Operatori in Spazi di Hilbert e Struttura Matematica della Meccanica Quantistica: un’Introduzione Valter Moretti Dipartimento di Matematica Facoltà di Scienze M.F.N Università di Trento 1 Prefazione. Una parte di questo libro è stata in realtà scritta, in forma preiminare, quando ero studente del corso di laurea in Fisica all’Università degli Studi di Genova. Il corso obbligatorio di Istituzioni di Fisica Teorica, al terzo anno, era il secondo scoglio insormontabile per molti studenti (il primo era il famigerato corso di Fisica II che includeva la termodinamica insieme all’elettrodinamica classica). La Meccanica Quantistica necessita un modo di pensare nuovo e difficile e lo sforzo era davvero notevole per noi volenterosi studenti: ci si muoveva per molti mesi in un contesto nebbioso ed insicuro, senza capire cosa fosse davvero importante nelle nozioni fisiche che cercavamo di imparare – con molta difficoltà – insieme ad un formalismo del tutto nuovo: quello della teoria spettrale degli operatori lineari su spazi di Hilbert. In realtà all’epoca non comprendevamo ancora che stavamo lavorando con tale teoria matematica, e per molti dei miei colleghi la cosa era, forse a ragione, del tutto irrilevante; i vettori bra di Dirac erano vettori bra di Dirac e basta e non gli elementi del duale dello spazio di Hilbert. La nozione di spazio di Hilbert e di spazio duale non aveva ancora diritto di cittadinanza nella classe degli strumenti matematici della quasi totalità dei miei colleghi, anche se sarebbe entrata a breve dal corso di Metodi Matematici della Fisica. La matematica, la formalizzazione matematica della fisica, era sempre stato il mio cavallo di battaglia per superare tutte le difficoltà insite nello studio della fisica, tanto che alla fine (ma dopo avere preso anche un dottorato in fisica teorica) sono istituzionalmente diventato un matematico. Armato delle mie nozioni di matematica, imparate in un percorso extracurriculare che coltivavo parallelamente agli studi di fisica da sempre, cercai di formalizzare anche le interessanti nozioni nelle quale mi stavo imbattendo, con questo nuovo ed interessantissimo corso di fisica. In parallelo portavo avanti una analogo progetto riguardante la formalizzazione matematica della teoria della Relatività Generale, non sapendo ancora che lo sforzo dedicato alla Meccanica Quantistica sarebbe stato incommensurabilmente superiore. La formulazione del teorema spettrale più o meno come è presentata nel capitolo 9 di questo libro è la stessa con la quale arrivai a sostenere l’esame del corso di Istituzioni di Fisica Teorica che fu, di conseguenza, un po’ un discorso tra sordi. Successivamente i miei interessi si spostarono verso la teoria quantisica dei campi, argomento di cui, dal punto di vista matematico, mi occupo ancora oggi nel contesto un po’ più generale della teoria quantistica dei campi su spaziotempo curvo. Tuttavia il mio interesse per la formulazione elementare della MQ non è andato scemando negli anni e, di tanto in tanto, ho continuato ad aggiungere qualche altro capitolo all’opera iniziata da studente. L’occasione di insegnare queste 2 cose in vari corsi per matematici e per fisici, nelle lauree specialistiche e nei dottorati, infliggendo ai miei poveri studenti i risultati dei miei sforzi di sintesi, si è rivelata fondamentale per per migliorare l’opera, trascrivendo il testo in LaTeX, ma anche corregendola in vari punti accogliendo le numerose osservazioni che mi sono giunte da varie persone. Vorrei a tal proposito ringraziare vari studenti e colleghi, che hanno contribuito a migliorare le diverse versioni preliminari di questo trattato: P. Armani, G. Bramanti, M. Dalla Brida, L. Di Persio, C. Fontanari, A. Franceschetti, A. Giacomini, V. Marini, G. Tessaro, A. Pugliese, G. Ziglio. Ringrazio in particolare R. Aramini e D. Cadamuro che mi hanno segnalato errori di vario genere. Sono grato ai miei amici e collaboratori R. Brunetti e N. Pinamonti per varie discussioni su molti degli argomenti trattati e per avermi segnalato importanti riferimenti bibliografici. Sarò grato a chiunque voglia scrivermi per segnalarmi le (sicuramente numerose) imprecisioni, mancanze e gli errori che quest’opera possiede ancora. A parte le evidenti limitazioni nel contenuto: non sono trattati gli aspetti matematici di importantissimi argomenti di fisica, primo fra tutti la teoria della diffusione quantistica. Inoltre – per ironia della sorte, dato che la mia attività di ricerca concerne le teorie relativistiche – tutta la trattazione si sviluppa ad un livello non realtivistico e la trattazione quantistica della simmetria di Poincaré rimane del tutto trascurata. D’altra parte alcuni argomenti chiave per la fisica, quali la nozione di simmetria (anche in relazione al problema della dinamica) oppure le proprietà delle funzioni di operatori autoaggiunti, sono affrontati con una certa profondità ed ampiezza. Ottobre 2009 Valter Moretti Dipartimento di Matematica Facoltà di Scienze MFN Università di Trento [email protected] 3 Indice 1 Introduzione 1.1 Scopi, struttura del libro e prerequisiti. . . 1.2 La MQ come teoria matematica. . . . . . 1.3 La MQ nel panorama della Fisica attuale. 1.4 Convenzioni generali. . . . . . . . . . . . . I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Elementi di teoria degli operatori su spazi di Hilbert 9 9 11 13 15 16 2 Alcune nozioni e teoremi generali nella teoria degli spazi normati e di Banach. 2.1 Spazi normati, di Banach e algebre. . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Operatori, spazi di operatori, norme di operatori. . . . . . . . . . . . . . . . . . . 2.3 I teoremi fondamentali negli spazi di Banach e le topologie deboli. . . . . . . . . 2.3.1 Il teorema di Hahn-Banach e le sue conseguenze elementari. . . . . . . . . 2.3.2 Il teorema di Banach-Steinhaus e topologie operatoriali. . . . . . . . . . . 2.3.3 Il teorema dell’applicazione aperta e dell’operatore inverso continuo dal Teorema di Baire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4 Proiettori. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Norme equivalenti. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 18 23 30 30 34 3 Spazi di Hilbert ed operatori limitati. 3.1 Nozioni elementari, teorema di Riesz e riflessività. . . . . . . . . . . . . . . . . . 3.2 Basi hilbertiane. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Nozione di aggiunto e applicazioni. . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 L’operazione di coniugazione hermitiana o aggiunzione. . . . . . . . . . . 3.3.2 ∗ -algebre e C ∗ -algebre. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.3 Operatori normali, autoaggiunti, isometrici, unitari, operatori positivi. . . 3.4 Proiettori ortogonali. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5 Radici quadrate di operatori positivi e decomposizione polare di operatori limitati. 3.6 La trasformata di Fourier-Plancherel. . . . . . . . . . . . . . . . . . . . . . . . . . 48 49 57 69 69 72 74 78 81 89 4 39 43 45 4 Proprietà elementari degli operatori compatti, di Hilbert-Schmidt e di classe traccia. 101 4.1 Generalità sugli operatori compatti in spazi normati, di Banach e Hilbert. . . . . 102 4.2 Operatori compatti in spazi di Hilbert. . . . . . . . . . . . . . . . . . . . . . . . . 104 4.3 Operatori di Hilbert-Schmidt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 4.4 Operatori di classe traccia (o nucleari). . . . . . . . . . . . . . . . . . . . . . . . . 126 5 Operatori non limitati con domini densi in spazi di Hilbert. 5.1 Operatori non limitati con dominio non massimale. . . . . . . . . . . . . . . . . . 5.1.1 Operatori non limitati con dominio non massimale in spazi normati e di Hilbert. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.2 La definizione generale di operatore aggiunto in spazi di Hilbert. . . . . . 5.2 Operatori hermitiani, simmetrici, autoaggiunti ed essenzialmente autoaggiunti. . 5.3 Alcune importanti applicazioni: operatore posizione e operatore impulso. . . . . . 5.3.1 L’operatore posizione. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.2 L’operatore impulso. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4 Criteri di esistenza ed unicità per le estensioni autoaggiunte. . . . . . . . . . . . . 5.4.1 La trasformata di Cayley e gli indici di difetto. . . . . . . . . . . . . . . . 5.4.2 Criteri di Von Neumann e di Nelson. . . . . . . . . . . . . . . . . . . . . . 134 135 II 164 Il formalismo della Meccanica Quantistica e la Teoria Spettrale 135 137 139 144 144 146 151 151 155 6 Brevi cenni di fenomenologia dei sistemi quantistici e di Meccanica Ondulatoria. 165 6.1 Generalità sui sistemi quantistici. . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 6.2 Alcune proprietà particellari delle onde elettromagnetiche. . . . . . . . . . . . . . 167 6.2.1 Effetto Fotoelettrico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 6.2.2 Effetto Compton. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 6.3 Cenni di Meccanica ondulatoria. . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 6.3.1 Onde di de Broglie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 6.3.2 Funzione d’onda di Schrödinger e interpretazione probabilistica di Born. . 171 6.4 Principio di indeterminazione di Heisenberg. . . . . . . . . . . . . . . . . . . . . . 173 6.5 Le grandezze compatibili ed incompatibili. . . . . . . . . . . . . . . . . . . . . . . 175 7 Il formalismo matematico di base della MQ: proposizioni, stati quantistici e osservabili. 177 7.1 Le idee che stanno alla base dell’interpretazione standard della fenomenologia quantistica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 7.2 Stati classici come misure di probabilità sulla σ-algebra delle proposizioni elementari. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 7.2.1 Stati come misure. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 5 7.2.2 7.2.3 7.2.4 7.2.5 7.3 7.4 7.5 Proposizioni e insiemi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Interpretazione insiemistica dei connettivi logici. . . . . . . . . . . . . . . Proposizioni “infinite” e grandezze fisiche. . . . . . . . . . . . . . . . . . . Il reticolo distributivo, limitato, ortocomplementato e σ-completo delle proposizioni elementari. . . . . . . . . . . . . . . . . . . . . . . . . . . . . Le proposizioni relative a sistemi quantistici come insiemi di proiettori ortogonali. 7.3.1 Reticoli di proiettori ortogonali su spazi di Hilbert. . . . . . . . . . . . . . Le proposizioni e gli stati relativi a sistemi quantistici. . . . . . . . . . . . . . . . 7.4.1 Proposizioni e stati di sistemi quantistici: il teorema di Gleason. . . . . . 7.4.2 Stati puri, stati misti, ampiezze di transizione. . . . . . . . . . . . . . . . 7.4.3 Stati successivi ai processi di misura e preparazione degli stati. . . . . . . 7.4.4 Regole di superselezione e settori coerenti. . . . . . . . . . . . . . . . . . . Le osservabili come Misure a Valori di Proiezione (PVM) su R. . . . . . . . . . . 7.5.1 La nozione di osservabile . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.5.2 Operatori autoaggiunti associati ad osservabili: esempi elementari. . . . . 7.5.3 Misure di probabilità associate a coppie stato - osservabile. . . . . . . . . 7.5.4 Un accenno alle osservabili generalizzate in termini di “POVM”. . . . . . 181 182 183 185 188 189 197 198 205 211 213 215 215 218 222 225 8 Teoria Spettrale su spazi di Hilbert I: generalità ed operatori normali limitati.227 8.1 Spettro, risolvente, operatore risolvente. . . . . . . . . . . . . . . . . . . . . . . . 228 8.1.1 Nozioni fondamentali. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228 8.1.2 Il raggio spettrale e la formula di Gelfand. . . . . . . . . . . . . . . . . . . 232 8.1.3 Spettri di operatori autoaggiunti, unitari e normali in spazi di Hilbert. . . 235 8.2 ∗-omomorfismi continui di C ∗ -algebre di funzioni indotti da operatori limitati autoaggiunti in spazi di Hilbert. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238 8.3 Misure a valori di proiezione e teorema spettrale per operatori limitati normali. . 247 8.3.1 Misure a valori di proiezione (PVM) dette anche misure spettrali. . . . . . 247 8.3.2 Proprietà degli operatori ottenuti integrando funzioni limitate rispetto a PVM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256 8.3.3 Teorema di decomposizione spettrale per operatori limitati normali. . . . 262 9 Teoria Spettrale su spazi di Hilbert II: operatori autoaggiunti non limitati ed applicazioni. 280 9.1 Teorema spettrale per operatori autoaggiunti non limitati. . . . . . . . . . . . . . 281 9.1.1 Integrazione di funzioni non limitate rispetto a misure spettrali. . . . . . 281 9.1.2 Teorema di decomposizione spettrale per operatori autoaggiunti non limitati.293 9.1.3 Un esempio a spettro puntuale: l’hamiltoniano dell’oscillatore armonico . 302 9.1.4 Un esempio a spettro continuo: gli operatori posizione ed impulso. . . . . 306 9.1.5 Teorema di rappresentazione spettrale per operatori autoaggiunti non limitati. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307 9.2 Gruppi unitari ad un parametro fortemente continui. . . . . . . . . . . . . . . . . 308 6 9.2.1 9.3 9.4 9.5 9.6 Gruppi unitari ad un parametro fortemente continui, teorema di von Neumann. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308 9.2.2 Gruppi unitari ad un parametro generati da operatori autoaggiunti e Teorema di Stone. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312 9.2.3 Condizioni per la commutatività di misure spettrali. . . . . . . . . . . . . 319 Prodotto tensoriale hilbertiano. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323 9.3.1 Prodotto tensoriale di spazi di Hilbert. . . . . . . . . . . . . . . . . . . . . 323 9.3.2 Prodotto tensoriale di operatori (generalmente non limitati) e loro proprietà spettrali. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328 9.3.3 Un esempio: il momento angolare orbitale. . . . . . . . . . . . . . . . . . 331 Esponenziale di operatori non limitati: vettori analitici. . . . . . . . . . . . . . . 335 Teorema di decomposizione polare per operatori non limitati. . . . . . . . . . . . 339 9.5.1 Proprietà degli operatori A∗ A, radici quadrate di operatori autoaggiunti positivi non limitati. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339 9.5.2 Teorema di decomposizione polare per operatori chiusi e densamente definiti.344 I teoremi di Kato-Rellich e di Kato. . . . . . . . . . . . . . . . . . . . . . . . . . 346 9.6.1 Il teorema di Kato-Rellich. . . . . . . . . . . . . . . . . . . . . . . . . . . 346 9.6.2 Un esempio: l’operatore −∆ + V ed il teorema di Kato. . . . . . . . . . . 348 10 La formulazione matematica della Meccanica Quantistica non relativistica. 355 10.1 Sistemi elementari non relativistici: particella a spin 0. . . . . . . . . . . . . . . . 359 10.1.1 le Relazioni di Commutazione Canonica (CCR) e non implementabilità con operatori limitati. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 361 10.1.2 Il Principio di Indeterminazione di Heisenberg come teorema. . . . . . . . 363 10.2 Le relazioni di Weyl, il teorema di Stone-von Neumann ed il teorema di Mackey. 364 10.2.1 Famiglie irriducibili di operatori e lemma di Schur. . . . . . . . . . . . . . 364 10.2.2 Le relazioni di Weyl dalle CCR. . . . . . . . . . . . . . . . . . . . . . . . . 366 10.2.3 Il teorema di Stone-von Neumann ed il teorema di Mackey. . . . . . . . . 375 10.2.4 La ∗-algebra di Weyl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 377 10.2.5 Dimostrazione dei teoremi di Stone-von Neumann e di Mackey. . . . . . . 381 10.2.6 Commenti finali sul teorema di Stone-von Neumann: il gruppo di Heisenberg.387 10.3 Il principio di corrispondenza di Dirac. . . . . . . . . . . . . . . . . . . . . . . . . 390 11 Introduzione alle Simmetrie Quantistiche. 11.1 Nozione e caratterizzazione di simmetrie quantistiche. . 11.1.1 Qualche esempio. . . . . . . . . . . . . . . . . . . 11.1.2 Simmetrie in presenza di regole di superselezione. 11.1.3 Simmetrie nel senso di Kadison. . . . . . . . . . 11.1.4 Simmetrie nel senso di Wigner. . . . . . . . . . . 11.1.5 Teoremi di Wigner, di Kadison. . . . . . . . . . . 11.1.6 Azione duale delle simmetrie sulle osservabili. . . 11.2 Introduzione ai gruppi di simmetria. . . . . . . . . . . . 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393 393 395 396 397 400 402 414 421 11.2.1 11.2.2 11.2.3 11.2.4 11.2.5 11.2.6 11.2.7 11.2.8 Rappresentazioni proiettive, unitarie proiettive, estensioni centrali. . . . . Gruppi di simmetria topologici. . . . . . . . . . . . . . . . . . . . . . . . . Rappresentazioni unitarie proiettive fortemente continue. . . . . . . . . . Il caso notevole del gruppo topologico R. . . . . . . . . . . . . . . . . . . Richiami sui gruppi ed algebre di Lie. . . . . . . . . . . . . . . . . . . . . Gruppi di simmetria di Lie, teoremi di Bargmann, Gårding, Nelson, FS3 . Un esempio: il gruppo di simmetria SO(3) e lo spin . . . . . . . . . . . . Il gruppo di Galileo e la regola di Bargmann di superselezione della massa 421 430 433 436 443 453 464 468 12 Alcuni argomenti più avanzati di Meccanica Quantistica. 12.1 L’assioma di evoluzione temporale e le simmetrie dinamiche. . . . . . . . . . . . . 12.1.1 L’equazione di Schrödinger e gli stati stazionari. . . . . . . . . . . . . . . 12.1.2 L’azione del gruppo di Galileo in rappresentazione posizione. . . . . . . . 12.1.3 L’evolutore temporale in assenza di omogeneità temporale e la serie di Dyson. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.1.4 Inversione del tempo antiunitaria. Teorema di Pauli. . . . . . . . . . . . . 12.2 Relazione tra simmetrie dinamiche e costanti del moto. . . . . . . . . . . . . . . . 12.2.1 La rappresentazione di Heinsenberg e le costanti del moto. . . . . . . . . . 12.2.2 Un accenno al teorema di Ehrenfest ed ai problemi matematici ad esso connessi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.2.3 Costanti del moto associate a gruppi di Lie di simmetria ed il caso del gruppo di Galileo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.3 Sistemi composti: sistemi con struttura interna e sistemi a più particelle. . . . . 12.3.1 Stati entangled ed il cosiddetto “paradosso EPR”. . . . . . . . . . . . . . 12.3.2 Impossibilità di trasmettere informazione tramite le correlazioni EPR. . . 12.3.3 Sistemi di particelle identiche. . . . . . . . . . . . . . . . . . . . . . . . . . 479 480 486 493 A Relazioni d’ordine, topologia, gruppi. A.1 Relazioni d’ordine, insiemi parzialmente ordinati, lemma di Zorn. . . . . . . . . . A.2 Richiami di topologia generale elementare. . . . . . . . . . . . . . . . . . . . . . . A.3 Richiami di teoria dei gruppi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 528 528 529 532 B Elementi di geometria differenziale. B.1 Varietà differenziabili, varietà differenziabili prodotto, funzioni differenziabili. . B.2 Spazio tangente e cotangente. Campi vettoriali covarianti e controvarianti. . . . B.3 Differenziali, curve e vettori tangenti. . . . . . . . . . . . . . . . . . . . . . . . . B.4 Pushforward e pullback. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 536 536 541 544 545 C Teoria della misura, integrale di funzioni a valori spazi di Banach. C.1 Richiami di teoria della misura. . . . . . . . . . . . . . . . . . . . . . . . . . . . . C.2 Derivazione sotto il segno di integrale. . . . . . . . . . . . . . . . . . . . . . . . . C.3 Integrale di funzioni a valori spazi di Banach. . . . . . . . . . . . . . . . . . . . . 546 546 552 553 8 496 500 503 503 508 511 516 517 521 523 Capitolo 1 Introduzione 1.1 Scopi, struttura del libro e prerequisiti. Uno degli scopi principali di questo libro è quello di esporre i fondamenti matematici della Meccanica Quantistica (MQ) in modo matematicamente rigoroso. Tuttavia si tratta di un testo di (Fisica-)Matematica e non di un manuale di Meccanica Quantistica. Escludendo alcune parti del libro, la fenomenologia fisica sarà lasciata sullo sfondo per concentrarci sugli aspetti logicoformali della teoria. In ogni caso daremo delle esemplificazioni fisiche del formalismo per non perdere il contatto con la realtà dei fisici. Il libro può anche essere considerato come un testo introduttivo di analisi funzionale lineare sugli spazi di Hilbert con particolare enfasi su alcuni risultati di teoria spettrale, – come le varie formulazioni del teorema spettrale per operatori normali limitati ed autoaggiunti non necessariamente limitati – indipendentemente dalla formulazione matematica della Meccanica Quantistica. Questo è – di fatto – il secondo scopo del libro. La formalizzazione matematica della MQ è “confinata” nei capitoli 6, 7, 10, 11 e 12 da cui i rimanenti capitoli sono logicamente indipendenti, anche se motivazioni per talune definizioni matematiche si possono trovare nei capitoli 7, 10, 11 e 12. Il terzo scopo del libro è quello di raccogliere in un unico testo diversi utili risultati rigorosi, ma più avanzati di quanto si trova nei manuali di fisica quantistica, sulla struttura matematica della Meccanica Quantistica. Tali risultati sono noti da molto tempo, ma sparsi nella letteratura avanzata. Possiamo menzionare il teorema di Gleason, i teoremi di Stone-von Neumann e di Mackey, il teorema di Kadison, oltre che il più noto teorema di Wigner; oppure argomenti di teoria degli operatori, come il teorema di decomposizione polare per operatorori chiusi non limitati (che ha grande rilevanza nella teoria di Tomita-Takesaki e in meccanica quantistica statistica, in riferimento alla condizione KMS), oppure alcuni risultati, dovuti a Nelson, sulle proprietà di autoaggiunzione di operatori simmetrici come conseguenza all’esistenza di insiemi densi di vettori analitici ed anche, infine, alcuni risultati dovuti a Kato (ma non solo) sull’essenziale autoaggiunzione di certi tipi di operatori e sui loro limiti dal basso dello spettro (risultati in massima parte basati sul teorema di KatoRellich). Il contenuto del libro può coprire una buona parte di un corso avanzato di Metodi Matematici 9 della Fisica, in un corso di laurea specialistico/magistrale in Fisica, assumendo che lo studente sia già familiare con le tecniche elementari della teoria della misura. Alternativamente, il testo può anche essere adoperato in un corso di Fisica Matematica avanzato, che tratti argomenti di Meccanica Quantistica. Se si guarda il testo con l’occhio del fisico più che con quello del matematico, ci si accorge che il libro è diviso in due parti. Nella prima parte, che termina con il capitolo 5 incluso, ci si occupa di enunciare la teoria generale degli operatori in spazi di Hilbert (dando anche alcune nozioni valide per contesti più generali quali gli spazi di Banach e provando risultati generali fondamentali, quali il teorema di Baire, di Hahn-Banach e Banach-Steinhaus e le loro conseguenze elementari). Nella seconda parte viene inizialmente (nel capitolo 9) sviluppata la teoria spettrale in termini di misure a valori di proiezione, fino ad enunciare e provare i teoremi di decomposizione spettrale per operatori autoaggiunti non limitati in spazi di Hilbert, includendo le proprietà delle funzioni di operatori (calcolo funzionale) per funzioni misurabili e non necessariamente limitate, studiandone con cura la proprietà spettrali generali e le proprietà dei loro domini. Con tali strumenti viene quindi sviluppato tutto il formalismo matematico fondazionale della Meccanica Quantistica. Nei capitoli relativi alla formulazione matematica generale della Meccanica Quantistica, dopo una discussione ed una motivazione di carattere fisico, si assume come punto di partenza matematico il fatto che che le proposizioni sui sistemi fisici quantistici siano descritte dal reticolo dei proiettori ortogonali su uno spazio di Hilbert complesso. Insiemi massimali di proposizioni fisicamente compatibili (in senso quantistico) sono descritte da reticoli distributivi ortocomplementati limitati e σ-completi. In questa ottica, la definizione quantistica di osservabile in termini di operatore autoaggiunto risulta essere estremamente naturale come, d’altra parte, la formulazione del teorema di decomposizione spettrale. Gli stati quantistici vengono introdotti come misure sull’insieme di tali proiettori. Tramite il teorema di Gleason, si caratterizzano gli stati come operatori positivi di classe traccia con traccia unitaria. Gli stati puri (i raggi dello spazio di Hilbert del sistema fisico) si ottengono come elementi estremali del corpo convesso degli stati. In questo contesto, e tra diversi altri argomenti, si discute la nozione di simmetria quantistica e di gruppo di simmetria in modo approfondito (riferendosi sia alla nozione dovuta a Wigner, ma anche a quella dovuta a Kadison), includendo lo studio delle le simmetrie dinamiche e la versione quantistica del teorema di Nöther. Come gruppo di simmetria di riferimento, che useremo nelle varie esemplificazioni della teoria delle rappresentazioni unitarie proiettive, ci riferiremo al gruppo di Galileo ed alle sue estensioni centrali ed ai sottogruppi di tale gruppo. Daremo anche una dimostrazione del teorema di Bargmann sull’esistenza di rappresentazioni unitarie per gruppi di Lie semplicemente connessi la cui algebra di Lie soddisfa una certa condizione coomologica. Discuteremo la regola di superselezione della massa dovuta a Bargamnn. Discuteremo anche alcuni utili risultati sulle rappresentazioni unitarie proiettive di gruppi di Lie di simmetrie dovuti a Gårding e Nelson. Tratteremo anche alcuni argomenti importanti, ma presentati in modo poco approfondito sui manuali, come le formulazioni relative all’unicità delle rappresentazioni unitarie delle relazioni di commutazione canonica (teoremi di Stone-von Neumann e Mackey) oppure la difficoltà teorica nel definire operatore tempo come operatore coniugato all’operatore energia (l’hamiltoniano). Discuteremo brevemente le difficoltà matematiche che si incontrano 10 nel voler rtendere rigoroso l’enunciato del teorema di Ehrenfest. Le appendici, in fondo al libro, richiamano le nozioni elementari di topologia generale, geometria differenziale (utile nel capitolo 11) e teoria della misura. La scelta dell’autore è stata di non trattare alcuni argomenti, sia pure importanti, come la teoria degli spazi di Hilbert attrezzati (le famose triplette di Gelfand) perché avrebbe richisto l’introduzione di ulteriore materiale, specialmente riguardante la teoria delle distribuzioni. Prerequisiti matematici necessari per comprendere il contenuto di questo libro sono essenzialmente, oltre ai contenuti di un normale corso completo di algebra lineare, che includa elementi di teoria dei gruppi e delle loro rappresentazioni, uno di analisi per funzioni di una e di più variabili, qualche nozione di topologia elementare degli spazi metrici, i fondamenti della teoria della misura su σ-algebre [Rud82] (riassunti in appendice a fine libro), qualche nozione elementare di teoria delle funzioni analitiche di una variabile complessa. Dal punto di vista fisico è necessaria la conoscenza di alcuni argomenti dei corsi universitari elementari di argomento Fisico. Più precisamente le nozioni di Meccanica elementare con alcuni elementi di Meccanica Analitica (i primi rudimenti della formulazione di Hamilton della dinamica) unitamente ad alcune nozioni di Elettromagnetismo (proprietà elementari delle Onde Elettromagnetiche e fenomeni ondulatori principali quali interferenza, diffrazione, diffusione). Le nozioni meno elementari ed altre nozioni utili solo in alcuni punti verranno comunque riassunte brevemente nel testo (anche negli esempi), presentando i risultati sufficienti per proseguire nella lettura. In una sezione del capitolo 11 si farà uso della nozione di gruppo di Lie e di alcune proprietà e risultati fondamentali della teoria corrispondente. Per tali argomenti ci riferiamo ai testi [War75, NaSt84]. Come già detto, in appendice a fine libro, sono richiamati con un certo dettaglio alcuni risultati di geometria differenziale utili in tale contesto. Nota importante. Gli esempi presentati nei vari capitoli devono considerarsi come parte integrante del testo e non possono essere omessi quasi mai. Alcuni risultati, ottenuti negli esercizi proposti, verranno successivamente usati nel testo come proposizioni note. Gli esercizi in questione saranno comunque corredati di suggerimenti, traccia di soluzione o, addirittura, soluzione completa. 1.2 La MQ come teoria matematica. Dal punto di vista matematico la Meccanica Quantistica rappresenta una rara sintesi di eleganza matematica e profondità descrittiva del contesto fisico. La teoria usa essenzialmente tecniche di analisi funzionale lineare, ma con diverse intersezioni con la teoria della misura, la teoria della probabilità e la logica matematica. Esistono (almeno) due possibili formulazioni matematiche della Meccanica Quantistica elementare. La più antica in ordine storico, dovuta essenzialmente a von Neumann (1932), è formulata usando il linguaggio della teoria degli spazi di Hilbert e della teoria spettrale degli operatori non limitati su tali spazi. La formulazione più recente ed avanzata, sviluppata dalla scuola del matematico Gel’fand nel tentativo di risolvere alcuni problemi fisico-matematici della teoria 11 quantistica dei campi, è presentata nel linguaggio delle algebre astratte (∗-algebre e C ∗ -algebre) costruite sul modello delle algebre di operatori definite e studiate dallo stesso von Neumann (oggi note come W ∗ algebre o algebre di von Neumann), ma emancipandosi dalla struttura di spazio di Hilbert (vedi per es. il testo classico sulle algebre di operatori [BrRo02]). Tale formulazione ha il suo centro nel famoso teorema GNS [Haa96, BrRo02]. La seconda formulazione, in un senso molto specifico che non possiamo chiarire qui, può considerarsi un’estensione della prima formulazione anche per i nuovi contenuti fisici introdotti. In particolare essa permette di dare un senso matematicamente preciso alla richiesta di località delle teorie di campo quantistiche relativistiche [Haa96] e permette l’estensione delle teorie quantistiche di campo in spaziotempo curvo. In questo libro ci occuperemo unicamente della prima formulazione che ha comunque una complessità matematica notevole accompagnata da una notevole eleganza formale. Uno strumento matematico fondamentale per sviluppare la MQ è il cosiddetto teorema spettrale per operatori autoaggiunti (generalmente non limitati) definiti in varietà lineari dense in uno spazio di Hilbert. Tale teorema, che può essere esteso al caso di operatori normali, fu dimostrato per la prima volta proprio da von Neumann nel suo libro fondamentale sulla struttura matematica della MQ [Neu32] che può considerarsi una pietra miliare della fisica matematica oltre che della matematica pura del XX secolo1 . Il legame tra MQ e teoria spettrale è dovuto al seguente fatto. Nell’interpretazione standard della MQ si vede in modo naturale che le grandezze fisiche misurabili su sistemi quantistici possono essere associate ad operatori autoaggiunti non limitati in un opportuno spazio di Hilbert. Lo spettro di ciascuno di questi operatori coincide con l’insieme dei valori assumibili dalla grandezza associata. La procedura di costruzione delle grandezze fisiche a partire dalle proprietà o proposizioni elementari del tipo “il valore della grandezza cade nell’intervallo (a, b]”, che nello schema matematico adottato corrispondono a proiettori ortogonali, non è altro che una procedura di integrazione su una appropriata misura spettrale a valori di proiezione. Tale procedura ricorda molto da vicino il metodo per definire l’integrale di Lebesgue di una funzione misurabile. Il teorema spettrale in sostanza altro non è che un metodo che permette di costruire operatori più complessi partendo da proiettori o, viceversa, di decomporre operatori in termini di misure a valori di proiezione. La formulazione moderna della teoria spettrale è sicuramente differente da quella originale di von Neumann che però conteneva quasi tutti gli elementi fondamentali. Ancora oggi il testo di von Neumann (che è stato scritto nel lontano 1932) rivela una profondità impressionante specie nei problemi più difficili dell’interpretazione fisica del formalismo della MQ di cui, leggendo il libro, si evince che von Neumann era chiaramente conscio a differenza di molti dei suoi colleghi. Sarebbe interessante fare un paragone tra il testo di von Neumann e il, molto più famoso, testo di Dirac [Dir30] sui fondamenti della MQ, cosa che lasciamo al lettore interessato. In ogni caso la profondità dell’impostazione data da von Neumann alla MQ comincia anche ad essere riconosciuta da chi si occupa di fisica sperimentale ed in particolare di misure quantistiche [BrKh95]. Le cosiddette Logiche Quantistiche nascono dal tentativo di formulare la MQ partendo dal 1 La definizione del concetto di spazio di Hilbert infinito dimensionale e gran parte della teoria generale degli spazi di Hilbert cosı̀ come la conosciamo oggi sono anch’essi dovuti a von Neumann e alla sua formulazione della MQ. 12 punto di vista più radicale possibile, attribuendo alla stessa logica usata nel trattare i sistemi quantistici, alcune proprietà differenti da quelle della logica classica e modificando la teoria dell’interpretazione. Per esempio, sono usati più di due valori di verità e il reticolo booleano delle proposizioni è rimpiazzato da una struttura non distributiva più complessa. Nella prima formulazione della logica quantistica, oggi denominata Logica Quantistica Standard, proposta da Von Neumann e Birkhoff nel 1936, la struttura dell’algebra booleana delle proposizioni era rimpiazzata con quella di un reticolo ortomodulare che di fatto ha come modello l’insieme dei proiettori ortogonali su uno spazio di Hilbert ovvero, l’insieme dei sottospazi chiusi su cui proiettano i proiettori [Bon97], unitamente ad alcune regole di composizione. È noto che, a dispetto della sua eleganza, tale modellizzazione contiene diversi difetti quando si cerca di tradurla in termini operativi fisici (o più precisamente operazionali). Accanto alle diverse formulazioni delle Logiche Quantistiche [Bon97, DCGi02, EGL09], esistono oggi formulazioni fondazionali alternative basate su altri punti di vista (come la teoria dei topos). 1.3 La MQ nel panorama della Fisica attuale. La Meccanica Quantistica – genericamente parlando la teoria della fisica del mondo atomico e sub atomico – insieme alla Teoria della Relatività Speciale e Generale (RSG) – genericamente parlando la teoria fisica della gravità, del mondo macroscopico e della cosmologia – costituiscono i due paradigmi attraverso i quali si è sviluppata la fisica del XX secolo e quella dell’inizio del secolo attuale. I due paradigmi si sono fusi in vari contesti dando luogo a teorie quantistiche relativistiche, in particolare alla Teoria Quantistica Relativistica dei Campi [StWi00, Wei99], che ha avuto uno sviluppo impressionante con straordinari successi esplicativi e predittivi nel contesto della teoria delle particelle elementari e delle forze fondamentali. A titolo d’esempio tale teoria ha previsto, all’interno del cosiddetto modello standard delle particelle elementari, l’unificazione della forza debole ed elettromagnetica che è poi stata confermata sperimentalmente alla fine degli anni ’80 con un esperimento spettacolare al C.E.R.N. di Ginevra in cui si sono osservate le particelle Z0 e W ± previste dalla teoria dell’unificazione elettrodebole. La previsione del valore di una grandezza fisica che è stata poi confermata con una delle maggiori precisioni di tutta la storia della Fisica si è avuta nell’elettrodinamica quantistica. Si tratta del valore del cosiddetto rapporto giromagnetico dell’elettrone g. Tale grandezza fisica è un numero puro. Il valore previsto dall’elettrodinamica quantistica per a := g/2 − 1 è: 0.001159652359 ± 0.000000000282 , quello ottenuto sperimentalmente è risultato essere 0.001159652209 ± 0.000000000031 . Molti fisici ritengono che la MQ sia la teoria fondamentale dell’Universo (più profonda delle teorie relativistiche) anche per il fatto che risulta essere valida per scale lineari di lunghezza che variano in uno spettro di ampiezza impressionante: da 1m (condensati di Bose-Einstein) almeno fino a 10−16 m (interno dei nucleoni: quarks). La MQ ha avuto un enorme successo sia teorico 13 che sperimentale anche nella scienza che studia la struttura della materia solida, nell’ottica, nell’elettronica, con diverse importantissime ricadute tecnologiche: ogni oggetto tecnologico di uso comune che sia moderatamente sofisticato (giocattoli per i bambini, telefonini, telecomandi...) da contenere qualche elemento semiconduttore sfrutta proprietà quantistiche della materia. Tornando ai due paradigmi scientifici del XX secolo – MQ e RSG – rimangono diversi punti oscuri in cui i due paradigmi sembrano venire in conflitto, in particolare il problema della cosiddetta “quantizzazione della gravità” e della struttura dello spaziotempo alle scale di Planck – 10−33 cm, 1043 s – le scale di lunghezza e di tempo che si ottengono combinando le costanti fondamentali delle due teorie: la velocità della luce, la costante di gravitazione universale e la costante di Planck. La necessità di una struttura discontinua dello spaziotempo a scale ultramicroscopiche è suggerita anche da alcune difficoltà matematiche (ma anche concettuali) non completamente risolte dalla cosiddetta teoria della Rinormalizzazione quantistica, dovute all’apparire di infiniti che si incontrano nei calcoli dei processi dovuti alle interazioni fondamentali tra le particelle elementari. Tutti questi problemi hanno dato luogo a recenti ed importanti sviluppi teorici, che hanno avuto influenze nello sviluppo della stessa matematica pura, come la teoria delle (super) stringhe (e brane) e le varie versioni di Geometria non commutativa, prima fra tutte quella di A. Connes. La difficoltà nel decidere quale di queste teorie abbia un senso fisico e descriva l’universo alle scale piccolissime è anche di natura tecnologica: la tecnologia attuale non è in grado di preparare esperimenti che permettano il discernimento tra le varie teorie proposte. Altri punti di contrasto tra MQ e RSG, su cui la discussione è oggi un po’ più pacata rispetto al passato, riguardano il rapporto della MQ con concetti di località di natura relativistica (paradosso Einstein-Podolsky-Rosen[Bon97]) in relazione ai fenomeni di entanglement della MQ. Ciò è dovuto in particolare all’analisi di Bell della fine degli anno ’60 ed ai celebri esperimenti di Aspect che hanno dato torto alle aspettative di Einstein, ragione all’interpretazione di Copenaghen, ed hanno provato che la nonlocalità è una caratteristica della natura, indipendentemente dall’accettazione o meno dell’interpretazione standard della MQ. Sembra ormai condivisa dalla maggior parte dei fisici l’idea che l’esistenza di processi fisici non locali, prevista teoricamente dalla MQ, non implichi alcuna reale violazione dei fondamenti della Relatività (l’entanglement quantistico non coinvolge trasmissione superluminare di informazioni e violazione della causalità [Bon97]). Nell’interpretazione standard della MQ detta di Copenaghen, rimangono punti fisicamente e matematicamente poco chiari, ma di estremo interesse concettuale. In particolare non è per nulla chiaro come la meccanica classica si possa ottenere come sottocaso o caso limite della MQ e come si possa fissare un limite (anche provvisorio o impreciso) tra i due mondi. Ulteriormente rimane aperto il problema della descrizione fisica e matematica del cosiddetto processo di misura quantistica di cui parleremo più avanti e che è strettamente connesso a quello del limite classico della MQ. Anche prendendo spunto da questo problema sono nate altre interpretazioni del formalismo della MQ, profondamente differenti dall’interpretazione di Copenaghen. Tra queste nuove interpretazioni, una volta considerate eretiche, di grande interesse è in particolare quella a variabili nascoste di Bohm [Bon97, Des80]. Talvolta vengono sollevate riserve sulla formulazione Meccanica Quantistica e sul fatto che non sia veramente comprensibile, ma che si tratti semplicemente di un elenco di procedure che 14 “materialmente funzionano”, mentre la vera essenza sia qualcosa di inaccessibile. È opinione dell’autore che dietro a questo punto di vista ci sia un pericoloso errore epistemologico. Basato sulla credenza che “spiegare” un fenomeno significhi ridurlo alle categorie dell’esperienza quotidiana. Come se queste fossero qualcosa di più profondo della realtà stessa. L’opinione dell’autore è che sia il esattamente il contrario: le categorie dell’esperienza quotidiana sono state costruite con l’esperienza quotidiana senza, conseguentemente, alcuna pretesa di profondità metafisica. Dietro quel semplice “materialmente funziona” ci potrebbe essere un mare filosofico profondo che ci avvicina alla realtà invece che allontanarcene. La Meccanica Quantistica ci ha insegnato a pensare in un modo differente ed è stata (anzi è ), per questo, un opportunità incredibile per l’esperienza umana. Voltarle le spalle dicendo che non l’abbiamo compresa, perché si rifiuta di ricadere nelle nostre categorie usuali, significa chiudere una porta su qualcosa di enorme. Questo è il parere dell’autore, che è fermamente convinto che il principio di indeterminazione di Heisenberg (ridotto a semplice teorema nella formulazione moderna) sia una delle massime vette raggiunte dall’intelletto umano. 1.4 Convenzioni generali. Nel seguito, se non sarà precisato altrimenti il campo degli scalari di uno spazio di Hilbert sarà sempre C. Il complesso coniugato di un numero c sarà indicato con c. Lo stesso simbolo è anche usato per denotare la chiusura di insiemi o di operatori, ciò non dovrebbe comunque creare fraintendimenti e, dove fosse necessario, un commento preciserà quale deve essere l’interpretazione del simbolo. Il prodotto scalare hermitiano tra due vettori ψ, φ di uno spazio di Hilbert sarà indicato con (ψ|φ). Si supporrà sempre che l’entrata di sinistra del prodotto scalare sia quella antilineare: (αψ|φ) = α(ψ|φ). Il termine operatore significa comunque operatore lineare anche se talvolta questa specificazione è omessa. Un operatore lineare U : H → H0 , dove H e H0 sono spazi di Hilbert, che sia isometrico e surgettivo sarà detto unitario, anche se in altri testi la terminologia è riservata al solo caso in cui valga anche H = H0 . La locuzione sottospazio sarà riservata ai sottospazi rispetto alla semplice struttura di spazio vettoriale anche nel caso in cui esista un’ulteriore struttura (spazio di Hilbert, Banach o altro) nello spazio ambiente. In altri testi, in riferimento alla teoria degli spazi di Hilbert, sottospazio significa quello che noi chiamiamo sottospazio chiuso, mentre un sottospazio rispetto alla sola struttura algebrica è spesso indicato con il nome di varietà lineare. L’operazione di coniugazione hermitiana sarà sempre indicata con ∗ e operatore hermitiano, operatore simmetrico ed operatore autoaggiunto non saranno considerati sinonimi; si vedano le definizioni corrispondenti nel seguito. 15 Parte I Elementi di teoria degli operatori su spazi di Hilbert 16 Capitolo 2 Alcune nozioni e teoremi generali nella teoria degli spazi normati e di Banach. In questo capitolo presenteremo alcune nozioni ed alcuni risultati fondamentali della teoria generale degli spazi normati e degli spazi di Banach. Introdurremo anche alcune strutture algebriche modellizzate su algebre naturali di operatori sugli spazi di Banach. Le algebre di Banach di operatori svolgono un ruolo di grande importanza nelle formulazioni moderne della Meccanica Quantistica. Questo capitolo serve essenzialmente ad introdurre il linguaggio e gli strumenti elementari della teoria degli spazi di operatori lineari. Le nozioni più importanti di questa sezione sono sicuramente la nozione di operatore limitato e le varie nozioni di topologia (indotta da norme o da seminorme) negli spazi di operatori. L’importanza di questi strumenti matematici deriva dal fatto che il linguaggio degli operatori lineari su spazi lineari è il linguaggio con cui è formulato la Meccanica Quantistica. In questo contesto la classe degli operatori limitati riveste un ruolo tecnico centrale anche se, per motivi di carattere fisico, in Meccanica Quantistica ci si trova costretti ad introdurre e lavorare anche con operatori non limitati. Vedremo tutto ciò nella seconda parte. Nella prima parte di questo capitolo introdurremo le nozioni elementari di spazio normato e di spazio di Banach e delle loro proprietà elementari. Nella seconda parte passeremo a prentare la nozione di norma operatoriale e delle propretà più utili di tale concetto. Nella terza parte enunceremo e dimostreremo i teoremi fondamentali generali degli spazi di Banach, nelle versioni più elementari. Il teorema di Hahn-Banach, il teorema di Banach-Steinhaus teorema dellapplicazione aperta (partendo dal teorema di Baire). Dimostrando anche diverse utili conseguenze (teorema delloperatore inverso continuo e del grafico chiuso). Il teorema di Banach-Steinhaus consentirà di discutere brevemente le varie topologie operatoriali che entrano in gioco nella teoria degli operatori, accennando brevente alla nozione di spazio di Fréchet. 17 La quarta parte sarà dedicata alla nozione di proiettore nelgi spazi normati, nozione che specializzeremo nel capito successivo a quella, più utile per i nostri scopi, di proiettore ortogonale. L’ultima parte, sarà dedicata ad un argomento importante, ma spesso tralasciato sui vari manuali: la nozione di norma equivalente e la dimostrazione del fatto che gli spazi normati di dimensione n finita, sono di Banach ed omeomorfi ad un corrispondente Cn con norma standard. 2.1 Spazi normati, di Banach e algebre. Diamo di seguito le principali definizioni sugli spazi normati e sulle algebre. Definizione 2.1. Sia X uno spazio vettoriale sul campo K = C o R. Un’applicazione N : X → R si dice norma su X e (X, N ) si dice spazio normato, quando N soddisfa le seguenti proprietà: N0. N (u) ≥ 0 per u ∈ X, N1. N (λu) = |λ|N (u) per λ ∈ K e u ∈ X, N2. N (u + v) ≤ N (u) + N (v), per u, v ∈ X, N3. N (u) = 0 ⇒ u = 0, per u ∈ X. Se N0, N1 e N2 sono soddisfatte ma non lo è necessariamente N3, N si dice seminorma. Nota. È chiaro che da N1 discende che N (0) = 0. Notazione 2.1. Nel seguito || || e p( ), aggiungendo eventuali indici quando necessari, indicheranno sempre rispettivamente norme e seminorme. È chiaro che ogni spazio normato ammette una topologia metrica naturale indotta dalla distanza d(u, v) := ||u − v|| per u, v ∈ X. (d : X × X → [0, +∞) è una metrica in quanto per costruzione è simmetrica, positiva, nulla solo se u = v e vale la disuguaglianza triangolare ||x − y|| ≤ ||x − z|| + ||z − y|| per x, y, z ∈ X.) Nel seguito ci riferiremo quasi sempre a tale topologia usando concetti topologici in uno spazio normato. Definizione 2.2. Se (X, || ||X ) e (Y, || ||Y ) sono spazi normati sullo stesso campo C o R, un’applicazione lineare L : X → Y è detta isometria se soddisfa ||L(x)||Y = ||x||X per ogni x ∈ X. Se l’isometria L : X → Y è anche suriettiva, è detta isomorfismo di spazi normati. Se esiste un isomorfismo di spazi normati (L) dallo spazio normato X allo spazio normato Y, tali spazi si dicono isomorfi (secondo L). Osservazioni. (1) Frequentemente si trova in letteratura una definizione alternativa e non equivalente di isomorfismo di spazi normati. Tale definizione richiede che l’isomorfismo sia un’applicazione lineare bicontinua (cioè un omeomorfismo lineare). È chiaro che un isomorfismo nel senso della definizione definizione 2.2 lo è anche rispetto a questa seconda definizione, tuttavia non vale il viceversa. 18 (2) È chiaro che ogni isometria L : X → Y è iniettiva per N3, ma può non essere suriettiva (se vale X = Y la non surgettività può esserci solo se la dimensione dello spazio X non è finita). Ogni isometria è ovviamente continua rispetto alle due topologie metriche dei due spazi e, se è suriettiva (cioè se è un isomorfismo), la sua inversa è ancora un’isometria e quindi un isomorfismo. Definizione 2.3. Uno spazio normato si dice spazio di Banach quando è completo nella sua topologia metrica (cioè ogni successione di Cauchy di elementi dello spazio converge a qualche elemento dello spazio.) È chiaro che la proprietà di completezza è invariante per isomorfismi di spazi normati ma non lo è sotto omeomorfismi. Un controesempio è dato dalla coppia di spazi R e (0, 1) entrambi dotati della norma valore assoluto. I due spazi sono omeomorfi ma il primo è completo, mentre il secondo non lo è. È immediato provare che ogni sottospazio chiuso di uno spazio di Banach è a sua volta uno spazio di Banach rispetto alla restrizione della norma. È un fatto noto che ogni spazio normato può essere completato producendo uno spazio di Banach in cui lo spazio di partenza è rappresentato da un sottospazio denso. Vale a tal proposito il: Teorema del completamento per spazi di Banach. Sia X uno spazio vettoriale sul campo K = C o R dotato di una norma N . (a) Esiste uno spazio di Banach (Y, M ) su K, detto completamento di X tale che X si identifica isometricamente con un sottospazio denso di Y tramite un applicazione lineare iniettiva J : X → Y. In altre parole, esiste un applicazione lineare iniettiva J : X → Y con J(X) = Y e M (J(x)) = N (x) per ogni x ∈ X. (b) Se la terna (J1 , Y1 , M1 ) con J1 : X → Y1 lineare isometrica e (Y1 , M1 ) spazio di Banach su K è tale che X si identifica isometricamente con un sottospazio denso di Y1 tramite J1 allora esiste ed è unico un isomorfismo di spazi normati φ : Y → Y1 tale che J1 = φ ◦ J. Schema della dimostrazione. Diamo solo l’idea generale della dimostrazione. (a) Conviene considerare lo spazio C delle successioni di Cauchy di elementi di X e definire la relazione di equivalenza in C: xn ∼ x0n ⇔ esiste lim ||xn − x0n || = 0 . n→∞ È chiaro che X ⊂ C/ ∼ identificando ogni x di X con la classe di equivalenza della successione costante xn = x. L’applicazione che definisce tale identificazione la indicheremo con J. Si prova facilmente che C/ ∼ è uno spazio vettoriale su K normato rispetto alla struttura indotta naturalmente da quella di X. Si prova infine che C/ ∼ è completo, che J è lineare, isometrica (e quindi iniettiva) e che J(X) è denso in Y := C/ ∼. (b) J1 ◦ J −1 : J(X) → Y1 è una trasformazione lineare isometrica continua definita su un insieme denso J(X) ⊂ Y a valori in uno spazio di Banach Y1 , e pertanto si estende unicamente ad una trasformazione φ lineare 19 continua ed isometrica su Y (vedi esercizi (3) e (4) in esercizi 2.1). Essendo φ isometrica, è anche iniettiva. La stessa cosa si può dire per l’estensione φ0 di J ◦ J1−1 : J1 (X) → Y e per costruzione (J ◦ J1−1 ) ◦ (J1 ◦ J −1 ) = idJ(X) . Estendendo per continuità su J(X) = Y troviamo che φ0 ◦ φ = idY e con un analogo ragionamento troviamo anche che φ ◦ φ0 = idY1 . Concludiamo che φ e φ0 sono anche surgettive ed in particolare φ è un isomorfismo di spazi normati e che per costruzione vale J1 = φ ◦ J. L’unicità di un isomorfismo φ : Y → Y0 che soddisfa J1 = φ ◦ J si ha facilmente notando che ogni altro siffatto isomorfismo di spazi normati ψ : Y → Y1 , per linearità deve soddisfare J − J = (φ − ψ) ◦ J e quindi (φ − ψ) J(X) = 0. L’unicità dell’estensione dell’applicazione (φ−ψ) J(X) , continua con dominio J(X) denso, a J(X) = Y prova che φ = ψ. 2 Come vedremo esiste uno stretto legame tra algebre e spazi normati, tale legame passa per la nozione di operatore lineare su uno spazio normato. Le definizioni principali riguardante la nozione di algebra sono riassunte di seguito. Definizione 2.4. Un’ algebra A sul campo K = C o R è uno spazio vettoriale su K dotato di un’ulteriore applicazione detta prodotto dell’algebra: ◦ : A × A → A tale che: A1. a ◦ (b + c) = a ◦ b + a ◦ c per a, b, c ∈ A, A2. (b + c) ◦ a = b ◦ a + c ◦ a per a, b, c ∈ A, A3. α(a ◦ b) = (αa) ◦ b = a ◦ (αb) per α ∈ K e a, b ∈ A. L’algebra A è detta: commutativa o abeliana se A4. a ◦ b = b ◦ a per ogni coppia a, b ∈ A; algebra con unitàse contiene un elemento I, detto unità dell’algebra, tale che: A5. I ◦ u = u ◦ I = u per ogni a ∈ A; algebra normata ovvero algebra normata con unità se è uno spazio vettoriale normato con norma || || che soddisfi la relazione A6. ||a ◦ b|| ≤ ||a||||b|| per a, b ∈ A; e, nel caso di algebra normata con unità, valga anche: A7. ||I|| = 1; algebra di Banach ovvero algebra di Banach con unità se A è spazio di Banach e rispettivamente algebra normata, o algebra normata con unità rispetto alla stessa norma. Un omomorfismo di algebre (con unità, normate, di Banach), φ : A → A0 è un omomorfismo rispetto alla struttura di spazio vettoriale (funzione lineare) che preserva il prodotto delle algebre e l’unità se presente. φ è detto isomorfismo di algebre(con unità, normate, di Banach) se è anche biettivo. Se esiste un isomorfismo φ : A → A0 , le algebre A e A0 (con unità, normate, di Banach) sono dette isomorfe. Osservazioni. (1) Si dimostra immediatamente che l’unità, se esiste è unica. (2) La nozione di norma non viene coinvolta nella definizione di omomorfismo e isomorfismo di algebre con unità, normate, di Banach. 20 Notazione 2.2. Nel seguito, se ciò non darà luogo a fraintendimenti, indicheremo il prodotto di due elementi di un’algebra semplicemente con ab invece che con a ◦ b. Esempi 2.1. (1) I campi C e R sono banalmente algebre commutative di Banach. In entrambi i casi la norma è l’operazione di estrazione del valore assoluto o modulo. (2) Se X è un insieme qualsiasi e K = C o R, indichiamo con L(X) l’insieme di tutte le funzioni f : X → K limitate (cioè supx∈X |f (x)| < ∞). L(X) ha una struttura naturale di spazio vettoriale su K rispetto alla solita operazione di composizione lineare di funzioni. Possiamo aggiungere un prodotto che rende L(X) un’algebra: se f, g ∈ L(X), f g è definita come, punto per punto, (f g)(x) := f (x)·g(x). Si osservi che l’algebra è commutativa e con unità (data dalla funzione che vale sempre 1). Una norma che rende L(X) algebra di Banach commutativa è quella dell’estremo superiore: ||f || := supx∈X |f (x)| [Rud82]. (3) Se sull’insieme X di sopra definiamo una σ-algebra, Σ, la sottoalgebra delle funzioni Σmisurabili, M (X, Σ) ⊂ L(X), è un insieme chiuso in L(X) rispetto alla topologia della norma dell’estremo superiore. Quindi M (X, Σ) è a sua volta un algebra di Banach commutativa [Rud82]. (4) Se X è uno spazio topologico, lo spazio vettoriale delle funzioni continue a valori nel campo C si indica con C(X). Cb (X) ⊂ C(X) denota il sottospazio delle funzioni continue limitate, Cc (X) ⊂ Cb (X) denota infine il sottospazio delle funzioni continue a supporto compatto. Nel caso X sia compatto i tre spazi coincidono evidentemente. I tre spazi sono sicuramente algebre commutative rispetto alle operazioni dette nell’esempio (2). C(X) e Cb (X) sono algebre con unità data dalla funzione costante di valore 1, mentre non lo è Cc (X) quando X non è compatto. Rispetto alla norma dell’estremo superiore definita nell’esempio (2) Cb (X) è algebra di Banach. È un risultato importante delle teorie delle algebre di Banach [Rud91] che ogni algebra di Banach con unità e commutativa sul campo C è isomorfa ad un’algebra C(K) con K compatto. Se X è uno spazio topologico di Hausdorff (cioè per ogni coppia di punti x, y ∈ X con x 6= y esistono due aperti A, B tali che A 3 x, B 3 y e A ∩ B = ∅) che sia anche localmente compatto (cioè per ogni punto p ∈ X c’è un aperto A ed un compatto K tali che p ∈ A ⊂ K), completando lo spazio normato Cc (X) si ottiene un’algebra di Banach (senza unità) commutativa, tale algebra di Banach si chiama l’algebra delle funzioni continue che tendono a zero all’infinito in X [Rud82]. Si tratta delle funzioni continue f : X → C, tali che, per ogni > 0 esiste un compatto K ⊂ X (dipendente da f in generale) con |f (x)| < se x ∈ X \ K . (5) Se X è spazio di Hausdorff compatto, consideriamo in C(X) una sottoalgebra A che soddisfi i seguenti requisiti: contenga l’unità (data dalla funzione che vale ovunque 1) e sia chiusa rispetto alla coniugazione complessa – se f ∈ A allora f ∗ ∈ A, dove f ∗ (x) := f (x) per ogni x ∈ X in cui la barra indica la coniugazione complessa –. Diremo che A separa i punti di X, se per ogni coppia x, y ∈ X con x 6= y esiste f ∈ A con f (x) 6= f (y). Il teorema di Stone-Weierstrass [Rud91], 21 prova quanto segue. Teorema (di Stone-Weierstrass). Ogni sottoalgebra A ⊂ C(X), con X di Hausdorff compatto, che contenga l’unità, sia chiusa rispetto alla coniugazione complessa e separi i punti, è tale che la sua chiusura rispetto alla norma dell’estremo superiore coincide con C(X) stessa. Un esempio tipico è quello in cui X è un compatto di Rn e A è l’algebra dei polinomi complessi ad n variabili (le coordinate di Rn ) ristretti ad A. Dal teorema di Stone-Weierstrass si ricava che con i polinomi possiamo approssimare uniformemente ogni funzione complessa continua definita su X. Tale risultato è utile nella teoria degli spazi di Hilbert per costruire basi hilbertiane. (6) Se (X, Σ, µ) è uno spazio con misura positiva e 1 ≤ p < ∞ valgono le disuguaglianze di Hölder e di Minkowski, rispettivamente: Z 1/p Z 1/q , |f (x)g(x)|dµ(x) ≤ |f (x)|p dµ(x) |g(x)|q dµ(x) X X X 1/p Z 1/p Z Z 1/p p p p , + |g(x)| dµ(x) ≤ |f (x)| dµ(x) |f (x) + g(x)| dµ(x) Z (2.2) X X X (2.1) dove f, g : X → C sono funzioni misurabili e 1/p + 1/q = 1 [Rud82]. Se indichiamo con Lp (X, µ) l’insieme contenente tutte le funzioni f : X → C che sono µ-misurabili e tali che R p p X |f (x)| dµ(x) < ∞, si prova facilmente che, in base alle disuguaglianze di sopra, L (X, µ) è uno spazio vettoriale rispetto alle solite composizioni lineari di funzioni e che Pp definita sotto è effettivamente una seminorma: Z 1/p Pp (f ) := |f (x)|p dµ(x) (2.3) X Per ottenere una vera norma, cioè per avere che sia soddisfatta N3, bisogna fare in modo da identificare con la funzione nulla ogni funzione che differisce da essa per un insieme di misura nulla. Tali funzioni pur non essendo nulle annullano l’integrale di sopra violando N3 a Pp . A tal fine si può definire la relazione di equivalenza su Lp (X, µ) data da f ∼ g se e solo se f − g è nulla quasi ovunque rispetto a µ. Si indica con Lp (X, µ) lo spazio quoziente Lp (X, µ)/ ∼. Questo spazio eredita naturalmente una struttura di spazio vettoriale su C da quella di Lp (X, µ) semplicemente definendo [f ] + [g] := [f + g] e α[f ] := [αf ] (si verifica che le definizioni non dipendono nei secondi membri dai rappresentanti scelti nelle classi di equivalenza usate a primo membro). Si riesce a provare ([Rud82], teorema 3.11) che Lp (X, µ) è spazio di Banach rispetto alla norma ||[f ]||p := Z p |f (x)| dµ(x) 1/p (2.4) X dove f è un rappresentante arbitrario di [f ] ∈ Lp (X, µ). Lo spazio di Banach ottenuto non è algebra rispetto al prodotto puntuale dato che il prodotto puntuale di funzioni di Lp (X, µ) non è, in generale elemento dello stesso spazio. 22 N.B. Nella letteratura corrente prevale l’uso del simbolo f per denotare la classe di equivalenza [f ] ∈ L2 (X, µ). Noi seguiremo tale uso nelle situazioni in cui ciò non produrrà confusione. (7) In riferimento all’esempio (6), consideriamo il caso particolare in cui X è un insieme non necessariamente numerabile, Σ è l’insieme delle parti di X e µ è la misura che conta i punti: se S ⊂ X, µ(S) = numero di elementi di S e µ(S) = ∞ se S contiene infiniti punti. In questo caso lo spazio Lp (X, µ) si indica semplicemente con lp (X). I suoi elementi sono le “successioni” {zx }x∈X di complessi etichettati su X, tali che: X |zx |p < ∞ , x∈X dove la somma è definita come: X sup |zx |p X0 ⊂ X, X0 finito . x∈X0 Si osservi che, nel caso X sia numerabile, X = N o Z in particolare, la definizione data sopra di somma di un insieme di numeri positivi etichettati su X si riduce a quella solita di somma di una serie (vedi definizione 3.4 e proposizione 3.2 nel capitolo 3). (8) Se (X, Σ, µ) è uno spazio con misura positiva e f : X → C una funzione misurabile definiamo Sf := {r ∈ R | µ(|f |−1 (r, +∞)) = 0}. Le funzioni misurabili f : X → C per cui Sf 6= ∅ costituiscono un’algebra commutativa con unità con le solite operazioni definite negli esempi di sopra per gli spazi di funzioni. È possibile definire una norma su tale algebra rispetto alla quale si abbia un’algebra di Banach (vedi [Rud82], teorema 3.11 per la dimostrazione della completezza): ||f || := ess supf dove l’estremo superiore essenziale di f , ess supf , è definito come inf Sf ossia n ess supf := inf r ∈ R µ(|f |−1 (r, +∞)) = 0 o . (2.5) L’algebra di Banach che si ottiene si indica con L∞ (X, µ) e si chiama l’algebra delle funzioni essenzialmente limitate. (9) In riferimento all’esempio (8), nel caso particolare in cui Σ è l’insieme delle parti di X e µ è la misura che conta i punti, lo spazio L∞ (X, µ) si indica semplicemente con l∞ (X). I suoi elementi sono le “successioni” di complessi etichettati su X {zx }x∈X tali che supx∈X |zx | < +∞. (Per cui, in riferimento alla notazione usata nell’esempio (2), l∞ (X) = L(X).) 2.2 Operatori, spazi di operatori, norme di operatori. Definizione 2.5. Siano X e Y spazi vettoriali sullo stesso campo K := R o C. (a) T : X → Y è detto operatore lineare (o semplicemente operatore) da X in Y se è 23 lineare. L(X, Y) denota l’insieme degli operatori lineari da X in Y. Quando X e Y sono normati, B(X, Y) ⊂ L(X, Y) denota il sottoinsieme degli operatori lineari continui. In particolare L(X) := L(X, X) e B(X) := B(X, X). (b) T : X → K è detto funzionale lineare (o semplicemente funzionale) su X se è lineare. (c) Lo spazio X∗ := L(X, K) è detto duale algebrico di X mentre, se K è inteso come uno spazio normato rispetto alla norma indotta dal valore assoluto, X0 := B(X, K) è detto duale topologico (o semplicemente duale) di X. Al solito se T, T 0 ∈ L(X, Y) e α, β ∈ K, la combinazione lineare αT + βT 0 è definita come l’applicazione (αT + βT 0 ) : u 7→ α(T u) + β(T 0 u) per ogni u ∈ X ed è quindi ancora un elemento di L(X, Y). Dato che come è facile provare vale anche che ogni combinazione lineare di operatori continui è un operatore continuo concludiamo che L(X, Y), L(X) e X∗ e B(X, Y), B(X) e X0 , sono tutti spazi vettoriali su K. Introduciamo il concetto di operatore e funzionale limitato. Teorema 2.1. Siano (X, || ||X ), (Y, || ||Y ) spazi normati sullo stesso campo K = C o R. Si consideri T ∈ L(X, Y). (a) Le seguenti due condizioni sono equivalenti (i) esiste K ∈ R tale che ||T u||Y ≤ K||u||X per ogni u ∈ X; u||Y (ii) esiste supu∈X\{0} ||T ||u||X < +∞. (b) Se vale la condizione (i) allora ¨ « ||T u||Y sup u ∈ X \ {0} = inf {K ∈ R | ||T u||Y ≤ K||u||X per ogni u ∈ X} . ||u||X Prova. (a) Se vale (i), per costruzione supu∈X\{0} A := u||Y supu∈X\{0} ||T ||u||X , ||T u||Y ||u||X ≤ K < +∞. Se vale (ii) posto K := A soddisfa (i). (b) Detto I l’estremo inferiore dell’insieme dei K che soddisfano (i), valendo supu∈X\{0} K deve essere u||Y supu∈X\{0} ||T ||u||X ||T u||Y ||u||X ≤ ≤ I. Supponiamo per assurdo che valga la disuguaglianza stret- u||Y ta. Sia allora J un punto con supu∈X\{0} ||T ||u||X < J e J < I. Dalla prima condizione segue che ||T u||Y < J||u||X per ogni u 6= 0 e quindi ||T u||Y ≤ J||u||X per ogni u ∈ X, ma allora J soddisfa la condizione (i) e ciò contraddice J < I. 2 Nel seguito ometteremo gli indici nelle norme per denotare gli spazi su cui sono definite se ciò sarà ovvio dal contesto. Definizione 2.6. Siano X, Y spazi normati sul medesimo campo C o R. T ∈ L(X, Y) è detto limitato se vale una delle due condizioni equivalenti dette in (a) nell’enunciato del teorema 2.1. 24 In tal caso il numero ||T u|| . ||u||6=0 ||u|| ||T || := sup (2.6) è detto norma (operatoriale) di T . Nota. Dalla definizione di ||T || si ha subito che se T : X → Y è limitato vale l’utile proprietà: ||T u|| ≤ ||T || ||u|| , per ogni u ∈ X . (2.7) La norma operatoriale può essere calcolata anche in altri modi talvolta utili nelle dimostrazioni. Vale la seguente proposizione in proposito. Proposizione 2.1. Siano X, Y spazi normati sul medesimo campo C o R. T ∈ L(X, Y) è limitato se e solo se esiste ed è finito uno dei secondi membri delle tre identità di sotto ed in tal caso tali identità sono verificate. ||T || = sup ||T u|| , (2.8) ||u||=1 ovvero ||T || = sup ||T u|| , (2.9) ||u||≤1 ovvero ||T || = inf {K ∈ R | ||T u|| ≤ K||u|| per ogni u ∈ X} . (2.10) Prova. Il fatto che T sia limitato se e solo se il secondo membro di (2.8) esista e sia finito e la stessa identità (2.8) seguono facilmente dalla linearità di T e dalla proprietà N1 delle norme. Il fatto che T sia limitato se e solo se il secondo membro di (2.9) esista e sia finito e la stessa identità (2.9) seguono facilmente dal seguente ragionamento. Dato che l’insieme degli u con ||u|| ≤ 1 include l’insieme degli u con ||u|| = 1, vale sup||u||≤1 ||T u|| ≥ sup||u||=1 ||T u||. D’altra parte, se ||u|| ≤ 1, vale ||T u|| ≤ ||T v|| per qualche v con ||v|| = 1 (qualunque v suddetto se u = 0 e v = u/||u|| altrimenti). Quindi vale anche sup||u||≤1 ||T u|| ≤ sup||u||=1 ||T u||, da cui si ottiene sup||u||≤1 ||T u|| = sup||u||=1 ||T u|| che dimostra quanto volevamo. Il fatto che T sia limitato se e solo se il secondo membro di (2.10) esista e sia finito e la stessa identità (2.10) seguono facilmente da (b) del teorema 2.1 2 Il legame tra continuità e limitatezza è dato dal seguente teorema che prova, tra l’altro, che gli operatori limitati sono tutti e soli quelli continui. 25 Teorema 2.2. Sia T ∈ L(X, Y) con X, Y spazi normati sul medesimo campo. I seguenti fatti sono equivalenti: (i) T è continuo in 0; (ii) T è continuo; (iii) T è limitato. Prova. (i) ⇔ (ii). La continuità implica banalmente la continuità in 0. Mostriamo che la continuità in 0 implica la continuità. Valendo (T u) − (T v) = T (u − v) si ha che (limu→v T u) − T v = limu→v (T u − T v) = lim(u−v)→0 T (u − v) = 0 per la continuità in 0. (i) ⇒ (iii). Dalla continuità in 0, esiste δ > 0 tale che, se ||u|| < δ allora ||T u|| < 1. Scelto δ 0 > 0 con δ 0 < δ, se v ∈ X \ {0}, u = δ 0 v/||v|| ha norma inferiore a δ per cui ||T u|| < 1, che in termini di v si scrive ||T v|| < (1/δ 0 )||v||. Vale allora la condizione (a) del teorema 2.1 con K = 1/δ 0 e pertanto, per la definizione 4.2 T è limitato. (iii) ⇒ (i). Si tratta di un fatto ovvio. Se T è limitato allora ||T u|| ≤ ||T ||||u|| da cui la continuità in 0. 2. Il nome “norma” per ||T || non è casuale; in effetti la norma di operatori rende a tutti gli effetti B(X, Y), e quindi in particolare B(X) e X0 , uno spazio normato come proveremo tra poco. Più precisamente, vedremo che B(X, Y) è uno spazio di Banach se Y è di Banach e quindi, in particolare, X0 è sempre spazio di Banach. Il teorema che segue riguarda anche un altro importante fatto in relazione alla struttura di algebra. Cominciamo con l’osservare che la composizione di operatori di L(X), rispettivamente B(X), produce operatori nello stesso spazio (in particolare perché la composizione di funzioni continue produce funzioni continue). Ulteriormente, è immediato provare che lo spazio vettoriale L(X), rispettivamente B(X), soddisfa gli assiomi A1, A2 e A3 della definizione di algebra quando il prodotto dell’algebra è definito come la composizione di operatori. In questo modo risulta chiaro che L(X) e B(X) possiedono una struttura naturale di algebra con unità, quest’ultima data dalla funzione identità I : X → X, inoltre B(X) risulta essere una sottoalgebra di L(X). Nell’ultima parte del teorema seguente si rafforza ulteriormente il risultato, provando che B(X) è sempre un’algebra normata con unità rispetto alla norma operatoriale ed è ulteriormente algebra di Banach se X è uno spazio di Banach. Teorema 2.3. Siano X, Y spazi normati sullo stesso campo. (a) L’applicazione || || : T 7→ ||T ||, dove ||T || è definita da (2.6) per T ∈ B(X, Y), è una norma su B(X, Y) e rende B(X, Y) spazio normato. (b) Sull’algebra con unità B(X) valgono le ulteriori relazioni che la rendono algebra normata con unità: (i) ||T S|| ≤ ||T ||||S|| e T, S ∈ B(X), (ii) ||I|| = 1. (c) Se Y è completo B(X, Y) è uno spazio di Banach. In particolare: (i) se X è uno spazio di Banach, B(X) è un’algebra di Banach; 26 (ii) X0 è sempre uno spazio di Banach rispetto alla norma dei funzionali, anche se X non è completo. Prova. (a) è diretta conseguenza della definizione di norma di un operatore: le proprietà definitorie della norma N1, N2, N3 per la norma operatoriale possono essere immediatamente verificate usando le stesse proprietà N1, N2, N3 per la norma dello spazio Y, la formula (2.8) per la norma operatoriale e la definizione di estremo superiore. (b) Il punto (i) è immediata conseguenza della (2.7) e della (2.8). (ii) è di immediata verifica usando l’espressione per la norma operatoriale (2.8). Passiamo a provare la parte (c). Proviamo che se Y è completo allora B(X, Y) è uno spazio di Banach. Sia {Tn } ⊂ B(X, Y) una successione di Cauchy rispetto alla norma operatoriale. Da (2.7) segue che ||Tn u − Tm u|| ≤ ||Tn − Tm ||||u|| , il fatto che {Tn } sia di Cauchy implica che sia di Cauchy la successione dei vettori Tn u. Essendo Y completo, per ogni fissato u ∈ X esisterà un vettore di Y: T u := lim Tn u . n→∞ X 3 u 7→ T u è un operatore lineare essendo tali tutti gli operatori Tn . Mostriamo, per concludere, che T ∈ B(X, Y) e che ||T − Tn || → 0 per n → ∞. Essendo {Tn } una successione di Cauchy, se > 0, varrà ||Tn −Tm || ≤ per n, m sufficientemente grandi e quindi anche ||Tn u − Tm u|| ≤ ||Tn − Tm ||||u|| ≤ ||u||. Allora: ||T u − Tm u|| = || lim Tn u − Tm u|| = lim ||Tn u − Tm u|| ≤ ||u|| n→+∞ n→+∞ se m è grande a sufficienza. Dalla stima ottenuta, essendo ||T u|| ≤ ||T u − Tm u|| + ||Tm u|| ed usando (2.7), segue ancora che ||T u|| ≤ ( + ||Tm ||)||u|| . Ciò dimostra che T è limitato e quindi T ∈ B(X, Y) per il teorema 2.2. Valendo, come provato sopra, ||T u−Tm u|| ≤ ||u|| si ha anche che ||T −Tm || ≤ dove può essere scelto arbitrariamente piccolo pur di scegliere m grande a sufficienza. In altre parole ||T − Tn || → 0 se n → ∞. La prova dei sottocasi (i) e (ii) è immediata. (i) segue dal fatto che B(X) = B(X, X) e (ii) segue dal fatto che X0 := B(X, K) ed il campo di X, K = C o R è completo come spazio normato. 2 Esempi 2.2 (1) Una misura complessa su X [Rud82] è un’applicazione µ : Σ → C, che associa un numero complesso ad ogni insieme misurabile di una σ-algebra Σ su X, in modo tale che: (i) µ(∅) = 0 e P (ii) µ(∪n∈N En ) = +∞ n=0 µ(En ) indipendentemente dall’ordine di somma (questo è equivalente a dire che la convergenza deve valere in valore assoluto), per ogni classe numerabile, {En }n∈N , di insiemi misurabili di Σ disgiunti a due a due. La misura positiva |µ|, detta variazione totale di µ, è definita come segue: se E è insieme di Σ, ( |µ|(E) := sup X i ) |µ(Ei )| {Ei } partizione di E di insiemi di Σ. 27 La variazione totale di una misura complessa soddisfa sempre |µ|(X) < +∞ per definizione di misura complessa ed è quindi, una misura finita. (N.B. Quando µ è una misura positiva, l’applicazione diretta della definizione di sopra produce µ = |µ|, ma in questo caso la finitezza di |µ|(X) non è assicurata e vale se e solo se µ è finita; le misure con segno si intendono qui un sottocaso di quelle complesse). Dal Teorema di Radon-Nikodym segue in particolare il seguente risultati [Rud82]. Teorema (di caratterizzazione delle misure complesse). Per ogni misura complessa µ sullo spazio misurabile X esiste, ed è unica a meno di ridefinizione su insiemi di misura nulla, una R funzione misurabile h : X → C con |h| = 1 su X, che sia in L1 (X, |µ|) e tale che µ(E) = E h d|µ|. Se f ∈ L1 (X, |µ|) si definisce pertanto X f dµ := X f h d|µ|. Consideriamo X spazio topologico di Hausdorff localmente compatto dotato di una misura complessa µ, definita sulla σ-algebra di Borel di X. Sappiamo che l’algebra normata Cc (X) ha come completamento nella norma dell’estremo superiore l’algebra di Banach C0 (X) delle funzioni che si annullano all’infinito ((4) in esempi 2.1). Nelle ipotesi fatte definiamo ||µ|| := |µ|(X). È chiaro che, se f ∈ C0 (X), Z R R X f dµ ≤ ||µ||||f ||∞ , dove ||f ||∞ = supx∈X |f (x)| . Da tale fatto segue subito che ogni misura complessa di Borel definisce un elemento del duale (topologico) di C0 (X). Il teorema di Riesz per misure complesse [Rud82] prova che questo è in realtà il caso generale, precisando anche qualcosa in più. Per enunciare il teorema di Riesz, ricordiamo che, se µ è una misura di Borel positiva sullo spazio di Hausdorff localmente compatto X, µ è detta regolare se, per ogni boreliano E, µ(E) coincide con (i) l’estremo superiore dell’insieme dei numeri µ(K) dove K ⊂ E è compatto, e (ii) con l’estremo inferiore dell’insieme dei numeri µ(V ) dove V ⊃ E è aperto. Una misura di Borel complessa, µ, è detta regolare se è tale la misura di Borel positiva finita data dalla sua variazione totale |µ|. Il teorema di Riesz per misure di Borel afferma quanto segue. Teorema (di Riesz per misure complesse regolari). Sia X uno spazio topologico di Hausdorff localmente compatto, se Λ : C0 (X) → C è un funzionale lineare continuo, allora esiste un’unica misura di Borel complessa regolare µΛ tale che, per ogni f ∈ C0 (X): Z Λ(f ) = f dµΛ . X Vale inoltre ||Λ|| = ||µΛ ||. Si osservi che, dato che Cc (X) è denso in C0 (X), un funzionale continuo sul primo spazio ne individua univocamente uno sul secondo, per cui il teorema caratterizza anche i funzionali continui rispetto alla norma dell’estremo superiore su Cc (X). Si osservi ancora che, se X è tale che ogni aperto sia unione numerabile di compatti, la parola regolare si può omettere nell’enunciato del teorema. Risulta infatti che (teorema 2.18 in [Rud82]), se ν è una misura di Borel positiva sullo spazio di Hausdorff localmente compatto X in cui 28 ogni aperto è unione numerabile di compatti1 e i compatti hanno misura finita (come nel caso in esame, essendo la misura |µ| finita), allora ν è regolare. In particolare vale il seguente teorema. Teorema (di Riesz per misure complesse su Rn ). Se K ⊂ Rn oppure K ⊂ C è un compatto (rispetto alla topologia standard di Rn oppure C) e Λ : C0 (K) → C è un funzionale lineare continuo, allora esiste un’unica misura di Borel complessa µΛ tale che, per ogni f ∈ C0 (K): Z Λ(f ) = f dµΛ . X (2) In riferimento all’esempio (6) in esempi 2.1, se 1 ≤ p < +∞ e 1/p + 1/q = 1, il duale di Lp (X, µ) risulta essere Lq (X, µ) nel senso che l’applicazione Lq (X, µ) 3 [g] 7→ Λg dove R Λg (f ) := X f g dµ, è un isomorfismo di spazi normati da Lq (X, µ) a (Lp (X, µ))0 . Analogamente il duale di L1 (X, µ) si identifica con L∞ (X, µ). Esercizi 2.1. (1) Provare che ogni seminorma p soddisfa p(x) = p(−x). (2) Si dimostri che in uno spazio normato (X, N ) ogni successione convergente è successione di Cauchy. Soluzione. Sia {xn }n∈N ⊂ X convergente a x nella topologia indotta dalla norma N . Valendo N (xn − xm ) = N (xn − x + x − xm ) ≤ N (xn − x) + N (x − xm ) per la disuguaglianza triangolare, si ha che per ogni > 0 esiste M > 0 per cui se n, m > M , N (xn − x) < /2 e N (xm − x) < /2. Quindi per ogni > 0 esiste M > 0 per cui se n, m > N , N (xn − xm ) < e la successione è di Cauchy. (3) Si consideri una coppia di spazi normati X, Y, con Y spazio di Banach, e un sottospazio S ⊂ X la cui chiusura rispetto alla norma di X coincida con tutto X (in altre parole S è denso in X). Sia poi T : S → Y un operatore lineare limitato su S. Si dimostri che esiste un’unica estensione limitata di T , T 0 : X → Y. Soluzione. Se x ∈ X ci sarà una successione {xn } di elementi di S che converge a x. Vale ||T xn − T xm || ≤ K||xn − xm || con K < +∞ per ipotesi. Dato che xn → x, la successione degli xn è di Cauchy e quindi lo è anche quella dei vettori T xn . Dato che Y è completo, esiste dunque T 0 x := limn→∞ T xn ∈ Y. Tale limite dipende solo da x e non dalla successione in S usata per approssimarlo: se S 3 zn → x allora per la continuità delle norme || lim T xn − lim T zn || = lim ||T xn − T zn || ≤ lim K||xn − zn || = K||x − x|| = 0 . n→+∞ n→+∞ n→+∞ n→+∞ Ovviamente T 0 S = T , cioè T 0 è un’estensione di T e questo si prova scegliendo per ogni x ∈ S la successione costante di termini xn := x che tende a x banalmente. Le proprietà di linearità di T 0 sono di verifica immediata dalla stessa definizione. Infine prendendo il limite a n → +∞ ad ambo membri di ||T xn || ≤ K||xn || si ricava che ||T 0 x|| ≤ K||x|| per cui T 0 è limitato. Veniamo alla prova dell’unicità. Se U è un’altra estensione limitata di T su X allora, per ogni x ∈ X, 1 Ciò accade in Rn in cui gli aperti sono unione numerabile di palle chiuse di raggio non nullo. 29 per continuità T 0 x − U x = limn→+∞ (T 0 xn − U xn ) dove gli xn appartengono a S (denso in X). Essendo T 0 S = T = U S il limite è banale e fornisce T 0 x = U x per ogni x ∈ X ossia T 0 = U . (4) In riferimento all’esercizio precedente, si provi che l’unica estensione limitata T 0 di T soddisfa anche ||T 0 || = ||T ||. Soluzione. Se x ∈ X e {xn } ⊂ S converge a x: ||T 0 x|| = lim ||T xn || ≤ lim ||T ||||xn || = ||T ||||x|| , n→+∞ n→+∞ per cui ||T 0 || ≤ ||T ||. Ma essendo anche S ⊂ X e T 0 S = T , ¨ « ¨ « ¨ ||T 0 x|| ||T 0 x|| ||T x|| 0 ||T || = sup 0 6= x ∈ X ≥ sup 0 6= x ∈ S = sup ||x|| ||x|| ||x|| « 0 6= x ∈ S . L’ultimo termine nella catena di identità scritta sopra è ||T ||. Quindi ||T 0 || ≥ ||T ||. Allora ||T 0 || = ||T ||. (5)* Se definiamo un isomorfismo di spazi normati come un’applicazione lineare continua con inversa continua, la proprietà di completezza di uno spazio normato è invariante sotto isomorfismi? Suggerimento. Se non si arriva ad una conclusione si legga il paragrafo 2.5 generalizzando la proposizione 2.6 al caso di due spazi normati connessi da un’applicazione lineare continua con inversa continua. 2.3 I teoremi fondamentali negli spazi di Banach e le topologie deboli. In questa sezione dimostreremo i teoremi fondamentali della teoria degli spazi normati e di Banach nella versione più elementare possibile e ne esaminiamo le più importanti conseguenze generali: il teorema di Hahn-Banach, quello di Banach-Steinhaus e quello dell’applicazione aperta, studiandone anche qualche immediata conseguenza importante. Le applicazioni del secondo teorema, quello di Banach-Steinhaus, forniscono l’occasione per introdurre diverse topologie negli spazi di operatori. Tali topologie rivestono un ruolo importantissimo in Meccanica Quantistica quando lo spazio di Banach di partenza è lo spazio di Hilbert della teoria, l’algebra di operatori limitati di interesse è costituita da (alcune) osservabili della teoria, mentre le proprietà elementari del sistema quantistico associate ai processi di misura sono una sottoclasse della classe degli operatori di proiezione ortogonale. Per passare con continuità dall’algebra delle osservabili a quella dei proiettori sono necessarie topologie più deboli rispetto a quella standard. Questo genere di problematiche che discuteremo più oltre hanno portato alla nozione di algebra (di operatori) di Von Neumann. 2.3.1 Il teorema di Hahn-Banach e le sue conseguenze elementari. Il primo teorema è il famosissimo teorema di Hahn-Banach che si occupa del problema dell’estensione di un funzionale lineare continuo, da un sottospazio dello spazio ambiente ad un funzionale 30 continuo, definito tutto lo spazio e che conservi la norma iniziale. Esistono in realtà versioni molto più elaborate e potenti di tale teorema che si possono trovare, per esempio, in [Rud91]. Noi ci limiteremo qui alla situazione più elementare possibile. Per enunciare il teorema, notiamo che se X è uno spazio normato e M ⊂ X un suo sottospazio (rispetto alla sola struttura di spazio vettoriale di X), la restrizione della norma di X a M definisce su M una struttura di spazio normato. In questo senso si può parlare di operatori o funzionali definiti su M e continui (ossia limitati rispetto alla struttura di spazio normato indotta da quella di X). Teorema di Hahn-Banach (per spazi normati). Sia M un sottospazio (non necessariamente chiuso) di uno spazio normato X con campo K = C o R e sia g : M → K un funzionale lineare continuo. Esiste un funzionale lineare f : X → K continuo tale che f M = g e ||f ||X = ||g||M . Prova. Seguiremo essenzialmente la dimostrazione data nel Cap.5 di [Rud82]. Partiamo dal caso in cui K = R. Se g = 0, un’estensione che soddisfa la tesi è f = 0. Supponiamo dunque che g 6= 0 e, senza perdere generalità , assumiamo anche che ||g|| = 1. Costruiamo l’estensione f come segue. Sia x0 ∈ X \ M e sia M1 := {x + λx0 | x ∈ M , λ ∈ R}, il sottospazio di X generato da M e x0 . Se, per ν ∈ R fissato, definiamo g1 : M1 → R come g1 (x + λx0 ) = g(x) + λν , abbiamo un’estensione di g a M1 . Proviamo che si può sempre scegliere ν in modo tale che ||g1 || = 1. A tal fine è sufficiente che ν sia scelto in modo che valga: |g(x) + λν| ≤ ||x + λx0 || , per ogni x ∈ M e λ ∈ R \ {0}. (2.11) Sostituiamo −λx a x e dividiamo i due membri di (2.11) per |λ|, ottenendo la condizione equivalente alla (2.11): |g(x) − ν| ≤ ||x − x0 || , per ogni x ∈ M. (2.12) e bx := g(x) + ||x − x0 ||. (2.13) Poniamo quindi: ax := g(x) − ||x − x0 || , La (2.12), e quindi ||g1 || = 1, vale se ν si fissa in modo tale da soddisfare ax ≤ ν ≤ bx per ogni x ∈ M. È sufficiente dunque provare che chi intervalli [ax , bx ], con x ∈ M, hanno un punto in comune, cosa che è equivalente a dimostrare che per ogni x, y ∈ M, vale ax ≤ by . (2.14) D’altra parte: g(x) − g(y) = g(x − y) ≤ ||x − y|| ≤ ||x − x0 || + ||y − x0 || e la (2.14) è conseguenza della (2.13). Abbiamo ottenuto che si può fissare ν in modo tale che ||g1 || = 1 come volevamo. 31 Consideriamo ora la famiglia P di tutte le coppie (M0 , g 0 ) tali che M0 ⊃ M sia un sottospazio di X e g 0 : M0 → R sia lineare, estenda g e valga ||g 0 || = 1. Sappiamo che P non è vuoto dato che contiene almeno (M1 , g1 ). Possiamo ordinare parzialmente P (vedi l’Appendice A anche per il seguito) definendo (M0 , g 0 ) ≤ (M00 , g 00 ) quando M00 ⊃ M0 e g 00 estende g 0 e ||g 0 || = ||g 00 || = 1. Si dimostra facilmente che ogni sottoinsieme totalmente ordinato di P ammette un maggiorante in P. Il lemma di Zorn implica allora che esiste un elemento massimale in P che denoteremo con (M1 , f 1 ). Si osservi ora che deve essere necessariamente M1 = X, altrimenti esisterebbe x0 ∈ X \ M1 e, con la procedura vista all’inizio, potremmo costruire un’estensione propria di f 1 al sottospazio generato da x0 e M1 che rispetti la richiesta sulla norma, in contraddizione con la massimalità di (M1 , f 1 ). Concludiamo che f := f 1 è l’estensione cercata nella tesi. Passiamo infine al caso K = C. Se u : M → R è la parte reale di g, cioè u(x) = Reg(x) per ogni x ∈ M, deve essere g(x) = u(x)−iu(ix) e anche ||g|| = ||u||, come si prova facilmente. Sappiamo, dal caso precedente, che esiste un’estensione lineare U : X → R di u con ||U || = ||u|| = ||g||. Ma allora, se definiamo l’applicazione lineare f : X → C come: f (x) := U (x) − iU (ix) , per ogni x ∈ X, abbiamo che f estende g a tutto X e soddisfa ||f || = ||U || = ||g|| come richiesto nella tesi. 2 Una delle più utili conseguenze del teorema di Hahn-Banach è il seguente corollario. Ricordiamo che, se X è uno spazio normato, X0 indica il suo duale topologico B(X, C). Corollario 1. Sia X spazio normato e x0 ∈ X con x0 6= 0. Esiste f ∈ X0 con ||f || = 1 tale che f (x0 ) = ||x0 ||. Prova. Si scelga M := {λx0 | λ ∈ K} e g : λx0 → λ||x0 ||. Sia f ∈ X0 il funzionale limitato che estende g secondo il teorema di Hahn-Banach. Per costruzione f (x0 ) = g(x0 ) = ||x0 || e ||f ||X = ||g||M = 1.2 Un altro risultato, che ha importanti conseguenze nella teoria delle algebre di Banach, è il seguente. Corollario 2. Sia X spazio normato non banale. Gli elementi di X0 sono separanti per X. Cioè, se x1 6= x2 sono punti di X (ed esistono tali punti se X non è lo spazio vettoriale banale {0}) allora c’è almeno un funzionale f ∈ X0 per cui f (x1 ) 6= f (x2 ). Prova. Basta scegliere nel corollario 1 x0 := x1 − x2 ottenendo f (x1 ) − f (x2 ) = f (x1 − x2 ) = ||x1 − x2 || = 6 0. 2 Se x ∈ X e f ∈ X0 con ||f || = 1, allora |f (x)| ≤ 1||x|| per cui sup{|f (x)| | f ∈ X0 , ||f || = 1} ≤ ||x|| . 32 Il corollario 1 consente di rafforzare il risultato provando immediatamente che sup{|f (x)| | f ∈ X0 , ||f || = 1} = max{|f (x)| | f ∈ X0 , ||f || = 1} = ||x|| . Questo fatto apparentemente non molto profondo ha invece una certa rilevanza in una questione importante che nasce nella teoria degli spazi normati infinito-dimensionali, quando la si confronta con quella nel caso finito dimensionale. È noto, dalla teoria elementare degli spazi vettoriali, che lo spazio (X∗ )∗ , duale algebrico del duale algebrico di uno spazio vettoriale di dimensione finita, ha la notevole proprietà di essere naturalmente isomorfo a X stesso. L’isomorfismo è dato dalla applicazione lineare che associa ad x ∈ X il funzionale lineare su X∗ , I(x), definito da (I(x))(f ) := f (x) per ogni f ∈ X∗ . Nel caso infinito dimensionale I identifica X con un sottospazio di (X∗ )∗ , ma non, in generale con tutto (X∗ )∗ . C’è qualche proposizione generale a riguardo che vale lavorando con spazi normati infinito dimensionali considerando però i duali in senso topologico? Si noti che (X0 )0 è il duale topologico di uno spazio normato (X0 , la cui norma è quella operatoriale). Di conseguenza (X0 )0 è uno spazio normato a sua volta, la norma essendo ancora una volta quella operatoriale. Consideriamo ancora la trasformazione lineare naturale I : X → (X0 )∗ che associa a x ∈ X l’elemento I(x) ∈ (X0 )∗ , cioè la funzione lineare I(x) : X0 → K, definita come (I(x))(f ) := f (x) per ogni f ∈ X0 e x ∈ X . (2.15) (È chiaro per costruzione che I(x) è un funzionale lineare su X0 per cui effettivamente I(x) ∈ (X0 )∗ ). Il fatto che sup{|f (x)| | f ∈ X0 , ||f || = 1} = ||x|| ha due implicazioni immediate: (1) I(x) è un funzionale limitato, per cui appartiene a (X0 )0 e (2) ||I(x)|| = ||x||. Per cui la trasformazione lineare I : X → (X0 )0 è un’isometria e quindi in particolare è iniettiva. In definitiva si ha l’inclusione isometrica X ⊂ (X0 )0 data dall’isometria I : X → (X0 )0 . Abbiamo provato il seguente corollario. Corollario 3. La trasformazione lineare I : X → (X0 )0 definita da (I(x))(f ) := f (x) per ogni x ∈ X e f ∈ X0 è un’isometria. In tal modo X si identifica isometricamente con un sottospazio di (X0 )0 . Si possono trovare esempi, nel caso infinito dimensionale, in cui X non ricopre tutto (X0 )0 . Ciò porta a dare la seguente definizione. Definizione 2.7. Uno spazio normato X è detto riflessivo se l’isometria I : X → (X0 )0 , che associa x ∈ X con I(x) secondo la (2.15), è suriettiva (cioè è un isomorfismo di spazi normati). In altre parole X è riflessivo quando X e (X0 )0 sono isometricamente isomorfi tramite la trasformazione naturale I. Vedremo nella prossima sezione che se X è uno spazio di Hilbert la riflessività è assicurata. Gli spazi di Banach Lp (X, µ) introdotti negli esempi 2.1 sono riflessivi se 1 < p < ∞. 33 2.3.2 Il teorema di Banach-Steinhaus e topologie operatoriali. Passiamo al teorema di Banach-Steinhaus nella formulazione più elementare ed alle sue conseguenze immediate. Teorema di Banach-Steinhaus. Sia {Tα }α∈A una famiglia di operatori in B(X, Y) dove X è uno spazio di Banach e Y uno spazio normato. Se, per ogni x ∈ X sup ||Tα x|| < +∞ , α∈A allora esiste K ≥ 0 tale che ||Tα || ≤ K per ogni α ∈ A . Prova. Per dimostrare il teorema possiamo evidentemente restringerci al caso di una famiglia numerabile {Tn }α∈N . La dimostrazione si ottiene dimostrando che esiste una palla aperta Bρ (z) ⊂ X, di raggio ρ > 0 e centro z ∈ X, su cui {Tn }n∈N è uniformemente limitata in x e n, cioè, esiste M ≥ 0 per il quale ||Tn (x)|| ≤ M per ogni n ∈ N e ogni x ∈ Bρ (z). Infatti, in tal caso si avrebbe, per ogni x ∈ Bρ (0): ||Tn (x)|| ≤ ||Tn (x + z)|| + ||Tn (z)|| ≤ 2M , per ogni n ∈ N , dove abbiamo usato la decomposizione x = (x + z) − z. Pertanto avremmo che ||Tn || ≤ 2M/ρ per ogni n ∈ N, dimostrando la tesi. Proviamo, per assurdo, che Bρ (z) suddetta esiste davvero. Assumiamo che non esista alcuna Bρ (z) con le proprietà suddette. Allora, per una palla aperta Br0 (x0 ) fissata arbitrariamente, deve esistere x1 ∈ Br0 (x0 ) per cui ||Tn1 (x1 )|| > 1, per qualche n1 ∈ N. Dato che Tn1 è continuo, possiamo trovare una seconda palla aperta Br1 (x1 ) con Br1 (x1 ) ⊂ Br0 (x0 ) e con 0 < r1 < r0 tale che ||Tn1 (x)|| ≥ 1 se x ∈ Bn1 (x1 ). Questa procedura può essere iterata all’infinito in modo da ottenere una successione di palle aperte in X, {Brk (xk )}k∈N , che soddisfano: (i) Brk (xk ) ⊃ Brk+1 (xk+1 ), (ii) rk → 0 per k → +∞, (iii) per ogni k ∈ N c’è un nk ∈ N tale che ||Tnk (x)|| ≥ k se x ∈ Bnk (xk ). Si verifica subito, che (i) e (ii) implicano che la successione {xk }k∈N deve essere di Cauchy. Per la completezza di X, esiste y ∈ ∩k∈N Bnk (xk ); d’altra parte, la condizione (iii) implica che ||Tnk (y)|| ≥ k per ogni k ∈ N contraddicendo l’ipotesi che, per ogni x ∈ X, vale supn∈N ||Tn x|| < +∞. Abbiamo ottenuto un assurdo che conclude la dimostrazione. 2 Un immediato ed utile corollario del teorema di Banach-Steinhaus è il seguente. Corollario 1. Nelle stesse ipotesi del teorema di Banach-Steinhaus la famiglia di operatori {Tα }α∈A è equicontinua ossia, per ogni > 0 esiste δ > 0 tale che, per ogni coppia x, x0 ∈ X, se ||x − x0 ||X < δ allora ||Tα x − Tα x0 || < per ogni α ∈ A. 34 Prova. Nel seguito Cγ := {x ∈ X | ||x||X ≤ γ} per ogni γ > 0. Fissiamo > 0, dobbiamo trovare il δ > 0 che soddisfa la proprietà scritta nella tesi. Per il teorema di Banach-Steinhaus ed usando la proposizione 2.1, ||Tα x||Y ≤ K < +∞ per ogni α ∈ A e x ∈ C1 . Se K = 0 non c’è nulla da provare, assumiamo pertanto K > 0. Scegliamo δ > 0 per cui Cδ ⊂ C/K . Con le scelte fatte, se ||x − x0 ||X < δ, vale K(x − x0 )/ ∈ CKδ/ ⊂ C1 e quindi ||Tα x − Tα x0 ||Y = ||Tα (x − x0 )||Y = K(x − x0 ) ||Tα || < K = , K K indipendentemente da α ∈ A. 2 Per introdurre altri due corollari del teorema di Banach-Steinhaus abbiamo bisogno di alcune nozioni topologiche. Notazione 2.3. Se δ > 0 e p è una seminorma sullo spazio vettoriale X, sul campo K = C o R, e x ∈ X, indicheremo con Bp,δ (x) la palla aperta associata a p, centrata sul vettore x e di raggio δ: Bp,δ (x) := {z ∈ X | p(z − x) < δ} . Nel caso in cui x = 0 scriveremo semplicemente Bp,δ in luogo di Bp,δ (0). Se A ⊂ X, x ∈ X e β ∈ K indicheremo l’insieme {x + βu | u ∈ A} con la notazione x + βA := {x + βu | u ∈ A} . Si prova subito che le palle Bp,δ con δ > 0 sono insiemi convessi, cioé se x, y ∈ Bp,δ allora (1 − λ)x + λy ∈ Bp,δ per λ ∈ [0, 1], bilanciati (detti anche equilibrati), cioé λx ∈ Bp,δ se x ∈ Bp,δ e 0 ≤ λ ≤ 1, assorbenti, cioé ogni x ∈ X soddisfa λ−1 x ∈ Bp,δ per qualche λ > 0. Queste proprietà sono invarianti per intersezione, per cui anche insiemi ottenuti intersecando palle centrate nell’origine, ma ottenute da seminorme differenti, godono di tali proprietà. Se P := {pi }i∈I è una famiglia di seminorme sullo spazio vettoriale X sul campo K = C o R, la topologia su X generata da P, T(P), è l’unica che ammette come base la classe degli insiemi x + Bpi1 ,δ1 ∩ · · · ∩ Bpin ,δn per ogni scelta di x ∈ X, di n = 1, 2, . . ., degli indici i1 , . . . , in ∈ I e dei numeri δ1 > 0, . . . δn > 0. Si dimostra facilmente che la topologia indotta come sopra da seminorme sullo spazio vettoriale X è compatibile con la struttura di spazio vettoriale, cioé le operazioni di somma e di prodotto per scalare risultano essere continue rispetto alla detta topologia. Ricordiamo che uno spazio vettoriale dotato di topologia compatibile con la struttura di spazio vettoriale è detto spazio vettoriale topologico. Quando la topologia di uno spazio vettoriale topologico è quella indotta da una classe di seminorme, si dice che lo spazio vettoriale è uno spazio localmente convesso. È chiaro che nel caso generale la topologia indotta da una seminorma o da una classe di seminorme P = {pi }i∈I sullo spazio vettoriale X non sarà di Hausdorff. Si vede facilmente che la 35 proprietà di Hausdorff vale se e solo se ∩i∈I p−1 i (0) = 0, il secondo 0 essendo il vettore nullo di X. In particolare ciò accade se almeno una delle pi è una norma. Infine si prova facilmente che ogni spazio vettoriale dotato di una topologia indotta da una classe finita o numerabile di seminorme {pn }n∈I con la proprietà ∩n∈I p−1 n (0) = 0 è metrizzabile, cioè è la stessa che si ottiene da una opportuna distanza d : X × X → R+ . In particolare, la topologia coincide con quella indotta dalla distanza invariante per traslazioni d(x, y) := pn (x − y) . 2n 1 + pn (x − y) X 1 n∈I Uno spazio di Fréchet è uno spazio X localmente convesso la cui topologia è di Hausdorff, è indotta da una classe finita o numerabile di seminorme, e, come spazio metrico, X è completo2 . Questi spazi, di cui non ci occuperemo molto a causa del livello elementare di questo libro sono di fondamentale importanza nella fisica teorica e matematica per quanto concerne le teorie quantistiche. Ovviamente ogni spazio di Banch è un caso elementare di spazio di Fréchet. Ricordiamo che in uno spazio topologico X, una successione di punti {xn }n∈N ⊂ X è detta convergere a x ∈ X quando: per ogni aperto A 3 x esiste NA ∈ N tale che xn ∈ A se n > NA . Si prova facilmente che: Proposizione 2.2. Una successione {xn }n∈N ⊂ X converge a x0 ∈ X nella topologia T(P) se e solo se, per ogni pi ∈ P, pi (xn ) → pi (x0 ) quando n → +∞. È chiaro che se la classe P si riduce ad un unico elemento dato da una norma, la topologia indotta da P è la solita topologia metrica indotta da una norma. Con la nozione introdotta sopra di topologia indotta da una classe di seminorme si possono definire alcune topologie “standard” su L(X, Y), B(X, Y) e sul duale X0 : una di queste topologie (e la corrispondente sul duale) la conosciamo già perché è quella indotta dalla norma operatoriale. Definizione 2.8. Siano X, Y spazi normati sullo stesso campo K = C o R. (a) Si definiscono su L(X, Y) e B(X, Y) le seguenti topologie operatoriali. (i) La topologia indotta su L(X, Y) (ovvero B(X, Y)) dalla classe di tutte le seminorme definite come, se T ∈ L(X, Y) (rispettivamente B(X, Y), px,f (T ) := |f (T (x))| per ogni x ∈ X e f ∈ Y0 , che è detta topologia debole su L(X, Y) (rispettivamente B(X, Y)); (ii) La topologia indotta su L(X, Y) (ovvero B(X, Y)) dalla classe di tutte le seminorme definite come, se T ∈ L(X, Y) (rispettivamente B(X, Y)), px (T ) := ||T (x)||Y 2 Si prova facilmente che una successione di Cauchy rispetto alla distanza di uno spazio localmente compatto metrizzabile è tale se e solo se è di Cauchy rispetto ad ogni seminorma della classe generante la topologia, di conseguenza tale nozione non dipende dalla distanza usata (che può non essere unica) per generare la topologia. 36 per ogni x ∈ X, che è detta topologia forte su L(X, Y) (rispettivamente B(X, Y)); (iii) La topologia indotta su B(X, Y) dalla norma operatoriale (2.6) è detta topologia uniforme su B(X, Y). (b) Se Y = K, la topologia uniforme definita in (iii) prende il nome di topologia (duale) forte e le topologie debole e forte definite in (i) e (ii), che risultano coincidere, prendono il nome di topologia ∗ -debole. Note. (1) Si prova facilmente che la topologia forte è più forte di quella debole (cioè gli aperti della topologia debole sono aperti anche nella topologia forte). Nello stesso modo si prova facilmente che la topologia uniforme è più forte della topologia forte. Per gli spazi duali vale ovviamente l’analoga proprietà: la topologia forte è più forte della topologia ∗ -debole. (2) Data una successione di operatori {Tn } ⊂ L(X, Y) (o B(X, Y)) e un operatore T ∈ L(X, Y) (o rispettivamente B(X, Y)), si prova facilmente che: Tn → T nella topologia debole, se e solo se f (Tn (x)) → f (T (x)) per ogni scelta di x ∈ X e f ∈ Y0 . Nello stesso modo, si prova facilmente che: Tn → T nella topologia forte se e solo se ||Tn (x) − T (x)||Y → 0 per ogni scelta di x ∈ X. È chiaro che la convergenza di una successione di operatori di B(X, Y) in senso uniforme (cioè rispetto alla topologia uniforme) implica la convergenza della stessa successione in senso forte (cioè rispetto alla topologia forte). Similmente, la convergenza di una successione di operatori di L(X, , Y) o B(X, Y) in senso forte implica la convergenza della stessa successione in senso debole (cioè rispetto alla topologia debole). (3) Data una successione di funzionali {fn } ⊂ X0 e un funzionale f ∈ X0 , si prova facilmente che: fn → f nella topologia ∗ -debole se e solo se fn (x) → f (x) per ogni scelta di x ∈ X. È chiaro che la convergenza di una successione di funzionali di X0 in senso forte (cioè rispetto alla topologia duale forte) implica la convergenza della stessa successione in senso ∗ -debole (cioè rispetto alla topologia ∗ -debole). 37 Notazione 2.4. Per denotare i limiti rispetto alle topologie forti e deboli solitamente si usano le seguenti convenzioni notazionali, che adotteremo anche in questo testo. T = s- lim Tn significa che T è il limite nella topologia forte della successione di operatori {Tn }. La stessa notazione si usa nel caso in cui gli operatori coinvolti siano funzionali e la topologia è quella duale forte. T = w- lim Tn significa che T è il limite nella topologia debole della successione di operatori {Tn }. f = w∗ - lim fn significa che f è il limite nella topologia ∗ -debole della successione {fn }. Le nozioni topologiche acquisite permettono di provare altri due rilevanti corollari del teorema di Banach-Steinhaus. Sappiamo già che se X è uno spazio normato allora X0 è completo rispetto alla topologia duale forte come provato in (ii) di (c) del teorema 2.3. Si può provare che la completezza sussiste anche rispetto alla topologia ∗ -debole purché X sia spazio di Banach. Corollario 2. Se X è uno spazio di Banach sul campo K = C o R, allora X0 è completo anche rispetto alla topologia ∗-debole. In altre parole se {fn } ⊂ X0 è tale che {fn (x)} è una successione di Cauchy per ogni x ∈ X, allora esiste f ∈ X0 tale che f = w∗ -limfn . Prova. Il campo di X è completo per ipotesi, di conseguenza, per ogni x ∈ X esisterà f (x) ∈ K con fn (x) → f (x). È immediato verificare che f : X 3 x 7→ f (x) definisce un funzionale lineare. Per concludere la dimostrazione proviamo che f è continuo. Per ogni x ∈ X, fn (x) è limitata (perché di Cauchy) per cui, dal teorema di B-S, |fn (x)| ≤ K < +∞ per ogni x ∈ X con ||x|| ≤ 1. Facendo il limite a n → +∞ segue che |f (x)| ≤ K se ||x|| ≤ 1 da cui ||f || ≤ K < +∞ e pertanto, dal teorema 2.2, f è continuo. 2 Corollario 3. Sia X uno spazio normato sul campo C o R. Se S ⊂ X è debolmente limitato, cioè per ogni f ∈ X0 esiste c(f ) ≥ 0 tale che |f (x)| ≤ c(f ) per ogni x ∈ S, allora S è limitato rispetto alla norma di X. Prova. Consideriamo gli elementi x ∈ S ⊂ X come funzionali del duale di X0 , (X0 )0 facendo uso della trasformazione isometrica I : X → (X0 )0 definita nel corollario 3 al teorema di HahnBanach. La famiglia di funzionali su X0 , S ⊂ (X0 )0 è limitata su ogni f ∈ X0 per ipotesi essendo (scriviamo x in luogo di I(x)) |x(f )| = |f (x)| ≤ c(f ). Dato che X0 è completo possiamo applicare il teorema di B-S concludendo che sup{|x(f )| | ||f || = 1} ≤ K < +∞ per ogni x ∈ S ossia (essendo I un’isometria) ||x|| ≤ K < +∞ per ogni x ∈ S. 2 38 2.3.3 Il teorema dell’applicazione aperta e dell’operatore inverso continuo dal Teorema di Baire. Concludiamo la sezione con l’ultimo importante teorema generale, quello dell’applicazione aperta, che avrà come conseguenza il teorema dell’operatore inverso continuo. Per provare tali teoremi vogliamo introdurre il minimo indispensabile della teoria degli spazi di Baire. Ricordiamo che un sottoinsieme S di uno spazio topologico X si dice ovunque non denso (nowhere dense), quando la sua chiusura S ha interno vuoto. Un insieme S ⊂ X, con X spazio topologico, è detto insieme di prima categoria o anche insieme magro (meager set), se è ottenibile come l’unione di una classe numerabili di insiemi ovunque non densi. Un insieme S ⊂ X, con X spazio topologico, è detto insieme di seconda categoria o anche insieme non magro se non è di prima categoria. Risultano immediatamente i seguenti risultati. (1) L’unione numerabile di insiemi di prima categoria è ancora di prima categoria. (2) Se h : X → X0 è un omeomorfismo di spazi topologici S ⊂ X è di prima (seconda) categoria se e solo se h(S) è di prima (risp. seconda) categoria. (3) Se A ⊂ B ⊂ X e B è di prima categoria nello spazio topologico X, allora A è di prima categoria. (4) Se B ⊂ X è un insieme chiuso dello spazio topologico X e Int(B) = ∅, allora B è di prima categoria in X. Vale infine l’importante teorema di Baire. Teorema di Baire. Sia X uno spazio metrico completo (in particolare uno spazio di Banach). Se {Un }n∈N è una collezione numerabile di sottoinsiemi aperti e densi di X, allora ∩n∈N Un è denso in X. Di conseguenza X è di seconda categoria. Prova. Sia A ⊂ X un insieme aperto e x ∈ A. Se fosse U0 ∩ A = ∅, avremmo che x ammette un intorno aperto di che non interseca U0 che, di conseguenza, non potrebbe essere denso in X. Quindi U0 ∩ A è un aperto (in quanto intersezione di aperti) non vuoto. Esiste allora una palla aperta Br0 (x0 ) di raggio r0 > 0 e centro x0 ∈ X tale che Br0 (x0 ) ⊂ U0 ∩ A. Possiamo ripetere la procedura usando Br0 (x0 ) al posto di A, U1 al posto di U0 , e trovando una nuova palla aperta Br1 (x1 ) con Br1 (x1 ) ⊂ U1 ∩ Br0 (x0 ). Iterando la procedura, possiamo costruire una classe numerabile di palle aperte Brn (xn ), di raggi rn , con n ∈ N e 0 < rn < 1/n, tali che Brn (xn ) ⊂ Un ∩ Brn−1 (xn−1 ). Dato che xn ∈ Brm (xm ) quando m ≥ n, la successione {xn }n∈N deve essere di Cauchy. Essendo X completo, xn → x per qualche x ∈ X se n → +∞. Per costruzione, per ogni n ∈ N, x ∈ Brn−1 (xn−1 ) ⊂ Brn (xn ) ⊂ · · · ⊂ U0 ∩ A ⊂ A. Concludiamo che vale x ∈ A e x ∈ Un per ogni n ∈ N e pertanto (∩n∈N Un ) ∩ A 6= ∅ per ogni sottoinsieme aperto A ⊂ X. Di conseguenza ∩n∈N Un è denso in X, dato che interseca ogni intorno aperto di ogni elemento di X. Passiamo al secondo asserto. Supponiamo ora che {Ek }k∈N X sia una collezione numerabile di insiemi Ek ⊂ X ovunque non densi. Se Vk è il complemento di Ek , per ogni k ∈ N, Vk deve essere aperto e denso in X. La prima parte del teorema dimostra che ∩k∈N Vn 6= ∅ e quindi, prendendo 39 il complemento X 6= ∪k∈N Ek ed, a maggior ragione, X 6= ∪k∈N Ek . Per cui X non è di prima categoria ed è dunque di seconda categoria. 2 Nota. Il teorema di Baire, vale anche nel caso in cui X sia uno spazio topologico di Hausdorff localmente compatto. La dimostrazione della prima parte è simile alla della prima parte del caso dello spazio metrico completo [Rud91], la seconda è identica. Teorema dell’applicazione aperta (di Banach-Schauder). Siano X e Y due spazi di Banach sullo stesso campo C o R e sia B1 (0) ⊂ X la palla aperta di raggio 1 e centrata in 0. Per ogni T ∈ B(X, Y) suriettivo esiste una palla aperta, Bδ (0) ⊂ Y, centrata nell’origine e di raggio δ > 0, tale che: T (B1 (0)) ⊃ Bδ (1) . (2.16) Nota. Il nome del teorema è dovuto al seguente fatto evidente. (2.16) e la linearità di T implicano che l’immagine secondo T di qualunque palla aperta B (x) = x + B1 (0) centrata in qualunque punto x ∈ X, contiene la palla aperta di Y centrata in T x: Bδ (0) := T x + Bδ (0) (per δ > 0 sufficientemente piccolo). Quindi l’immagine secondo T di un qualsiasi aperto di X, A = ∪x∈A Bx (x) risulta essere un aperto di Y: T (A) = ∪x∈A Bδx (T x). In altre parole, la funzione T è aperta. Prova del Teorema dell’applicazione aperta. Seguiremo essenzialmente la dimostrazione più generale di questo teorema data in [Rud91] per spazi localmente convessi, specializzandola al caso in esame. Definiamo la palla aperta Bn := B2−n 1 (0), di raggio 2−n e centrata nell’origine. Proveremo che esiste un intorno aperto W dell’origine di Y tale che: W ⊂ T (B1 ) ⊂ T (B0 ) . (2.17) Questo risultato implica immediatamente la tesi. Per provare (2.17), notiamo che, come si prova facilmente da B1 ⊃ B2 − B2 , dalla linearità e contuinuità di T : T (B1 ) ⊃ T (B2 ) − T (B2 ) ⊃ T (B2 ) − T (B2 ) . (2.18) La prima inclusione di (2.17) risulta quindi essere vera se T (B2 ) ha interno non vuoto. Per provare che Int(T (B2 )) 6= ∅, notiamo che, nelle nostre ipotesi: Y = T (X) = +∞ [ kT (B2 ) , (2.19) k=1 dal momento che B2 è un intorno aperto di 0. Dato che Y è di seconda categoria, almeno uno dei kT (B2 ) deve essere di seconda categoria (se fossero tutti di prima categoria, Y sarebbe di prima categoria e questo non può accadere per il teorema di Baire). Dato che y 7→ ky è un omeomorfismo da Y a Y, T (B2 ) deve essere di seconda categoria in Y. Concludiamo che la chiusura di T (B2 ) ha interno non vuoto. Questo prova la prima inclusione in (2.17). 40 Per provare la seconda inclusione in (2.17), usiamo una successione di elementi yn ∈ Y costruita induttivamente come segue. Fissiamo y1 ∈ T (B1 ). Assumiamo quindi n ≥ 1 e che yn sia stato scelto in T (Bn ) e vogliamo definire yn+1 . Quello che abbiamo provato per V1 vale nello stesso modo per Vn+1 , in modo tale che T (Bn+1 ) contiene un intorno aperto dell’origine. Allora: (2.20) yn − T (Bn+1 ) ∩ T (Bn ) 6= ∅ . Questo implica che esiste xn ∈ Bn tale che: T (xn ) ∈ yn − T (Bn+1 ) . (2.21) Definiamo allora: yn+1 := yn − T xn . Si noti che yn+1 ∈ T (Bn+1 ), e la costruzione induttiva procede in questo modo ad ogni passo. Dato che ||xn || < 2−n , per n = 1, 2, . . ., la somma x1 + · · · + xn forma una successione di Cauchy che converge a qualche x ∈ X, per la completezza di X, e vale ||x|| < 1. Quindi x ∈ B0 . Dal momento che: m m X n=1 T xn = X (yn − yn+1 ) = y1 − ym+1 , (2.22) n=1 e dato che ym+1 → 0 per m → +∞ (per continuità di T ), concludiamo che y1 = T x ∈ T (B0 ). Dato che y1 era un generico elemento di T (B1 ), questo risultato dimostra la seconda inclusione in (2.17) e conclude la dimostrazione. 2 La conseguenza elementare più importante del teorema dell’applicazione aperta è sicuramente il Teorema di Banach dell’operatore inverso nel caso di spazi di Banach (esiste una versione che usa solo l’ipotesi di spazi vettoriali dotati di metrica e completi). Corollario 1 (Teorema di Banach dell’operatore inverso). Siano X e Y due spazi di Banach sullo stesso campo C o R. Se T ∈ B(X, Y) è iniettivo e suriettivo, allora valgono i seguenti due fatti. (a) T −1 : Y → X è un operatore limitato cioè T −1 ∈ B(Y, X). (b) Esiste c > 0 tale che: ||T x|| ≥ c||x|| , per ogni x ∈ X. (2.23) Prova. (a) Il fatto che T −1 sia lineare è di immediata verifica. Bisogna solo provare che T −1 è continuo. Essendo T aperta, la controimmagine di un aperto di X secondo T −1 è un aperto, quindi T −1 è continua. (b) Dato che T −1 è limitata, esiste K ≥ 0 tale che ||T −1 y|| ≤ K||y|| per ogni y ∈ Y. Notare che K > 0, altrimenti varrebbe T −1 = 0 e di conseguenza T −1 e T non sarebbero biettive. Per ogni x ∈ X definiamo y = T x. Sostituendo in ||T −1 y|| ≤ K||y|| troviamo la (2.23) ponendo c = 1/K. 2 Per concludere passiamo a dimostrare un utilissimo teorema in teoria degli operatori chiamato il teorema del grafico chiuso. 41 Notazione 2.5. Se ∅ 6= K1 , . . . , Kn ⊂ X, con X spazio vettoriale, < K1 , · · · , Kn > denota il sottospazio vettoriale di X generato dagli insiemi Ki cioè il sottospazio di X contenente tutte le combinazioni lineari (finite) di elementi degli insiemi Ki . Se K ⊂ X e ∅ = 6 K1 , . . . , Kn ⊂ X sono sottospazi, K = K1 ⊕ · · · ⊕ Kn significa che K è somma diretta degli spazi Ki . In altre parole vale che K =< K1 , · · · , Kn > e Ki ∩ Kj = {0} per ogni coppia di indici i, j con i 6= j, ovvero equivalentemente, ogni vettore di K può essere decomposto in maniera unica come una somma di vettori degli spazi Ki . Per dimostrare il teorema abbiamo bisogno di alcuni risultati preliminari. Prima di tutto notiamo che se (X, NX ) e (Y, NY ) sono spazi normati sullo stesso campo K = C o R, possiamo considerare lo spazio vettoriale S costituito sul prodotto cartesiano X×Y definendo le operazioni di prodotto per scalare e somma di vettori come: α(x, y) = (αx, αy) e (x, y) + (x0 , y 0 ) = (x + x0 , y + y 0 ). È chiaro che X e Y si identificano naturalmente con due sottospazi di S, che indicheremo ancora con X e Y rispettivamente, e che vale S = X ⊕ Y. S è dotato naturalmente della topologia prodotto indotta da quella dei fattori X e Y. (Ricordiamo che la topologia prodotto su uno spazio vettoriale prodotto X = ×α∈A Xα è la meno forte topologia per cui tutte le proiezioni canoniche Πα : X → Xα sono continue. Nel caso di un numero finito di fattori (come nel caso considerato), tale topologia ammette come base di aperti i prodotti cartesiani di tutte le palle aperte negli spazi Xα .) Le operazioni della struttura di spazio vettoriale di S sono continue rispetto alla topologia prodotto di X e Y. La topologia prodotto di S è normabile: cioè esiste un norma su S la cui topologia metrica associata è proprio la topologia prodotto di S. Tale norma è definita come ||(x, y)|| := max{NX (x), NY (y)} per ogni (x, y) ∈ X ⊕ Y . (2.24) Il fatto che questa norma generi la stessa topologia generata dai prodotti delle palle metriche di X e Y si prova come segue. Consideriamo l’intorno aperto di (x0 , y0 ) dato dal prodotto di due palle aperte Bδ (x0 ) × Bµ (y0 ) rispettivamente in X e Y. La palla aperta di X ⊕ Y centrata ancora in (x0 , y0 ): {(x, y) ∈ X × Y | ||(x, y) − (x0 , y0 )|| < min{δ, µ}} è contenuta in Bδ (x0 ) × Bµ (y0 ). Viceversa, il prodotto Bδ (x0 ) × Bδ (y0 ) che contiene il punto (x0 , y0 ) è incluso nella palla metrica centrata in (x0 , y0 ) {(x, y) ∈ X × Y | ||(x, y) − (x0 , y0 )|| < } , se > δ. Questo conclude la prova perché ne segue che ogni unione di prodotti di palle metriche di X e Y è anche unione di palle metriche di X ⊕ Y ed ogni unione di palle metriche di X ⊕ Y è anche unione di prodotti di palle metriche di X e Y. Quindi le due topologie coincidono. Si prova immediatamente che (X ⊕ Y, || ||) è uno spazio di Banach se sono tali (X, NX ) e (Y, NY ). (Questo fatto implica, in base alla proposizione 2.3 della prossima sezione, che qualunque norma che generi la topologia prodotto rende X⊕Y spazio di Banach.) Sia infatti {(xn , yn )} una successione di Cauchy in X ⊕ Y, allora {xn } e {yn } risultano essere di Cauchy in X e Y rispettivamente 42 dalla stessa definizione di norma su X ⊕ Y data sopra. Siano x ∈ X e y ∈ Y i limiti di queste due successioni che esistono essendo X e Y spazi di Banach. Quindi, se > 0 esistono Nx e Ny interi positivi tali che, se n > max{Nx , Ny } allora ||(x, y) − (xn , yn )|| < , e quindi (xn , yn ) → (x, y) per n → +∞ nella topologia indotta dalla norma di X ⊕ Y. Tale spazio è quindi spazio di Banach. Definizione 2.9. Siano X, Y spazi normati sullo stesso campo C o R. T ∈ L(X, Y) è detto chiuso se il grafico dell’operatore T , cioè il sottospazio G(T ) := {(x, T x) | x ∈ X} ⊂ X ⊕ Y, è chiuso nella topologia prodotto. In altre parole T è chiuso quando per ogni successione {xn } ⊂ X tale che {xn } e {T xn } convergono in X e Y rispettivamente, limn→∞ T (xn ) = T (limn→∞ xn ). Possiamo enunciare e dimostrare il teorema dell’operatore chiuso o grafico chiuso. Corollario 2 (Teorema dell’operatore chiuso o del grafico chiuso). Siano X, Y spazi di Banach sullo stesso campo K = C o R e sia T : X → Y un operatore lineare. T è limitato se e solo se è chiuso. Prova. Se T è limitato allora è banalmente chiuso. Si supponga quindi che T sia chiuso e mostriamo che è limitato. Consideriamo l’applicazione lineare biettiva M : G(T ) 3 (x, T x) 7→ x ∈ X. G(T ) è per ipotesi un sottospazio chiuso nello spazio di Banach X ⊕ Y per cui è a sua volta uno spazio di Banach rispetto alla restrizione della norma || || (2.24). Dalla definizione di tale norma troviamo che vale banalmente ||M (x, T x)||X = ||x||X ≤ ||(x, T x)||G(T ) per cui M è limitato. Per il teorema dell’inverso limitato di Banach M −1 : X → G(T ) ⊂ X ⊕ Y è limitato. Dato che la proiezione canonica di ΠY : X ⊕ Y → Y è continua nella topologia prodotto, concludiamo che l’applicazione lineare ΠY ◦ M −1 : x 7→ T x per ogni x ∈ X è continua ossia limitata. 2 2.4 Proiettori. Introduciamo, usando il teorema del grafico chiuso, la nozione e le proprietà elementari di alcuni operatori continui detti proiettori. La nozione di proiettore giocherà il ruolo centrale nella formulazione della Meccanica Quantistica quando lo spazio normato sarà uno spazio di Hilbert. Definizione 2.10 Sia (X, || ||) spazio normato sul campo C o R. P ∈ B(X) è detto proiettore se è idempotente, cioè se PP = P . (2.25) M := P (X) è detto spazio di proiezione di P e si dice anche che P proietta su M. 43 I proiettori sono naturalmente associati ad una decomposizione diretta dello spazio ambiente X in una coppia di sottospazi chiusi. Proposizione 2.4. Sia P ∈ B(X) un proiettore sullo spazio normato (X, || ||). Vale quanto segue. (a) Se Q : X → X è l’applicazione lineare che soddisfa Q+P =I , (2.26) P Q = QP = 0 , (2.27) Q è proiettore e dove 0 è l’operatore nullo (quello che trasforma nel vettore 0 ogni vettore di X). (b) Gli spazi di proiezione M := P (X) ed N := Q(X) sono sottospazi chiusi di X e vale X=M⊕N. (2.28) Prova. (a) Q è continuo perché somma di operatori continui, QQ = (I − P )(I − P ) = I − 2P + P P = I − 2P + P = I − P = Q. P Q = P (I − P ) = P − P P = P − P = O, (I − P )P = P − P P = P − P = O. (b) Se P (xn ) → y per n → +∞ allora, dalla continuità di P : P P (xn ) → P (y). Per (2.25) questo si scrive P (xn ) → P (y) da cui y = P (y) per l’unicità del limite (essendo X di Hausdorff). In definitiva y ∈ M implica y ∈ M(⊂ M) per cui M = M ed M è dunque un insieme chiuso. Con lo stesso ragionamento si prova che N è chiuso. Il fatto che M ed N siano sottospazi è immediata conseguenza della linearità di P e Q rispettivamente. Sia ora x ∈ X, dalla definizione di Q vale x = P (x) + Q(x) , di conseguenza X =< M, N >. Per concludere basta provare che M ∩ N = {0}. Se x ∈ M, N allora x = P (x) e x = Q(x) per (2.25): per es. se x ∈ M allora x = P z per qualche z ∈ X, ma allora P x = P P z = P z = x. Applicando Q alla identità x = P x e tenendo conto di x = Qx si ha: x = Q(x) = QP (x). Ma QP (x) = 0 per (2.27). Abbiamo ottenuto che x ∈ M ∩ N implica x = 0 che è quanto volevamo provare. 2 Il teorema del grafico chiuso prova che la proposizione 2.4 può essere invertita come segue, assumendo l’ulteriore ipotesi che lo spazio ambiente sia di Banach. Proposizione 2.5. Sia (X, || ||) spazio di Banach e M, N ⊂ X due sottospazi chiusi tali che X = M ⊕ N. Si considerino le applicazioni P : X → M e Q : X → N che associano a x ∈ M i rispettivi elementi di M ed N secondo la decomposizione diretta X = M ⊕ N. Allora vale quanto segue. (a) P e Q sono proiettori che proiettano rispettivamente su M ed N. 44 (b) Valgono le identità (2.26) e (2.27). Prova. Per ipotesi, se x ∈ X allora vale la decomposizione x = uM + uN con uM ∈ M e un ∈ N e tale decomposizione è l’unica possibile rispetto a tale coppia di sottospazi. L’unicità ed il fatto che M ed N sono rispettivamente chiusi per combinazioni lineari implicano che le funzioni P : x 7→ uM e Q : x 7→ uN siano lineari e che valga P P = P e QQ = Q. Si noti anche che P (X) = M e Q(X) = N per costruzione e che (2.26) vale in quanto X =< M, N >, mentre (2.27) vale perchè M ∩ N = {0}. Per concludere la dimostrazione bisogna solo provare che P e Q sono continui. Mostriamo che P è chiuso, il teorema dell’operatore chiuso implica allora che P è continuo. La dimostrazione per Q è analoga. Sia {xn } ⊂ X una successione che converge a x ∈ X e tale che {P xn } converge anch’essa ad un elemento di X. Dobbiamo provare che P x = lim P xn . n→+∞ Dato che N è chiuso: N 3 Qxn = xn − P xn → x − lim P xn = z ∈ N . n→+∞ Abbiamo ottenuto che x = lim P xn + z , n→+∞ con z ∈ N ma anche limn→+∞ P xn ∈ M perchè M è chiuso e P xn ∈ M per ogni n. D’altra parte sappiamo che vale anche x = P x + Qx Per l’unicità della decomposizione di x come somma di vettori in N ed M deve essere P x = lim P xn n→+∞ e z = Qx, quindi l’operatore P è chiuso ed è pertanto continuo. 2 2.5 Norme equivalenti. Un’interessante applicazione del teorema dell’operatore inverso di Banach è un criterio per stabilire quando due norme sullo stesso spazio vettoriale, che risulta essere completo per entrambe, sono associate alla stessa topologia. Introduciamo qualche nozione prima di enunciare il criterio detto nella proposizione 2.6. Concluderemo il capitolo con la dimostrazione del fatto che tutte le norme sugli spazi vettoriali di dimensione finita sono equivalenti e rendono tali spazi spazi di Banach. Definizione 2.11. Due norme N1 e N2 sullo stesso spazio vettoriale X (su C o R) si dicono equivalenti se esistono due costanti c, c0 > 0 tali che: cN2 (x) ≤ N1 (x) ≤ c0 N2 (x) , 45 per ogni x ∈ X. (2.29) Osservazioni. (1) Si osservi che (2.29) è equivalente all’analoga disuguaglianza che si ottiene scambiando N1 con N2 e sostituendo c, c0 con 1/c0 , 1/c rispettivamente. (2) Si prova immediatamente che se uno spazio normato è completo allora è tale ogni altro spazio normato sullo stesso spazio vettoriale dotato di una norma equivalente. (3) Se due norme sullo stesso spazio sono equivalenti allora generano la stessa topologia. La proposizione di sotto prova che vale anche il viceversa. (4) Nello spazio delle norme su un fissato spazio vettoriale, la nozione di norma equivalente definisce una relazione di equivalenza. La prova di ciò è immediata dalle definizioni date. Proposizione 2.6. Sia X uno spazio vettoriale su C o R. Le norme N1 e N2 su X sono equivalenti se e solo se l’applicazione identica I : (X, N2 ) 3 x 7→ x ∈ (X, N1 ) è un omeomorfismo (che equivale a dire che le topologie metriche generate dalle due norme coincidono). Prova. Bisogna solo dimostrare che se I è omeomorfismo allora le norme sono equivalenti. L’altra implicazione è ovvia dalla definizione di norme equivalenti. Se I è un omeomorfismo allora è continuo nell’origine e quindi, in particolare, la palla metrica rispetto alla norma N1 di raggio 1 e centrata in 0 deve contenere completamente una palla aperta rispetto alla norma N2 centrata in 0 di raggio δ > 0 sufficientemente piccolo. Ossia N2 (x) ≤ δ ⇒ N1 (x) < 1. In particolare, per x 6= 0, N2 (δx/N2 (x)) ≤ δ per cui: N1 (δx/N2 (x)) < 1 ossia δN1 (x) ≤ N2 (x). Per x = 0 vale banalmente l’uguaglianza. Abbiamo provato che esiste c0 = 1/δ > 0 per cui N1 (x) ≤ c0 N2 (x) per ogni x ∈ X. L’altra parte della (2.29) si prova analogamente scambiando il ruolo dei due spazi. 2 Proposizione 2.7. Sia X uno spazio vettoriale su C o R. Si supponga che X sia spazio di Banach rispetto ad entrambe le norme N1 , N2 . Se esiste c > 0 tale che, per ogni x ∈ X: cN2 (x) ≤ N1 (x) allora le due norme sono equivalenti. Prova. Si consideri la funzione identità I : x 7→ x. Tale funzione è lineare e continua quando la pensiamo come I : (X, N1 ) → (X, N2 ) perché N2 (x) ≤ (1/c)N1 (x) per ogni x ∈ X. Per il punto (b) nella tesi del teorema di Banach della funzione inversa esisterà c0 > 0 tale che N1 (x) ≤ c0 N2 (x) per ogni x ∈ X. N1 e N2 soddisfano allora la (2.29). 2 Come ultima proposizione diamo il seguente importante risultato, che vale anche per spazi reali scambiando C con R usando la stessa dimostrazione. Proposizione 2.8. Tutte le norme su uno spazio vettoriale X sul campo C di dimensione finita assegnata sono tra di loro equivalenti ed ognuna di esse definisce una struttura di spazio di Banach su X. 46 Prova. È chiaro che possiamo ridurci a studiare il caso dello spazio Cn , visto che ogni spazio vettoriale complesso di dimensione finita n è isomorfo a Cn . Come conseguenza delle osservazioni (2) e (4) di sopra, è sufficiente provare che ogni norma su Cn è equivalente alla norma standard. Si tenga conto del fatto, noto dall’analisi elementare, che Cn con la norma standard è completo. P P Sia N una norma su Cn e sia e1 , · · · , en la base canonica di Cn . Se x = i xi ei e y = i yi ei sono elementi generici di Cn , dalla proprietà di positività (N0), dalla disuguaglianza triangolare (N2) e dalla proprietà di omogeneità (N1) della definizione di norma: 0 ≤ N (x − y) ≤ n X |xi − yi |N (ei ) ≤ Q i=1 dove Q := P i N (ei ). n X |xi − yi | , i=1 D’altra parte vale banalmente, se || · || è la norma standard su Cn Ì |xj − yj | ≤ M ax{|xi − yi | | i = 1, 2, · · · , n} ≤ n X |xi − yi |2 = ||x − y|| , i=1 da cui 0 ≤ N (x − y) ≤ nQ||x − y|| . Questo prova che N è continua rispetto alla topologia della norma standard. Se S := {x ∈ Cn | ||x|| = 1} e N 0 è una seconda norma su Cn , che quindi sarà continua rispetto alla topologia della norma standard, la funzione S 3 x 7→ f (x) := N (x) N 0 (x) sarà continua perché rapporto di funzioni continue con denominatore mai nullo. Dato che S è compatto nella topologia della norma standard, esisteranno il minimo m ed il massimo M di f . In particolare M ≥ m > 0 perché N, N 0 sono strettamente positive su S e i valori m, M sono assunti da f per opportuni vettori xm , xM in S. Per costruzione: mN 0 (x) ≤ N (x) ≤ M N 0 (x) , per ogni x ∈ S . Questa disuguaglianza vale in realtà per ogni vettore x ∈ Cn come ora proviamo. Si può sempre scrivere x = λx0 con x0 ∈ S e λ ≥ 0, quindi moltiplicando per λ ≥ 0 i termini della disuguaglianza di sopra valutata in x0 si ha mλN 0 (x0 ) ≤ λN (x0 ) ≤ M λN 0 (x0 ) . Usando infine la proprietà N1 delle norme per λ = |λ| si ottiene mN 0 (x) ≤ N (x) ≤ M N 0 (x) per ogni x ∈ Cn . Scegliendo N 0 := || · || si conclude che ogni norma su Cn è equivalente a quella standard. 2 47 Capitolo 3 Spazi di Hilbert ed operatori limitati. In questa sezione introdurremo alcune prime nozioni matematiche relative agli spazi di Hilbert che ci serviranno per dare un fondamento matematico alla MQ. Una parte importante del capitolo sarà dedicata alla nozione di base hilbertiana (detta anche sistema ortonormale completo), che tratteremo nel modo più generale possibile non assumendo la separabilità dello spazio di Hilbert. Prima di tale nozione enunceremo e proveremo il teorema più importante della teoria degli spazio di Hilbert: il teorema della rappresentazione di Riesz, che prova che esiste un anti isomorfismo naturale tra uno spazio di Hilbert ed il suo duale topologico. Tale discussione consentirà di accennare brevemente alla nozione di spazio riflessimo. La terza parte del capitolo, sarà dedicata ad introdurre e studiare la nozione di operatore aggiunto (nel caso di operatori limitati), introdotto tramite ol teorema di Riesz, e tutte le sue fondamentali conseguenze nella teoria degli operatori limitati. Introdurremo in particolare la nozione di C ∗ algebra (di operatori ed in senso astratto, e nelle esemplificazioni presenteremo la struttura di algebra di von Neumann citando il celebre teorema del doppio commutante). In tale sezione introdurremo le classi degli operatori autoaggiunti, unitari e normali, discutendone le loro proprietà elementari. La quarta sezione sarà interamente dedicata alla nozione di proiettore ortogonale e delle proprietà più importanti di tali tipi di operatori. La struttura di reticolo ortocoplementato sarà analizzata successivamante. La penultima sezione sarà dedicata all’importante teorema di decomposizione polare per operatori limitati definiti su tutto lo spazio di Hilbert. Come strumento tecnico, sarà introdotta la nozione di radice quadrata positiva di un operatore limitato. I teoremi presentati sono dimostrati indipendentemente dal teorema spettrale che sarà provato successivamente. L’ultima sezione riguarda la teoria elementare della trasformata di Fourier e di Fourier-Plancherel, che introdurremo in modo molto rapido e conciso, senza fare riferimento alla teoria delle distribuzioni di Schwartz. Negli esempi finali sarà menzionato il teorema di Paley-Wiener, che sarà poi usato per costruire basi Hilbertiane nelgli spazi L2 . 48 3.1 Nozioni elementari, teorema di Riesz e riflessività. Definizione 3.1. Se X è uno spazio vettoriale sul campo complesso, un’applicazione S : X×X → C si dice prodotto scalare (hermitiano) e (X, S) spazio con prodotto scalare quando S soddisfa: H0. S(u, u) ≥ 0 per ogni u ∈ X; H1. S(u, αv + βw) = αS(u, v) + βS(u, w) per ogni α, β ∈ C e u, v, w ∈ X; H2. S(u, v) = S(v, u) per ogni u, v ∈ X; H3. S(u, u) = 0 ⇒ u = 0, per ogni u ∈ X. Se valgono H0, H1, H2 ma non necessariamente H3, S si dice semi-prodotto scalare. Nello spazio vettoriale X con (semi-)prodotto scalare hermitiano S, vettori u, v ∈ X si dicono ortogonali se: S(u, v) = 0 . In tal caso si dice anche che u è ortogonale, o equivalentemente normale, a v e v è ortogonale, o equivalentemente, normale a u. Se ∅ = 6 K ⊂ X, lo spazio ortogonale aK, K ⊥ , è l’insieme dei vettori di X ortogonali a ciascun elemento di K. Note. (1) H1 e H2 implicano insieme che S è antilineare nel primo argomento: S(αv + βw, u) = αS(v, u) + βS(w, u) per ogni α, β ∈ C e u, v, w ∈ X. (2) Dalla H2 segue che u è ortogonale a v se e solo se v è ortogonale a u, per cui la definizione di ortogonalità è ben posta. (3) Si verifica immediatamente che K ⊥ è un sottospazio vettoriale di X per la proprietà H1, per cui il termine spazio ortogonale è appropriato. Proposizione 3.1. Sia X uno spazio vettoriale su C dotato di un semi prodotto scalare S. (a) Vale la disuguaglianza di Cauchy-Schwartz: per ogni coppia x, y ∈ X |S(x, y)|2 ≤ S(x, x)S(y, y) ; (3.1) in (3.1) vale il segno di uguaglianza se x e y sono linearmente dipendenti e solo in tal caso se S è prodotto scalare. (b) Al variare di x ∈ X, È p(x) := S(x, x) (3.2) definisce una seminorma, ovvero una norma se S è un prodotto scalare, che si dice essere indotta da S. (c) p soddisfa l’identità del parallelogramma: p(x + y)2 + p(x − y)2 = 2(p(x)2 + p(y)2 ) , 49 (3.3) per ogni x, y ∈ X. Prova. (a) Se α ∈ C vale, usando le proprietà del semi-prodotto scalare, 0 ≤ S(x − αy, x − αy) = S(x, x) − αS(x, y) − αS(y, x) + |α|2 S(y, y) . (3.4) Supponiamo S(y, y) 6= 0. In tal caso ponendo α := S(x, y)/S(y, y) si ottiene da (3.4) 0 ≤ S(x, x) − |S(x, y)|2 /S(y, y) , che è la tesi. Se S(y, y) = 0 troviamo invece da (3.4) che deve comunque valere per ogni α ∈ C: 0 ≤ S(x, x) − αS(x, y) − αS(y, x) . (3.5) Scegliendo α ∈ R sufficientemente grande in valore assoluto, si vede che la disuguaglianza (3.5) è impossibile a meno che S(x, y) + S(y, x) = 0. Scegliendo poi α = iλ con λ ∈ R sufficientemente grande in valore assoluto, si vede che la disuguaglianza (3.4) può valere solo se oltre all’identità S(x, y) = −S(y, x) provata sopra, vale anche S(x, y) − S(y, x) = 0 e quindi S(x, y) = 0. In definitiva, se S(y, y) = 0 vale ancora (3.5) perchè S(x, y) = 0. Se x e y sono linearmente dipendenti allora vale x = αy oppure y = αx per qualche α ∈ C. Si verifica immediatamente che in tal caso i due membri di (3.1) sono uguali. Supponiamo ora che S sia un prodotto scalare e che valga |S(x, y)|2 = S(x, x)S(y, y). Se almeno uno dei due vettori x, y è nullo (ed in tal caso l’uguaglianza vale) allora è banalmente vero che x e y sono linearmente dipendenti. Mettiamoci nel caso in cui È entrambi i vettori È siano non nulli e valga l’uguaglianza detta. In tal caso, ridefinendo u = x/ S(x, x) e v = y/ S(y, y), vale |S(u, v)| = 1 e quindi S(u, v) = eiη per qualche η ∈ R. Per H3 l’equazione in α e β, αu + βv = 0 equivale a S(αu + βv, αu + βv) = 0. Sviluppandola si ottiene che essa equivale a |α|2 + |β|2 + αβeiη + βαe−iη = 0 . Scegliendo α = eiµ e β = eiν in modo che −µ + ν + η = π, l’equazione di sopra risulta essere soddisfatta. Abbiamo trovato che, per opportuni µ, ν ∈ R vale È È eiµ S(y, y)x + eiν S(x, x)y = 0 ossia che x e y sono linearmente dipendenti. (b) Tutte le proprietà delle seminorme si verificano immediatamente dalla definizione di p e dalle proprietà del prodotto scalare, eccetto la disuguaglianza triangolare N2 che proviamo ora. Dalle proprietà del prodotto scalare risulta subito che p(x + y)2 = p(x)2 + 2ReS(x, y) + p(y)2 , dove Rez := (z + z)/2 indica la parte reale del numero complesso z. 2ReS(x, y) ≤ 2|S(x, y)| e quindi per (3.1), 2ReS(x, y) ≤ 2p(x)p(y), da cui si ottiene: p(x + y)2 ≤ p(x)2 + 2p(x)p(x) + p(y)2 , 50 ossia p(x, y)2 ≤ (p(x) + p(y))2 , che implica N2. La proprietà N3 segue immediatamente da H3, nel caso S sia un prodotto scalare. (c) Si verifica immediatamente usando la definizione di p e le proprietà del prodotto scalare. 2 Nota. La disuguaglianza di Cauchy-Schwartz ha come immediata conseguenza il fatto che un prodotto scalare S : X × X → C è una funzione continua sullo spazio X × X dotato della topologia prodotto, quando su X si usi la topologia metrica indotta dal prodotto scalare tramite la norma (3.2). In particolare il prodotto scalare è anche continuo nei suoi singoli argomenti separatamente. Definizione 3.2. Se (X, SX ) e (Y, SY ) sono spazi con prodotto scalare (hermitiano), un’applicazione lineare L : X → Y è detta isometria se soddisfa SY (L(x), L(y)) = SX (x, y) per ogni x, y ∈ X. Se l’isometria L : X → Y è anche surgettiva è detta isomorfismo di spazi con prodotto scalare. Se esiste un isomorfismo (L) di spazi con prodotto scalare dallo spazio X allo spazio Y, tali spazi si dicono isomorfi (secondo L). È chiaro che ogni isometria L : X → Y è iniettiva per H3, ma può non essere surgettiva (anche se X = Y se la dimensione dello spazio X non è finita). Inoltre ogni isometria è ovviamente continua rispetto alle due topologie metriche dei due spazi indotte dalle norme indotte dai prodotti scalari e, se è surgettiva (cioè se è un isomorfismo), la sua inversa è ancora un’isometria (e quindi un isomorfismo). Esercizi 3.1. (1) Mostrare che se, su uno spazio vettoriale sul campo C, una seminorma (norma) p soddisfa l’identità del parallelogramma, allora esiste, ed è unico, un semi prodotto scalare (rispettivamente un prodotto scalare) S che induce p tramite (3.2). Suggerimento. Se S è un semi-prodotto scalare vale 4S(x, y) = S(x + y, x + y) − S(x − y, x − y) − iS(x + iy, x + iy) + iS(x − iy, x − iy). (2) Si può dare la definizione di (semi-)prodotto scalare anche per spazi vettoriali sul campo reale, semplicemente cambiando H2 in S(u, v) = S(v, u) ed usando ovviamente combinazioni lineari a coefficienti in R in H1. Mostrare che vale ancora la proposizione 3.1 (3) Si consideri uno spazio vettoriale con campo reale. Provare che se una seminorma (norma) p su tale spazio soddisfa l’identità del parallelogramma allora esiste, ed è unico, un semi-prodotto scalare (rispettivamente un prodotto scalare) S che induce p tramite (3.2). Suggerimento. Se S è un semiprodotto scalare vale 4S(x, y) = S(x + y, x + y) − S(x − y, x − y). 51 (4) Dimostrare quanto asserito nella nota sotto la proposizione 3.1 per uno spazio con prodotto scalare (X, S). Suggerimento. Se X × X 3 (xn , yn ) → (x, y) ∈ X × X per n → +∞, usando la disuguaglianza di C.-S. provare che se S è il prodotto scalare e p la norma associata, allora vale |S(x, y) − S(xn , yn )| ≤ p(xn )p(yn − y) + p(xn − x)p(y) , e tenere conto che p(xn ) → p(x) e che la proiezione canonica è continua nella topologia prodotto. (5) Siano (X, S) e (X1 , S1 ) spazi con prodotto scalare hermitiano. Sia L : X → X1 lineare e tale che S1 (L(x), L(x)) = S(x, x) per ogni x ∈ X. Provare che L è un’isometria (di spazi con prodotto scalare). Si può generalizzare il risultato al caso di spazi sul campo reale? Suggerimento. Usare i suggerimenti agli esercizi (1) e (3). Notazione 3.1. Nel seguito, se non sarà specificato altrimenti, ( |) denoterà un prodotto scalare e || || la norma indotta da esso come in proposizione 3.1. Definizione 3.3. Uno spazio con prodotto scalare (hermitiano) si dice spazio di Hilbert se è spazio di Banach rispetto alla norma indotta dal prodotto scalare. Un isomorfismo di spazi con prodotto scalare tra due spazi di Hilbert è detto isomorfismo tra spazi di Hilbert o, equivalentemente, trasformazione unitaria o, equivalentemente, operatore unitario. Deve essere chiaro che se U : H → H2 è un isomorfismo di spazi con prodotto scalare (hermitiano), H1 è spazio di Hilbert se e solo se è tale H. In tal caso U è una trasformazione unitaria. Vale un teorema del completamento analogo a quello valido per spazi di Banach. Teorema del completamento per spazi di Hilbert. Sia X uno spazio vettoriale sul campo C dotato di un prodotto scalare S. (a) Esiste uno spazio di Hilbert (H, ( | )), detto completamento di X, tale che X si identifica con un sottospazio denso (rispetto alla topologia metrica di H indotta dal prodotto scalare ( | )) di H tramite un’applicazione lineare iniettiva J : X → H che estende il prodotto scalare S in ( | ). In altre parole, esiste un’applicazione lineare iniettiva J : X → H con J(X) = H e (J(x)|J(y)) = S(x, y) per ogni x, y ∈ X. (b) Se la terna (J1 , H1 , ( | )1 ) con J1 : X → H1 lineare isometrica e (H1 , ( | )1 ) spazio di Hilbert è tale che X si identifica con un sottospazio denso di H1 tramite J1 estendendo il prodotto scalare S in ( | )1 , allora esiste ed è unico una trasformazione unitaria φ : H → H1 tale che J1 = φ◦J. Schema della dimostrazione. (a) Conviene usare il teorema del completamento per gli spazi di È Banach e costruire il completamento di Banach dello spazio normato (X, N ) dove N (x) := S(x, x). Dato che S è continuo e X è denso nel completamento secondo la funzione lineare J, S induce un semiprodotto scalare ( | ) sul completamento di Banach H. ( | ) è un prodotto scalare 52 su H in quanto, sempre per continuità risulta indurre la stessa norma dello spazio di Banach. Di conseguenza H è spazio di Hilbert e la funzione lineare J che identifica X con un sottospazio denso di H soddisfa le proprietà prescritte nella tesi. (b) La dimostrazione è essenzialmente uguale a quella data nel caso di spazi di Banach. 2 Esempi 3.1. P (1) Cn dotato del prodotto scalare (u|v) := ni=1 ui vi , dove u = (u1 , . . . , un ) e v = (v1 , . . . , vn ), è uno spazio di Hilbert. (2) Un esempio di spazio di Hilbert estremamente importante in fisica si ricava dall’esempio (6) in esempi 2.1: lo spazio L2 (X, µ), dove X è uno spazio con misura positiva µ su una σ-algebra Σ. Sappiamo che L2 (X, µ) è uno spazio di Banach rispetto alla norma ||f ||2 := Z f (x)f (x)dµ(x) X essendo f un qualsiasi rappresentante della classe di equivalenza di funzioni uguali quasi ovunque rispetto a µ, f ∈ L2 (X, µ). Usando essenzialmente la stessa dimostrazione per provare la disuguaglianza di Cauchy-Schwartz e tenendo conto della finitezza delle norme degli elementi dello spazio di Banach L2 (X, µ), è facile provare che (f |g) := Z f (x)g(x)dµ(x) (3.6) X è finito se f, g ∈ L2 (X, µ) e definisce un prodotto scalare hermitiano su tale spazio di Banach. È ovvio che tale prodotto scalare induce la norma || ||2 per cui L2 (X, µ) è uno spazio di Hilbert rispetto al prodotto scalare (3.6). Passiamo ora a provare che gli spazi di Hilbert sono riflessivi. Per fare ciò dobbiamo introdurre alcuni utili strumenti legati al concetto di spazio ortogonale di centrale importanza nello sviluppo del formalismo della MQ. Notazione 3.2. Se K ⊂ X, con X spazio topologico, X indica la chiusura di X, cioè il più piccolo chiuso (nel senso dell’intersezione) che include K. Ciò è equivalente a dire che X è l’unione di K e di tutti i suoi punti di accumulazione. Ricordiamo che se ∅ 6= K ⊂ X, con X spazio vettoriale, K è detto convesso se αu + βv ∈ K quando α, β ≥ 0, α + β = 1 e u, v ∈ K. Chiaramente ogni sottospazio di X è convesso, ma non tutti i sottoinsiemi convessi di X sono sottospazi di X. Per esempio una palla aperta di raggio finito rispetto alla norma su uno spazio vettoriale è un insieme convesso che non è sottospazio. Ricordiamo che se K ⊂ X, allora < K > denota il sottospazio di X generato da K. Teorema 3.1. Sia (H, ( | )) spazio di Hilbert e K ⊂ H un sottoinsieme non vuoto. (a) K ⊥ è un sottospazio chiuso di H. ⊥ (b) K ⊥ =< K >⊥ = < K >⊥ = < K > . 53 (c) Se K è chiuso e convesso, allora per ogni x ∈ H esiste ed è unico PK (x) ∈ K tale che ||x − PK (x)|| = min{||x − y|| | y ∈ K}, dove || || denota la norma indotta da ( | ). (d) Se K è un sottospazio chiuso, allora ogni x ∈ H si decompone in modo unico come zx + yx con zx ∈ K e yx ∈ K ⊥ e quindi vale: H = K ⊕ K⊥ . (3.7) Infine risulta zx := PK (x) definito in (c). (e) (K ⊥ )⊥ = < K >. Nota. In realtà (a) e (b) valgono anche se lo spazio non è di Hilbert ma solo spazio vettoriale con prodotto scalare e la topologia è quella indotta dal prodotto scalare. Prova del teorema 3.1. (a) K ⊥ è sottospazio per le proprietà di (anti-)linearità del prodotto scalare. Dalla continuità del prodotto scalare segue subito che se {xn } ⊂ K ⊥ converge a x ∈ H allora (x|y) = 0 per ogni y ∈ K, per cui x ∈ K ⊥ . Quindi K ⊥ è chiuso contenendo tutti i suoi punti di accumulazione. (b) La dimostrazione della prima identità è ovvia dalla definizione di ortogonale e dalla linearità (antilinerarità) del prodotto scalare. La seconda identità segue quindi immediatamente da (a). Riguardo all’ultima identità notiamo che sicuramente, essendo < K >⊂ < K > vale ⊥ ⊥ < K >⊥ ⊃ < K > . D’altra parte < K >⊥ ⊂ < K > per la continuità del prodotto scalare. ⊥ Di conseguenza < K >⊥ = < K > , che conclude la catena di uguaglianze avendo già provato che < K >⊥ = < K >⊥ . (c) Sia 0 ≤ d = inf y∈K ||x − y||, che esiste perché l’insieme dei numeri ||x − y|| con y ∈ K è limitato inferiormente e non vuoto. Sia {yn } ⊂ K una successione di punti per cui ||x−yn || → d. Mostriamo che si tratta di una successione di Cauchy. Dall’identità del parallelogramma (3.3), con x e y in tale formula sostituiti con x − yn e x − ym rispettivamente, segue che ||yn − ym ||2 = 2||x − yn ||2 + 2||x − ym ||2 − ||2x − yn − yn ||2 . Osserviamo ora che ||2x − yn − yn ||2 = 4||x − (yn + ym )/2||2 ≥ 4d2 , dato che yn /2 + ym /2 ∈ K nell’ipotesi di convessità di K e che d è l’estremo inferiore dei numeri ||x − y|| se y ∈ K. Fissato > 0, prendendo n e m grandi a sufficienza avremo: ||x − yn ||2 ≤ d2 + , ||x − ym ||2 ≤ d2 + , da cui ||yn − ym ||2 ≤ 4(d2 + ) − 4d2 = 4 . Quindi la successione è di Cauchy. Essendo H completo, yn converge a qualche y ∈ K dato che K è chiuso. Per la continuità della norma d = ||x − y||. Mostriamo che y ∈ K è l’unico punto che soddisfa d = ||x − y||. Ogni altro y 0 ∈ K con la stessa proprietà soddisfa, dall’identità del parallelogramma: ||y − y 0 ||2 = 2||x − y||2 + 2||x − y 0 ||2 − ||2x − y − y 0 ||2 ≤ 2d2 + 2d2 − 4d2 = 0 , dove abbiamo ancora usato ||2x − y − y||2 = 4||x − (y + y)/2||2 ≥ 4d2 (dato che y/2 + y 0 /2 ∈ K nell’ipotesi di convessità di K e che d è l’estremo inferiore dei numeri ||x−z|| se z ∈ K). Valendo 54 ||y − y 0 || = 0 deve essere y = y 0 . Quindi PK (x) := y soddisfa tutte le richieste. (d) Sia x ∈ H e x1 ∈ K a distanza minima da x. Poniamo x2 := x − x1 e mostriamo che x2 ∈ K ⊥ . Sia y ∈ K, la funzione R 3 t 7→ f (t) := ||x − x1 + ty||2 ha un minimo per t = 0. Si noti che tale fatto vale nell’ipotesi che K sia sottospazio, per cui −x1 + ty ∈ K per ogni t ∈ R se x1 , y ∈ K. Quindi la sua derivata si annulla in t = 0: ||x2 + ty||2 − ||x2 ||2 = (x2 |y) + (y|x2 ) = 2Re(x2 |y) . t→0 t f 0 (0) = lim Di conseguenza Re(x2 |y) = 0. Sostituendo y con iy si ricava che anche la parte immaginaria di (x2 |y) vale zero, per cui (x2 |y) = 0 e x2 ∈ K ⊥ . Con questo abbiamo provato che < K, K ⊥ >= H. Non resta che mostrare che K ∩ K ⊥ = {0}. Ma questo è ovvio dal fatto che se x ∈ K ∩ K ⊥ allora x deve essere ortogonale a x allora ||x||2 = (x|x) = 0 e quindi x = 0. (e) Se y ∈ K, allora y è ortogonale ad ogni elemento di K ⊥ ; per linearità e continuità del prodotto scalare questo vale anche se y ∈ < K >. In altre parole < K > ⊂ (K ⊥ )⊥ . (3.8) Usando (d) e sostituendo al posto di K il sottospazio chiuso < K > otteniamo che H = < K >⊕ ⊥ < K > . Ossia, tenendo conto di (b) H = < K > ⊕ K⊥ . (3.9) Se u ∈ (K ⊥ )⊥ , in base alla (3.9) c’è una decomposizione fatta di vettori ortogonali ((u0 |v) = 0) u = u0 + v con u0 ∈ < K > e v ∈ K ⊥ e quindi (u|v) = (v|v). Valendo (u|v) = 0 (perché u ∈ (K ⊥ )⊥ e v ∈ K ⊥ ) deve essere (v|v) = 0 e dunque (K ⊥ )⊥ 3 u = u0 ∈ < K >. Concludiamo che < K > ⊃ (K ⊥ )⊥ da cui la tesi valendo (3.8). 2 Il teorema provato ha il seguente corollario che segue immediatamente da (b) e (d). Corollario. Se S è un sottoinsieme di uno spazio di Hilbert H, < S > è denso in H se e solo se S ⊥ = {0}. Possiamo ora enunciare e provare il teorema dovuto a F. Riesz, che è sicuramente il teorema più importante della teoria degli spazi di Hilbert. Teorema 3.2 (Riesz). Sia (H, ( | )) spazio di Hilbert. Ogni funzionale lineare continuo su H, f , è univocamente rappresentabile come f (x) = (yf |x) , per ogni x ∈ H , dove yf ∈ H. Al variare di f ∈ H0 , yf assume ogni valore in H. 55 Prova. È chiaro che ogni applicazione H 3 x 7→ (y|x) definisce un elemento di H0 per la continuità del prodotto scalare. D’altra parte si ottengono due diverse applicazioni usando due y differenti: (y|x) = (y 0 |x) per ogni x ∈ K implica ||y − y 0 ||2 = (y − y 0 |y − y 0 ) = 0 da cui y = y 0 . Quindi l’applicazione H0 3 f → yf ∈ H se esiste è iniettiva. Per concludere il teorema è quindi sufficiente provare che per ogni f ∈ H0 esiste yf ∈ H tale che f (x) = (yf |x) per ogni x ∈ H. Il nucleo di f , Kerf := {x ∈ H | f (x) = 0}, è un sottospazio chiuso dato che f è continuo. Se Kerf = H allora yf = 0, altrimenti H = Kerf ⊕ (Kerf )⊥ per il teorema 3.1. Proviamo che (Kerf )⊥ ha dimensione 1. Sia 0 6= y ∈ (Kerf )⊥ . In tal caso f (y) 6= 0 (z) (y 6∈ Kerf !). Per ogni z ∈ (Kerf )⊥ , il vettore z − ff (y) y cade in (Kerf )⊥ perché combinazione lineare di elementi di (Kerf )⊥ , ma anche z − Quindi z − f (z) f (y) y ∈ Kerf ∩ (Kerf )⊥ e dunque f (z) f (y) y ∈ Kerf (z) z − ff (y) y = 0. come si verifica immediatamente. Quindi y è una base per (Kerf )⊥ dato che ogni altro vettore z ∈ (Kerf )⊥ è una combinazione lineare di y: z = yf := f (z) f (y) y. Definiamo f (y) y. (y|y) Mostriamo che yf rappresenta f nel senso voluto. Se x ∈ H, possiamo decomporre x rispetto alla decomposizione Kerf ⊕ (Kerf )⊥ ottenendo: x = n + x⊥ , dove f (x⊥ ) f (x) x⊥ = y= y f (y) f (y) per quanto provato sopra ed avendo tenuto conto del fatto che f (x⊥ ) = f (x) per linearità essendo f (n) = 0. Il calcolo diretto di (yf |x) fornisce immediatamente: (yf |x) = f (x) concludendo la dimostrazione. 2. Corollario. Ogni spazio di Hilbert è riflessivo. Prova. Prima di tutto notiamo che possiamo mettere su H0 un prodotto scalare definito come (f |g)0 := (yg |yf ), dove f (x) = (yf |x) e g(x) = (yg |x) per ogni x ∈ H. Si osservi che la norma indotta da ( | )0 in H0 coincide con la norma naturale di H0 , ||f || := sup |f (x)| , ||x||=1 rispetto alla quale H0 è completo per il teorema 2.3. Infatti questa definizione si può scrivere, per il teorema 3.2: ||f || = sup |(yf |x)| ; ||x||=1 la disuguaglianza di Cauchy-Schwartz implica subito che ||f || ≤ ||yf ||, inoltre vale |(yf |x)| = ||yf || se x = yf /||yf ||. Quindi ||f || = ||yf ||, ma quest’ultima è proprio, come volevamo, la norma di f indotta dal prodotto scalare ( | )0 . 56 Quindi (H0 , (|)0 ) è uno spazio di Hilbert e (H0 )0 il suo duale. Il teorema 3.2 assicura che gli elementi di (H0 )0 , F , sono tutti e soli quelli per cui esiste qualche gF ∈ H0 tale che F (f ) = (gF |f )0 per ogni f ∈ H0 . Ma (gF |f )0 = (yf |ygF ) = f (ygF ). Abbiamo cioè che per ogni F ∈ (H0 )0 esiste (ed è unico per il corollario 3 del teorema di Hahn-Banach) un vettore ygF ∈ H tale che, per ogni f ∈ H0 : F (f ) = f (ygF ) . Questa proprietà altro non è che la riflessività di H. 2 Nota. Dalla dimostrazione del corollario, risulta che lo spazio duale topologico H0 dotato del prodotto scalare ( | )0 , definito come (f |g)0 := (yg |yf ), è uno spazio di Hilbert. L’applicazione H0 3 f 7→ yf ∈ H risulta essere anti-lineare, iniettiva e suriettiva e preserva il prodotto scalare per costruzione. In questo senso H e H0 sono anti isomorfi. 3.2 Basi hilbertiane. Passiamo ora ad introdurre tutto l’armamentario matematico relativo al concetto di base hilbertiana. Abbiamo bisogno di qualche risultato preliminare. Chiameremo insieme indiciato, e lo indicheremo con {αi }i∈I , ogni applicazione I 3 i 7→ αi . L’insieme I è detto insieme degli indici; la coppia (i, αi ), è detto elemento i-esimo dell’insieme indiciato. Si osservi che può accadere che αi = αj con i 6= j. Definizione 3.4. Se A = {αi }i∈I è un insieme non vuoto di numeri reali non negativi indiciati sull’insieme I di cardinalità arbitraria, la somma dell’insieme indiciato A è il numero in [0, +∞) ∪ {+∞} definito come: X αj F ⊂ I , F finito . αi := sup i∈I j∈F X (3.10) Nota. D’ora in poi un insieme si dirà numerabile quando può essere messo in corrispondenza biunivoca con l’insieme dei numeri naturali N. Quindi il caso numerabile non include il caso finito. Proposizione 3.2. In riferimento alla definizione 3.4 vale quanto segue. (a) Se I è finito o numerabile, la somma dell’insieme indiciato A coincide con la somma, ovvero rispettivamente con la somma della serie {αin }n∈N (che converge sempre, al più a +∞, essendo serie di termini non negativi) indipendentemente dall’ordinamento, cioè dalla funzione biettiva N 3 n 7→ in ∈ I. (b) Se la somma dell’insieme A è finita, allora il sottoinsieme di I per cui αi 6= 0 è finito o numerabile. In tal caso, restringendosi al sottoinsieme detto, la somma di A coincide con la somma su un insieme finito di indici o, rispettivamente, la somma di una serie come precisato 57 in (a). (c) Se µ è la misura che conta i punti di I definita sulla σ-algebra dell’insieme della parti di I (se J ⊂ I allora µ(J) ≤ +∞ è il numero di elementi di J per definizione), allora X Z αi = i∈I αi dµ(i) . (3.11) A Prova. (a) Il caso di I finito è ovvio; consideriamo il caso di I infinito numerabile e supponiamo di avere scelto un particolare ordinamento di I, per cui possiamo riscrivere A come A = {αin }n∈N . P Mostriamo che la somma della serie di elementi {αin }n∈N , ∞ n=0 αin , coincide con la somma nel senso (3.10) che, per definizione, non dipende dall’ordinamento scelto. Vale, per (3.10): N X αin ≤ n=0 X αi . i∈I E quindi, prendendo il limite per N → +∞, che esiste e coincide con l’estremo superiore dell’insieme delle ridotte della serie, essendo non decrescente la successione delle ridotte: +∞ X αin ≤ n=0 X αi . (3.12) i∈I D’altra parte, se F ⊂ I è finito, possiamo sempre fissare NF sufficientemente grande in modo tale che {αi }i∈F ⊂ {αi0 , αi1 , αi2 , . . . , αiNF }. In tal modo X αi ≤ NF X α in , n=0 i∈F Prendendo l’estremo superiore di entrambi i membri della disuguaglianza precedente al variare degli insiemi F ⊂ I finiti, e ricordando che l’estremo superiore dell’insieme delle ridotte coincide con la somma della serie abbiamo: X i∈I αi ≤ +∞ X αin . (3.13) n=0 Le (3.12) e (3.13) implicano la tesi. (b) sia S < +∞, S ≥ 0, la somma dell’insieme indiciato A. Se S = 0, tutti gli elementi di A devono essere nulli e la tesi è verificata banalmente. Si supponga che S > 0. È chiaro che ogni αi è contenuto in [0, S] – altrimenti la somma sarebbe maggiore di S – e in particolare, se αi 6= 0, allora αi ∈ (0, S]. Poniamo Sn := S/n per n = 1, 2, . . .. Se Nk è il numero di elementi i ∈ I per P P cui αi cade nell’intervallo (Sk , Sk+1 ], sicuramente i∈I αi ≥ Sk Nk , ovvero i∈I αi = +∞ se Nk è infinito. Quindi Nk deve essere finito per ogni k. Dato che l’unione degli intervalli disgiunti (Sk , Sk+1 ] è (0, S], ogni αi 6= 0 cade esattamente in uno solo di tali intervalli, che contiene un numero finito di αi 6= 0 come provato sopra. La cardinalità dell’insieme degli i per cui αi 6= 0 è quindi al più numerabile perché tale insieme è unione finita o numerabile di insiemi finiti. 58 (c) Notando che ogni funzione è misurabile rispetto alla misura detta (dato che la σ-algebra è l’insieme delle parti) l’identità (3.11) è immediata conseguenza della definizione di integrale di una funzione positiva [Rud82]. 2 Passiamo a definire in vari passi il concetto di sistema ortonormale completo ovvero base hilbertiana. Definizione 3.5. Sia (H, ( | )) spazio con prodotto scalare hermitano e ∅ = 6 N ⊂ H. (a) N è detto insieme ortogonale se N 63 0 e se x, y ∈ N sono ortogonali quando x 6= y. (b) N è detto insieme ortonormale se è ortogonale ed ogni suo elemento ha norma (indotta da prodotto scalare) unitaria. (c) Se (H, ( | )) è spazio di Hilbert, N è detto sistema ortonormale completo, o equivalentemente base hilbertiana, se è un insieme ortonormale e soddisfa la proprietà: N ⊥ = {0} . (3.14) Nota. È chiaro che un insieme di vettori ortogonali N è linearmente indipendente: se F ⊂ P P P P P N è finito e 0 = x∈F αx x, allora 0 = ( x∈F αx x| y∈F αy y) = x∈F y∈F αx αy (x|y) = P 2 2 2 x∈F |αx | ||x|| . Dato che ||x|| > 0 e |αx | ≥ 0, deve necessariamente essere |αx | = 0 per ogni x ∈ F . Ossia αx = 0 per ogni x ∈ F . Teorema 3.3 (Disuguaglianza di Bessel). Siano (H, ( | )) spazio con prodotto scalare hermitano e N un insieme ortonormale in H. Per ogni x ∈ H X |(x|z)|2 ≤ ||x||2 . (3.15) z∈N In particolare solo una quantità numerabile di elementi (x|z) sono non nulli. Prova. È sufficiente provare (3.15) per i sottoinsiemi F ⊂ N finiti. Se (3.15) vale in tali casi, la prova nel caso generale, inclusa la proposizione enunciata sotto (3.15), è immediata conseguenza della definizione 3.4 e di (b) della proposizione 3.2. Dimostriamo dunque la (3.15) per F ⊂ N finito contenente n elementi z1 , . . . , zn . Siano x ∈ H e α1 , . . . , αn ∈ C. Sviluppando la norma P ||x − nk=1 αk zk ||2 in termini del prodotto scalare di H e tenendo conto dell’ortonormalità degli elementi zp e zq e delle proprietà di (anti-)linearità del prodotto scalare, si trova subito che: 2 n n n n X X X X 2 2 x − |α | − α (x|z ) − α z = ||x|| + αk (x|zk ) . k k k k k k=1 k=1 k=1 k=1 Il secondo membro può riscriversi ||x||2 − n X k=1 |(x|zk )|2 + n X |(x|zk )|2 − αk (x|zk ) − αk (x|zk ) + |αk |2 , k=1 59 ossia 2 n n n X X X 2 2 x − α z = ||x|| − |(x|z )| + | (zk |x) − αk |2 . k k k k=1 k=1 k=1 È chiaro che il secondo membro ha un unico minimo assoluto per αk = (zk |x), k = 1, . . . , n. In tal caso si ottiene proprio: 2 n n X X 2 0 ≤ x − (zk |x)zk = ||x|| − |(x|zk )|2 , k=1 k=1 da cui n X |(x|zk )|2 ≤ ||x||2 . k=1 Ciò completa la dimostrazione 2. Lemma 3.1. Sia {xn }n∈N un insieme ortogonale numerabile indicizzato su N nello spazio di Hilbert (H, ( | )). Sia || || la norma indotta da ( | ). Se +∞ X ||xn ||2 < +∞ , (3.16) n=0 allora: (a) esiste, ed è unico, x ∈ H tale che +∞ X xn = x , (3.17) n=0 dove la convergenza della serie è intesa come convergenza della successione delle ridotte nella topologia metrica di || ||; (b) la serie in (3.18) può essere riordinata, ossia, per ogni f : N → N biettiva, +∞ X xf (n) = x . (3.18) n=0 Prova. P (a) Sia An := nk=0 xk ; dalle proprietà di ortonormalità dei vettori xk e dalla definizione della norma in termini di prodotto scalare segue subito che, se n > m, allora n X ||An − Am ||2 = ||xk ||2 . k=m+1 Dato che la serie a secondo membro converge per ipotesi, ||An − Am ||2 = n X k=m+1 ||xk ||2 ≤ +∞ X k=m+1 60 ||xk ||2 → 0 per m → +∞ e questo implica immediatamente che la successione delle ridotte {An } sia di Cauchy. Dato che H è completo, esisterà x ∈ H limite di tali successioni e quindi, per definizione, limite della serie. Dato che H è spazio normato e quindi metrico, vale la proprietà di Hausdorff che implica l’unicità dei limiti e quindi in particolare quella di x. P P (b) Si fissi f : N → N biettiva. Poniamo come sopra An := nk=0 xn e σn := nk=0 xf (n) . La serie P 2 a termini positivi +∞ k=0 ||xf (k) || converge perché la sue ridotte sono maggiorate dalle ridotte P 2 della serie convergente a termini positivi +∞ k=0 ||xk || . Come conseguenza di (a), esisterà il limite in H delle ridotte σn , ovvero anche la serie riordinata convergerà in H. Mostriamo che la serie riordinata converge sempre a x. Se definiamo rn := max{f (0), f (1), . . . , f (n)}, vale allora X ||Arn − σn ||2 ≤ ||xk ||2 k∈Jn dove Jn si ottiene eliminando dall’insieme {0, 1, 2, . . . , max{f (0), f (1), . . . , f (n)}} i numeri f (0), f (1), . . . , f (n). È chiaro che, per la biettività della funzione, i numeri che rimangono corrisponderanno ad alcuni elementi dell’insieme infinito {f (n + 1), f (n + 2), . . .} . Di conseguenza ||Arn − σn ||2 ≤ X ||xk ||2 ≤ k∈Jn Dato che P+∞ 2 k=0 ||xf (k) || +∞ X ||xf (k) ||2 . (3.19) k=n+1 < +∞, (3.19) implica che: lim (Arn − σn ) = 0 . n→+∞ D’altra parte vale anche rn ≥ n (dato che f è iniettiva, se fosse max{f (0), f (1), . . . , f (n)} < n, gli f (n) dovrebbero essere n + 1 numeri interi non negativi strettamente inferiori a n e questo è impossibile) e quindi limn→+∞ rn = +∞ per cui x = lim An = lim Arn = lim σn . n→+∞ n→+∞ n→+∞ Questo conclude la dimostrazione. 2 Possiamo quindi enunciare e dimostrare il teorema fondamentale delle basi hilbertiane. Tale teorema prova che le basi hilbertiane soddisfano proprietà che sono dirette generalizzazioni di quelle delle basi ortonormali negli spazi vettoriali di dimensione finita dotati di prodotto scalare. La differenza è che ora sono ammesse, usando la topologia di H, anche combinazioni lineari infinite: ogni elemento dello spazio di Hilbert può essere scritto in modo univoco come una combinazione 61 lineare infinita di elementi di una base hilbertiana. Si deve osservare che, indipendentemente dal fatto che negli spazi di Hilbert esistano tali basi hilbertiane, esistono comunque, come conseguenza del lemma di Zorn (o assioma della scelta) anche basi algebriche che non richiedono alcuna nozione topologica. La differenza tra le basi hilbertiane e quelle algebriche è quindi che le seconde riguardano solo combinazioni lineari finite: ogni elemento dello spazio vettoriale (in questo caso di Hilbert) può essere scritto in modo univoco come una combinazione lineare finita degli elementi della base (che comunque sono infiniti). Teorema 3.4. Sia (H, ( | )) spazio di Hilbert e N ⊂ H un insieme ortonormale. I seguenti fatti sono equivalenti. (a) N è una base hilbertiana (ossia N è insieme ortonormale e N ⊥ = {0}). (b) Fissato x ∈ H, una quantità al più numerabile di numeri (z|x) è non nulla per z ∈ N e vale: x= X (z|x)z , (3.20) z∈N dove la convergenza della serie è intesa come convergenza della successione delle ridotte nella topologia indotta dal prodotto scalare. (c) Fissati x, y ∈ H, una quantità al più numerabile di numeri (z|x), (y|z) è non nulla se z ∈ N e vale: X (x|y) = (x|z)(z|y) . (3.21) z∈N (d) Se x ∈ H, vale, nel senso della definizione 3.4: ||x||2 = X |(z|x)|2 . (3.22) z∈N (e) < N > = H, cioè il sottospazio generato da N è denso in H. Se vale una delle proprietà equivalenti dette sopra, in (3.20), (3.21) non conta l’ordine con cui si etichettano i coefficienti (x|z), (z|x) = (x|z) e (z|y) non nulli. Prova. (a) ⇒ (b). Per il teorema 3.3 solo una quantità al più numerabile di coefficienti (z|x) è non P nullo. Indichiamo con (zn |x) tali coefficienti, n ∈ N, e poniamo SN := N n=0 (zn |x)zn . L’insieme {(zn |x)zn }n∈N è per costruzione ortogonale, inoltre essendo ||zn || = 1 la disuguaglianza di Bessel P 2 implica che +∞ Usando (a) del lemma 3.1 segue che la serie (3.20) n=0 ||(zn |x)zn || < +∞. P 0 converge ad un unico x ∈ H con x0 = +∞ n=0 (zn |x)zn . Inoltre la serie può essere riordinata pur convergendo allo stesso x0 per (b) di lemma 3.1. Mostriamo che x0 = x. Dalla linearità e continuità del prodotto scalare si ha che, se z0 ∈ N : (x − x0 |z0 ) = (x|z0 ) − X (x|z)(z|z0 ) = (x|z0 ) − (x|z0 ) = 0 z∈N dove si è tenuto conto del fatto che l’insieme dei coefficienti z costituisce un insieme ortonormale. Dato che z0 ∈ N è arbitrario, x − x0 ∈ N ⊥ e quindi x − x0 = 0 in quanto N ⊥ = {0} per ipotesi. 62 Questo prova che (3.20) vale indipendentemente dall’ordine con cui si etichettano i coefficienti (z|x) 6= 0. (b) ⇒ (c). Se (b) è valida, (c) è una sua ovvia conseguenza dovuta alla continuità e (anti)linearità del prodotto scalare e al fatto che N è ortonormale. (c) ⇒ (d). (d) è un caso particolare di (c) quando y = x. (d) ⇒ (a). Se (d) è vera e se x ∈ H è tale che (x|z) = 0 per ogni z ∈ N , allora ||x|| = 0 ossia x = 0. In altre parole N ⊥ = {0}, cioè vale (a). Abbiamo provato che (a),(b),(c) e (d) sono equivalenti. Per concludere notiamo che (b) implica immediatamente (e), mentre (e) implica (a): se x ∈ N ⊥ allora, per la linearità del prodotto ⊥ scalare, x ∈ < N >⊥ ⊂ < N >⊥ . Ma per (b) del teorema 3.1 < N >⊥ = < N > . Essendo < N > = H per ipotesi, x ∈ H⊥ = {0}. In altre parole, essendo N ⊥ = {0}, vale (a). Il fatto che la serie di numeri complessi in (3.21) può essere riordinata arbitrariamente conservandone la somma si ottiene dal seguente ragionamento. Si consideri l’insieme A := {z | (x|z) 6= 0 oppure (y|z) 6= 0} . Tale insieme è numerabile. La disuguaglianza di Cauchy-Schwartz in l2 (A) produce: X |(x|z)||(z|y)| ≤ ( z∈A X |(x|z)|2 )1/2 ( z∈A P per (d). Quindi la serie z∈N (x|z)(z|y) = perché è assolutamente convergente. 2 X |(y|z)|2 )1/2 < +∞ z∈A P z∈A (x|z)(z|y) può essere riordinata arbitrariamente Il lemma di Zorn implica immediatamente che ogni spazio di Hilbert ammette una base hilbertiana. Teorema 3.5. Ogni spazio di Hilbert ammette una base hilbertiana. Prova. Sia H uno spazio di Hilbert. Consideriamo la classe A i cui elementi sono gli insiemi ortonormali in H. Definiamo in A la relazione d’ordine parziale data dall’inclusione insiemistica. Per costruzione ogni sottoinsieme ordinato E di A è superiormente limitato dall’elemento costituito dall’unione degli elementi di E. Per il lemma di Zorn esiste allora in A un elemento massimale N . Con le definizioni date, la massimalità di N implica che non ci sono in H vettori normali a tutti gli elementi di N , non nulli e non appartenenti a N stesso. In altre parole, N è un sistema ortonormale completo.2 Prima di passare al caso degli spazi di Hilbert separabili, diamo ancora un importante risultato della teoria generale. Teorema 3.6. Sia H uno spazio di Hilbert con base hilbertiana N . Valgono i seguenti fatti. (a) H è isomorfo come spazio di Hilbert a L2 (N, µ) dove µ è la misura positiva che conta i punti 63 di N (vedi (6) e (7) in esempi 2.1 e (2) in esempi 3.1); la trasformazione unitaria che identifica i due spazi è data dall’applicazione H 3 x 7→ {(z|x)}z∈N ∈ L2 (N, µ) . (3.23) (b) Tutte le basi hilbertiane di H hanno la stessa cardinalità (pari a quella di N ), che si dice dimensione dello spazio di Hilbert. (c) Se H1 è spazio di Hilbert con la stessa dimensione di H, allora i due spazi sono isomorfi come spazi di Hilbert. Prova. (a) L’applicazione U : H 3 x 7→ {(z|x)}z∈N ∈ L2 (N, µ) è ben definita, in quanto, se x ∈ H e N è una base hilbertiana, allora vale la proprietà (d) del teorema 3.4, la quale afferma proprio che {(z|x)}z∈N ∈ L2 (N, µ). Tale applicazione è sicuramente iniettiva: se x, x0 ∈ H producono gli stessi coefficienti (z|x) = (z|x0 ) per ogni z ∈ N , allora x = x0 per (b) del teorema 3.4. P L’applicazione è anche suriettiva: se {αz }z∈N ∈ L2 (N, µ) e quindi z∈N |αz |2 < +∞, allora P per il lemma 3.1 esiste x := z∈N αz z e (z|x) = αz per la continuità del prodotto scalare e l’ortonormalità dell’insieme N . Infine (c) del teorema 3.4 implica che U sia isometrica. Pertanto U : H → L2 (N, µ) è un operatore unitario e quindi H e L2 (N, µ) sono isomorfi come spazi di Hilbert. (b) Se una delle basi hilbertiane ha cardinalità finita c, allora essa è anche base algebrica di H. Con la geometria elementare si prova che se esiste una base con cardinalità finita c, allora ogni altro insieme di vettori linearmente indipendenti M ha cardinalità ≤ c e = c se e solo se M genera finitamente tutto lo spazio. Tenendo conto che ogni base hilbertiana, in quanto insieme ortogonale, è costituita da vettori linearmente indipendenti, si conclude facilmente che ogni base hilbertiana di H deve avere cardinalità sicuramente ≤ c e quindi = c perchè genera (finitamente) H. Quanto detto esclude anche il caso in cui, in H, una base hilbertiana abbia cardinalità finita ed un’altra abbia cardinalità infinita. Siano dunque N e M basi hilbertiane di H entrambe di cardinalità infinita. Se x ∈ M , definiamo Nx := {z ∈ N | (x|z) 6= 0}. Dato P che 1 = (z|z) = x∈M |(z|x)|2 , deve accadere che per ogni z ∈ N esiste x ∈ M tale che z ∈ Nx . Quindi N ⊂ ∪x∈M Nx e allora la cardinalità di N sarà inferiore o uguale a quella di ∪x∈M Nx che coincide con quella di M dato che ogni insieme Nx è al più numerabile per (b) del teorema 3.4. Quindi la cardinalità di N è inferiore o uguale a quella di M . Scambiando i ruoli di N ed M si ottiene anche che la cardinalità di M è inferiore o uguale a quella di N . Il teorema di Schröder-Bernstein implica infine che la cardinalità di M e quella di N coincidano. (c) Siano N e N1 due basi hilbertiane di H e H1 rispettivamente, e si supponga che N e N1 abbiano la stessa cardinalità. Allora esiste un’applicazione biettiva che identifica i punti di N con quelli di N1 e tale applicazione genera naturalmente un isomorfismo di spazi con prodotto scalare V dallo spazio L2 su N allo spazio L2 su N1 rispetto alla misura che conta i punti che è quindi un isomorfismo tra spazi di Hilbert. Se U1 : H1 → L2 (N1 , µ) è l’isomorfismo analogo a U : H → L2 (N, µ) descritto sopra, U V U1−1 : H1 → H è una trasformazione unitaria per costruzione e dunque H e H1 sono isomorfi come spazi di Hilbert.2 64 Di particolare interesse in fisica sono i cosiddetti spazi di Hilbert separabili. Definizione 3.6. Uno spazio di Hilbert si dice separabile se ammette un insieme denso e numerabile. Vale un ben noto e utile teorema di caratterizzazione. Teorema 3.7. Sia H spazio di Hilbert. (a) H è separabile se e solo se ha dimensione finita oppure ammette una base hilbertiana numerabile. (b) Se H è separabile, tutte le basi hilbertiane sono finite con lo stesso numero di elementi pari alla dimensione dello spazio, oppure sono tutte numerabili. (c) Se H è separabile è isomorfo a Cn dotato del prodotto scalare hermitiano standard con n finito pari alla dimensione di H, oppure è isomorfo a l2 (N). Prova. (a) Se lo spazio di Hilbert ammette una base hilbertiana finita o numerabile, allora, in base a (b) del teorema 3.4, esiste un insieme denso numerabile: quello costituito dalle combinazioni lineari finite di elementi della base usando come coefficienti numeri complessi di parte reale ed immaginaria razionale. Lasciamo i dettagli della facile dimostrazione al lettore. Supponiamo viceversa che uno spazio di Hilbert sia separabile. Sappiamo che, per il teorema 3.5, esistono sempre basi hilbertiane in tale spazio: mostriamo che ciascuna di esse deve essere al più numerabile. Supponiamo per assurdo che N sia base hilbertiana non numerabile per lo spazio di Hilbert H separabile. Scelti z, z 0 ∈ N con z 6= z 0 , ogni punto x ∈ H è tale che, per la disuguaglianza triangolare riferita alla norma indotta dal prodotto scalare: ||z − z 0 || ≤ ||x − z 0 || + ||z − x||. D’altra parte essendo {z, z 0 } un insieme ortonormale ||z − z 0 ||2 = (z − z 0 |z − z 0 ) = ||z||2 + ||z 0 ||2 + 0 = 1 + 1 = 2. √ 0 Quindi ||x − implica immediatamente che palle aperte di √ z|| + ||x − z || ≥ 2. Questo risultato raggio < 2/2 centrate rispettivamente in z e z 0 sono disgiunte comunque scegliamo z, z 0 ∈ N con z 6= z 0 . Sia {B(z)}z∈N una classe di tale palle disgiunte a due a due e ciascuna centrata sul rispettivo z ∈ N . Se D ⊂ H è l’insieme denso e numerabile che esiste per l’ipotesi di separabilità, dovrà accadere che, per ogni z ∈ N , esiste x ∈ D con x ∈ B(z). Dato che le palle sono disgiunte, avremo un diverso x per ogni palla. Ma la cardinalità di {B(z)}z∈N non è numerabile, per cui nemmeno D può essere numerabile e questo è assurdo. (b) e (c) sono immediate conseguenze del teorema 3.6. Tuttavia, per completezza diamo una traccia di una dimostrazione di esse. (b) Come è noto dalla teoria elementare, se una base (hilbertiana o no) ha un numero finito di elementi, allora tutte le altre basi (hilbertiane o no) hanno lo stesso numero di elementi pari alla dimensione dello spazio; inoltre, tutti gli insiemi di vettori linearmente indipendenti (come le basi hilbertiane) contengono un numero di elementi che non supera la dimensione dello spazio. Da questo fatto segue immediatamente che, se uno spazio di Hilbert è separabile ed una sua base hilbertiana è finita, allora tutte le basi hilbertiane dello spazio sono finite con lo stesso numero di elementi pari alla dimensione dello spazio. Nelle stesse ipotesi, se una base hilbertiana è 65 numerabile allora tutte le altre basi hilbertiane devono essere numerabili per (a). (c) Fissata una base hilbertiana N ed usando il teorema 3.4, si verifica immediatamente che P l’applicazione che trasforma H 3 x = u∈N αu u nell’insieme (finito o infinito a seconda del caso) {αu }u∈N è un isomorfismo di spazi con prodotto scalare da H a Cn , oppure, da H a l2 (N), a seconda che la dimensione di H sia finita oppure non lo sia. 2 Un’altra utile proposizione per spazi di Hilbert separabili è la seguente. Proposizione 3.4. Sia (H, ( | )) spazio di Hilbert con H 6= {0}. Valgono i seguenti fatti. (a) Se Y := {yn }n∈N è un insieme di vettori linearmente indipendenti e tali che Y ⊥ := {0} o equivalentemente < Y > = H. Allora H è separabile ed esiste una base hilbertiana di H, X := {xn }n∈N , tale che, per ogni p ∈ N, il sottospazio generato dai vettori y0 , y1 , . . . , yp coincide con quello generato dai vettori x0 , x1 , . . . , xp . (b) Se H è separabile e S ⊂ H è un sottospazio (non chiuso) di H denso in H, allora S contiene una base hilbertiana di H. Prova. (a) Diamo solo una traccia della dimostrazione perché si tratta essenzialmente della procedura di ortogonalizzazione di Gram-Schmidt, nota dai corsi di geometria elementare. Per ipotesi è y0 6= 0. Poniamo quindi x0 := y0 /||y0 ||. Successivamente consideriamo il vettore non nullo (perché y0 e y1 sono linearmente indipendenti) z1 := y1 − (x0 |y1 )x0 . È chiaro che x0 , z1 sono non nulli, ortogonali (quindi linearmente indipendenti) e generano la stesso spazio di y0 e y1 . Non resta che porre x1 := z1 /||z1 || per ottenere l’insieme ortonormale {x0 , x1 } che genera lo stesso spazio di y0 , y1 . Possiamo ora ripetere la procedura definendo induttivamente l’insieme di vettori: zn := yn − n−1 X (xk |yn )xk , k=0 e quindi quello dei vettori xn := zn /||zn ||. Per induzione si verifica facilmente che i vettori z0 , . . . , zk sono non nulli, ortogonali (quindi linearmente indipendenti) e generano lo stesso spazio generato dai vettori linearmente indipendenti y0 , . . . , yk ; di conseguenza i vettori x0 , . . . , xk formano un insieme ortonormale che genera lo stesso spazio generato dai vettori linearmente indipendenti y0 , . . . , yk . Se u ⊥ yn per ogni n ∈ N, allora vale anche (scrivendo gli xn come combinazione lineare di y0 , . . . , yn ) u ⊥ xn per ogni n ∈ N e viceversa (scrivendo ogni yn come combinazione lineare di x0 , . . . , xn ). Quindi X ⊥ = Y ⊥ = {0} e dunque X è una base hilbertiana per H. (b) S deve contenere un sottoinsieme S0 numerabile e denso in H. Sia infatti {yn }n∈N un insieme denso e numerabile in H. Per ogni yn ci sarà una successione {xnm }m∈N ⊂ S tale che xnm → yn per m → +∞. Si verifica subito che il sottoinsieme numerabile di S, S0 := {xn,m }(n,m)∈N×N , è ancora denso in H. Rietichettiamo gli elementi di S0 sui naturali in modo che x1 6= 0. Avremo dunque S0 = {xq }q∈N e dividiamo S0 in due sottoinsiemi S1 , che conterrà almeno x1 per definizione, e S2 nel modo seguente. Se x2 è linearmente indipendente da x1 includiamo x2 in S1 altrimenti lo includiamo in S2 . Se x3 è linearmente indipendente dagli elementi in S1 66 lo includiamo in S1 altrimenti lo includiamo in S2 . Procediamo in questo modo per tutti gli elementi di S0 . S1 conterrà, per costruzione, un insieme di generatori di S0 . In questo modo < S1 >=< S0 >⊃ S0 sarà un insieme denso in H e composto da vettori linearmente indipendenti. Inoltre, visto che S ⊃ S1 è sottospazio vettoriale, posto Y := S0 , avremo che la procedura di costruzione di un sistema ortonormale completo tramite combinazioni lineari finite di elementi di Y descritta in (a), produce una base hilbertiana di elementi di S stesso. 2 Esempi 3.2. (1) Consideriamo lo spazio di Hilbert L2 ([−L/2, L/2], dx) (vedi (2) in esempi 3.1), dove dx è la solita misura di Lebesgue sui boreliani di R e L > 0. Consideriamo le funzioni misurabili (perché continue) definite come, per n ∈ Z e x ∈ [−L/2, L/2], 2πn ei L x fn (x) := √ . L (3.24) Si verifica immediatamente che le funzioni fn appartengono allo spazio considerato e costituiscono un insieme ortonormale rispetto al prodotto scalare di L2 ([−L/2, L/2], dx) (vedi (2) in esempi 3.1) (f |g) := Z L/2 f (x)g(x)dx . (3.25) −L/2 Consideriamo l’algebra di Banach di funzioni continue C([−L/2, L/2]) (che è sottospazio di L2 ([−L/2, L/2], dx)) con norma data dalla norma dell’estremo superiore ((4) e (5) in esempi 2.1). Il sottospazio vettoriale S di C([−L/2, L/2]) generato da tutti i vettori fn , n ∈ Z, è una sottoalgebra di C([−L/2, L/2]). S contiene 1, è chiusa rispetto alla coniugazione complessa e, come è facile provare, separa i punti di [−L/2, L/2] (l’insieme delle funzioni fn da solo separa i punti), per cui, per il teorema di Stone-Weierstrass ((5) in esempi 2.1), è densa in C([−L/2, L/2]). D’altra parte è noto che le funzioni continue di [−L/2, L/2] costituiscono uno spazio vettoriale denso in L2 ([−L/2, L/2], dx) nella topologia di quest’ultimo ([Rud82] p.85); infine la topologia di C([−L/2, L/2]) è più forte di quella di L2 ([−L/2, L/2], dx), valendo (f |f ) ≤ L sup |f |2 = L(sup |f |)2 se f ∈ C([−L/2, L/2]). Ne consegue che S è denso in L2 ([−L/2, L/2], dx). Per (e) del teorema 3.4, i vettori fn costituiscono una base hilbertiana di L2 ([−L/2, L/2], dx), che di conseguenza risulta anche essere separabile. (2) Consideriamo lo spazio di Hilbert L2 ([0, 1], dx), dove dx è la misura di Lebesgue. Come nell’esempio precedente l’algebra di Banach C([0, 1]) è sottospazio denso in L2 ([0, 1], dx) nella topologia di quest’ultimo. Definiamo ora, diversamente dall’esempio precedente, per n = 0, 1, 2, . . ., x ∈ [0, 1]: gn (x) := xn . (3.26) Si dimostra subito che i vettori scritti sopra sono linearmente indipendenti. Il sottospazio vettoriale S di C([0, 1]) generato da tutti i vettori gn , n ∈ N, è una sottoalgebra di C([0, 1]). S contiene 1, è chiusa rispetto alla coniugazione complessa e separa i punti, per cui, per il teorema di Stone-Weierstrass, è densa in C([0, 1]) e anche in L2 ([0, 1], dx), ragionando come nell’esempio 67 precedente. La differenza dal caso precedente è che ora che le funzioni gn non costituiscono un insieme ortonormale. Tuttavia, usando la proposizione 3.4 si costruisce immediatamente un sistema ortonormale completo per L2 ([0, 1], dx). Gli elementi di tale base hilbertiana si chiamano i polinomi di Legendre. (3) I due esempi precedenti esibiscono due spazi L2 separabili. Si può provare che Lp (X, µ) (1 ≤ p < +∞) è separabile se e solo se la misura µ è separabile, cioè ammette un sottoinsieme denso e numerabile lo spazio metrico costruito sul sottoinsieme della σ-algebra Σ della misura µ contenente insiemi di misura finita, prendendo il quoziente rispetto alla relazione di equivalenza che identifica insiemi che differiscono per insiemi di misura nulla, e infine definendo la distanza come: d(A, B) := µ((A \ B) ∪ (B \ A)) . A tal fine vale la seguente proposizione sulle misure separabili. Proposizione (misure e spazi Lp separabili). Una misura positiva σ-additiva µ, e quindi Lp (X, µ), è separabile se µ è σ-finita (cioè X è unione numerabile di insiemi di misura finita) ed esiste una classe al più numerabile di insiemi misurabili la σ-algebra generata dai quali coincide con quella della misura µ. [Hal69] Si osservi che, di conseguenza, come corollario. Proposizione (misure di Borel e spazi Lp separabili). Ogni misura di Borel σ-finita riferita ad uno spazio topologico a base numerabile produce spazi Lp separabili. In particolare questo accade per la misura di Lebesgue su Rn ristretta ai boreliani e quindi anche per gli Lp riferiti alla misura di Lebesgue stessa, dato che tali spazi Lp sono isomorfi, come spazi di Banach, ai corrispondenti ottenuti dalla misura ristretta alla σ-algebra di Borel (le eventuali funzioni misurabili aggiunte cadono nella classe di equivalenza della funzione nulla). Le misure di Borel positive definite su spazi di Hausdorff localmente compatti si chiamano misure di Radon se sono regolari e i compatti hanno misura finita. Una misura di Radon è σ-finita se lo spazio su cui è definita è σ-compatto, cioè unione numerabile di compatti. (4) Consideriamo lo spazio L2 ((a, b), dx), dove −∞ ≤ a < b ≤ +∞ e dx denota l’usuale misura di Lebesgue su R. Sussiste la seguente utilissima proposizione dopo avere introdotto la trasformata di Fourier e Fourier-Plancherel (proposizione 3.14): Sia f : (a, b) → C misurabile tale che (1) l’insieme {x ∈ (a, b) | f (x) = 0} ha misura nulla, (2) esistono C, δ > 0 per cui |f (x)| < Ce−δ|x| per ogni x ∈ (a, b). In questo caso lo spazio lineare finitamente generato da tutte le funzioni x 7→ xn f (x) per n = 0, 1, 2, . . . è denso in L2 ((a, b), dx). L’importanza di questo risultato è che consente di costruire facilmente delle basi hilbertiane in L2 ((a, b), dx) anche se a o b sono infiniti (per cui non è possibile usare Stone-Weierstrass). Infatti, la procedura di ortogonalizzazione di Gram-Schmidt applicata ai vettori fn , con fn (x) := xn f (x), fornisce una base hilbertiana, secondo la procedura illustrata in proposizione 3.4. 2 A titolo di esempio, se f (x) := e−x /2 , la procedura di Gram-Schmidt definisce la base hilbertiana 2 di L2 (R, dx) delle cosiddette funzioni di Hermite, che hanno tutte la forma ψn (x) := Hn (x)e−x /2 dove Hn è un polinomio di grado n = 0, 1, 2, . . . chiamato n-esimo polinomio di Hermite. Nella Meccanica Quantistica questa base hilbertiana è importante quando si studia il sistema fisico 68 detto oscillatore armonico unidimensionale. Il calcolo diretto con procedura di Gram-Schmidt 2 mostra che ψ0 = π −1/4 e−x /2 e i successivi elementi sono individuati dalla la relazione di ricord renza ψn+1 = (2(n + 1))−1/2 (x − dx )ψn . Con la stessa procedura ed usando f (x) := e−x si trova una base hilbertiana di L2 ((0, +∞), dx) data dalle cosiddette funzioni di Laguerre, che sono della forma e−x Ln (x) con n = 0, 1, . . .. Ogni polinomio Ln è di grado n e si dice n-esimo polinomio di Laguerre. In Meccanica Quantistica questa base hilbertiana è importante quando si lavora con sistemi fisici con simmetria sferica, come l’atomo di idrogeno. (5) Consideriamo lo spazio di Hilbert separabile L2 (Rn , dx) (dove dx denota la solita misura di Lebesgue sui Boreliani di Rn ). È un fatto noto [Vla81] che gli spazi di funzioni su Rn infinitamente differenziabili, a valori reali (o complessi) e, rispettivamente, a supporto compatto oppure che decrescono all’infinito più rapidamente di ogni potenza negativa di |x|, sono sottospazi di Lp (Rn , dx), (1 ≤ p < ∞) densi in questi spazi. Consegue immediatamente da (b) di proposizione 3.4 che tali sottospazi contengono basi hilbertiane di L2 (Rn , dxn ). 3.3 Nozione di aggiunto e applicazioni. Esaminiamo ora una delle più importanti nozioni della teoria degli operatori in uno spazio di Hilbert: la nozione di operatore aggiunto (hermitiano). In questa sezione considereremo solo il caso di operatori limitati. Il caso generale sarà trattato più avanti. 3.3.1 L’operazione di coniugazione hermitiana o aggiunzione. Siano (H1 , ( | )1 ), (H2 , ( | )2 ) spazi di Hilbert e T ∈ B(H1 , H2 ). Consideriamo, per u ∈ H2 fissato, l’applicazione: H1 3 v 7→ (u|T v)2 ∈ C . (3.27) L’applicazione di sopra è sicuramente lineare ed anche limitata: |(u|T v)2 | ≤ ||u||2 ||T || ||v||1 . Si tratta dunque di un elemento di H01 . Per il teorema di Riesz (teorema 3.2), esisterà wT,u ∈ H1 tale che (u|T v)2 = (wT,u |v)1 , per ogni v ∈ H1 . (3.28) Possiamo ancora notare che l’applicazione H2 3 u 7→ wT,u è lineare. Infatti: (wT,αu+βu0 |v)1 = (αu + βu0 |T v)2 = α(u|T v)2 + β(u0 |T v)2 = (αwT,u + βwT,u0 |v)1 , per cui, per ogni v ∈ H, 0 = (wT,αu+βu0 − αwT,u − βwT,u0 |v)1 ; scegliendo v := wT,αu+βu0 − αwT,u − βwT,u0 , si ha che deve essere wT,αu+βu0 − αwT,u − βwT,u0 = 0 e quindi wT,αu+βu0 = αwT,u + βwT,u0 69 per ogni α, β ∈ C e u, u0 ∈ H2 . Quindi esiste un operatore lineare T ∗ : H2 3 u 7→ wT,u ∈ H1 . Questo operatore soddisfa (u|T v)2 = (T ∗ u|v)1 per ogni coppia u ∈ H2 , v ∈ H1 ed è l’unico operatore lineare a soddisfare questa identità. Se ci fosse un altro operatore B ∈ L(H2 , H1 ) che soddisfa l’identità detta, varrebbe anche (T ∗ u|v)1 = (Bu|v)1 per ogni v ∈ H1 . Di conseguenza avremmo che ((T ∗ − B)u|v)1 = 0 per ogni v ∈ H1 . Scegliendo v := (T ∗ − B)u si ha che deve essere ||(T ∗ − B)u||21 = 0 e quindi T ∗ u − Bu = 0. Dato che u ∈ H2 è arbitrario, deve infine valere T ∗ = B. Abbiamo in definitiva provato che vale la proposizione seguente. Proposizione 3.5. Siano (H1 , ( | )1 ), (H2 , ( | )2 ) spazi di Hilbert e T ∈ B(H1 , H2 ). Esiste ed è unico un operatore lineare T ∗ : H2 → H1 tale che: (u|T v)2 = (T ∗ u|v)1 , per ogni coppia u ∈ H2 , v ∈ H1 . (3.29) Possiamo dare la definizione di operatore aggiunto hermitiano. Nel seguito ometteremo l’aggettivo “hermitiano”, dato che in queste dispense non lavoreremo mai con operatori aggiunti non hermitiani, definibili lavorando con spazi di Banach senza usare la struttura di spazio di Hilbert. Definizione 3.7. Siano (H1 , ( | )1 ), (H2 , ( | )2 ) spazi di Hilbert e T ∈ B(H1 , H2 ). L’unico operatore lineare T ∗ ∈ L(H2 , H1 )che soddisfa (3.29) si dice aggiunto (hermitiano) o anche coniugato hermitiano dell’operatore T . L’operazione di coniugazione hermitiana gode delle seguenti proprietà elementari. Ricordiamo che dato un operatore lineare tra due spazi vettoriali, T : X → Y, Ran(T ) := {T (x) | x ∈ X} e Ker(T ) := {x ∈ X | T (x) = 0} indicano rispettivamente is ottospazi di Y e X rispettivamente detti il rango (o immagine) dell’operatore T e il nucleo dell’operatore T . Proposizione 3.6. Siano (H1 , ( | )1 ), (H2 , ( | )2 ) due spazi di Hilbert e T ∈ B(H1 , H2 ). Valgono i seguenti fatti. (a) T ∗ ∈ B(H2 , H1 ) e più precisamente ||T ∗ || = ||T || , ∗ (3.30) ∗ 2 ||T T || = ||T || = ||T T || . (3.31) (b) L’operazione di coniugazione hermitiana è involutiva: (T ∗ )∗ = T . (c) Se, rispettivamente, S ∈ B(H1 , H2 ) e α, β ∈ C, oppure S ∈ B(H1 , H), con H spazio di Hilbert, valgono le identità (αT + βS)∗ = αT ∗ + βS ∗ , ∗ (T S) ∗ ∗ = S T . 70 (3.32) (3.33) (d) Vale Ker(T ) = [Ran(T ∗ )]⊥ , Ker(T ∗ ) = [Ran(T )]⊥ . (3.34) (e) T è biettivo se e solo se T ∗ è biettivo. In tal caso vale: (T ∗ )−1 = (T −1 )∗ . Prova. Ometteremo nel seguito la specificazione della norma e del prodotto scalare e scriveremo, per esempio, || || indifferentemente per || ||1 e || ||2 . Quale norma o prodotto scalare sia in uso sarà chiaro dal contesto. (a) Per ogni coppia u ∈ H2 , x ∈ H1 vale |(T ∗ u|x)| = |(u|T x)| ≤ ||u|| ||T || ||x||. Scegliendo x := T ∗ u si ha in particolare ||T ∗ u||2 ≤ ||T || ||u|| ||T ∗ u|| e quindi ||T ∗ u|| ≤ ||T || ||u||. Quindi T ∗ è limitato e ||T ∗ || ≤ ||T ||. Ha senso quindi definire (T ∗ )∗ ed ottenere ||(T ∗ )∗ || ≤ ||T ∗ ||. Questa disuguaglianza si può riscrivere ||T || ≤ ||T ∗ || per (b), la cui dimostrazione usa solo il fatto che T ∗ sia limitato. Poiché ||T ∗ || ≤ ||T || e ||T || ≤ ||T ∗ || vale, (3.30). Passiamo a dimostrare (3.31). È sufficiente dimostrare la prima delle due identità, la seconda segue dalla prima e da (3.30). Notiamo che, per (b)(i) del teorema 2.3, la cui tesi vale banalmente anche per operatori S ∈ B(Y, X), T ∈ B(Z, Y) con X, Y, Z spazi normati, ||T ∗ T || ≤ ||T ∗ || ||T || = ||T ||2 . D’altra parte: ||T ||2 = ( sup ||T x||)2 = sup ||T x||2 = sup (T x|T x) . ||x||≤1 ||x||≤1 ||x||≤1 Usando la definizione di aggiunto e poi la disuguaglianza di Cauchy-Schwartz sull’ultimo termine della catena di uguaglianze scritte sopra, troviamo che : ||T ||2 = sup (T x|T x) = sup |(T ∗ T x|x)| ≤ sup ||T ∗ T x|| = ||T ∗ T || . ||x||≤1 ||x||≤1 ||x||≤1 In definitiva abbiamo ottenuto che ||T ∗ T || ≤ ||T ||2 e ||T ||2 ≤ ||T ∗ T ||, per cui vale ||T ∗ T || = ||T ||2 . (b) Segue immediatamente dall’unicità dell’operatore aggiunto, valendo, per le note proprietà del prodotto scalare e per la stessa definizione di operatore aggiunto dell’operatore T : (v|T ∗ u) = (T ∗ u|v) = (u|T v) = (T v|u) . (c) Se u ∈ H2 , v ∈ H1 (u|(αT + βS)v) = α(u|T v) + β(u|Sv) = α(T ∗ u|v) + β(S ∗ u|v) = ((αT ∗ + βS ∗ )u|v) . Per l’unicità dell’operatore aggiunto vale (3.32). Se v ∈ H, u ∈ H2 (u|(T S)v) = (T ∗ u|Sv) = ((S ∗ T ∗ )u|v) . Per l’unicità dell’operatore aggiunto vale (3.33). (d) È sufficiente provare la prima delle due identità, la seconda segue subito dalla prima usando (b). Dato che (T ∗ u|v) = (u|T v), se v ∈ Ker(T ) allora (T ∗ u|v) = 0 per ogni u ∈ H2 e quindi v ∈ [Ran(T ∗ )]⊥ . Viceversa, sempre per (T ∗ u|v) = (u|T v), se v ∈ [Ran(T ∗ )]⊥ , allora (u|T v) = 0 per ogni u ∈ H2 . Scegliendo u := T v segue che T v = 0 e quindi v ∈ Ker(T ). 71 (e) Se T è biettivo allora T −1 è limitato per il teorema di Banach dell’operatore inverso. Di conseguenza esiste (T −1 )∗ . Vale: T −1 T = T T −1 = I. Calcolando l’aggiunto ad ambo membri, usando la seconda proprietà in (c) e tenendo conto che I ∗ = I, abbiamo: T ∗ (T −1 )∗ = (T −1 )∗ T ∗ = I. Queste identità sono equivalenti a dire che T ∗ è biettivo e che (T ∗ )−1 = (T −1 )∗ . Infine, se T ∗ è biettivo, allora, per quanto appena provato, lo deve essere anche (T ∗ )∗ = T per (b). 2 3.3.2 ∗ -algebre e C ∗ -algebre. L’operazione di coniugazione hermitiana consente di introdurre uno dei concetti matematici più utili nelle formulazioni avanzate della Meccanica Quantistica: stiamo parlando della la struttura di C ∗ -algebra (anche detta B ∗ -algebra). Torneremo ad usare tale struttura nel capitolo 8 in relazione al teorema di decomposizione spettrale. Definizione 3.8. Sia A un’algebra (commutativa, con unità, normata con norma || ||, di Banach) sul campo C. Se esiste un’applicazione ∗ : A → A che gode delle seguenti proprietà: I1. (antilinearità) (αx + βy)∗ = αx∗ + βy ∗ per ogni x, y ∈ A, α, β ∈ C, I2. (involutività) (x∗ )∗ = x per ogni x ∈ A, I3. (xy)∗ = y ∗ x∗ per ogni x, y ∈ A, tale applicazione è detta involuzione e la struttura (A,∗ ) si dice ∗ -algebra (rispettivamente commutativa, con unità, normata, di Banach). Una ∗ -algebra di Banach (con unità) si dice C ∗ -algebra (rispettivamente con unità) se vale la ulteriore proprietà ||x∗ x|| = ||x||2 . (3.35) Un omomorfismo tra due ∗ -algebre: f : A → B è detto ∗ -omomorfismo se preserva l’involuzione: f (x∗ ) = f (x)∗ per ogni x ∈ A (dove ∗ a primo membro indica l’involuzione in A e quella a secondo membro indica l’involuzione in B), ed detto ∗ -isomorfismo se è anche biettivo. Un elemento x di una ∗ -algebra è detto normale se xx∗ = x∗ x ed è detto hermitiano se x∗ = x. Prima di tornare alla C ∗ -algebra B(H), diamo alcune immediate proprietà generali delle ∗algebre che seguono dalla stessa definizione. Proposizione 3.7. Sia A una ∗-algebra. Indicando con ∗ l’involuzione in A, vale quanto segue. (a) Se A è C ∗ -algebra con norma || || e x ∈ A è normale, allora, per ogni m = 1, 2, . . .: ||xm || = ||x||m . (b) Se A è C ∗ -algebra con norma || || e x ∈ A, allora ||x∗ || = ||x|| . (c) Se A ammette unità I, vale I∗ = I. 72 Prova. (a) Se ||x|| = 0 la tesi eovvia. Supponiamo x 6= 0 Usando ripetutamente (3.35), I2 e I3 e il fatto che xx∗ = x∗ x: ||x2 ||2 = ||(x2 )∗ x2 || = ||(x∗ )2 x2 || = ||(x∗ x)∗ (x∗ x)|| = ||x∗ x||2 = (||x||2 )2 k da cui ||x2 || = ||x||2 per la positività della norma. Iterando la procedura si prova che ||x2 || = k ||x||2 per ogni naturale k. Se m = 3, 4, . . . esistono due naturali n, k tali che m + n = 2k . In questo modo: ||x||m ||x||n = ||x||n+m = ||xn+m || ≤ ||xm || ||xn || ≤ ||xm || ||x||n ≤ ||x||m ||x||n . Ma allora tutte le disuguaglianze devono essere uguaglianze, in particolare: ||xm || ||x||n = ||x||m ||x||n e pertanto, dividendo per ||x||m (che è non nullo perché x 6= 0 e || · || è una norma) si ha la tesi. (b) (3.35) implica che ||x||2 = ||xx∗ || ≤ ||x|| ||x∗ || da cui ||x|| ≤ ||x∗ ||. Nello stesso modo ||x∗ || ≤ ||(x∗ )∗ ||, ma (x∗ )∗ = x da cui la tesi. (c) II∗ = I∗ (1) per definizione di unità; d’altra parte II∗ = (I∗ )∗ I∗ = (I∗ I)∗ (2). Da (1) e (2) segue che I∗ = (I∗ I)∗ = (I∗ )∗ = I. 2 Esempi 3.3. (1) Le algebre di Banach di funzioni a valori complessi viste negli esempi (2),(3),(4),(8) e (9) in esempi 2.1 sono tutte C ∗ -algebre commutative in cui l’involuzione è data dalla coniugazione complessa delle funzioni. (2) Abbiamo immediatamente che, in virtù di (a), (b) e (c) in proposizione 3.6: l’algebra di Banach B(H) è anche una C ∗ -algebra se l’involuzione è definita come la coniugazione hermitiana e gli operatori autoaggiunti (vedi successiva definizione 3.9) coincidono con gli elementi hermitiani di B(H). (3) Un esempio di C ∗ -algebra, fondamentale per le applicazioni di teoria quantistica dei campi (ma non solo) è l’algebra di von Neumann. Se M è un sottoinsieme dello spazio di Hilbert complesso H, il commutante di M è definito come: M0 := {T ∈ B(H) | T A − AT = 0 per ogni A ∈ M} . Se M è chiuso sotto l’operazione di coniugazione hermitiana (cioé A∗ ∈ M se A ∈ M) il commutante M0 è sicuramente una ∗-algebra con unità . Nel caso generale vale: M01 ⊂ M02 se M2 ⊂ M1 e anche M ⊂ (M0 )0 , che implicano M0 = ((M0 )0 )0 , per cui iterando l’operazione di calcolo del commutate non si supera il secondo commutante. Dalla continuità del prodotto operatoriale, che il commutante M 0 è chiuso nella topologia uniforme e quindi, se M è chiuso rispetto alla coniugazione hermitiana, il suo commutante M0 è una C ∗ -algebra (sotto C ∗ -algebra) di B(H). 73 M0 ha altre fondamentali proprietà topologiche nel caso generale. Si dimostra facilmente che M0 è chiuso rispetto alla topologia operatoriale forte e rispetto alla topologia operatoriale debole. Il risultato vale indipendentemente dal fatto che il prodotto di operatori non è congiuntamente continuo nei due argomenti, dato che è sufficiente la continuità separatamente nei due argomenti. Nel seguito, come di consuetudine nella teoria della algebre di von Neumann, scriveremo M00 al posto di (M0 )0 e via di seguito. Vale il seguente fondamentale teorema dovuto a von Neumann, detto [BrRo02]: Teorema (del doppio commutante). Se A è una sotto ∗-algebra di B(H), con H spazio di Hilbert complesso, i seguenti fatti sono equivalenti. (a) A = A00 . (b) A è chiusa rispetto alla topologia operatoriale debole e I ∈ A. (c) A è chiusa rispetto alla topologia operatoriale forte e I ∈ A. Che (a) implichi (b) che, a sua volta, implichi (c) è abbastanza facile da provare. Il punto difficile è dimostrare che (c) implichi (a). Un’algebra di von Neumann in B(H) è una sotto ∗-algebra che soddisfi una delle proprietà equivalenti del teorema di von Neumann citato sopra. Quindi, in particolare M0 è sempre un’algebra di von Neumann se M è un sottoinsieme di B(H), valendo (M0 )00 = M0 come visto sopra. Si osservi anche che, per costruzione, un’algebra di von Neumann in B(H) è una C ∗ -algebra, più precisamente una sotto C ∗ -algebra di B(H). Si verifica subito che l’intersezione di due algebre di von Neumann è ancora un’algebra di von Neumann. Se M ⊂ B(H), M00 risulta essere la più piccola (nel senso dell’intersezione) algebra di von Neumann che include M come sottoinsieme [BrRo02]. Pertanto M00 si chiama l’algebra di von Neumann generata da M. 3.3.3 Operatori normali, autoaggiunti, isometrici, unitari, operatori positivi. Tornando alla C ∗ -algebra B(H) (ma anche più in generale a B(H, H1 )), possiamo dare alcune definizioni riguardanti i più importanti tipi di operatori. Definizione 3.9. Siano (H, ( | )) e (H1 , ( | )1 ) spazi di Hilbert e si denotino con IH e IH1 , rispettivamente, gli operatori identità su H e H1 . (a) T ∈ B(H) è detto normale se T T ∗ = T ∗ T . (b) T ∈ B(H) è detto autoaggiunto se T = T ∗ . (c) T ∈ L(H, H1 ) è detto isometrico se è limitato e T ∗ T = IH ; equivalentemente T ∈ L(H, H1 ) è isometrico se (T x|T y)1 = (x|y) per ogni coppia x, y ∈ H. (d) T ∈ L(H, H1 ) è detto unitario se è limitato e T ∗ T = IH , T T ∗ = IH1 ; equivalentemente T ∈ L(H, H1 ) è unitario se è isometrico e suriettivo. (e) T ∈ L(H) è detto positivo, e si scrive T ≥ 0, se (u|T u) ≥ 0 per ogni u ∈ H. (f ) Se U ∈ L(H), si dice che T maggiora U , e si scrive T ≥ U , se T − U ≥ 0. 74 Osservazioni. (1) Si osservi, a commento di (c), che se T ∈ B(H, H1 ) e T ∗ T = IH , allora vale (T x|T y)1 = (x|y) per ogni coppia x, y ∈ H in quanto (x|y) = (x|T ∗ T y) = (T x|T y)1 . Viceversa, se T ∈ L(H, H1 ) e vale (T x|T y)1 = (x|y) per ogni x, y ∈ H, allora T è limitato (basta porre y = x) e dunque esiste T ∗ ; infine vale T ∗ T = IH perché (x|T ∗ T y) = (T x|T y)1 = (x|y) per ogni coppia x, y ∈ H e quindi in particolare (x|(T ∗ T − I)y) = 0 con x = (T ∗ T − I)y. A commento di (d) si osservi che ogni operatore isometrico T è ovviamente iniettivo, perché T u = 0 implica ||u|| = 0 e quindi u = 0. Allora la surgettività è equivalente all’esistenza di un’inversa destra che coincida con quella sinistra, che esiste già per l’iniettività ed è T ∗ . Da ciò segue immediatamente che T ∗ T = IH e T T ∗ = IH1 è equivalente a dire che T ∈ L(H, H1 ) è isometrico (e quindi limitato) ed è anche suriettivo. (La definizione data qui di operatore unitario è quindi in accordo con la definizione 3.3). (2) Esistono operatori isometrici in B(H) che non sono operatori unitari (ovviamente ciò non accade se H ha dimensione finita). Un esempio è l’operatore sullo spazio l2 (N): A : (z0 , z1 , z2 , . . .) 7→ (0, z0 , z1 , , . . .) , per ogni (z0 , z1 , z2 , . . .) ∈ l2 (N). (3) Gli operatori unitari in B(H) e quelli autoaggiunti sono operatori normali, ma non vale il viceversa in generale. Per concludere questa sezione, restringendoci a lavorare con un unico spazio di Hilbert, diamo alcune proprietà elementari degli operatori normali, autoaggiunti, unitari e positivi nella seguente proposizione preceduta da una definizione. Definizione 3.10. Siano X spazio vettoriale sul campo K e T ∈ L(X); λ ∈ K è detto autovalore dell’operatore T se T u = λu (3.36) per qualche u ∈ X \ {0}. In tal caso u è detto autovettore di T con autovalore λ (o associato all’autovalore λ). Il sottospazio di tutti gli autovettori con autovalore λ è detto autospazio di T con autovalore λ (o associato all’autovalore λ). Proposizione 3.8. Sia (H, ( | )) spazio di Hilbert. (a) Se T ∈ B(H) è autoaggiunto, allora: ||T || = sup {|(x|T x)| | x ∈ H , ||x|| = 1} . (3.37) Più in generale, se T ∈ L(H) soddisfa (x|T x) = (T x|x) per ogni x ∈ H ed il secondo membro di (3.37) è finito, allora T è limitato. (b) Se T ∈ B(H) è normale (e quindi in particolare autoaggiunto oppure unitario): (i) λ ∈ C è autovalore di T con autovettore u se e solo se λ è autovalore per T ∗ con lo stesso autovettore u; 75 (ii) autospazi di T con autovalori distinti sono ortogonali. (c) Sia T ∈ L(H). Valgono i seguenti fatti: (i) se T è positivo, i suoi possibili autovalori sono reali non negativi; (ii) se T è limitato ed autoaggiunto, i suoi possibili autovalori sono reali; (iii) se T è isometrico (ed in particolare unitario), i suoi possibili autovalori sono complessi con modulo uguale a 1. (d) Se T ∈ L(H) soddisfa (y|T x) = (T y|x) per ogni coppia x, y ∈ H, allora T è limitato ed è autoaggiunto. (e) Se T ∈ B(H) soddisfa (x|T x) = (T x|x) per ogni x ∈ H, allora T è autoaggiunto. (f ) Se T ∈ B(H) è positivo, allora è autoaggiunto. (g) ≥ è una relazione di ordine parziale in L(H) (e quindi anche in B(H)). Prova. (a) Posto Q := sup {|(x|T x)| | x ∈ H , ||x|| = 1}, dato che ||x|| = 1, |(x|T x)| ≤ ||T x||||x|| ≤ ||T x|| ≤ ||T || . Quindi: Q ≤ ||T ||. Per concludere, è sufficiente provare che ||T || ≤ Q. Vale l’identità di immediata verifica 4(x|T y) = (x + y|T (x + y)) − (x − y|T (x − y)) + i(x + iy|T (x + iy)) − i(x − iy|T (x − iy)) . Da tale identità e tenendo conto del fatto che (z|T z) = (T z|z) = (z|T z), si ricava che 4Re(x|T y) = 2(x|T y) + 2(x|T y) può essere scritto: 4Re(x|T y) = (x + y|T (x + y)) − (x − y|T (x − y)) ≤ Q||x + y||2 + Q||x − y||2 = 2Q||x||2 + 2Q||y||2 . Abbiamo provato che: 4Re(x|T y) ≤ 2Q||x||2 + 2Q||y||2 . Sia y ∈ H con ||y|| = 1. Se T y = 0, allora è ovvio che ||T y|| ≤ Q; altrimenti definiamo x := T y/||T y|| e otteniamo dalla disuguaglianza provata sopra: 4||T y|| = 4Re(x|T y) ≤ 2Q(||x||2 + ||y||2 ) = 2Q(1 + 1) = 4Q da cui, ancora, ||T y|| ≤ Q. In definitiva ||T y|| ≤ Q se ||y|| = 1 e quindi ||T || = sup{||T y|| | y ∈ H , ||y|| = 1} ≤ Q . La seconda proposizione segue dalla seconda parte della dimostrazione di sopra (||T || ≤ Q). (b)(i) Se A è normale ||Au||2 = (Au|Au)2 = (A∗ Au|u) = (AA∗ u|u) = (A∗ u|A∗ u) = ||A∗ u||2 . Se T è normale, T − λI è normale con aggiunto T ∗ − λI, per cui applicando il risultato di sopra, ||T u − λu||2 = ||T ∗ u − λu||2 . 76 La tesi segue immediatamente. (ii) Sia u autovettore di T con autovalore λ e v autovettore di T con autovalore µ. Per (i), λ(v|u) = (v|T u) = (T ∗ v|u) = (µv|u) = µ(v|u) per cui (λ−µ)(v|u) = 0. Essendo λ 6= µ, deve essere (v|u) = 0. (c) Se T ≥ 0 e T u = λu con u 6= 0, allora 0 ≤ (u|T u) = λ(u|u); essendo (u|u) > 0, segue che deve essere λ ≥ 0. Sia poi T = T ∗ e T u = λu con u 6= 0: allora λ(u|u) = (u|T u) = (T u|u) = λ(u|u). Essendo (u|u) 6= 0, si ha λ = λ ossia λ ∈ R. Se invece T è isometrico: (u|u) = (T u|T u) = |λ|2 (u|u). Essendo u 6= 0, si ha che |λ| = 1. (d) La tesi si prova dimostrando che T è limitato. L’unicità dell’aggiunto implica allora che T = T ∗ in quanto (y|T x) = (T y|x) per ogni coppia x, y ∈ H. A causa del teorema del grafico chiuso (corollario 2 del teorema dell’applicazione aperta 2.3 in cap.2), per dimostrare che T è limitato è sufficiente provare che T è chiuso. Sia allora {xn } ⊂ H una successione convergente a x e supponiamo che i vettori T xn definiscano una successione convergente: dobbiamo mostrare che T xn → T x. Nelle nostre ipotesi, fissato y ∈ H, si ha: (y|T xn ) = (T y|xn ) → (T y|x) = (y|T x) . Per la continuità del prodotto scalare e tenendo conto che esiste per ipotesi limn→+∞ T xn , possiamo allora scrivere: y T x − lim T xn = 0 . n→+∞ Dato che y è arbitrario, scegliendo proprio y := T x − limn→+∞ T xn concludiamo che T x − limn→+∞ T xn = 0. (e) e (f) Nelle ipotesi fatte ((T ∗ − T )x|x) = 0 per ogni x ∈ H. Per (2) in esercizi 3.2 (vedi dopo) deve essere T ∗ − T = 0 ossia T = T ∗ . Se T ∈ B(H) è positivo, allora (x|T x) è reale e coincide quindi con il suo complesso coniugato, che vale (T x|x) per le proprietà del prodotto scalare, per cui si ricade nel caso precedente. (g) Bisogna provare tre fatti. (i) T ≥ T : questo è ovvio perchè significa che ((T − T )x|x) ≥ 0 per ogni x ∈ H. (ii) se T ≥ U e U ≥ S allora T ≥ S: questo si prova immediatamente notando che T − S = (T − U ) + (U − S) e quindi ((T − S)x|x) = ((T − U )x|x) + ((U − S)x|x) ≥ 0 per ogni x ∈ H, dato che T ≥ U e U ≥ S. (iii) se T ≥ U e U ≥ T allora T = U . Per provare (iii) si osservi che nelle ipotesi fatte (x|(T − U )x) = 0 per ogni x ∈ H. Per (2) in esercizi 3.2 deve essere T − U = 0 ossia T = U . 2 Nota. Si osservi che per spazi di Hilbert sul campo reale ≥ non è una relazione d’ordine parziale, perché non è vero che se A ≥ 0 e 0 ≥ A, allora A = 0. A titolo di esempio, si consideri una matrice antisimmetrica A su Rn (visto come spazio vettoriale sul campo R), dotato del prodotto scalare ordinario. Vale A ≥ 0 e anche 0 ≥ A, in quanto (x|Ax) = 0 per ogni x ∈ Rn , ma A 6= 0. 77 3.4 Proiettori ortogonali. Come ultimo concetto elementare introduciamo la nozione di proiettore ortogonale, che giocherà il ruolo centrale nel costruire il formalismo della meccanica quantistica. In riferimento alla definizione 2.10 ed alle successive proposizioni 4.2 e 5.2, possiamo dare la seguente definizione. Definizione 3.11. Se (H, ( | )) è spazio di Hilbert, un proiettore P ∈ B(H) è detto proiettore ortogonale se P ∗ = P . Nota. Quindi i proiettori ortogonali sono tutti e soli gli operatori limitati da H in H definiti dalle due condizioni P = P P (idempotenza) e P = P ∗ (autoaggiuntezza). Si osservi che come immediata conseguenza della definizione data si ha la positività dei proiettori ortogonali: per ogni x ∈ H (u|P u) = (u|P P u) = (P ∗ u|P u) = (P u|P u) = ||P u||2 ≥ 0 . Abbiamo la seguente coppia di proposizioni che caratterizzano i proiettori ortogonali. Proposizione 3.9. Sia P ∈ B(H) un proiettore ortogonale (nello spazio di Hilbert H) che proietta su M : allora vale quanto segue. (a) Il proiettore associato Q := I − P è ancora un proiettore ortogonale. (b) Q(H) = M ⊥ , per cui la decomposizione diretta associata a P e Q secondo (b) di proposizione 2.4 è quella dovuta a M ed al suo ortogonale M ⊥ : H = M ⊕ M⊥ . (c) Per ogni x ∈ H, ||x − P (x)|| = min{||x − y|| | y ∈ M } . (d) Se N è una base hilbertiana di M , allora: P = s- X u (u| ) , u∈N dove il simbolo “s-” indica che la serie è calcolata nella topologia forte se la somma è infinita. (e) I ≥ P ; inoltre, se P non è l’operatore nullo (il proiettore su {0}), ||P || = 1. Prova. (a) Sappiamo già che Q := I − P è proiettore (proposizione 2.4). Per (c) di proposizione 3.6, essendo anche I ∗ = I, segue subito che Q∗ = Q, per cui Q è proiettore ortogonale. (b) Per la (b) della proposizione 2.4, è sufficiente provare che Q(H) = M ⊥ . A tal fine si noti che se x ∈ Q(H) e y ∈ M , allora (x|y) = (Qx|y) = (x|Qy) = (x|y − P y) = (x|y − y) = 0, per cui Q(H) ⊂ M ⊥ . Mostriamo che deve essere anche M ⊥ ⊂ Q(H), per cui M ⊥ = Q(H). Per la proposizione 2.4, sussiste la decomposizione diretta di H: H = M ⊕ Q(H) 78 D’altra parte, per (d) di teorema 3.1, si ha anche la decomposizione diretta (e ortogonale) H = M ⊕ M⊥ . Se y ∈ M ⊥ , in base alla prima decomposizione si ha la decomposizione unica di y: y = yM +z con yM ∈ M e z ∈ Q(H). Ma, come visto, Q(H) ⊂ M ⊥ , per cui, per l’unicità della decomposizione, y = yM +z deve coincidere anche con la decomposizione rispetto alla seconda coppia di sottospazi: e quindi yM ∈ M e z ∈ M ⊥ . In tal caso yM = 0 per ipotesi, per cui y = z ∈ Q(H). Dato che y ∈ M ⊥ è un vettore arbitrario, abbiamo provato che M ⊥ ⊂ Q(H). (c) La tesi è immediata conseguenza di (d) del teorema 3.1, quando K := M , tenuto conto dell’unicità della decomposizione diretta. (d) Possiamo completare N a base hilbertiana di H tramite l’unione con una base hilbertiana N 0 di M ⊥ (infatti N ∪ N 0 è un insieme ortonormale per costruzione; inoltre, valendo H = M ⊕ M ⊥ per (b), se x ∈ H è ortogonale a N e N 0 , deve essere il vettore nullo. Per definizione di base hilbertiana, N ∪ N 0 è base hilbertiana di H.) Allora si verifica immediatamente che R= X u (u| ) u∈N e R0 = X u (u| ) u∈N 0 (dove le somme, se contengono infiniti addendi, sono calcolate nella topologia forte) sono operatori limitati, soddisfano RR = R, R(H) = M , R0 R0 = R0 , R0 (H) = M ⊥ ed infine R0 R = RR0 = 0 e R + R0 = I. Per la proposizione 2.4, R ed R0 sono proiettori associati alla decomposizione diretta M ⊕ M ⊥ . Per l’unicità della decomposizione su M e M ⊥ di ogni vettore, concludiamo che deve essere R = P (e R0 = Q). (e) Q = I − P è proiettore ortogonale per cui: 0 ≤ (Qx|Qx) = (x|QQx) = (x|Qx) = (x|Ix) − (x|P x) , per ogni x ∈ H. Questo significa che I ≥ P . Da quanto appena detto segue anche che: ||P x||2 = (P x|P x) = (x|P P x) = (x|P x) ≤ (x|x) = ||x||2 . Prendendo l’estremo superiore su x con ||x|| = 1, si ha ||P || ≤ 1. Se P 6= 0, ci sarà x ∈ H con ||x|| = 1 per cui P x = x e quindi ||P x|| = 1. In tal caso dovrà essere ||P || = 1. 2 Proposizione 3.10. Sia H spazio di Hilbert e M ⊂ H un sottospazio chiuso. I proiettori P e Q associati alla somma diretta ortogonale H = M ⊕ M⊥ secondo la proposizione 2.5 (con N := M⊥ ) e che proiettano rispettivamente su M e M⊥ sono proiettori ortogonali. Prova. Bisogna solo provare che P = P ∗ . Il fatto che Q = Q∗ segue da Q = I − P . Se x ∈ H, allora si ha la decomposizione univoca x = y + z con y = P (x) ∈ M e z = Q(x) ∈ M⊥ . 79 Sia x0 = y 0 + z 0 l’analoga decomposizione per x0 ∈ H. Vale (x0 |P x) = (y 0 + z 0 |y) = (y 0 |y). Ma anche (P x0 |x) = (y 0 |y + z) = (y 0 |y), per cui (x0 |P x) = (P x0 |x) ossia ((P ∗ − P )x0 |x) = 0 per ogni x, x0 ∈ H. Scegliendo x = (P ∗ − P )x0 si vede che deve valere P x0 = P ∗ x0 per ogni x0 e quindi P = P ∗. 2 Esercizi 3.2. (1) Mostrare che se H è spazio di Hilbert, U ∈ L(H) è operatore isometrico se e solo se ||U x|| = ||x|| per ogni x ∈ H. Più in generale, provare che se T : D(T ) → X è un operatore sullo spazio vettoriale D(T ) sul campo complesso e con prodotto scalare ( | ), dove D(T ) è un sottospazio (non necessariamente chiuso) di X, allora i due fatti seguenti sono equivalenti (|||| indica la norma indotta dal prodotto scalare): (a) ||T x|| = ||x|| per ogni x ∈ D(T ); (b) (T x|T y) = (x|y) per ogni coppia x, y ∈ D(T ). Suggerimento. (5) di Esercizi 3.1 (2) Siano H uno spazio di Hilbert e T : D(T ) → H un operatore lineare, dove D(T ) ⊂ H è un sottospazio denso in H (eventualmente D(T ) = H). Si provi che se (u|T u) = 0 per ogni u ∈ D(T ) allora T = 0, cioè T è l’operatore nullo (che manda ogni vettore in 0). Soluzione. Vale 0 = (u + v|T (u + v)) = (u|T u) + (v|T v) + (u|T v) + (v|T u) = (u|T v) + (v|T u) . Similmente 0 = i(u + iv|T (u + iv)) = i(u|T u) + i(v|T v) − (u|T v) + (v|T u) = −(u|T v) + (v|T u) . Quindi, sommando membro a membro, (v|T u) = 0 per ogni u, v ∈ D(T ). Scegliendo {vn }n∈N ⊂ D(T ) tale che vn → T u per n → +∞, si ha che ||T u||2 = (T u|T u) = limn→+∞ (vn |T u) = 0 per ogni u ∈ D(T ), ossia T u = 0 per ogni u ∈ D(T ) e quindi T = 0. (3) Si consideri L2 ([0, 1], m) dove m è la solita misura di Lebesgue. Sia f ∈ L2 ([0, 1], m). Mostrare che l’operatore Tf : L2 ([0, 1], m) 3 g 7→ f · g, dove · è l’ordinario prodotto di funzioni punto per punto, è ben definito, limitato con norma ||Tf || ≤ ||f || e normale. Infine Tf è autoaggiunto se e solo se f ammette solo valori reali. (4) Sia T ∈ B(H) autoaggiunto. Per λ ∈ R, si consideri la serie di operatori U (λ) := ∞ X (iλ)n n=0 Tn , n! dove T 0 := I, T 1 := T , T 2 := T T e via di seguito e la convergenza è quella nella topologia uniforme. Si dimostri che la serie converge ad un operatore unitario. (5) In riferimento all’esercizio precedente, provare che se λ, µ ∈ R, U (λ)U (µ) = U (λ + µ). (6) Mostrare che la serie nell’esercizio (5) converge per ogni λ ∈ C ad un operatore limitato e che U (λ) è sempre normale. 80 (7) Mostrare che l’operatore U (λ) dell’esercizio (7) è positivo se λ ∈ iR. Ci sono valori di λ ∈ C per cui U (λ) è un proiettore (non necessariamente ortogonale)? (8) Calcolare esplicitamente U (λ) dell’esercizio (5) se T è definito come Tf dell’esercizio (4) con f = f. (9) In l2 (N) si consideri l’operatore T : {xn } 7→ {xn+1 /n}. Provare che T è limitato e calcolare T ∗. 3.5 Radici quadrate di operatori positivi e decomposizione polare di operatori limitati. In questa sezione piuttosto tecnica vedremo alcune nozioni molto utili in teoria degli operatori limitati in uno spazio di Hilbert. Il risultato più importante è il cosiddetto teorema di decomposizione polare per operatori limitati. Si tratta di una decomposizione di un operatore che generalizza la decomposizione di un numero complesso z nel prodotto del suo valore assoluto e di un esponenziale immaginario: z = |z|ei arg z . La nozione valore assoluto di un operatore è utile per introdurre una generalizzazione del concetto di “convergenza assoluta” di serie numeriche costruite a partire da operatori e basi hilbertiane. Useremo queste serie nel definire gli operatori di Hilbert-Schmidt e gli operatori di classe traccia, alcuni dei quali rappresentano gli stati in meccanica quantistica. Parte delle dimostrazioni sono tratte da [Mar82] e [KaAk80]. Definizione 3.12. Se A ∈ B(H), con H spazio di Hilbert, B ∈ B(H) si dice radice quadrata ovvero radice quadrata (positiva) di A se B 2 = A (e rispettivamente B ≥ 0). Mostreremo tra poco che ogni operatore limitato positivo ha una ed una sola radice quadrata positiva. Ci serve un lemma iniziale che diamo sotto forma di proposizione in quanto si tratta, a sua volta, di un utilissimo risultato molto usato nella teoria spettrale lavorando con successioni e serie di proiettori ortogonali nella topologia forte. Proposizione 3.11. Sia H spazio di Hilbert. Se {An }n∈N ⊂ B(H) è una successione monotona non decrescente (non crescente) di operatori autoaggiunti limitata superiormente (rispettivamente inferiormente) da K ∈ B(H), allora esiste A ∈ B(H) autoaggiunto con A ≤ K (rispettivamente A ≥ K) e tale che: A = s- lim An . n→+∞ (3.38) Prova. Dimostriamo la tesi nel caso non decrescente; l’altro caso si riporta a questo considerando la successione di termini K − An . Posto Bn := An + ||A0 ||I per ogni n ∈ N, si verifica facilmente che la successione dei Bn è 81 monotona non decrescente fatta di operatori positivi1 e vale ancora Bn ≤ K + ||A0 ||I =: K1 e K1 è positivo (K può non esserlo). Valendo (x|K1 x) ≥ (x|Bn x), ma anche −(x|Bm x) ≤ 0 ed infine (x|Bn x) − (x|Bm x) ≥ 0 se n ≥ m, vale anche (x|K1 x) ≥ (x|Bn x) − (x|Bm x) ≥ 0 per ogni x ∈ H. Dato che che ogni operatore positivo T definisce un semiprodotto scalare per cui è valida la disuguaglianza di Schwartz |(x|T y)|2 ≤ (x|T x)(y|T y) , (3.39) avremo che, se n ≥ m: |(x|(Bn − Bm )y)|2 ≤ (x|(Bn − Bm )x)(y|(Bn − Bm )y) ≤ (x|K1 x)(y|K1 y) ≤ ||K1 ||2 ||x||2 ||y||2 . Quindi |(x|(Bn − Bm )y)|2 ≤ ||K1 ||2 ||x||2 ||y||2 . Se si pone x = (Bn − Bm )y e si prende l’estremo superiore sugli y ∈ H con ||y|| = 1, si ricava che ||Bn − Bm || ≤ ||K1 || . (3.40) Dalla (3.39) con y = (Bn − Bm )x e T = Bn − Bm si ricava che, per ogni x ∈ H, se n ≥ m: ||(Bn − Bm )x||4 = ((Bn − Bm )x|(Bn − Bm )x)2 ≤ (x|(Bn − Bm )x)((Bn − Bm )x|(Bn − Bm )2 x) . Per (3.40), l’ultimo termine è maggiorato da (x|(Bn − Bm )x)||Bn − Bm ||3 ||x||2 ≤ ||K1 ||3 ||x||2 [(x|Bn x) − (x|Bm x)] . Quindi: ||(Bn − Bm )x||4 ≤ ||K1 ||3 ||x||2 [(x|Bn x) − (x|Bm x)] . La successione non decrescente limitata di numeri positivi (x|Bk x) è necessariamente convergente, per cui è di Cauchy. Concludiamo che deve essere di Cauchy anche quella di vettori Bk x. Esisterà dunque il limite per k → +∞ di tale successione. Definiamo B : H 3 x 7→ lim Bn x . n→+∞ Si verifica facilmente che per costruzione B è lineare; inoltre soddisfa 0 ≤ (Bx|x) = (x|Bx) ≤ (x|K1 x) 1 Si osservi che, in particolare se ||x|| = 1, (x|An x) + ||A0 || ≥ (x|A0 x) + ||A0 ||, ma −||A0 || ≤ (x|A0 x) ≤ ||A0 || per (a) di Proposizione 3.8. Di conseguenza (x|An x) + ||A0 || ≥ 0 per ogni x tale che ||x|| = 1. Questo equivale a dire che (y|An y) + ||A0 ||(y|y) ≥ 0 per ogni y ∈ H, ossia An + ||A0 ||I ≥ 0. 82 dato che 0 ≤ (Bk x|x) = (x|Bk x) ≤ (x|K1 x) per ogni k ∈ N. Dato che K1 è limitato ed autoaggiunto (essendo positivo), da (a) di proposizione 3.8 concludiamo che B è limitato, valendo sup{|(x|Bx)| | x ∈ H , ||x|| = 1} ≤ sup{|(x|K1 x)| | x ∈ H , ||x|| = 1} = ||K1 || . B è anche autoaggiunto per (e) di proposizione 3.8. Quindi, A := B − ||A0 ||I è un operatore limitato, autoaggiunto e vale Ax = lim (Bn − ||A0 ||I)x = lim An x ; n→+∞ n→+∞ inoltre A ≤ K perché per ogni x ∈ H vale (x|An x) ≤ (x|Kx) per ipotesi e tale risultato permane prendendo il limite per n → +∞. 2 Come detto sopra, questo risultato ci permette di dimostrare l’esistenza delle radici quadrate degli operatori limitati positivi. Teorema 3.8. Sia H spazio di Hilbert √ e A ∈ B(H) un operatore positivo. Esiste un’unica radice quadrata positiva, che indichiamo con A. Inoltre: √ (a) A commuta con tutti gli operatori √ limitati che commutano con A; (b) se A è biettivo, è biettivo anche A. Nota. Come d’uso comune nella teoria degli operatori e delle algebre, dire che due operatori A e B commutano, ovvero che A commuta con B ovvero che B commuta con A, significa semplicemente che AB = BA . (3.41) Senza precisare null’altro si sottintende quindi che l’identità scritta valga sul dominio di A e su quello di B (che devono coincidere) ed inoltre Ran(A) deve essere incluso nel dominio di B e Ran(B) deve essere incluso nel dominio di A. È chiaro che tutto ciò è banalmente vero usando operatori A, B ∈ L(X), dove X è un qualsiasi spazio vettoriale. Prova del teorema 3.8. Senza limitare la generalità, possiamo assumere che ||A|| ≤ 1. Quindi poniamo A0 := I − A. Mostriamo prima di tutto che A0 ≥ 0 e ||A0 || ≤ 1. A0 ≥ 0 dato che (x|A0 x) = (x|x) − (x|Ax) ≥ ||x||2 − ||A||||x||2 , dove abbiamo usato il fatto che A = A∗ per cui (per (a) di proposizione 3.8) ||A|| = sup{|(z|Az)| | ||z|| = 1} e tenendo conto che |(z|Az)| = (z|Az) per la positività di A. Dato che la forma sesquilineare (x, y) 7→ (x|A0 y) è positiva, vale la disuguaglianza di Cauchy-Schwartz per cui: |(x|A0 y)|2 ≤ (x|A0 x)(y|A0 y) ≤ ||x||2 ||y||2 , dove abbiamo usato la positività di A = I − A0 e A0 nell’ultimo passaggio. Per y = A0 x otteniamo da sopra che ||A0 x|| ≤ ||x||, da cui infine si ha che ||A0 || ≤ 1 . 83 (3.42) Passiamo a definire una successione di operatori limitati Bn : H → H, per n = 1, 2, · · · , ponendo: B1 := 0 , 1 Bn+1 := (A0 + Bn2 ) . 2 (3.43) Usando (3.42) si verifica immediatamente, usando le proprietà della norma, che per ogni n come sopra, ||Bn || ≤ 1 . (3.44) Per induzione si verifica immediatamente che gli operatori Bn sono polinomi in A0 a coefficienti non negativi. Si tenga conto, qui e nel seguito, che tutti gli operatori Bk commutano tra di loro e commutano con A0 per costruzione. Similmente gli operatori Bn+1 − Bn risultano essere polinomi di A0 a coefficienti non negativi. Infatti dalla (3.43) si ha che: 1 1 1 2 2 Bn+1 − Bn = (A0 + Bn2 ) − (A0 + Bn−1 ) = (Bn2 − Bn−1 ) 2 2 2 ossia 1 Bn+1 − Bn = (Bn + Bn−1 )(Bn − Bn−1 ) . 2 Dall’ultima identità segue facilmente, per induzione, che gli operatori Bn+1 − Bn sono polinomi di A0 a coefficienti non negativi: si tenga conto del fatto che ogni Bn +Bn−1 è somma di polinomi a coefficienti non negativi per cui è un polinomio a coefficienti non negativi ed infine si usi il fatto che il prodotto di polinomi a coefficienti non negativi è un polinomio dello stesso genere. Dato che A0 ≥ 0, ogni suo polinomio a coefficienti non negativi è un operatore positivo: il 2n n n polinomio è somma di termini a2n A2n 0 che sono positivi (essendo a2n ≥ 0 e A0 = A0 A0 con 2n+1 n 2n n n che sono A0 autoaggiunto, per cui a2n (x|A0 x) = a2n (A0 x|A0 x) ≥ 0), e di termini a2n+1 A0 2n+1 n n n n x) = (x|A0 AA0 x) = (A0 x|A A0 x) ≥ 0). ancora positivi (perché a2n+1 ≥ 0 e (x|A0 Concludiamo che gli operatori limitati Bn e Bn+1 − Bn sono operatori positivi. In altre parole, la successione degli operatori limitati positivi (e quindi autoaggiunti) Bn è non decrescente. Questa successione è anche maggiorata dall’operatore I. Infatti, essendo Bn∗ = Bn ≥ 0 vale, per (a) di proposizione 3.8, (x|Bn x) = |(x|Bn x)| ≤ ||Bn ||||x||2 . Da (3.44) segue subito che Bn ≤ I. Possiamo allora applicare la proposizione 3.11 ottenendo che esiste un operatore limitato positivo B0 ≤ I tale che: B0 = s − lim Bn . n→+∞ Vale ulteriormente per la definizione di convergenza nella topologia operatoriale forte, per la commutatività degli operatori Bk e per la continuità di essi: B0 Bm x = ( lim Bn )Bm x = lim Bn Bm x = lim Bm Bn x = Bm lim Bn x = Bm B0 x . n→+∞ n→+∞ n→+∞ Quindi B0 commuta con ogni Bm e di conseguenza: B02 − Bn2 = (B0 + Bn )(B0 − Bn ) 84 n→+∞ da cui, per n → +∞ ||B02 x − Bn2 x|| ≤ ||B0 + Bn ||||B0 x − Bn x|| ≤ (||B0 || + ||Bn ||)||B0 x − Bn x|| ≤ 2||B0 x − Bn x|| → 0 . In altre parole B02 x = lim Bn2 x . n→+∞ Passando allora al limite nella relazione ottenuta da (3.43) 1 Bn+1 x = (A0 x + Bn2 x) , 2 troviamo, per ogni x ∈ H, 1 B0 x = (A0 x + B02 x) , 2 ossia 2B0 = A0 + B02 . Per concludere, esprimendo l’identità di sopra in termini di B := I − B0 , troviamo immediatamente che B 2 = I − A0 , cioè, B2 = A . Quindi B è una radice quadrata di A. Si osservi che B ≥ 0 dato che B0 ≤ I e B = I − B0 . Per cui B è una radice quadrata positiva di A. Ancora, se C è un operatore limitato che commuta con A allora commuterà con A0 e quindi con ogni Bn . Di conseguenza C commuterà con B0 e con B = I − B0 . Proviamo infine l’unicità della radice quadrata positiva. Sia V una radice quadrata positiva di A. La radice positiva B costruita sopra ha la proprietà di commutare con tutti gli operatori che commutano con A. Siccome AV = V 3 = V A , V e A commutano tra di loro e quindi B dovrà commutare con V . Fissiamo arbitrariamente x ∈ H e poniamo y := Bx − V x. Abbiamo allora: ||Bx − V x||2 = ([B − V ]x|[B − V ]x) = ([B − V ]x|y) = (x|[B ∗ − V ∗ ]y) = (x|[B − V ]y) (3.45) Mostriamo ora che, nelle nostre ipotesi, By = 0 e V y = 0 separatamente. Ciò conclude la prova perché, per l’arbitrarietà di x ∈ H, ||Bx − V x|| = 0 implica B = V . Vale (y|By) + (y|V y) = (y|[B + V ][B − V ]x) = (y|[B 2 − V 2 ]x) = (y|[A − A]x) = 0 , Poiché (y|V y) ≥ 0 e (y|By) ≥ 0 deve quindi essere (y|V y) = (y|By) = 0 . 85 Questo implica che V y = By = 0, infatti, se W è una radice quadrata positiva di V , essendo ||W y||2 = (W y|W y) = (y|W 2 y) = (y|V y) = 0 , dovrà essere W y = 0 e, a maggior ragione, V y = W (W y) = 0. Nello stesso modo si trova By = 0. √ Non resta che provare che A è biettivo se lo √ è A. Se A è biettivo, allora commuta con −1 anche A−1 ,√di conseguenza commuta con A √ −1 √ A. Si verifica allora immediatamente che −1 A A = AA è inverso destro e sinistro di A, che è di conseguenza biettivo. 2 Corollario. Sia H spazio di Hilbert; se A, B ∈ B(H) sono positivi e commutano tra di loro, allora il loro prodotto è un operatore limitato positivo. Prova. √ B commuta con A, perciò √ 2 √ √ √ √ (x|ABx) = (x|A B x) = (x| BA Bx) = ( Bx|A Bx) ≥ 0 . 2 Concludiamo la sezione mostrando che ogni operatore limitato A su uno spazio di Hilbert ammette una decomposizione in un prodotto di un operatore positivo P , univocamente determinato, e un operatore isometrico U definito sul rango di quello positivo ed ivi univocamente determinato: A = U P . Tale decomposizione si dice decomposizione polare dell’operatore e ha molteplici applicazioni in fisica matematica. Noi useremo la decomposizione polare di operatori limitati compatti nella prossima sezione. Una definizione preliminare è necessaria. Definizione 3.12. Siano H spazio di Hilbert e A ∈ B(H). L’operatore limitato, positivo e quindi autoaggiunto: √ |A| := A∗ A , (3.46) è detto valore assoluto di A. Nota. Valendo, per ogni x ∈ H: || |A| x||2 = (x| |A|2 x) = (x|A∗ Ax) = ||Ax||2 , otteniamo || |A| x|| = ||Ax|| , (3.47) Ker(|A|) = Ker(A) (3.48) da cui segue che e quindi |A| è iniettivo se e solo se lo è A. Un’altra utile proprietà è: Ran(|A|) = (Ker(A))⊥ , (3.49) che vale in quanto Ran(|A|) = ((Ran(|A|))⊥ )⊥ = (Ker(|A|∗ ))⊥ = (Ker(|A|))⊥ = (Ker(A))⊥ . Passiamo al teorema di decomposizione polare. 86 Teorema 3.9. Siano H spazio di Hilbert e A ∈ B(H). (a) Esiste una sola coppia di operatori P, U ∈ B(H) tali che valgano insieme le condizioni seguenti: (1) vale la decomposizione A = UP , (3.50) (2) P è positivo, (3) U è isometrico su Ran(P ) (ossia ||U x|| = ||x|| per ogni x ∈ Ran(P )), (4) Ker(U ) ⊃ Ker(P ) (o equivalentemente (4)’ Ker(U ) ⊃ Ker(A)). (b) Risulta essere P = |A| e quindi Ker(U ) = Ker(A) = (Ran(P ))⊥ . (c) Se A è biettivo, U coincide con l’operatore unitario A|A|−1 . Prova. (a) Cominciamo con il provare l’unicità. Se esiste la decomposizione (3.50) A = U P con P ≥ 0 (oltre che limitato) e U limitato, allora A∗ = P U ∗ , essendo P autoaggiunto perché positivo ((c) in teorema 3.8); quindi A∗ A = P U ∗ U P . (3.51) La condizione che U sia isometrico su Ran(P ) si scrive (U P x|U P y) = (P x|P y) per ogni x, y ∈ H, che equivale a (x|[P U ∗ U P − P 2 ]y) = 0 per ogni x, y ∈ H. Quindi P U ∗ U P = P 2 . Sostituendo in (3.51) concludiamo che deve essere P 2 = A∗ A e dunque, essendo P positivo ed estraendo l’unica radice quadrata positiva (teorema 3.8) ad ambo membri, troviamo P = |A|. Quindi, se esiste una decomposizione con i requisiti fissati in (a), necessariamente P = |A|. Mostriamo che anche U è fissato unicamente. Notiamo che H = Ker(P ) ⊕ (Ker(P ))⊥ ma, usando (d) di proposizione 3.6 e la (e) del teorema 3.1, vale anche (Ker(P ))⊥ = Ran(P ∗ ) = Ran(P ) per il fatto che P è autoaggiunto. Quindi H = Ker(P ) ⊕ Ran(P ). Per assegnare un operatore su H, è sufficiente assegnarlo su ciascuno dei due addendi della somma diretta scritta sopra: U = 0 su Ker(P ) nelle ipotesi del teorema, mentre la condizione U P x = Ax per ogni x ∈ H fissa univocamente U su Ran(P ). D’altra parte, essendo per ipotesi U limitato, lo sarà anche ristretto a Ran(P ). Un operatore limitato definito in un dominio denso è estendibile univocamente ad un operatore limitato definito sulla chiusura del dominio (vedi (3) e (4) in esercizi 2.1). Quindi, per le ipotesi fatte, U è in realtà fissato su tutto Ran(P ) e quindi su tutto H. La dimostrazione di unicità è conclusa; passiamo a quella di esistenza. In base a quanto visto sopra, è necessario, innanzi tutto, mostrare che la condizione U P = A con P = |A|, riscritta equivalentemente come U : |A|x 7→ Ax per ogni x ∈ H, definisce effettivamente un operatore, che indicheremo con U0 , su Ran(|A|). Perché tale funzione sia ben definita è necessario sufficiente che valga |A|x = |A|y ⇒ Ax = Ay, altrimenti non avremmo una funzione. Notiamo che, da (3.47), se |A|x = |A|y, allora Ax = Ay e quindi l’applicazione U0 : Ran(|A|) 3 |A|x 7→ Ax è ben definita (non è plurivoca). Il fatto che U0 sia lineare è ovvio per costruzione, come lo è il fatto che sia un’isometria, poiché U0 preserva le norme per (3.47) (si tenga conto di (1) in esercizi 3.2). Il fatto che U0 sia un’isometria su Ran(|A|) implica, per continuità, che si estenda in modo unico ad un’isometria sulla chiusura di Ran(|A|). Indichiamo 87 ancora con U0 tale estensione. Infine definiamo un operatore U : H → H tale che, rispetto alla somma diretta vista sopra H = Ker(|A|) ⊕ Ran(|A|), si decomponga in U Ker(|A|) := 0 e U Ran(|A|) := U0 . È immediato verificare che U ∈ B(H) e che U soddisfa (3.50) per costruzione. Infine vale Ker(U ) ⊃ Ker(|A|) per costruzione. Proviamo, per concludere, che i due nuclei in realtà coincidono. Ogni eventuale u con U u = 0 si decompone come u0 + x, con u0 ∈ Ker(|A|), su cui U si annulla, e x ∈ Ran(|A|), per cui deve valere U0 x = 0. Dato che su tale spazio U0 è isometrico, deve essere x = 0 e quindi u = u0 ∈ Ker(|A|). Quindi Ker(U ) ⊂ Ker(|A|) e, tenendo conto anche dell’altra inclusione, vale infine Ker(U ) = Ker(|A|) = Ker(A) per (3.48). (b) è già stato provato completamente provando (a). (c) Se A è iniettivo, usando (b), si trova che Ker(A) = Ker(U ) è banale e quindi U è iniettivo. D’altra parte, direttamente dalla decomposizione polare A = U P si vede che Ran(U ) ⊃ Ran(A) e pertanto, se A è suriettivo, deve esserlo U . Concludiamo che, se A è biettivo, U deve essere tale. In tal caso, per (b), U è un operatore isometrico suriettivo su Ran(P ) = (Ker(P ))⊥ = {0}⊥ = H ed è quindi unitario. Infine, da A = U |A|, essendo A e U biettivi, segue che |A| è biettivo e quindi possiamo scrivere: U = A|A|−1 . 2 Definizione 3.13. Siano H spazio di Hilbert e A ∈ B(H). Si dice decomposizione polare dell’operatore A la decomposizione A = UP , dove P, U ∈ B(H) soddisfano le proprietà: P è positivo, U è isometrico su Ran(P ) e Ker(U ) = Ker(P ). Un utile corollario del teorema di decomposizione polare è il seguente. Corollario. Nelle ipotesi del teorema 3.9, se U |A| = A è la decomposizione polare di A, vale l’identità: |A∗ | = U |A|U ∗ . (3.52) Prova. Da A = U |A| segue immediatamente che A∗ = |A|U ∗ = U ∗ U |A|U ∗ , dove si è tenuto conto del fatto che U ∗ U |A| = |A|, dato che U è isometrico su Ran(|A|). Quindi, per l’operatore autoaggiunto AA∗ vale: AA∗ = U |A|U ∗ U |A|U ∗ . Dato che U |A|U ∗ è evidentemente positivo, avremo, per l’unicità della radice quadrata: È √ |A∗ | = (A∗ )∗ A∗ = AA∗ = U |A|U ∗ . Questo prova la tesi. 2 88 3.6 La trasformata di Fourier-Plancherel. Introduciamo molto brevemente la trasformata di Fourier e di Fourier-Plancherel. Notazione 3.3. I punti di Rn saranno indicati con singole lettere e le componenti con la stessa lettera ed un indice, in tal modo x = (x1 , . . . , xn ), mentre dx denoterà l’ordinaria misura di Lebesgue in Rn . Diremo multindice ogni n-pla, α = (α1 , . . . , αn ) con αi = 0, 1, 2, . . . e indicheremo con |α| la P somma |α| := ni=1 αi . Useremo inoltre le seguenti notazioni: ∂xα := ∂ |α| , ∂xα1 1 · · · ∂xαnn e nello stesso modo M α (x) := xα1 1 · · · xαnn . Con D(Rn ) indicheremo lo spazio, anche indicato con Cc∞ (Rn ), delle funzioni a valori complessi infinitamente differenziabili con supporto compatto. Con S(Rn ) indicheremo lo spazio di Schwartz su Rn , ovvero lo spazio vettoriale complesso delle funzioni C ∞ (Rn ) a valori complessi che godono dell’ulteriore proprietà: per ogni f ∈ S(Rn ) e per ogni coppia di multindici α e β, esiste K < +∞ (dipendente da f , α e β!) tale che |M α (x)∂xβ f (x)| ≤ K, per ogni x ∈ Rn . (3.53) Le norme || ||1 , || ||2 e || ||∞ in questa sezione denoteranno rispettivamente la norma di L1 (Rn , dx), L2 (Rn , dx) e L∞ (Rn , dx) (vedi (6) e (8) in Esempi 2.1). Ovviamente D(Rn ) e S(Rn ) sono invarianti sotto l’azione degli operatori M α (x) (visto come operatore moltiplicativo) e ∂xα : funzioni di ciascuno dei due spazi rimangono nel rispettivo spazio quando trasformate sotto l’azione di M α (x) e ∂xα . È chiaro che D(Rn ) ⊂ Lp (R, dx) come sottospazio per ogni 1 ≤ p ≤ ∞ dato che i compatti su Rn hanno misura di Lebesgue finita e che ogni f ∈ D(Rn ) è continua e quindi limitata sui compatti. Vale anche che S(Rn ) ⊂ Lp (R, dx) per ogni 1 ≤ p ≤ ∞ come sottospazio. Infatti, se C ⊂ Rn è un compatto contenente l’origine, f ∈ S(Rn ) è limitata su C essendo ivi continua e, fuori da C, vale |f (x)| ≤ Cn |x|−n per ogni n = 0, 1, 2, 3, . . . pur di scegliere Cn ≥ 0 sufficientemente grande. In definitiva |f | è limitata su Rn e quindi appartiene a L∞ ma, per ogni p ∈ [1, +∞), è anche limitata da una funzione che appartiene a Lp : tale funzione è costante su C e vale Cn /|x|n con n > 1/p fuori da C. Oltre al fatto ovvio che D(Rn ) ⊂ S(Rn ), ricordiamo un fatto notissimo (indipendente dai risultati che troveremo in questa sezione) che sarà utile tra poco [KiGv83]: gli spazi D(Rn ) e S(Rn ) sono sottospazi densi di ogni Lp (R, dx) per ogni 1 ≤ p < ∞. Vale infine il seguente importante Lemma la cui dimostrazione si può trovare in [Bre86] (Corollario IV.24) ed è indipendente dai risultati che troveremo in questa sezione. 89 Lemma 3.2. Se f ∈ L1 (Rn , dx) e Z f (x)g(x) dx = 0 Rn per ogni g ∈ D(Rn ) , allora f (x) = 0 quasi ovunque rispetto alla misura di Lebesgue dx su Rn . Definizione 3.14. Le trasformazioni lineari da L1 (Rn , dx) in L∞ (Rn , dx) definite da: eik·x f (x) dx , per ogni f ∈ L1 (Rn , dx) e ogni k ∈ Rn ; n/2 Rn (2π) Z e−ik·x (F− g)(x) := g(k) dk , per ogni g ∈ L1 (Rn , dk) e ogni x ∈ Rn n/2 n (2π) R Z (Ff )(k) := (3.54) (3.55) sono dette rispettivamente: trasformata di Fourier e trasformata inversa di Fourier. Osservazioni. (1) Si osservi che dk indica comunque la misura di Lebesgue in Rn . Abbiamo usato un nuovo nome per la variabile di Rn (k invece di x) nell’esplicitare la trasformata inversa di Fourier solo perché tale notazione è quella tradizionale e ciò si rivelerà comodo nei calcoli. (2) È ovvio che, per le proprietà elementari dell’integrale, Z Z Z dx ||f ||1 dxn dx ik·x ik·x |(Ff )(k)| ≤ = |f (x)| = ≤ |e | |f (x)| e f (x) n/2 n/2 n/2 Rn (2π) (2π) (2π) (2π)n/2 Rn Rn e similmente |(F− g)(x)| ≤ ||g||1 /(2π n/2 ) per ogni x, k ∈ Rn , per cui ha senso definire la trasformata di Fourier e la trasformata inversa di Fourier come operatori a valori almeno in L∞ (Rn , dx). Vediamo nel seguito solo le proprietà più immediate della trasformata di Fourier che si connettono più direttamente con la trasformazione di Fourier-Plancherel. Tralasceremo importanti risultati come la continuità rispetto alla topologia naturale indotta da seminorme nello spazio di Schwartz, per i quali si rimanda a qualsiasi testo di teoria delle funzioni ed analisi funzionale oppure teoria delle distribuzioni [Vla81]. Proposizione 3.12. La trasformazione di Fourier e la trasformazione inversa di Fourier godono delle seguenti proprietà. (a) Sono continue rispetto alle norme naturali del dominio e codominio, valendo le disuguaglianze ||f ||1 ||g||1 ||Ff ||∞ ≤ e ||F− g||∞ ≤ . n/2 (2π) (2π)n/2 (b) Lo spazio di Schwartz è invariante sotto F e F− , cioè F(S(Rn )) ⊂ S(Rn ) e F− (S(Rn )) ⊂ S(Rn ). 90 (c) Le due trasformazioni ristrette allo spazio invariante S(Rn ) sono una l’inversa dell’altra: se f ∈ S(Rn ), allora Z eik·x g(k) = f (x) dx n/2 Rn (2π) se e solo se Z f (x) = Rn e−ik·x g(k) dk (2π)n/2 (d) Le due trasformazioni ristrette allo spazio invariante S(Rn ) sono isometriche rispetto al semi-prodotto scalare di L2 (Rn , dxn ): se f1 , f2 , g1 , g2 ∈ S(Rn ), allora Z Z Rn e (Ff1 )(k)(Ff2 )(k)dk = Z Rn Rn f1 (x)f2 (x)dx Z (F− g1 )(x)(F− g2 )(x)dx = Rn g1 (k)g2 (k)dk . (e) Le due trasformazioni individuano trasformazioni limitate da L1 (Rn , dx) a C0 (Rn ) (lo spazio delle funzioni continue che tendono a zero all’infinito (4) in Esempi 2.1) e pertanto vale il Lemma di Riemann-Lebesgue: per ogni f ∈ L1 (Rn , dx), (F) (k) → 0 per |x| → +∞ e vale l’analoga proprietà per F− . (f ) Le due trasformazioni, definite su L1 (Rn , dx), sono iniettive. Osservazione. Riguardo al punto (f), si può dimostrare [Rud91] ancora più fortemente che se f ∈ L1 (Rn , dx) è tale che Ff ∈ L1 (Rn , dk), allora vale anche F− (Ff ) = f . È valido lo stesso risultato scambiando il ruolo di F e F− . Prova della proposizione 3.12. (a) è già stata dimostrata nella (2) di note seguenti la definizione 3.14. (b) Diamo la prova per F; per F− si può procedere analogamente. Poniamo Z g(k) := Rn eik·x f (x) dx (2π)n/2 Si verifica facilmente che il secondo membro può essere derivato in k tramite un operatore ∂kα facendo passare la derivata sotto il segno di integrale. Infatti risulta immediatamente che α ik·x f (x) = i|α| M α (x)eik·x f (x) ≤ |M α (x)f (x)| . ∂k e La funzione x 7→ |M α (x)f (x)| è in L1 in quanto f ∈ S(Rn ). Dato che il modulo della derivata dell’integrando è maggiorato uniformemente da una funzione positiva ed integrabile, noti 91 teoremi sul passaggio del simbolo di derivata sotto quello di integrale (basati sul teorema della convergenza dominata di Lebesgue) permettono di concludere che ∂kα g(k) =i |α| Z Rn eik·x M α (x)f (x) dx (2π)n/2 (3.56) Notando che f si annulla più rapidamente di ogni potenza inversa di |x| per |x| → +∞, si trova che: ik·x Z e β |β| β f (x) dx M (k)g(k) = (−i) ∂x (2π)n/2 Rn e quindi, usando l’integrazione per parti, M β (k)g(k) = i|β| Z Rn eik·x β ∂ f (x) dx . (2π)n/2 x (3.57) Quindi, inserendo ∂kα g al posto della funzione g in (3.57) e tenendo conto di (a), si ha: |M β (k)∂kα g(k)| ≤ ∂ β (M α f ) , 1 per ogni k ∈ Rn . Essendo finito il secondo membro, in quanto f ∈ S(Rn ), ed essendo α e β arbitrari, concludiamo che g ∈ S(Rn ). (c) Le identità (3.56) e (3.57) si scrivono in altro modo come ∂ α F = i|α| FM α , |β| M F = i β (3.58) F∂ , β (3.59) dove F è in realtà la restrizione della trasformata di Fourier a S(Rn ). Osservando che Fh = F− h per ogni h ∈ S(Rn ), si ricava facilmente: ∂ α F− = (−1)|α| i|α| F− M α , |β| |β| M F− = (−1) i β F− ∂ . β (3.60) (3.61) Dalle (3.58), (3.59), (3.60) e (3.61), troviamo in particolare che FF− M α = M α FF− , (3.62) F− F M (3.63) α = M F− F , α dove M α è pensato come operatore moltiplicativo (M α f )(x) := M α (x)f (x), e anche FF− ∂ α = ∂ α FF− , (3.64) F− F ∂ (3.65) α = ∂ F− F . α 92 Mostreremo ora che, in virtù di tali relazioni di commutazione, gli operatori J := FF− e J− := F− F devono essere l’operatore identità di S(Rn ). Per prima cosa proviamo che, fissati x0 ∈ Rn e f ∈ S(Rn ), il valore di (Jf )(x0 ) dipende solo da f (x0 ). Se f ∈ S(Rn ) possiamo sempre scrivere f (x) = f (x0 ) + Z 1 df (x0 + t(x − x0 )) dt 0 dt = f (x0 ) + n X (xi − x0i )gi (x) , i=1 dove le funzioni gi (che sono C ∞ (Rn ), come si verifica facilmente) sono definite da gi (x) := ∂ ∂xi Z 1 f (x0 + t(x − x0 ))dt 0 e dunque, se f1 , f2 ∈ S(Rn ) e f1 (x0 ) = f2 (x0 ), risulta f1 (x) = f2 (x) + n X (xi − x0i )hi (x) , (3.66) i=1 dove, per differenza, la funzione x 7→ ni=1 (xi − x0i )hi (x) e quindi le funzioni hi sono in S(Rn ). Applicando J ad ambo i membri di (3.66) e tenendo conto del fatto che J commuta con i polinomi in x per (3.62), otteniamo P (Jf1 )(x) = (Jf2 )(x) + n X (xi − x0i )(Jhi )(x) . i=1 Prendendo x = x0 , si vede che (Jf1 )(x0 ) = (Jf2 )(x0 ) sotto l’ipotesi iniziale di f1 (x0 ) = f2 (x0 ). Quindi, come dicevamo, (Jf )(x0 ) è una funzione soltanto di f (x0 ). Tale funzione deve anche essere lineare, dato che J è lineare per costruzione. Ne consegue che sarà (Jf )(x0 ) = j(x0 )f (x0 ), dove j è una funzione su Rn a valori in C. Per l’arbitrarietà di x0 , abbiamo provato che J agisce come la moltiplicazione per una funzione j. Si osservi che tale funzione deve essere C ∞ . Per provare ciò, si scelga f ∈ S(Rn ) che valga costantemente 1 in un intorno I(x0 ) di x0 . Se x ∈ I(x0 ), vale (Jf )(x) = j(x). Dato che il primo membro è C ∞ (I(x0 )), lo deve essere anche il secondo. Valendo ciò nell’intorno di ogni punto di Rn , vale anche j ∈ C ∞ (Rn ). La (3.64) implica allora che, per ogni f ∈ S(Rn ) ed ogni x ∈ Rn : j(x) ∂ ∂ f (x) = j(x)f (x) . i ∂x ∂xi Scegliendo, come prima, f con valore costantemente uguale a 1 in un aperto, si ha dall’identità di sopra che in quell’aperto tutte le derivate di j devono annullarsi. Dato che ciò vale nell’intorno di ogni punto di Rn che è connesso, la funzione continua j deve essere una funzione costante su tutto Rn . Il valore della costante ovviamente non dipende dall’argomento di J e quindi può essere calcolato valutando J su una funzione arbitraria di S(Rn ). Un utile esercizio è quello di 2 calcolare J sulla funzione x 7→ e−x e si vede che il valore della costante è proprio 1. La prova per J− si esegue nello stesso modo. 93 (d) Usando (c) la tesi si prova immediatamente. Facciamo la dimostrazione per F; quella per F− è essenzialmente la stessa. Se f1 , f2 ∈ S(Rn ), poniamo, per i = 1, 2: Z gi (k) := Rn eik·x fi (x) dx . (2π)n/2 È immediato verificare che, nelle nostre ipotesi, possiamo usare il teorema di Fubini-Tonelli, ottenendo Z Z Rn g1 (k)g2 (k)dk = Z Rn g1 (k) Rn eik·x f2 (x)dxdk = (2π)n/2 Z Rn ×Rn eik·x g1 (k)f2 (x)dx ⊗ dk . (2π)n/2 Usando nuovamente il teorema di Fubini-Tonelli per l’ultimo integrale opportunamente riscritto, abbiamo Z Rn Z g1 (k)g2 (k)dk = Rn ×Rn e−ik·x g1 (k)f2 (x)dx ⊗ dk = (2π)n/2 Z Rn Z f2 (x) Rn e−ik·x g1 (k)dkdx (2π)n/2 Z = Rn f1 (x)f2 (x)dx , dove abbiamo usato il risultato in (c). Questa è la tesi che volevamo provare. (e) Facciamo la dimostrazione per F, p per F− la dimostrazione è analoga. Si osservi anche che entrambe le trasformazioni sono ben definite su L1 (Rn , dx) dato che l’integrale è invariante ||f ||1 quando alteriamo le funzioni su insiemi di misura di Lebesgue nulla. La stima ||Ff ||∞ ≤ (2π) n/2 assicura che l’applicazione lineare F : S(Rn ) → S(Rn ) ⊂ C0 (Rn ) econtinua quando il dominio è dotato della norma L1 e il codominio della norma || · ||∞ . Dato che S(Rn ) è denso in L1 nella norma detta e il codominio è completo rispetto alla seconda norma, la trasformata di Fourier inizialmente definita su S(Rn ) si estende per continutà unicamente (e quindi coincide con la trasf. lineare già definita su L1 (Rn , dx)) ad una trasformazione lineare limitata da L1 (Rn , dx) a C0 (Rn ) che conserva la stessa norma (cfr (2) e (3) in Esercizi 2.1). Dato che, se f ∈ L1 , Ff ∈ C0 (Rn ), per ogni > 0 esiste un compatto K ⊂ Rn tale che |(Ff )(k)| < se k 6∈ K . Scegliendo per ogni > 0 una palla di raggio r centrata nell’origine tanto grande da includere K , concludiamo che, per ogni > 0 esiste un reale r > 0 tale che |(Ff )(k)| < se |k| > r . (f) Facciamo la dimostrazione per F, p per F− la dimostrazione è analoga. Dato che l’operatore F è lineare, è sufficiente dimostrare che se Ff è la funzione nulla, allora f è quasi ovunque nulla. Si supponga pertanto che: Z Rn eik·x f (x) dx = 0 , (2π)n/2 per ogni k ∈ Rn . Se g ∈ S(Rn ), applicando il teorema di Fubini-Tonelli, abbiamo che: Z Z Z Z eik·x eik·x 0= g(k) f (x) dx dk = g(k) dk f (x) dx . n/2 n/2 Rn Rn (2π) Rn Rn (2π) 94 Dato che F è biettiva su S(Rn ), quanto ottenuto è equivalente a dire che (notare che ψf ∈ L1 (Rn , dx) per ogni ψ ∈ S(Rn ) dato che ψ è limitata): Z ψ(x)f (x) dx = 0 Rn per ogni ψ ∈ S(Rn ). Dato che D(Rn ) ⊂ S(Rn ), il lemma 3.2 implica che f è nulla quasi ovunque. 2 Passiamo alla trasformata di Fourier-Plancherel. Dato che S(Rn ) è denso in L2 (Rn ), passando alle classi di equivalenza di funzioni si potrà dire che S(Rn ) individua un sottospazio denso, che indicheremo ancora con lo stesso simbolo S(Rn ), nello spazio di Hilbert L2 (Rn ). Gli operatori F e F− possono essere pensati come definiti su tale sottospazio denso in L2 (R, dx). Il punto (d) della proposizione 3.12 implica in particolare che tali operatori sono limitati con norma pari a 1, dato che sono operatori isometrici. Come sappiamo dall’esercizio (3) di esercizi 2.1, F e F− individueranno univocamente due operatori lineari limitati su tutto L2 (Rn , dx). Per esempio, l’operatore che estende F su L2 (Rn , dx) è definito come, se f ∈ L2 (Rn , dx), b := lim Ff , Ff n n→+∞ dove {fn }n∈N ⊂ S(Rn ) è una qualunque successione che converge a f nella topologia di L2 (Rn , dx) (come provato nell’esercizio citato sopra, il limite esiste sempre e non dipende dalla successione b continuerà a conservare il scelta). Per la continuità del prodotto scalare, l’operatore esteso F 2 2 2 b sarà iniettivo su L (Rn , dx). In realtà sarà anche prodotto scalare di L (R , dx) e pertanto F b possiamo similmente cosuriettivo per il seguente motivo elementare. Accanto all’operatore F 2 n n Ó struire l’operatore che estende su L (R , dx) la trasformata inversa di Fourier F − . Su S(R , dx) vale FF− = IS(Rn ) Passando alle estensioni su L2 per linearità e continuità, tenendo conto del fatto che l’unica estensione lineare dell’identità su S(Rn , dx) (costruita con la procedura generale detta sopra) è l’identità su L2 (Rn , dx), otteniamo che deve valere bF b =I, F − b dove I è l’identità su L2 (Rn , dx). Questo fatto implica immediatamente la surgettività di F. b : L2 (Rn , dx) → L2 (Rn , dx) che estende per linearità Definizione 3.15 L’unico operatore F e continuità la trasformata di Fourier ristretta a S(Rn ) è detto trasformazione di FourierPlancherel. b : L2 (Rn , dx) → Teorema 3.10 (di Plancherel). La trasformazione di Fourier-Plancherel F L2 (Rn , dx) è un operatore lineare biettivo ed isometrico. 95 Prova. La dimostrazione è stata data immediatamente sopra la definizione 3.15. 2 b Rimane aperta una questione. Se f ∈ L1 (Rn , dx) ∩ L2 (Rn , dx) (ma f 6∈ S(Rn )), a priori Ff e Ff b non abbiamo esteso F partendo da L1 (Rn , dx), ma siamo parsono diversi, perché per definire F n titi dal suo sottospazio S(R ). Questa era l’unica possibilità, visto che L1 (Rn , dx) 6⊂ L2 (Rn , dx). La seguente proposizione fa luce sulla questione, dando anche un metodo pratico per calcolare la trasformata di Fourier-Plancherel in termini di limiti di quella di Fourier. Nota. Ricordiamo che se K ⊂ Rn è un insieme di misura finita ed in particolare se K è un compatto (i compatti hanno misura di Lebesgue finita), allora: (1) L2 (K, dx) ⊂ L1 (K, dx); (2) se {fn }n∈N ⊂ L2 (K, dx) converge nella norma || ||2 a f ∈ L2 (K, dx) allora converge alla stessa funzione anche nella norma || ||1 ; (3) L∞ (K, dx) ⊂ Lp (K, dx) per 1 ≤ p < ∞; (4) se {fn }n∈N ⊂ L∞ (K, dx) converge nella norma || ||∞ a f ∈ L∞ (K, dx), allora converge alla stessa funzione anche nella norma || ||p . Queste quattro affermazioni si provano immediatamente come segue, tenendo conto, per le prime due, che la funzione che vale costantemente 1 su un compatto, che quindi ha misura finita, è integrabile. Per la prima affermazione si osservi che vale 2|f (x)| ≤ |f (x)|2 + 1 , per cui l’integrale del primo membro è maggiorato da quello del secondo. Per la seconda affermazione si noti che, dalla disuguaglianza di Cauchy-Schwartz Z 2 |g(x)| 1 dx ≤ Z K 2 |g(x)| dx K Z 1dx , K sostituendo f (x) − fn (x) a g(x) si ha la prova della seconda affermazione. Riguardo alla terza e quarta affermazione è sufficiente notare che, per la stessa definizione di integrale di Lebesgue: Z K |g|p dx ≤ ess sup |g|p K Z dx = (||g||∞ )p K Z dx K per ogni funzione misurabile g definita su K. Proposizione 3.13. La trasformazione di Fourier-Plancherel e quella di Fourier godono delle seguenti proprietà. (a) Se f ∈ L2 (Rn , dx) ∩ L1 (Rn , dx), la sua trasformata di Fourier-Plancherel si riduce alla trasformata di Fourier Ff calcolata direttamente con la formula integrale (3.54). (b) Se f ∈ L2 (Rn , dx), la sua trasformata di Fourier-Plancherel può essere calcolata come F̂f = lim gn n→+∞ 96 dove il limite è nel senso di L2 (Rn , dk), Z gn (k) := Kn eik·x f (x)dx , (2π)n/2 (3.67) essendo gli insiemi Kn ⊂ Rn tutti compatti e tali che Km+1 ⊃ Km per m = 1, 2, . . ., con n ∪∞ m=1 Km = R . Prova. (a) Cominciamo a provare la tesi per le funzioni f ∈ L2 (Rn , dx) tali che f sia differente da 0 su un insieme di misura nulla fuori da un compatto K0 . In questo caso f appartiene anche a L1 (Rn , dx). Sia quindi {sn } ⊂ S(Rn ) una successione di funzioni che tendono a f nella norma di L2 (Rn , dx). Se B e B 0 sono due palle aperte di raggio finito tali che B ⊃ B 0 ⊃ B 0 ⊃ K0 , possiamo costruire una funzione h ∈ D(Rn ) tale da valere costantemente 1 su B 0 e da annullarsi fuori da B. È chiaro che se fn := h · sn , la successione {fn } è costituita da funzioni di D(Rn ), e quindi S(Rn ), con supporti contenuti nel compatto K := B. Quindi tutte le fn sono anche in L1 (Rn , dx) e la successione {fn } tende a f sia nella norma di L2 (Rn , dx) che in quella di L1 (Rn , dx). Per definizione, valendo fn → f nella norma || ||2 , sarà ||Ffn − F̂f ||2 → 0 (3.68) per n → +∞. D’altra parte, dato che fn → f anche nella norma || ||1 , per (a) di proposizione 3.12 ||Ffn − Ff ||∞ → 0 per n → +∞. Dato che, sugli insiemi di misura finita, la convergenza nella norma || ||∞ implica quella nella norma || ||2 , avremo che ||Ffn − Ff ||2 → 0 (3.69) b = Ff . e quindi, valendo (3.68) e per l’unicità del limite, dovrà essere Ff 2 n 1 n Supponiamo ora che f ∈ L (R , dx)∩L (R , dx) senza altre restrizioni. Consideriamo una classe di compatti {Kn } che soddisfino le ipotesi nel punto (b). Definiamo le funzioni fn := χKn · f , dove χE è la funzione caratteristica dell’insieme E (definita in modo che χE (x) = 0 se x 6∈ E e χE (x) = 1 se x ∈ E). È chiaro che vale fn → f puntualmente per n → +∞. Inoltre |f (x) − fn (x)|p ≤ |f (x)|p per p = 1, 2, . . .. Allora, per il teorema della convergenza dominata di Lebesgue, fn → f per n → +∞ in particolare rispetto alla norma || ||1 e a quella || ||2 . D’altra parte, per quanto dimostrato sopra, b . Ffn = Ff n Quindi, per (a) di proposizione 3.12, troviamo che ||Ff − Ffn ||∞ → 0 ed allo stesso tempo b − Ff || → 0. Questi fatti varranno anche per le funzioni che si ottengono vale anche ||Ff n 2 b , Ff , Ff ad un qualsiasi compatto K. Tenendo conto che per funzioni nulle restringendo Ff n fuori da un compatto la convergenza uniforme implica quella in L2 , si ha che se x appartiene b )(x) quasi ovunque. Ma ogni x ∈ Rn appartiene ad un ad un compatto qualsiasi, (Ff )(x) = (Ff b come elementi di L2 (Rn , dx). compatto, per cui Ff = Ff 97 (b) La prova è stata data nella parte finale della dimostrazione del punto (a). 2 Esempi 3.4 (1) Un fatto piuttosto importante che distingue nettamente lo spazio D(Rn ) da S(Rn ) è che il primo spazio, al contrario del secondo, non è invariante sotto la trasformazione di Fourier (e la trasformata inversa di Fourier). Infatti vale il seguente risultato: se f ∈ D(Rn ), allora Ff ∈ S(Rn ), ma se Ff ∈ D(Rn ), allora f e Ff sono la funzione nulla. Lo stesso fatto vale per la trasformata inversa di Fourier. La prova è semplice; la svolgiamo per F, ma la stessa prova vale anche per F− . Se vale Z g(k) = Rn eip·x f (x) dx , (2π)n/2 dove f ha supporto compatto, allora l’integrale di sopra converge anche per k ∈ Cn . Inoltre, facendo uso del teorema della convergenza dominata di Lebesgue, si può far passare la derivata nelle componenti ki di k, e nelle loro parti reale ed immaginaria, sotto il segno di integrale. Dato che k 7→ eik·x è analitica (cioè analitica in ogni variabile ki separatamente), soddisferà le condizioni di Cauchy-Riemann in ogni variabile ki . Di conseguenza tali condizioni saranno soddisfatte anche per la funzione g in ogni variabile ki . Si conclude che g è una funzione analitica su tutto Cn . La restrizione di g ad Rn definirà, tramite la parte reale e quella immaginaria, due funzioni analitiche di variabile reale su tutto Rn . Se g ha supporto compatto, esisterà un aperto non vuoto di Rn in cui Re g e Im g si annullano. È un fatto ben noto nella teoria delle funzioni analitiche (reali di variabile reale) che se una funzione analitica definita su un aperto connesso (in questo caso tutto Rn ) si annulla su un aperto non vuoto incluso nel suo dominio, allora si annulla ovunque nel dominio. Dobbiamo quindi concludere che, nelle nostre ipotesi su f , se g ha supporto compatto, essa deve necessariamente essere la funzione nulla. Tale dovrà anche essere f , in quanto F è invertibile su S(Rn ). (2) Un fatto connesso con (1) è il noto teorema di Paley-Wiener (vedi per es. [KiGv83]): Teorema (di Paley-Wiener). Sia a > 0 e si consideri L2 ([−a, a], dx) come sottospazio di L2 (R, dx). Lo spazio F̂(L2 ([−a, a], dx)) contiene tutte e sole le funzioni g = g(k) tali che ciascuna di esse possa essere estesa analiticamente ed univocamente a tutto il piano complesso nella variabile k ∈ C in una funzione analitica che soddisfa |g(k)| ≤ Ce2πa|Imk| , per ogni k ∈ C per qualche costante C ≥ 0 dipendente da g. Visto che deve essere F̂(L2 ([−a, a], dx)) ⊂ L2 (R, dk) per il teorema di Plancherel, il teorema di Paley-Wiener implica che le funzioni analitiche g che sono limitate secondo la disuguaglianza di sopra per qualche costante C ≥ 0, individuano elementi di L2 (R, dk) quando k è ristretta a R. Per concludere, consideriamo lo spazio L2 ((a, b), dx), dove −∞ ≤ a < b ≤ +∞ e dx denota l’usuale misura di Lebesgue su R. Sussiste la seguente utilissima proposizione usata in (4) di 98 esempi 3.2 per costruire basi Hilbertiane che deriva dalla teoria della trasformata di FourierPlancherel. Proposizione 3.14. Sia f : (a, b) → C misurabile tale che (1) l’insieme {x ∈ (a, b) | f (x) = 0} ha misura nulla, (2) esistono C, δ > 0 per cui |f (x)| < Ce−δ|x| per ogni x ∈ (a, b). In questo caso lo spazio lineare finitamente generato da tutte le funzioni x 7→ xn f (x) := fn (x) per n = 0, 1, 2, . . . è denso in L2 ((a, b), dx). Prova Sia S := {fn }n∈N . È sufficiente provare che S ⊥ = {0} dato che è S ⊥ ⊕ < S > = L2 ((a, b), dx) per il teorema 3.1. Sia allora h ∈ L2 ((a, b), dx) tale che Z b xn f (x)h(x)dx = 0 a per ogni n = 0, 1, 2, . . .. Possiamo estendere la funzione h a tutta la retta reale definendola nulla fuori da (a, b). La condizione di sopra si riscrive Z xn f (x)h(x)dx = 0 , (3.70) R per ogni n = 0, 1, 2, . . .. Valgono inoltre i seguenti fatti: (i) f · h ∈ L1 (R, dx): infatti entrambe le funzioni sono in L2 (R, dx), per cui il loro prodotto è in L1 (R, dx); (ii) f · h ∈ L2 (R, dx), perché |f (x)|2 < C 2 e−2δ|x| < C 2 < +∞ e |h|2 è integrabile per ipotesi; 0 (iii) La funzione che manda x ∈ R in eδ |x| f (x)h(x) è in L1 (R, dx) per ogni δ 0 < δ. Infatti, essendo 0 0 0 x 7→ |eδ |x| f (x)| ≤ Ce−(δ−δ )|x| , la funzione x 7→ eδ |x| f (x) è in L2 (R, dx); inoltre h ∈ L2 (R, dx) per ipotesi, per cui il loro prodotto è in L1 (R, dx). Per (i) possiamo calcolare la trasformata di Fourier Z g(k) = R eik·x √ f (x)h(x) dx . 2π Questa coinciderà con la trasformata di Fourier-Plancherel di f · h per i punti (i) e (ii) insieme, tenuto conto di (a) della proposizione 3.13. Per (iii), se k è complesso e |Imk| < δ, la funzione g = g(k) di sopra è ben definita ed analitica nella banda aperta B ⊂ C definita da Rek ∈ R, |Imk| < δ; la prova si costruisce analogamente a quanto fatto nell’esempio (1). Usando il teorema della convergenza dominata di Lebesgue e passando sotto il segno di integrale l’operatore di derivazione, è infine facile provare che, per ogni n = 0, 1, . . ., dn g in |k=0 = √ n dk 2π Z xn f (x)h(x)dx . R Tutte queste derivate sono nulle per (3.70), di conseguenza lo sviluppo di Taylor di g nell’origine è nullo e quindi g si annulla in un disco aperto contenuto nella banda B. Essendo g analitica, si annullerà identicamente nell’aperto connesso B ed in particolare sull’asse k reale. Quindi, 99 in particolare, avremo che la trasformata di Fourier-Plancherel della funzione f · h è il vettore nullo di L2 (R, dk). Dato che la trasformata di Fourier-Plancherel è una trasformazione unitaria dobbiamo concludere che f · h = 0 quasi ovunque su R ed in particolare su (a, b) dove per ipotesi f 6= 0 quasi ovunque. Ma allora deve essere h = 0 quasi ovunque su (a, b), ovvero ogni h ∈ S ⊥ coincide con l’elemento nullo di L2 ((a, b), dx). Questo conclude la prova. 2 100 Capitolo 4 Proprietà elementari degli operatori compatti, di Hilbert-Schmidt e di classe traccia. In questo capitolo introdurremo alcuni tipi di operatori che saranno necessari quando definiremo il concetto di stato quantistico. Tali operatori sono noti in letteratura come operatori di classe traccia oppure operatori nucleari. Si tratta di operatori limitati definiti su uno spazio di Hilbert che ammettono traccia. Tali operatori giocano un ruolo fondamentale nelle teorie fisiche in quanto, per il celebre teorema di Gleason, che avremo occasione di discutere più avanti, rappresentano gli stati quantistici. Purtroppo, tali operatori sono poco discussi nella letteratura matematica elementare a dispetto della loro importanza in fisica, pertanto ci dilungheremo un poco sulle loro notevoli proprietà . Per arrivare a definirli è necessario introdurre qualche nozione in più riguardante in particolare gli operatori compatti, detti anche completamente continui, che rivestono una notevole importanza in vari rami della matematica e delle applicazioni alla fisica, indipendentemente dalle teorie quantistiche. Nella prima sezione del capitolo presenteremo la nozione generale di operatore compatto su uno spazio normato, discutendone molto brevemente le proprietà generali. Proveremo anche il classico risultato riguardante la non compattezza della palla unitaria in dimensione infinita. Nella seconda sezione specializzaeremo la definizione al caso di spazi di Hilbert, in riferimento, in particolare agli spazi L2 , sui quali gli operatori compatti (come quelli di Hilbert-Schmidt) ammettono una certa rappresentazione integrale. Mostreremo che l’insieme degli operatori compatti individua uno ∗-ideale bilatero nella C ∗ algebra degli operatori limitati sullo spazio di Hilbert. In questa sede enunceremo e dimostreremo il celebre teorema di Hilbert sollo sviluppo spettrale degli operatori compatti, che può essere considerato come il precursore di tutti i teoremi di decomposizione spettrale. La quarta sezione riguarderà lo ∗-ideale bilatero degli operatori di Hilbert-Schmidt e le loro proprietà più elementari. In particolare mostreremo che lo spazio degli operatori di H-S è a sua volta uno spazio di Hilbert. 101 L’ultima sezione concernerà l’introduzione dello ∗-ideale bilatero degli operatori di classe traccia e la dimostrazione delle proprietà più importanti (e più utili in fisica) di tali operatori. In particolare dimostreremo la proprietà di ciclicità della traccia. 4.1 Generalità sugli operatori compatti in spazi normati, di Banach e Hilbert. Ricordiamo che in uno spazio topologico un insieme compatto K è definito dalla proprietà seguente: K è detto compatto se da ogni ricoprimento di aperti di K (cioè una classe di aperti {Ai }i∈I con ∪i∈I Ai ⊃ K) è possibile estrarre un sotto ricoprimento finito (ossia esiste un insieme finito J ⊂ I tale che ∪i∈J Ai ⊃ K). Una nozione connessa è quella di compattezza sequenziale: K è detto sequenzialmente compatto se per ogni successione {xn }n∈N ⊂ K esiste una sotto successione {xnp }p∈N convergente ad un punto di K. Ricordiamo che i sottoinsiemi chiusi dei compatti sono compatti e, negli spazi di Hausdorff (in particolare gli spazi vettoriali normati, come gli spazi di Hilbert), i compatti sono chiusi. Negli spazi topologici che siano anche spazi metrici (e quindi ancora in particolare gli spazi vettoriali normati, come gli spazi di Hilbert), la proprietà di compattezza è equivalente a quella di compattezza sequenziale. Un’altra proprietà utile che vale in spazi metrici è la seguente. Proposizione 4.1. Sia (X, || ||) spazio normato. Se A ⊂ X è tale che ogni successione di punti di A ammette una sotto successione convergente (non necessariamente in A), allora A è compatto. Prova. L’unica cosa da mostrare è che se {yn } ⊂ A, allora esiste una sotto successione di {yn } che converge (in A, essendo esso chiuso). Evidentemente, ci saranno delle successioni, una per (k) (k) ogni k, {xn } ⊂ A, con xn → yk per n → +∞. Fissando k e prendendo un corrispondente nk sufficientemente grande, possiamo allora costruire termine per termine una nuova successione (k) {zk := xnk } ⊂ A tale che ||yk −zk || < 1/k. Nelle ipotesi fatte su A, esisterà una sotto successione di {zk }, {zkp }, che converge a qualche y ∈ A. Si ha: ||ykp − y|| ≤ ||ykp − zkp || + ||zkp − y|| . Dato che 1/kp → 0 per p → +∞, fissato > 0 esisterà P tale che, se p > P , allora ||zkp −y|| < /2 insieme a 1/kp < /2, per cui ||ykp − y|| < . In altre parole {ykp } → y per p → +∞. 2 Nota. La proposizione provata vale anche per spazi metrici, con banali modifiche nella dimostrazione. Un risultato importante e notevole, che distingue nettamente il caso di uno spazio normato finito-dimensionale da quello infinito-dimensionale e che si applica, più in generale, a spazi me102 trici, è il seguente . Proposizione 4.2. Sia (X, || ||) uno spazio normato. Se X ha dimensione infinita, la chiusura della palla aperta unitaria {x ∈ X | ||x|| < 1} non può essere compatta. Nota. La chiusura della palla aperta unitaria coincide con la palla chiusa unitaria {x ∈ X | ||x|| ≤ 1} (lo si provi per esercizio). Nel caso di dimensione finita, la palla chiusa unitaria è compatta. Ciò segue dal fatto che in spazi normati di dimensione finita tutte le norme inducono la stessa topologia (e rendono lo spazio di Banach, lo si dimostri per esercizio), per cui ci si può sempre ridurre ad usare la metrica euclidea identificando lo spazio con un Rn . In tal caso la chiusura della palla aperta coincide banalmente con la palla chiusa, che è compatta perché insieme chiuso e limitato di Rn (teorema di Heine-Borel). Prova della proposizione 4.2. Indichiamo con B la palla aperta unitaria centrata nell’origine e supponiamo che B sia compatta. Allora possiamo ricoprire B, e quindi B, con un numero N > 0 di palle aperte Bk , di raggio 1/2 e centrate rispettivamente in xk , k = 1, . . . , N . Consideriamo un sottospazio Xn di X, di dimensione finita n, tale da contenere i vettori xk . Dato che la dimensione di X è infinita, possiamo scegliere n > N arbitrariamente grande. Definiamo le ulteriori palle, di raggi 1 e 1/2 rispettivamente, P := B ∩ Xn e Pk := Bk ∩ Xn per ogni k = 1, . . . , N . Identifichiamo Xn con R2n (o Rn se il campo di X è R) tramite la scelta di una base di Xn , {zk }k=1,...,n . Notare che una palla Pk non soddisfa necessariamente l’equazione di una palla in R2n in questa costruzione. Se normalizziamo la misura di Lebesgue m di R2n dividendo per il volume di P (che è non nullo dato che è aperto non vuoto per la proposizione 2.8) abbiamo che m(P ) = 1. Mostriamo che allora m(Pk ) = (1/2)n . La misura di Lebesgue è invariante per traslazioni per cui ci si può ridurre a considerare le palle centrate nell’origine di raggio r, B(r). Dato che ogni norma è una funzione omogenea vale B(λr) = {λu | u ∈ B(r)} =: λB(r) per ogni λ > 0. Dato che la misura di Lebesgue su R2n soddisfa m(λE) = λ2n m(E), nelle ipotesi fatte risulta che deve essere m(Pk ) = m((1/2)P ) = (1/2)n m(P ) = (1/2)n . Essendo infine B ⊂ ∪N k=1 Bk PN N e dunque P ⊂ ∪k=1 Pk , deve essere m(P ) ≤ k=1 m(Pk ) per subadditività, ossia 1 ≤ N (1/2)2n . Questo è impossibile se n è abbastanza grande (N è fissato). 2 Ricordiamo che in uno spazio normato (X, || ||) un insieme M è detto limitato (rispetto alla norma || ||) se esiste una palla metrica, Bδ (x0 ), di raggio finito δ > 0 e centrata in qualche punto x0 ∈ X, tale che M ⊂ Bδ (x0 ). È chiaro, allora, che M è limitato se e solo se esiste una palla metrica di raggio finito δ > 0 e centrata nell’origine di X, che contiene M (basta scegliere il raggio di tale palla pari a δ+||x0 ||). Definizione 4.1. Siano X, Y spazi normati sullo stesso campo R o C (in particolare X = Y = H spazio di Hilbert). T ∈ L(X, Y) è detto compatto o completamente continuo se vale una 103 delle due condizioni equivalenti: (a) per ogni sottoinsieme M ⊂ X limitato, T (M ) è compatto in Y; (b) ogni successione limitata, {xn }n∈N , ammette una sotto successione, {xnk }k∈N ⊂ X, tale che {T xnk }k∈N converge in Y. B0 (X, Y) denota il sottoinsieme degli operatori compatti da X a Y e, in particolare, B0 (X) denota il sottoinsieme degli operatori compatti da X in X. Osservazioni. (1) È chiaro che (a) ⇒ (b). L’implicazione inversa, (b) ⇒ (a), è immediata conseguenza della proposizione 4.1. (2) Ogni operatore compatto è sicuramente limitato. Infatti, la palla chiusa di raggio 1 centrata nell’origine di X è mappata in un insieme (che contiene l’origine) a chiusura compatta K. Essendo compatto, K è ricopribile da un numero finito, N , di palle aperte di raggio finito r > 0, Br (yi ). Vale allora K ⊂ ∪N i=1 Br (yi ) ⊂ BR+r (0), dove R è il massimo delle distanze tra i centri yi delle palle e l’origine. In particolare ||T (x)|| ≤ (R+r) per ||x|| = 1 per cui ||T || ≤ r+R < +∞. 4.2 Operatori compatti in spazi di Hilbert. D’ora in avanti ci restringeremo a considerare operatori compatti in spazi di Hilbert, anche se molte delle proprietà che enunceremo valgono anche in ambiente meno sofisticato, come spazi normati o spazi di Banach. Nel teorema che segue, l’ipotesi di completezza dello spazio viene in realtà usata solo nell’ultima proprietà. Abbiamo bisogno di una proposizione preliminare prima di enunciare e provare il teorema. Proposizione 4.3. Sia H spazio di Hilbert. A ∈ B(H) è compatto se e solo se |A| (definizione 3.12) è compatto. Prova. Supponiamo A compatto. Sia {xk }k una successione limitata in H e sia {Axkn }n una sotto successione di {Axk }k convergente in virtù della compattezza di A. Essendo tale sotto successione successione di Cauchy, in virtù di (3.47), la sotto successione di {|A|xk }k , {|A|xkn }n è successione di Cauchy e quindi converge. Pertanto |A| è compatto. Scambiando il ruolo di A e |A| ed usando la stessa dimostrazione, si prova che se |A| è compatto, è tale anche A. Teorema 4.1. Sia H spazio di Hilbert. Valgono i seguenti fatti. (a) B0 (H) è un sottospazio vettoriale di B(H). (b) B0 (H) è uno ∗-ideale bilatero di B(H), ossia, oltre ad essere un sottospazio, B0 (H) gode della proprietà che se T ∈ B0 (H), allora T K, KT ∈ B0 (H) per ogni K ∈ B(H) ed inoltre T ∗ ∈ B0 (H). (c) B0 (H) è chiuso rispetto alla topologia uniforme. 104 Prova. (a) Se T è compatto e a ∈ C, segue banalmente dalla stessa definizione di operatore compatto che aT è compatto. Se T e S sono compatti lo è T + S. Proviamolo. Se {un } è successione limitata, sia {unk } una sotto successione per cui {T unk } è convergente (sarà quindi tale ogni sua sotto successione). Dato che {unk } è limitata per costruzione, esisterà una sua sotto successione {unkp } per cui {Sunkp } è convergente. Per costruzione {Sunkp } e {T unkp } sono entrambe convergenti e quindi è tale la successione di elementi (T + S)unkp = T unkp + Sunkp . Abbiamo provato che, se {un } è successione limitata c’è una sua sotto successione {unkp } per cui {(T + S)unkp } converge; pertanto T + S è compatto. (b) Data la successione {xn } limitata, esiste una sotto successione di {T xn } convergente, e quindi anche di {KT xn }, dato che K è continuo. Quindi KT è compatto. Data la successione {xn } limitata, anche {Kxn } è limitata, dato che K è limitato (||Kxn || ≤ ||K||||xn || ≤ ||K||C < +∞). Dalla compattezza di T segue che {T Kxn } ammette una sotto successione convergente. Quindi T K è compatto. Per dimostrare la chiusura rispetto all’operazione di coniugazione hermitiana, notiamo che |T | è compatto se e solo se T è compatto per proposizione 4.3. Decomponendo polarmente T = U |T | secondo il teorema 3.9, segue che T ∗ = |T |U ∗ , dove si è tenuto conto del fatto che |T | ≥ 0, per cui |T | è autoaggiunto. La limitatezza di U ∗ insieme alla compattezza di |T | implicano che T ∗ = |T |U ∗ è compatto per quanto provato all’inizio di questa parte di dimostrazione. (c) Sia B(H) 3 A = limi→+∞ Ai con Ai ∈ B0 (H). Sia {xn } una successione limitata di vettori di H: ||xn || ≤ C per ogni n. Vogliamo provare che esiste una sottosuccesione di {Axn } convergente. Con una procedura ricorsiva, costruiamo una famiglia di sottosuccessioni (2) {xn } ⊃ {x(1) n } ⊃ {xn } ⊃ · · · (i+1) (4.1) (i) (i+1) tale che, per ogni i = 1, 2, . . ., {xn } è sotto successione di {xn } tale che {Ai+1 xn } è (i) convergente. Questo è sempre possibile, in quanto ogni {xn } è limitata da C essendo sotto successione di {xn } ed inoltre Ai+1 è compatto per ipotesi. La sotto successione di {Axn } che (i) proveremo convergere è quella di elementi Axi . Usando la disuguaglianza triangolare abbiamo facilmente che (i) (k) (i) (i) (i) (k) (k) (k) ||Axi − Axk || ≤ ||Axi − An xi || + ||An xi − An xk || + ||An xk − Axk || . Usando la stima scritta, nelle nostre ipotesi si ha che: (i) (k) (i) (k) (i) (k) (i) (k) ||Axi −Axk || ≤ ||A−An ||(||xi ||+||xk ||)+||An (xi −xk )|| ≤ 2C||A−An ||+||An xi −An xk ||. Fissato > 0, se n è grande a sufficienza, varrà 2C||A − An || ≤ /2, dato che An → A per (r) ipotesi. Fissato n e se r ≥ n, {An (xp )}p è sotto successione della successione convergente (n) (p) {An (xp )}p . È facile vedere che la successione {An (xp )}p costruita, per p ≥ n, con i termini “diagonali” di tutte queste sottosuccessioni, ciascuna sotto successione della precedente per (n) (4.1), è ancora sotto successione della successione convergente {An (xp )}p , per cui è anche essa convergente (allo stesso limite). Concludiamo che se i, k ≥ n sono grandi a sufficienza, vale anche 105 (i) (k) (i) (k) ||An xi −An xk || ≤ /2. Quindi, se i, k sono grandi a sufficienza ||Axi −Axk || ≤ /2+/2 = . Ciò prova la tesi. 2 Esempi 4.1. (1) Se X, Y sono spazi normati e T ∈ B(X, Y) è tale che Ran(T ) ha dimensione finita, allora T deve essere compatto. Proviamolo. Se V ⊂ X è limitato, cioè ||x|| < K se x ∈ V per un fissato K < +∞ indipendente da x, allora ||T (V )|| ≤ K||T || < +∞, per cui T (V ) è limitato. T (V ) è chiuso e limitato in uno spazio normato di dimensione finita che è sempre omeomorfo ad un Cn (Proposizione 2.8). Per il teorema di Heine-Borel T (V ) è allora compatto rispetto alla topologia indotta sul rango di T . Quindi T è compatto dato che, dalla definizione generale di compatto, la compattezza rispetto alla topologia indotta implica immediatamente quella rispetto alla topologia globale. Come ulteriore sottocaso, se H è spazio di Hilbert si consideri un operatore Tx ∈ L(H) della forma Tx : u 7→ (x|u)y , dove x, y ∈ H sono fissati vettori (eventualmente coincidenti). È chiaro che tale operatore è compatto, avendo rango di dimensione finita. (2) Se {xn }n∈N e {yn }n∈N sono sottoinsiemi ortogonali di H e se, interpretando la serie nella P topologia uniforme, risulta che T = n∈N (xn | )yn è un operatore limitato, allora T è compatto per (a) e (c) del teorema 4.1. (3) In l2 (N) consideriamo l’operatore A : {xn } 7→ {xn+1 /n}. Tale operatore è compatto in quanto è limite nella topologia uniforme degli operatori, per n = 1, 2 . . . , Am : {xn } 7→ {x2 /1, x3 /2, . . . , xm+1 /m, 0, 0, . . .} . Si verifica infatti facilmente che (lo si provi per esercizio) ||A − An || ≤ 1/(n + 1) . (4) Si consideri lo spazio X con misura µ sulla σ-algebra Σ in X e sia µ σ-finita, in modo da definire la misura prodotto µ ⊗ µ. Consideriamo quindi K ∈ L2 (X × X, µ ⊗ µ). Si può provare che Z TK : L2 (µ) 3 f 7→ K(x, y)f (y)dµ(y) definisce un operatore TK ∈ B(L2 (X, µ)) che è compatto quando µ è anche separabile. Per prima cosa notiamo che, indipendentemente dall’ipotesi di separabilità, se f ∈ L2 (µ): Z e K(·, y)f (y)dµ(y) ∈ L2 (µ) Z K(·, y)f (y)dµ(y) L2 (X,µ) ≤ ||K||L2 (X×X,µ⊗µ) ||f ||L2 (X,µ) , 106 che equivale a dire: ||TK || ≤ ||K||L2 (X×X,µ⊗µ) . (4.2) (La prova di questo fatto è interamente basata sul teorema di Fubini-Tonelli: Se K ∈ L2 (µ ⊗ µ) allora, per Fubini-Tonelli: (1) |K(x, ·)|2 ∈ L1 (µ), µ-quasi ovunque, R (2) |K(x, y)|2 dµ(y) ∈ L1 (µ) . Da (1) segue che K(x, ·) ∈ L2 (µ) quasi ovunque e quindi K(x, ·)f ∈ L1 (µ) quasi ovunque e per la disuguaglianza di Cauchy-Schwarz: R (3) |K(x, y)||fR (y)|dµ(y) ≤ ||K(x, ·)||L2 ||f ||L2 . Posto F (x) := K(x, y)f (y)dµ(y), F è misurabile e vale, per la (3): R 2 2 (4) |F (x)| ≤ ||f ||L2 |K(x, y)|2 dµ(y). Per (2) si ha quindi che |F |2 ∈ L2 (µ) ed è quindi vero che vale Z K(·, y)f (y)dµ(y) ∈ L2 (µ) . Da (4) e dal teorema di Fubini-Tonelli segue infine anche Z K(·, y)f (y)dµ(y) L2 (µ) ≤ ||K||L2 (µ⊗µ) ||f ||L2 (µ) , da cui (4.2).) Facciamo l’ipotesi ulteriore che µ sia separabile in modo che sia separabile L2 (X, µ). Per esempio X può essere un qualsiasi intervallo (o un boreliano) di R e µ la misura di Lebesgue su R. Se {un }n∈N è una base Hilbertiana di L2 (X, µ), allora {un ·um }n,m∈N è una base Hilbertiana di L2 (X × X, µ ⊗ µ) (· è l’ordinario prodotto di funzioni punto per punto) e allora, nella topologia di L2 (X × X, µ ⊗ µ), X K= knm un · um , n,m dove i numeri knm ∈ C dipendono da K. Quindi, posto Kp := X knm un · um n,m≤p si ha che Kp → K per p → +∞ nella norma di L2 (X × X, µ ⊗ µ). Tenuto conto di (4.2) applicata agli operatori TKp −K = TKp − TK , dove TKp è indotto dal nucleo integrale Kp , segue che, per p → +∞, X ||TK − TKp || = knm un · um n,m>p →0, L2 (X×X,µ⊗µ) per cui TK è compatto in quanto gli operatori TKp sono compatti essendo somme finite di operatori con rango di dimensione finita come quelli discussi nell’esempio (1). Gli operatori compatti in spazi di Hilbert godono di notevoli proprietà; in particolare gli operatori compatti e autoaggiunti hanno caratteristiche che generalizzano al caso infinito-dimensionale 107 le proprietà della matrici hermitiane finito-dimensionali. Oltre a ciò sono uno strumeto utilissimo per estendere ulteriormente la teoria. Teorema 4.2 (di Hilbert). Siano H spazio di Hilbert e T ∈ B0 (H) con T = T ∗ : allora vale quanto segue. (a) Ogni autospazio di T con autovalore λ 6= 0 ha dimensione finita. (b) L’insieme σp (T ) degli autovalori di T ha le seguenti caratteristiche: (1) è non vuoto, (2) è reale, (3) è al più numerabile, (4) ha al più un solo punto di accumulazione dato da 0, (5) vale l’identità sup{|λ| | λ ∈ σp (T )} = ||T || . Più precisamente, l’estremo superiore suddetto è anche massimo ed è raggiunto in Λ ∈ σp (T ) tale che Λ = ||T || se sup||x||=1 (x|T x) = ||T || , (4.3) oppure Λ = −||T || se inf ||x||=1 (x|T x) = −||T || . (4.4) (6) T coincide con l’operatore nullo se e solo 0 è l’unico autovalore. Prova di parte del teorema 4.2. (a) Sia Hλ l’autospazio di T con autovalore λ 6= 0. Se B ⊂ Hλ è la palla aperta di raggio 1 centrata nell’origine, allora si può scrivere B = T (λ−1 B) e λ−1 B è limitato a sua volta per costruzione. Dato che T è compatto, B è compatto. Quindi, nello spazio di Hilbert Hλ , la chiusura della palla aperta unitaria è un insieme compatto, pertanto dimHλ < +∞ per la proposizione 4.2. (b) Proveremo tutti i punti eccetto (3) e (4), che saranno provati nella dimostrazione del teorema successivo. σp (T ), se è non vuoto è fatto di elementi reali per (c) (ii) di proposizione 3.8, essendo T autoaggiunto. Per (a) in proposizione 3.8 −||T || ≤ (x|T x) ≤ ||T || per ogni x di norma unitaria, di conseguenza ci possono essere solo le seguenti due possibilità: sup||x||=1 (x|T x) = ||T || oppure inf ||x||=1 (x|T x) = −||T ||. Supponiamo vero il primo fatto ed eseguiamo la dimostrazione in questo caso. L’altro caso si tratta con la stessa dimostrazione scambiando T con −T . Assumeremo che ||T || > 0, altrimenti la prova della tesi è ovvia. Per ogni autovalore λ possiamo scegliere un autovettore x con ||x|| = 1 e quindi ||T || ≥ |(x|T x)| = |λ|(x|x) = |λ|, di conseguenza sup |σp (T )| ≤ ||T ||. Per provare (5), basta quindi esibire un autovettore con autovalore Λ = ||T ||. Si noti che ciò prova anche che σp (T ) 6= ∅. Per ipotesi esisterà una successione di punti xn con ||xn || = 1 tali che (xn |T xn ) → ||T || =: Λ > 0. Vale (dove usiamo anche il fatto che ||T xn || ≤ ||T ||||xn || = ||T ||) ||T xn − Λxn ||2 = ||T xn ||2 − 2Λ(xn |T xn ) + Λ2 ≤ ||T ||2 + Λ2 − 2Λ(xn |T xn ) . 108 Essendo ||T || = Λ, nel limite per n → +∞ della precedente disuguaglianza, si ha che T xn − Λxn → 0 . (4.5) Per concludere ci basterebbe provare che anche {xn }n∈N converge a qualche punto, oppure che ciò accade per una sua sotto successione. Dato che ||xn || = 1, la successione {xn }n∈N è limitata; essendo T compatto, possiamo estrarre da {T xn }n∈N una sotto successione convergente: {T xnk }k∈N . Da (4.5), si ha che: 1 xnk = [T xnk − (T xnk − Λxnk )] Λ converge a qualche x ∈ H se k → +∞, in quanto combinazione lineare di successioni convergenti. Dato che T è continuo e xnk → x, (4.5) implica che T x = Λx . Notiamo che x 6= 0 perché ||x|| = limk→+∞ ||xnk || = 1. Abbiamo provato che x è un autovettore con autovalore Λ. (6) è immediata conseguenza di (5). 2 Passiamo al teorema di Hilbert riguardante lo sviluppo degli operatori compatti autoaggiunti su una base hilbertiana di autovettori. Teorema 4.3 (di Hilbert). Siano (H, ( | )) spazio di Hilbert e T ∈ B0 (T ) con T = T ∗ . (a) Se Pλ è il proiettore ortogonale sull’autospazio con autovalore λ ∈ σp (T ) (insieme degli autovalori di T ), vale: X T = λPλ . (4.6) λ∈σp (T ) Se σp (T ) è infinito, la serie in (4.6) è intesa nel senso della topologia uniforme e gli autovalori in σp (T ): λ0 , λ1 , . . . (con λi 6= λj se i 6= j) sono ordinati in modo tale che |λ0 | ≥ |λ1 | ≥ |λ2 | ≥ . . .. (b) Se Bλ denota una base hilbertiana dell’autospazio di T associato a λ ∈ σp (T ), allora ∪λ∈σp (T ) Bλ è una base hilbertiana per H; in altre parole, H ammette una base hilbertiana fatta di autovettori di T . Nota. Si osservi che ci possono essere al più due autovalori non nulli con lo stesso valore assoluto (essendo gli autovalori reali). L’unica possibile ambiguità nell’ordinamento dei termini della serie di sopra, valendo |λ0 | ≥ |λ1 | ≥ |λ2 | ≥ . . ., è nella scelta dell’ordinamento di ogni coppia λ, λ0 se |λ| = |λ0 |. Come vedremo dalla dimostrazione del teorema, la somma della serie non dipende da qualunque scelta venga fatta per tale ordinamento. Prova del teorema 4.3 e della parte rimanente del teorema 4.2. (a) Sia λ un autovalore con autospazio Hλ . Sia Pλ il proiettore ortogonale su Hλ e Qλ := I − Pλ il proiettore ortogonale su H⊥ λ . Vale T Pλ = Pλ T = λPλ . (4.7) 109 Questa identità si dimostra notando che se x ∈ H, Pλ x ∈ Hλ e allora T Pλ x = λPλ x, da cui T Pλ = λPλ . Prendendo l’aggiunto ad ambo membri e tenendo conto del fatto che λ ∈ R, T = T ∗ , Pλ = Pλ∗ , si ha subito che Pλ T = λPλ = T Pλ . Come ulteriore conseguenza troviamo che vale anche, direttamente dalla definizione di Qλ e da quanto appena provato, Qλ T = T Qλ . (4.8) Notiamo ancora che, essendo I = Pλ + Qλ abbiamo che T = Pλ T + Qλ T , ossia T = λPλ + Qλ T . (4.9) Si osservi che Qλ T soddisfa: (i) è autoaggiunto essendo (Qλ T )∗ = T ∗ Q∗λ = T Qλ = Qλ T , (ii) è compatto per (b) del teorema 4.1, (iii) soddisfa per costruzione Pλ (Qλ T ) = (Qλ T )Pλ = 0 valendo Pλ Qλ = Qλ Pλ = 0. Nel seguito useremo ripetutamente queste identità anche senza citarle esplicitamente e d’ora in poi scriveremo Pn , Qn , Hn per, rispettivamente, Pλn Qλn , Hλn . Cominciamo a scegliere un autovalore λ = λ0 con valore assoluto più alto: ci sono al più due di tali autovalori che differiscono per un segno; in tal caso scegliamo uno dei due. Avremo che, se T1 := Q1 T , allora vale T = λ0 P0 + T1 dove T1 soddisfa le proprietà (i), (ii) e (iii) suddette. Se T1 = 0, la dimostrazione è finita; se non lo è sappiamo comunque che T1 è autoaggiunto compatto, per cui possiamo reiterare la procedura appena illustrata usando T1 in luogo di T e trovando, se T2 := Q1 T1 , T = λ0 P0 + λ1 P1 + T2 . λ1 è un autovalore di T1 , non nullo e con massimo valore assoluto (se un autovalore di valore assoluto massimo fosse nullo, sarebbe T1 = 0 per (6) in (b) del teorema 4.2), e P1 è il proiettore ortogonale sull’autospazio di T1 associato a λ1 . Si osservi ancora che ogni autovalore λ1 di T1 è anche autovalore di T essendo, se T1 u1 = λ1 u1 , T u1 = (λ0 P0 + T1 )u1 = λ0 P0 T1 = λ0 · 0 · T 1 1 u1 + T1 u1 = λ0 P0 Q0 T u1 + T1 u1 λ1 λ1 1 u1 + λ1 u1 = λ1 u1 . λ1 λ1 6= λ0 perché u1 ∈ RanT1 = Ran(Q0 T ) ⊂ H⊥ 0 . Si osservi infine che ogni autovettore u di T con autovalore λ1 deve essere anche autovettore di T1 con autovalore λ1 . Infatti usando T1 = Q0 T = (I − P0 )T si ha, se T u = λ1 u: T1 u = λ1 u − λ1 P0 u = λ1 u + 0 = λ1 u , dove abbiamo usato P0 u = 0, che segue dal fatto che autospazi con autovalori distinti per (T ) operatori autoaggiunti (T ) sono ortogonali. In definitiva, l’autospazio H1 1 con autovalore λ1 110 di T1 coincide con l’autospazio H1 di T con autovalore λ1 . Quindi P1 è il proiettore ortogonale in H su tale autospazio per T oltre che per T1 . Dato che |λ0 | ha valore massimo possibile, vale comunque |λ1 | ≤ |λ0 |. Questo fatto ha una conseguenza importante. Dato che ||T || = |λ0 | e ||T1 || = λ1 per il teorema precedente, avremo che ||T1 || ≤ ||T || . Se risulta T2 = 0 la dimostrazione è finita, altrimenti procederemo nello stesso modo ottenendo che n T− X λk Pk = Tn , (4.10) k=0 dove |λ0 | ≥ |λ1 | ≥ · · · ≥ |λk | ≥ . . . e ||Tk || = |λk | (4.11) Se nessuno degli operatori Tk è l’operatore nullo, la procedura continua indefinitamente. Mostriamo che, in tal caso, la serie decrescente dei numeri positivi |λk | deve tendere a 0 (non ci può essere un punto di accumulazione precedente a 0). Supponiamo che |λ0 | ≥ |λ1 | ≥ · · · ≥ |λk | ≥ . . . ≥ > 0 Scegliamo un vettore xn ∈ Hn per ogni n ed in modo tale che ||xn || = 1. Dunque la successione degli xn è limitata, per cui la successione dei T xn o una sua sotto successione deve convergere, essendo T compatto. Ma questo è impossibile perché, sviluppando il quadrato della norma di ||λn xn − λm xm || tenendo conto che xn e xm sono perpendicolari in quanto autovettori con autovalori distinti per un operatore autoaggiunto ((ii) in (b) di proposizione 3.8), si ha ||T xn − T xm ||2 = ||λn xn − λm xm ||2 = |λn |2 + |λm |2 ≥ 2 , per ogni n e m, per cui né la successione dei T xn né una sua sotto successione può convergere non potendo essere di Cauchy. Questo è assurdo e quindi la successione dei λn (se effettivamente sono infiniti) deve convergere a 0. Come conseguenza di (4.10) e (4.11), quanto appena provato implica che vale anche, nella topologia uniforme, T = +∞ X λ k Pk . (4.12) k=0 Si osservi che, per costruzione, il risultato non dipende dall’ordinamento che abbiamo adottato all’interno delle eventuali coppie di autovalori distinti con lo stesso valore assoluto. Mostriamo ora che l’identità (4.12) coincide con la (4.6) in quanto la successione trovata di autovalori {λk } esaurisce l’insieme degli autovalori di T eccetto al più l’autovalore nullo che non fornisce comunque contributo a (4.12) e (4.6). Sia λ 6= λn per ogni n un autovalore di T e Pλ sia il 111 proiettore ortogonale associato. Valendo Pn Pλ = 0 per ogni n (perché autospazi di autovalori distinti di operatori autoaggiunti sono ortogonali per (ii) in (b) di proposizione 3.8), (4.12) implica T Pλ = +∞ X λ k Pk Pλ = 0 , k=0 da cui, se u ∈ Hλ , T u = T Pλ u = 0 . Questo significa che λ = 0. La prova di (a) è conclusa ed abbiamo contestualmente provato anche le parti rimanenti del teorema 4.2. (b) Si osservi che le basi hilbertiane Bλ esistono sempre per il teorema 3.5, essendo gli autospazi di T sottospazi chiusi (lo si dimostri per esercizio) dello spazio di Hilbert H e quindi spazi di Hilbert a loro volta. Sia B := ∪λ∈σp (T ) Bλ . Mostriamo che che se u ∈ B ⊥ allora u = 0 e ciò conclude la dimostrazione in quanto l’insieme B è ortonormale per costruzione per cui la definizione 3.5 è soddisfatta. Se u ∈ B ⊥ , allora u ⊥ Bλ per ogni λ ∈ σp (T ), per cui Pλ u = 0 per ogni λ ∈ σp (T ). Usando la decomposizione di T data in (4.6), abbiamo che T u = 0; pertanto u appartiene all’autospazio di T con autovalore nullo H0 . Ma essendo anche u ortogonale ad ogni autospazio di T per costruzione, dovrà essere contemporaneamente u ∈ H0 e u ∈ H⊥ 0 , ossia u = 0 che conclude la prova. 2 Il teorema di Hilbert insieme al teorema 9.3 di decomposizione polare consentono di estendere la formula (4.6) dello sviluppo di un operatore compatto autoaggiunto ad un’analoga formula valida nel caso non autoaggiunto. Diamo prima una definizione che sarà utile nel seguito. Definizione 4.2. Siano H spazio di Hilbert e A ∈ B0 (H). Gli autovalori λ non nulli di |A| vengono detti valori singolari di A e il loro insieme si indica con sing(A). La dimensione (finita) mλ dell’autospazio corrispondente a λ ∈ sing(A) viene detta molteplicità di λ. Teorema 4.4. Siano (H, ( | )) spazio di Hilbert e A ∈ B0 (H) con A 6= 0, in modo che l’insieme dei valori singolari di A, sing(A), sia non vuoto. Ordinando sing(A) in modo decrescente: λ0 > λ1 > λ2 > . . ., ed usando tale ordinamento nelle somme scritte sotto, vale: A = A∗ = X mλ X λ∈sing(A) i=1 mλ X X λ (uλ,i | ) vλ,i , (4.13) λ (vλ,i | ) uλ,i , (4.14) λ∈sing(A) i=1 dove le somme, se infinite, sono intese nel senso della convergenza della topologia uniforme e, per ogni λ ∈ sing(A), l’insieme degli elementi uλ,1 , . . . , uλ,mλ è una base ortonormale nell’autospazio 112 di |A| associato all’autovalore λ. Inoltre, per λ ∈ sing(A) e i = 1, 2, . . . , mλ i vettori vλ,i := 1 Auλ,i , λ (4.15) definiscono un insieme ortonormale. Per gli stessi valori di λ e i risulta infine vλ,i = U uλ,i , (4.16) dove U è l’operatore che appare nella decomposizione polare A = U |A|. Prova. Notiamo che |A| è autoaggiunto, positivo e compatto. I suoi autovalori saranno quindi reali, positivi e distribuiti come specificato in (a) e (b) del teorema 4.2. Studieremo il caso in cui l’insieme degli autovalori è infinito (e quindi numerabile), lasciando il sottocaso banale al lettore. Il teorema 4.3 permette di sviluppare |A| come X |A| = λPλ , λ∈σp (|A|) dove la convergenza è intesa rispetto alla topologia uniforme. È chiaro che ci si può ridurre a considerare solo gli autovalori non nulli dato che quello nullo non fornisce contributo alla serie : X |A| = λPλ . λ∈sing(A) Se non ci fossero autovalori non nulli, ci sarebbe l’unico autovalore nullo e sarebbe |A| = 0 per il teorema 4.2, quindi dalla decomposizione polare avremmo A = 0 e la prova del teorema sarebbe ovvia. Se U è limitato, si prova subito che se B(H) 3 Tn → T ∈ B(H) nella topologia uniforme, vale anche U Tn → U T , sempre nel senso della topologia uniforme degli operatori. Dato che l’operatore U della decomposizione polare di A, A = U |A|, è limitato, avremo subito che, nella convergenza della topologia uniforme: A = U |A| = X λU Pλ . (4.17) λ∈sing(A) Il teorema 4.2 nel punto (a) precisa che il sottospazio chiuso su cui proietta ogni Pλ (con λ > 0) ha dimensione finita mλ . Possiamo sempre trovare una base ortonormale di tale autospazio: {uλ,i }i=1,...,mλ . Si osservi che (uλ,i |uλ0 ,j ) = δλλ0 δij per costruzione, siccome autovettori con autovalori distinti sono ortogonali (essendo |A| normale perché positivo) per (ii) in (b) di proposizione 3.8. Dato che uλ,i = |A|(uλ,i /λ), segue che uλ,i ∈ Ran(|A|). Quindi U agisce sugli uλ,i in modo isometrico, per cui i vettori a secondo membro di (4.16) sono ancora ortonormali. La (4.16) equivale alla (4.15) per la decomposizione polare di A: Auλ,i = U |A|uλ,i = U λuλ,i = λvλ,i . 113 È un facile esercizio provare che il proiettore ortogonale Pλ (λ > 0) si può scrivere come Pλ = mλ X (uλ,i | ) uλ,i . i=1 Di conseguenza U Pλ = mλ X (uλ,i | ) U uλ,i = i=1 mλ X (uλ,i | ) vλ,i . i=1 Sostituendo in (4.17) si trova (4.13). La (4.14) si ottiene dalla (4.13) tenendo conto dei seguenti fatti. (i) L’operazione di coniugazione hermitiana A 7→ A∗ è antilineare, per cui trasforma combinazioni lineari di operatori in combinazioni lineari dei loro aggiunti e con i corrispondenti coefficienti sostituiti dai complessi coniugati dei coefficienti della combinazione lineare iniziale. (ii) L’operazione di coniugazione hermitiana è continua nella topologia uniforme di B(H) in quanto ||A∗ || = ||A|| per (a) di proposizione 3.6. In conseguenza di ciò, da (4.13) troviamo (si tenga conto del fatto che λ ∈ R): A∗ = X mλ X λ [(uλ,i | ) vλ,i ]∗ , λ∈sing(A) i=1 dove la serie converge nella topologia uniforme. È un facile esercizio verificare che [(uλ,i | ) vλ,i ]∗ = (vλ,i | ) uλ,i , da cui segue immediatamente la (4.14). 2 Il teorema provato consente di introdurre la nozione di operatore di Hilbert-Schmidt e di operatore di classe traccia, che vedremo nelle prossime sezioni. Esercizi 4.1. (1) Provare che se A∗ = A ∈ B0 (H), con H spazio di Hilbert, allora σp (|A|) = {|λ| |λ ∈ σp (A)} . Concludere che se A∗ = A ∈ B0 (H), allora sing(A) = {|λ| |λ ∈ σp (A) \ {0}} . Soluzione. Sviluppando gli operatori compatti autoaggiunti A ed |A| secondo il teorema 4.3 si ha, con ovvie notazioni, A= X λPλ e |A| = λ∈σp (A) X µ∈σp (|A|) 114 µPµ0 . Calcolando il quadrato degli operatori A e |A|, usando la continuità di tali operatori (che permette lavorare come se le tutte le serie fossero somme finite), l’idempotenza e l’ortogonalità dei proiettori relativi ad autovettori distinti ed infine tenendo conto che |A|2 = A∗ A = A2 , si ha che deve valere X X λ 2 Pλ = µ2 Pµ0 . (4.18) λ∈σp (A) µ∈σp (|A|) Si tenga ora conto che Pλ Pλ0 = 0 se λ 6= λ0 e Pλ Pλ0 = Pλ0 altrimenti e che l’analoga proprietà vale per i proiettori della decomposizione di |A|. Applicando Pλ0 a destra di ambo membri di (4.18), prendendo l’aggiunto del risultato e applicando Pµ0 0 a destra dei membri dell’identità finale, si ricava infine che, per ogni λ0 ∈ σ(A) e µ0 ∈ σp (|A|): deve valere λ20 Pλ0 Pµ0 0 = µ20 Pλ0 Pµ0 0 ossia (λ20 − µ20 )Pλ0 Pµ0 0 = 0 . (4.19) Il fatto che A ammetta una base Hilbertiana di autovettori (teorema 4.3) si può scrivere come ben noto: X P λ0 . I = sλ0 ∈σ(A) Pλ0 Pµ0 0 Fissiamo µ0 ∈ σp (|A|). Se fosse = 0 per ogni λ0 ∈ σ(A) dall’identità di sopra avremmo 0 Pµ0 = 0 che è impossibile per definizione di autospazio. Di conseguenza, dovendo valere (4.19), ci deve essere λ0 ∈ σ(A) tale che λ2 = µ20 , ovvero µ0 = |λ0 |. Se λ0 ∈ σp (A), usando un’analoga procedura scambiando il ruolo di A e |A|, si prova che deve esistere µ0 ∈ σp (|A|) tale che λ2 = µ20 , ovvero µ0 = |λ0 |. La prima affermazione è provata. La seconda affermazione è ora evidente dalla definizione di valore singolare. (2) Si dimostri che se T ∈ B0 (H) e se H 3 xn → x ∈ H in senso debole, cioè : (g|xn ) → (g|x) se n → +∞, per ogni fissato g ∈ H, allora ||T (xn ) − T (x)|| → 0 per n → +∞. In altre parole gli operatori compatti trasformano successioni convergenti debolmente in successioni convergenti in norma. Osservare che il risultato vale anche se T ∈ B(X, Y) con X e Y spazi normati, pur di interpretare la nozione di convergenza debole opportunamente. Soluzione. Sia xn → x in senso debole. Se si tiene conto del teorema di Riesz, si ha subito che l’insieme {xn }n∈N è debolmente limitato nel senso del corollario 3 del teorema di BanachSteinhaus. In base a tale risultato, vale ||xn || ≤ K per ogni n ∈ N, per qualche K > 0. Definiamo allora yn := T xn , y := T x e notiamo che, per ogni h ∈ H, (h|yn ) − (h|y) = (T ∗ h|xn ) − (T ∗ h|x) → 0 se n → +∞, e quindi anche la successione degli yn converge debolmente a y. Supponiamo, per assurdo, che ||yn − y|| 6→ 0 se n → +∞. Allora devono esistere un > 0 e una sottosuccessione {ynk }k∈N con ||y − ynk || ≥ per ogni k ∈ N. Dato che {xnk }k∈N è limitata da K come osservato sopra, e T compatto, deve esistere una sottosuccessione {ynkr }r∈N che converge a qualche y 0 6= y. 115 Questa sottosuccessione {ynkr }r∈N deve quindi convergere anche debolmente a y 0 . Ma questo è impossibile dato che {yn }n∈N converge debolmente a y 6= y 0 . Allora deve essere: yn → y nel senso della norma di H. Il ragionamento si può ripetere nel caso generale in cui T ∈ B(X, Y) con X e Y spazi normati, intepretando X 3 xn → x ∈ X in senso debole come: g(xn ) → g(x) se n → +∞, per ogni fissatog ∈ X0 , dato che il corollario 3 del teorema di Banach-Steinhaus vale in questo caso. (Nella dimostrazione si deve osservare che se h ∈ Y0 allora h◦T ∈ X0 perché composizione di funzioni lineari continue.) 4.3 Operatori di Hilbert-Schmidt. Una classe particolare di operatori compatti sono quelli di Hilbert-Schmidt. Questi trovano applicazioni in vasti rami della fisica matematica, oltre che nella meccanica quantistica. Definizione 4.3. Sia (H, ( | )) spazio di Hilbert e sia || || la norma indotta dal prodotto A ∈ B(H) è detto operatore di Hilbert-Schmidt se esiste una base hilbertiana U l’insieme {||Au||2 }u∈U ammette somma finita nel senso della definizione 3.4. La classe degli operatori di Hilbert-Schmidt su H sarà indicata con B2 (H) e, se A ∈ allora ÊX ||A||2 := ||Au||2 , scalare. per cui B2 (H), (4.20) u∈U dove U è la base hilbertiana suddetta. Per prima cosa mostriamo che la particolare base scelta nella definizione è in realtà generica e che anche ||A||2 non dipende dalla scelta di tale base. Proposizione 4.4. Siano (H, ( | )) spazio di Hilbert, || || la norma indotta dal prodotto scalare, U e V due basi hilbertiane (eventualmente coincidenti) e A ∈ B(H). (a) {||Au||2 }u∈U ammette somma finita se e solo se {||Av||2 }v∈V ammette somma finita. In tal caso vale X X ||Au||2 = ||Av||2 . (4.21) u∈U {||Au||2 } (b) tal caso vale u∈U v∈V ammette somma finita se e solo se {||A∗ v||2 }v∈V ammette somma finita. In X ||Au||2 = u∈U X ||A∗ v||2 . v∈V Prova. Consideriamo che, per (d) del teorema 3.4, ||Au||2 = X |(v|Au)|2 < +∞ , v∈V 116 (4.22) per cui, fissato u, solo una quantità al più numerabile di coefficienti |(v|Au)| è non nulla per (b) di proposizione 3.2. Ciò determina un insieme al più numerabile V(u) ⊂ V tale che X ||Au||2 = u∈U X X |(v|Au)|2 < +∞ . (4.23) u∈U v∈V(u) Questo significa in particolare, riutilizzando (b) di proposizione 3.2, che solo un insieme al P più numerabile di elementi u ∈ U fornisce somme v∈V(u) |(v|Au)|2 non nulle. In definitiva i coefficienti (v|Au) sono non nulli solo per un insieme Z al più numerabile di coppie (u, v) ∈ U×V. Definiamo gli insiemi al più numerabili U := {u ∈ U | esiste v ∈ V con (v|Au) 6= 0} e V := {v ∈ V | esiste u ∈ U con (v|Au) 6= 0} . In tal modo Z ⊂ U × V . Possiamo mettere su U e V le misure µ e ν rispettivamente che contano gli elementi di U e V e le serie sopra considerate si trascrivono in termini di integrali rispetto alle misure dette ((c) proposizione 3.2). In particolare (4.23) si riscrive: X X X 2 ||Au|| = u∈U 2 |(v|Au)| = Z Z dµ(u) U u∈U v∈V(u) dν(v)|(v|Au)|2 < +∞ . (4.24) V Le misure µ e ν sono σ-finite perché U e V sono al più numerabili, per cui ha senso definire la misura prodotto µ ⊗ ν e applicare il teorema di Fubini-Tonelli. Tale teorema assicura che, per l’ultima parte di (4.24), la funzione (v, u) 7→ |(v|Au)|2 è integrabile rispetto alla misura prodotto e che possiamo interscambiare gli integrali: X 2 ||Au|| = Z 2 |(v|Au)| dµ(u) ⊗ dν(v) = U ×V u∈U Z Z dµ(u)|(v|Au)|2 < +∞ . dν(v) V U Notiamo che (v|Au) = (A∗ v|u), per cui solo una quantità al più numerabile di elementi (A∗ v|u) (con (u, v) ∈ U × V ) sarà non nulla e avremo in particolare XX ∗ 2 |(A v|u)| = Z dν(v) V v∈V u∈U Z dµ(u)|(A∗ v|u)|2 = U X ||Au||2 < +∞ . u∈U Ma il primo membro è proprio v∈V ||A∗ v||2 . Abbiamo provato parte della proposizione (b): se {||Au||2 }u∈U ammette somma finita allora {||A∗ v||2 }v∈V ammette somma finita e le due somme coincidono. Usando la stessa dimostrazione, scambiando i nomi delle basi e dei loro elementi e partendo dall’operatore A∗ , ricordando che vale (A∗ )∗ = A per operatori limitati, si prova nello stesso modo che vale la parte rimanente di (b): se {||A∗ v||2 }v∈V ammette somma finita, allora {||Au||2 }u∈U ammette somma finita, ed in tal caso vale (4.22). La dimostrazione di (a) si prova immediatamente da (b) tenendo conto dell’arbitrarietà delle P 117 basi usate. 2 Possiamo enunciare e provare alcune delle numerose ed interessanti proprietà matematiche degli operatori di Hilbert-Schmidt. La proprietà più interessante dal punto di vista matematico è la (b) del teorema scritto sotto: gli operatori di Hilbert-Schmidt formano uno spazio di Hilbert con un prodotto scalare che induce una norma che coincide, per ogni operatore A di HilbertSchimdt, proprio con il numero che avevamo indicato con ||A||2 . Un altro fatto importante è che gli operatori di Hilbert-Schmidt sono compatti e formano un ideale bilatero chiuso rispetto alla coniugazione hermitiana all’interno dello spazio degli operatori limitati. Teorema 4.5. Sia H spazio di Hilbert. Gli operatori di Hilbert-Schmidt godono delle seguenti proprietà. (a) B2 (H) è un sottospazio di B(H) e più fortemente uno ∗-ideale bilatero di B(H); inoltre: (i) ||A||2 = ||A∗ ||2 per ogni A ∈ B2 (H); (ii) ||AB||2 ≤ ||B|| ||A||2 e ||BA||2 ≤ ||B|| ||A||2 per ogni A ∈ B2 (H) e B ∈ B(H); (iii) ||A|| ≤ ||A||2 per ogni A ∈ B2 (H). (b) Se A, B ∈ B2 (H) e se B è una base hilbertiana in H, si definisca (A|B)2 := X (Ax|Bx) . (4.25) x∈B L’applicazione ( | )2 : B2 (H) × B2 (H) → C è ben definita (la somma di sopra si riduce sempre ad una serie assolutamente convergente e non dipende dalla base hilbertiana) e determina un prodotto scalare su B2 (H) che per ogni A ∈ B2 (H) soddisfa: (A|A)2 = ||A||22 (4.26) (c) (B2 (H), ( | )2 ) è spazio di Hilbert. (d) B2 (H) ⊂ B0 (H). Più precisamente, A ∈ B2 (H) se e solo se è compatto e l’insieme dei numeri positivi {mλ λ2 }λ∈sing(A) (essendo mλ la molteplicità di λ) ha somma finita. In tal caso risulta s X ||A||2 = mλ λ2 . (4.27) λ∈sing(A) Prova. (a) Ovviamente B2 (H) è chiuso rispetto alla moltiplicazione per scalare. Mostriamo che lo è rispetto a quello di somma di operatori. Se A, B ∈ B2 (H) e B è una qualsiasi base hilbertiana: X u∈B ||(A + B)u||2 ≤ X (||Au|| + ||Bu||)2 ≤ 2 u∈B X u∈B 118 ||Au||2 + X u∈B ||Bu||2 . Quindi B2 (H) è sottospazio di B(H). Il fatto che sia chiuso rispetto alla coniugazione hermitiana è una immediata conseguenza di (b) della proposizione 4.4, che implica anche (i). Mostriamo che vale (ii) e contestualmente che B2 (H) è chiuso rispetto alla composizione destra e sinistra con operatori limitati. Se A ∈ B2 (H) e B ∈ B(H) allora: X ||BAu||2 ≤ u∈B X ||B||2 ||Au||2 = ||B||2 X ||Au||2 . u∈B u∈B Questo prova insieme che B2 (H) è chiuso rispetto alla composizione sinistra con operatori limitati e che vale la seconda disuguaglianza in (ii). La chiusura rispetto alla moltiplicazione a destra è immediata conseguenza di quella a sinistra e della chiusura rispetto alla coniugazione hermitiana: B ∗ A∗ ∈ B2 (H) se A ∈ B2 (H) e B ∈ B(H), e quindi (B ∗ A∗ )∗ ∈ B2 (H), ossia AB ∈ B2 (H). Da (i) abbiamo anche che se A ∈ B2 (H) e B ∈ B(H), allora ||AB||2 = ||(AB)∗ ||2 = ||B ∗ A∗ ||2 ≤ ||B ∗ || ||A∗ ||2 = ||B|| ||A||2 che completa la dimostrazione di (ii). Per provare (iii) notiamo che: 1/2 X ||A|| = sup ||Ax|| = sup (||Ax||2 )1/2 = sup ||x||=1 ||x||=1 ||x||=1 |(u|Ax)|2 = sup ||x||=1 u∈B 1/2 X |(A∗ u|x)|2 u∈B dove abbiamo usato (d) del teorema 3.4 rispetto alla base hilbertiana B. Utilizzando la disuguaglianza di Cauchy-Schwartz nell’ultimo termine della catena di uguaglianze di sopra, otteniamo: 1/2 1/2 ||A|| ≤ sup ||x||=1 X ||A∗ u||2 ||x||2 = u∈B X ||A∗ u||2 = ||A∗ ||2 = ||A||2 . u∈B (b) Se A, B ∈ B2 (H) e B è una base hilbertiana, allora la quantità di termini Au e Bu non nulli, per u ∈ B, è al più numerabile per la definizione 4.3 e (b) di proposizione 3.2. Valendo 1 |(Au|Bu)| ≤ ||Au|| ||Bu|| ≤ (||Au||2 + ||Bu||2 ) , 2 concludiamo che la quantità di termini non nulli (Au|Bu) per u ∈ B è anch’essa al più numerabile e che la serie dei termini non nulli (Au|Bu) è assolutamente convergente, per cui non conta l’ordinamento scelto nel calcolare (4.25). Mostreremo tra poco che la scelta della base hilbertiana è irrilevante. Prima notiamo che (4.26) è vera banalmente e che ( | )2 soddisfa gli assiomi di un semiprodotto scalare, come è immediato verificare. L’assioma di positività H3 è immediata conseguenza di (iii), pertanto ( | )2 è un prodotto scalare che induce la norma || ||2 . Quindi vale la formula in (1) di esercizi 3.1, che sussiste per ogni prodotto scalare: 4(A|B)2 = ||A + B||22 + ||A − B||22 − i||A + iB||22 + i||A − iB||22 . Dato che, per la proposizione 4.4, il secondo membro non dipende dalla base hilbertiana usata, non dipenderà dalla scelta della base nemmeno il primo membro. (c) Bisogna solo provare che lo spazio è completo. Sia B una base hilbertiana di H. Sia {An }n 119 una successione di Cauchy di operatori di Hilbert-Schmidt rispetto alla norma || ||2 . Da (iii) di (a) la successione è di Cauchy anche nella topologia uniforme, per cui, essendo B(H) completo per il teorema 2.3, esisterà A ∈ B(H) con ||A − An || → 0 per n → +∞. La proprietà di Cauchy dice che preso > 0, esiste N tale che, ||An − Am ||22 ≤ 2 se n, m > N . Tenendo conto della definizione di || ||2 , varrà anche che, per lo stesso , per ogni sottoinsieme finito I ⊂ B: X ||(An − Am )u||2 ≤ ||An − Am ||22 ≤ 2 u∈I quando n, m > N . Passando al limite per m → +∞, si trova che vale ancora: X ||(An − A)u||2 ≤ 2 u∈I per ogni sottoinsieme finito I ⊂ B se n > N . In definitiva, per l’arbitrarietà di I, abbiamo che: ||A − An ||2 ≤ se n > N . (4.28) Da questo fatto segue in particolare che A − An ∈ B2 (H) e quindi A = An + (A − An ) ∈ B2 (H); inoltre, per l’arbitrarietà di > 0 in (4.28), vale anche che An tende a A rispetto alla norma || ||2 . Quindi ogni successione di Cauchy nella norma || ||2 converge in B2 (H), che di conseguenza è completo. (d) Sia A ∈ B2 (H): mostriamo che è compatto e che soddisfa (4.27). Sia B una base hilbertiana. P Vale u∈B ||Au||2 < +∞, dove solo una quantità al più numerabile di addendi è non nulla ed infine sappiamo che la somma si può scrivere come una serie o una somma finita, come ben noto, considerando solo i vettori un per cui ||Aun ||2 > 0. Di conseguenza varrà che per ogni > 0 esiste N tale che +∞ X ||Aun ||2 ≤ 2 . n=N La stessa proprietà si può quindi trascrivere in termini di tutti gli elementi di B: per ogni > 0 esiste un sottoinsieme finito I ⊂ B tale che X ||Au||2 ≤ 2 . u∈B\I Sia quindi AI l’operatore definito imponendo: AI u := Au se u ∈ I e AI u := 0 se u ∈ B \ I . Il rango di AI è generato dai vettori Au con u ∈ I , essendo tali vettori in numero finito AI è limitato e compatto ((1) in esempi 4.1). Per costruzione esiste ||A − AI ||2 e vale: X ||A − AI ||22 = ||(A − AI )u||2 = u∈B X ||Au||2 , u∈B\I pertanto, per (iii) di (a) abbiamo che ||A − AI || ≤ ||A − AI ||2 = 1/2 X u∈B\I 120 ||Au||2 ≤. Quindi A è un punto di accumulazione dello spazio degli operatori compatti rispetto alla topologia uniforme. Tenendo conto del fatto che l’ideale degli operatori compatti è chiuso nella topologia uniforme ((c) di teorema 4.1), il risultato ottenuto prova che A è compatto. √ Dimostriamo adesso che vale (4.27): consideriamo l’operatore positivo compatto |A| = A∗ A e sia {uλ,i }λ∈sing(A),i={1,2,...,mλ } una base hilbertiana di Ker(|A|)⊥ costruita come nel teorema 4.4. Possiamo completarla a base dello spazio di Hilbert aggiungendo una base hilbertiana per Ker(|A|), che coincide con Ker(A) per la nota dopo la definizione 3.12. (Se {ui } è base hilbertiana per il sottospazio chiuso Ker(|A|) e {vj } è una base hilbertiana per il sottospazio chiuso Ker(|A|)⊥ , allora l’insieme ortonormale B := {ui } ∪ {vj } è base hilbertiana per H, perché, come è facile provare dalla decomposizione ortogonale H = Ker(|A|) ⊕ Ker(|A|)⊥ , se x ∈ H è ortogonale a B, allora x = 0.) Usando la base hilbertiana detta per esprimere ||A||2 , abbiamo: ||A||22 = X mλ X X (Auλ,i |Auλ,i ) = mλ X (A∗ Auλ,i |uλ,i ) = mλ X mλ λ2 , (4.29) λ∈sing(A) i=1 λ∈sing(A) i=1 λ∈sing(A) i=1 X dove si è tenuto conto del fatto √ che la parte di base riguardante Ker(A) per costruzione non fornisce contributo, |A|uλ,i = A∗ Auλ,i = λuλ,i e (uλ,i |uλ0 ,j ) = δλλ0 δij . Se, viceversa, A è compatto e {mλ λ2 }λ∈sing(A) ha somma finita, allora da (4.29) segue che ||A||2 < +∞, per cui A ∈ B2 (H). 2 Esempi 4.2. (1) Torniamo all’esempio (4) in esempi 4.1. Consideriamo gli operatori TK : L2 (X, µ) → L2 (X, µ) indotti dai nuclei integrali K ∈ L2 (X × X, µ ⊗ µ) (con µ misura σ-finita separabile), Z (TK f )(x) := K(x, y)f (y)dµ(y) per ogni f ∈ L2 (X, µ) . X Abbiamo provato che tali operatori sono compatti. Mostriamo ora che sono anche di HilbertSchmidt. Usando le stesse definizioni dell’esempio in questione, se f ∈ L2 (X, µ) avevamo visto che (vedi punto (3) nell’esempio (4)), per ogni x ∈ X, Z F (x) = |K(x, y)| |f (y)|dµ(y) < +∞ . X Dato che F ∈ L2 (X, µ), per ogni g ∈ L2 (X, µ) la funzione x 7→ g(x)F (x) è una funzione integrabile (in modo da poter definire il prodotto scalare di g e F ). Il teorema di Fubini-Tonelli assicura quindi che la funzione (x, y) 7→ g(x)K(x, y)f (y) è in L2 (X × X, µ ⊗ µ) e che Z X×X g(x)K(x, y)f (y) dµ(x) ⊗ dµ(y) = Z Z dµ(x) g(x) X K(x, y)f (y)dµ(y) = (g|Tk f ) . X 121 (4.30) Consideriamo allora una base hilbertiana di L2 (X × X, µ ⊗ µ) del tipo {ui · uj }i,j , dove {uk }k è una base hilbertiana per L2 (X, µ) (e quindi lo è anche {uk }k , come si prova immediatamente). Dato che K ∈ L2 (X × X, µ ⊗ µ), varrà lo sviluppo K= X αij ui · uj , (4.31) i,j per cui ||K||2L2 = X |αij |2 < +∞ . (4.32) i,j D’altra parte, da (4.30) e (4.31), si ha (ui |TK uj ) = Z ui (x)uj (y)K(x, y) dµ(x) ⊗ dµ(y) = (ui · uj |K) = αij , X×X per cui (4.32) si può riscrivere ||K||2L2 = X |(ui |TK uj )|2 < +∞ . i,j Per definizione di operatore di Hilbert-Schmidt, TK è quindi un operatore di Hilbert-Schmidt e vale anche ||TK ||2 = ||K||L2 . (2) È abbastanza facile provare che se H = L2 (X, µ) con µ σ-finita e separabile, allora B2 (H) consiste di tutti e soli gli operatori TK con K ∈ L2 (X × X, µ ⊗ µ) e che quindi l’applicazione che identifica K con TK è un isomorfismo di spazi di Hilbert L2 (X × X, µ ⊗ µ) allo spazio di Hilbert B2 (H). Consideriamo a tal fine T ∈ B2 (H) ed esibiamo K ∈ L2 (X × X, µ ⊗ µ) per cui T = TK . P Presa una qualsiasi base Hilbertiana {un }n∈N di L2 (X, µ) deve essere n∈N ||T un ||2 < +∞. Conseguentemente, sviluppando T un sulla stessa base {un }n∈N , si ottiene che: +∞ > X ||T un ||2 = n∈N X X |(um |T un )|2 . m∈N n∈N Interpretando le somme come integrali su {un }n∈N , ed applicando il teorema di Fubini-Tonelli, P concludiamo che: (n,m)∈N2 |(um |T un )|2 < +∞ e quindi l’operatore integrale di Hilbert-Schmidt TK con nucleo integrale K ∈ L2 (X × X, µ ⊗ µ) dato da: K := X (um |T un )um · un (n,m)∈N2 è ben definito. D’altra parte, usando i risultati dell’esempio precedente, per costruzione vale: (um |TK un ) = Z Z dµ(x)um (x) X dµ(y)K(x, y)un (y) = (um |T un ) X 122 e quindi: TK un = T un per ogni n ∈ N. Per continuità segue immediatamente che TK = T . (3) Consideriamo l’equazione di Volterra nella funzione incognita f ∈ L2 ([0, 1], dx): Z x f (x) = ρ f (y)dy + g(x) , 0 con g ∈ L2 ([0, 1], dx) assegnata, ρ ∈ C \ {0} assegnato. (4.33) Sopra dx indica la misura di Lebesgue e l’integrale esiste dato che, per ogni fissato x ∈ [0, 1], può essere intepretato come il prodotto scalare tra f e la funzione [0, 1] 3 y 7→ θ(x − y), e quindi riscritto come: Z Z x 1 θ(x − y)f (y)dy , f (y)dy = 0 0 dove θ(u) = 1 se u ≥ 0 oppure θ(u) = 0 se u < 0. Dato che evidentemente (x, y) 7→ θ(x − y) è anche una funzione in L2 ([0, 1]2 , dx ⊗ dy), l’equazione può essere riscritta in termini di un operatore di Hilbert-Schmidt T come: f = ρT f + g , con g ∈ L2 ([0, 1], dx) assegnata, ρ ∈ C \ {0} assegnato. (4.34) dove abbiamo introdotto l’operatore di Volterra: Z x g ∈ L2 ([0, 1], dx) . g(y)dy (T g)(x) := (4.35) 0 Più in generale gli operatori di Volterra, e quindi le equazioni associate, sono definiti come Z 1 (TV f )(x) := θ(x − y)V (x, y)g(y)dy , 0 per qualche V ∈ L2 ([0, 1]2 , dx ⊗ dy). Noi studiamo qui il caso più semplice dato dalla (4.35). Se l’operatore (I − ρT ) fosse invertibile, la soluzione dell’equazione (4.34) sarebbe data da f = (I − ρT )−1 g . (4.36) Formalmente, usando lo stesso sviluppo della serie geometrica, abbiamo che l’operatore inverso (destro e sinistro) di I − ρT è dato dalla somma della serie: +∞ X (I − ρT )−1 = I + ρn+1 T n+1 . (4.37) n=0 intepretando la convergenza della serie nella topologia uniforme. Una condizione sufficiente per la convergenza è ||ρT || < 1 e la dimostrazione è la stessa che per la serie geometrica. Noi vogliamo però cercare di fare una stima più fine. Usiamo la norma dello spazio B2 (L2 ([0, 1], dx)), tenendo conto di (iii) in (a) del teorema 4.5 ed infine notando che se, per An ∈ B(L2 ([0, 1], dx)), P P+∞ vale ||An || ≤ an ≥ 0 dove la serie +∞ n=0 an converge, allora converge anche la serie n=0 An nella topologia di B(L2 ([0, 1], dx)). La dimostrazione di ques’ultimo fatto è la stessa che si ha 123 in analisi elementare, per esempio per dimostrare il criterio di Weierstrass della serie dominata. Il calcolo diretto tramite (4.35), mostra che, se n ≥ 1: (T n+1 g)(x) = Z x (x − y)n n! 0 g(y)dy , per cui T n ∈ B2 (L2 ([0, 1], dx)) e anche: Ì n n ||T || ≤ ||T ||2 = (x − y)n−1 2 2n−1 |θ(x − y)|2 . dx ⊗ dy ≤ (n − 1)! (n − 1)! [0,1]2 Z n n Dato che la serie di termine generico ρ n!2 converge, concludiamo che, per ogni valore di ρ 6= 0, l’operatore (I − ρT )−1 esiste in B(L2 ([0, 1], dx)) ed è dato dalla somma a secondo membro di (4.37). E dunque (4.36) è la soluzione dell’equazione di Volterra iniziale. Si può infine dare la forma esplicita dell’operatore (I − ρT )−1 . −1 (I − ρT ) g (x) = g(x) + +∞ X n+1 ρ +∞ XZ n+1 T g (x) = g(x) + ρ n=1 0 n=0 x (ρ(x − y))n g(y)dy . n! In teorema della convergenza dominata prova che si può scambiare la serie con l’integrale trovando, per la soluzione dell’equazione di Volterra: Z f (x) = (I − ρT )−1 g (x) = g(x) + ρ x eρ(x−y) g(y)dy . 0 Tuttavia, nel fare queste operazioni, abbiamo usato una nozione di convergenza puntuale, differente da quella operatoriale uniforme. Il fatto che l’espressione di sopra sia davvero la forma esplicita dell’operatore inverso di I −ρT si può verificare per computo diretto, usando l’espressione esplicita (4.35) ed integrando per parti lavorando con g ∈ C([0, 1]). Il risultato si estende su tutto L2 ([0, 1], dx), tenendo conto che l’operatore con nucleo integrale θ(x − y)eρ(x−y) è limitato (essendo di Hilbert-Schmidt) e C([0, 1]) è denso in L2 ([0, 1], dx). L’unicità dell’inverso conclude la dimostrazione. (4) Sia L2 (X, µ) con µ separabile. Un operatore integrale TK : L2 (X, µ) → L2 (X, µ) individuato dal nucleo integrale K(x, y) = N X pk (x)qk (y) , k=1 L2 (X, µ), dove pk , qk ∈ k = 1, 2, 3, . . . , N sono funzioni arbitrarie, è detto operatore degenere. Gli operatori degeneri formano uno ∗-ideale bilatero BD (L2 (X, µ)) di B(L2 (X, µ)) che é sottospazio di B0 (L2 (X, µ)) e B2 (L2 (X, µ)). Si può provare abbastanza facilmente che BD (L2 (X, µ)) è denso in B2 (L2 (X, µ)) nella topologia naturale di quest’ultimo. 124 Il contenuto delle osservazioni (1) e (2) può essere racchiuso in un teorema. L’ultima affermazione è di immediata dimostrazione ed lasciata per esercizio. Teorema 4.6. Se µ è una misura positiva σ-additiva e separabile su X, lo spazio B2 (L2 (X, µ)) è costituito da tutti e soli gli operatori TK della forma, dove N ∈ N è arbitrario: Z (TK f )(x) := K(x, y)f (y)dy , per ogni f ∈ L2 (X, µ), X dove K ∈ L2 (X × X, µ ⊗ µ). Inoltre risulta: ||TK ||2 = ||K||L2 (X×X,µ⊗µ) . L’applicazione L2 (X × X, µ ⊗ µ) 3 K 7→ TK ∈ B2 (L2 (X, µ)) è un isomorfismo di spazi di Hilbert. Esercizi 4.2. (1) In riferimento agli esempi 4.2, provare che dati TK , TK 0 ∈ B2 (L2 (X, µ)) (dove la misura è assunta essere separabile) che sono dunque individuati dai nuclei integrali K e K 0 , allora l’operatore di Hilbert-Schmidt aTK + bTK 0 , con a, b ∈ C ha nucleo integrale aK + bK 0 . (2) Provare che dato TK ∈ B2 (L2 (X, µ)) individuato dal nucleo integrale K allora l’operatore ∗ ha nucleo integrale K ∗ con K ∗ (x, y) = K(y, x). di Hilbert-Schmidt TK (3) Nelle stesse ipotesi di (1) mostrare che il nucleo integrale di TK TK 0 è K 00 (x, z) := Z K(x, y)K 0 (y, z) dµ(y) . X (4) Se L2 (X, µ) è separabile, si consideri l’applicazione L2 (X×X, µ⊗µ) 3 K 7→ TK ∈ B2 (L2 (X, µ)). Si dimostri che si tratta di un isomorfismo di spazi di Hilbert. Si discuta se si può o meno pensare tale applicazione come un’isometria tra spazi normati, assumendo B(L2 (X, µ)) come codominio. Più debolmente si discuta la continuità dell’omomorfismo. (5) In riferimento a (4) in esempi 4.2, dimostrare che, se g ∈ C0 ([0, 1]), allora: Z (I − ρT )−1 g (x) = g(x) + ρ x eρ(x−y) g(y)dy . 0 Suggerimento. Applicare l’operatore I − ρT , tenendo conto dell’espressione integrale di T e ∂ ρ(x−y) osservando che ρeρ(x−y) = ∂x e . (6) Si consideri l’insieme BD (L2 (X, µ)) degli operatori degeneri su L2 (X, µ), con µ separabile. Provare che le seguenti affermazioni sono equivalenti. (a) T ∈ BD (L2 (X, µ)). (b) Ran(T ) ha dimensione finita. (c) T ∈ B2 (L2 (X, µ)) (e pertanto T è un opertore integrale) con nucleo integrale che può sempre P 2 essere scritto come K(x, y) = N k=1 pk (x)qk (y) dove le funzioni: p1 , . . . , pN ∈ L (X, µ) e q1 , . . . , qN ∈ L2 (X, µ) sono, separatamente, linearmente indipendenti. 125 (7) Si consideri l’insieme BD (L2 (X, µ)) degli operatori degeneri su L2 (X, µ), con µ separabile. Mostrare BD (L2 (X, µ)) è uno ∗-ideale bilatero di B(L2 (X, µ)) sottospazio di B2 (L2 (X, µ)). In altre parole si deve provare che BD (L2 (X, µ) ⊂ B2 (L2 (X, µ)), che è un sottospazio chiuso rispetto alla coniugazione hermitiana e che AD, DA ∈ BD (L2 (X, µ) se A ∈ B(L2 (X, µ)) e D ∈ BD (L2 (X, µ)). (8) Si consideri BD (L2 (X, µ)) con L2 (X, µ), con µ separabile. La chiusura topologica di BD (L2 (X, µ)) in B2 (L2 (X, µ)) rispetto alla topologia naturale di B(L2 (X, µ)) coincide con B2 (L2 (X, µ))? Suggerimento. Si consideri l’operatore, dove la convergenza della serie è quella rispetto alla norma operatoriale uniforme: +∞ X 1 √ TKn , T := n n=0 e dove Kn (x, y) = φn (x)φn (y), essendo {φn }n∈N una base hilbertiana di L2 (X, µ). Provare che T ∈ B(L2 (X, µ)) è ben definito, ma T 6∈ B2 (L2 (X, µ)), dato che ||T φn ||2 = 1/n. 4.4 Operatori di classe traccia (o nucleari). Passiamo ad introdurre gli operatori di classe traccia, detti anche operatori nucleari. Seguiremo essenzialmente l’approccio in [Mar82] (un altro approccio si trova in [Pru81]). Proposizione 4.5. Siano H spazio di Hilbert e A ∈ B(H). I seguenti tre fatti sono equivalenti. (a) Esiste una base hilbertiana N di H per cui {(u||A|u)}u∈N ha somma finita: X (u||A|u) < +∞ . u∈N È (a)’ |A| è operatore di Hilbert-Schmidt. (b) A è compatto ed inoltre l’insieme indiciato {mλ λ}λ∈sing(A) , dove mλ è la molteplicità di λ, ha somma finita. Prova. È È Si osservi che (a)’ è una semplice trascrizione di (a), tenendo conto del fatto che |A| |A| = |A|. Per cui (a) e (a)’ sono equivalenti. È È Mostriamo che (a) implica (b). A è compatto perché |A| = ( |A|)2 è compatto essendo |A| compatto, in quanto ogni operatore di Hilbert-Schmidt è compatto ((d) teorema 4.5), il prodotto di operatori compatti è compatto ((b) teorema 4.1), ed infine |A| è compatto se e solo se lo è A (proposizione 4.3). Costruiamo una base hilbertiana di H usando autovettori di |A|: uλ,i con i = 1, . . . , mλ (mλ = +∞ al più solo per λ = 0) e |A|uλ,i = λuλ,i . Rispetto a tale base: È 2 È X È X X È X |A|uλ,i |A|uλ,i = uλ,i ( |A|)2 uλ,i = (uλ,i ||A|uλ,i ) = mλ λ . |A| = 2 λ,i λ,i λ,i λ È 2 per cui {mλ λ}λ∈sing(A) , ha somma finita essendo |A| < +∞ per ipotesi. È ora ovvio che 2 È 2 (b) implica (a)’ procedendo all’indietro nelle argomentazioni e calcolando |A| in una base 2 126 di autovettori di |A|. 2 Definizione 4.4. Sia H spazio di Hilbert. A ∈ B(H) è detto operatore di classe traccia o equivalentemente operatore nucleare se soddisfa una delle tre condizioni (a), (a)’ o (b) in proposizione 4.5. L’insieme degli operatori di classe traccia su H sarà indicato con B1 (H) e, se A ∈ B1 (H), allora È 2 X ||A||1 := |A| = mλ λ , (4.38) 2 λ∈sing(A) dove abbiamo usato le stesse notazioni che in proposizione 4.5. Note. (1) Il nome “classe traccia” deriva evidentemente almeno dal seguente fatto. Per un operatore A di classe traccia, il numero reale ||A||1 generalizza al caso infinito-dimensionale la nozione di traccia della matrice corrispondente ad |A| (e non ad A). In realtà le analogie non finiscono qui, come vedremo tra poco. (2) Valgono le inclusioni: B1 (H) ⊂ B2 (H) ⊂ B0 (H) ⊂ B(H) , ossia op. classe traccia ⊂ op. Hilbert-Schmidt ⊂ op. compatti ⊂ op. limitati . L’unica inclusione non È ancora dimostrata è la prima.ÈPerÈprovarla notiamo che, se A ∈ B1 (H), allora, per definizione, |A| ∈ B2 (H), quindi |A| = |A| |A| è di Hilbert-Schmidt per (a) del teorema 4.5; in virtù della decomposizione polare A = U |A|, essendo U ∈ B(H), si ha A ∈ B2 (H) per (a) del teorema 4.5. (3) Ciascuno degli insiemi scritti è sottospazio vettoriale dello spazio degli operatori limitati ed in più ∗-ideale bilatero (per gli operatori di classe traccia lo proveremo tra poco); infine ciascuno di questi sottospazi è anche spazio di Hilbert o di Banach rispetto ad una naturale struttura: gli operatori compatti formano un sottospazio chiuso rispetto alla topologia uniforme in B(H) e quindi uno spazio di Banach rispetto alla norma operatoriale, gli operatori di Hilbert-Schmidt definiscono uno spazio di Hilbert rispetto al prodotto scalare di Hilbert-Schmidt e gli operatori di classe traccia definiscono uno spazio di Banach rispetto alla norma || ||1 , come diremo più avanti. Prima di passare ad estendere il concetto di traccia al caso infinito-dimensionale, vediamo le proprietà più importanti degli operatori nucleari o di classe traccia. Teorema 4.7. Sia H spazio di Hilbert. Gli operatori nucleari in H godono delle seguenti proprietà. (a) Se A ∈ B1 (H) allora esistono due operatori B, C ∈ B2 (H) tali che A = BC. Viceversa, se B, C ∈ B2 (H) allora BC ∈ B1 (H) ed in tal caso: ||BC||1 ≤ ||B||2 ||C||2 . 127 (4.39) (b) B1 (H) è un sottospazio di B(H) e più fortemente è uno ∗-ideale bilatero, inoltre: (i) ||AB||1 ≤ ||B|| ||A||1 e ||BA||1 ≤ ||B|| ||A||1 per ogni A ∈ B1 (H) e B ∈ B(H); (ii) ||A||1 = ||A∗ ||1 per ogni A ∈ B1 (H); (c) || ||1 definisce una norma su B1 (H). Nota. È possibile provare che B1 (H) è uno spazio di Banach rispetto alla norma || ||1 (vedi referenze in [Mar82]). Prova della proposizione 4.6 eccetto (ii) in (b) che verrà dimostrata in proposizione 4.7. (a) Se A è di classe traccia, usando la decomposizione polareÈdi A = U |A| (teorema 3.9), B e C È possono sempre essere definiti come B := U |A| e C := |A|. Per definizione di operatore di È classe traccia, |A| è operatore di Hilbert-Schmidt, dunque C è Hilbert-Schmidt. Lo è anche B, in quanto U ∈ B(H) e gli operatori di Hilbert-Schmidt formano un ideale in B(H), come provato nel teorema 4.5. Siano ora B e C di Hilbert-Schmidt, mostriamo che A := BC è di classe traccia. Notiamo che A è compatto per (d) di teorema 4.5 e (b) di teorema 4.1; quindi P dobbiamo solo provare che λ∈sing(A) mλ λ < +∞. Se BC = 0, la tesi è ovvia. Assumiamo BC 6= 0 e sviluppiamo l’operatore compatto BC come nel teorema 4.4: mλ X X A = BC = λ(uλ,i | )vλ,i . λ∈sing(A) i=1 Per non caricare troppo le notazioni, poniamo Γ := {(λ, i)|λ ∈ sing(A), i = 1, 2, . . . , mλ } e λj indichi il primo elemento della coppia j = (λ, i). Allora è chiaro che X X λj = j∈Γ mλ λ . λ∈singA Dal teorema di decomposizione polare A = U |A| con U ∗ U = I sul rango di |A| e tendo conto che vj = U uj per cui U ∗ vj = uj , segue che: (vj |BCuj ) = (vj |Auj ) = (vj |U |A|uj ) = λj (vj |U uj ) = λj (U ∗ vj |uj ) = λj (uj |uj ) = λj . Se S ⊂ Γ è finito: X j∈S λj = X j∈S (vj |BCuj ) = X (B ∗ vj |Cuj ) ≤ j∈S X ||B ∗ vj || ||Cuj || ≤ sX j∈S j∈S ||B ∗ vj ||2 sX ||Cuj ||2 . j∈S Dato che gli insiemi ortonormali di elementi uj = uλ,i e vj = vλ,i possono essere separatamente completati a base hilbertiana di H, l’ultimo termine della catena di disuguaglianze di sopra è maggiorato da: ||B ∗ ||2 ||C||2 = ||B||2 ||C||2 . Prendendo l’estremo superiore su tutti gli S finiti, concludiamo che: ||BC||1 = X mλ λ ≤ ||B||2 ||C||2 λ∈sing(A) 128 ed in particolare A = BC ∈ B1 (H). (b) e (c). La chiusura di B1 (H) rispetto al prodotto per scalare si prova immediatamente dalla stessa definizione di operatore nucleare. Mostriamo che B1 (H) è chiuso rispetto alla somma. Siano A, B ∈ B1 (H). Se A + B = 0, allora A + B è nucleare banalmente. Assumiamo pertanto A + B 6= 0, che è comunque compatto. Decomponendo polarmente abbiamo: A = U |A|, B = V |B|, A + B = W |A + B|. Usando la solita decomposizione sui valori singolari come nella prova di (a) avremo: A+B = mβ X X β(uβ,i | )vβ,i . β∈sing(A+B) i=1 Se Γ := {(β, i)|β ∈ sing(A + B), i = 1, 2, . . . , mβ }, S ⊂ Γ è finito e βj è il primo elemento della coppia j ∈ Γ, si ha: X j∈S βj = X j∈S (vj |(A + B)uj ) = X (vj |Auj ) + j∈S X (vj |Buj ) . j∈S La somma delle due somme ottenuta alla fine può essere riscritta in altro modo, ottenendo È È X È X X È ( |B|V ∗ vj | |B|uj ) . βj = ( |A|U ∗ vj | |A|uj ) + j∈S j∈S j∈S Procedendo come per l’analoga dimostrazione in (a), otteniamo È È È È È È X βj ≤ || |A|U ∗ ||2 || |A|||2 + || |B|V ∗ ||2 || |B|||2 ≤ || |A|||22 + || |B|||22 j∈S (nell’ultimo passaggio abbiamo tenuto A vale la disuguaÈ conto del fatto È che, per esempio, per È ∗ ∗ glianza ((a) (ii) del teorema 4.5) || |A|U ||2 ≤ || |A|||2 ||U ||, dato che |A| è di HilbertSchmidt; inoltre ||U ∗ || ≤ 1, come è immediato provare, visto che è un operatore isometrico su Ker(|A|)⊥ e si annulla su Ker(|A|)). Notiamo infine che È È || |A|||22 + || |B|||22 = ||A||1 + ||B||1 . Abbiamo in definitiva provato che A + B ∈ B1 (H) e che in B1 (H) vale la disuguaglianza triangolare: ||A + B||1 ≤ ||A||1 + ||B||1 . Quindi || ||1 è una seminorma. In realtà è una norma, in quanto ||A||1 = 0 implica che gli autovalori di |A| siano tutti nulli e quindi, essendo |A| compatto, |A| = 0 per (6) in (a) di teorema 4.2. Per la decomposizione polare di A = U |A|, segue infine che A = 0. Fino ad ora abbiamo provato che B1 (H) è sottospazio vettoriale di B(H) e che || ||1 è una norma. Mostriamo ora che B1 (H) è chiuso rispetto alla composizione, a destra È e a sinistra, con operatori limitati. È Siano A ∈ B1 (H), B ∈ B(H) e A = U |A|. Allora BA = (BU |A|) |A|, dove i due fattori sono 129 operatori di Hilbert-Schmidt e quindi, per (a), BA ∈ B1 (H). Usando (ii) di (a) in teorema 4.5, (4.38) e (a) del presente teorema, si ha: È È √ √ √ ||BA||1 ≤ ||BU |A|||2 || |A|||2 ≤ ||BU || || A||2 || A||2 ≤ ||B|| || A||22 = ||B|| ||A||1 . È È Inoltre AB = (U |A|) |A|B ∈ B1 (H) perché entrambi i fattori sono di Hilbert-Schmidt e vale (a). In modo analogo al caso trattato sopra, si trova che ||AB||1 ≤ ||B|| ||A||1 . La prova di (ii) in (b) sarà data nella prova della proposizione 6.5. 2 Per concludere introduciamo il concetto di traccia di un operatore nucleare e mostriamo come la traccia abbia le stesse proprietà formali della traccia di matrici. Proposizione 4.6. Se (H, ( | )) è uno spazio di Hilbert, A ∈ B1 (H) e N è una base hilbertiana di H, è ben definita: X trA := (u|Au) ; (4.40) u∈N inoltre: (a) trA non dipende dalla base hilbertiana scelta; (b) per ogni coppia ordinata (B, C) di operatori di Hilbert-Schmidt tali che A = BC vale: trA = (B ∗ |C)2 ; (4.41) ||A||1 = tr|A| . (4.42) (c) |A| ∈ B1 (H) e vale: Prova. (a) e (b). Ogni operatore di classe traccia può decomporsi nel prodotto di due operatori di Hilbert-Schmidt, come provato in (a) di teorema 4.7. Cominciamo con il notare che se A = BC con B, C operatori di Hilbert-Schmidt, allora (B ∗ |C)2 = X (B ∗ u|Cu) = u∈N X (u|BCu) = u∈N X (u|Au) = trA . u∈N Questo prova che trA è ben definito, essendo un prodotto scalare di Hilbert-Schmidt, e che vale (4.41). (Quanto scritto sopra mostra anche che (B ∗ |C)2 = (B 0 ∗ |C 0 )2 se BC = B 0 C 0 , essendo B, B 0 , C, C 0 operatori di Hilbert-Schmidt.) Si osservi inoltre che il risultato ottenuto prova anche l’invarianza di trA al variare della base hilbertiana, visto che ( | )2 non dipende dalla scelta della base hilbertiana. (c) Prima di tutto, per l’unicità della radice quadrata positiva, vale | (|A|) | = |A|. Infatti | (|A|) | è l’unico operatore limitato positivo il cui quadrato è |A|∗ |A| = |A|2 e |A| è limitato, positivo con quadrato pari a |A|2 . Quindi, essendo A di classe traccia +∞ > X (u||A|u) = u∈N X u∈N 130 (u|| (|A|) |u) , per cui, dalla definizione 4.4, |A| stesso è di classe traccia. Infine, scegliendo una base hilbertiana fatta di autovettori di |A|, {uλ,i }, si ha tr|A| = X mλ X (uλ,i | |A|uλ,i ) = X mλ X λ∈sing(A) i=1 λ∈sing(A) i=1 X λ= mλ λ = ||A||1 . λ∈sing(A) Questo conclude la dimostrazione. 2 Definizione 4.5. Siano H spazio di Hilbert e A ∈ B1 (H). Il numero trA ∈ C è detto traccia dell’operatore A di A. La seguente proposizione enuncia altre utili proprietà degli operatori nucleari: in particolare, esattamente come nel caso finito-dimensionale, la ciclicità della traccia. Si osservi che non è richiesto che tutti gli operatori nella traccia siano di classe traccia (e ciò è importante per le applicazioni in fisica). Proposizione 4.7. Sia H spazio di Hilbert. La traccia gode delle seguenti proprietà. (a) Se A, B ∈ B1 (H) e α, β ∈ C, allora: trA∗ = trA , tr(αA + βB) = α trA + β trB . (4.43) (4.44) (b) Se A è di classe traccia e B ∈ B(H), oppure A e B sono entrambi di Hilbert-Schmidt, allora trAB = trBA . (4.45) (c) Se A1 , A2 , . . . An sono in B(H) con almeno un operatore di classe traccia oppure almeno due operatori di Hilbert-Schmidt, allora vale la proprietà di ciclicità della traccia tr (A1 A2 · · · An ) = tr (Aσ(1) Aσ(2) · · · Aσ(n) ) , (4.46) dove (σ(1), σ(2), . . . , σ(n)) è una permutazione ciclica di (1, 2, . . . , n). Prova della proposizione 4.7 e di (ii) in (b) del teorema 4.7. (a) La prova è immediata dalla stessa definizione di traccia. (b) Per dimostrare la tesi cominciamo con il provare che essa vale se A e B sono entrambi di Hilbert-Schmidt. Per (b) di teorema 4.5, (4.45) è equivalente a dire che (A∗ |B)2 = (B ∗ |A)2 . (4.47) La prova di (4.47) è immediata usando la relazione, valida per tutti i prodotti scalari e le norme da essi generate: 4(X|Y ) = ||X + Y ||2 + ||X − Y ||2 − i||X + iY ||2 + i||X − iY ||2 , 131 e ricordando che, nel caso della norma di Hilbert-Schmidt, ||Z||2 = ||Z ∗ ||2 ((i) in (a) di teorema 4.5). Supponiamo ora che A sia di classe traccia e B ∈ B(H). Allora A = CD, con C e D di HilbertSchmidt per (a) del teorema 4.7. Inoltre DB e BC sono di Hilbert-Schmidt, in quanto B2 (H) è un ideale bilatero di B(H). Quindi, usando la proprietà di interscambio provata valida nel caso di due operatori di Hilbert-Schmidt, si ha: trAB = trCD B = trC DB = trDB C = trD BC = trBC D = trB CD = trBA . (c) È chiaro che, essendo B1 (H) un ideale bilatero di B(H), è sufficiente che un solo operatore tra A1 , . . . , An sia di classe traccia perché lo sia il loro prodotto. In particolare, usando (a) del teorema 4.7 unitamente al fatto che anche B2 (H) è un ideale di B(H), si vede subito che se due operatori tra A1 , . . . , An sono di Hilbert-Schmidt, allora il prodotto totale è di classe traccia. È chiaro che la (4.46) è equivalente a tr (A1 A2 · · · An ) = tr (A2 A3 · · · An A1 ) ; (4.48) infatti, continuando a permutare un passo alla volta, si ottengono tutte le permutazioni cicliche. Proviamo la (4.48). Consideriamo dapprima il caso in cui due operatori, Ai e Aj con i < j, siano di Hilbert-Schmidt. Se i = 1, la tesi segue subito da (b) con la coppia di operatori di Hilbert-Schmidt A = A1 e B = A2 · · · An . Se i > 1, allora i quattro operatori (i) A1 · · · Ai , (ii) Ai+1 · · · An , (iii) Ai+1 · · · An A1 , (iv) A2 · · · Ai sono necessariamente di Hilbert-Schmidt perché contengono ciascuno Ai oppure Aj (mai entrambi), quindi vale tr(A1 · · · An ) = tr(A1 · · · Ai Ai+1 · · · An ) = tr(Ai+1 · · · An A1 A2 · · · Ai ) = tr(A2 · · · Ai Ai+1 · · · An A1 ) , che è quanto volevamo provare. Dimostriamo ora la proprietà di ciclicità nell’ipotesi che Ai sia di classe traccia. Se i = 1 la tesi segue immediatamente da (b) con A = A1 e B = A2 · · · An . Supponiamo allora che i > 1. Allora A1 · · · Ai e A2 · · · Ai sono di classe traccia perché ciascuno dei due contiene Ai , quindi, ricordando (b) della presente proposizione, si ha: tr(A1 · · · An ) = tr(A1 · · · Ai Ai+1 · · · An ) = tr(Ai+1 · · · An A1 A2 · · · Ai ) = tr(A2 · · · Ai Ai+1 · · · An A1 ) . La proprietà di ciclicità della traccia consente di provare (ii) in (b) del teorema 4.7. In base a (4.42) si tratta di provare che tr|A| = tr|A∗ |. Dal corollario del teorema di decomposizione polare (teorema 3.9) sappiamo che |A∗ | = U |A|U ∗ , dove U |A| = A è la decomposizione polare di A. Vale allora ||A∗ ||1 = tr|A∗ | = tr(U |A|U ∗ ) = tr(U ∗ U |A|) = tr|A| = ||A||1 , 132 dove abbiamo usato il fatto che U ∗ U |A| = |A|, dato che U è isometria su Ran(|A|) (teorema 3.9). 2 Esercizi 4.3. (1) Considerare un operatore integrale TK su L2 ([0, L]N , dx), con nucleo integrale K(x, y) dove K ∈ C 1 ([0, L]N ). Assumendo che TK ∈ B1 (L2 ([0, L]N , dx)), mostrare che Z tr(TK ) = K(x, x)dx . [0,L]N Suggerimento. Usare come base di Hilbert per sviluppare la traccia la base hilbertiana degli esponenziali 1 i 2π PN ni xi , n1 , n2 , . . . , nN ∈ Z . e L k=1 LN/2 Ricordare che, se f : [0, L]N → C è di classe C 1 allora la serie di Fourier converge puntualmente (escluso al più l’insieme di misura nulla rappresentato dal bordo di [0, L]N ): X 1 f (x) = L n ,...,n 1 e i 2π L PN k=1 ni xi Z 2π e−i L PN k=1 ni yi f (y)dy . [0,L]N N ∈Z Usare infine il teorema di Fubini-Tonelli opportunamente. (2) Considerare un operatore integrale TK su L2 ([0, 2π], dx), con nucleo integrale: K(x, y) = 1 2π 1 in(x−y) e . n2 n∈Z\{0} X Dimostrare che si tratta di un operatore compatto, di Hilbert-Schmidt e di classe traccia. (3) Dimostrare che l’operatore TK nell’esercizio (2) è un inverso sinistro dell’operatore differenziale: d2 − 2, dx definito sulle funzione infinitamente differenziabili su [0, π] che soddisfano condizioni di periodicità (includendo tutte le derivate). Tenendo conto di tale dominio, TK può essere anche un inverso destro? (4) Considerare un operatore integrale Ts su L2 ([0, 2π], dx), con nucleo integrale: Ks (x, y) = 1 2π 1 in(x−y) e . n2s n∈Z\{0} X Dimostrare che si tratta di un operatore compatto, di Hilbert-Schmidt e di classe traccia se s > 1/2. Dimostrare che: tr(Ts ) = ζR (s) , dove il secondo memebro è la funzione zeta di Riemann. 133 Capitolo 5 Operatori non limitati con domini densi in spazi di Hilbert. In questo capitolo estenderemo la teoria degli operatori in spazi di Hilbert considerando operatori non limitati (in particolare operatori autoaggiunti non limitati, che sono gli operatori più importanti della Meccanica Quantistica). Nella prima sezione introdurremo i primi rudimenti di teoria degli operatori non limitati definiti su domini che non coincidono con tutto lo spazio di Hilbert. Daremo, in particolare, la nozione di dominio naturale. Introdurremo la nozione di operatore chiuso e chiudibile. Quindi, presenteremo la nozione generale di operatore aggiunto, per operatori non limitati e densamente definiti, provando che tale nozione estende quella già data nel caso di operatori limitati definiti su tutto lo spazio di Hilbert. La sezione successiva si occuperà di discutere le generalizzazioni al caso di operatore non limitato, della nozione di operatore autoaggiunto, precedentemente data nel caso di operatori di B(H). Introdurremo quindi i concetti di operatore hermitiano, simmetrico, essenzialmente autoaggiunto ed autoaggiunto, discutendone le proprietà generali più importanti. In particolare presentermo la nozione di core di un operatore e quella di indici di difetto. La terza sezione sarà completamente dedicata a due esempi di operatori autoaggiunti della massima importanza in Meccanica Quantistica: gli operatori posizione ed impulso negli spazi L2 (R3 , dx). Studieremo a fondo tali operatori, presentandone le varie possibili equivalenti definizioni. L’ultima sezione sarà dedicata a criteri più avanzati per stabilire se un operatore simmetrico ammette estensioni autoaggiunte e se è essenzialmente autoaggiunto. In particolare presenteremo il criterio di von Neumann. Alcuni strumenti tecnici per affrontare questo tipo di analisi, oltre alla nozione di core di un operatore, sono la trasformata di Cayley e la nozione di vettore analitico, discussi nello stessa sezione. 134 5.1 5.1.1 Operatori non limitati con dominio non massimale. Operatori non limitati con dominio non massimale in spazi normati e di Hilbert. Le prime nozioni che diamo sono abbastanza generali e non necessitano ancora della struttura di spazio di Hilbert. Definizione 5.1. Se X è uno spazio normato, un operatore in X è un’applicazione lineare: T : D(T ) → X , dove D(T ) ⊂ X è un sottospazio di X (in generale non chiuso), detto dominio di T . Il grafico G(T ) dell’operatore T è il sottospazio di X ⊕ X: G(T ) := {(x, T x) | x ∈ D(T )} . Se α ∈ C e A e B sono operatori in X con dominio D(A) e D(B) rispettivamente, si definiscono gli operatori in H: AB, tale che ABf := A(Bf ) sul suo dominio naturale: D(AB) := {f ∈ D(B) | Bf ∈ D(A)} A + B tale che (A + B)f := Af + Bf sul suo dominio naturale: D(A + B) := D(A) ∩ D(B) αA, tale che αAf := α(Af ) sul suo dominio naturale: D(αA) = D(A) se α 6= 0, D(0A) := H . È chiaro che le definizioni date sopra si riducono a quelle già viste nel caso di operatori T ∈ L(X), che non sono altro che operatori in X con D(T ) = X. Il concetto di estensione di un operatore e quello di operatore chiuso e chiudibile giocano un ruolo importante nel seguito. Definizione 5.2. Se A è un operatore nello spazio normato X, un operatore B sullo spazio X si dice estensione di A, e si scrive A ⊂ B, se G(A) ⊂ G(B). Definizione 5.3. Sia A operatore nello spazio normato X. (a) A è detto chiuso se il suo grafico è chiuso nella topologia prodotto di X × X. In altre parole A è chiuso se, per ogni successione {xn }n∈N ⊂ D(A) tale che, per n → +∞: (i) xn → x ∈ X, (ii) T xn → y ∈ X, vale x ∈ D(A) e y = T x. 135 (b) A è detto chiudibile se la chiusura G(A) del suo grafico è ancora il grafico di un operatore (che risulta essere necessariamente chiuso). Tale operatore si indica con A e si dice chiusura di A. La seguente proposizione caratterizza gli operatori chiudibili. Proposizione 5.1. Sia A operatore nello spazio normato X; i seguenti fatti sono equivalenti: (i) A è chiudibile, (ii) non esistono in G(A) elementi del tipo (0, z) con 0 6= z ∈ X, (iii) A ammette estensioni chiuse. Prova. (i) ⇔ (ii) A non è chiudibile se e solo se ci sono due successioni in D(A), {xn } e {x0n }, tali che xn → x ← x0n , ma Axn → y 6= y 0 ← Ax0n . Per linearità questo è equivalente a dire che c’è una successione di elementi x00n = xn − x0n → 0 tale che T x00n → y − y 0 = z 6= 0. Questo è equivalente a dire che G(A) contiene il punto (0, z). (i) ⇔ (iii) Se A è chiudibile, A è un’estensione chiusa di A. Se viceversa esiste un’estensione chiusa B di A non può accadere che esistano in G(A) elementi del tipo (0, z) con 0 6= z ∈ X, altrimenti, essendo A ⊂ B e B chiuso, avremmo che G(B) = G(B) ⊃ G(A) 3 (0, z) e quindi B non sarebbe un operatore. 2 Restringiamoci al caso in cui X sia uno spazio di Hilbert, che indicheremo con H. È per molti motivi conveniente definire una struttura di spazio di Hilbert sullo spazio somma diretta H ⊕ H (vedi il testo dopo notazione 2.5). Dal punto di vista topologico, H ⊕ H ha la topologia naturale data dalla topologia prodotto di H × H. Vogliamo pertanto che la struttura di spazio di Hilbert su H ⊕ H induca proprio la topologia prodotto. Definiamo il prodotto scalare su H ⊕ H come ((x, x0 )|(y, y 0 )) := (x|x0 ) + (y|y 0 ), per ogni coppia (x, x0 ), (y, y 0 ) ∈ H ⊕ H. Siccome la norma indotta da questo prodotto scalare è tale che ||(z, z 0 )||2 = ||z||2 + ||z 0 ||2 (5.1) per ogni (z, z 0 ) ∈ H ⊕ H, si ha immediatamente che ogni successione di Cauchy {(xn , x0n )}n∈N in H⊕H rispetto alla norma indotta dal prodotto scalare su H⊕H definisce le successioni di Cauchy in H: {xn }n∈N e {x0n }n∈N . Tali successioni di Cauchy convergono dunque rispettivamente a x e x0 in H. È quindi immediato provare che (xn , x0n ) → (x, x0 ) per n → +∞ direttamente da (5.1). Pertanto H ⊕ H è completo. Inoltre, il prodotto scalare definito su H ⊕ H induce una norma la cui topologia su H ⊕ H è, come volevamo, la topologia prodotto. Per provare ciò, è sufficiente notare che, se (x, y) ∈ H ⊕ H e se Bδ ((x, y)) è la palla metrica aperta in H ⊕ H centrata in (x, y) di raggio δ > 0 e B (z) l’analoga palla aperta in H centrata in z di raggio > 0, allora valgono le inclusioni: Bδ/√2 (x) × Bδ/√2 (y) ⊂ Bδ ((x, y)) ⊂ Bδ√2 (x) × Bδ√2 (y) Concludiamo che, per esempio, la nozione di operatore chiuso su uno spazio di Hilbert (definizione 5.3) può essere equivalentemente data rispetto alla topologia indotta dal prodotto scalare 136 su H ⊕ H. Per dimostrare alcune proposizioni conviene introdurre fin d’ora l’operatore unitario τ : H⊕H → H ⊕ H tale che τ : (x, y) 7→ (−y, x) . Si osservi che τ τ = −I. Si verifica immediatamente per computo diretto che, se F ⊂ H ⊕ H, allora τ (F ⊥ ) = (τ (F ))⊥ , (5.2) dove ⊥ 5.1.2 è riferito al prodotto scalare di H ⊕ H; in altre parole τ e ⊥ commutano. La definizione generale di operatore aggiunto in spazi di Hilbert. Passiamo a definire l’aggiunto di un operatore A nello spazio di Hilbert H, nel caso in cui D(A) sia denso in H. Consideriamo un vettore x ∈ H per cui esiste un vettore zA,x tale che, per ogni y ∈ D(A): (x|Ay) = (zA,x |y) . (5.3) Si osservi che 0 soddisfa sicuramente la proprietà richiesta per x. Inoltre, se esiste zA,x per un 0 certo x, zA,x è univocamente fissato da x. Infatti se zA,x soddisfa la stessa identità di sopra per tutti gli y ∈ D(A), allora deve essere: 0 0 = (x|Ay) − (x|Ay) = (zA,x − zA,x |y) (5.4) per ogni y ∈ D(A). Dato che D(A) è denso in H, ci sarà una successione {yn }n∈N ⊂ D(A) 0 . Per la continuità del prodotto scalare, (5.4) implica subito che per cui yn → zA,x − zA,x 0 ||2 = 0 e quindi z 0 ||zA,x − zA,x A,x = zA,x . Indicheremo con D(A∗ ) l’insieme degli x ∈ H che soddisfano la condizione (5.3) per qualche zA,x e per ogni y ∈ D(A). Ragionando come per la definizione dell’operatore aggiunto nel caso in cui A ∈ B(H), si verifica subito che D(A∗ ) è un sottospazio di H e che l’applicazione D(A∗ ) 3 x 7→ zA,x è lineare. Definizione 5.4. Se T è un operatore nello spazio di Hilbert H con D(T ) = H, l’operatore aggiunto di T , T ∗ , è l’operatore su H definito sul sottospazio: D(T ∗ ) := {x ∈ H | esiste zT,x ∈ H con (x|T y) = (zT,x |y) per ogni y ∈ D(T )} e tale che: T ∗ : x 7→ zT,x . 137 Note. (1) È chiaro che vale: (T ∗ x|y) = (x|T y) , per ogni coppia (x, y) ∈ D(T ∗ ) × D(T ). (2) Se T ∈ B(H), applicando la definizione 5.4 per T ∗ si vede immediatamente che vale D(T ∗ ) = H a causa del teorema di Riesz, come visto nel paragrafo 3.3. Concludiamo che: per gli operatori di B(H) la definizione di aggiunto data in definizione 5.4 coincide con quella data in definizione 3.7. (3) Si osservi che non è detto che D(T ∗ ) sia denso in H, per cui, in generale, non esiste (T ∗ )∗ . (4) Esplicitando l’insieme τ (G(T ))⊥ troviamo subito che τ (G(T ))⊥ = {(x, y) ∈ H ⊕ H | − (x|T z) + (y|z) = 0 per ogni z ∈ D(T )} . In altre parole τ (G(T ))⊥ è il grafico di T ∗ (purché tale operatore sia definito): τ (G(T ))⊥ = G(T ∗ ) . (5) Se A ⊂ B ed entrambi gli operatori sono densamente definiti, allora A∗ ⊃ B ∗ . La prova è immediata dalla definizione di aggiunto. Teorema 5.1. Sia A operatore sullo spazio di Hilbert H con dominio denso; allora valgono le seguenti proprietà: (a) A∗ è un operatore chiuso e vale: τ (G(A))⊥ = G(A∗ ) ; (5.5) (b) A è chiudibile se e solo se D(A∗ ) è denso. In tal caso: A ⊂ A = (A∗ )∗ ; (c) KerA∗ = [RanA]⊥ e Ker(A) ⊂ [RanA∗ ]⊥ (dove possiamo sostituire ⊂ con = se D(A∗ ) è denso in H). (d) Se A è chiuso (oltre ad avere dominio denso) allora vale la decomposizione ortogonale di H ⊗ H: H ⊕ H = τ (G(A)) ⊕ G(A∗ ) . (5.6) Prova. (a) L’identità (5.5) è stata provata nella nota precedente. In essa: τ (G(A))⊥ è chiuso per costruzione, essendo l’ortogonale di un insieme ((a) di teorema 3.1), quindi A∗ è chiuso. (b) Consideriamo la chiusura del grafico di A; vale D(A) = (D(A)⊥ )⊥ per il teorema 3.1. Tenendo conto che τ τ = −I, che S ⊥ = −S ⊥ per ogni insieme S, e che valgono (5.2) e (5.5), troviamo che: G(A) = −τ ( τ (G(A))⊥ )⊥ = −τ (G(A∗ ))⊥ = τ (G(A∗ ))⊥ . (5.7) 138 Per proposizione 5.1, G(A) è il grafico di un operatore (la chiusura di A) se e solo se G(A) non contiene elementi del tipo (0, z) con z 6= 0. In altre parole G(A) non è il grafico di un operatore se e solo se esiste z 6= 0 con (0, z) ∈ τ (G(A∗ ))⊥ . Questa condizione si esplicita in esiste z 6= 0 tale che 0 = ((0, z)|(−A∗ x, x)) , per ogni x ∈ D(A∗ ) . In altre parole G(A) non è il grafico di un operatore se e solo se D(A∗ )⊥ 6= {0}, che è equivalente a dire che D(A∗ ) non è denso in H. In definitiva: G(A) è il grafico di un operatore se e solo se D(A∗ ) è denso in H. Se D(A∗ ) è denso in H, allora (A∗ )∗ è definito e, usando (5.7) e (5.5), G(A) = τ (G(A∗ ))⊥ = G((A∗ )∗ ) . D’altra parte, per la definizione di chiusura dell’operatore A, G(A) = G(A). Sostituendo sopra: G(A) = G((A∗ )∗ ) , e quindi A = (A∗ )∗ . (c) Seguono immediatamente da (A∗ x|y) = (x|Ay) , per ogni coppia (x, y) ∈ D(A∗ ) × D(A) e dalla densità di D(A) (e da quella di D(A∗ )). (d) Dato che A è chiuso, G(A) è chiuso e quindi τ (G(A)) è chiuso perchè τ : H ⊕ H → H ⊕ H è evidentemente unitario. Dalla (5.5) e da (b) e (d) del teorema 3.1 abbiamo immediatamente che (5.6) deve essere vera. Questo conclude la dimostrazione. 2 Nota. Tenuto conto del fatto che, se D(A) è denso e λ ∈ C, allora (A − λI)∗ = A∗ − λI, la prima relazione del punto (c) implica immediatamente che valga anche la seguente identità, che useremo spesso in seguito: Ker(A∗ − λI) = [Ran(A − λI)]⊥ , mentre la seconda relazione del punto (c) fornisce: Ker(A − λI) ⊂ [Ran(A∗ − λI)]⊥ . 5.2 Operatori hermitiani, simmetrici, autoaggiunti ed essenzialmente autoaggiunti. Possiamo ora dare la definizione di operatore autoaggiunto e le nozioni connesse. Definizione 5.5. Siano (H, ( | )) spazio di Hilbert e A operatore in H. (a) A è detto hermitiano se (Ax|y) = (x|Ay) per ogni coppia x, y ∈ D(A). 139 (b) A è detto simmetrico se è hermitiano e D(A) è denso. In altre parole A è simmetrico quando D(A) è denso e A ⊂ A∗ . (c) A è detto autoaggiunto se D(A) è denso e A = A∗ . (d) A è detto essenzialmente autoaggiunto se D(A) e D(A∗ ) sono densi e A∗ = (A∗ )∗ ovvero, equivalentemente, D(A) è denso, A è chiudibile e vale A∗ = A. (e) A è detto normale se A∗ A = AA∗ , dove i due membri sono definiti sui loro domini naturali. Note. (1) A commento di (c) nella definizione 5.5, si osservi che, per (a) di teorema 5.1, ogni operatore autoaggiunto è chiuso. (2) Val la pena di notare che: (i) le definizioni di operatore hermitiano, simmetrico, autoaggiunto ed essenzialmente autoaggiunto coincidono quando il dominio dell’operatore è tutto lo spazio di Hilbert; (ii) vale il teorema di Hellinger-Toeplitz: un operatore hermitiano con dominio dato da tutto lo spazio di Hilbert (cioé un operatore autoaggiunto definito su tutto lo spazio di Hilbert) è necessariamente limitato. Questo evero per (d) della proposizione 3.8, ed è quindi autoaggiunto anche nel senso della definizione 3.9; (iii) gli operatori limitati autoaggiunti nel senso della definizione 3.9 sono operatori autoaggiunti con dominio dato da tutto lo spazio, nel senso della definizione di sopra. (3) La nozione di operatore essenzialmente autoaggiunto è la più importante delle quattro presentate sopra nelle applicazioni in Meccanica Quantistica, per il seguente fatto. Come vedremo tra poco, gli operatori essenzialmente autoaggiunti ammettono una sola estensione autoaggiunta, per cui portano tutta l’informazione di un operatore autoaggiunto. Per motivi che vedremo più avanti, gli operatori importanti in Meccanica Quantistica sono operatori autoaggiunti; d’altra parte gli operatori più comodi da trattare sono gli operatori differenziali. Risulta spessissimo che operatori differenziali definiti su domini opportuni siano essenzialmente autoaggiunti. In tal modo gli operatori differenziali essenzialmente autoaggiunti sono, da una parte, comodi per essere usati, dall’altra, portano le informazioni, in maniera univoca, di operatori autoaggiunti utili in Meccanica Quantistica. Per questo motivo ci soffermiamo su alcune proprietà connesse all’autoaggiunzione essenziale. (4) Dato un operatore A : D(A) → H nello spazio di Hilbert H, si dice che B ∈ B(H) commuta con A, quando BA ⊂ AB . Se il dominio di A è denso e quindi esiste A∗ , si verifica facilmente che se B ∈ B(H) commuta con A allora B ∗ commuta con A∗ (lo si provi per esercizio). Estendendo quanto detto in (3) in esempi 3.3, indichiamo con {A}0 il commutante di A : D(A) → H, cioé : {A}0 := {B ∈ B(H) | BA ⊂ AB} Nel caso in cui A = A∗ risulta che {A}0 è una sotto ∗-algebra di B(H) che è chiusa rispetto alla topologia operatoriale forte. Si tratta dunque di un’algebra di von Neumann (vedi (3) in esempi 3.3). L’ulteriore commutante {A}00 := {{A}0 }0 è ancora un’algebra di von Neumann che 140 si chiama algebra di von Neumann generata da A. Notazione 5.1. D’ora in poi scriveremo anche A∗∗···∗ in luogo di (((A∗ )∗ ) · · · )∗ . Proposizione 5.2. Siano (H, ( | )) spazio di Hilbert e A operatore in H; allora valgono i seguenti fatti. (a) Se D(A), D(A∗ ), D(A∗∗ ) sono densi, allora: ∗ A∗ = A = A∗ = A∗∗∗ . (5.8) (b) A è essenzialmente autoaggiunto se e solo se A è autoaggiunto. (c) Se A è autoaggiunto, allora è simmetrico massimale: non ha estensioni proprie simmetriche. (d) Se A è essenzialmente autoaggiunto, allora A ammette solo una estensione autoaggiunta: A (che coincide con A∗ ). Prova. (a) Se D(A), D(A∗ ), D(A∗∗ ) sono densi, allora esistono A∗ , A∗∗ e A∗∗∗ . Inoltre ∗ A = (A∗∗ )∗ = A∗∗∗ = (A∗ )∗∗ = A∗ per (b) del teorema 5.1. Dato che A∗ è chiuso (per (a) di teorema 5.1), vale infine: A∗ = A∗ . (b) Se A è essenzialmente autoaggiunto, allora A = A∗ e quindi, in particolare, D(A) = D(A∗ ) è ∗ denso. Calcolando l’aggiunto di A e tenendo conto di (b) in teorema 5.1, si ha: A = (A∗ )∗ = A, ossia A è autoaggiunto. ∗ Viceversa, se A è autoaggiunto, ossia esiste A = A, allora D(A), D(A∗ ), D(A∗∗ ) sono densi e, ∗ applicando (a): A∗ = A∗ = A ; quindi A∗ = A. Allora A è essenzialmente autoaggiunto. (c) Sia A autoaggiunto e A ⊂ B con B simmetrico. Prendendo gli aggiunti, si ha A∗ ⊃ B ∗ . Ma B ∗ ⊃ B per la simmetria. Allora: A ⊂ B ⊂ B ∗ ⊂ A∗ = A , e quindi A = B = B ∗ . (d) Sia A∗ = A∗∗ e A ⊂ B con B = B ∗ . Prendendo l’aggiunto di A ⊂ B si ha che: B = B ∗ ⊂ A∗ . Prendendo due volte l’aggiunto di A ⊂ B troviamo anche che A∗∗ ⊂ B, ma allora: B = B ∗ ⊂ A∗ = A∗∗ ⊂ B , per cui B = A∗∗ , che coincide con A per (b) del teorema 5.1. 2 Passiamo ora a dare i due teoremi fondamentali che caratterizzano gli operatori autoaggiunti ed essenzialmente autoaggiunti. Teorema 5.2. Sia A operatore simmetrico nello spazio di Hilbert H. I seguenti fatti sono equivalenti: (a) A è autoaggiunto; 141 (b) A è chiuso e Ker(A∗ ± iI) = {0}; (c) Ran(A ± iI) = H. Prova. (a) ⇒ (b) Se A = A∗ , allora A è chiuso perché A∗ è chiuso. Se x ∈ Ker(A∗ + iI), allora vale anche Ax = −ix e quindi i(x|x) = (Ax|x) = (x|Ax) = (x| − ix) = −i(x|x) , per cui (x|x) = 0 e quindi x = 0. La prova per Ker(A∗ − iI) = {0} è analoga. (b) ⇒ (c) Dalla definizione di operatore aggiunto segue che (vedi nota dopo teorema 5.1): [Ran(A − iI)]⊥ = Ker(A∗ + iI). Quindi da (b) segue che Ran(A − iI) è denso in H. Ora teniamo conto della chiusura di A per mostrare che in realtà Ran(A − iI) = H. Si fissi y ∈ H arbitrariamente e si scelga {xn }n∈N ⊂ D(A) per cui (A − iI)xn → y ∈ H. Vale, se z ∈ D(A), ||(A − iI)z||2 = ||Az||2 + ||z||2 ≥ ||z||2 , da cui il fatto che {xn }n∈N è una successione di Cauchy ed esiste x = limn→+∞ xn . La chiusura di A comporta subito quella di A−iI, per cui: (A−iI)x = y e quindi Ran(A−iI) = Ran(A − iI) = H. La prova per Ker(A∗ − iI) = {0} è analoga. (c) ⇒ (a) Dato che A ⊂ A∗ per l’ipotesi di simmetria, è sufficiente provare che D(A∗ ) ⊂ D(A). Sia y ∈ D(A∗ ). Dato che Ran(A − iI) = H, esiste un vettore x− ∈ D(A) tale che: (A − iI)x− = (A∗ − iI)y . Su D(A) l’operatore A∗ coincide con A e pertanto, dall’identità di sopra, si trova che: (A∗ − iI)(y − x− ) = 0 . Ma Ker(A∗ − iI) = Ran(A + iI)⊥ = {0}, per cui y = x− e y ∈ D(A). La dimostrazione nel caso di Ran(A + iI) è analoga. 2 Teorema 5.3. Sia A operatore simmetrico nello spazio di Hilbert H. I seguenti fatti sono equivalenti: (a) A è essenzialmente autoaggiunto; (b) Ker(A∗ ± iI) = {0}; (c) Ran(A ± iI) = H. Prova. (a) ⇒ (b) Se A è essenzialmente autoaggiunto, allora A∗ = A∗∗ e quindi A∗ è autoaggiunto (e dunque chiuso). Applicando il teorema 5.2, segue che Ker(A∗∗ ± iI) = {0} e quindi vale (b) perché A∗∗ = A∗ . (b) ⇒ (a) A ⊂ A∗ per ipotesi e quindi, essendo D(A) denso, lo è anche D(A∗ ). Di conseguenza, per la (b) del teorema 5.1, A è chiudibile e A ⊂ A = A∗∗ (in particolare D(A∗∗ ) = D(A) ⊃ D(A) 142 ∗ è denso). Pertanto, da A ⊂ A∗ segue A ⊂ A∗ e, per la (a) di proposizione 5.2, si ha A∗ = A . In ∗ definitiva, A ⊂ A , ovvero A è simmetrico. Possiamo allora applicare il teorema 5.2 all’operatore A, valendo per esso la proposizione (b) in tale teorema. Concludiamo che A è autoaggiunto. Da (b) di proposizione 5.2 segue che A è essenzialmente autoaggiunto. (b) ⇔ (c) Dato che Ran(A ± iI)⊥ = Ker(A∗ ∓ iI) e che Ran(A ± iI) ⊕ Ran(A ± iI)⊥ = H, (b) e (c) sono equivalenti. 2 Per concludere presentiamo un concetto utile nelle applicazioni: quello di core per un operatore. Definizione 5.6. Sia A un operatore nello spazio di Hilbert H con dominio denso e sia A chiudibile. Un sottospazio denso S ⊂ D(A) è detto essere un core di A se A S è chiudibile e: A S = A . Vale la seguente ovvia ma importante proposizione. Proposizione 5.3. Se A è un operatore autoaggiunto nello spazio di Hilbert H, un sottospazio S ⊂ D(A) è un core per A se e solo se A S è essenzialmente autoaggiunto. Prova. Se A S è essenzialmente autoaggiunto, allora ammette un’unica estensione autoaggiunta, che coincide con la sua chiusura per (d) in proposizione 5.2; nel caso in esame, tale estensione coincide necessariamente con A, che per ipotesi è autoaggiunto. Quindi A S è un core. Viceversa, se A S è un core, significa che la chiusura di A S è autoaggiunta perché coincide con l’operatore autoaggiunto A. Per (b) di proposizione 5.2, A S è dunque essenzialmente autoaggiunto. 2 Esercizi 5.1. (1) Sia A un operatore nello spazio di Hilbert H con dominio denso D(A). Siano α, β ∈ C e si consideri il dominio naturale D(αA + β) := D(A). Provare che: (i) αA + βI : D(αA + β) → H ammette aggiunto e (αA + βI)∗ = αA∗ + βI . (ii) αA + βI è hermitiano, simmetrico, autoaggiunto, essenzialmente autoaggiunto se e solo se A è, rispettivamente, hermitiano, simmetrico, autoaggiunto, essenzialmente autoaggiunto. (iii) αA + βI è chiudibile se e solo se A è chiudibile ed in tal caso vale: αA + βI = αA + βI . Suggerimento. Applicare direttamente le definizioni necessarie. (2) Siano A e B operatori nello spazio di Hilbert H densamente definiti. Provare che se A + B : D(A) ∩ D(B) → H è densamente definito, allora: (A + B)∗ ⊂ A∗ + B ∗ . 143 (3) Siano A e B operatori nello spazio di Hilbert H densamente definiti. Provare che se il dominio naturale D(AB) è densamente definito allora AB : D(AB) → H ammette aggiunto e (AB)∗ ⊂ B ∗ A∗ . (4) Sia A un operatore nello spazio di Hilbert H densamente definito e L : H → H un operatore limitato. Provare, applicando la definizione di aggiunto, che valgono le relazioni: (LA)∗ = A∗ L∗ , (AL)∗ = L∗ A∗ e quindi, in particolare, D(A∗ )L∗ = D((LA)∗ ) e D((AL)∗ ) = L∗ D(A∗ ). Dimostrare anche che vale la relazione: (L + A)∗ = L∗ + A∗ , e quindi, in particolare, D((L + A)∗ ) = D(L∗ ) ∩ D(L∗ ) = D(A∗ ). (5) Sia A operatore simmetrico sullo spazio di Hilbert H. Provare che se A : D(A) → H è biettivo allora è autoaggiunto. Tenere conto del fatto che, come si dimostra dal teorema spettrale per operatori autoaggiunti non limitati che vedremo più avanti, l’inverso di un operatore autoaggiunto (quando esiste) è autoaggiunto. Suggerimento. Se A è simmetrico lo è A−1 : H → D(A). Questo è definito su tutto lo spazio di Hilbert per cui è autoaggiunto. (6) Nel seguito se A è un operatore su H, il commutante {A}0 è l’insieme degli operatori di B(H) per cui BA ⊂ AB. Sia A : D(A) → H operatore nello spazio di Hilbert H. Provare che se D(A) è denso e A è chiuso, allora {A}0 ∩ {A∗ } è una sotto ∗-algebra di B(H) con unità ed è chiusa rispetto alla topologia forte. Dimostrare che se A è autoaggiunto ed è definito su tutto H, allora l’algebra di von Neumann ({A}0 )0 coincide con l’algebra di von Neumann generata da {A} nel senso di (3) in esempi 3.3. 5.3 Alcune importanti applicazioni: operatore posizione e operatore impulso. Come esempi del formalismo introdotto in questo capitolo fino a questo punto, introduciamo e studiamo alcune caratteristiche di due operatori autoaggiunti, di grande importanza in Meccanica Quantistica, che si chiamano rispettivamente operatore posizione ed operatore impulso. Il significato fisico di tali operatori sarà chiarito nella seconda parte del trattato. Nel seguito adotteremo le convenzioni le definizioni e le notazioni usate nella sezione 3.6. x = (x1 , . . . , xn ) denota il punto generico di Rn . 5.3.1 L’operatore posizione. Definizione 5.7. Consideriamo l’operatore in H := L2 (Rn , dx), dove dx è la misura di Lebesgue su Rn e i è un numero in {1, 2, . . . , n}, dato da: (Xi f )(x) = xi f (x) , 144 (5.9) con dominio: § D(Xi ) := f ∈ L2 (Rn , dx) Z Rn |xi f (x)|2 dx < +∞ ª . (5.10) Questo operatore si chiama operatore posizione rispetto alla coordinata i-esima. Proposizione 5.4. Si consideri l’operatore Xi definito in (5.9) con dominio definito in (5.10). Valgono i seguenti fatti. (a) L’operatore Xi è autoaggiunto. (b) Xi D(Rn ) e Xi S(Rn ) sono dei core per Xi e quindi: Xi = Xi D(Rn ) = Xi S(Rn ) . Prova. (a) Il dominio di Xi è sicuramente denso in H in quanto include lo spazio D(Rn ) delle funzioni infinitamente differenziabili a supporto compatto e anche lo spazio delle funzioni di Schwartz S(Rn ) (vedi notazione 3.3) che sono entrambi densi in L2 (Rn , dx). Quindi Xi è chiudibile ed ammette aggiunto. Dalla definizione di Xi e del suo dominio risulta immediatamente che (g|Xi f ) = (Xi g|f ) se f, g ∈ D(Xi ). Di conseguenza Xi è hermitiano e simmetrico. Mostriamo che è anche autoaggiunto. Dato che, per la simmetria Xi ⊂ Xi∗ è sufficiente provare che D(Xi∗ ) = D(Xi ). Determiniamo l’aggiunto di Xi direttamente dalla definizione. f ∈ D(Xi∗ ) se e solo se esiste h ∈ L2 (Rn , dx) per cui: Z Z Rn f (x)xi g(x)dx = per ogni g ∈ D(Xi ). Infine: h(x)g(x)dx Rn Xi∗ : f 7→ h . Dato che D(Xi ) è denso e vale Z Rn [xi f (x) − h(x)]g(x)dx = 0 per ogni g ∈ D(Xi ), possiamo anche dire che: f ∈ L2 (Rn , dx) appartiene a D(Xi∗ ) se e solo se xi f (x) = h(x) quasi ovunque, con h ∈ L2 (Rn , dx). In definitiva, D(Xi∗ ) è composto da tutte e sole funzioni f ∈ L2 (Rn , dx) per cui Z Rn |xi f (x)|2 dx < +∞ , e quindi D(Xi∗ ) = D(Xi ) e Xi è autoaggiunto. (b) Se definiamo l’operatore Xi come abbiamo fatto sopra, eccetto per il fatto che restringiamo il suo dominio allo spazio D(Rn ) delle funzioni infinitamente differenziabili a supporto compatto, oppure S(Rn ), l’operatore ottenuto in tal modo cessa di essere autoaggiunto, ma rimane simmetrico come è immediato provare. Notiamo che gli aggiunti di Xi D(Rn ) e Xi S(Rn ) coincidono 145 entrambi con l’operatore Xi∗ già trovato sopra. Questo perché nella costruzione di Xi∗ abbiamo solo usato il fatto che Xi è l’operatore che moltiplica per xi su un dominio denso: che fosse D(Xi ) definito in (5.10) o un suo sottospazio non cambiava il risultato. Definendo Xi come in (5.9) e (5.10), il suo aggiunto Xi∗ deve soddisfare Ker(Xi∗ ± iI) = {0} per (b) del teorema 5.2. Ma dato che Xi∗ è lo stesso che si ottiene restringendo il dominio di Xi a D(Rn ) o S(Rn ), valendo (b) del teorema 5.3, l’operatore Xi , con dominio ristretto, risulta essere essenzialmente autoaggiunto. L’ultima proposizione è conseguenza immediata di (d) in proposizione 5.2. 2 5.3.2 L’operatore impulso. Passeremo ora ad introdurre l’operatore impulso. Abbiamo bisogno di una definizione preliminare. Ricordiamo che che f : Rn → C è una funzione localmente integrabile su Rn se f · g è in L1 (Rn , dx) per ogni funzione g ∈ D(Rn ). Definizione 5.8. Sia f localmente integrabile. Se α è un multi indice, diremo che h : Rn → C è la α-esima derivata di f in senso debole, e scriveremo w-∂ α f = h, se h : Rn → C è localmente integrabile e vale Z |α| Z h(x)g(x) dx = (−1) Rn Rn f (x)∂xα g(x) dx (5.11) per ogni funzione g ∈ D(Rn ). Note. (1) La derivata in senso debole, se esiste è univocamente determinata (a meno di un insieme di misura nulla): se h e h0 sono localmente integrabili e soddisfano (5.11), allora Z (h(x) − h0 (x))g(x) dx = 0 (5.12) Rn per ogni funzione g ∈ D(Rn ). Ma allora h(x) − h0 (x) = 0 quasi ovunque per il lemma di Du Bois-Reymond [Vla81], che afferma che φ, localmente integrabile su Rn , è nulla quasi ovunque R se e solo se Rn φ(x)f (x) dx = 0 per ogni f ∈ D(Rn ). (2) È chiaro che, nel caso che f ∈ C |α| (Rn ), la derivata di ordine α in senso debole di f esiste e coincide con quella in senso ordinario (a meno di un insieme di misura nulla). Tuttavia vi sono casi in cui la derivata ordinaria non esiste ed esiste solo quella debole. (3) È chiaro che le funzioni L2 (Rn , dx) sono localmente integrabili essendo D(Rn ) ⊂ L2 (Rn , dx) ed essendo in L1 il prodotto di funzioni L2 . Al fine di introdurre l’operatore impulso, consideriamo l’operatore su H := L2 (Rn , dx), dato da: (Ai f )(x) = −i~ 146 ∂ f (x) , ∂xi dove ~ è una costante positiva, con dominio: D(Ai ) := D(Rn ). Dalla definizione di Ai e del suo dominio risulta immediatamente che (g|Ai f ) = (Ai g|f ) se f, g ∈ D(Ai ). Di conseguenza Ai è hermitiano e simmetrico. Mostriamo che Ai è anche essenzialmente autoaggiunto. Determiniamo l’aggiunto di Ai che si indica con Pi := A∗i direttamente dalla definizione. Per f ∈ D(Pi ) deve esistere φ ∈ L2 (Rn , dx) per cui: Z f (x)g(x)dx = −i~ Rn Z φ(x) Rn ∂ g(x)dx , ∂xi per ogni g ∈ D(Rn ) . (5.13) Prendendo il complesso coniugato ad ambo membri, la condizione (5.13) si esprime dicendo che: φ ∈ L2 (Rn , dx) appartiene a D(Pi ) se e solo se ammette derivata in senso debole f che appartiene a L2 (Rn , dx). Infine Pi : φ 7→ f . Definizione 5.9. Consideriamo l’operatore in H := L2 (Rn , dx), dove dx è la misura di Lebesgue su Rn e i è un numero in {1, 2, . . . , n}, dato da: (Pi f )(x) = −i~w- ∂ f (x) , ∂xi (5.14) con dominio: n ∂ D(Pi ) := f ∈ L2 (Rn , dx) esiste w- ∂x f ∈ L2 (Rn , dx) i o . (5.15) Pi si dice operatore impulso rispetto alla coordinata i-esima. Nota. Se Rn = R, un modo alternativo, ma equivalente, di definire D(Pi ) è quello di dire che tale spazio è lo spazio di Sobolev H1 (R, dx). Proposizione 5.5. Si consideri l’operatore Pi definito in (5.14) con dominio definito in (5.15). Valgono i seguenti fatti. (a) L’operatore Pi è autoaggiunto. (b) Gli spazi D(Rn ) e S(Rn ) sono dei core per Pi . In altre parole, le restrizioni di Pi a tali spazi date dagli operatori differenziali definiti da: ∂ f (x) , ∂xi ∂ (A0 i f )(x) = −i~ f (x) , ∂xi (Ai f )(x) = −i~ (5.16) (5.17) con, rispettivamente, f ∈ D(Ai ) := D(Rn ) e f ∈ D(A0i ) := S(Rn ), sono essenzialmente autoaggiunti e vale: Ai = A0i = Pi . 147 Prova. Nel seguito indichiamo brevemente la derivata parziale rispetto alla coordinata i-esima con ∂i e l’analoga derivata parziale in senso debole con w-∂i . D(Pi ) è composto dalle funzioni h di L2 (Rn , dx) che ammettono derivata debole a quadrato integrabile e Pi φ = −i~w-∂i φ . Vogliamo provare che Ker(A∗i ± iI) = {0}. Ciò proverebbe, in virtù del teorema 5.3, che A∗i è essenzialmente autoaggiunto, ossia Pi è autoaggiunto. Proveremo che, se f ∈ L2 (Rn , dx) soddisfa i(~w-∂i f ± f ) = 0 , (5.18) allora f (x) = e±x/~ g(x) dove g è costante lungo xi . Quindi, affinché f ∈ L2 (Rn , dx), deve essere g = 0 identicamente, da cui Ker(Pi ± iI) = {0}. Per dimostrare quanto voluto, notiamo che se f soddisfa (5.18) allora vale: w-∂i e±xi /~ f = 0 , (5.19) Ci riduciamo quindi a provare che vale il seguente fatto. Lemma. Se h : Rn → C è localmente integrabile e soddisfa w-∂i h = 0 , (5.20) allora h coincide quasi ovunque con una funzione costante nella variabile xi . Prova del lemma. Per fissare le idee supporremo n = 2 e i = 1 ed indicheremo con (x, y) le coordinate di R2 . Il caso di Rn è una generalizzazione immediata; di fatto la dimostrazione è la stessa: basta pensare inglobate nella variabile y le coordinate diverse da xi . Assumiamo dunque che h localmente integrabile soddisfi la condizione (5.20), che scriveremo esplicitamente: Z ∂ h(x, y) g(x, y)dx ⊗ dy = 0 , per ogni g ∈ D(R) . (5.21) 2 ∂x R Sia f ∈ D(R2 ) e scegliamo a > 0 sufficientemente grande in modo che valga suppf ⊂ [−a, a] × R [−a, a]. Definiamo χ ∈ D(R) per cui suppχ = [−a, a] e R χ(x)dx = 1. Allora esiste una funzione g ∈ D(R2 ) tale che Z ∂ g(x, y) = f (x, y) − χ(x) f (u, y)du . ∂x R Infatti basta considerare: Z x g(x, y) := f (u, y)du − −∞ Z x Z χ(u)du −∞ f (u, y)du . R Questa funzione è C ∞ per costruzione, la sua derivata in x coincide con f (x, y) − χ(x) Z f (u, y)du . R 148 (5.22) Inoltre il supporto di g è limitato: se |y| > a, f (u, y) = 0 qualunque sia u per cui g(x, y) = 0 qualunque sia x. Se x < −a si annullano il primo integrale in (5.22) ed anche il secondo visto che χ ha supporto in [−a, a]. Viceversa, se x > a vale: Z +∞ g(x, y) := f (u, y)du − 1 −∞ Z f (u, y)du = 0 , R R dove abbiamo tenuto conto delle condizioni suppχ = [−a, a] R χ(x)dx = 1. In definitiva g si annulla fuori da [−a, a] × [−a, a]. Inserendo g in (5.21) ed usando il teorema di Fubini-Tonelli, troviamo: Z Z Z h(x, y)f (x, y) dx ⊗ dy − h(x, y)χ(x)dx f (u, y) du ⊗ dy = 0 . R2 R2 R Cambiando nome alle variabili: Z § Z ª h(x, y) − h(u, y)χ(u)du f (x, y) dx ⊗ dy = 0 , R2 (5.23) R essendo f una funzione qualsiasi di D(R2 ). Si osservi che la funzione (x, y) 7→ k(y) := Z h(u, y)χ(u)du R è localmente integrabile su R2 , perché (x, y, u) 7→ f (x, y)h(u, y)χ(u) è integrabile su R3 per ogni f ∈ D(R2 ) (basta notare che |f (x, y)| ≤ |f1 (x)||f2 (y)| per f1 e f2 opportune in D(R)). La (5.23), valida per ogni f ∈ D(R2 ), implica immediatamente che h(x, y) − Z h(u, y)χ(u)du = 0 R quasi ovunque su R2 per il lemma di Du Bois-Reymond (vedi (1) in note dopo definizione 5.8). In altre parole: h(x, y) = k(y) quasi ovunque su R2 . 2 Abbiamo conseguentemente provato che Pi è autoaggiunto e che Ai è essenzialmente autoaggiunto e il suo aggiunto (che coincide con la chiusura per (d) do proposizione 5.2) è Pi stesso. Dato che D(Rn ) ⊂ S(Rn ), con la stessa procedura usata sopra, abbiamo che, che se φ ∈ D(A0 ∗i ) allora φ ammette derivata generalizzata e vale: ∗ A0 i φ = −i~ w − 149 ∂ φ. ∂xi Usando la stesa procedura seguita sopra, si prova immediatamente che A0i è essenzialmente autoaggiunto. Essendo Ai ⊂ A0i ed essendo anche Ai essenzialmente autoaggiunto, deve allora valere che A0 ∗∗ = A0 = A∗∗ = A = Pi per (d) di proposizione 5.2. 2 Esiste un altro modo per introdurre l’operatore Pi . Consideriamo la trasformata di Fourier-Plancherel F̂ : L2 (Rn , dx) → L2 (Rn , dk) vista nella sezione 3.6. Useremo le stesse notazioni usate in tale sezione. Definiamo nello spazio L2 (Rn , dk) l’analogo dell’operatore Xi introdotto sopra, che però indicheremo con Ki dato che le coordinate di Rn vengono indicate con (k1 , . . . , kn ) nello spazio “di arrivo” della trasformata di Fourier-Plancherel. Dato che F̂ una trasformazione unitaria, l’operatore F̂−1 Ki F̂ sarà autoaggiunto se definito sul dominio F̂−1 D(Ki ). Proposizione 5.6. Se Ki è l’operatore posizione rispetto alla coordinata i-esima nello spazio di arrivo della trasformata di Fourier-Plancherel F̂ : L2 (Rn , dx) → L2 (Rn , dk), vale: Pi = ~ F̂−1 Ki F̂ . Prova. Per provare ciò è sufficiente mostrare che i due operatori coincidono su un dominio in cui sono essenzialmente autoaggiunti. Consideriamo lo spazio S(Rn ). Come sappiamo dalla sezione 3.6, la trasformata di Fourier-Plancherel si riduce alla trasformata di Fourier su tale spazio e vale: F̂(S(Rn )) = S(Rn ). Inoltre, direttamente dalle proprietà della trasformata di Fourier abbiamo che, se g ∈ S(Rn ) e Z 1 f (x) = eik·x g(k) dk (2π)n/2 Rn allora ∂ 1 −i~ f (x) = ∂xi (2π)n/2 Z Rn eik·x ~kg(k) dk . In altre parole abbiamo ottenuto che Pi S(Rn ) = ~ F̂−1 Ki S(Rn ) F̂ Notiamo che Ki è essenzialmente autoaggiunto su S(Rn ) per la proposizione 5.4 per cui lo è anche ~ F̂−1 Ki S(Rn ) F̂ su S(Rn ) essendo F unitaria. In effetti tale operatore coincide con l’operatore A0i introdotto nella proposizione 5.5. Dato che anche Pi S(Rn ) è essenzialmente autoaggiunto e che le estensioni autoaggiunte di operatori essenzialmente autoaggiunti sono uniche e coincidono con la chiusura dell’operatore, concludiamo che Pi = ~ F̂−1 Ki S(Rn ) F̂ = ~ F̂−1 Ki S(Rn ) F̂ = ~ F̂−1 Ki F̂ . Questo conclude la dimostrazione 2. 150 5.4 Criteri di esistenza ed unicità per le estensioni autoaggiunte. Per concludere il capitolo presentiamo ancora alcuni utili criteri per stabilire se un operatore ammette estensioni autoaggiunte. 5.4.1 La trasformata di Cayley e gli indici di difetto. Lo strumento tecnico centrale per dimostrare questi criteri è la cosiddetta trasformata di Cayley che introduciamo nel seguito. Prima estendiamo il concetto di isometria agli operatori con dominio più piccolo di tutto lo spazio di Hilbert. Definizione 5.10. Un operatore U nello spazio di Hilbert H, con dominio dato dal sottospazio D(U ), è detto isometria, se vale (U x|U y) = (x|y) , per ogni coppia x, y ∈ D(U ). Note (1) È chiaro che se D(U ) = H la definizione di isometria data sopra individua gli operatori isometrici nel senso della definizione 3.9. (2) Per l’esercizio (1) in esercizi 3.2, la definizione di isometria data sopra equivale a richiedere che U soddisfi ||U x|| = ||x||, per ogni x ∈ D(U ). La trasformazione: t−i t+i definisce una corrispondenza biunivoca tra la retta reale R ed il cerchio di raggio 1, centrato nell’origine, nel piano complesso C, escluso il punto 1. Esiste una generalizzazione di tale corrispondenza che associa operatori isometrici ad operatori simmetrici. Questa corrispondenza, di cui studieremo solo alcune proprietà, è la trasformata di Cayley. t 7→ Teorema 5.4. Sia H uno spazio di Hilbert. (a) Se A è un operatore simmetrico in H, l’operatore V := (A − iI)(A + iI)−1 , (5.24) detto trasformata di Cayley dell’operatore A, definisce un’isometria suriettiva dallo spazio Ran(A + iI) allo spazio Ran(A − iI). (b) Se vale (5.24) allora valgono i seguenti fatti: (i) D(A) = Ran(I − V ); (ii) I − V è iniettivo e, su D(A) = Ran(I − V ), A si ricostruisce come: A := i(I + V )(I − V )−1 . 151 (5.25) (c) A operatore simmetrico in H è autoaggiunto se e solo se la sua trasformata di Cayley V è un operatore unitario su H. (d) Sia V operatore unitario su H. Se I − V è iniettivo, V è la trasformata di Cayley di un operatore simmetrico in H. Prova. (a) Per computo diretto, usando la simmetria di A e le proprietà di (anti-)linearità del prodotto scalare, si verifica subito che, se f ∈ D(A): ||(A ± iI)f ||2 = ||Af ||2 + ||f ||2 . (5.26) Di conseguenza, se (A ± iI)f = 0, allora f = 0. Gli operatori A ± iI sono quindi iniettivi su D(A) e quindi V è ben definita dallo spazio Ran(A + iI) allo spazio Ran(A − iA) ed è suriettiva per costruzione. Proviamo che V è anche isometrica. Da (5.26) segue che, per ogni g ∈ D(A) ||(A − iI)g|| = ||(A + iI)g|| . Se poniamo g = (A + iI)−1 f , per f ∈ Ran(A + iI), troviamo immediatamente: ||(A − iI)(A + iI)f || = ||f || , per cui V definisce un’isometria suriettiva dallo spazio Ran(A + iI) allo spazio Ran(A − iA). (b) Per definizione, D(V ) è costituito dai vettori g = (A + iI)f per f ∈ D(A). Applicando V a g troviamo V g = (A − iI)f . Aggiungendo e togliendo g = (A + iI)f membro a membro, si ottengono le relazioni: (I + V )g = 2Af , (5.27) (I − V )g = 2if . (5.28) (5.28) mostra che (I − V ) è iniettiva in quanto, se (I − V )g = 0 allora f = 0 e quindi g = (A + iI)f = 0. Possiamo allora scrivere, se f ∈ D(A): g = 2i(I − V )−1 f . Inoltre Ran(I − V ) = D(A). Applicando (I + V ) ad ambo membri ed usando (5.27) otteniamo: Af = i(I + V )(I − V )−1 f per ogni f ∈ D(A). (c) Supponiamo che A = A∗ . Per il teorema 5.2, deve accadere che Ran(A+iI) = Ran(A−iI) = H. Allora, per il teorema 5.4, V è isometrica su Ran(A + iI) = H ed è suriettiva, dato che la sua immagine è Ran(A − iI) = H. Quindi V è unitaria. Supponiamo ora che V sia un operatore unitario su H. Allora il suo dominio e la sua immagine devono coincidere con H, ossia deve essere Ran(A + iI) = Ran(A − iI) = H. Questo equivale a 152 dire che A = A∗ per il teorema 5.2. (d) Per ipotesi, c’è una corrispondenza biettiva z 7→ x, tra D(V ) = H e Ran(I − V ), data da x := z − V z . Definiamo l’operatore S : Ran(I − V ) → H, dato da: Sx := i(z + V z) , se x = z − V z. (5.29) Se x, y ∈ D(S) = Ran(I − V ), allora x = z − V z e y = u − V u per qualche coppia z, u ∈ D(V ). Dato che V è un’isometria, vale che: (Sx|y) = i(z + V z|u − V u) = i(V z|u) − i(z|V u) = (z − V z|iu + iV u) = (x|Sy) , e quindi S è hermitiano. Per provare che è anche simmetrico, notiamo che D(S) = Ran(I − V ) è denso. Infatti [Ran(I − V )]⊥ = Ker(I − V ∗ ). Se non fosse Ker(I − V ∗ ) = {0}, ci sarebbe u ∈ H, non nullo, tale che V ∗ u = u e allora, applicando V ad ambo membri, u = V u. Questo è impossibile perché I − V è iniettivo per ipotesi. Per concludere, proviamo che V è la trasformata di Cayley di S. La (5.29) può essere riscritta nella forma 2iV z = Sx − ix , 2iz = Sx + ix , se z ∈ H. Allora: V (Sx + ix) = Sx − ix per x ∈ D(S) e H = D(V ) = Ran(S + iI). Ma allora V è la trasformata di Cayley di S perché vale: V (S + iI) = S − iI e quindi: V = (S − iI)(S + iI)−1 . Questo conclude la dimostrazione del teorema. 2 Nota. Dall’enunciato e dalla dimostrazione del teorema risulta che se A è simmetrico allora Ker(A ± iI) = {0}. In generale però non accade anche che Ker(A∗ ± iI) = {0}! Quest’ultima è una condizione molto più forte che equivale alla essenziale autoaggiunzione di A (se A è simmetrico) per il teorema 5.3. Passiamo alle conseguenze del teorema 5.4 nello studio dell’esistenza di estensioni autoaggiunte di un operatore simmetrico. Il primo dei teoremi a riguardo è il seguente, che introduce i cosiddetti indici di difetto. Teorema 5.5. Sia A un operatore simmetrico sullo spazio di Hilbert H. Definiti gli indici di difetto: d± (A) := dim Ker(A∗ ± iI) , vale quanto segue: (a) A ammette estensioni autoaggiunte se e solo se d+ (A) = d− (A); (b) Se d+ (A) = d− (A), esiste una corrispondenza biunivoca tra estensioni autoaggiunte di A ed 153 operatori isometrici suriettivi da Ker(A∗ − iI) a Ker(A∗ + iI). (A ammette tante estensioni autoaggiunte quanti sono gli operatori isometrici suriettivi suddetti e, in particolare, A ammette più di una estensione autoaggiunta se d+ (A) = d− (A) > 0.) Nota. Gli indici di difetto possono definirsi equivalentemente come: d± (A) := dim [Ran(A ∓ iI)]⊥ , dato che Ker(A∗ ± iI) = [Ran(A ∓ iI)]⊥ . Prova del teorema 5.5. Consideriamo la trasformata di Cayley V di A. Supponiamo che A ammetta un’estensione autoaggiunta B. Sia U : H → H la trasformata di Cayley di B. È immediato provare che U è un’estensione di V usando (5.24) e tenendo conto che (B + iI)−1 estende (A + iI)−1 e B − iI estende A − iI. Di conseguenza, U trasforma Ran(A + iI) in Ran(A − iI). Essendo U unitario, si ha che y ⊥ Ran(A + iI) se e solo se U y ⊥ U (Ran(A + iI)). In altre parole U ([Ran(A + iI)]⊥ ) = [Ran(A − iI)]⊥ . Per (d) di proposizione 3.6, questo equivale a dire U (Ker(A∗ + iI)) = Ker(A∗ − iI). Dato che U è un’isometria, deve allora essere dim Ker(A∗ + iI) = dim Ker(A∗ − iI) ossia d+ (A) = d− (A). Mostriamo che, viceversa, se valed+ = d− , allora A ammette estensioni autoaggiunte e queste non sono uniche se d+ (A) = d− (A) > 0. Sia V la trasformata di Cayley di A. Dato che V è limitata, usando gli esercizi svolti in (3) e (4) in esercizi 3.1, possiamo estendere V , in modo unico, ad un operatore isometrico da U : Ran(A + iI) → Ran(A − iI). Possiamo fare la stessa cosa per V −1 , estendendola, in modo unico, ad un operatore isometrico da Ran(A − iI) a Ran(A + iI). È chiaro che, per continuità, tale operatore deve essere U −1 : Ran(A − iI) → Ran(A + iI). ⊥ Ricordiamo che Ran(A ± iI) = [Ran(A ± iI)]⊥ = Ker(A∗ ∓ iI). Nell’ipotesi di d+ (A) = d− (A), possiamo definire un operatore unitario U0 : Ker(A + iI) → Ker(A − iI). Valendo le decomposizioni ortogonali di sottospazi chiusi H = Ran(A + iI) ⊕ Ker(A∗ − iI) = Ran(A − iI) ⊕ Ker(A∗ + iI) , l’operatore W : (x, y) := U ⊕ U0 :7→ (U x, U0 y) , con x ∈ Ran(A + iI) e y ∈ Ker(A∗ − iI) , è un operatore unitario su H. Inoltre I − W è iniettivo. Infatti, Ker(I − W ) consiste nelle coppie (x, y) 6= (0, 0) con U x = x e U0 y = y: la prima equazione ammette solo la soluzione x = 0 perché U è un’isometria e la seconda equazione implica che y ∈ Ker(A∗ +iI)∩Ker(A∗ −iI) che produce subito y = 0. Possiamo allora applicare (d) del teorema 5.4: W è la trasformata di Cayley di un operatore B simmetrico, che risulta essere autoaggiunto per (c) dello stesso teorema. Dato che W estende U , B è un’estensione autoaggiunta di A. La scelta dell’operatore unitario U0 può essere fatta in più modi se d+ (A) = d− (A) > 0, tale scelta definisce diverse estensioni autoaggiunte di A. Mostriamo ora che la corrispondenza tra le estensioni autoaggiunte di A e gli operatori isometrici 154 suriettivi U0 è biunivoca. I punti (a) e (b) del teorema 5.4 implicano immediatamente che, due operatori simmetrici sono diversi se e solo se le loro trasformate di Cayley sono diverse. Consideriamo allora le estensioni autoaggiunte dell’operatore A. Ogni estensione autoaggiunta, B, individua una trasformata di Cayley W unitaria che estende l’operatore U (definito sopra) in un operatore unitario su H. Dato che U : Ran(A + iI) → Ran(A − iI) è isometrico suriettivo, che valgono le decomposizioni H = Ran(A + iI) ⊕ Ker(A∗ − iI) = Ran(A − iI) ⊕ Ker(A∗ + iI) , e che infine W estende U , ciò può accadere solo se W determina un isometria suriettiva U0 : Ker(A∗ − iI) → Ker(A∗ + iI). Due estensioni autoaggiunte B, B 0 distinte devono individuare due operatori U0 , U00 distinti, altrimenti le trasformate di Cayley W, W 0 dei due operatori coinciderebbero e quindi gli operatori coinciderebbero a loro volta. Abbiamo ottenuto che l’applicazione che manda l’estensione autoaggiunta di A, B nell’associata isometria suriettiva U0 è iniettiva. Questa applicazione è anche suriettiva, dato che, come visto sopra, la scelta dell’isometria suriettiva U0 determina un’estensione autoaggiunta di A: l’unica che ha trasformata di Cayley data da W := U ⊕ U0 . 2 Una prima importante conseguenza del teorema 5.5 è la seguente. Teorema 5.6. Un operatore simmetrico A sullo spazio di Hilbert H è essenzialmente autoaggiunto se e solo se ammette un’unica estensione autoaggiunta. Prova. Se A è essenzialmente autoaggiunto allora ammette un’unica estensione autoaggiunta come noto da (d) di proposizione 5.2. Per il teorema 5.5, se A è simmetrico ammette estensioni autoaggiunte solo se d+ = d− . In particolare, se ammette un’unica estensione autoaggiunta deve essere d+ = d− = 0. Ma allora, per (b) del teorema 5.3, A è essenzialmente autoaggiunto. 2 5.4.2 Criteri di Von Neumann e di Nelson. Un secondo teorema che enunceremo e dimostreremo ora è in realtà un corollario del teorema 5.4. Tale teorema è dovuto a von Neumann. Abbiamo bisogno di due definizioni preliminari. Definizione 5.10. Siano X e X0 spazi vettoriali sul campo complesso dotati di prodotto scalare hermitiano ( | )V e ( | )V 0 rispettivamente. Una funzione V : X → X è detta operatore antiunitario se soddisfa le seguenti proprietà: (a) antilinearità : V (αx + βy) = αV x + βV y per ogni x, y ∈ X, α, β ∈ C; (b) antiisometricità: (V x|V y)X0 = (x|y)X per ogni x, y ∈ X; 155 Nota. Notare la coniugazione complessa a secondo membro in (b). Si osservi che vale ||V z||X0 = ||z||X per ogni z ∈ X. Definizione 5.11. Se (H, ( | )) è uno spazio di Hilbert, un operatore antiunitario C : H → H è detto coniugazione oppure equivalentemente operatore di coniugazione se è involutivo, cioè se soddisfa: CC = I . Nota. Una coniugazione è definita su uno spazio vettoriale complesso con prodotto scalare hermitiano e, in generale, non è un’involuzione nel senso della definizione 3.8, che è invece definita su un’algebra. Teorema 5.7 (von Neumann). Sia A è un operatore simmetrico nello spazio di Hilbert H. Se esiste una coniugazione C : H → H tale che valga C(D(A)) ⊂ D(A) ed anche AC = CA . allora A ammette estensioni autoaggiunte. Prova. Mostriamo prima di tutto che C(D(A∗ )) ⊂ D(A∗ ) e che vale anche A∗ C = CA∗ . Infatti, dalla definizione di aggiunto (A∗ f |Cg) = (f |ACg) per ogni f ∈ D(A∗ ) e g ∈ D(A). Usando il fatto che C è antiunitaria: (CCg|CA∗ f ) = (CACg|Cf ). Dato che C commuta con A e CC = I, si ha ancora (g|CA∗ f ) = (Ag|Cf )), ossia (CA∗ f |g) = (Cf |Ag) per ogni f ∈ D(A∗ ) e g ∈ D(A). Dalla definizione di aggiunto, questo significa che Cf ∈ D(A∗ ) se f ∈ D(A∗ ) e CA∗ f = A∗ Cf . Passiamo a provare l’esistenza delle estensioni autoaggiunte facendo uso del teorema 5.5. In base a quanto appena provato, se A∗ f = if , applicando C ad ambo membri ed usando il fatto che C sia anti lineare e commuti con A∗ , troviamo: A∗ Cf = −iCf . Per cui C è un’applicazione (iniettiva perché conserva la norma) da Ker(A∗ − iI) a Ker(A∗ + iI). Tale applicazione è anche suriettiva in quanto, se vale A∗ g = −ig, definendo f := Cg troviamo che deve essere A∗ f = +if e, riapplicando C a f (tenendo conto di CC = I), troviamo Cf = g. Quindi C è un’applicazione biettiva da Ker(A∗ − iI) a Ker(A∗ + iI). Il fatto che sia anche antiisometrica, e quindi preservi l’ortonormalità di vettori, comporta subito che trasformi biettivamente basi hilbertiane in basi hilbertiane, in particolare quindi, conservandone la cardinalità. Allora deve essere d+ (A) = d− (A). Per il teorema 5.4 vale la tesi. 2 Introduciamo ora l’utile criterio di Nelson. Sono necessarie alcune definizioni. Definizione 5.11. Sia A operatore nello spazio di Hilbert H. (a) Un vettore ψ ∈ D(A) tale che, An ψ ∈ D(A) per ogni n ∈ N (A0 := I), è detto vettore C ∞ per A ed il sottospazio vettoriale di H dei vettori C ∞ per A si indica con C ∞ (A). (b) ψ ∈ C ∞ (A) è detto vettore analitico per A, se vale: +∞ X ||An ψ|| n t < +∞ , n! n=0 156 per qualche t > 0; (d) ψ ∈ C ∞ (A) è detto vettore di unicità per A, se l’operatore A Dψ è essenzialmente autoaggiunto come operatore nello spazio di Hilbert Hψ := Dψ , dove Dψ è il sottospazio di H delle combinazioni lineari (finite) vettori An ψ con n = 0, 1, 2 . . . . Nota. Se ψ è un vettore analitico per A, la serie +∞ X ||An ψ|| n t , n! n=0 converge per qualche t > 0. Allora, per i noti teoremi di convergenza sulle serie di potenze, convergerà assolutamente ed uniformemente +∞ X ||An ψ|| n z , n! n=0 per ogni z ∈ C con |z| < t. Ulteriormente convergeranno, per |z| < t, anche le serie delle derivate di ogni ordine, cioè le serie: +∞ X ||An+p ψ|| z n! , n! n=p per ogni fissato p = 1, 2, 3, . . .. Quest’ultimo fatto ha un’importante conseguenza, di verifica immediata usando ripetutamente la disuguaglianza triangolare e la proprietà di omogeneità della norma: se ψ è un vettore analitico per A operatore nello spazio di Hilbert H, allora tutti vettori in Dψ sono vettori analitici per A. Più precisamente, se la serie +∞ X ||An ψ|| n t , n! n=0 converge per t > 0 e φ ∈ Dψ , allora la serie +∞ X ||An φ|| n s , n! n=0 converge per ogni s ∈ C con |s| < t. Vale la seguente proposizione nota anche come Lemma di Nussbaum. Proposizione 5.7 (Nussbaum). Sia A operatore simmetrico nello spazio di Hilbert H. Se D(A) contiene un insieme di vettori di unicità le cui combinazioni lineari formano un insieme denso in H, allora A è essenzialmente autoaggiunto. 157 Prova. È sufficiente provare che gli spazi Ran(A ± iI) sono densi, per il teorema 5.3. Nelle ipotesi fatte, dati φ ∈ H e > 0, ci sarà una combinazione lineare finita di vettori di unicità P ψi con ||φ − N i=1 αi ψi || < /2. Dato che ψi ∈ Hψ e A Dψ è essenzialmente autoaggiunto, per −1 P N . Allora, posto il teorema 5.3, esiste ηi ∈ Hψ con ||(A Dψ +iI)ηi − ψi || ≤ /2 j=1 |αj | PN P α η e ψ := α ψ , vale η ∈ D(A) e η := N i=1 i i i=1 i i ||(A + iI)η − φ|| ≤ ||(A Dψ +iI)η − ψ|| + ||φ − ψ|| < . Dato che > 0 è arbitrario, Ran(A + iI) è denso. La prova per Ran(A − iI) è analoga. 2 La proposizione precedente permette di dimostrare il teorema di Nelson la cui dimostrazione richiede alcuni risultati di teoria spettrale per operatori autoaggiunti non limitati che vedremo nel capitolo 8, ma che sono indipendenti dal teorema di Nelson stesso. Teorema 5.8 (Nelson). Sia A un operatore simmetrico nello spazio di Hilbert H. Se D(A) contiene un insieme di vettori analitici per A le cui combinazioni lineari finite sono dense in H, allora A è essenzialmente autoaggiunto. Prova. Per la proposizione 5.7 è sufficiente provare che, nelle ipotesi fatte, ogni vettore analitico ψ0 per A è anche vettore di unicità per A. Notiamo che A Dψ0 è sicuramente un operatore simmetrico in Hψ0 := Dψ0 , dato che è hermitiano e il suo dominio è denso in Hψ0 . Supponiamo che A Dψ0 ammetta un’estensione autoaggiunta B in Hψ0 . (Nota: stiamo parlando di estensioni autoaggiunte di A Dψ0 nello spazio di Hilbert Hψ0 , non in H!) Sia µψ la misura spettrale di (B) ψ ∈ Dψ0 rispetto a B (cfr (c) in teorema 8.4, cap 8) definita come µψ (E) := (ψ|PE ψ) per (B) ogni insieme di Borel E ⊂ σ(B) ⊂ R, dove PE è la misura a valori di proiezione associata all’operatore autoaggiunto B. Dato che ψ0 è analitico, +∞ X ||An ψ0 || n t0 < +∞ , n! n=0 per qualche t0 > 0. Quindi, per quanto detto nella nota dopo la definizione 5.11. +∞ X ||An ψ|| n t < +∞ , n! n=0 per ogni t < t0 con t ≥ 0. Se z ∈ C e 0 < |z| < t0 allora: n +∞ +∞ X z n Z X z n n x dµψ (x) = 1·|x |dµ (x) ≤ ψ n! n! σ(B) n=0 σ(B) n=0 n=0 +∞ XZ = +∞ X tn 0 n! n=0 n ||ψ|| ||B ψ|| = ||ψ|| 158 +∞ X tn 0 n! n=0 tn0 n! Z 1/2 Z dµψ (x) σ(B) ||An ψ|| < +∞ . 1/2 2n x dµψ (x) σ(B) Il teorema di Fubini-Tonelli implica che, se 0 < |z| < t0 , possiamo scambiare il simbolo di serie con quello di integrale in Z +∞ X zn xn dµψ (x) . σ(B) n=0 n! Allora, se 0 ≤ |z| < t0 e se ψ appartiene al dominio di ezB (cfr definizione 9.2) (ψ|ezB ψ) = Z σ(B) ezx dµψ (x) = +∞ X +∞ X zn zn n x dµψ (x) = n! σ(B) n=0 n! n=0 Z Z σ(B) xn dµψ (x) = +∞ X zn (ψ|An ψ). n! n=0 In particolare ciò accade sicuramente se z = it (con |t| < t0 ) dato che il dominio di eitB etutto lo spazio di Hilbert: +∞ X (it)n (ψ|eitB ψ) = (ψ|An ψ) . (5.30) n! n=0 (Si osservi che la serie di potenze a secondo membro edi potenze e pertanto essa converge in un disco aperto di raggio t0 , ciò definisce un prolungamento analitico della funzione a primo membro per it rimpiazzato da z in tale disco anche se ψ non appartiene al dominio di ezB .) Consideriamo un’altra estensione autoaggiunta di ADψ0 , B 0 . Ripetendo i ragionamenti di sopra troviamo che, per |t| < t0 : +∞ X (it)n itB 0 (ψ|An ψ) . (5.31) (ψ|e ψ) = n! n=0 (5.30) e (5.31) implicano che, per ogni |t| < t0 e per ogni ψ ∈ Dψ0 : 0 0 (ψ|(eitB − eitB )ψ) = 0 . Dato che Dψ0 è uno spazio denso in Hψ0 , concludiamo che (vedi l’esercizio svolto (2) in esercizi 3.2), per ogni |t| < t0 : 0 eitB = eitB . Calcolando la derivata in senso forte per t = 0, per il teorema di Stone (cfr teorema 8.x cap 8), risulta che (si tenga conto del fatto che t0 > 0 per ipotesi): B = B0 . Concludiamo che tutte le eventuali estensioni autoaggiunte di A Dψ coincidono. Mostriamo che esiste almeno un’estensione autoaggiunta. Definiamo C : Dψ0 → Hψ0 come: C: N X an An ψ0 7→ n=0 N X an An ψ0 . n=0 Si prova facilmente che C si estende in modo unico ad una coniugazione su Hψ0 , che indicheremo ancora con C. Inoltre, per costruzione CA Dψ0 = A Dψ0 C, per cui A Dψ0 ha estensioni 159 autoaggiunte per il teorema 5.7. In conclusione, per ogni vettore analitico ψ0 , A Dψ0 deve essere essenzialmente autoaggiunto in Hψ0 per il teorema 5.6, perché è simmetrico ed ammette esattamente un’estensione autoaggiunta. Abbiamo in questo modo provato che ogni vettore analitico ψ0 è anche vettore di unicità per A. Questo conclude la dimostrazione. 2 Esempi 5.1. (1) Un esempio tipico per applicare il criterio di von Neumann, è il caso dell’operatore di rilevanza fondamentale in Meccanica Quantistica: H := −∆ + V dove ∆ è il solito operatore laplaciano su Rn : n X ∂2 ∆ := , ∂x2i i=1 e V è una funzione localmente integrabile a valor reali. Se definiamo il dominio di H come D(Rn ), risulta subito che H è un operatore simmetrico su L2 (Rn , dx). Definendo C come l’operatore antiunitario che associa ad ogni funzione f ∈ L2 (Rn , dx) la funzione che punto per punto assume i valori complessi coniugati di f , è chiaro che vale CH = HC, per cui H ammette estensioni autoaggiunte. Precisando meglio la natura di V si riesce a provare che H è essenzialmente autoaggiunto. ∂ (2) L’operatore Ai := −i ∂x definito su D(Rn ) (vedi proposizione 5.5), come sappiamo è esi senzialmente autoaggiunto, quindi ammette estensioni autoaggiunte. Esiste una coniugazione C che commuti con Ai ? (Si noti che potrebbe anche non esistere). La coniugazione usata in (1) non commuta con Ai malgrado ammetta il suo dominio come spazio invariante. Un’altra coniugazione è C : L2 (Rn , dx) → L2 (Rn , dx) definita da: (Cf )(x) := f (−x) (quasi ovunque) per ogni f ∈ L2 (Rn , dx). È facile verificare che C(D(Rn )) ⊂ D(Rn ) e che CAi = Ai C. (3) Si consideri lo spazio di Hilbert H := L2 ([0, 1], dx) dove dx è la solita misura di Lebesgue, d e i consideri A := i dx con dominio dato dallo spazio delle funzioni C 1 ([0, 1]) (cioè funzioni di 1 classe C ((0, 1)) che ammettono limiti finiti per la derivata prima in 0 e 1), che si annullano in 0 e in 1. Si verifica immediatamente che l’operatore è hermitiano, usando l’integrazione per parti e tenendo conto che le funzioni si annullano agli estremi di integrazione annullando i termini dovuti al bordo. Inoltre si può verificare che il dominio di A è effettivamente denso, per cui l’operatore A è simmetrico. Mostriamo che A non è essenzialmente autoaggiunto. Infatti, la condizione che g ∈ D(A∗ ) soddisfi A∗ g = ig ovvero A∗ g = −ig si scrive rispettivamente: Z 1 g(x) f 0 (x) ± if (x) dx = 0 0 per ogni f ∈ D(A). Usando l’integrazione per parti, si verifica immediatamente che, le funzioni di L2 ([0, 1], dx) definite da g(x) = ex e g(x) := e−x , soddisfano l’identità di sopra per ogni f di classe C 1 ([0, 1]) che si annulli in 0 e in 1. Queste due ultime condizioni sono fondamentali per verificare l’identità di sopra integrando per parti, in quanto le due funzioni esponenziali non si annullano in 0 e 1. In virtù del teorema 5.3, A non è essenzialmente autoaggiunto. Tuttavia esistono estensioni autoaggiunte a causa del teorema 5.6. Infatti la trasformazione 160 antilineare C : L2 ([0, 1], dx) → L2 ([0, 1], dx) definita da (Cf )(x) := f (1 − x) manda funzioni C 1 ([0, 1]) che si annullano in 0 e 1 in funzioni C 1 ([0, 1]) che si annullano in 0 e 1 ed inoltre d d d d Ci f (x) = −i f (1 − x) = i f (1 − x) = i (Cf )(x) . dx d(1 − x) dx dx per cui CA = AC. Tali estensioni devono essere in numero maggiore di 1, altrimenti A sarebbe essenzialmente autoaggiunto per il teorema 5.5, cosa che sappiamo essere falsa. Si osservi che i risultati ottenuti non cambierebbero considerando differenti domini analoghi a quello usato sopra, in particolare considerando come dominio quello delle funzioni C ∞ ([0, 1]) che si annullano in 0 e 1, oppure quello delle funzioni C ∞ su [0, 1] a supporto compatto contenuto in (0, 1). (4) Si consideri lo spazio di Hilbert H := L2 ([0, 1], dx) dove dx è la solita misura di Lebesgue, e d si consideri A := −i dx con dominio dato dallo spazio delle funzioni C ∞ ([0, 1]) periodiche e con derivate di ogni ordine periodiche, di periodo [0, 1]. L’integrazione per parti prova immediatamente che A è hermitiano. Le funzioni esponenziali en (x) := ei2πnx , per x ∈ [0, 1], con n ∈ Z formano una base hilbertiana di H come segue da (1) in esempi 3.2. Queste funzioni sono tutte contenute in D(A), per cui, essendo lo spazio generato da esse denso in H, D(A) è denso in H e quindi A è simmetrico. Ogni f ∈ H è in corrispondenza biunivoca con la successione dei coefficienti {fn }n∈Z ⊂ l2 (Z) dello sviluppo X f= fn en . n∈Z Abbiamo in tal modo definito un operatore unitario U : H → `2 (Z) tale che U : f 7→ {fn }n∈Z (vedi teorema 3.6). Dalla teoria elementare delle serie di Fourier si verifica facilmente che: U D(A)U −1 =: D(A0 ) è lo spazio delle successioni {fn } di l2 (Z) tali che, per ogni N ∈ N, nN |fn | → 0 per n → +∞. Inoltre, se A0 := U AU −1 e {fn }n∈Z ∈ D(A0 ), A0 : {fn }n∈Z 7→ {2πnfn }n∈Z . Ragionando come per l’operatore Xi nella prova della proposizione 5.4, si verifica subito che X D(A0∗ ) = {gn }n∈Z ⊂ l2 (Z) |2πngn |2 < +∞ . n∈Z e, su questo dominio, A0∗ : {fn } 7→ {2πnfn } . Procedendo come nella prova della proposizione 5.4, si verifica subito che l’aggiunto di questo operatore coincide con l’operatore stesso. Quindi A0∗ è autoaggiunto e A0 è essenzialmente autoaggiunto. Dato che U è unitaria, concludiamo (lo si provi in dettaglio) che anche A è essenzialmente autoaggiunto e che per la sua unica estensione autoaggiunta A, vale A = U A0 U −1 . (5) L’ esempio (4) può essere trattato molto più rapidamente con il criterio di Nelson. Il dominio 161 di A contiene le funzioni en le cui combinazioni lineari sono dense in H := L2 ([0, 1], dx). Vale anche Aen = 2πnen , per cui +∞ X X (2πn)k ||Ak en || k +∞ t = (t)k = e2πnt < +∞ , k! k! k=0 k=0 per ogni t > 0. Quindi A è essenzialmente autoaggiunto. Esercizi 5.2. (1) Si studi l’hermiticità, la simmetria e l’essenziale autoaggiunzione in H = L2 ([0, 1], dx), dell’operatore −d2 /dx2 , con dominio dato dalle funzioni C ∞ ([0, 1]) e (i) periodiche oppure, (ii) che si annullano agli estremi. (2) Si dimostri che le estensioni autoaggiunte dell’operatore nell’esempio (3) sono parametrizzabili da un unico parametro reale. Suggerimento. Si studino le dimensioni di Ker(A∗ ± iI) = Ran(A ∓ iI). (3) Dimostrare che l’operatore in L2 (R, dx) dato da: H := − d2 + x2 . dx2 È essenzialmente autoaggiunto se D(H) := S(R). Suggerimento. Cercare una base hilbertiana di L2 (R, dx) fatta di autovettori di H. (4) Si consideri l’operatore di Laplace in Rn già considerato in (1) in esempi 5.1: ∆ := n X ∂2 i=1 ∂x2i . Si dimostri esplicitamente che ∆ è essenzialmente autoaggiunto sullo spazio di Schwarz S(Rn ) nello spazio di Hilbert L2 (Rn , dx) e dunque ammette una sola estensione autoaggiunta ∆. b : L2 (Rn , dx) → L2 (Rn , dk) è la trasformata di Fourier-Plancherel (vedi Si provi infine che, se F sezione 3.6), vale: b F b −1 f (k) := −k 2 f (k) , F∆ dove k 2 = k12 + k22 + . . . + kn2 , sul dominio naturale dato da: Z § ª 2 n 4 2 f ∈ L (R , dk) k |f (k)| dk < +∞ . Rn Suggerimento. L’operatore ∆ è simmetrico su S(R3 ), pertanto possiamo usare il teorema 5.3 verificando la validità della condizione (b). Notando che lo spazio di Schwarz è invariante sotto b dato dalla trasformata di Fourier-Plancherel come provato nell’azione dell’operatore unitario F b F b −1 . Ò := F∆ la sezione 3.6, possiamo studiare la condizione (b) del teorema 5.3 per l’operatore ∆ 162 Tale operatore è essenzialmente autoaggiunto su S(R3 ) se e solo se lo è ∆ su S(R3 ). L’azione di Ò sulle funzioni di S(Rn ), si riduce alla semplice moltiplicazione per −k 2 = −(k 2 + k 2 + . . . + k 2 ) ∆ n 1 2 che definisce, come si prova subito, un operatore autoaggiunto sul dominio naturale suddetto. Ò ∗ usando la stessa La condizione (b) del teorema 5.3 può allora essere verificata facilmente per ∆ n n definizione di aggiunto ed il fatto che S(R ) ⊃ D(R ). L’unicità dell’estensione autoaggiunta per operatori essenzialmente autoaggiunti prova l’ultima parte dell’esercizio tenendo conto del b è un operatore unitario. fatto che F (5) Ricordando che D(Rn ) indica lo spazio delle funzioni complesse infinitamente differenziabili a supporto compatto su Rn , in riferimento all’esercizio precedente ed indicando con ∆ l’unica estensione autoaggiunta di ∆ : S(Rn ) → L2 (Rn , dx), mostrare che D(Rn ) è un core per ∆. In altre parole ∆D(Rn ) è essenzialmente autoaggiunto e ∆D(Rn ) = ∆. Suggerimento. Per provare quanto richiesto basta dimostrare che (∆ D(Rn ) )∗ = ∆ (per∗ ché da ciò segue che, prendendo l’aggiunto, ∆D(Rn ) = ((∆ D(Rn ) )∗ )∗ = ∆ = ∆). Per provare l’identità detta notiamo che se ψ ∈ D((∆ D(Rn ) )∗ ) allora, per ogni ϕ ∈ D(Rn ), deve valere: (∆ϕ|ψ) = (ϕ|ψ 0 ), dove ψ 0 = (∆ D(Rn ) )∗ ψ ∈ L2 (Rn , dx). Passando in trasforb 0 = −k 2 Fψ, b mata di Fourier-Plancherel si vede subito che, nelle ipotesi fatte, Fψ dato che n 2 n 0 b F(D(R )) è denso in L (R , dk). Abbiamo ottenuto che ψ ∈ D(∆) e ψ = ∆ψ e quindi: (∆ D(Rn ) )∗ ⊂ ∆. Supponiamo viceversa che ψ ∈ D(∆). In questo caso, passando in trab ∈ L2 (Rn , dk) e, per ogni ϕ ∈ D(Rn ) possiamo scrivere: sformata di Fourier-Plancherel −k 2 Fψ R R 2 Fψ b Fψ b = − dk(Fϕ)k b b = (ϕ|∆ψ). Per definizione di operatore aggiunto (∆ϕ|ψ) = − dkk 2 (Fϕ) ∗ abbiamo trovato che: ψ ∈ D((∆D(Rn ) ) ) e (∆D(Rn ) )∗ ψ = ∆ψ. Abbiamo con ciò provato che vale anche l’altra inclusione: (∆D(Rn ) )∗ ⊃ ∆. (6) Ricordiamo che se A è un operatore su H, allora il commutante {A}0 è l’insieme degli operatori di B(H) tali che BA ⊂ AB. Sia A : D(A) → H autoaggiunto. Sia T la trasformata di Cayley di A. Provare che ({A}0 )0 generata da A coincide con l’algebra di von Neumann ({T }0 )0 generata da {T } (vedi (3) in esempi 3.3) 163 Parte II Il formalismo della Meccanica Quantistica e la Teoria Spettrale 164 Capitolo 6 Brevi cenni di fenomenologia dei sistemi quantistici e di Meccanica Ondulatoria. Nella prossima sezione daremo qualche idea generale di che cosa si intenda per sistema quantistico. Le parti successive di questo capitolo possono essere tralasciati dal lettore più matematico non interessato alla genesi dei concetti fisici della MQ. In tali paragrafi passeremo rapidamente ad enunciare in modo piuttosto sommario alcuni dei fatti sperimentali e dei modelli teorici “proto quantistici” che hanno infine condotto alla formulazione prima della meccanica ondulatoria e poi della MQ vera e propria. Molti dettagli fisici si possono trovare in [CCP82]. Ometteremo completamente ogni discussione su alcune importanti tappe di questo percorso storico: spettroscopia atomica, modelli atomici (Rutherford,Bohr, Bohr-Sommerfeld), esperimento di Franck-Hertz, per i quali si rimanda a testi di fisica (es. [CCP82]). Il nostro succinto sommario metterà solo a giustificare il modello di base per la teoria matematica della MQ che svilupperemo partire dalla sezione 5.5. 6.1 Generalità sui sistemi quantistici. Usiamo qui la parola sistema fisico in senso molto generico e discorsivo. È molto difficile definire dal punto di vista fisico cosa sia un sistema quantistico. Possiamo cominciare a dire che più di sistema fisico quantistico più opportuno parlare di sistema fisico dal comportamento quantistico facendo questa distinzione da un punto di vista più fenomenologico-sperimentale che teorico. All’interno della formulazione teorica della meccanica quantistica non esiste una precisa demarcazione tra sistemi classici e sistemi quantistici, se non una demarcazione imposta del tutto “a mano” come vedremo più avanti, e tale argomento è oggi, ancora di più che in passato, oggetto di discussione ed attività di ricerca teorica e sperimentale. Parlando in modo del tutto generico, possiamo dire che hanno comportamento quantistico i sistemi della microfisica, cioè molecole, atomi, nuclei e particelle subnucleari quando presi in165 dividualmente. Sistemi fisici costituiti da più copie di tali sottosistemi (per esempio cristalli ) possono avere a loro volta comportamento quantistico. Sistemi macroscopici hanno comportamento tipicamente quantistico solo in determinate condizioni difficili da realizzare (es. condensazione di Bose-Einstein, L.A.S.E.R.). In modo leggermente più preciso della rozza distinzione tra microsistemi e macrosistemi esposta sopra, possiamo dire che, generalmente parlando, quando un qualsiasi sistema fisico si comporta quantisticamente l’azione caratteristica del sistema, cioè il numero dalle dimensioni fisiche di Energia × Tempo (equivalentemente Quantità di Moto × Lunghezza ovvero Momento angolare) ottenuto combinando opportunamente le dimensioni fisiche caratteristiche del sistema (es. massa, velocita’, dimensioni lineari ecc...) nei processi considerati è dell’ordine o inferiore al valore della costante di Planck h = 6.6262 · 10−34 Js. La costante di Planck e la parola quantum che caratterizza il nome della MQ vennero introdotte per la prima volta da Planck nel 1900 nel suo lavoro sulla teoria del corpo nero per eliminare il problema dell’energia totale teoricamente infinita di un sistema fisico costituito da radiazione elettromagnetica in equilibrio termodinamico con le pareti di una cavità tenuta ad una temperatura fissata. La sua ipotesi teorica, rivelatasi poi esatta, prevedeva che la radiazione in potesse scambiare energia con le pareti in quantità proporzionali alle frequenza degli oscillatori atomici nelle pareti la cui costante universale di proporzionalità era la costante di Planck, tali quantità vennero chiamate in latino quanta o quanti in italiano. Tornando al criterio per discriminare i sistemi quantistici da quelli classici usando la costante h, consideriamo per esempio un elettrone legato ad un nucleo di idrogeno. Un’azione caratteristica dell’elettrone si ottiene come, per esempio il prodotto della massa dell’elettrone (∼ 9 · 10−31 Kg), per una stima della velocità intorno al nucleo (∼ 106 m/s) per il valore del raggio di Bohr dell’atomo di idrogeno (∼ 5 · 10−11 m). Il calcolo fornisce un’azione caratteristica dell’ordine di 4.5 · 10−35 Js più piccolo dunque della costante di Planck. Ci si aspetta quindi che l’elettrone nell’atomo abbia comportamento quantistico, come infatti accade. Si può fare un calcolo analogo per sistemi fisici macroscopici come per esempio un pendolo di massa di qualche grammo e lunghezza dell’ordine del centimetro che oscilla sottoposto alla forza di gravità. Un’azione caratteristica di questo sistema può essere definita come il prodotto dell’energia cinetica massima per il periodo di oscillazione. Si trovano, per il sistema in questione valori dell’azione caratteristica di moltissimi ordini di grandezza superiori ad h. Osservazione. Una delle proprietà peculiare dei sistemi quantistici è il fatto che lo spettro dei valori assumibili dalle grandezze fisiche attribuibili ad essi è generalmente diverso (almeno in alcuni casi importanti) dallo spettro dei valori delle stesse grandezze assumibili da sistemi macroscopici analoghi. In certi casi, la differenza è sorprendente perché si passa da uno spettro continuo di valori possibili nel caso classico, ad uno spettro discreto, nel caso quantistico. È importante però precisare la discretezza dello spettro dei valori assumibili da una generica grandezza fisica quantistica non è una caratteristica necessaria in MQ: esistono grandezze quantistiche con spettro di valori continuo anche in MQ. Questo fraintendimento è all’origine o a volte conseguenza di una delle interpretazioni più frequenti, ma riduttiva, dell’aggettivo quantistica 166 nella parola Meccanica Quantistica. 6.2 Alcune proprietà particellari delle onde elettromagnetiche. Le onde elettromagnetiche (e quindi in particolare la luce) in particolari circostanze sperimentali rivelano comportamenti tipici di quelli di insiemi di particelle. Nella descrizione matematica di tali comportamenti classicamente anomali è coinvolta la costante di Planck. Possiamo citare due esempi di comportamento classicamente anomalo che hanno svolto un ruolo fondamentale nello sviluppo iniziale della MQ per i corrispondenti modelli teorici proto quantistici costruiti nel tentativo di darne una spiegazione: l’ effetto fotoelettrico e l’effetto Compton. 6.2.1 Effetto Fotoelettrico. L’effetto fotoelettrico riguarda l’emissione di elettroni (corrente elettrica) da parte di metalli in seguito ad illuminazione con un’onda elettromagnetica. Tale effetto era noto dalla prima metà del secolo XIX e alcune sue caratteristiche risultavano del tutto inspiegabili alla luce della teoria classica dell’interazione onde elettromagentica e materia [CCP82]. In particolare era inspiegabile la presenza di un valore minimo della frequenza della luce usata per irraggiare il metallo al di sotto del quale non si ha emissione elettronica. Il valore di tale soglia dipende dal metallo usato. Una volta raggiunta la soglia, l’istantaneità del processo di emissione era del tutto inspegabile. La teoria classica implica che l’emissione di elettroni ci deve essere indipendentemente dalla frequenza usata pur di aspettare un tempo sufficientemente lungo in modo da fare assorbire agli elettroni del metallo sufficiente energia da superare l’energia di legame con gli atomi. Nel 1905 A. Einstein propose un modello, per l’epoca molto ardito, che rendeva conto di tutte le proprietà anomale dell’effetto fotoelettrico1 con una precisione sperimentale notevole. Seguendo Planck, l’ipotesi centrale di Einstein era che un onda elettromagnetica monocromatica cioé con frequenza definita, che indicheremo con ν, sarebbe in realtà costituita da particelle materiali, dette quanti di luce, ciascuna dotata di energia E = hν . (6.1) In tale modello l’energia totale dell’onda sarebbe quindi pari alla somma delle energie dei singoli quanti di luce. Tutto ciò era ed è in contrasto totale con la teoria dell’elettromagnetismo classico in cui un’onda elettromagnetica è un sistema continuo la cui energia è legata all’ampiezza dell’onda invece che alla frequenza. Quello che dunque accadrebbe nell’effetto fotoelettrico secondo il modello di Einstein è che, illuminando il metallo con un onda monocromatica, ciascuno dei pacchetti energetici associati all’onda possa essere assorbito da un elettrone esterno di ogni atomo del metallo. Più precisamente l’ipotesi di Einstein per spiegare la fenomenologia sperimentale, era 1 Einstein ricevette il Premio Nobel proprio per tale lavoro. 167 che il pacchetto possa essere o assorbito completamente oppure non assorbito affatto, senza possibilità di assorbimenti parziali. Se e solo se l’energia del quanto è uguale o superiore all’energia dell’elettrone di legame con l’atomo E0 (dipendente dal metallo e misurabile indipendentemente dall’effetto fotoelettrico), l’elettrone viene istantaneamente espulso, incamerando in energia cinetica l’eventuale energia in eccesso del quanto. La frequenza ν0 := E0 /h individuerebbe cosı̀ la soglia sulla frequenza osservata sperimentalmente. Tale ipotesi si rivelò in perfetto accordo con dati sperimentali 6.2.2 Effetto Compton. L’effetto Compton risale al 1923. Esso riguarda la diffusione di onde elettromagnetiche di altissima frequenza – raggi X (> 1017 Hz) e raggi γ (> 1018 Hz) – da parte di materia estesa (gas, liquidi e solidi). Schematizzando al massimo l’effetto sperimentale consiste in questo. Irraggiando la sostanza (che diremo ostacolo) con un’onda elettromagnetica piana propagante nella direzione z e monocromatica di lunghezza d’onda λ, si osserva un’onda diffusa dall’ostacolo con diverse componenti. Una componente è diffusa in tutte le direzioni ed ha la stessa lunghezza d’onda della radiazione incidente, l’altra componente ha una lungezza d’onda leggermente superiore a λ, λ(θ) che dipende dall’angolo di osservazione θ. Se più precisamente, θ è definito come l’angolo tra la direzione di propagazione dell’onda incidente z e la direzione di propagazione dell’onda diffusa oltre l’ostacolo con lunghezza d’onda λ(θ), misurando θ a partire dall’asse z, vale la relazione: λ(θ) = λ + f (1 − cosθ) (6.2) dove2 la costante f ha le dimensioni di una lunghezza e si ottiene dai dati sperimentali. Il suo valore è f = 0.024(±0.001) Å. La teoria elettromagnetica classica era ed è assolutamente incapace di spiegare un tale fenomeno. Tuttavia come Compton dimostrò, esso poteva essere spiegato assumendo le tre ipotesi seguenti del tutto incompatibili con la teoria classica ma in accordo con l’ipotesi dei quanti di luce di Einstein. (a) L’onda elettromagnetica è costituita da particelle che trasportano energia, esattamente come aveva ipotizzato Einstein, secondo la legge (6.1). (b) Ogni quanto di luce possiede anche un’impulso p := ~k , (6.3) dove k è il vettore d’onda dell’onda elettromagnetica associata al quanto (vedi sotto). (c) I quanti di luce interagiscano, in un processo d’urto (in generale in regime relativistico), con gli atomi e con gli elettroni più esterni degli atomi dell’ostacolo soddisfacendo le leggi di conservazione dell’impulso e dell’energia. 2 Ricordiamo che 1 Å= 10−10 m 168 A commento di (c), ricordiamo che il vettore vettore d’onda k associato ad un onda piana monocromatica ha, per definizione, direzione e verso pari a quello di propagazione dell’onda e modulo dato da 2π/λ, dove λ è la lunghezza d’onda dell’onda. Equivalentemente, se ν è la frequenza dell’onda, |k| = 2π/λ = 2πν/c , (6.4) dove si è usata la ben nota relazione νλ = c , (6.5) valida per le onde elettromagnetiche ed essendo c = 2.99792 · 108 m/s è la velocità della luce. Possiamo dare qualche dettaglio in più per il lettore interessato. Le leggi di conservazione dell’energia e dell’impulso da usarsi in regime relativistico, cioè quando (qualcuna) delle velocità coinvolte sono dell’ordine di c, si scrivono rispettivamente, nelle ipotesi fatte: me c2 + hν = ~k = me c2 + hν(θ) , 1 − v 2 /c2 m v p e + ~k(θ) . 1 − v 2 /c2 p (6.6) (6.7) A primo membro compaiono le quantità precedenti dell’urto a secondo membro quelle successive all’urto. me = 9.1096 · 10−31 Kg è la massa dell’elettrone. L’elettrone è pensato in quiete prima dell’urto con il quanto di luce. In seguito all’urto il quanto di luce viene diffuso nella direzione individuata da θ, mentre l’elettrone acquista velocità v. Il vettore d’onda precedente all’urto, k, è quindi nella direzione (generica ma fissata) z mentre il vettore d’onda del quanto di luce dopo l’urto, k(θ), forma un angolo θ con k. Dalla (6.7), tenendo conto della definizione del vettore d’onda, si ricava subito m2e c2 h2 ν 2 h2 ν(θ)2 hν hν(θ) = 2 + −2 cos θ . 2 2 1 − v /c c c2 c c Eliminando ν tra la relazione appena ottenuta e la (6.6) si ricava immediatamente ν(θ) = ν − hνν(θ) (1 − cosθ) . me c2 (6.8) Tenendo conto della relazione (6.1) e ν = c/λ, si ricava facilemente la (6.2) nella forma λ(θ) = λ + h (1 − cosθ) me c (6.9) da cui si evince che f = h/(me c) il cui valore numerico coincide proprio con quello ottenuto sperimentalmente quando si sostituiscono i valori numerici di h, me e c. Si osservi anche, che nel limite formale per me → +∞, la (6.9) fornisce λ(θ) → λ. Ciò porta anche a spiegare la componente dell’onda diffusa isotropicamente senza variazione della lunghezza d’onda (rispetto alla lunghezza d’onda della radiazione incidente), come dovuta a quanti di luce che interagiscono con particelle di massa molto più grande di quella elettronica (un atomo del materiale o tutto l’ostacolo nel suo complesso). 169 Osservazione. Il modello di Einstein e quello di Compton spiegano perfettamente l’effetto fotoelettrico e la formula (6.2) in termini quantitativi e qualitativi. Tuttavia devono considerarsi come modelli ad hoc slegati ed addirittura in contrasto con il corpus della fisica teorica dell’epoca: l’idea della costituzione corpuscolare delle onde elettromagnetiche e quindi della luce, come noto dai tempi di Newton e Huygens, non può spiegare effetti ondulatori notissimi della luce quali i fenomeni di interferenza e diffrazione. In qualche modo il modello ondulatorio e quello corpuscolare della luce (onde elettromagnetiche) devono coesistere nella realtà, ma ciò non è possibile nel paradigma della fisica classica. Ciò invece accade nella formulazione relativistica completa della MQ introducendo il concetto di fotone. 6.3 Cenni di Meccanica ondulatoria. In queste dispense non ci occuperemo più delle proprietà quantistiche della luce che richiederebbero uno sviluppo ulteriore del formalismo della MQ che presenteremo. Le idee esposte sopra sui primi tentativi di descrizione quantistica della luce furono però utili, ribaltando il punto di vista, per arrivare alla formulazione della meccanica ondulatoria, il primo passo verso la formulazione della MQ. La meccanica ondulatoria è una delle due prime versioni un pò rudimentali della MQ per particelle dotate di massa3 . Nel seguito ci occuperemo molto succintamente di esporre alcune idee portanti della meccanica ondulatoria che mettono in luce alcuni punti fondamentali e generali che useremo per costruire il formalismo proprio della MQ. In particolare tralasceremo alcuni risultati storicamente connessi quali l’equazione stazionaria di Schrödinger e la spiegazione, tramite essa, dello spettro energetico dell’atomo di idrogeno. Torneremo più avanti su questi argomenti dopo avere costruito il formalismo. 6.3.1 Onde di de Broglie. Un quanto di luce di Einstein e Compton è associato ad un’onda elettromagnetica piana monocromatica di numero d’onda k = p/~ e pulsazione ω = E/~, dove lo ricordiamo, la pulsazione è semplicemente 2π volte la frequenza. Ogni componente dell’onda piana elettromagnetica (una componente del campo elettrico o magnetico che vibra perpendicolarmente a k) ha allora la forma di un’onda scalare: ψ(t, x) = Aei(k·x−tω) . (6.10) In realtà solo la parte reale dell’onda di sopra ha senso fisico. Un onda a valori complessi invece che reali del tipo di sopra ha comunque interesse fisico perché appare nella decomposizione di Fourier (vedi sezione 3.6) di una soluzione generale dell equazioni del campo elettromagnetico (equazioni di Maxwell) e più generalmente dell’equazione di d’Alembert. In termini di impulso 3 L’altra versione sviluppata parallelamente da Heisenberg consisteva nella cosiddetta meccanica delle matrici [CCP82] della quale non ci occuperemo. 170 e energia del quanto di luce, la stessa onda può riscriversi: i ψ(t, x) = Ae ~ (p·x−tE) . (6.11) Dove lo si noti compaiono solo l’impulso e l’energia del quanto di luce. Nel 1924 de Broglie fece un’ipotesi estremamente rivoluzionaria: come alle onde elettromagnetiche si potevano associare, almeno in certi contesti sperimentali, delle particelle, si doveva poter associare delle onde alle particelle materiali della stessa forma (6.11) dove ora però, p e E sono rispettivamente l’impulso e l’energia (cinetica) della particella. Non era affatto chiara la natura di tali fantomatiche onde. La lunghezza d’onda associata ad una particella di impulso p: λ = h/|p| , (6.12) viene detta lungezza d’onda di de Broglie della particella. Nel 1927 si ebbe evidenza sperimentale di onde in qualche modo associate al comportamento di particelle materiali, più precisamente elettroni, da parete di due distinti esperimenti da parte di Davisson e Germer e G.P. Thompson. Senza entrare nei dettagli degli esperimenti diremo solo quanto segue. È noto che quando un’onda (elettromagnetica, sonora ecc...) incontra un ostacolo con una struttura interna di dimensioni tipiche dell’ordine o superiori alla lunghezza d’onda dell’onda incidente, l’onda diffusa dall’ostacolo produce un fenomeno detto diffrazione: le varie parti interne dell’ostacolo agiscono sull’onda creando interferenza costruttuva e distruttiva, in modo che l’onda diffusa produca, su uno schermo su cui incide, delle figure costituite da zone d’ombra e zone di maggiore intensità (cioè più chiare nel caso di onde luminose). Tali figure si dicono figure di diffrazione. Se l’ostacolo è un cristallo, dalle figure di diffrazione si può risalire alla struttura interna di cristalli. Osservazione. È importante sottolineare che il fenomeno della diffrazione è strettamente dovuto alla natura ondulatoria dell’onda (al fatto che ci sia qualcosa che oscilli ed al principio di sovrapposizione). Non è possibile produrre figure di diffrazione sparando delle particelle, che soddisfino le usuali leggi della meccanica classica, su qualsivoglia ostacolo. Tornando agli esperimenti di Davisson e Germer e G.P. Thompson, essi ottennero figure di diffrazione prodotte da fasci di elettroni sparati su cristalli. Più precisamente le figure di diffrazione si produssero su uno schermo dall’accumularsi delle tracce puntiformi degli elettroni diffusi da un cristallo di passo reticolare dell’ordine di 1 Å. Il fatto ancora più notevole che corroborava l’ipotesi di de Broglie era il fatto che, negli esperimenti detti, le figure di diffrazione apparivano solo se la lunghezza di de Broglie degli elettroni era dell’ordine di 1Å o inferiore, esattamente come nel fenomeno della diffrazione prodotto da onde “usuali” su cristalli con passo reticolare di 1 Å. 6.3.2 Funzione d’onda di Schrödinger e interpretazione probabilistica di Born. Nel 1926, in due famosi e geniali articoli, Schrödinger prese sul serio l’ipotesi di de Broglie e fece un’assunzione più precisa: quella di associare ad una particella materiale non un’onda 171 piana come (6.11), ma un pacchetto d’onde costituito dalla sovrapposizione (nel senso della trasformata di Fourier, vedi sezione 3.6) di onde piane di de Broglie. Nel caso di particelle libere cioé la cui energia è data dalla sola energia cinetica, l’onda di Schrödinger si scrive: Z ψ(t, x) = R3 i e ~ (p·x−tE(p)) ψ̂(p) d3 p , (2π~2 )3/2 (6.13) dove E(p) := p2 /(2m) essendo m la massa della particella. Nei due articoli Schrödinger osservò che l’ottica geometrica si basa su un’equazione, detta equazione dell’iconale, che ha una struttura formalmente analoga all’equazione di Hamilton-Jacobi per una particella della meccanica classica. Schrödinger tentò allora di determinare un equazione fondamentale di una meccanica ondulatoria per la materia rispetto alla quale l’equazione di Hamilton-Jacobi della meccanica giocasse lo stesso ruolo approssimato che equazione dell’iconale (ottica geometrica) gioca rispetto all’equazione di d’Alembert (ottica ondulatoria) [CCP82]. In questo modo pervenne alla notissima equazione di Schrödinger che gioca un ruolo centrale nella MQ. Noi ricaveremo tale equazione più avanti dopo avere costruito il formalismo. Nel caso generale di una particella soggetta ad una forza dovuta ad un potenziale U , f (t, x) = −∇U (t, x), l’equazione era ∂ψ(t, x) ~2 i~ = − ∆ + U (t, x) ψ(t, x) (6.14) ∂t 2m dove ∆ := ∇ · ∇ è l’operatore di Laplace in R3 . L’onda di de Broglie-Schroedinger ψ venne chiamata funzione d’onda della particella a cui è associata. L’interpretazione oggi accettata della funzione d’onda ψ – almeno nell’interpretazione standard (“di Copenhagen”) del formalismo della MQ – venne data Born sempre nel 1926: fissato t ∈ R, |ψ(t, x)|2 ρ(t, x) := R 2 3 R3 |ψ(t, y)| d y è la densità di probabilità di trovare la particella nel punto x quando si esegua un esperimento per determinarne la posizione. L’interpretazione di Born che si rivelò in accordo con l’esperienza, era già in sostanziale accordo con i risultati degli esperimenti di Davisson e Germer e G.P. Thompson in cui le tracce delle particelle sullo schermo si addensavano nelle regioni in cui ρ(t, x) > 0 ed erano assenti nelle regioni in cui ρ(t, x) = 0 dando luogo alle figure di diffrazione. (Il fatto che le onde piane di de Broglie non abbiano diretto significato fisico alla luce dell’interpretazione di Born avendo integrale del modulo quadro divergente è fisicamente irrilevante. Le onde piane monocromatiche usate per interpretare i risultati sperimentali secondo l’ipotesi di de Broglie possono essere approssimate a piacimento da pacchetti a quadrato sommabile con una distribuzione ψ̂(p) arbitrariamente stretta attorno ad un valore p0 che determina con approssimazione piccola a piacere la lunghezza d’onda λ0 = |p0 |/h di de Broglie degli elettroni.) 172 Osservazioni. (1) Dal punto di vista matematico, l’assunzione dell’interpretazione di Born richiede che abbiano senso fisico solo le funzioni d’onda a quadrato sommabile e non quasi ovunque nulle, cioè gli elementi non nulli di L2 (R3 , d3 x): uno spazio di Hilbert entra in gioco per la prima volta, nella costruzione della MQ. (2) Assumendo l’interpretazione di Born si deve concludere che, quando non viene eseguito alcun esperimento per determinarne la posizione, la particella associata alla funzione d’onda ψ, non può evolvere temporalmente secondo le leggi della meccanica classica: se seguisse una traiettoria regolare come prescritto dalla meccanica classica, la funzione |ψ|2 associata dovrebbe essere quasi ovunque nulla fuori dalla traiettoria. Tuttavia avendo ogni traiettoria regolare in R3 misura nulla, |ψ|2 dovrebbe essere nulla quasi ovunque in R3 portando ad una contraddizione. In altre parole, quando non si esegue un esperimento per determinare la posizione della particella, la particella non deve considerarsi un oggetto classico, ma la sua evoluzione temporale è descritta dall’evoluzione dell’onda ψ (secondo l’equazione di Schrödinger). (3) Se si ammette, come nell’interpretazione di Copenhagen, che la funzione d’onda ψ sia una descrizione completa dello stato fisico della particella, si deve concludere che la posizione della particella sia fisicamente indefinita prima di eseguire un esperimento che la determini e che venga fissata all’atto dell’esperimento in modo probabilistico. Non è corretto pensare che l’uso di una descrizione probabilistica sia dovuto ad insufficiente conoscenza dello stato del sistema: “la posizione esiste ma noi non la conosciamo”. Nell’interpretazione di Copenhagen la posizione non esiste fino a quendo non si esegue un esperimento per determinarla e lo stato della particella (l’informazione massima sulle sue proprietà fisiche variabili nel tempo) è descritto dall’onda ψ. Nella meccanica ondulatoria la particella quantistica ha dunque una duplice natura di onda-corpuscolo, ma le due nature non vengono mai in contrasto perché non si manifestano mai contemporaneamente. 6.4 Principio di indeterminazione di Heisenberg. Quando cerchiamo di valutare sperimentalmente il valore di qualsiasi grandezza definita per un sistema fisico interagendo con il sistema stesso, possiamo alterare lo stato del sistema. Tuttavia nella descrizione classica, in linea di principio possiamo rendere piccola a piacere la perturbazione apportata allo stato. Nel 1927 Heisenberg si rese conto che le ipotesi di Planck, Einstein, Compton, de Broglie avevano una conseguenza (anche epistemologica) notevole in questo contesto. In termini quantitativi il principio di Heisenberg stabilisce che, considerado sistemi quantistici e particolari grandezze, non è sempre possibile rendere piccola a piacere la perturbazione apportata allo stato del sistema: la costante di Planck rappresenta un limite invalicabile per il prodotto delle indeterminazioni di alcune coppie di grandezze. Più precisamente, esaminando vari esperimenti ideali in cui si assumeva qualcuna delle ipotesi 173 dei modelli di Planck, Einstein, Compton e de Broglie, Heisenberg arrivò alla conclusione che: cercando di determinare la posizione o l’impulso di una particella lungo un fissato asse x, se ne altererà l’impulso o rispettivamente la posizione lungo lo stesso asse in modo tale che il prodotto della minima larghezza possibile delle due incertezze ∆x e ∆p con cui alla fine risultano essere note le due grandezze soddisfi: ∆x∆p & h , (6.15) senza poter andare sotto tale stima. Se la posizione e l’impulso sono valutiati lungo assi reciprocamente ortogonali il prodotto delle incertezze può essere arbitrariamente piccolo. (6.15) esprime il principio di indeterminazione di Heisenberg per la posizione e l’impulso. Una relazione analoga vale per l’incertezza ∆E con cui è determinata l’energia E di una particella e l’incertezza ∆t con cui si determina il tempo t in cui viene fatta la misura dell’energia4 ∆E∆t & h . (6.16) A titolo di esempio consideriamo l’esperimento ideale in cui si cerca di determinare la posizione X di un elettrone di momento inizialmente noto P illuminandolo con un fascetto di luce monocromatica di lughezza d’onda λ che si propaga nella direzione x. Immaginiamo di voler leggere la posizione su uno schermo parallelo all’asse X tramite una lente interposta tra l’asse X e lo schermo. Un quanto di luce che ha interagito con l’elettrone produrrà un’immagine X 0 colpendo schermo dopo avere attraversato la lente. A causa dell’apertura finita della lente è non possibile conoscere con esattezza la direzione lungo la quale è stato diffuso il quanto di luce che produce l’immagine X 0 sullo schermo. Dall’ottica ondulatoria sappiamo che in X 0 si avrà una figura di diffrazione che permetterà di raggiungere nella misura della coordinata X una accuratezza non più piccola di ∆X & λ , sin α dove α è il semi angolo sotto il quale da X si vede la lente. Al quanto di luce corrisponde l’impulso h/λ, per cui l’incertezza della componente Px del quanto di luce diffuso sarà data approssimativamente da h(sin α)/λ. L’impulso totale del sistema particella, quanto di luce, microscopio, dovrà rimanere costante per cui l’incertezza nella componente x della quantità di moto della particella dopo la diffusione del quanto di luce dovrà essere uguale alla corrispondente incertezza per il quanto di luce stesso: ∆Px & h sin α . λ Il prodotto delle due indeterminazioni della particella lungo l’asse x risulta essere dunque al minimo ∆X∆Px & h . 4 la relazione d’indeterminazione tempo-energia ha uno status ed una interpretazione molto più problematico delle analoghe relazioni posizione-impulso. 174 Osservazione. Il principio di Heisenberg, a questo livello, ha la stessa (in)consistenza logica dei modelli proto quantistici usati euristicamente per arrivarne alla formulazione. Deve essere visto più come una ipotesi di lavoro per costruire una nuova nozione di particella in cui le nozioni di posizione ed impulso classici abbiano senso solo entro limiti fissati dal principio stesso: gli stati fisici di una particella quantistica devono essere tali per cui l’impulso o la posizione non siano definite e definibili contemporaneamente. Val la pena di ricordare che nella formulazione finale della MQ, come vedremo, il principio di Heisenberg diventa un teorema. 6.5 Le grandezze compatibili ed incompatibili. Indipendentemente dal principio di Heisenberg, la fenomenologia quantistica mostra che ci sono coppie grandezze A e B che risultano essere incompatibili. Questo significa che, se si misura prima la grandezza A sul sistema ottenendo il risultato a e quindi – immediatamente dopo – si misura B ottenendo il risultato b, una successiva misura di A – vicina temporalmente a piacere a quella di B (in modo da non poter imputare il risultato all’evoluzione temporale) – produce un risultato a1 generalmente differente da a. Lo stesso fenomeno appare scambiando il ruolo di A e B. Coppie di grandezze incompatibili sono la componente della posizione e dell’impulso lungo un fissato, tali grandezze soddisfano anche il principio di Heisenberg. Questi due fatti sono connessi, ma il legame può essere spiegato chiaramente solo dopo avere costruito il formalismo completo. In generale coppie di grandezze incompatibili non soddisfano il principio di Heisenberg. Risulta che le grandezze quantistiche incompatibili non sono mai funzioni una dell’altra e nemmeno che esistono apparati di misura in grado di misurarle contemporaneamente. È importante sottolineare che la fenomenologia quantistica mostra che esistono anche coppie di grandezze A0 , B 0 compatibili. Questo significa che, se si misura prima la grandezza A sul sistema ottenendo il risultato a0 e quindi – immediatamente dopo – si misura B 0 ottenendo il risultato b0 , una successiva misura di A0 – vicina temporalmente a piacere a quella di B 0 (in modo da non poter imputare il risultato all’evoluzione temporale) – produce lo stesso risultato a0 . Lo stesso fenomeno appare scambiando il ruolo di A0 e B 0 . In particolare ogni grandezza fisica A è compatibile con se stessa e con ogni funzione di A (per esempio la posizione di una particella lungo una retta ed il quadrato del numero che individua tale posizione.) Un esempio di coppie di grandezze incompatibili che non soddisfano il principio di Heisenberg sono due componenti diverse dello spin di una particella. Lo spin dell’elettrone (e poi di tutte le particelle nucleari e subnucleari) fu introdotto da Goudsmit e Uhlembeck nel 1925 per spiegare alcune proprietà “anomale”, il cosiddetto effetto Zeeman anomalo, degli spettri energetici (righe spettrali) degli atomi di metalli alcalini. In senso semi classico lo spin rappresenta il momento angolare intrinseco dell’elettrone che, per certi aspetti, può essere pensato come dovuto ad un incessante moto rotatorio dell’elettrone attorno al proprio centro di massa. Tuttavia questa 175 interpretazione è molto fuorviante è non deve essere presa alla lettera. Un significato profondo allo spin può solo essere dato nel contesto della definizione, dovuta a Wigner, di particella elementare quantistica come sistema elementare invariante sotto l’azione del gruppo di Poincaré. Allo spin è associato un momento magnetico intrinseco che è alla fine il responsabile dell’effetto Zeeman anomalo osservato. Tuttavia lo spin è una grandezza vettoriale con caratteristiche peculiari quantistiche che lo differenziano completamente da un momento angolare classico e lo fanno rientrare nella categoria dei momenti angolari quantistici. La prima differenza è nei valori assumibili dal modulo dello spin. Nell’unità di misura ~ tali valori sono sempre numeri del tipo È s(s + 1) dove s è un intero fissato dipendente dal tipo di particella, s = 1/2 per l’elettrone. Ciascuna delle tre componenti dello spin rispetto ad una terna di assi destrorsa ortonormale può assumere ciascuno dei 2s + 1 valori discreti −s, −s + 1, . . . , s − 1, s. Le tre componenti dello spin risultano essere grandezze fisiche incompatibili nel senso detto sopra: la misurazione alternata e fatta a tempi vicinissimi di due differenti componenti dello spin fornisce valori sempre differenti per tali componenti dello spin. È importante precisare che la stessa incompatibilità si ha anche per le componenti del momento angolare orbitale e totale di una particella. Un esempio di coppie di grandezze compatibili per una particella quantistica sono la componente x dell’impulso e la componente y del vettore posizione. Risulta anche che ogni grandezza fisica è compatibile con se stessa. Tale fatto non è per nulla banale. 176 Capitolo 7 Il formalismo matematico di base della MQ: proposizioni, stati quantistici e osservabili. La Matematica in Fisica è come il maiale: non si butta mai via niente. In questo capitolo presenteremo la struttura matematica generale della Meccanica Quantistica. La procedura, essenzialmente dovuta a von Neumann e qui presentata in veste più moderna tenendo conto del risulatato di Gleason (vedi sotto), sarà un’estensione della meccanica (hamiltoniana) classica che tenga conto dei risultati sperimentali sulla natura dei sistemi quantistici discussa nel capitolo precedente. Nella prima sezione riassumeremo i risultati presentati nel capitolo precedente, rimarcando alcuni punti fondamentali che giocheranno un ruolo fondamentale nel seguito. Nella sezione successiva riesamineremo alcuni aspetti della formulazione della meccanica di Hamilton da un punto di vista insiemistico e logico-formale insieme, mostrando che esiste un’intepretazione dei fondamenti della teoria in cui le proprosizioni elementari sul sistema fisico sono descritte da una σ-algebra, mentre gli stati sono descrivibili in termini di misure (eventualmente di Dirac) su tale σ-algebra. Nella terza sezione, mostreremo come si possa modificare la struttura delineata nel caso classico fino ad introdurre una descrizione della fenomenologia quantistica. In questo caso la σ-algebra è sostituita dal reticolo dei proiettori su un opportuno spazio di Hilbert e gli stati da una nozione generalizzata di misura σ-additiva sul reticolo dei proiettori. Nella quarta sezione enetremo nel cuore della struttura mostrando, tramite il teorema di Gleason, che le misure generalizzate di cui sopra non sono altro che operatori di classe traccia, positivi con traccia unitaria. In questo modo introdurremo lo spazio convesso degli stati quantistici, identificando gli stati puri (o raggi ) con gli elementi estremali del corpo convesso. Discuteremo inoltre la descrizione formale della nozione di proposizioni compatibili, del processo di misura e l’esistenza di regole di superselezione con la decomposizione dello spazio di Hilbert in settori 177 coerenti. Faremo qualche accenno alle interessanti logiche quantistiche ed alle recenti critiche sollevate sulla loro utilità in fisica. Nella quinta ed ultima sezione ci dedicheremo alla costruzione euristica della nozione di osservabile, vista come insieme di proposizioni elementari che costituiscono una misura a valori di proiezione (PVM) sullo spazio di Hilbert del sistema fisico. Tale costruzione fornirà anche una motivazione fisica alla dimostrazione del teorema spettrale, che sarà provato successivamente. Daremo anche qualche accenno ad una generalizzazione della nozione di osservabile in termini di misure a valori di operatori positivi (POVM), enunciando il teorema di interallacciamento di Neumark. 7.1 Le idee che stanno alla base dell’interpretazione standard della fenomenologia quantistica. Cerchiamo di riassumere alcuni punti cruciali del comportamento dei sistemi quantistici. QM1. (i) I risultati delle misure di grandezze fisiche su sistemi quantistici, di cui è fissato lo stato, hanno esiti probabilistici. Non è possibile prevedere l’esito della misura, ma solo (per esempio per quanto riguarda la posizione di una particella nell’interpretazione di Born) la probabilità che l’esito fornisca un certo risultato. (ii) Tuttavia se una grandezza è stata misurata ed ha prodotto un certo risultato, ripetendo la misura della stessa grandezza immediatamente dopo la prima misura (per evitare che nel frattempo lo stato del sistema evolva), il risultato della misura sarà lo stesso già ottenuto. QM2. (i) Esistono delle grandezze fisiche incompatibili nel senso che segue. Dette A e B due grandezze incompatibili, se si misura prima la grandezza A sul sistema (a stato fissato) ottenendo il risultato a e quindi – immediatamente dopo – si misura B ottenendo il risultato b, una successiva misura di A – vicina temporalmente a piacere a quella di B (in modo da non poter imputare il risultato all’evoluzione temporale dello stato) – produce un risultato a1 generalmente differente da a. Lo stesso fenomeno appare scambiando il ruolo di A e B. Risulta che le grandezze quantistiche incompatibili non sono mai funzioni una dell’altra e nemmeno che esistono apparati sperimentali di misura in grado di misurarle contemporaneamente. (ii) Esistono anche grandezze fisiche compatibili nel senso che segue. Dette A0 e B 0 due grandezze compatibili, se si misura prima la grandezza A0 sul sistema (a stato fissato) ottenendo il risultato a0 e quindi – immediatamente dopo – si misura B 0 ottenendo il risultato b0 , una successiva misura di A0 – vicina temporalmente a piacere a quella di B 0 (in modo da non poter imputare il risultato all’evoluzione temporale) – produce lo stesso risultato a0 già ottenuto. Lo stesso fenomeno appare scambiando il ruolo di A0 e B 0 . In particolare, per (ii) di QM1, ogni grandezza fisica è compatibile con se stessa e se due grandezze fisiche sono una funzione dell’altra (es. l’energia ed il suo quadrato), allora sono compatibili. 178 Osservazioni. (1) QM1 e QM2 si riferiscono alle grandezze fisiche “non definitorie” di un sistema fisico. Per grandezze definitorie intendiamo quelle che non dipendono dallo stato del sistema e che quindi permettono di distinguere un sistema da un altro. Le rimanenti grandezze, quelle a cui si riferiscono QM1 e QM2, sono invece dipendenti dallo stato del sistema. (2) È chiaro che non è possibile avere la certezza assoluta che i sistemi fisici quantistici soddisfino (i) di QM1. Si potrebbe infatti sospettare che la stocasticità dell’esito delle misure derivi dal fatto che, in realtà, gli sperimentatori non conoscano completamente lo stato del sistema e se lo conoscessero completamente potrebbero prevedere con certezza gli esiti delle misure. In questo senso la probabilità quantistica sarebbe semplicemente di natura epistemica. Nell’interpretazione standard della MQ, la cosiddetta interpretazione di Copenaghen, la stocasticità degli esiti delle misure è assunta come un fatto fondamentale della natura dei sistemi quantistici. Esistono comunque interessanti tentativi di interpretazione della fenomenologia quantistica basati su formalismi alternativi (le cosiddette formulazioni in termini di variabili nascoste) [Bon97]. In tali approcci la stocasticità è spiegata come dovuta ad una incompleta informazione da parte dello sperimentatore sul reale stato fisico del sistema che è descritto da più variabili (ed in modo molto diverso) rispetto a quelle usate nella formulazione standard. Nessuno di tali tentativi (malgrado alcuni siano veramente notevoli come la teoria di Bohm) è risultato fino ad oggi veramente soddisfacente tanto da essere un vero competitore dell’interpretazione e della formulazione standard della MQ (quando si considerino anche le teorie quantistiche relativistiche e la teoria dei campi quantistica relativistica in particolare). Bisogna anche sottolineare che non è comunque possibile costruire una teoria fisica completamente classica (includendo le teorie relativistiche non quantistiche tra le teorie classiche) che possa spiegare completamente la fenomenologia quantistica. Le variabili nascoste devono soddisfare un requisito di contestualità piuttosto inusuale nelle teorie classiche. Infine ogni teoria che spieghi la fenomenologia quantistica, inclusa la stessa MQ, deve essere non locale [Bon97]. In altre parole la fenomenologia sperimentale prova l’esistenza di correlazioni tra esiti di esperimenti che avvengono in regioni distinte dello spazio ed in periodi di tempo per cui non e possibile che vi sia trasmissione di informazione tramite qualunque mezzo fisico che si muova ad una velocità non superiore a quella della luce nel vuoto. (3) È implicito in QM1 e QM2 che i sistemi fisici interessanti nella fenomenologia e teoria quantistica vengano divisi in due grandi categorie: gli strumenti di misura ed i sistemi quantistici. Nella formulazione di Copenaghen si assume che gli strumenti di misura siano sistemi che soddisfino alle leggi della fisica classica. Queste assunzioni che corrispondono a dati di fatto sperimentali e che sono a dir vero piuttosto rozze dal punto di vista teorico, sono alla base dell’interpretazione del formalismo e non si riesce a dire molto altro nel corpus della formulazione standard. Per esempio non è chiaro dove si situi la linea di confine tra sistemi classici e quantistici, nemmeno come questa linea possa essere descritta all’interno del formalismo e nemmeno se il sistema costituito dall’apparato di misura e dal sistema quantistico possa essere a sua volta considerato come un sistema quantistico più grande e trattato all’interno del formalismo. Infine, il processo fisico dell’interazione tra strumento di misura e sistema quantistico che fornisce l’esito della misura non è descritto all’interno del formalismo quantistico standard come un processo dinamico. 179 Vedremo meglio più avanti tale punto. Rimandiamo a [Bon97, Des80] per una discussione su tali interessanti e difficili argomenti. 7.2 Stati classici come misure di probabilità sulla σ-algebra delle proposizioni elementari. È noto che una misura positiva µ sullo spazio X è detta misura di probabilità se µ(X) = 1. La trattazione formale, dovuta a Kolmogorov, del calcolo delle probabilità si traduce nello studio delle misure di probabilità. Vediamo ora come la nozione di misura di probabilità possa essere usata per rappresentare gli stati fisici dei sistemi classici. Un’estensione di tale nozione verrà impiegata nel seguito per dare una descrizione matematica degli stati dei sistemi quantistici. Questo approccio è stato studiato per la prima volta da G. Mackey (“The mathematical Foundations of Quantum Mechanics”, Benjamin, New York 1963)). 7.2.1 Stati come misure. Consideriamo un sistema fisico classico arbitrario descritto in formulazione hamiltoniana. Questo significa che lo spazio ambiente, lo spaziotempo delle fasi, Hn+1 sarà dato da una varietà differenziabile fibrata su R, l’asse del tempo, le cui fibre Ft , lo spazio delle fasi al tempo t, saranno varietà differenziabili (tra di loro diffeomorfe) F di dimensione 2n dotate di una struttura simplettica che permette di formulare le equazioni di Hamilton. Nell’intorno di ogni punto su ciascuna sottovarietà Ft0 avremo delle coordinate naturali t, q 1 , . . . , q n , p1 , . . . , pn rispetto alle P quali la forma simplettica è ω = ni=1 dq i ∧ dpi e le equazioni di Hamilton prendono la solita forma per k = 1, 2, . . . , n: dq k dt dpk dt ∂H(t, q(t), p(t)) , ∂pk ∂H(t, q(t), p(t)) = − . ∂q k = (7.1) (7.2) essendo H la funzione hamiltoniana delle coordinate locali considerate ed essendo t la coordinata sull’asse del tempo. L’evoluzione del sistema sarà descritta quindi dalle curve integrali delle equazioni scritte sopra. Ad ogni fissato tempo t ∈ R, ogni evoluzione del sistema determina un punto (t, r(t)) con r(t) ∈ Ft in cui la curva integrale considerata interseca Ft . Nel caso si stia considerando, non un sistema fisico ma un insieme statistico di sistemi fisici identici, l’evoluzione del sistema è descritta assegnando una funzione densità positiva localmente rappresentabile come ρ = ρ(t, q, p) che risolve l’equazione di Liouville: n ∂ρ X ∂ρ ∂H ∂H ∂ρ + − =0. ∂t i=1 ∂q i ∂pi ∂q i ∂pi 180 (7.3) Si richiede ovviamente che, per ogni t Z Ft ρ dµ = 1 , (7.4) dove dµ, localmente rappresentabile come dµt = dq 1 ∧ · · · ∧ dq n ∧ dp1 ∧ · · · ∧ dpn , è la misura indotta dalla forma simplettica ω su Ft . È un fatto noto come teorema di Liouville la proprietà dell’integrale in (7.4) di essere invariante al variare di t, quando ρ soddisfa (7.3) [CCP82]. ρ(t, r) con r ∈ Ft rappresenta la densità probabilità che il sistema fisico si trovi in r al tempo t. In definitiva, sia nel caso di un unico sistema fisico, che nel caso di una trattazione statistica, l’evoluzione del sistema è descritta assegnando una classe di misure di Borel di probabilità {νt }t∈R , ciascuna definita sul corrispondente spazio delle fasi Ft dove: (i) se si lavora con un insieme statistico νt = ρdµt ; (ii) se si lavora con un solo sistema si può definire una misura νt caso limite di (i) come la misura di Dirac concentrata in r(t). Ricordiamo che la misura di Dirac δx concentrata in un punto x di uno spazio con misura X è definita come δx (E) = 0 se x 6∈ E e δx (E) = 1 se x ∈ E, dove E è un qualsiasi elemento della σ-algebra, Σ, dello spazio X. Lo stato del sistema al tempo t (eventualmente pensato come stato statistico) sarà quindi individuato dalla misura νt . Il significato operativo della misura νt nel caso essa sia una misura di Dirac sarà chiarito tra poco. Nota. Per rappresentare gli stati del sistema al tempo t in modo del tutto generale, tralasciando il problema dell’evoluzione dello stato ed abbandonando la formulazione hamiltoniana standard, si potrebbe lavorare su varietà topologiche Ft invece che differenziabili. Gli stati (al tempo t) potrebbero comunque essere rappresentati in termini di misure di probabilità rispetto alla σ-algebra di Borel. La richiesta dell’esistenza di una topologia su Ft è intrinsecamente connessa con l’esistenza di “intorni” dei punti di tale insieme, dovuti alla presenza di errori di misura sperimentali, rimpicciolibili a piacere, ma non annullabili. Più precisamente, la richiesta di poter distinguere i punti di Ft malgrado l’esistenza di errori di misura, viene tradotta matematicamente con la richiesta che la topologia di Ft sia di Hausdorff (come d’altronde accade nelle varietà differenziabili). 7.2.2 Proposizioni e insiemi. Se ammettiamo che la descrizione hamiltoniana del nostro sistema fisico contenga tutte le proprietà fisiche del sistema, tutte le proposizioni sul sistema che al tempo t sono vere o false, o sono vere con una certa probabilità, devono poter essere descritte in Ft in qualche modo. Inoltre, il loro valore di verità ovvero la probabilità che siano vere deve poter essere ottenuta una volta noto lo stato νt del sistema. Mettiamoci inizialmente nel caso in cui si considera un unico sistema e quindi νt è una misura 181 di Dirac. Ogni proposizione P individua un insieme di Ft che contiene tutti e soli i punti di Ft che la rendono verificata. Indicheremo tale insieme ancora con P . Noto lo stato νt , la proposizione sarà vera se e solo se il punto r(t) che descrive lo stato al tempo t appartiene all’insieme P . Se assegniamo convenzionalmente il valore 0 ad una proposizione falsa e 1 ad una vera, in termini di misure νt , il valore di verità della proposizione P sullo stato νt è dato allora da νt (P ) dove ora P ⊂ Ft è l’insieme associato alla proposizione P . Questo fatto chiarisce il significato operativo della misura di Dirac νt . La stessa interpretazione può essere usata nel caso lo stato abbia un’interpretazione statistica: νt (P ) rappresenta la probabilità che P sia vera al tempo t quando lo stato è νt . È chiaro che tutto quanto detto ha senso se gli insiemi P appartengono alla σ-algebra su cui sono definite le misure νt . Tale σ-algebra è quella di Borel ed è pertanto ragionevolmente grande. Note. (1) Anche il caso di una misura di Dirac può interpretarsi nel senso delle misure di probabilità (vedi Appendice A) (e la misura di Dirac è una misura di probabilità) se si attribuisce al valore di verità 1 la probabilità certa e al valore di verità 0 la probabilità nulla. D’ora in poi adotteremo tale interpretazione unificante in entrambi i casi. (2) È chiaro che una stessa proposizione può essere formulata in modi differenti ma equivalenti. Nell’identificare proposizioni con insiemi di Ft noi stiamo esplicitamente assumendo che: se due proposizioni individuano lo stesso sottoinsieme di Ft si devono considerare come la stessa proposizione. 7.2.3 Interpretazione insiemistica dei connettivi logici. Prese due proposizioni P e Q, possiamo comporle con connettivi logici per costruire altre proposizioni. In particolare possiamo considerare la proposizione costruita con la disgiunzione, P ∨ Q, e la proposizione costruita con la congiunzione, P ∧ Q. Con una sola proposizione possiamo costruirne la negazione ¬P . Possiamo interpretare queste proposizioni in termini di insiemi della σ-algebra di Ft : (i) la disgiunzione P O Q corrisponde a P ∪ Q; (ii) la congiunzione P E Q corrisponde a P ∩ Q; (iii) la negazione aP corrisponde a Ft \ P . È possibile mettere un ordinamento parziale in ogni classe di sottoinsiemi di Ft usando l’inclusione insiemistica: P ≤ Q se e solo se P ⊂ Q. L’interpretazione più naturale a livello di proposizioni del fatto che P ⊂ Q è semplicemente che Q è conseguenza logica di P , ossia P ⇒ Q . Note. (1) La probabiltà che siano vere queste proposizioni composte può essere calcolata usando la misura νt in quanto le operazioni insiemistiche che corrispondono a O, E, a sono operazioni 182 rispetto alle quali ogni σ-algebra è chiusa. (2) Si verifica facilmente che se νt è una misura di Dirac, il valore di probabilità (che ricordiamo essere solo 0 o 1 in questo caso) assegnato a ciascuna delle espressioni composte di sopra, coincide con il valore di verità calcolato tramite le tavole di verità del connettivo logico usato. Per esempio, P OQ è vera (cioè νt (P ∪ Q) = 1) se e solo se almeno una delle due proposizioni costituenti è vera (cioè se e solo se νt (P ) = 1 oppure, senza esclusione, νt (Q) = 1); infatti il punto p su cui è concentrata la misura di Dirac δx = νt cade in P ∪ Q se e solo se x cade in almeno uno dei due insiemi P e Q. 7.2.4 Proposizioni “infinite” e grandezze fisiche. Solitamente nel calcolo proposizionale non si considerano delle proposizioni composte contenenti infinite proposizioni ed infiniti connettivi logici come P1 O P2 O . . .. L’interpretazione delle proposizioni e dei connettivi in termini di elementi e operazioni in una σ-algebra permette però di considerare tali proposizioni. Possiamo legare almeno alcune di tali proposizioni grandezze fisiche misurabili sul sistema. In via del tutto generale possiamo considerare le grandezze fisiche definite sul nostro sistema hamiltoniano come qualche classe di funzioni regolari in qualche senso f : Hn+1 → R. Una scelta molto generale per il requisito di regolarità si ha prendendo tutta la classe delle funzione misurabili limitate. Tali funzioni definiscono densità di qualche grandezza che almeno localmente possono essere integrate. Si possono fare delle scelte meno radicali prendendo per esempio solo la classe delle funzioni continue oppure C 1 oppure C ∞ . Dal punto di vista fisico sembrerebbe naturale richiedere che le grandezze fisiche siano descritte da funzioni almeno continue, per il fatto che le misure sono sempre affette da errori sperimentali nel determinare il punto di Hn+1 che rappresenta il sistema: se le funzioni non sono continue, piccoli errori di misura possono provocare grandi variazioni sui valori delle grandezze. Tuttavia bisogna tenere anche conto del fatto che vi possono essere grandezze che assumono valori discreti, per le quali la critica di sopra non si applica (i valori si possono distinguere usando strumenti sufficientemente, ma non infinitamente, precisi). Ci restringiamo ora a lavorare ad un tempo fissato t, per cui le grandezze fisiche che considereremo saranno funzioni f : Ft → R. Se f : Ft → R è una grandezza fisica valutabile sul sistema fisico (al tempo t), possiamo costruire con essa delle proposizioni del tipo: (f ) PE = “Il valore di f valutato sullo stato del sistema cade nell’insieme di Borel E ⊂ R” , Il fatto di considerare insiemi di Borel E e non solo, per esempio, intervalli aperti, consente di trattare sullo stesso piano grandezze che assumono valori continui e grandezze che assumo valori discreti. Infatti nella classe degli insiemi di Borel di R ci sono anche gli insiemi chiusi, ci sono gli stessi punti di R ed insiemi contenenti quantità finite e numerabili di punti. In termini insiemistici: 183 (f ) PE = f −1 (E) ⊂ Ft . (f ) Nota. Come al solito, una volta noto lo stato νt , la probabilità che PE sia vera al tempo t (f ) per il sistema è νt (PE ). Se lo stato non è statistico, il valore suddetto è il valore di verità della (f ) stessa proposizione PE . Consideriamo un ’intervallo [a, b) con b ≤ +∞. Possiamo decomporre tale intervallo nell’unione disgiunta di una infinità di sotto intervalli: [a, b) = ∪∞ i=1 [ai , ai+1 ) dove a1 := a ed inoltre ai < ai+1 ed infine ai → b per i → ∞. È chiaro allora che la proposizione (f ) P[a,b) = “Il valore di f valutato sullo stato del sistema cade nell’insieme di Borel [a, b)” , può essere decomposta in una disgiunzione infinita di proposizioni ciascuna della forma (f ) P[ai ,ai+1 ) = “Il valore di f valutato sullo stato del sistema cade nell’insieme di Borel [ai , ai+1 )”. (f ) (f ) P[a,b) = O+∞ i=1 P[ai ,ai+1 ) , (f ) che corrisponde alla decomposizione dell’insieme P[a,b) nell’unione disgiunta (f ) (f ) P[a,b) = ∪+∞ i=1 P[ai ,ai+1 ) . Quindi vediamo che ha senso fisico assumere l’esistenza di almeno alcune proposizioni sul sistema costruite con infiniti connettivi logici ed infinite sotto proposizioni. Per dualità rispetto alla negazione, che trasforma la disgiunzione O in congiunzione E, se assumiamo che l’insieme delle proposizioni ammissibili sia chiuso rispetto alla negazione a, dobbiamo assumere come fisicamente sensate anche proposizioni infinite costruite con il connettivo E. Il fatto di poter rappresentare le proposizioni come insiemi di una σ-algebra e quindi poterne calcolare la probabilità che siano vere su uno stato del sistema tramite la misura corrispondente, suggerisce di assumere che abbiano senso fisico proposizioni costruite con un’infinità numerabile connettivi logici di tipo O oppure un’infinità numerabile di connettivi logici di tipo E, perchè gli insiemi corrispondenti sono ancora elementi della σ-algebra che è chiusa rispetto all’unione ed all’intersezione numerabile di insiemi. Per avere una struttura “isomorfa” a quella di σ-algebra costituita da proposizioni insieme ai connettivi logici O, E, a, dobbiamo includere tra le proposizioni fisiche ancora due proposizioni che corrispondono agli insiemi ∅ e Ft rispettivamente. Tali proposizioni evidentemente sono quella sempre falsa (ovvero con probabilità 0 di essere vera per qualsivoglia stato) che indicheremo con 0 e quella sempre vera (ovvero con probabilità 1 di essere vera per qualsivoglia stato) che indicheremo con 1. Una volta identificate le proposizioni con insiemi, la struttura di σ-algebra ci permette di assumere che : 184 L’insieme delle proposizioni elementari P relative al sistema fisico considerato, insieme ai connettivi logici O, E, a, costituiscano una struttura “isomorfa” ad una σ-algebra. Il valore di verità oppure, a seconda del tipo di stato, la probabilità che una proposizione P sia vera sullo stato del sistema al tempo t si calcola comunque come νt (P ) dove ora P ⊂ Ft è l’insieme associato alla proposizione. Tutto ciò è indipendente dal fatto che una proposizione sia “normale” o costituita con infiniti connettivi logici. Nota. Ci si può chiedere se la σ-algebra associata all’insieme di tutte le proposizioni sul sistema corrisponda alla σ-algebra di Borel di Ft o sia più piccola. È chiaro che se si assume che ogni funzione reale misurabile limitata definita su Ft sia una grandezza fisica allora la risposta è positiva perchè tra queste funzioni ci sono le funzioni caratteristiche di ogni insieme misurabile (f ) di Ft . Se f è la funzione caratteristica dell’insieme di Borel E, per esempio, la proposizione PE corrisponde all’insieme E. 7.2.5 Il reticolo distributivo, limitato, ortocomplementato e σ-completo delle proposizioni elementari. Nel caso classico possiamo (anzi dobbiamo per dare senso alle proposizioni “infinite”) identificare proposizioni con insiemi e dire che le proposizioni sono insiemi. Tuttavia, per il passaggio al caso quantistico in cui non esiste lo spazio delle fasi, è importante farsi la domanda che segue. Esistono strutture matematica in qualche senso “isomorfe” ad una σ-algebra che non siano σ-algebre di insiemi? La risposta è positiva e si ricava dalla teoria dei reticoli. Definizione 7.1. Un insieme parzialmente ordinato (X, ≥) è detto reticolo quando soddisfa i due seguenti requisiti: (a) per ogni coppia x, y ∈ X esiste sup{a, b}; (b) per ogni coppia x, y ∈ X esiste inf{a, b}. Note. (1) Nella teoria dei reticoli sup{a, b} si indica con a ∨ b e inf{a, b} si indica con con a ∧ b. È importante notare che in un reticolo esistono inf{a, b} e sup{a, b} anche se a e b non sono confrontabili, cioè non vale a ≤ b oppure b ≤ a. Si prova facilmente che i seguenti tre fatti sono equivalenti: a ∧ b = a , a ∨ b = b , a ≤ b. (2) Si osservi che per ogni reticolo X, dalla definizione di inf e sup, seguono le proprietà associative: per ogni terna a, b, c ∈ X, (a ∧ b) ∧ c = a ∧ (b ∧ c) , (a ∨ b) ∨ c = a ∨ (b ∨ c) , per cui, per esempio, si può scrivere a ∨ b ∨ c ∨ d e a ∧ b ∧ c ∧ d senza ambiguità. 185 (3) Valgono anche le proprietà di simmetria: a∨b = b∨a, a∧b = b∧a, per ogni coppia a, b ∈ X. Di conseguenza, per esempio a ∨ b ∨ c = c ∨ a ∨ b ∨ a. Esistono diversi tipi di reticoli, la seguente definizione ne classifica alcuni. Definizione 7.2. Un reticolo (X, ≥) si dice: (a) reticolo distributivo se valgono le leggi distributive tra ∨ e ∧: per ogni terna a, b, c ∈ X a ∨ (b ∧ c) = (a ∨ b) ∧ (a ∨ b) , a ∧ (b ∨ c) = (a ∧ b) ∨ (a ∧ b) ; (b) reticolo limitato se X ammette minimo, indicato con 0 e massimo, indicato con 1; (c) reticolo ortocomplementato se è limitato ed è dotato di un’applicazione X 3 a 7→ ¬a, dove ¬a è detto ortocomplemento di a, che soddisfa: (i) a ∨ ¬a = 1 per ogni a ∈ X, (ii) a ∧ ¬a = 0 per ogni a ∈ X, (iii) ¬(¬a) = a per ogni a ∈ X, (iv) se a ≥ b allora ¬b ≥ ¬a per ogni coppia a, b ∈ X. (d) reticolo σ-completo, se ogni insieme numerabile {an }n∈N ⊂ X ammette estremo superiore che viene denotato con ∨n∈N an . Un reticolo che soddisfi (a), (b) e (c) è detto algebra di Boole. Un’algebra di Boole che soddisfi (d) è detta algebra di Boole σ-completa ovvero, equivalentemente, σ-algebra di Boole. Definizione 7.3. Se X e Y sono algebre di Boole, un’applicazione h : X → Y è detta omomorfismo di algebre di Boole se soddisfa: h(a ∨ b) = h(a) ∨ h(b) , h(¬a) = ¬h(a) , per ogni coppia a, b ∈ X per ogni a ∈ X Se X e Y sono σ-algebre di Boole, un omomorfismo di algebre di Boole h : X → Y è detto omomorfismo di σ-algebre di Boole se soddisfa h(∨n∈N an ) = ∨n∈N h(an ) per ogni insieme numerabile {an }n∈N ⊂ X . Un omomorfismo biettivo di algebre di Boole (σ-algebre di Boole) è detto isomorfismo di algebre di Boole (rispettivamente di σ-algebre di Boole ). Note. (1) Si verifica che per ogni algebra di Boole X, se a ∈ X allora ¬a è l’unico elemento a soddisfare 186 (i) e (ii) di (c) nella definizione 7.2. Da questo risultato si prova che valgono le identità di De Morgan: per ogni a, b ∈ X, ¬(a ∨ b) = ¬a ∧ ¬b , ¬(a ∧ b) = ¬a ∨ ¬b . (2) Dalla stessa definizione di inf e sup si verifica che un’algebra di Boole è σ-completa se e solo se ogni insieme numerabile {an }n∈N ⊂ X ammette estremo inferiore. Tale estremo inferiore viene denotato con ∧n∈N an e vale ∧n∈N an = ¬(∨n∈N ¬an ) da cui anche ∨n∈N an = ¬(∧n∈N ¬an ). (3) Se h : X → Y è un omomorfismo di algebre di Boole, dalle identità di De Morgan si prova subito che h(a ∧ b) = h(a) ∧ h(b) , per ogni coppia a, b ∈ X . Nello stesso modo si ha subito che h(1) = 1 e h(0) = 0. (Per esempio h(1) = h(a ∨ ¬a) = h(a) ∨ ¬h(a) = 1.) (4) Usando il fatto che a ∨ b = b se e solo se a ≤ b, si ha che un omomorfismo di algebre di Boole h : X → Y preserva l’ordinamento: se per a, b ∈ X vale a ≤ b, allora vale anche h(a) ≤ h(b) . (5) Usando il punto (2) si ha facilmente che, se h : X → Y è un omomorfismo di σ-algebre di Boole, allora h(∧n∈N an ) = ∧n∈N h(an ) per ogni insieme numerabile {an }n∈N ⊂ X . (6) Si prova facilmente che, se h : X → Y è un isomorfismo di (σ-)algebre di Boole, allora h−1 : Y → X è un isomorfismo di (σ-)algebre di Boole. In base alle definizioni date risulta ovvio che valgono le seguenti proposizioni. Proposizione 7.1. Ogni σ-algebra su un insieme X è un’algebra di Boole (ossia un reticolo distributivo, limitato, ortocomplementato), σ-completa in cui: (i) la relazione d’ordine è l’inclusione insiemistica (e quindi ∨ corrisponde a ∪ e ∧ corrisponde a ∩), (ii) il massimo ed il minimo dell’algebra di Boole sono X e ∅, (iii) l’operazione di ortocomplemento corrisponde al complemento insiemistico rispetto allo spazio X. Proposizione 7.2. Siano Σ, Σ0 due σ-algebre su X e X0 rispettivamente e f : X → X0 una funzione misurabile. Valgono i due seguenti fatti: (a) Al variare di E ∈ Σ0 , gli insiemi (f ) PE := f −1 (E) 187 definiscono una σ-algebra di Boole t.c.: (i) la relazione d’ordine è l’inclusione insiemistica (e quindi ∨ corrisponde a ∪ e ∧ corrisponde a ∩), (ii) il massimo ed il minimo dell’algebra di Boole sono X = f −1 (X0 ) e ∅ = f −1 (∅), (iii) l’operazione di ortocomplemento corrisponde al complemento insiemistico rispetto allo spazio X. (f ) (b) L’applicazione Σ0 3 E 7→ PE è un omomorfismo di σ-algebre di Boole. Dobbiamo concludere le stesse cose per l’insieme delle proposizioni relative ad un sistema fisico: le proposizioni relative ad un sistema fisico costituiscono un reticolo distributivo, limitato, ortocomplementato e σ-completo, cioè una σ-algebra di Boole, in cui: (i) la relazione d’ordine corrisponde alla relazione di conseguenza logica, (ii) il massimo ed il minimo sono la proposizione sempre vera 1 e quella sempre falsa 0, (iii) l’operazione di ortocomplemento corrisponde alla negazione. (Si osservi che da (i) e (iii) segue che la congiunzione deve corrispondere all’intersezione e la disgiunzione all’unione.) Ulteriormente: Se f : Ft → R è una grandezza fisica rappresentata da una funzione misurabile (assumendo su R la σ-algebra di Borel), allora valgono i seguenti fatti. (a) Al variare di E nella σ-algebra di Borel di R, le proposizioni (f ) PE = “Il valore di f valutata sullo stato del sistema cade nell’insieme di Borel E ⊂ R” , definiscono una σ-algebra di Boole. (f ) (b) L’applicazione che associa ad ogni boreliano E ⊂ R la proposizione PE definisce un omomorfismo di σ-algebre di Boole. 7.3 Le proposizioni relative a sistemi quantistici come insiemi di proiettori ortogonali. Passiamo ora a considerare sistemi quantistici. Cercando di seguire un approccio per quanto possibile vicino al caso classico, vogliamo prima di tutto cercare di dare un modello matematico per la classe delle proposizioni relative allo stato quantistico ad un tempo t fissato, di un sistema quantistico. Non sappiamo ancora come descrivere lo stato quantistico, ma sappiamo qualcosa, QM1 e QM2, riguardo alle grandezze quantistiche misurabili sul sistema quando ne è assegnato lo stato. 188 Per il momento ci concentreremo su QM2. Sappiamo che esistono grandezze incompatibili. È immediato concludere che esistono proposizioni incompatibili: se A e B sono grandezze incompatibili (A) = “Il valore di A valutata sullo stato del sistema cade nell’insieme di Borel J ⊂ R” , (B) = “Il valore di B valutata sullo stato del sistema cade nell’insieme di Borel K ⊂ R” , PJ PK sono in generale proposizioni incompatibili: i valori di verità di tali proposizioni si disturbano a vicenda eseguendo la verifica di esse ripetutamente in successione con intervalli di tempo piccoli a piacere, in modo da non imputare il fenomeno all’evoluzione dello stato del sistema. Le misure sperimentali di grandezze su un sistema fisico sono associate ad apparati di misura e non sempre esistono apparati di misura che possano misurare contemporaneamente grandezze fisiche distinte. Ciò invece accade quando le grandezze sono una funzione dall’altra (es. l’energia ed il quadrato dell’energia). Risulta che le grandezze quantistiche incompatibili non sono mai funzioni una dell’altra e nemmeno che esistono apparati di misura in grado di misurarle contemporaneamente. Non ha quindi alcun senso fisico, in questa situazione, affermare che le due proposizioni considerate sopra, associate a grandezze fisiche incompatibili, possano assumere sul sistema un valore di verità contemporaneamente. Le due proposizioni, in questo senso sono dette incompatibili. Deve essere ben chiaro che quindi incompatibili non significa qui che le due proposizioni non possono essere vere contemporaneamente, per cui, per esempio, la loro disgiunzione è sempre falsa, ma significa molto più fortemente, che non ha senso (fisico) formarne la disgiunzione o la congiunzione di tali proposizioni ed attribuire ad esse qualsiasi valore di verità. Tale valore di verità non può nemmeno essere definito con una procedura di limite misurando successivamente le due grandezze perchè esse “si disturbano” nel senso precisato. (A) (B) In altre parole, lo ripetiamo, non ha senso dare significato fisico a proposizioni del tipo PJ OPK (A) (B) oppure PJ E PK perché non esiste, alcun modo sperimentale per attribuire valori di verità a tali proposizioni. Non possiamo allora assumere il modello dell’insieme delle proposizioni dato da qualche reticolo (o σ-algebra) di insiemi in cui la disgiunzione e la congiunzione sono sempre possibili. Dovremmo imporre degli ulteriori vincoli su tale modello, vietando certi sottoinsiemi. Una procedura alternativa, che si è rivelata molto più interessante è quella di modellizzare le proposizioni elementari tramite i proiettori ortogonali di uno spazio di Hilbert. 7.3.1 Reticoli di proiettori ortogonali su spazi di Hilbert. L’insieme dei proiettori ortogonali su uno spazio di Hilbert gode di alcune interessantissime proprietà molto vicine a quelle dei reticoli booleani con alcune importanti differenze che consentono di modellizzare le proposizioni incompatibili di sistemi quantistici. Non esamineremo la questione a fondo, ma discuteremo solo alcune proprietà importanti. Prima di tutto notiamo alcune proprietà molto interessanti che riguardano coppie di proiettori che commutano tra di loro. Proposizione 7.3. Sia (H, ( | )) uno spazio di Hilbert e sia P(H) l’insieme dei proiettori ortogonali su H. 189 Valgono le proprietà che seguono per ogni coppia P, Q ∈ P(H). (a) I seguenti fatti sono equivalenti: (i) P ≤ Q; (ii) P (H) è sottospazio di Q(H); (iii) P Q = P (iv) QP = P . (b) I seguenti fatti sono equivalenti: (i) P Q = 0; (ii) QP = 0; (iii) P (H) e Q(H) sono ortogonali. Se vale (i) oppure (ii) oppure (iii), P + Q è proiettore ortogonale e proietta su P (H) ⊕ Q(H). (c) Se P Q = QP allora P Q è proiettore ortogonale e proietta su P (H) ∩ Q(H). (d) Se P Q = QP allora P + Q − P Q è proiettore ortogonale e proietta sul sottospazio chiuso < P (H), Q(H) >. Prova. (a) Prima di tutto notiamo che se P è un proiettore che proietta su M , allora P u = 0 se e solo e u ∈ M ⊥ a causa della decomposizione diretta ortogonale H = M ⊕ M ⊥ ((d) in teorema 3.1) e tenendo conto che il componente di u in M è proprio P u. (i) ⇒ (ii). Se P ≤ Q allora (u|Qu) ≥ (u|P u) ovvero essendo i proiettori idempotenti ed autoaggiunti: (Qu|Qu) ≥ (P u|P u) che si può anche scrivere come ||Qu|| ≥ ||P u||. Quindi in particolare Qu = 0 implica P u = 0 ovvero Q(H)⊥ ⊂ P (H)⊥ . Usando (e) di teorema 3.1 e notando che Q(H) e P (H) sono chiusi, troviamo infine che P (H) ⊂ Q(H). (ii) ⇒ (iii). Se S è una base hilbertiana per P (H) la si completi a base per Q(H) aggiungendo l’insieme S 0 di vettori ortogonali a S. Si tenga ora conto che, per (d) di proposizione 3.9, P = sP P 0 u∈S u(u| ) e Q = s- u∈S∪S 0 u(u| ). Dall’ortogonalità di S e S , dal fatto che ciascuno di essi è insieme ortonormale e infine dalla continuità del prodotto scalare segue immediatamente la tesi per controllo diretto. (iii) ⇔ (iv). Si ottengono una dall’altra prendendo l’aggiunto ad ambo membri. (iii) e (iv) ⇒ (i). Se u ∈ H, (u|Qu) = ((P + P ⊥ )u|Q(P + P ⊥ )u) dove P ⊥ = I − P . Notiamo che P e P ⊥ commutano con Q per (iii) e (iv) inoltre P P ⊥ = P ⊥ P = 0. Sviluppando il secondo membro di (u|Qu) = (u|(P + P ⊥ )Q(P + P ⊥ )u) , si ha, tenendo conto che alcuni termini sono nulli per quanto appena detto: (u|Qu) = (u|P QP u) + (u|P ⊥ QP ⊥ u) . D’altra parte, per (iii) e (iv): (u|P QP u) = (u|P P u) = (u|P u). Concludiamo che: (u|Qu) = (u|P u) + (u|P ⊥ QP ⊥ u) . e quindi (u|Qu) ≥ (u|P u). (b) Supponiamo P Q = 0, prendendo l’aggiunto si ha che QP = 0, quindi si verifica immediatamente che P (H) e Q(H) sono ortogonali essendo P Q = QP = 0. Se P (H) e Q(H) sono ortogonali, 190 prendiamo in ciascuno di tali spazi una base hilbertiana N e N 0 rispettivamente, scrivendo i P P proiettori P e Q come indicato in (d) di proposizione 3.9: P = u∈N (u| )u, Q = u∈N 0 (u| )u, si ricava immediatamente che P Q = QP = 0. Usando le espressioni di P e Q scritte sopra, tenendo conto che N ∪ N 0 è una base hilbertiana per P (H) ⊕ Q(H) ed usando ancora (d) di proposizione 3.9 si ricava che P + Q è il proiettore ortogonale che proietta su P (H) ⊕ Q(H). (c) Il fatto che P Q sia proiettore ortogonale (cioè autoaggiunto ed idempotente) se P Q = QP dove P e Q sono proiettori ortogonali è di immediata verifica. Se u ∈ H, P Qu ∈ P (H), ma anche P Qu = QP u ∈ Q(H) e quindi P Qu ∈ P (H)∩Q(H). Abbiamo provato che P Q(H) ⊂ P (H)∩Q(H), per concludere basta provare che P (H) ∩ Q(H) ⊂ P Q(H). Se u ∈ P (H) ∩ Q(H) allora P u = u e Qu = u e quindi vale anche P u = P Qu = u ossia u ∈ P Q(H). Questo significa che se P (H) ∩ Q(H) ⊂ P Q(H). (d) Il fatto che R := P +Q−P Q sia proiettore ortogonale è di immediata verifica. Consideriamo lo spazio < P (H), Q(H) >. Possiamo costruire una base hilbertiana per tale spazio come segue. Per prima cosa costruiamo una base hilbertiana N per il sottospazio chiuso P (H)∩Q(H). Quindi aggiungiamo a questa una seconda base hilbertiana per lo spazio che “rimane in P (H) una volta tolto P (H) ∩ Q(H)”, cioè costruiamo una base hilbertiana N 0 per lo spazio chiuso ortogonale in P (H) a P (H) ∩ Q(H): P (H) ∩ (P (H) ∩ Q(H))⊥ . Infine costruiamo, con lo stesso criterio, una terza base hilbertiana N 00 per Q(H) ∩ (P (H) ∩ Q(H))⊥ . È facile convincersi che le tre basi sono a due a due ortogonali e insieme costituiscono una base per < P (H), Q(H) >. Tutto ciò mostra che vale la decomposizione diretta ed ortogonale < P (H), Q(H) > = (P (H) ∩ Q(H)) ⊕ (P (H) ∩ (P (H) ∩ Q(H))⊥ ) ⊕ (Q(H) ∩ (P (H) ∩ Q(H))⊥ ) . Nelle nostre ipotesi, il proiettore sul primo spazio della decomposizione è P Q per (c). Il proiettore su (P (H)∩Q(H))⊥ ) è quindi I −P Q. Quindi, applicando nuovamente (c), il proiettore ortogonale sul secondo addendo della decomposizione è P (I − P Q) = P − P Q. Similmente, il proiettore sul terzo addendo della decomposizione è Q(I − P Q) = Q − P Q. Applicando (b), il proiettore sulla somma diretta ortogonale dei tre spazi detti, cioè su < P (H), Q(H) > sarà: P Q + (P − P Q) + (Q − P Q) = P + Q − P Q . Questo conclude la dimostrazione. 2 In base a quanto dimostrato, consideriamo due proiettori ortogonali P, Q ∈ P(H) che commutano e assumiamo di associare a tali proiettori delle proposizioni sul sistema fisico indicate con le stesse lettere. Se facciamo le associazioni P E Q ←→ P Q , P O Q ←→ P + Q − P Q , aP ←→ I − P , i secondi membri delle associazioni scritte sopra sono ancora proiettori ortogonali. Inoltre questi proiettori soddisfano proprietà formalmente identiche a quelle delle proposizioni costruite con 191 connettivi logici. Per esempio, risulta subito che a (P E Q) =aP O aQ. Infatti: aP O aQ ←→ (I−P )+(I−Q)−(I−P )(I−Q) = 2I−P −Q−I+P Q+P +Q = I−P Q ←→a (P EQ). ed in tal modo si possono verificare tutte le relazioni che abbiamo scritto precedentemente, quando si lavora con proiettori commutanti. Si osservi ancora che se P e Q commutano e P ≤ Q allora P Q = QP = P e P + Q − P Q = Q per cui, se pensiamo P, Q, P Q, P + Q − P Q come proposizioni sul sistema, quando P ≤ Q, dobbiamo attribuire a P Q e P + Q − P Q gli stessi valori di verità che assume P . Questo fatto è analogo, tenendo conto delle associazioni di sopra, a quanto accade a P E Q e P O Q nelle situazioni in cui Q è conseguenza logica di P . La differenza sostanziale tra i proiettori ortogonali e le proposizioni di un sistema classico è però la seguente. Se i proiettori P e Q non commutano, P Q e P + Q − P Q non sono nemmeno proiettori in generale, per cui le associazioni sopra proposte non hanno significato. Tutto ciò sembra molto interessante per il nostro fine di cercare un modello per le proposizioni dei sistemi quantistici tenendo conto di QM2. L’idea è che: le proposizioni dei sistemi quantistici sono in corrispondenza biunivoca con proiettori ortogonali in uno spazio di Hilbert in modo tale che: (i) la relazione di conseguenza logica tra proposizioni P e Q (ossia che P ⇒ Q) corrisponda alla relazione P ≤ Q tra i corrispondenti proiettori; (ii) due proposizioni sono compatibili se e solo se i rispettivi proiettori commutano. Nota. Prima di procedere ulteriormente chiariamo un punto sulla natura dei proiettori ortogonali commutanti. Dai punti (a) e (b) della proposizione 7.3 si potrebbe sospettare che gli unici casi in cui due proiettori ortogonali P e Q commutino siano quando: (a) gli spazi su cui proiettano sono uno incluso nell’altro, oppure, (b) gli spazi su cui proiettano sono reciprocamente ortogonali. Mostriamo con un esempio concreto che ci sono altre possibilità. Consideriamo lo spazio L2 (R2 , dx ⊗ dy) dove dx e dy sono la misura di Lebesgue sulla retta reale. Consideriamo gli insiemi del piano: A = {(x, y) ∈ R2 | a ≤ x ≤ b}, con a < b fissati, e B = {(x, y) ∈ R2 | c ≤ y ≤ d}, con c < d fissati. Se G ⊂ R2 è misurabile, definiamo l’operatore lineare PG : L2 (R2 , dx ⊗ dy) → L2 (R2 , dx ⊗ dy) definito da PG f = χG · f per ogni f ∈ L2 (R2 , dx ⊗ dy), dove χG è, al solito, la funzione caratteristica di G e · indica il prodotto di funzioni punto per punto. L’operatore PG è un proiettore ortogonale come è facile provare. Inoltre si verifica subito che PG (L2 (R2 , dx ⊗ dy)) = {f ∈ L2 (R2 , dx ⊗ dy) | ess supp f ⊂ G} , dove ess supp f è il supporto essenziale di f , dato, come ben noto, dal complemento dell’unione degli aperti sui quali f è nulla quasi ovunque. È allora immediato verificare che nessuno dei due spazi di proiezione PA (L2 (R2 , dx ⊗ dy)) e PB (L2 (R2 , dx ⊗ dy)) è incluso nell’altro e nemmeno i due spazi di proiezione sono ortogonali. Tuttavia vale PA PB = PB PA = PA∩B . 192 Se l’idea della corrispondenza tra proposizioni di sistemi quantistici e proiettori ortogonali su un opportuno spazio di Hilbert è sensata, le similitudini strutturali tra i costrutti con i proiettori ortogonali e quelli dell’algebra di Boole σ-completa delle proposizioni deve valere anche quando si considerino più di due proposizioni. In particolare, ci si aspetta di trovare una struttura di reticolo distributivo, limitato, ortocomplementato (ed eventualmente σ-completo) in qualche insieme opportunamente scelto di proiettori rappresentante proprietà compatibili a due a due. Il teorema seguente, oltre ad asserire che lo spazio di tutti i proiettori ortogonali è un reticolo (non distributivo in generale), mostra che è davvero cosı̀. ] di proiettori ortogonali a due a due commutanti, è facile provare Se abbiamo un insieme, P(H), con il Lemma di Zorn (vedi Appendice A) che esiste anche un insieme P0 (H) di proiettori or] e che è massimale rispetto alla condizione di commutatività togonali che include l’insieme P(H) (cioè ogni proiettore ortogonale che commuta con gli elementi di P0 (H) è contenuto in P0 (H)). Teorema 7.1. Sia H spazio di Hilbert. (a) La classe dei proiettori ortogonali su H, P(H), è un reticolo limitato, ortocomplementato, σ-completo e, in generale, non distributivo. Più precisamente: (i) la relazione d’ordine è la relazione d’ordine ≥ tra proiettori, (ii) il massimo ed il minimo di P(H) sono: I (operatore identità) e 0 (operatore nullo) rispettivamente, (iii) l’operazione di ortocomplemento del proiettore ortogonale P corrisponde a ¬P = I − P . (7.5) (iv) P(H) non è distributivo se dimH ≥ 2. (b) In P(H) valgono i seguenti ulteriori fatti: (i) se P, Q ∈ P(H) commutano, allora: P ∧ Q = PQ , (7.6) P ∨ Q = P + Q − PQ , (7.7) (ii) se {Qn }n∈N ⊂ P(H) è costituito da elementi a due a due commutanti, allora: ∨n∈N Qn = s- lim Q0 ∨ · · · ∨ Qn , (7.8) ∧n∈N Qn = s- lim Q0 ∧ · · · ∧ Qn , (7.9) n→+∞ n→+∞ indipendentemente dall’ordine con cui si etichettano i Qn . (c) Sia P0 (H) ⊂ P(H) un insieme di proiettori ortogonali a due a due commutanti e sia P0 (H) massimale rispetto alla condizione di commutatività, allora vale quanto segue: (i) P0 (H) è un reticolo limitato, ortocomplementato, σ-completo e distributivo – ossia una σ-algebra di Boole – rispetto alla relazione d’ordine ≥; 193 (ii) il minimo, il massimo di P0 (H), l’ortocomplemento di elementi di P0 (H), l’estremo inferiore e quello superiore di insiemi al più numerabili di P0 (H), esistono in P0 (H) e coincidono con i corrispondenti elementi calcolati rispetto P(H). (d) Più in generale se P0 (H) ⊂ P(H) è un insieme di proiettori ortogonali a due a due commutanti, ma non necessariamente massimale, soddisfacente la proprietà (ii) in (c), allora P0 (H) è una σ-algebra di Boole rispetto alla relazione d’ordine ≥. Prova. (a) Ricordiamo che ≥ è una relazione d’ordine parziale in P0 (H) per (f) di proposizione 3.8. Si tenga quindi conto di (a) di proposizione 7.3, per cui: P ≤ Q se e solo se P (H) ⊂ Q(H) (7.10) In tal modo la relazione d’ordine parziale sui proiettori ortogonali corrisponde biunivocamente a quella dei relativi sottospazi di proiezione. La classe dei sottospazi chiusi di H è un reticolo: se M, N sono sottospazi chiusi, l’estremo superiore ed inferiore di tale coppia sono rispettivamente M ∨ N = < M, N > e M ∧ N = M ∩ N. Proviamolo. < M, N > è un sopraspazio chiuso di M ed N per costruzione, inoltre, se L è un sopraspazio chiuso di M e di N, deve contenerli entrambi e quindi contiene < M, N >, quindi M ∨ N = < M, N >. M ∩ N è un sottospazio chiuso di M ed N per costruzione, inoltre, se L è un sottospazio chiuso contenuto in M ed N, deve essere contenuto in M ∩ N, quindi M ∧ N = M ∩ N. Passando ai proiettori ed usando (7.10), avremo che se P, Q ∈ P(H), P ∨ Q è il proiettore ortogonale che proietta su < P (H), Q(H) >, mentre P ∧ Q è il proiettore ortogonale che proietta su P (H) ∩ Q(H). Si osservi che la dimostrazione con le stesse argomentazioni, può essere estesa immediatamente al caso di una famiglia finita o numerabile di proiettori ortogonali {Pi }i∈I . In tal caso: ∨i∈I Pi è il proiettore ortogonale che proietta su < {Pi (H)}i∈I > e ∧i∈I Pi è il proiettore ortogonale che proietta su ∩i∈I Pi (H) per cui il reticolo dei proiettori ortogonali e quello dei sottospazi chiusi sono entrambi σ-completi. È chiaro che, nel reticolo dei sottospazi chiusi, il minimo ed il massimo sono, rispettivamente {0} e H. Passando al reticolo dei proiettori ortogonali tramite (7.10), si ha che il minimo ed il massimo sono, rispettivamente, il proiettore ortogonale che proietta su {0}, cioè l’operatore nullo, ed il proiettore su H che coincide con l’operatore identità. L’ortocomplementazione di proiettori ¬P := I − P , corrisponde all’ortocomplementazione di sottospazi chiusi per (b) di proposizione 3.9: ¬P (M) := P (M)⊥ . La verifica delle proprietà dell’operazione di ortocomplementazione per sottospazi (e quindi per proiettori) è allora immediata tenendo conto di (b), (d) ed (e) nel teorema 3.1. Diamo infine un controesempio per provare che il reticolo dei sottospazi chiusi, e quindi anche quello dei proiettori ortogonali, non è distributivo. Consideriamo un sottospazio bidimensionale S di uno spazio di Hilbert H con dimensione ≥ 2. Possiamo identificare con C2 tale sottospazio scegliendo in esso una base ortonormale {e1 , e2 }. Si considerino quindi i tre sottospazi di S, H1 :=< e1 >, H2 :=< e2 >, H3 :=< e1 + e2 >. Vale H1 ∧ (H2 ∨ H3 ) = H1 ∧ S = H1 , ma (H1 ∧ H2 ) ∨ (H1 ∧ H3 ) = {0} ∨ {0} = {0}. Per cui: H1 ∧ (H2 ∨ H3 ) 6= (H1 ∧ H2 ) ∨ (H1 ∧ H3 ) . 194 (b) e (c) Se i proiettori ortogonali P e Q commutano, oppure se i proiettori ortogonali {Qn }n∈N commutano a due a due, per il Lemma di Zorn, esiste sempre un insieme massimale di proiettori ortogonali commutanti a due a due P0 (H) che contiene P e Q oppure, rispettivamente, {Qn }n∈N . Con tale precisazione possiamo provare (b) e (c) contemporaneamente, scegliendo un tale P0 (H) arbitrariamente nella prova di (b). È chiaro che 0 e I appartengono a P0 (H) dato che commutano con tutti gli elementi di P0 (H). La stessa cosa accade per ¬P = I − P se P ∈ P0 (H). Bisogna ora provare che, per ogni coppia di proiettori P, Q ∈ P0 (H), esistono l’estremo superiore e quello inferiore per l’insieme {P, Q} nello spazio P0 (H), che questi si calcolano come detto in (b) e che, infine, tali proiettori coincidono con l’estremo superiore e quello inferiore per l’insieme {P, Q} nello spazio P(H). Le proprietà di distributività di ∨ e ∧ seguono facilmente dalle formule (7.7) e (7.6), dalle proprietà di commutatività dei proiettori e dal fatto che i proiettori ortogonali soddisfano la proprietà di idempotenza P P = P . Tenendo conto di (c) di proposizione 7.3, il proiettore su M ∩N , che corrisponde a P ∧Q in P(H), è proprio P Q che appartiene a P0 (H) perché, per costruzione, commuta con tutti i proiettori di P0 (H) e tale insieme è massimale. Concludiamo che P ∧ Q := inf {P, Q} = inf {P, Q} = P Q . P0 (H) P(H) Dato che P e Q commutano per ipotesi, il proiettore su < M, N >, che corrisponde a P ∨ Q calcolato in P(H), è P + Q − P Q per (d) di proposizione 7.2 e tale proiettore appartiene a P0 (H) perché commuta con tutti i proiettori di P0 (H). Concludiamo, come sopra, che P ∨ Q := sup {P, Q} = sup {P, Q} = P + Q − P Q : P0 (H) P(H) Quindi P0 (H) è un’algebra di Boole. Mostriamo per concludere che P0 (H) è σ-completo. Consideriamo una famiglia numerabile di proiettori {Qn }n∈N ed associamo a ciascuno dei Qn il nuovo proiettore Pn definito induttivamente come P0 := Q0 e, per n = 1, 2, . . .: Pn := Qn (I − P1 − . . . − Pn−1 ) . Si verifica facilmente per induzione che: (i) Pn Pm = 0 se n 6= m; (ii) Q1 ∨ · · · ∨ Qn = P1 ∨ · · · ∨ Pn = P1 + · · · + Pn per n = 0, 1, . . .. Si osservi che allora, se definiamo gli operatori limitati: An := P1 + · · · + Pn risulta subito che: (iii) An = A∗n e An An = An per ogni n = 0, 1, . . ., cioè gli An sono proiettori ortogonali per cui in particolare An ≤ I, per ogni n = 0, 1, . . . per (e) di proposizione 3.9. (iv) An ≤ An+1 per ogni n = 0, 1, . . ., Per la proposizione 3.11 esiste l’operatore limitato autoaggiunto Q dato dal limite forte A = s- lim Pn = s- lim Q0 ∨ · · · ∨ Qn . n→+∞ n→+∞ 195 È immediato verificare dall’espressione di sopra che AA = A, per cui A è ancora un proiettore ortogonale che appartiene a P0 (H) in quanto è limite (forte) di operatori che commutano con tutti gli elementi di P0 (H). Vale, sempre per la proposizione 3.11, An ≤ A e quindi in particolare Qn ≤ Q1 ∨ · · · ∨ Qn ≤ A per ogni n ∈ N. Mostriamo che A è l’estremo superiore della classe dei Qn , sia in P(H) che in P0 (H). Supponiamo che il proiettore ortogonale K ∈ P(H) soddisfi K ≥ Qn per ogni n ∈ N. Questo significa che KQn = Qn per (a) di proposizione 6.3. Allora, dalla definizione degli operatori Pn , vale anche KPn = Pn e quindi KAn = An , per cui K ≥ An per ogni naturale n per (a) di proposizione 7.3. La proposizione 3.11 assicura allora che K ≥ A. In altre parole A ∈ P0 (H) è un maggiorante della classe dei Qn ed ogni altro maggiorante K ∈ P(H) maggiora A. Per definizione di estremo superiore A = supP(H) {Qn }n∈N =: ∨n∈N Qn . Dato che A ∈ P0 (H), A sarà anche estremo superiore in P0 (H). È chiaro che nell’identità provata sopra: ∨n∈N Qn = s- lim Q0 ∨ · · · ∨ Qn n→+∞ è irrilevante l’ordine con cui sono stati etichettati i Qn dato che il primo membro, cioè l’estremo superiore dell’insieme {Qn }n∈N , non dipende dall’ordine con cui si etichettano gli elementi dell’insieme per definizione. La formula (7.9) si dimostra facilmente usando ¬ e formula (7.8) per l’estremo superiore. La prova di (d) è immediata tenendo semplicemente conto che la commutatività implica la distributività del reticolo direttamente da (i) e (ii) di (b). 2 Questa proposizione conclude la nostra brevissima introduzione alla teoria dei reticoli ed alle sue relazioni con la formulazione della Meccanica Quantistica. Essa mostra che ha o può avere senso pensare di associare proiettori ortogonali a proposizioni relative a sistemi quantistici, descrivendo l’incompatibilità tra proposizioni in termini di non commutativtà dei proiettori associati. In questo contesto si ritrova anche la struttura classica restringendosi a lavorare in insiemi di proiettori commutanti massimali oppure, più generalmente, che soddisfino la richiesta (ii) in (c) nella tesi del teorema. Ci si può chiedere se sia possibile dare delle motivazioni più profonde per la scelta di descrivere le proprietà dei sistemi fisici quantistici tramite un reticolo di proiettori ortogonali che non siano la semplice risposta “perché funziona”. Importanti, sebbene parziali, risultati in questa direzione sono stati ottenuti da diversi autori (tra cui G. Makey) a partire dal celebre lavoro di C. Piron “Axiomatique Quantique” Helv. Phys. Acta 37 439-468 (1964). È importante precisare che quanto visto in questo capitolo è solo un piccolo ed informale passo verso le diverse formulazione della Logica Quantistica (o logiche quantistiche) della quale non ci occuperemo. Si vedano a tal proposito [DCGi02, EGL09] oltre che [Bon97]. L’unica cosa che possiamo dire è che per costruire le logiche quantistiche si preferisce considerare i sottospazi su cui proiettano i proiettori ortogonali piuttosto che i proiettori stessi. La struttura di reticolo nell’insieme dei sottospazi chiusi indotta dall’inclusione insiemistica non è altro che quella dei proiettori di P(H) rispetto alla relazione d’ordine parziale tra operatori limitati ≥, come visto nella dimostrazione del teorema precedente. Il reticolo che si viene a costruire in questo modo, come accade per il corrispondente reticolo di proiettori ortogonali, soddisfa tutte le ipotesi che 196 definiscono una σ-algebra di Boole eccetto la proprietà distributiva. Soddisfa invece una proprietà differente che produce la struttura di reticolo ortomodulare, limitato e σ-completo. Un punto importante è il seguente. Per noi R := P ∧ Q indica solo il proiettore che proietta sull’intersezione dei sottospazi associati a P e Q. R può avere o meno senso fisico come proposizione sul sistema, ma non corrisponde alla proposizione P E Q quando P e Q sono associati a proposizioni mutuamente incompatibili. Viceversa, nell’approccio dovuto a von Neumann e Birkhoff, che corrisponde alla cosiddetta logica quantistica standard, ∨ e ∧ vengono usati come veri e propri connettivi (soddisfacenti un’altra algebra rispetto ai connettivi usuali), anche quando connettono proiettori che corrispondono a proposizioni incompatibili per cui non esistono sistemi di misura in grado di assegnare a P e Q un valore di verità contemporaneamente. Il significato fisico di tali connettivi è pertanto poco chiaro. Per questa ragione il punto di vista della Logica Quantistica standard è stato criticato dai fisici (vedi il cap. 5 di [Bon97] per una discussione approfondita). In realtà vi sono almeno tre questioni che hanno portato allo stallo se non al fallimento del programma di Birkhoff e von Neumann di trovare l’impostazione fisica più profonda della Meccanica Quantistica in una Logica Quantistica basata sulla teoria dei reticoli ortomodulari. (a) La mancanza di distributività della Logica Quantistica rende difficile l’interpretazione del formalismo in termini di una struttura logica. (b) A dispetto di grandi sforzi, non sembra possibile una ragionevole generalizzazione dell’operatore implicazione e quindi non c’è un vero sistema deduttivo nella Logica Quantistica. (c) La Logica Quantistica è rimasta un linguaggio proposizionale, dato che non è stato possibile trovare una estensione alla logica dei predicati. Negli ultimi anni, diversi autori (in particolare C. Isham, N.P. Landsman e collaboratori) hanno introdotto nuovi approcci formali, in un certo senso più profondi, della Logica Quantistica à la Birkhoff e von Neumann, in particolare impiegando la teoria dei topos1 . 7.4 Le proposizioni e gli stati relativi a sistemi quantistici. In questa sezione daremo i primi due assiomi della formulazione generale della Meccanica Quantistica, precisando come sono descritte matematicamente le proposizioni dei sistemi quantistici e gli stati dei sistemi quantistici facendo uso di un opportuno spazio di Hilbert. Caratterizzeremo tali stati attraverso un importante teorema dovuto a Gleason. Infine mostreremo che gli stati quantistici formano un insieme convesso e possono essere costruiti come combinazioni lineari di stati estremali detti stati puri che sono in corrispondenza biunivoca con gli elementi (raggi) dello spazio proiettivo associato allo spazio di Hilbert del sistema fisico. 1 Vedi ad esempio: C. Heunen, N.P. Landsman, B. Spitters, A topos for algebraic quantum theory, arXiv:0709.4364v2 [quant-ph], April 6, 2008. 197 7.4.1 Proposizioni e stati di sistemi quantistici: il teorema di Gleason. In base a quanto visto nella sezione precedente, assumeremo il seguente assioma della Meccanica Quantistica, dove come già fatto precedentemente, indichiamo con la stessa lettera proposizioni e proiettori corrispondenti. A1. Le proposizioni riguardanti un sistema quantistico S sono in corrispondenza biunivoca con (un sottoinsieme de) il reticolo (rispetto all’inclusione di sottospazi) P(HS ) dei proiettori ortogonali di uno spazio di Hilbert (complesso) e separabile HS , detto spazio di Hilbert associato ad S. Inoltre: (1) La compatibilità tra proposizioni corrisponde alla commutatività dei rispettivamente associati proiettori ortogonali; (2) l’implicazione logica tra due proposizioni compatibili P ⇒ Q corrisponde alla relazione P ≤ Q per i proiettori associati; (3) I (operatore identità) e 0 (operatore nullo) corrispondono rispettivamente alla proposizione sempre vera ed a quella sempre falsa; (4) la negazione di una proposizione P , ¬P corrisponde al proiettore ortogonale ¬P = I − P ; (5) solo quando le proposizioni P e Q sono compatibili le proposizioni P O Q e P E Q hanno senso fisico e corrispondono rispettivamente ai proiettori ortogonali P ∨ Q e P ∧ Q; (6) se {Qn }n∈N è un insieme numerabile di proposizioni a due a due compatibili, hanno senso fisico le proposizioni corrispondenti a ∨n∈N Qn e ∧n∈N Qn . Nota. La richiesta che lo spazio HS sia separabile verrà chiarita più avanti quando considereremo sistemi quantistici concreti e daremo una rappresentazione esplicita di HS . Malgrado la questione sia alquanto sottile d’ora in poi assumeremo che il sottoinsieme di P(HS ) che descrive le proposizioni del sistema sia effettivamente tutto P(HS ). Possiamo anche dare un secondo assioma che riguarda gli stati quantistici. L’idea, basata su QM1 e QM2 (e sulle successive osservazioni) è che uno stato quantistico al tempo t assegni la “probabilità” che sia vera ogni proposizione del sistema. L’idea è quella di generalizzare il concetto di misura σ-additiva di probabilità. Invece di definirla su una σ-algebra, la dobbiamo pensare come definita sull’insieme dei proiettori associati alle proposizioni sul sistema. Sappiamo che ogni insieme massimale di proposizioni compatibili definisce un’algebra di Boole σ-finita, che è una generalizzazione di una σ-algebra su cui si definiscono le misure. La richiesta naturale è quindi la seguente. A2 (forma provvisoria). Uno stato ρ al tempo t su un sistema quantistico S è un’applicazione ρ : P(HS ) → [0, 1] tale che: (1) ρ(I) = 1; (2) se {Pi }i∈N ⊂ P(HS ) soddisfa: Pi Pj = 0 per i 6= j, allora ρ s- +∞ X ! Pi = i=0 +∞ X i=0 198 ρ(Pi ) . Note. (1) La richiesta (1) dice semplicemente che la proposizione sempre vera ha probabilità certa di essere vera su ogni stato. (2) La richiesta (2) vale evidentemente anche per proposizioni in numero finito: è sufficiente che definitivamente Pi = 0. (3) La richiesta (2) può essere riscritta come: ρ (∨i∈N Pi ) = +∞ X ρ(Pi ) , i=1 per ogni classe di proposizioni {Pi }i∈N ⊂ P(HS ) compatibili e che si escludono a vicenda a due P a due, per cui +∞ i=0 Pi = ∨i∈N Pi esiste sempre per la teorema 7.1. (La prova dell’esistenza di P+∞ P è comunque la seguente. Nelle ipotesi fatte, le ridotte della serie definiscono operatori i=0 i P autoaggiunti idempotenti e quindi proiettori ortogonali. Quindi N i=0 Pi ≤ I per (e) della propoPN +1 PN sizione 3.9. Inoltre i=0 Pi ≥ i=0 Pi come è immediato provare. Quindi per la proposizione 3.11 esiste il limite in senso forte della successione delle ridotte. È immediato provare che tale limite è ancora idempotente ed autoaggiunto per cui è un proiettore ortogonale.) (4) È chiaro che ogni stato ρ determina l’equivalente di una misura positiva σ-additiva di probabilità in ogni insieme massimale di proiettori commutanti P0 (Hs ) che, come visto, è una diretta generalizzazione del concetto di σ-algebra. In questo senso abbiamo definito un’estensione del concetto di misura di probabilità. (5) Il lettore deve essere messo in guardia dall’idea di identificare la “misura di probabilità” ρ con una vera misura di probabilità su una σ-algebra. Il fatto che ora consideriamo anche proposizioni incompatibili nel senso quantistico cambia completamente le regole della probabilità condizionata. La probabilità che sia vera P quando è verificata Q segue delle regole diverse da quelle in teoria della probabilità classica se P e Q sono incompatibili nel senso quantistico. Commento importante. Quando assegniamo uno stato ci saranno dunque delle proposizioni con probabilità 1 di essere verificate se il sistema viene sottoposto a processo di misura rispetto a tali proposizioni, e proposizioni con probabilità inferiore a 1 di essere verificate se il sistema viene sottoposto a processo di misura rispetto a tali proposizioni. Riguardo alle prime proposizioni, possiamo pensare che esse corrispondano a proprietà che il sistema effettivamente abbia nello stato considerato. Assumendo l’interpretazione standard della Meccanica Quantistica, in cui la probabilità non ha significato epistemico, dobbiamo concludere che le proprietà relative alle seconde proposizioni non sono definite nello stato considerato. Un esempio importante dal punto di vista fisico è il seguente. Consideriamo le proposizioni PE che corrispondono alla proprietà di un sistema fisico dato da una particella quantistica descritta sulla retta reale: “la particella ha posizione nel boreliano E ∈ R”. Se lo stato ρ del sistema assegna ad ogni PE , con E limitato, probabilità inferiore a 1 (ed è facile esibire uno di questi stati come vedremo più avanti trattando il principio di indeterminazione di Heisenberg che come vedremo è un teorema) dobbiamo concludere che la posizione della particella, nello stato ρ, non 199 è definita. Da questo punto di vista risulta chiaro che la descrizione spaziale delle particelle come punti di una varietà (in questo caso R) che rappresenta “lo spazio”, non gioca più un ruolo centrale come accadeva in fisica classica. In un certo senso tutte le proprietà (che possono assumere valori diversi a seconda dello stato) di un sistema fisico sono messe sullo stesso piano e lo “spazio” in cui descrivere il sistema ed i suoi stati è uno spazio di Hilbert. Dal punto di vista matematico la domanda che dobbiamo porci immediatamente è se esistano davvero applicazioni ρ che godano delle proprietà enunciate in A2. Dato uno spazio di Hilbert separabile H, mostriamo che esistono applicazioni ρ : P(H) → [0, 1] tale che: (1) ρ(I) = 1; (2) se {Pi }i∈N ⊂ P(H) soddisfa: Pi Pj = 0 per i 6= j, allora ρ s- +∞ X ! Pi = i=0 +∞ X ρ(Pi ) . i=0 Proposizione 7.5. Sia H spazio di Hilbert separabile e T : H → H un operatore di classe traccia, positivo (e quindi autoaggiunto) con traccia di valore 1. Se definiamo ρT : P(H) → R come ρT (P ) := tr(T P ) per ogni P ∈ P(H) allora: (a) ρT (P ) ∈ [0, 1] per ogni P ∈ P(H), (b) ρT (I) = 1, (c) se {Pi }i∈N ⊂ P(H) soddisfa: Pi Pj = 0 per i 6= j, allora ρT s- +∞ X ! Pi = i=0 +∞ X ρT (Pi ) . i=1 Prova. Notiamo che T P è di classe traccia per ogni P ∈ P(H) per (b) del teorema 4.7 essendo P limitato, per cui ha senso calcolare tr(T P ). La positività di T assicura che gli autovalori di T sono tutti reali non negativi ((c) in proposizione 3.8). Mostriamo che in realtà gli autovalori cadono tutti in [0, 1]. T è un operatore compatto autoaggiunto (in quanto positivo). Usando la decomposizione vista nel teorema 4.4, tenendo conto che |A| = A (perché A ≥ 0), e che quindi, nella decomposizione polare di A = U |A|, vale U = I, troviamo: T = X mλ X λ (uλ,i | ) uλ,i . λ∈σp (A) i=1 Sopra σp (A) è l’insieme degli autovalori di A e, se λ > 0, {uλ,i }i=1,...,mλ è una base dell’autospazio associato a λ ∈ σp (A). Infine, la convergenza è nella topologia uniforme. Possiamo riscrivere lo 200 sviluppo di sopra come T = X λj (uj | )uj . (7.11) j dove abbiamo etichettato su N (o su un suo sottoinsieme finito se dim(H) < +∞) l’insieme degli autovettori uj = uλ,i , con λ > 0, denotando con λj l’autovalore di uj ed abbiamo completato a base hilbertiana di H l’insieme degli autovettori detti aggiungendo una base per il nucleo di T (la base complessiva è comunque al più numerabile perché H è separabile). Calcolando la traccia di T sulla base degli uj , nelle nostre ipotesi abbiamo 1 = tr(T ) = X λj , j per cui λj ∈ [0, 1]. Si osservi che l’identità di sopra prova anche (b) essendo T I = I. Sia ora P ∈ P(H), Calcolando la traccia di T P sulla base detta: tr(T P ) = X λj (uj |P uj ) . j Dato che (uj |P uj ) = (P uj |P uj ), abbiamo che 0 ≤ (uj |P uj ) ≤ ||P ||2 ||uj ||2 ≤ 1. dove abbiamo tenuto conto del fatto che ||uj || = 1 e che ||P || ≤ 1 ((e) in proposizione 3.9). In definitiva: 0≤ X λj (uj |P uj ) ≤ X j λj = 1 j per cui vale (a). Proviamo (c). Scegliamo una base hilbertiana {ui,j }j∈Ii in ogni spazio Pi (H). Lasciamo al lettore la verifica del fatto che, nelle nostre ipotesi, B := {ui,j }j∈Ii ,i∈N è una base hilbertiana P per il sottospazio chiuso su cui proietta il proiettore ortogonale P = s- +∞ i=0 Pi . Possiamo quindi completare B a base hilbertiana di H unendola con una base hilbertiana B 0 di P (H)⊥ . Usando la continuità di T e (d) di proposizione 3.9: " !# ρT (P ) = tr T s- X ! (u| )u = tr s- u∈B X (u| )T u . u∈B Ora calcoliamo la traccia usando la base hilbertiana B ∪ B 0 ρT (P ) = X v∈B∪B 0 X v (u|v)T u u∈B = X (u |T u ) . (7.12) u∈B dove si è tenuto conto del fatto che, se u, v ∈ B ∪ U 0 , (v|u) = δuv ed inoltre gli elementi di B sono ortogonali a quelli di B 0 . Con una analoga procedura troviamo che +∞ X i=1 ρT (Pi ) = Ii +∞ XX (ui,j |T ui,j ) . i=1 j=1 201 Possiamo sempre ingrandire ogni insieme Ii fino a N definendo ui,j := 0 se j > sup Ii . In tal caso possiamo scrivere: +∞ X +∞ ∞ XX ρT (Pi ) = i=1 Z (ui,j |T ui,j ) = Z dµ(i) N i=1 j=1 (ui,j |T ui,j )dµ(j) . N dove µ è la misura che conta i punti in N e si è tenuto conto di (c) di proposizione 3.2, notando R che (ui,j |T ui,j ) ≥ 0 per ogni coppia i, j e quindi anche N (ui,j |T ui,j )dµ(j) ≥ 0 per ogni i. Con la stessa interpretazione l’ultima somma in (7.12) può essere vista come X ρT (P ) = (u |T u ) = Z (ui,j |T ui,j ) dµ(i) ⊗ dµ(j) . N×N u∈B Dato che i numeri (ui,j |T ui,j ) sono non negativi e che l’integrale di sopra è convergente, il teorema di Fubini-Tonelli, assicura che +∞ X Z ρT (Pi ) = i=1 Z dµ(i) N (ui,j |T ui,j )dµ(j) = Z N (ui,j |T ui,j ) dµ(i) ⊗ dµ(j) = ρT (P ) , N×N che è l’enunciato nel punto (c). 2 Il seguente notevolissimo teorema dovuto a Gleason (J. of Math. and Mech. 6, 885-893 (1957)) porta ad una caratterizzazione completa delle funzioni che soddisfano l’assioma A2. Teorema 7.2 (Gleason). Sia H uno spazio di Hilbert di dimensione finita ≥ 3, oppure separabile e di dimensione infinita. Per ogni funzione µ : P(H) → [0, +∞) con µ(I) < +∞ e tale che soddisfa (2) in A2, esiste un operatore T : H → H di classe traccia e positivo tale che: µ(P ) = tr(T P ) per ogni P ∈ P(H). Traccia della dimostrazione. Gleason definisce una frame function non negativa su uno spazio di Hilbert sottodimensionale separabile o di dimensione finita, H, come una funzione f a valori reali non negativi con dominio dato dalla (superficie della) sfera unitaria di H, tale che, se {xi }i∈I è una base hilbertiana: X f (xi ) < +∞ . i∈I Quindi dimostra, usando risultati di von Neumann, che ogni frame function non negativa, f , su uno spazio di Hilbert separabile o di dimensione finita ≥ 3 ammette un operatore limitato ed autoaggiunto T per cui f (x) = (x|T x) per ogni vettore di norma unitaria x. 202 Consideriamo quindi il proiettore ortogonale Px := (x| ) x associato ad un vettore di norma unitaria. È immediato verificare che, nelle nostre ipotesi su µ, f (x) := µ(Px ) definisce una frame function non negativa al variare di x, dato che µ ≥ 0 ed inoltre risulta ! X f (xi ) = X i X µ(Pxi ) = µ i P xi = µ (I) < +∞ . i Allora ci deve essere un operatore autoaggiunto T tale che µ(Px ) = (x|T x) per ogni vettore unitario x. Dato che (x|T x) ≥√0 per ogni x, T risulta essere un operatore positivo e quindi T = |T |, essendo T = T ∗ e T 2 = T per l’unicità delle radici quadrate positive. Se {xi }i∈I è una base hilbertiana per H, nelle nostre ipotesi su µ deve valere: X +∞ > µ(I) = (xi |T xi ) = X i (xi | |T |xi ) . i Per definizione di operatore di classe traccia (definizione 4.4), T = |T | è dunque un operatore di classe traccia. Sia infine P ∈ P(H). Possiamo scegliere una base Hilbertiana di P (H): {xi }i∈J e completarla a base Hilbertiana di H aggiungendo una base hilbertiana {xi }i∈J 0 di P (H)⊥ . Abbiamo i seguenti fatti: J è numerabile (o finito) per il teorema 3.7, inoltre P = s- X P xi i∈J per (d) di proposizione 3.9, infine Pxi Pxj = 0 se i 6= j sono elementi di J. Allora, dato che P xi = xi se i ∈ J e P xi = 0 se i ∈ J 0 : µ(P ) = X i∈J µ(Pxi ) = X X i∈J i∈J∪J 0 (xi |T xi ) = (xi |T P xi ) = tr(T P ) . 2 Note. (1) La dimostrazione di Gleason funziona anche per spazi di Hilbert definiti sul campo reale. (2) Si può notare che l’operatore T ha traccia 1 se µ(I) = 1, come nel caso considerato nell’assioma A2. (3) Se il campo dello spazio di Hilbert è complesso, come in tutti i casi considerati in questo trattato e come nell’assioma A2, l’operatore T associato a µ è unico: ogni altro operatore T 0 di classe traccia che soddisfa µ(P ) = tr(T 0 P ) per ogni P ∈ P(H) deve anche soddisfare: (x|(T − T 0 )x) = 0 per ogni x ∈ H. Infatti, se x = 0 ciò è ovvio, mentre se x 6= 0 possiamo sempre completare a base hilbertiana il vettore x/||x|| e, se Px è il proiettore su < x >, la condizione tr((T − T 0 )Px ) = 0 si scrive, sulla base detta: ||x||−2 (x|(T − T 0 )x) = 0. Per l’esercizio (2) in 203 Esercizi 3.2 ciò implica che T − T 0 = 0. (Nel caso di spazio di Hilbert sul campo reale ciò non è più vero in generale, come si verifica banalmente in Rn dotato del solito prodotto scalare “righe per colonne”, prendendo per T una matrice reale antisimmetrica non nulla e per T 0 la matrice nulla). (4) La richiesta di spazio di Hilbert di dimensione > 2 è irrinunciabile. Si verifica subito che, su C2 , i proiettori ortogonali sono 0, I e tutte le matrici della forma 3 X 1 Pn := I+ ni σ i 2 i=2 ! , dove n = (n1 , n2 , n3 ) ∈ R3 ha norma unitaria: ||n|| = 1 e σ1 , σ2 , σ3 sono le note matrici di Pauli 0 1 0 −i 1 0 σ1 = , σ2 = , σ3 = . (7.13) 1 0 i 0 0 −1 Vi è corrispondenza biunivoca tra i proiettori Pn ed i punti di S2 , la sfera da raggio 1 contenente quindi i punti identificati dai vettori n. Le funzioni µ che soddisfano le richieste in del teorema di Gleason possono quindi pensarsi come funzioni definite su S2 ∪{0, I}. Le richieste nel teorema di Gleason si riducono a: µ(0) = 0, µ(I) = 1 e µ(n) = 1 − µ(−n). Gli operatori positivi di classe traccia con traccia unitaria, si verificano essere tutti e soli quelli della forma 3 X 1 ui σi I+ ρu = 2 i=2 ! , dove ora ||u|| ≤ 1. Di conseguenza, se · indica l’ordinario prodotto scalare in R3 , tr(ρu Pn ) = 1 (1 + u · n) . 2 L’applicazione µ definita da µ(0) = 0, µ(I) = 1 ma, per ogni n ∈ S2 e per un fissato v ∈ S2 , µ(Pn ) = 1 1 + (v · n)3 , 2 soddisfa le richieste nel teorema di Gleason. Tuttavia si verifica facilmente che non ci sono operatori ρu come sopra (quindi positivi di classe traccia) tali che µ(Pn ) := tr(ρu Pn ) per ogni proiettore ortogonale Pu . Il teorema di Gleason insieme alle considerazioni esposte sopra, unitamente al fatto che tutti i sistemi quantistici noti hanno spazio di Hilbert con dimensione che soddisfa le ipotesi del teorema di Gleason2 , conducono alla riformulazione dell’assioma A2. 2 Le particelle con spin 1/2 ammettono uno spazio di Hilbert, in cui si definisce l’osservabile spin, di dimensione 2. La stessa cosa accade per lo spazio di Hilbert in cui viene descritta la polarizzazione della luce (elicità del fotone). Tuttavia questi sistemi fisici, quando descritti completamente, per esempio includendo i gradi di libertà posizionali o legati all’impulso sono rappresentabili in uno spazio di Hilbert infinito dimensionale. 204 A2. Uno stato ρ al tempo t su un sistema quantistico S, con spazio di Hilbert associato HS , è un operatore positivo di classe traccia con traccia unitaria su HS . La probabilità che la proposizione P ∈ P(HS ) sia vera sullo stato ρ vale tr(ρP ). Possiamo quindi dare la seguente definizione. Definizione 7.4. Sia H spazio di Hilbert separabile. Un operatore di classe traccia, positivo e con traccia uguale a 1 si dice stato su H. L’insieme degli stati su H si indica con S(H). Osservazione importante. Il teorema di Gleason ha una conseguenza fisica fondamentale che distingue nettamente gli stati dei sistemi classici da quelli dei sistemi quantistici. I sistemi classici ammettono stati completamente deterministici, descritti da misure di Dirac con supporto su un punto nello spazio delle fasi al tempo considerato. Tali misure assumono solo i valori 0 e 1 e sono quindi stati in cui alcune proposizioni sono certe e le rimanenti sono false. Analoghi stati non esistono per sistemi quantistici. La prova è immediata: se x appartiene all’insieme S dei vettori di norma unitaria e Px è il proiettore ortogonale (x|·)x, ogni stato ρ per il teorema di Gleason determina una funzione, evidentemente continua, S 3 x 7→ µ(Px ) = (x|ρx). Dato che S è connesso3 e che le funzioni continue mandano connessi in connessi, µ(Px ) deve essere connesso al variare di x. Se µ assume solo valori 0 oppure 1, deve essere (x|ρx) = 0 per ogni x e quindi si averebbe ρ = 0 che violerebbe tr(ρ) = 1, oppure (x|ρx) = 1 per ogni x e quindi si avrebbe ρ = I che non è di classe traccia nel caso infinito dimensionale e viola tr(ρ) = 1 nel caso finito dimensionale. Questo risultato negativo ha rilevanza nei tentativi di costruire modelli classici della meccanica quantistica introducendo “variabili nascoste” perché pone dei severi vincoli. 7.4.2 Stati puri, stati misti, ampiezze di transizione. Passiamo a studiare l’insieme degli stati S(HS ) se HS è lo spazio di Hilbert associato al sistema quantistico S. Ricordiamo che in uno spazio vettoriale, un insieme C è detto convesso se, per ogni coppia x, y ∈ C, λx + (1 − λ)y ∈ C per ogni λ ∈ [0, 1]. Un elemento e di un insieme convesso C è detto estremale se non esistono x, y ∈ C con x, y 6= e tali che e = λx + (1 − λ)y per qualche λ ∈ (0, 1). Ricordiamo che se X è uno spazio vettoriale sul campo K = C o R, lo spazio quoziente X/ ∼, dove, se u, v ∈ X, u ∼ v se e solo se v = αu per qualche α ∈ K \ {0} è detto spazio proiettivo associato a X. Gli elementi di X/ ∼ diversi da [0] (classe di equivalenza di 0, contenente solo 0) 3 Tale insieme è infatti connesso per archi continui e dunque connesso. Diamo una traccia della dimostrazione di tale fatto. Se x, y ∈ S allora ci sono due casi. Nel primo caso x = eiα0 y per qualche α0 > 0 e quindi x è connesso a y dalla curva, continua rispetto alla topologia dello spazio di Hilbert e tutta inclusa in S, [0, α0 ] 3 α 7→ eiα x. Nel secondo caso x è combinazione lineare di y e di un vettore y 0 ∈ S perpendicolare a y che si ottiene costruendo una base ortonormale nel sottospazio generato da y e x, quando tale base ammetta y come primo vettore. Dato che ||x|| = ||y|| = ||y 0 || = 1 e che y ⊥ y 0 , deve allora essere x = eiα cos βy + eiδ sin βy 0 per una terna di reali α, β, γ. Allora x è connesso ad y tramite una curva, continua e completamente contenuta in S, che si ottiene variando questi tre parametri separatemente in tre opportuni intervalli. 205 sono detti raggi di X. Proposizione 7.6. Sia (H, ( | )) uno spazio di Hilbert separabile. (a) S(H) è un sottoinsieme convesso di B1 (H) (spazio degli operatori di classe traccia su H). (b) Gli elementi estremali di S(H) sono tutti e soli quelli della forma: ρψ := (ψ| )ψ , per ogni vettore ψ ∈ H con ||ψ|| = 1. Pertanto esiste una corrispondenza biunivoca tra l’insieme degli stati estremali e l’insieme dei raggi di H, che associa allo stato estremale (ψ| )ψ il raggio [ψ]. (c) Ogni stato ρ ∈ S(H) soddisfa ρ ≥ ρρ ed è estremale se e solo se soddisfa ρρ = ρ . (d) Ogni stato ρ ∈ S(H) è una combinazione lineare di stati estremali, includendo le combinazioni lineari infinite nella convergenza definita dalla topologia uniforme. In particolare esiste sempre una decomposizione: X ρ= pφ (φ| )φ φ∈N dove N è una base hilbertiana di H fatta di autovettori di ρ, pφ ∈ [0, 1] per ogni φ ∈ N e X pφ = 1 . φ∈N Prova. (a) Presi due stati ρ, ρ0 è chiaro che λρ+(1−λ)ρ0 è ancora un operatore di classe traccia in quanto gli operatori di classe traccia formano un sottospazio di B(H) (teorema 4.7). Dalle proprietà di linearità della traccia (proposizione 4.6): tr[λρ + (1 − λ)ρ0 ] = λtrρ + (1 − λ)trρ0 = λ1 + (1 − λ)1 = 1 . Infine, se f ∈ H e λ ∈ [0, 1], tenendo conto che ρ e ρ0 sono positivi: (f |(λρ + (1 − λ)ρ0 )f ) = λ(f |ρf ) + (1 − λ)(f |ρ0 f ) ≥ 0 . Quindi λρ + (1 − λ)ρ0 è uno stato se ρ, ρ0 sono stati e λ ∈ [0, 1]. (b) e (d) Consideriamo ρ ∈ S(H). ρ è un operatore compatto autoaggiunto (in quanto positivo). Usando la decomposizione vista nel teorema 4.4, tenendo conto che |ρ| = ρ (perché ρ ≥ 0), e che quindi, nella decomposizione polare di ρ = U |ρ|, vale U = I, troviamo: ρ= X mλ X λ (uλ,i | ) uλ,i . λ∈σp (ρ) i=1 206 (7.14) Sopra σp (ρ) è l’insieme degli autovettori di ρ e, se λ > 0, {uλ,i }i=1,...,mλ è una base dell’autospazio associato a λ ∈ σp (ρ). Infine, la convergenza è nella topologia uniforme. Questo sviluppo da solo prova (d). Completando a base hilbertiana ∪λ>0 {uλ,i }i=1,...,mλ aggiungendo una base per Kerρ, dalla proposizione 4.6 otteniamo che deve anche essere: X 1 = tr(ρ) = mλ λ . (7.15) λ∈σp (ρ) Supponiamo ora che ρψ := (ψ| )ψ , con ||ψ|| = 1. È immediato verificare che ρψ ∈ S(H). Vogliamo provare che ρψ è estremale in S(H). Assumiamo pertanto che esistano ρ, ρ0 ∈ S(H) e λ ∈ (0, 1) per cui ρψ = λρ + (1 − λ)ρ0 . Mostreremo che ρ = ρ0 = ρψ . Consideriamo il proiettore ortogonale Pψ = (ψ| )ψ. È chiaro che (completando ψ a base Hilbertiana): tr(ρψ Pψ ) = 1. Ne consegue che: 1 = λtr(ρPψ ) + (1 − λ)tr(ρ0 Pψ ) . Dato che λ ∈ (0, 1) e 0 ≤ tr(ρPψ ) ≤ 1, 0 ≤ tr(ρ0 Pψ ) ≤ 1, questo è possibile solo se tr(ρPψ ) = tr(ρ0 Pψ ) = 1. Proviamo allora che tr(ρPψ ) = 1 e tr(ρ0 Pψ ) = 1 implicano che ρ = ρ0 = ρψ . Decomponendo ρ come in (7.14), tr(ρPψ ) = 1 si riscrive: X λj |(uj |ψ)|2 = 1 , (7.16) j dove abbiamo etichettato su N (o su un suo sottoinsieme finito se dim(H) < +∞) l’insieme degli autovettori uj = uλ,i , con λ > 0, denotando con λj l’autovalore di uj ed abbiamo completato a base hilbertiana di H l’insieme degli autovettori detti aggiungendo una base per il nucleo di ρ (la base complessiva è comunque al più numerabile perché H è separabile). Per ipotesi X λj = 1, (7.17) |(uj |ψ)|2 = 1 . (7.18) j X j Dato che λj ∈ [0, 1] e |(uj |ψ)|2 ∈ [0, 1] per ogni j ∈ N, avremo che valgono anche: X λ2j ≤ 1 , (7.19) |(uj |ψ)|4 ≤ 1 . (7.20) j X j 207 Per cui la successione dei λj e quella dei |(uj |ψ)|2 sono in l2 (N). L’identità (7.16) insieme alle (7.19) e (7.20) ed alla disuguaglianza di Cauchy-Schwartz in l2 (N), implicano infine che deve essere X λ2j = 1 , (7.21) |(uj |ψ)|4 = 1 . (7.22) j X j Dato che λj ∈ [0, 1] per ogni j ∈ N, (7.17) e (7.21) sono compatibili solo se tutti i λi sono nulli eccetto uno, λp , che vale esattamente 1. Nello stesso modo, dato che |(uj |ψ)|2 ∈ [0, 1] per ogni j ∈ N, (7.18) e (7.22) sono compatibili solo se tutti i numeri |(uj |ψ)| sono nulli, eccetto uno, |(uk |ψ)|, che vale 1. Dato che gli ui formano una base hilbertiana e ||ψ|| = 1, deve dunque essere che ψ = αuk , dove |α| = 1. È chiaro che deve essere k = p altrimenti tr(ρPψ ) = 0. Essendo ρ= X λj (uj | )uj , j in base a quanto trovato, abbiamo finalmente che: ρ = λk (uk | )uk = 1 · (uk | )uk = α−1 α−1 (ψ| )ψ = |α|−1 (ψ| )ψ = (ψ| )ψ = ρψ . Con la stessa procedura si prova che ρ0 = ρψ . Se uno stato ρ non è del tipo (ψ| )ψ, si potrà comunque decomporre come ρ= X λj (uj | )uj , j in cui almeno due valori p 6= q per cui λp 6= λq sono entrambi non nulli e quindi, in particolare, λp , 1 − λp ∈ (0, 1). In tal caso potremo riscrivere ρ come ρ = λp (up | )up + (1 − λp ) λj (uj | )uj . (1 − λp ) j6=p X (up | )up è uno stato come già detto ed è immediato verificare che anche ρ0 := λj (uj | )uj , (1 − λp ) j6=p X è uno stato di S(H) (ovviamente ρ0 6= (up | )up per costruzione essendo uq 6∼ up ). Abbiamo quindi provato che ρ non è estremale. L’applicazione f che associa allo stato estremale (ψ| )ψ il raggio [ψ] è ben definita. Infatti, cominciamo a notare che, per definizione di stato estremale ||ψ|| = 1, per cui ψ 6= 0 e quindi [ψ] è un raggio. Uno stesso stato estremale può essere scritto in vari modi diversi: vale infatti (come è immediato provare tenendo conto che deve essere ||φ|| = 1) che (ψ| )ψ = (φ| )φ se e 208 solo se ψ = eiα φ per qualche α ∈ R. Ma allora, per definizione di raggio, [ψ] = [φ]. Mostriamo che l’applicazione f è iniettiva. Se φ e ψ hanno norma unitaria e [ψ] = [φ] allora ψ = eiα φ per qualche α ∈ R e quindi (ψ| )ψ = (φ| )φ. Infine l’applicazione f è suriettiva, perché, se [φ] è un raggio e quindi ||φ|| = 6 0, ci sarà ψ ∈ [φ] con ||ψ|| = 1. In tal caso f ((ψ| )ψ) = [φ] perché ψ = αφ per qualche α ∈ C non nullo. (c) Dimostriamo prima la seconda affermazione. Se ρ è estremale, ρρ = ρ come si prova immediatamente usando la forma data in (b) per gli stati estremali. Decomponendo uno stato ρ come (con il significato spiegato sopra) ρ= X λj (uj | )uj , j si ha subito che: ρρ = X λ2j (uj | )uj . j Se è ρρ = ρ, passando alle tracce, dovrà essere X j λ2j = X λj = 1 j con λj ∈ [0, 1]. Si prova facilmente che questo è possibile solo se tutti i λj sono nulli eccetto uno, λk , il cui valore è 1. Ma allora ρ= X λj (uj | )uj = 1 · (uk | )uk , j che è uno stato estremale per (b). P Proviamo la prima affermazione. Sia x = j αj uj un vettore arbitrario di H (si ricordi che gli uj definiscono una base hilbertiana di H), allora, dato che λj ∈ [0, 1]: (x|ρρx) = X j λ2j (x|uj )(uj |x) = X λ2j |αj |2 ≤ X j j λj |αj |2 = X λj (uj |x)(uj |x) = (x|ρx) . j Quindi ρρ ≤ ρ. 2 Possiamo dare la seguente definizione. Definizione 7.5. Sia (H, ( | )) uno spazio di Hilbert separabile. (a) gli elementi estremali in S(H) sono detti stati puri ed il loro insieme è indicato con Sp (H), gli stati non estremali sono detti stati misti o miscele. (b) Se vale X ψ= αi φi , i∈I 209 con I finito o numerabile (e la convergenza della serie è nella topologia di H nel secondo caso), dove i vettori φi ∈ H sono tutti non nulli e 0 6= αi ∈ C, si dice che lo stato (ψ| )ψ è sovrapposizione coerente degli stati (φi | )φi /||φi ||2 . (c) Se ρ ∈ S(H) soddisfa X ρ= pi ρi i∈I con I finito, ρi ∈ S(H) e 0 6= pi ∈ [0, 1] per ogni i ∈ I ed infine i pi = 1, si dice che lo stato ρ è sovrapposizione incoerente o miscela degli stati (eventualmente puri) ρi . (d) Se ψ, φ ∈ H soddisfano ||ψ|| = ||φ|| = 1: (i) il numero complesso (ψ|φ) viene detto ampiezza di transizione o ampiezza di probabilità dello stato (φ| )φ sullo stato (ψ| )ψ; (ii) il numero reale non negativo |(ψ|φ)|2 viene detto probabilità di transizione dello stato (φ| )φ sullo stato (ψ| )ψ. P Note (1) I vettori dello spazio di Hilbert di un sistema quantistico associati a stati puri vengono spesso detti, in letteratura fisica, funzioni d’onda. La motivazione di tale terminologia è dovuta alla prima formulazione della Meccanica Quantistica in termini di Meccanica Ondulatoria (vedi cap. 6) e sarà ripresa in seguito quando parleremo dell’equazione di Schrödinger. (2) La possibilità di costruire stati puri con vettori non nulli che sono combinazione lineare di vettori associati ad altri stati puri è quello che, nel gergo della Meccanica Quantistica, si chiama principio di sovrapposizione degli stati (puri). (3) Si osservi che in (c), nel caso in cui ρi = ψi (ψi | ), non è richiesto che (ψi |ψj ) = 0 se i 6= j. Tuttavia è immediato provare che se I è finito, nel caso di ρi stato misto o puro e pi ∈ [0, 1] per P ogni i ∈ I con i pi = 1, allora: X ρ= pi ρi i∈I è di classe traccia (è questo è ovvio perché gli operatori di classe traccia formano uno spazio vettoriale e ogni ρi è di classe traccia), è positivo (perché combinazione lineare con coefficienti positivi di operatori positivi) ed ha traccia unitaria perché, per le proprietà di linearità della traccia (proposizione 4.6): ! trρ = tr X i∈I pi ρi = X pi trρi = i∈I X pi · 1 = 1 . i∈I La decomposizione di ρ su una base hilbertiana di suoi autovettori può considerarsi un caso limite della decomposizione di sopra quando I è infinito numerabile, ρi = ψi (ψi | ), oppure, se I è finito, ed infine (ψi |ψj ) = δij . È importante notare che: in generale, un fissato stato misto ammette più di una decomposizione incoerente in termini di stati puri e misti. (4) Si consideri lo stato puro ρψ ∈ Sp (H), che quindi si scriverà come ρp si = (ψ| )ψ per qualche vettore ψ ∈ H con ||ψ|| = 1. Il punto che vogliamo sottolineare qui è che tale stato puro è anche 210 un proiettore ortogonale Pψ := (ψ| )ψ e, di conseguenza, deve corrispondere ad una proposizione sul sistema. L’interpretazione naturale ed ingenua4 di tale proposizione è che essa corrisponda all’affermazione: “lo stato del sistema è lo stato puro individuato dal vettore ψ”. Tale interpretazione è dovuta al fatto che, se ρ ∈ S(H), allora tr(ρPψ ) = 1 se e solo se ρ = (ψ| )ψ. Infatti, se ρ = (ψ| )ψ, allora completando a base hilbertiana ψ e facendo la traccia su tale base, risulta immediatamente che tr(ρPψ ) = 1. Supponiamo viceversa che valga tr(ρPψ ) = 1 per lo stato ρ. Sotto tali ipotesi deve essere ρ = (ψ| )ψ come dimostrato nella prova della proposizione 7.6. (5) Il punto (4) consente di dare un’interpretazione al modulo quadro dell’ampiezza di transizione (φ|ψ). Se ||φ|| = ||ψ|| = 1, come richiesto nella definizione di ampiezza di transizione, risulta immediatamente che: tr(ρψ Pφ ) = |(φ|ψ)|2 , dove ρψ := (ψ| )ψ e Pφ = (φ| )φ. Tenendo allora conto di (4), concludiamo che: |(φ|ψ)|2 è la probabilità che, essendo lo stato (al tempo t) individuato dal vettore ψ, diventi lo stato individuato da φ in seguito a processo di misura sul sistema (al tempo t). Si osservi che |(φ|ψ)|2 = |(ψ|φ)|2 , per cui la probabilità di transizione dello stato individuato da ψ sullo stato individuato da φ coincide con l’analoga probabilità con i ruoli dei due vettori scambiati. Questo fatto non è, a priori, per nulla fisicamente evidente. 7.4.3 Stati successivi ai processi di misura e preparazione degli stati. La formulazione standard della Meccanica quantistica assume il seguente assioma su ciò che succede al sistema fisico S nello stato ρ ∈ S(HS ) al tempo t quando viene sottoposto ad un processo di misura riguardante la proposizione P ∈ P(HS ) se la proposizione risulta essere verificata (e quindi in particolare tr(ρP ) > 0 prima della misura). A3. Se il sistema quantistico S si trova nello stato ρ ∈ S(HS ) al tempo t e la proposizione P ∈ P(HS ) risulta essere verificata in seguito al processo di misura allo stesso tempo t, lo stato del sistema immediatamente dopo la misura è ρP := P ρP . tr(ρP ) In particolare se ρ è puro ed è individuato dal vettore ψ con ||ψ|| = 1, lo stato del sistema immediatamente dopo la misura è ancora puro ed è individuato dal vettore: ψP = Pψ . ||P ψ|| 4 Non possiamo fare a meno di notare una certa confusione di livelli semantico/sintattico in questa interpretazione. Tuttavia, per come l’interpretazione viene usata dai fisici, non crea problemi, ma potrebbe crearne in una formulazione rigorosa dal punto di vista logico formale. 211 È immediato verificare che, in entrambi i casi, ρP e ψP definiscono stati. Nel primo caso infatti ρP è positivo, di classe traccia con traccia unitaria, nel secondo caso, vale ||ψP || = 1. Osservazioni importanti. (1) Come già sottolineato precedentemente, la misura di una proprietà o di una grandezza fisica avviene facendo interagire il sistema con un apparato di misura (supposto macroscopico e soggetto alle leggi della fisica classica). La Meccanica Quantistica nella sua formulazione standard non stabilisce cosa sia un apparato di misura, ma solo che ne esistano, e nemmeno è in grado di descrivere l’interazione tra strumento di misura e sistema quantistico al di fuori della schematizzazione di A3. Esistono vari punti di vista e congetture su come completare la descrizione fisica del processo di misura, chiamato nel gergo della Meccanica quantistica collasso o riduzione dello stato o della funzione d’onda. Ma per varie ragioni nessuna delle proposte attuali è completamente soddisfacente [Des80, Bon97, Ghi97, Alb00]. Una proposta molto interessante è stata fatta nel 1985 da G.C. Girardi, T. Rimini e A. Weber (Physical Review D34, 1985 p.470) in cui si descrive in modo dinamico non lineare il processo di misura della posizione e lo si assume non dovuto ad uno strumento di misura ma ad un processo di autolocalizzazione. Purtroppo l’idea ha ancora diversi problemi, in particolare non ammette in modo ovvio una descrizione relativistica. (2) L’assioma A3 si riferisce a misure non distruttive, anche dette misure indirette [BrKh95], in cui il sistema fisico misurato (tipicamente una particella) non viene assorbito/distrutto dallo strumento di misura. (3) Gli strumenti di misura si usano comunemente per preparare lo stato di un sistema. Dal punto di vista teorico la preparazione di uno stato puro viene fatta nel modo seguente. Si sceglie un numero finito di proposizioni compatibili P1 , . . . , Pn , in maniera tale che il sottospazio su cui proietta P1 ∧ · · · ∧ Pn = P1 · · · Pn sia unidimensionale. Ossia P1 · · · Pn = (ψ| )ψ per qualche vettore con ||ψ|| = 1. (L’esistenza di tali proposizioni è nota per praticamente tutti i sistemi fisici quantistici che si usano sperimentalmente.) Quindi si eseguono misure contemporanee delle proposizioni Pi su vari esemplari identici del sistema fisico considerato (es. elettroni) di cui però non si conoscono gli stati. Se per uno di essi tutte le misure di tutte le proposizioni hanno dato esito positivo, immediatamente dopo le misure, lo stato del sistema è quello individuato dal vettore ψ. Normalmente ad ogni proiettore Pi è associata una grandezza fisica Ai misurabile sul sistema e Pi definisce la proposizione “la grandezza Ai cade nell’insieme Ei ”. Quindi di fatto, per preparare lo stato puro ψ, si misurano contemporaneamente una serie di grandezze fisiche Ai compatibili e si selezionano i sistemi in cui gli esisti delle misure sono caduti, rispettivamente, in ognuno degli insiemi Ei . Tali sistemi sono nello stato associato a ψ immediatamente dopo le misure. (4) Vediamo come si possono preparare stati misti miscelando stati puri. Si considerino una quantità q1 di copie identiche del sistema S preparate nello stato puro associato a ψ1 , una analoga quantità q2 di copie identiche dello stesso sistema S preparate nello stato puro associato a ψ2 e via di seguito fino a ψn . Se si mischiano tali sistemi, dopo la miscela, ciascuno di essi si 212 troverà nello stato misto: ρ= n X pi (ψi | )ψi , i=1 dove pi := qi / ni=1 qi . Si noti che in generale è falso che (ψi |ψj ) = 0 se i 6= j per cui, l’espressione di sopra per ρ non è la decomposizione su una base hilbertiana di autovettori di ρ stesso. Questa procedura potrebbe fare pensare che esistano due tipi di probabilità, una intrinseca dovuta alla natura quantistica degli stati ψi e l’altra epistemica, inglobata nelle probabilità pi . In realtà non è vero: una volta creato lo stato misto con la procedura detta sopra, non c’è più alcun modo, all’interno della Meccanica Quantistica, di distinguere gli stati della miscela. Per esempio, si osservi che la stessa miscela ρ si sarebbe potuta ottenere miscelando stati puri diversi da quelli individuati dai vettori ψi . In particolare, si sarebbero potuti usare quelli della decomposizione di ρ in termini di una base hilbertiana di suoi autovettori. Dal punto di vita fisico, facendo misure di qualsiasi genere (assumendo gli assiomi della Meccanica Quantistica fino ad ora enunciati) non sarebbe possibile distinguere le due miscele. P 7.4.4 Regole di superselezione e settori coerenti. I sistemi quantistici noti sono tali che non tutti i vettori ψ normalizzati a 1 determinano stati ammissibili fisicamente. Ci sono ragioni teoriche di vario genere, sulle quali non ci soffermiamo, che implicano l’esistenza di cosiddette regole di superselezione. In base a tali regole, lo spazio di Hilbert del sistema H risulta essere una somma diretta ortogonale (al più numerabile perché lo spazio somma è numerabile) di sottospazi chiusi detti settori coerenti: H = H1 ⊕ H2 ⊕ · · · e gli unici stati, individuati da singoli vettori, fisicamente ammissibili sono quelli rappresentati da vettori in H1 , oppure H2 , oppure H3 ,, ... Ma non sono fisicamente ammessi stati individuati da combinazioni lineari di vettori appartenenti a spazi coerenti distinti. Dal punto di vista fisico, i settori coerenti sono i sottospazi di H associati ad una classe di proposizioni mutuamente esclusive – cioè i proiettori ortogonali che proiettano su tali spazi P mutuamente ortogonali P1 , P2 , ... con i Pi = I (la somma è in senso forte se è eseguita su un insieme infinito di termini) – che affermano che una certa grandezza, quella che determina la regola di superselezione, ha un valore fissato, dipendente dalla proposizione. Alternativamente la grandezza non è richiesta assumere un valore preciso ma solo in una precisa classe di valori, dichiarata dalla proposizione stessa. A titolo di importante esempio citiamo la regola di superselezione della carica elettrica per i sistemi quantistici elettricamente carichi. Essa richiede che: ogni vettore ψ che determina uno stato del sistema, deve verificare una proposizione PQ del tipo: “il valore della carica del sistema vale Q” dove Q è un valore possibile della carica (e dipende dalla proposizione). Matematicamente quindi deve essere tr(PQ (ψ| )ψ) = 1 per qualche valore della carica Q, che equivale a dire PQ ψ = ψ per qualche valore della carica Q. In altre parole: non sono ammessi stati, individuati da singoli vettori, in cui la carica non ha un valore definito. Questa richiesta 213 è ovvia in fisica classica, ma non lo è in meccanica quantistica, dove un sistema elettricamente carico, a priori, potrebbe ammettere stati in cui la carica non è definita. Si osservi che la richiesta che lo spazio di Hilbert del sistema sia separabile richiede che i valori possibili per la carica elettrica, cioé i settori coerenti a carica definita, siano al più una quantità numerabile e quindi la carica elettrica non può variare con continuità . Un’altra regola di superselezione riguarda il momento angolare di ogni sistema fisico. Dalla meccanica quantistica è noto che il modulo del momento angolare al quadrato J 2 , quando è in uno stato definito, può assumere solo valori interi oppure semi interi (in unità ~2 = h/2π dove h é la solita costante di Planck). Esiste allora una decomposizione dello spazio di Hilbert del sistema fisico in due sottospazi chiusi ortogonali. Uno in cui J 2 ha valori interi ed uno in cui J 2 ha valori semi interi. La regola di superselezione del momento angolare richiede che i vettori che rappresentano stati del sistema non siano combinazione lineare di vettori nei due sottospazi. È importante notare che uno stato puro può quindi essere a momento angolare non definito, in quanto il vettore associato allo stato è combinazione lineare di vettori corrispondenti a stati puri con diversi valori del momento angolare, tuttavia, a causa della regola di superselezione, tali valori devono essere tutti interi oppure tutti semi interi. Nel caso di presenza di regole di superselezione associate alla decomposizione di H nella somma diretta in settori coerenti: M H= Hk , (7.23) k∈K possiamo definire gli spazi degli stati e degli stati puri di ciascun settore: S(Hk ), Sp (Hk ). Possiamo vedere questi insiemi come sottoinsiemi di S(H) e Sp (H) rispettivamente, in base al seguente argomento generale. Se M è un sottospazio chiuso dello spazio di Hilbert H possiamo identificare S(M ) (e quindi Sp (M )) in modo naturale con un sottoinsieme di S(H) (rispettivamente Sp (H)), pensando S(M ) (rispettivamente Sp (M )) come il sottoinsieme degli stati ρ (misti e puri rispettivamente) di S(H), tali che Ran(ρ) ⊂ M . Tale identificazione è equivalente ad estendere ogni ρ ∈ S(M ) ad un operatore definito su tutto H, imponendo che sia l’operatore nullo su M ⊥ . Nel caso in esame, in cui M è ciascuno dei settori coerenti Hk , possiamo identificare ogni S(Hk ), Sp (Hk ) con sottoinsiemi di S(H) e Sp (H) rispettivamente. Con tale identificazione abbiamo subito che S(Hk ) ∩ S(Hj ) = ∅ e Sp (Hk ) ∩ Sp (Hj ) = ∅ se k 6= j. Per quanto riguarda gli stati puri fisicamente possibili per il sistema fisico descritto su H, questi saranno tutti e soli quelli dell’insieme: [ Sp (Hk ) . k∈K Gli stati misti fisicamente possibili per il sistema fisico descritto su H saranno quelli che si riescono a costruire come miscele degli stati puri suddetti. Quindi, gli stati misti saranno tutte e sole le possibili le combinazioni lineari convesse (anche infinite in riferimento alla topologia operatoriale forte) degli elementi dell’insieme: [ S(Hk ) . k∈K 214 Osservazione. Si prova facilmente che, se i proiettori ortogonali Pk sono quelli associati a ciascun Hk della decomposizione in settori coerenti (7.23), gli stati ρ ∈ Sp (H) che hanno senso fisico sono tutti e soli quelli che soddisfano i vincoli: ρPk = Pk ρ per ogni k ∈ K. (7.24) Proviamolo. Nel caso di uno stato (ψ| )ψ, la condizione ρPi = Pi ρ per ogni i ∈ K, implica subito P che Pi ψ = (ψ|Pi ψ)ψ per ogni i. Dato che I = i∈K Pi e Pi Pi0 = 0 se i 6= i0 , deve accadere che: (ψ|ψ) = 1 = X ||Pi ψ||2 . (7.25) i∈K Valendo Pi ψ = (ψ|Pi ψ)ψ, deve allora anche succedere che: 1 = (ψ|Pi ψ) = (Pi ψ|Pi ψ) = ||Pi ψ||2 , X 1= ||Pi ψ||4 . i |(ψ|Pi ψ)| P 2. Ossia, visto che (7.26) i∈K Essendo 0 ≤ ||Pi ψ|| ≤ 1, (7.25) e (7.26) sono compatibili solo se Pi ψ 6= 0 solo per un valore di i = iψ , per cui ψ ∈ Hiψ . Lasciamo per esercizio al lettore la dimostrazione del fatto che il risultato sussiste anche per gli stati misti di S(H): gli stati misti ρ ∈ S(H) che hanno senso fisico sono tutti e soli quelli che soddisfano i vincoli (7.24). 7.5 7.5.1 Le osservabili come Misure a Valori di Proiezione (PVM) su R. La nozione di osservabile Notazione 7.1. D’ora in poi, se X è uno spazio topologico, B(X) denoterà la σ-algebra di Borel di X, cioè la più piccola σ-algebra di sottoinsiemi di X che includa tutti gli insiemi aperti di X. In Meccanica Quantistica, le grandezze fisiche valutabili sui sistemi fisici e che hanno comportamento descritto in QM1 e QM2 sono dette osservabili. Ci occupiamo ora di esse. Dal punto (A) di vista fisico è ragionevole supporre che i proiettori ortogonali PE associati all’osservabile A siano commutanti l’uno con l’altro al variare di E ⊂ R, in quanto ci si aspetta che le proposizioni del tipo (A) PE := “Il valore di A valutata sullo stato del sistema cade nell’insieme di Borel E ⊂ R” , siano tutte compatibili al variare di E nella σ-algebra di Borel di R. Inoltre ci aspettiamo (A) (A) (A) che valga PE ∧ PE 0 = PE∩E 0 perché l’esito della misura cade in E ed anche in E 0 se e solo 215 (A) se cade in E ∩ E 0 . Ci aspettiamo che valga anche PR = I perché l’esito della misura cade (A) sicuramente in R per cui PR è la proposizione sempre vera, indipendentemente dallo stato sul quale si misura. Infine, per motivi fisicamente evidenti e tenendo conto del significato logico di ∨, è ragionevole supporre che, per ogni insieme numerabile di boreliani di R, {En }n∈N , valga: (A) (A) ∨n∈N PEn = P∪n∈N En . Possiamo dare la seguente definizione in cui identifichiamo l’osservabile A con un’applicazione opportuna: Definizione 7.6. Se H è uno spazio di Hilbert un’applicazione A che associa ad ogni insieme di (A) Borel E ⊂ R un proiettore ortogonale PE ∈ P(H) è detta osservabile se valgono le proprietà che seguono: (A) (A) (A) (A) (a) PE PE 0 = PE 0 PE per ogni coppia di boreliani E, E 0 ⊂ R; (A) (A) (A) (b) PE ∧ PE 0 = PE∩E 0 per ogni coppia di boreliani E, E 0 ⊂ R; (A) (c) PR = I; (d) per ogni insieme numerabile di boreliani di R, {En }n∈N , vale: (A) (A) ∨n∈N PEn = P∪n∈N En . Note. (A) (1) Si dimostra facilmente che la classe {PE }E∈B(R) definita sopra è una σ-algebra di Boole definita rispetto alla solita relazione d’ordine parziale ≤ tra proiettori. (A) (2) In generale {PE }E∈B(R) non è massimale rispetto alla commutatività dei proiettori. (3) È chiaro che, con la definizione data sopra, ogni osservabile altro non è che un omomorfismo di σ-algebre di Boole, dalla σ-algebra di Borel di R, B(R), alla σ-algebra di Boole dei proiettori {PE }E⊂Σ(R) . (4) La definizione di osservabile può essere riformulata in modo equivalente, ma matematicamente più semplice da maneggiare. Tale riformulazione è data nella prossima proposizione. Proposizione 7.7. Sia H spazio di Hilbert. Un’applicazione P : B(R) → B(H) è un’osservabile se e solo se soddisfa i seguenti requisiti. (a) P (B) ≥ 0 per ogni B ∈ B(R); (b) P (B)P (B 0 ) = P (B ∩ B 0 ) per ogni coppia B, B 0 ∈ B(R); (c) P (R) = I; (d) per ogni insieme numerabile di boreliani di R, {Bn }n∈N a due a due disgiunti, vale: s- +∞ X P (Bn ) = P (∪n∈N Bn ) . n=0 216 Prova. Se P : B(R) → B(H) è un’osservabile le proprietà (a), (b), (c), (d) della proposizione 7.7 sono banalmente verificate. Dobbiamo mostrare che se P : B(R) → B(H) soddisfa tali proprietà allora è un’osservabile. Includiamo tutti gli operatori P (B) con B ∈ B(R) in un insieme massimale di proiettori commutanti (che esiste per il lemma di Zorn), P0 (H) e d’ora in poi lavoreremo in tale insieme senza perdere generalità. (a) implica che ogni P (B) è autoaggiunto per (f) in proposizione 3.8, (b) implica che P (B)P (B) = P (B ∩ B) = P (B) per cui tutti gli operatori P (E) sono proiettori ortogonali. Inoltre (b) implica anche che P (B)P (B 0 ) = P (B ∩ B 0 ) = P (B 0 ∩ B) = P (B 0 )P (B) per cui tutti i proiettori commutano tra di loro. Usando la prima identità in (i) di (b) di teorema 7.1 la condizione (b) di sopra si riscrive P (B) ∧ P (B 0 ) = P (B ∩ B 0 ). Per concludere è sufficiente provare la proprietà (d) della definizione 7.6. Consideriamo una classe numerabile di insiemi {En }n∈N ⊂ B(R) in generale non disgiunti a due a due. Vogliamo provare che esiste ∨n∈N P (En ) e vale ∨n∈N P (En ) = P (∪n∈N En ) . Per fare ciò definiamo la classe di insiemi boreliani a due a due disgiunti: {Bn }n∈N con B0 := E0 e, per n > 0, Bn = En \ (E1 ∪ · · · ∪ En−1 ) . Si verifica facilmente che, per ogni p ∈ N ∪ {+∞}, ∪pn=0 En = ∪pn=0 Bn . Da questa identità, usando la proprietà I − P (B) = P (R \ B) ed usando ricorsivamente la seconda identità in (i) di (b) di teorema 7.1, si ricava facilmente che, per ogni n ∈ N: ∨pn=0 P (En ) = ∨pn=0 P (Bn ) , e quindi ∨pn=0 P (En ) p X = P (Bn ) . (7.27) n=0 dove abbiamo tenuto conto che la proprietà (d) nella tesi di questa proposizione implica che ∨pn=0 P (Bn ) p X = P (Bn ) , n=0 per una classe finita di insiemi disgiunti Bn (la classe finita può sempre essere completata ad una classe numerabile aggiungendo infinite copie dell’insieme vuoto). Possiamo, per concludere, prendere il limite forte per p → +∞ in (7.27). Tale limite esiste per (b) in teorema 7.1 e vale anche, nelle nostre ipotesi: ∨n∈N P (En ) = s- lim p→+∞ p X P (Bn ) = P (∪n∈N Bn ) = P (∪n∈N En ) . n=0 217 Questo conclude la dimostrazione 2. Note. (1) Si osservi che (c) e (d) da sole implicano che I = P (I ∪ ∅) = I + P (∅) per cui P (∅) = 0 . (2) Se B ∈ B(R) allora R \ B ∈ B(R) e R = B ∪ (R \ B). Quindi da (d), prendendo B0 = B, B1 = R \ B e tutti i rimanenti Bk = ∅ abbiamo che: I = P (B) + P (R \ B). In altre parole vale anche ¬P (B) = P (R \ B) . La proposizione appena provata consente di identificare in modo biunivoco le osservabili con enti matematici ben noti in letteratura: le misure a valori di proiezione su R. Tale nozione sarà generalizzata nel prossimo capitolo. Definizione 7.7. Un’applicazione P : B(R) → B(H), con H spazio di Hilbert, che soddisfa le richieste (a), (b), (c) e (d) della proposizione 7.7 è detta misura a valori di proiezione (PVM) su R oppure equivalentemente misura spettrale su R. Possiamo enunciare il quarto assioma della formulazione matematica generale della Meccanica Quantistica. A4. Ogni osservabile A sul sistema quantistico S è descritta da una misura a valori di proiezione su R, P (A) , nello spazio di Hilbert del sistema HS , in modo tale che, se E è un boreliano di R, il proiettore P (A) (E) corrisponde alla proposizione “l’esito della misura di A cade nel boreliano E”. 7.5.2 Operatori autoaggiunti associati ad osservabili: esempi elementari. Torniamo ora al caso classico. Nel caso classico, le osservabili corrispondono a quelle che abbiamo chiamato grandezze fisiche, cioè funzioni f : Ft → R. Se si assume che f sia almeno misurabile, possiamo associarle una classe di proposizioni del tipo (f ) PE := “Il valore di f valutata sullo stato del sistema cade nell’insieme di Borel E ⊂ R” , che corrisponde all’insieme misurabile (f ) PE := f −1 (E) . La proposizione 7.2 ed il successivo commento hanno chiarito che, fissata f : Ft → R misura(f ) bile, l’applicazione che associa ad ogni insieme E ∈ B(R) l’insieme PE è un omomorfismo di σ-algebre di Boole. Tutto ciò è uguale al caso quantistico. Nel caso classico accadono alcuni ulteriori fatti. Prima di tutto è chiaro che non ci possono essere 218 (f ) (f 0 ) due funzioni misurabili differenti f ed f 0 con PE = PE per ogni E ∈ B(R). Più fortemente, risulta che dalla σ-algebra di Boole associata a f si può ricostruire f stessa con una procedura di limite. La procedura è contenuta nella dimostrazione di una ben nota proposizione di teoria della misura che useremo più avanti (cfr la tesi e la dimostrazione del teorema 1.72 in [Rud82]). Per enunciare la proposizione, ricordiamo che se X è uno spazio dotato di una σ-algebra di suoi sottoinsiemi Σ, una funzione f : X → C è detta semplice se è misurabile rispetto a Σ ed assume solo un numero finito di valori. Le funzioni semplici formano uno spazio vettoriale complesso. Proposizione 7.8. Sia X è uno spazio dotato di una σ-algebra di sottoinsiemi Σ. (a) Lo spazio delle funzioni semplici (rispetto a Σ) da X in C è denso, in senso puntuale, nello spazio delle funzioni misurabili (rispetto a Σ) da X a C. (b) Lo spazio delle funzioni semplici (rispetto a Σ) da X in C è denso, rispetto alla norma dell’estremo superiore, nello spazio delle funzioni limitate e misurabili (rispetto a Σ) da X a C. (c) Se f : X → R è misurabile rispetto a Σ ed è non negativa, allora esiste una successione non decrescente di funzioni semplici non negative che tende a f puntualmente, ovvero uniformemente se f è limitata. Prova. È sufficiente provare la tesi nel caso di funzioni a valori reali, il caso complesso si ottiene facilmente da questo, decomponendo le funzioni a valori complessi in parte reale ed immaginaria. Definiamo le note funzioni f+ (x) := sup{0, f (x)} e f− (x) := inf{0, f (x)} per x ∈ Ft ; allora f = f+ + f− , dove f+ ≥ 0 e f− ≤ 0 sono misurabili essendo f misurabile. Ora costruiremo una successione di funzioni semplici che tende a f+ , tale costruzione dimostra, tra le altre cose, il punto (c) dato che f = f+ se f ≥ 0. Per 0 < n ∈ N fissato, costruiamo una partizione del semi asse reale [0, +∞) fatta da boreliani En,i e En con i−1 i En,i := , , En := [n, +∞) , 2n 2n con 1 ≤ i ≤ n2n . Quindi, per ogni n, definiamo la classe degli insiemi misurabili (f ) Pn,i := f −1 (En,i ) , Pn(f ) := f −1 (En ) . Infine poniamo, per ogni n ∈ N: s+,n := n n2 X i=1 i−1 χ (f ) + nχP (f ) . n 2n Pn,i (7.28) Per costruzione 0 ≤ s+,n ≤ s+,n+1 ≤ f per n = 1, 2, . . .. Inoltre, per ogni fissato x risulta |f+ (x) − s+,n (x)| ≤ 1/2n se n è abbastanza grande. È quindi evidente che s+,n → f+ puntualmente se n → +∞. La stima |f+ (x) − s+,n (x)| ≤ 1/2n è uniforme in x se f+ è limitata (basta che sia n > sup f+ ), in tal caso la convergenza s+,n → f+ vale anche nel senso uniforme. Si costruisce similmente, decomponendo il semiasse reale negativo con partizioni analoghe a 219 quella di sopra, una successione di funzioni semplici, s−,n ≤ 0 che converge puntualmente a f− . La successione delle funzioni semplici s−,n + s+,n converge puntualmente a f e, per costruzione, la convergenza è uniforme quando f è limitata. 2 La domanda che ci poniamo fin da ora nel caso quantistico è la seguente: (A) c’è un ente matematico associato ad ogni osservabile, A : B(R) 3 E 7→ PE , che corrisponde, nel caso classico, alla funzione misurabile f che genera omomorfismo di σ-algebre di Boole degli (f ) insiemi PE = f −1 (E)? Se la risposta è positiva, sussiste una procedura di decomposizionericostruzione di tale ente in termini della σ-algebra di Boole di proiettori? Vedremo nel prossimo capitolo che la riposta ad entrambe le domande è positiva: ad ogni osservabile, definita come sopra, si associa in modo biunivoco un operatore autoaggiunto (generalmente non limitato) sullo spazio di Hilbert del sistema, in modo tale che il complemento al più grande (A) insieme di R per cui PE = 0 (detto supporto di P (A) ), cioè l’insieme dei valori assumibili dall’osservabile A, coincide con lo spettro dell’operatore autoaggiunto associato all’osservabile. La procedura di decomposizione-ricostruzione dell’operatore autoaggiunto a partire dall’osservabile è essenzialmente il cosiddetto teorema spettrale. L’associazione di un operatore ad una osservabile si attua definendo una opportuna procedura di integrazione che associa ad insiemi di Borel operatori invece di numeri reali. In effetti la procedura di limite per ricostruire f basata sulle funzioni (7.28) può essere vista come una procedura di integrazione rispetto ad una misura che associa ad insiemi di Borel (nello spazio dei valori assumibili dalla funzione) E ⊂ C delle funzioni χf −1 (E) : X → C. In termini intuitivi, tenendo conto che i−1 2n (f ) è approssimativamente il valore che f assume in Pn,i , f = lim n n2 X n→+∞ i=1 i−1 χ (f ) + nχP (f ) n 2n Pn,i può essere pensata come Z f= λdχλ . (7.29) C Non ci interessa andare a fondo in questa analogia (si può dare un senso matematicamente rigoroso all’integrale di sopra), perché siamo interessati al caso quantistico in cui una formula analoga a (7.29) definisce l’operatore autoaggiunto associato ad un’osservabile. Facciamo ora un esempio elementare di osservabile e mostriamo come associare a essa un operatore autoaggiunto. La teoria generale sarà sviluppata nei prossimi capitoli. Esempi 7.1. (1) Consideriamo un sistema quantistico descritto su uno spazio di Hilbert H e consideriamo per esso una grandezza fisica A che, dal punto di vista fisico può assumere solo una quantità discreta e finita di valori distinti {an }n=1,··· ,N ⊂ R. Ecco come associare a tale grandezza un’osservabile, che indicheremo ancora con la stessa lettera A, data da una classe di proiettori (A) ortogonali PE con E boreliano di R. Postuliamo che esista una classe di proiettori ortogonali 220 non nulli etichettati sugli an , {Pan }n=1,··· ,N tale che Pan Pam = 0 se n 6= m (che equivale, per aggiunzione, a Pam Pan = 0 se n 6= m) ed inoltre N X Pan = I . (7.30) n=1 Il significato di Pan sarà ovviamente: “il valore della grandezza A in seguito a misura di essa sul sistema risulta essere esattamente an ” . È chiaro che la richiesta Pan Pam = Pam Pan = 0, ossia Pan ∧ Pam = 0, se n 6= m corrisponde alla duplice richiesta fisica che (a) le proposizioni Pan e Pam siano fisicamente compatibili, ma (b) la misura dell’osservabile non possa produrre contemporaneamente il valore an ed anche il valore distinto am (infatti la proposizione associata al proiettore nullo è quella impossibile). La P richiesta N n=1 Pan = I, altrimenti scrivibile come Pa1 ∨ · · · ∨ Pan = I, corrisponde alla richiesta che almeno una delle proposizioni Pan debba risultare verificata in seguito ad una misura dell’ osservabile A. L’osservabile A : T(R) → P(H) è costruita come segue: per ogni boreliano E ⊂ R (A) PE X := (A) Pan , con P∅ := 0 . (7.31) an ∈E La verifica delle proprietà (a), (b), (c) e (d) della proposizione 7.10 è ora immediata per costruzione. (2) Riferendoci all’esempio (1), possiamo associare all’osservabile A un operatore, che indicheremo ancora con la stessa lettera A. La definizione è la seguente A := N X an Pan (7.32) n=0 L’operatore A è limitato ed autoaggiunto per costruzione essendo combinazione lineare a coefficienti reali di operatori autoaggiunti ed ha una ulteriore proprietà interessante: σp (A) = {an }n=1,··· ,N , cioè, l’insieme degli autovalori di A coincide con i valori assumibili dall’osservabile A. La prova di ciò è diretta: se 0 6= u ∈ Pan (H) allora Pam u = Pam Pan u = u se n = m oppure 0 se n 6= m. Inserendo questo risultato in (7.32) si ha subito che Au = an u per cui an ∈ σp (A). Viceversa, se u 6= 0 è autovettore di A con autovalore λ (che deve essere reale dato che A = A∗ ), deve risultare da (7.32): λu = N X an Pan u . n=0 D’altra parte, essendo risultare P an Pan = I, modificando il primo membro dell’identità di sopra, deve N X n=0 λPan u = N X n=0 221 an Pan u , e quindi N X (λ − an )Pan u = 0 . (7.33) n=0 Se applichiamo infine Pm ad ambo membri e ricordiamo che Pm Pn = δm,n Pn , otteniamo le N identità (λ − am )Pam u = 0 . Se queste identità fossero tutte risolte da Pm u = 0 per ogni m avremmo un assurdo dovendo essere 0 6= u = Iu = N X Pan u . n=0 Quindi ci deve essere qualche n in (7.33) per cui λ = an . Si noti che ciò può accadere per un solo valore di n essendo per ipotesi gli an distinti. In definitiva l’autovalore λ di A deve coincidere con uno dei valori an . Abbiamo provato che l’insieme degli autovalori di A coincide con i valori assumibili dall’osservabile A. L’operatore autoaggiunto A gioca qui un ruolo analogo a quello (f ) giocato dalla funzione f nel caso di una grandezza classica {PE }E∈T(R) . Nei prossimi capitoli svilupperemo una procedura che consente di associare in modo univoco ad ogni osservabile A (cioé ad ogni misura a valori di proiezione su R) un operatore autoaggiunto (generalmente non limitato) che indicheremo con la stessa lettera A, estendendo quanto trovato negli esempi precedenti. I valori assumibili dall’osservabile saranno dati dagli elementi dello spettro completo dell’operatore σ(A) che, come vedremo, è un insieme generalmente più grande dell’insieme degli autovalori. Lo strumento centrale da utilizzare sarà la procedura d’integrazione rispetto ad una misura a valori di proiezione, che corrisponde alla generalizzazione dell’espressione Z X f (λ) dP (A) (λ) , f (λ)Pλ =: σ(A) λ∈σp (A) (cfr (7.30) con f : λ 7→ 1 e (7.32) con f : λ 7→ λ ) al caso in cui i valori λ sono infiniti e possono variare in modo continuo in tutto lo spettro di A. In particolare dovranno valere le identità, la cui interpretazione verrà dalla teoria delle misure spettrali: Z A= λ dP (A) Z (λ) , σ(A) 7.5.3 I= 1 dP (A) (λ) σ(A) Misure di probabilità associate a coppie stato - osservabile. Un’altra proprietà notevole delle misure a valori di proiezione su R è la seguente. Ricordiamo che una misura di Borel µ su X, spazio topologico di Hausdorff localmente compatto, è una misura µ, positiva, σ-additiva, sulla σ-algebra di Borel di X, B(X). La misura è detta di probabilità se µ(X) = 1. 222 Proposizione 7.9. Sia H uno spazio di Hilbert e {PE }E∈B(R) una misura a valori di proiezione su R. Se ρ ∈ S(H) è uno stato, l’applicazione µρ : E 7→ tr(ρPE ) è una misura di Borel di probabilità su R. Prova. La prova è elementare. Basta provare che µρ è positiva, σ-additiva e µρ (R) = 1. R è di Hausdorff e localmente compatto, per cui ogni misura positiva σ-additiva sull’algebra di Borel è una misura di Borel. Decomponiamo ρ come al solito su una base hilbertiana di suoi autovettori: X ρ= pj (ψj | )ψj , j∈N dove i numeri pj sono non negativi e la loro somma è 1. Vale: µρ (E) = tr(ρPE ) ≥ 0 dato che i proiettori ortogonali sono operatori positivi, i numeri Pj sono non negativi e che tr(ρPE ) = P j∈N pj (ψj |PE ψj ). Inoltre µρ (R) = 1 dato che, valendo PR = I, X pj (ψj |Iψj ) = trρ = 1 . j∈N Proviamo la σ-additività di µρ . Se {En }n∈N è una classe di boreliani disgiunti a due a due e E := ∪n∈N En , allora vale, tenendo conto di (d) della proposizione 7.8: +∞ > tr(ρPE ) = +∞ X pj j=0 ! +∞ +∞ +∞ X XX ψj PEi ψj = pj (ψj |PEi ψj ) . i=0 j=0 i=0 Dato che pj ≥ 0 e (ψj |PEi ψj ) ≥ 0, il teorema di Fubini permette di interscambiare le serie di sopra, ottenendo: tr(ρPE ) = +∞ X +∞ X pj (ψj |PEi ψj ) = +∞ X tr(ρPEi ) . i=0 i=0 j=0 In altre parole, se {En }n∈N è una classe di boreliani disgiunti a due a due allora: +∞ X µρ (∪n∈N En ) = µρ (En ) . n=0 Questo conclude la dimostrazione. 2 Esempi 7.2. (1) Consideriamo l’osservabile A che assume un numero finito N di valori discreti an vista negli esempi (1) e (2) in Esempi 7.1 usando le stesse notazioni usate ivi. Sia A l’operatore autoaggiunto associato all’osservabile. Fissiamo uno stato ρ ∈ S(H) e consideriamo la sua (A) misura di probabilità relativa all’osservabile {PE }E∈T(R) . Per costruzione, se E ∈ T(R), (A) µ(A) ρ (E) := tr(ρPE ) = X an ∈E 223 tr(ρPan ) = X an pn δan (E) con pn := tr(ρPan ) . Quindi X µ(A) = ρ pn δan , (7.34) an dove abbiamo usato le misure di Dirac δan centrate nei punti an : δa (E) = 1 se a ∈ E, oppure P δa (E) = 0 se a 6∈ E. Si osservi che 0 ≤ pn ≤ 1 e n pn = 1 per costruzione. Quindi la misura di probabilità associata allo stato ρ e riferita all’osservabile A è di fatto una combinazione lineare convessa di misure di Dirac. (2) Il valore medio dell’osservabile A sullo stato ρ, hAiρ ed il suo scarto quadratico medio ∆A2ρ sullo stato ρ, possono essere scritti in modo sintetico usando l’operatore A (7.32) associato all’osservabile nel modo che segue. Per definizione di valore medio hAiρ = Z a dµ(A) ρ (a) . R D’altra parte, tenendo conto dell’espressione (7.34) si ha Z a dµ(A) ρ (a) = X R p n an = n X an tr(ρPan ) . n Usando infine (7.32) e le proprietà lineari della traccia, concludiamo che: hAiρ = tr(ρA) . (7.35) Nel caso che ρ sia uno stato puro, ossia ρ = ψ(ψ|·) con ||ψ|| = 1, si ha immediatamente da (7.35) che, se hAiψ indica il valor medio di A sullo stato individuato dal vettore ψ, hAiψ = (ψ|Aψ) (7.36) Per definizione lo scarto quadratico medio è ∆A2ρ Z 2 a2 dµ(A) ρ (a) − hAiρ . = R Procedendo come nel caso del valor medio: Z a 2 dµ(A) ρ (a) = X R pn a2n = n X a2n tr(ρPan ) = tr ρ n X a2n Pan . n Si osservi ora che A2 = X n an Pan X m am Pam = X an am Pan Pam = n,m dove abbiamo usato Pan Pam = δn,m Pn . In definitiva: ∆A2ρ = tr ρA2 − (tr (ρA))2 . 224 X a2n Pan = A2 , n (7.37) Nel caso che ρ sia uno stato puro, ossia ρ = ψ(ψ|·) con ||ψ|| = 1, si ha immediatamente da (7.37) che, se ∆A2ψ indica lo scarto quadratico medio di A sullo stato individuato dal vettore ψ, ∆A2ψ = ψ|A2 ψ − (ψ|Aψ)2 = ψ| A2 − hAi2ψ ψ . (7.38) Le formule che abbiamo scritto negli esempi di sopra concernenti i valori medi e gli scarti quadratici medi di osservabili in fissati stati, sono in realtà valide nel caso generale (con opportune attenzione ai domini) come sarà provato più avanti, quando avremo definito in maniera del tutto generale la procedura per associare operatori autoaggointi ad osservabili. 7.5.4 Un accenno alle osservabili generalizzate in termini di “POVM”. Nella dimostrazione della dimostrazione 7.9 non abbiamo usato la proprietà (a) in proposizione 7.7 che caratterizza le osservabili e, per quanto riguarda la proprietà (d) abbiamo usato solo la convergenza in senso debole (implicata da quella forte). Abbiamo, in definitiva, provato la seguente proposizione. Proposizione 7.10. Sia H uno spazio di Hilbert e {PE }E∈B(R) una classe di operatori in B(H) che soddisfano: (a)’ PE ≥ 0 per ogni E ∈ B(R); (b)’ PE = I; (c)’ per ogni insieme numerabile di boreliani di R, {En }n∈N a due a due disgiunti, vale: w- +∞ X PEn = P∪n∈N En . n=0 Se ρ ∈ S(H), l’applicazione µρ : E 7→ tr(ρPE ) è una misura di Borel di probabilità su R. I numeri µρ (E) sono le probabilità che il risultato di una misura dell’osservabile {PE }E∈B(R) cadano nei boreliani E. È possibile, e talvolta conveniente, dare una definizione di osservabili generalizzate, assumendo che esse siano descritte da applicazioni E 7→ PE che soddisfino le richieste (a)’, (b)’ e (c)’, più deboli rispetto a quelle che possono essere usate per definire le misure a valori di proiezione su R (cioé le osservabili) tramite la proposizione 7.7. In particolare, gli operatori PE non sono più proiettori ortogonali, ma semplicemente operatori limitati e positivi. Un esempio interessante di applicazione di queste osservabili generalizzate è quando si cerca di definire un’osservabile tempo. Per esempio come l’osservabile associata al tempo di arrivo di una particella in un detector. Vi sono profonde ragioni fisiche per asserire che tale osservabile non può essere definita in termini di classi di proiettori5 . 5 Vedi per esempio: R. Giannitrapani Positive-operator-valued time observable in quantum mechanics. Internat. J. Theoret. Phys. 36, 1575–1584, 1997 e R. Brunetti e K: Fredenhagen Remarks on time-energy uncertainty realtions Rev. Math. Phys.14, 897-906, 2002. 225 Dal punto di vista matematico si ha la seguente definizione (vedi [BGL95] per una discussione generale). Definizione 7.8. Siano H uno spazio di Hilbert. Un’applicazione A : B(R) → B(H) è detta misura a valori operatoriali positivi (POVM) se soddisfa le seguenti richieste: (a)’ A(E) ≥ 0 per ogni E ∈ B(R); (b)’ A(R) = I; (c)’ per ogni insieme numerabile di boreliani di R, {En }n∈N a due a due disgiunti, vale: w- +∞ X A(En ) = A(∪n∈N En ) . n=0 Un’ osservabile generalizzata su H è una classe di operatori {AE }E∈B(R) tale che E 7→ AE sia una misura a valori operatoriali positivi. Note. (1) Se A è una POVM su H, essendo B(H) 3 A(E) ≥ 0, ogni A(E) è autoaggiunto per ogni boreliano E. Le condizioni (a)’ e (c)’ implicano che 0 ≤ A(E) ≤ I e ||A(E)|| ≤ 1 per ogni boreliano E. (2) Esiste un importante teorema, dovuto a Neumark che mostra lo stretto legame tra PVM e POVM: Teorema di Neumark. se A : B(R) → B(H) è una POVM sullo spazio di Hilbert H allora esiste Un secondo spazio di Hilbert H0 che include H come sottospazio chiuso ed esiste un’applicazione P : B(R) → B(H0 ) che gode delle proprietà (a), (b), (c), (d) della proposizione 7.8, e definisce quindi un’osservabile in H0 , tale che U A(E)U = U P (E) , per ogni E ∈ B(H), essendo U : H0 → H il proiettore ortogonale su H. È importante notare che, tuttavia, P (E) non ha, in generale, un diretto significato fisico, in quanto H0 non è lo spazio di Hilbert del sistema. (3) Se consideriamo l’insieme degli operatori limitati e positivi A ∈ B(H), con 0 ≤ A(E) ≤ I, dove H è uno spazio di Hilbert, tale insieme è parzialmente ordinato rispetto a alla solita relazione d’ordine ≥, tuttavia non è un reticolo (al contrario dell’insieme dei proiettori ortogonali). Questo fatto non permette di generalizzare allo spazio degli operatori limitati positivi l’interpretazione data ai dei proiettori ortogonali in termini di proposizioni sul sistema. Vedi [BGL95] per ulteriori approfondimenti. 226 Capitolo 8 Teoria Spettrale su spazi di Hilbert I: generalità ed operatori normali limitati. In questo capitolo, di carattere puramente matematico, introduciamo i primi rudimenti di teoria spettrale per operatori (generalmente non limitati) su spazi di Hilbert (complessi), fino ad arrivare alla nozione di misura spettrale ed al teorema di decomposizione spettrale per operatori limitati normali. Il caso degli operatori autoaggiunti non limitati sarà trattato nel prossimo capitolo. Nella prima parte introdurremo il concetto di risolvente e di spettro di un operatore. Lo spettro di un operatore è un insieme di numeri complessi (associato ad ogni operatore) che generalizza il concetto di insieme degli autovalori. Il teorema spettrale prova che ogni operatore (limitato normale, oppure autoaggiunto non necessariamente limitato) può essere decomposto, in modo unico, tramite una procedura di integrazione rispetto ad una opportuna misura a “valori di proiezione”. In definitiva, tale teorema può essere visto come una generalizzazione negli spazi di Hilbert del teorema di diagonabilizzabilità delle matrici normali a coefficienti in C. Lo spettro di un operatore risulta essere il supporto della misura a valori di proiezione associata all’operatore tramite il teorema spettrale. Gli strumenti matematici necessari per formulare il teorema spettrale sono utili anche per altri fini. Vedremo in fatti che, attraverso di essi, è possibile dare una nozione di “operatore funzione di un secondo operatore”. Tale nozione ha molteplici applicazioni in fisica matematica. Il legame della teoria spettrale con la Meccanica Quantistica risiede nel fatto che le misure a valori di proiezione non sono altro che le osservabili definite nel capitolo precedente. Attraverso il teorema spettrale, le osservabili risultano essere in corrispondenza biunivoca con operatori autoaggiunti (generalmente non limitati) e gli spettri di tali operatori costituiscono gli insiemi degli esiti possibili delle misure quando si misurano le osservabili. La corrispondenza tra osservabili e operatori autoaggiunti permetterà di sviluppare la formulazione della teoria quantistica in stretto legame con la meccanica classica, nella quale, le osservabili sono le grandezze fisiche 227 rappresentate da funzioni a valori reali. Esaminiamo con più dettaglio il contenuto del capitolo. Nella prima sezione definiremo, come detto sopra i concetti di: spettro, risolvente, operatore risolvente, discutendone le proprietà più importanti ed in particolare la formula del raggio spettrale. Daremo le prorietà degli spettri di operatori autoaggiunti, unitari e normali. Nella sezione successiva costruiremo degli ∗-omomorfismi continui di C ∗ -algebre di funzioni indotti da operatori limitati autoaggiunti in spazi di Hilbert che saranno lo strumento fondamentale per fare il primo passo verso il teorema spettrale. Nell’ultima sezione, dopo avere definito la nozione di integrale di una funzione limitata rispetto ad una PVM, sarà dimostrato il teorma spettrale sarà per operatori limitati normali (in particolare autoaggiunti o unitari) in due versioni. 8.1 Spettro, risolvente, operatore risolvente. In questa sezione ci occuperemo delle nozioni e dei risultati fondamentali della teoria spettrale in spazi normati, di Banach e di Hilbert. 8.1.1 Nozioni fondamentali. Definizione 8.1. Sia X spazio normato sul campo C e sia A : D(A) → X un operatore lineare, dove D(A) ⊂ X è un sottospazio (non necessariamente denso) di X. (a) Si dice insieme risolvente di A l’insieme ρ(A) dei λ ∈ C tali che siano soddisfatte le seguenti tre condizioni: (i) Ran(A − λI) = X; (ii) (A − λI) : D(A) → X è iniettivo; (iii) (A − λI)−1 : Ran(A − λI) → X è limitato. (b) Se λ ∈ ρ(A), si dice (operatore) risolvente di A l’operatore Rλ (A) := (A − λI)−1 : Ran(A − λI) → D(A) . (c) Si dice spettro di A l’insieme σ(A) := C \ ρ(A). Lo spettro di A è unione dei seguenti tre sottoinsiemi disgiunti: (i) lo spettro puntuale di A, σp (A), costituito dai numeri complessi λ per cui l’operatore A − λI non è iniettivo; (ii) lo spettro continuo di A, σc (A), costituito dai numeri complessi λ per cui l’operatore A − λI è iniettivo e vale l’identità Ran(A − λI) = X, ma (A − λI)−1 non è limitato; (iii) lo spettro residuo di A, σr (A), costituito dai numeri complessi λ per cui l’operatore A − λI è iniettivo, ma Ran(A − λI) 6= X. Note. (1) È chiaro che σp (A) contiene tutti e soli gli autovalori di A (vedi definizione 3.10). Nel caso in cui X = H è uno spazio di Hilbert e gli autovettori di A formano una base hilbertiana di H, 228 si dice che A ha spettro puntuale puro. Si osservi che questo non significa, in generale, che σp (T ) = σ(T ); per esempio gli operatori autoaggiunti compatti hanno tutti spettro puntuale puro, tuttavia 0 può essere un punto dello spettro continuo. (2) Nel seguito faremo uso della teoria delle funzioni analitiche (dette equivalentemente olomorfe) definite su sottoinsiemi aperti di C, dati dagli insiemi risolventi di operatori chiusi, a valori in uno spazio di Banach sul campo complesso [Rud82]. La teoria è essenzialmente quella delle funzioni analitiche a valori complessi già nota dai corsi elementari, con le uniche differenze che, sull’immagine delle funzioni: (i) il valore assoluto deve essere sostituito con la norma dello spazio di Banach e (ii) la coniugazione complessa deve essere rimpiazzata dalla coniugazione hermitiana. Le definizioni, gli enunciati dei teoremi e le loro dimostrazioni sono gli stessi del caso elementare, se si tiene conto delle due precisazioni dette sopra. (3) Esistono altre decomposizioni dello spettro [ReSi80, AbCi97] nel caso in cui X = H sia spazio di Hilbert e A sia operatore normale di B(H) oppure autoaggiunto in H, di cui diremo nel capitolo seguente dopo aver dimostrato il teorema spettrale per operatori autoaggiunti non limitati. Per uno studio dettagliato di tali classificazioni per operatori rilevanti in Meccanica Quantistica si veda [AbCi97]. Lo spettro degli operatori autoaggiunti in uno spazio di Hilbert gioca un ruolo fondamentale in Meccanica Quantistica, perché, come vedremo, è costituito dall’insieme dei possibili risultati delle misure dell’osservabile associata all’operatore. Rimaniamo per il momento in un contesto generale e proviamo il seguente teorema. Tra le altre cose, il teorema prova che, se l’operatore T sullo spazio normato X è chiuso – in particolare, quindi, se T ∈ B(X) oppure, per il teorema 5.1, se T è autoaggiunto o è l’aggiunto di un operatore su uno spazio di Hilbert – allora, per avere che λ ∈ ρ(T ) è necessario e sufficiente che T − λI sia una biezione da D(T ) a tutto X. Non è quindi necessario controllare che l’inverso sia continuo e nemmeno controllare che Ran(T − λI) sia denso. Teorema 8.1. Sia X spazio di Banach sul campo C e sia T un operatore in X con dominio D(T ). Se T è chiuso, valgono i seguenti fatti. (a) λ ∈ ρ(T ) se e solo se T − λI è una biezione di D(T ) su X. (b) ρ(T ) è aperto, σ(T ) è chiuso e ρ(T ) 3 λ 7→ Rλ (T ) è una funzione olomorfa su ρ(T ) a valori nello spazio di Banach complesso B(X). (c) Se D(T ) = X, allora ρ(T ) è non vuoto; se inoltre X 6= {0}, allora σ(T ) è un compatto non vuoto ed in particolare vale: |λ| ≤ ||T || , per ogni λ ∈ σ(T ). (d) Per ogni λ, µ ∈ ρ(T ) vale l’equazione risolvente: Rλ (T ) − Rµ (T ) = (λ − µ)Rλ (T )Rµ (T ) . Note. (1) Per il punto (a), se T ∈ B(X) con X spazio di Banach (e quindi T è chiuso per il teorema del 229 grafico chiuso), oppure se T = A∗ (e quindi T è chiuso per (a) del teorema 5.1) con A operatore nello spazio di Hilbert X = H (in particolare se T = T ∗ ), allora il dominio di Rλ (T ) è tutto X e quindi Rλ (T ) ∈ B(X) (il tutto se λ ∈ ρ(T )). (2) Il punto (c) si applica in particolare al caso di operatori T ∈ B(X) per il teorema del grafico chiuso. Prova del teorema 8.1. (a) Se λ ∈ ρ(T ), basta provare che Ran(T −λI) = X. Dato che (T −λI)−1 è continuo, esiste K ≥ 0 per cui ||(T − λI)−1 x|| ≤ K||x|| per ogni x = (T − λI)y ∈ Ran(T − λI). Di conseguenza, per ogni y ∈ D(T ) vale ||y|| ≤ K||(T − λI)y)|| . (8.1) Dato che Ran(T − λI) = X, se x ∈ X, esisterà una successione {yn }n∈N ⊂ D(T ) per cui (T − λI)yn → x per n → +∞. Da (8.1) concludiamo che {yn }n∈N è successione di Cauchy e quindi ammette limite y ∈ X. Essendo T un operatore chiuso, dovrà essere y ∈ D(T ) e (T − λI)y = x, per cui x ∈ Ran(T − λI). Abbiamo provato che Ran(T − λI) = X, come volevamo. Supponiamo ora che T − λI sia una biezione di D(T ) su X; per provare la tesi è sufficiente mostrare che (T − λI)−1 è continuo. Poiché T è chiuso, allora anche T − λI è chiuso, cioè ha grafico chiuso. Dato che T − λI è una biezione, segue subito che anche (T − λI)−1 ha grafico chiuso ed è quindi chiuso. Essendo (T − λI)−1 definito su tutto X per ipotesi, il teorema del grafico chiuso prova immediatamente che (T − λI)−1 è limitato. (b) Se µ ∈ ρ(T ), la serie: S(λ) := +∞ X (λ − µ)n Rµ (T )n+1 n=0 converge assolutamente nella norma operatoriale (e quindi nella topologia uniforme) se |λ − µ| < 1/||Rµ (T )|| . (8.2) Infatti vale: +∞ X n=0 |λ − µ|n ||Rµ (T )n+1 || ≤ +∞ X |λ − µ|n ||Rµ (T )||n+1 = ||Rµ (T )|| n=0 +∞ X | (λ − µ) ||Rµ (T )|| |n . n=0 L’ultima serie è una serie geometrica di ragione | (λ − µ) ||Rµ (T )|| |, che converge in quanto | (λ − µ) ||Rµ (T )|| | < 1 per la (8.2). Se λ soddisfa la condizione di sopra, applicando T − λI = (T − µI) + (µ − λ)I a sinistra ed a destra di S(λ), si ottiene immediatamente che (usando anche la definizione Rµ (T )0 := I) (T − λI)S(λ) = IX mentre S(λ)(T − λI) = ID(T ) . 230 Abbiamo provato che se µ ∈ ρ, c’è un intorno aperto di µ tale che, per ogni punto λ di tale intorno esiste ed è limitato l’inverso di T − λI da X a D(T ). Quindi, per (a), tale intorno è incluso in ρ(T ) e allora ρ(T ) è aperto e σ(T ) = C \ ρ(T ) è chiuso. Inoltre Rλ (T ) è sviluppabile in serie di Taylor nell’intorno di ogni punto di ρ(T ) secondo la topologia operatoriale uniforme, per cui ρ(T ) 3 λ 7→ Rλ (T ) è una funzione olomorfa da ρ(T ) a valori nello spazio di Banach B(X). (c) Nel caso D(T ) = X, essendo T chiuso e X spazio di Banach, il teorema del grafico chiuso implica che T è limitato. Se λ ∈ C soddisfa |λ| > ||T ||, allora la serie S(λ) = +∞ X (−λ)−(n+1) T n n=0 (T 0 := I), converge assolutamente nella norma operatoriale. Per computo diretto si verifica che, come nel caso precedente, valgono effettivamente le identità: (T − λI)S(λ) = I e anche S(λ)(T − λI) = I , e quindi S(λ) = Rλ (T ) per (a). Quindi, per (a), ogni λ ∈ C con |λ| > ||T || appartiene a ρ(T ), che è dunque non vuoto. Inoltre, se λ ∈ σ(T ), deve valere |λ| ≤ ||T ||, per cui, se σ(T ) è non vuoto, allora è compatto perché chiuso e limitato. Mostriamo che σ(T ) 6= ∅. Supponiamo per assurdo che σ(T ) = ∅. In tal caso λ 7→ Rλ (T ) è definita su tutto C. Fissiamo f ∈ X0 (duale di X) e x ∈ X e consideriamo la funzione a valori complessi: ρ(T ) 3 λ 7→ g(λ) := f (Rλ (T )x). Questa funzione è sicuramente analitica in ogni componente connessa dell’insieme aperto ρ(T ), perché, per quanto provato sopra, se µ ∈ ρ(T ), in un intorno di µ tutto contenuto in ρ(T ), si ha lo sviluppo di Taylor: f (Rλ (T )x) := +∞ X (λ − µ)n f (Rµ (T )n+1 x) , n=0 dove abbiamo sfruttato la continuità di f , ed il fatto che la serie converge nella topologia uniformemente (e quindi anche in quella debole). Dunque, nell’ipotesi in cui σ(T ) = ∅, g è una funzione analitica su tutto C. Notiamo ancora che per |λ| > ||T || vale anche lo sviluppo: g(λ) := f (Rλ (T )x) = +∞ X (−λ)−(n+1) f (T n x) . n=0 Dato che tale serie converge assolutamente (per il teorema di Abel sulle serie di potenze), possiamo scrivere, per |λ| ≥ 1 + ||T ||: |g(λ)| ≤ |λ|−1 +∞ X |λ|−n |f (T n x)| ≤ n=0 K . |λ| per qualche K > 0. Quindi la funzione |g|, essendo continua ovunque e maggiorata da K|λ−1 | per |λ| ≥ Λ per qualche costante Λ, deve essere limitata su tutto il piano complesso. Essendo 231 anche olomorfa su tutto il piano complesso, g deve essere costante per il teorema di Liouville. Annullandosi |g(λ)| all’infinito, g deve essere la funzione nulla. Allora f (Rλ (T )x) = 0. Dato che il risultato vale per ogni f ∈ X0 , il secondo corollario al teorema di Hahn-Banach (cap.2 sezione 2.3) implica che deve essere ||Rλ (T )x|| = 0. Dato che anche x ∈ X 6= {0} era arbitrario, dobbiamo concludere che Rλ (T ) = 0 per ogni λ ∈ ρ(T ). Ma allora è impossibile che Rλ (T ) sia l’operatore inverso di T − λI. L’assurdo prova che l’ipotesi σ(T ) = ∅ non può verificarsi. (d) L’equazione risolvente si prova come segue. Valgono le equazioni (T − λI)Rλ (T ) = I e (T − µI)Rµ (T ) = I. Esplicitando i prodotti: T Rλ (T ) − λRλ (T ) = IX e T Rµ (T ) − µRµ (T ) = IX . Moltiplicando a sinistra la prima equazione per Rµ (T ) e la seconda per Rλ (T ), sottraendo i risultati ottenuti membro a membro e tenendo conto che Rµ (T )Rλ (T ) = Rλ (T )Rµ (T ) e che Rµ (T )T Rλ (T ) = Rλ (T )T Rµ (T ), si ottiene l’equazione risolvente. La prima relazione di commutazione scritta sopra segue dall’evidente identità (T − µI)(T − λI) = (T − λI)(T − µI) che ne implica un’analoga per gli operatori inversi; la seconda relazione di commutazione si prova come segue: Rµ (T )T Rλ (T ) = Rµ (T )(T − λI)Rλ (T ) + Rµ (T )λIRλ (T ) = Rµ (T )I + λRµ (T )Rλ (T ) = Rµ (T ) + λRλ (T )Rµ (T ) = (I + λRλ (T ))Rµ (T ) = (Rλ (T )(T − λI) + λRλ (T ))Rµ (T ) = Rλ (T )T Rµ (T ) . Questo conclude la dimostrazione. 2 8.1.2 Il raggio spettrale e la formula di Gelfand. Se T è un operatore limitato in uno spazio di Banach con dominio dato da tutto lo spazio, per il teorema 8.1 il suo spettro è contenuto nel cerchio di raggio ||T || centrato nell’origine di C. Tuttavia potrebbe esserci un cerchio di raggio più piccolo, con lo stesso centro, che racchiude σ(T ). A tal fine si fornisce la seguente definizione. Definizione 8.2. Sia X spazio di Banach sul campo C. Il raggio spettrale di T ∈ B(X) è il numero reale non negativo: r(T ) := sup{|λ| | λ ∈ σ(T )} . Esiste una celebre formula per il calcolo del raggio spettrale, dovuta al matematico Gelfand. Otterremo la formula di Gelfand usando un risultato sullo spettro di polinomi di operatori limitati che avrà anche un’altra importante conseguenza nella sezione successiva. Proposizione 8.2. Siano X spazio di Banach sul campo C, T ∈ B(X) e p = p(z) un polinomio complesso nella variabile z ∈ C. Valgono i seguenti fatti. 232 (a) Se p(T ) indica l’operatore ottenuto sostituendo al numero z l’operatore T in p(z) ed interpretando ogni potenza T n come l’operatore ottenuto dalla composizione di T con se stesso n volte (T 0 := I), vale: σ(p(T )) = p(σ(T )) := {p(λ) | λ ∈ σ(T )} . (8.3) (b) Se X è uno spazio di Hilbert, lo spettro di T ∗ soddisfa σ(T ∗ ) = σ(T ) := {λ | λ ∈ σ(T )} (8.4) . Prova. (a) Se α1 , . . . , αn sono le radici di un polinomio q (non necessariamente distinte), vale Q Q q(z) = c ni=1 (z − αi ), per qualche complesso c. Quindi q(T ) = c ni=1 (T − αi I). Sia λ ∈ σ(T ): allora (T −λI) : X → X non è biettivo per (a) di teorema 8.1; definiamo µ := p(λ). Consideriamo il polinomio q := p − µ. Dato che q(λ) = 0, uno dei fattori della decomposizione di q scritta sopra sarà (z − λ). Di conseguenza, scegliendo opportunamente l’ordine delle radici e tenendo conto che gli operatori T − αi I commutano tra di loro, si ha: p(T ) − µI = c "n−1 Y # (T − αi I) (T − λI) = c(T − λI) i=1 n−1 Y (T − αi I) . i=1 Come conseguenza, p(T ) − µI non potrà essere biettivo come operatore da X a X, essendo T − λI non biettivo. Per (a) del teorema 8.1 deve allora essere µ ∈ σ(p(T )). Abbiamo quindi provato che p(σ(T )) ⊂ σ(p(T )). Per concludere proviamo l’altra inclusione. Sia µ ∈ σ(p(T )): poniamo Q q = p − µ e decomponiamo il polinomio q come q(z) = c ni=1 (z − αi ). Avremo l’analoga decomposizione p(T ) − µI = c n Y (T − αi I) . i=1 Se tutte le radici αi appartenessero a ρ(T ), allora ogni (T − αi I) : X → X sarebbe biettivo e quindi sarebbe biettivo p(T ) − µI, cosa che è esclusa per ipotesi. Di conseguenza ci sarà una radice αk tale che (T − αk I) : X → X non è biettivo e quindi (sempre per (a) del teorema 8.1) αk ∈ σ(T ). Ma allora p(αk ) − µ = 0 e dunque µ ∈ p(σ(T )), il che implica p(σ(T )) ⊃ σ(p(T )). (b) Dalla proposizione 3.6, (T − λI) : X → X è biettivo se e solo se T ∗ − λI lo è; (a) del teorema 8.1 implica allora la tesi. 2 Teorema 8.2. Siano (X, || ||) spazio di Banach e T ∈ B(X). (a) Il raggio spettrale di T si ottiene tramite la formula di Gelfand r(T ) = lim ||T n ||1/n , n→+∞ dove il limite a secondo membro esiste sempre. (b) Se X è spazio di Hilbert e T è normale (T ∈ B(X)), allora vale sempre r(T ) = ||T || . 233 Prova.(a) Per (a) di proposizione 8.2 si ha (σ(T ))n = σ(T n ), per cui r(T )n = r(T n ) ≤ ||T n || e quindi vale r(T ) ≤ lim inf ||T n ||1/n . (8.5) n (Si noti che, al contrario del limite inferiore, che esiste sempre, il limite potrebbe non esistere.) Se |λ| > r(T ), allora vale Rλ (T ) = +∞ X (−λ)−(n+1) T n , (8.6) n=0 perché, per il teorema di Hadamard, il bordo del cerchio di convergenza di una serie di potenze di Laurent di una funzione analitica è quello che passa nella singolarità più vicina al punto all’infinito. Nel caso in esame, dato che tutte le singolarità appartengono allo spettro σ(T ), il bordo del cerchio di convergenza è dato dai punti λ ∈ C con |λ| > r(T ). In definitiva, la serie di sopra converge per ogni λ ∈ C tale che |λ| > r(T ) e quindi convergerà assolutamente in ogni cerchio, centrato nel punto all’infinito, che passa per un tale λ. In particolare varrà |λ|−(n+1) ||T n || → 0 , se n → +∞, per ogni λ ∈ C con |λ| > r(T ). Per ogni > 0, deve accadere allora che, definitivamente: ||T n ||1/n < 1/n |λ|(n+1)/n = (|λ|)1/n |λ| , per cui, essendo (|λ|)1/n → 1 per n → +∞, accadrà che lim supn ||T n ||1/n ≤ |λ| per ogni λ ∈ C con |λ| > r(T ). Dato che possiamo avvicinarci a piacere al valore di r(T ) con |λ|, dovrà accadere che lim supn ||T n ||1/n ≤ r(T ). Tenendo conto di (8.5), abbiamo infine che: r(T ) ≤ lim inf ||T n ||1/n ≤ lim sup ||T n ||1/n ≤ r(T ) . n n Questo prova che esiste il limite di ||T n ||1/n per n → +∞ e che esso coincide con r(T ). (b) Per (a) di proposizione 3.7, tenendo conto che B(X) è una C ∗ -algebra con involuzione ∗ (vedi nota prima della proposizione 3.7), abbiamo che ||T n || = ||T ||n se T è normale. Applicando la formula di Gelfand, si ha: r(T ) = lim ||T n ||1/n = lim (||T ||n )1/n = ||T || . n→+∞ n→+∞ Questo completa la dimostrazione. 2 Nota. Il punto (b) vale in particolare se T è autoaggiunto oppure se T è unitario. 234 8.1.3 Spettri di operatori autoaggiunti, unitari e normali in spazi di Hilbert. Passiamo a considerare il caso specifico di operatori unitari e di operatori autoaggiunti. Proposizione 8.3. Sia H spazio di Hilbert. Valgono i seguenti fatti. (a) Se A è operatore autoaggiunto in H (non necessariamente limitato e non definito su tutto H in generale), allora: (i) σ(A) ⊂ R, (ii) σr (A) = ∅, (iii) autospazi di A con autovalori (cioè punti di σp (A)) distinti sono ortogonali. (b) Se U ∈ B(H) è operatore unitario, allora: (i) σ(U ) è un sottoinsieme compatto e non vuoto di {λ ∈ C | |λ| = 1}, (ii) σr (U ) = ∅. (c) Se T ∈ B(H) è operatore normale, allora: (i) σr (T ) = σr (T ∗ ) = ∅, (ii) σp (T ∗ ) = σp (T ), (iii) σc (T ∗ ) = σc (T ). Prova. (a) Cominciamo con (i). Supponiamo λ = µ + iν con ν 6= 0 e proviamo che λ ∈ ρ(A). Se x ∈ D(A), vale: ((A − λI)x|(A − λI)x) = ((A − µI)x|(A − µI)x) + ν 2 (x|x) + iν[(Ax|x) − (x|Ax)] . L’ultimo addendo è nullo perché A è autoaggiunto. Concludiamo che ||(A − λI)x|| ≥ |ν| ||x|| . Con la stessa procedura si trova anche che ||(A − λI)x|| ≥ |ν| ||x|| . Gli operatori A − λI e A − λI saranno dunque iniettivi e varrà ||(A − λI)−1 || ≤ |ν|−1 , dove (A − λI)−1 : Ran(A − λI) → D(A). Notiamo ora che vale ⊥ Ran(A − λI) = [Ran(A − λI)]⊥ = Ker(A∗ − λI) = Ker(A − λI) = {0} , dove, nell’ultimo passaggio, si è tenuto conto del fatto che A − λI è iniettivo. Riassumendo, vale ⊥ che: A − λI è iniettivo, (A − λI)−1 è limitato e Ran(A − λI) = {0}, cioè Ran(A − λ) è denso in H; quindi λ ∈ ρ(A), per definizione di insieme risolvente. Passiamo a (ii). Supponiamo che λ ∈ σ(A), ma che λ 6∈ σp (A). In tal caso A − λI deve essere iniettivo e quindi Ker(A − λI) = {0}. Essendo A = A∗ e λ ∈ R per (i), vale allora Ker(A∗ − λI) = {0}, per cui [Ran(A − λI)]⊥ = Ker(A∗ − λI) = {0} e quindi Ran(A − λI) = H. Di conseguenza λ ∈ σc (A). 235 La prova di (iii) è immediata: se λ 6= µ e Au = λu, Av = µv, allora, tenendo conto del fatto che λ, µ ∈ R e che A = A∗ , (λ − µ)(u|v) = (Au|v) − (u|Av) = (u|Av) − (u|Av) = 0 ; essendo λ − µ 6= 0, deve essere (u|v) = 0. (b) (i) Il fatto che σ(U ) sia chiuso segue subito da (b) del teorema 8.1, dato che ogni operatore unitario è definito su tutto H, limitato e, quindi, chiuso. Essendo ||U || = 1, da (c) dello stesso teorema segue anche che σ(U ) è un sottoinsieme compatto e non vuoto di {λ ∈ C | |λ| ≤ 1}. Per concludere, consideriamo la serie S(λ) = +∞ X λn (U ∗ )n+1 n=0 dove |λ| < 1. Tenendo conto che ||U || = ||U ∗ || = 1, si vede immediatamente che la serie converge assolutamente nella norma operatoriale e quindi definisce un operatore di B(H). Tenendo infine conto che U ∗ U = U U ∗ = I ed usando la serie scritta sopra, si ha che (U − λI)S(λ) = S(λ)(U − λI) = I . Per (a) del teorema 8.1, deve allora essere λ ∈ ρ(U ). In definitiva: σ(U ) è un sottoinsieme compatto e non vuoto di {λ ∈ C | |λ| = 1}. (ii) La tesi è conseguenza di (i) di (c), essendo normale ogni operatore unitario. Diamo comunque una dimostrazione indipendente. Se λ ∈ σr (U ), allora Ran(U − λI) non è denso, per cui esiste f 6= 0 normale a Ran(U − λI). Allora, per ogni g ∈ H: (f |λg) = (f |U g) e quindi (λf |g) = (U ∗ f |g) per ogni g ∈ H. Di conseguenza: U ∗ f = λf . Facendo agire U membro a membro, troviamo f = λU f , che implica U f = λf perché, essendo |λ| = 1, vale 1/λ = λ. Quindi λ ∈ σp (U ) e ciò è assurdo, essendo lo spettro puntuale e lo spettro residuo disgiunti; pertanto σr (U ) = ∅. (c) Ricordiamo che, se T ∈ B(H) è normale, allora λ ∈ C è autovalore di T se e solo se λ è autovalore di T ∗ ((i) di (b) in proposizione 3.8). Questo fatto da solo prova (ii). Essendo le tre parti dello spettro disgiunte e valendo σ(T ) = σ(T ∗ ) ((b) proposizione 8.2), per provare (iii) basta dimostrare (i). Supponiamo che λ ∈ σ(T ), ma che λ 6∈ σp (T ). Essendo σ(T ) = σ(T ∗ ) e σp (T ) = σp (T ∗ ), questo equivale a dire che λ ∈ σ(T ∗ ), ma che λ 6∈ σp (T ∗ ). In tal caso T ∗ − λI deve essere iniettivo e quindi Ker(T ∗ − λI) = {0}. Allora (per (d) di proposizione 3.6) [Ran(T − λI)]⊥ = Ker(T ∗ − λI) = {0} e quindi Ran(T − λI) = H. Di conseguenza λ ∈ σc (T ). In altre parole σr (T ) = ∅. La dimostrazione per T ∗ è la stessa, usando il fatto che (T ∗ )∗ = T ((b) di proposizione 3.6). 2 Esercizi 8.1. (1) Si supponga che valgano le ipotesi del teorema 8.1 con X = H spazio di Hilbert. Mostrare che se Rλ (T ) è compatto per λ = λ0 ∈ ρ(T ), allora è compatto per ogni λ ∈ ρ(T ). 236 Suggerimento. Si usi l’equazione risolvente e le proprietà dello spazio degli operatori compatti. (2) Sia H = l2 (N) e si consideri l’operatore: T : (x0 , x1 , x2 , . . .) 7→ (0, x0 , x1 , . . .) . Determinare lo spettro di T . (3) Siano H spazio di Hilbert e T = T ∗ ∈ B(H) compatto. Mostrare che se dim(RanT ) non è finita, allora σc (T ) 6= ∅ ed è costituito da un punto solo. Suggerimento. Decomporre T come nel teorema 4.3, tenere conto del teorema 4.2 ed infine del fatto che σ(T ) è chiuso per il teorema 8.1. (4) Costruire un operatore autoaggiunto con spettro puntuale denso in [0, 1]. Suggerimento. Si consideri lo spazio di Hilbert H = l2 (N), si numerino i razionali in [0, 1] secondo un ordine qualsiasi: r0 , r1 , . . . e si definisca l’operatore T : (x0 , x1 , x2 , . . .) 7→ (r0 x0 , r1 x1 , r2 x2 , . . .) con dominio D(T ) dato dalle successioni (x0 , x1 , x2 , . . .) ∈ l2 (N) tali che +∞ X |rn xn |2 < +∞ . n=0 (5) Mostrare che se T è autoaggiunto sullo spazio di Hilbert H e λ ∈ ρ(T ), allora Rλ (T ) è un operatore normale di B(H) che soddisfa: Rλ (T )∗ = Rλ (T ) . (6) Mostrare che se U : H → H, con H spazio di Hilbert, è operatore isometrico non suriettivo, allora σr (U ) 6= ∅. Suggerimento. Provare che 0 ∈ σ(U ). U − 0I è iniettivo, ma Ran(U − 0I) = RanU non è denso. Se fosse denso accadrebbe che, per ogni f ∈ H, esisterebbe {fn }n∈N ⊂ H con U fn → f . Conservando U la norma, {fn } sarebbe di Cauchy perché lo è {U fn }, ma allora, se fn → g, avremmo U g = f . Dato che f ∈ H è arbitrario, avremmo che U è suriettivo, cosa esclusa a priori. (7) Sia A un operatore nello spazio di Hilbert H con dominio D(A) e sia U : H0 → H un’isometria suriettiva tra spazi di Hilbert. Provare che, se A0 := U −1 AU : D(A0 ) → H0 , con D(A0 ) = U −1 D(A), allora σp (A) = σp (A0 ), σp (A) = σp (A0 ), σr (A) = σr (A0 ). (8) Si consideri l’operatore posizione Xi definito in definizione 5.7. Mostrare che σ(Xi ) = σc (Xi ) = R. (9) Si consideri l’operatore impulso Xi definito in definizione 5.9. Mostrare che σ(Pi ) = σc (Pi ) = R. Suggerimento. Usare la proposizione 5.6. (10) Se σ(A) = σ(B), per due operatori A e B in uno spazio di Hilbert, allora è vero che σp (A) = σp (B)? 237 Suggerimento. Considerare l’operatore dell’esercizio (4) e l’operatore moltiplicativo per la coordinata x in L2 ([0, 1], dx), dove dx è la misura di Lebesgue su R. 11. Si consideri l’operatore di Volterra T : L2 ([0, 1], dx) → L2 ([0, 1], dx) definito in (4.35) e se ne studi lo spettro. Suggerimento. σ(T ) = σc (T ) = {0}. 8.2 ∗-omomorfismi continui di C ∗ -algebre di funzioni indotti da operatori limitati autoaggiunti in spazi di Hilbert. Mostreremo in questa sezione come sia possibile costruire una trasformazione continua, che conservi la struttura di C ∗ -algebra, da uno spazio di funzioni misurabili limitate e definite su un compatto, allo spazio degli operatori limitati e definiti su uno spazio di Hilbert H. La trasformazione suddetta è “generata” da un operatore autoaggiunto T ∈ B(H). Il primo passo per costruire tali trasformazioni consiste nello studio di funzioni polinomiali di T e T ∗ nel caso più generale in cui T ∈ B(H) sia un operatore normale. Per ragioni tecniche è conveniente, in certi casi, esprimere tali polinomi in funzione di due variabili autoaggiunte che ora introduciamo. Consideriamo un operatore normale T ∈ B(H), dove H è uno spazio di Hilbert. Possiamo sempre decomporre T e T ∗ in combinazioni lineari di due operatori autoaggiunti, X, Y , commutanti tra di loro: T = X + iY , T ∗ = X − iY , (8.7) essendo per definizione T + T∗ T − T∗ , Y := . (8.8) 2 2i Gli operatori X e Y sono evidentemente autoaggiunti per costruzione. La prova del fatto che X e Y commutano è immediata, in virtù della commutatività di T e T ∗ . La decomposizione (8.7) è analoga a quella dei numeri complessi in parte reale ed immaginaria: X := z = x + iy , z = x − iy , (8.9) z−z . 2i (8.10) essendo per definizione x := z+z , 2 y := Nota. È importante precisare che si possono considerare z e z come variabili indipendenti, biunivocamente legate con le variabili x, y. I polinomi e, più in generale, le funzioni di x e y sono allora in corrispondenza biunivoca con le funzioni di z e z: alla funzione f = f (z, z) si può associare la funzione g = g(x, y), definita come g(x, y) := f (x + iy, x − iy) e, viceversa, alla funzione g = g(x, y) si può associare la funzione f1 = f1 (z, z), definita come f1 (z, z) := g((z + z)/2, (z − z)/2i). È chiaro che vale f1 = f identicamente. Sfrutteremo tale possibilità in seguito. 238 L’applicazione φT che associa ad un polinomio a coefficienti complessi p = p(x, y), (x, y) ∈ R2 , l’operatore normale p(X, Y ) (definito nel modo più ovvio, interpretando i prodotti di numeri x e y come composizione di operatori X e Y e definendo X 0 := Y 0 := I) ha delle caratteristiche interessanti, la cui verifica è immediata, tenendo conto del fatto che X e Y (e dunque le loro potenze) commutano: (a) è lineare: φT (αp + βp0 ) = αφT (p) + βφT (p0 ) per ogni α, β ∈ C, (b) manda il prodotto di polinomi nella composizione di operatori: φT (p·p0 ) = φT (p)◦φT (p0 ), (c) manda il polinomio che vale costantemente 1 nell’operatore identità: φT (1) = I . Queste proprietà, per definizione (cfr A7 in definizione 2.4), rendono φT un omomorfismo di algebre con unità, definito sulla ∗ -algebra con unità dei polinomi complessi e a valori nella C ∗ -algebra B(H). Ci sono ancora tre proprietà interessanti di φT : (d) manda il polinomio R2 (x, y) 7→ z = x + iy, che indicheremo un po’ impropriamente con z, nell’operatore T : φT (z) = T ; (e) se p denota il polinomio complesso coniugato del polinomio p (p(x, y) = p(x, y) per ogni (x, y) ∈ R2 ), vale φT (p)∗ = φT (p); (f) se, per A ∈ B(H), valgono AT = T A e AT ∗ = T ∗ A, allora AφT (p) = φT (p)A per ogni polinomio p. C’è un’altra interessante proprietà che si riscontra quando si restringe il dominio dei polinomi considerati ad un compatto di R2 . Consideriamo, per esempio, un polinomio p = p(x, y) definito sul compatto σ(T ) e tale che si possa scrivere come funzione della variabile z = x + iy. Questo accade, in particolare, se T = T ∗ , nel qual caso σ(T ) ⊂ R. Possiamo allora scrivere p = p(z), oppure, nel caso in cui T = T ∗ , p = p(x). Dato che φT (p) = p(T ) è un operatore normale, deve essere che, in virtù di (b) del teorema 8.2: ||p(T )|| = r(p(T )) = sup{|µ| ∈ C | µ ∈ σ(p(T ))} . La proposizione 8.2 implica allora che: ||φT (p)|| = sup{|p(z)| | z ∈ σ(T )} . (8.11) Questo fatto può essere esteso, con opportune precisazioni, al caso di funzioni non necessariamente polinomiali. Occupiamoci ora, in modo specifico, del caso in cui T sia autoaggiunto. Proposizione 8.4. Siano H spazio di Hilbert e T ∈ B(H) operatore autoaggiunto. (a) Esiste un unico omomorfismo continuo, ΦT : C(σ(T )) → B(H), dalla C ∗ -algebra commutativa con unità C(σ(T )) (spazio delle funzioni continue a valori complessi f = f (x), per x ∈ σ(T ), dotato della norma dell’estremo superiore || ||∞ e con involuzione data dalla coniugazione complessa) alla C ∗ -algebra con unità B(H), che gode della proprietà ΦT (x) = T , dove x è il polinomio σ(T ) 3 x 7→ x. (b) ΦT gode delle ulteriori seguenti proprietà: (i) per ogni f ∈ C(σ(T )) vale ||ΦT (f )|| = ||f ||∞ ; 239 (8.12) (ii) se, per A ∈ B(H), vale AT = T A, allora AΦT (f ) = ΦT (f )A per ogni f ∈ C(σ(T )); (iii) ΦT è uno ∗ -omomorfismo di C ∗ -algebre, valendo ΦT (f ) = ΦT (f )∗ per ogni f ∈ C(σ(T )). Prova. (a) Dimostriamo l’esistenza. Lo spettro σ(T ) ⊂ R è compatto per (c) del teorema 8.1 ed è spazio topologico di Hausdorff perché tale è R, quindi possiamo applicare il teorema di Stone-Weierstrass. Lo spazio P (σ(T )) dei polinomi p = p(x), con x ∈ σ(T ), a coefficienti complessi, costituisce una sottoalgebra di C(σ(T )) che contiene l’unità, data dalla funzione di valore costantemente pari a 1, separa i punti di σ(T ) (se x1 , x2 ∈ σ(T ) con x1 6= x2 , il polinomio p(x) := x − x1 su σ(T ) è tale che p(x1 ) = 0, ma p(x2 ) 6= 0) ed è chiusa rispetto alla coniugazione complessa. Il teorema di Stone-Weierstrass ((5) in esempi 2.1) assicura che lo spazio dei polinomi considerati è denso in C(σ(T )). Consideriamo l’applicazione (definita prima della proposizione 8.4) φT : P (σ(T )) 3 p 7→ p(X, Y ) ∈ B(H) . Sappiamo che φT è lineare e vale inoltre ||φT (p)|| = ||p||∞ per (8.11), il che implica la continuità di φT . È noto che un operatore lineare continuo T : D(T ) → Y, dove Y è uno spazio di Banach e D(T ) un sottospazio denso di uno spazio normato X, ammette un’unica estensione limitata TÒ : X → Y e vale ||TÒ|| = ||T || (vedi gli esercizi svolti (3) e (4) in esercizi 2.1). Di conseguenza esisterà un unico operatore lineare ΦT : C(σ(T )) → B(H) limitato che estende φT su C(σ(T )). Tale operatore è un omomorfismo di algebre con unità in quanto: (a) è lineare, (b) soddisfa ΦT (f · g) = ΦT (f )ΦT (g) per continuità (dato che, banalmente, ciò è vero sulla sottoalgebra dei polinomi per definizione di φT ), (c) trasforma la funzione che vale costantemente 1 ∈ P (σ(T )) nell’operatore identità I ∈ B(H) per definizione di φT . Infine, la (8.12) è banalmente vera in virtù della proprietà (d) dell’applicazione φT . Passiamo all’unicità: ogni altro omomorfismo χT di algebre con unità che soddisfa (8.12), deve coincidere con ΦT sullo spazio dei polinomi. (Infatti, deve essere T = χT (x) = ΦT (x) e quindi, usando più volte il fatto che il prodotto di polinomi è trasformato nella composizione di operatori, T n = χT (xn ) = ΦT (xn ); inoltre, l’ulteriore identità I = χT (1) = ΦT (1) vale per definizione di omomorfismo tra algebre con unità. Usando la linearità, si ottiene che, per ogni p ∈ P (σ(T )), vale p(T ) = χT (p) = ΦT (p).) Se χT è anche continuo, per l’unicità dell’estensione continua coinciderà con ΦT ovunque. (b) Le proprietà (i) e (ii) si provano immediatamente se f è un polinomio e quindi si estendono direttamente per continuità al caso di f ∈ C(σ(T )). Infine l’omomorfismo è uno ∗ -omomorfismo in quanto, se {pn } è una successione di polinomi che tende, uniformemente su σ(T ), alla funzione continua f , {pn } tenderà, uniformemente su σ(T ), alla funzione continua f ; d’altra parte, come visto sopra (cfr proprietà (e) di φT ), ΦT (pn ) = ΦT (pn )∗ e l’operazione di coniugazione hermitiana è continua nella topologia operatoriale uniforme. Per la continuità di ΦT , dovrà quindi essere: ΦT (f ) = ΦT (f )∗ . 2 Notazione 8.1. Ricordiamo che se X è uno spazio topologico, B(X) indica la σ-algebra di Borel su X. La C ∗ -algebra delle funzioni f : X → C Borel-misurabili e limitate M (X, B(X)) (vedi (3) 240 in esempi 2.1) sarà nel seguito indicata semplicemente con M (X). Rimanendo nel caso T = T ∗ , la proposizione appena provata può essere estesa dimostrando l’esistenza e l’unicità di un analogo omomorfismo di algebre con unità tra M (σ(T )) e B(H) (dove la topologia usata su σ(T ) è quella indotta dalla topologia di R ⊃ σ(T )). Teorema 8.3. Siano H spazio di Hilbert e T ∈ B(H) operatore autoaggiunto. ÒT : M (σ(T )) → B(H), dalla C ∗ -algebra commuta(a) Esiste un unico omomorfismo continuo, Φ tiva con unità M (σ(T )) (spazio delle funzioni misurabili limitate a valori complessi definite sul compatto di Hausdorff σ(T ), dotato della norma dell’estremo superiore || ||∞ e con involuzione data dalla coniugazione complessa) alla C ∗ -algebra con unità B(H), tale che: (i) vale l’identità: ÒT (x) = T , Φ dove x è la funzione σ(T ) 3 x 7→ x ; (8.13) (ii) se {fn }n∈N ⊂ M (σ(T )) è limitata e converge puntualmente a f : σ(T ) → C, allora ÒT (f ) = w- lim Φ ÒT (fn ) . Φ n→+∞ ÒT gode delle ulteriori seguenti proprietà: (b) Φ ÒT si riduce all’omomorfismo isometrico ΦT su C(σ(T )) di proposizione 8.4; (i) Φ ÒT (f )|| ≤ ||f ||∞ ; (ii) per ogni f ∈ M (σ(T )) vale ||Φ ÒT (f ) = Φ ÒT (f )A per ogni f ∈ M (σ(T )); (iii) se, per A ∈ B(H), vale AT = T A, allora AΦ ∗ ∗ Ò Ò ÒT (f )∗ per ogni f ∈ M (σ(T )); (iv) ΦT è uno -omomorfismo di C -algebre, valendo ΦT (f ) = Φ (v) se {fn }n∈N ⊂ M (σ(T )) è limitata e converge puntualmente a f : σ(T ) → C, allora ÒT (f ) = s- lim Φ ÒT (fn ) ; Φ n→+∞ ÒT (f ) ≥ 0. (vi) se f ∈ M (σ(T )) assume solo valori reali e f ≥ 0, allora Φ Nota. A commento di (ii) in (a), notiamo che la convergenza in senso debole di una successione di operatori in uno spazio di Hilbert H può essere definita in modo equivalente mediante prodotti scalari, usando il teorema 3.2 (di Riesz), che identifica lo spazio H con il suo duale topologico H0 . Se {An }n∈N ⊂ L(H) e A ∈ L(H), scrivere che A = w-limn→+∞ An significa che, per ogni coppia x, y ∈ H, (x|An y) → (x|Ay) per n → +∞. Prova del teorema 8.3. (a) Fissati x, y ∈ H, l’applicazione: Lx,y : C(σ(T )) 3 f 7→ (x|ΦT (f )y) ∈ C è lineare e ||Lx,y || è dato da: sup{|Lx,y (f )| | f ∈ C(σ(T )) , ||f ||∞ = 1} ≤ ||x|| ||y|| sup{||ΦT (f )|| | f ∈ C(σ(T )) , ||f ||∞ = 1} 241 (dove si è usata la disuguaglianza di Cauchy-Schwartz), da cui, usando il fatto che ΦT è isometrico, troviamo: ||Lx,y || ≤ ||x|| ||y|| , e quindi Lx,y è limitato. Per il teorema della rappresentazione di Riesz per le misure complesse (cfr. (1) in esempi 2.2), esiste un’unica misura complessa µx,y sul compatto σ(T ) ⊂ C tale che, per ogni f ∈ C(σ(T )), si abbia: Z Lx,y (f ) = (x|ΦT (f )y) = f (λ) dµx,y (λ) ; (8.14) σ(T ) vale inoltre |µx,y |(σ(T )) = ||Lx,y || ≤ ||x|| ||y||. Notiamo per inciso che se x = y, allora µx,x è una misura reale, positiva e finita: infatti, se f ∈ C(σ(T )) assume solo valori reali, vale ΦT (f ) = ΦT (f )∗ per (iii) di (b) nella proposizione 8.4, per cui: Z Z f (λ) h(λ)d|µx,x (λ)| = σ(T ) f (λ) h(λ)d|µx,x (λ)| = (x|ΦT (f )x) = (ΦT (f )x|x) = (x|ΦT (f )x) σ(T ) Z = f (λ) h(λ)d|µx,x (λ)| , σ(T ) dove abbiamo decomposto dµx,x in hd|µx,x |, essendo h una funzione misurabile di modulo unitario individuata quasi ovunque da µx,x e |µx,x | la misura positiva associata a µx,x (vedi [Rud82]). Per linearità, la relazione Z Z f (λ) h(λ)d|µx,x (λ)| = f (λ) h(λ)d|µx,x (λ)| σ(T ) σ(T ) deve valere anche quando f ∈ C(σ(T )) prende valori complessi. Il teorema di Riesz sulle misure complesse assicura allora che hd|µx,x | = hd|µx,x |, per cui h(λ) = h(λ) quasi ovunque, ma essendo |h(λ)| = 1, segue che h(λ) = 1 quasi ovunque e quindi µx,x è una misura reale, positiva e finita (perché tale è |µx,x |). Usiamo (8.14) per estendere Lx,y (f ) al caso generale in cui f ∈ M (σ(T )), dato che il secondo membro è comunque ben definito: se g ∈ M (σ(T )), Z Lx,y (g) := g(λ) dµx,y (λ) . (8.15) σ(T ) Dovrà essere, per proprietà generali delle misure complesse (cfr. (1) in esempi 2.2): |Lx,y (g)| ≤ ||g||∞ |µx,y |(σ(T )) ≤ ||g||∞ ||x|| ||y|| . (8.16) Per costruzione, se g ∈ C(σ(T )) è fissata, (x, y) 7→ Lx,y (g) è anti-lineare in x e lineare in y. Si può dimostrare che ciò continua a valere anche per g ∈ M (σ(T )). Proviamo per esempio la linearità in y, l’anti-linearità si prova analogamente. Dai teoremi generali delle misure complesse (vedi [Rud82]) si ha che, per x, y, z ∈ H e g ∈ M (σ(T )) fissati, se α, β ∈ C, allora vale Z α Z g(λ) dµx,y (λ) + β σ(T ) Z g(λ) dµx,z (λ) = σ(T ) g(λ) dν(λ) , σ(T ) 242 (8.17) dove ν è la misura complessa definita da ν(E) := αµx,y (E) + βµx,z (E) per ogni boreliano E ⊂ σ(T ). Tenendo conto di come abbiamo definito le misure µx,y (cfr. (8.14)) e sfruttando la linearità del prodotto scalare di H nell’argomento di destra, si ricava subito che, per ogni f ∈ C(σ(T )) inserita in (8.17) al posto di g, sussiste l’identità Z Z f (λ) dµx,αy+βz (λ) = σ(T ) f (λ) dν(λ) . σ(T ) Il teorema di Riesz assicura a questo punto che µx,αy+βz = ν. Pertanto, (8.17) può essere riscritta, per ogni g ∈ M (σ(T )): Z α Z g(λ) dµx,y (λ) + β σ(T ) Z g(λ) dµx,z (λ) = σ(T ) g(λ) µx,αy+βz (λ) . σ(T ) Abbiamo provato che Lx,y (g) è lineare in y per ogni fissato x ∈ H e ogni g ∈ M (σ(T )). La (8.16) implica la limitatezza dell’operatore lineare y 7→ Lx,y (g) e quindi, per il teorema 3.2 (di Riesz), fissati g ∈ M (σ(T )) e x ∈ H, esiste un unico vettore vx ∈ H tale che Lx,y (g) = (vx |y) per ogni y ∈ H. Dato che vx è lineare in x (perché Lx,y (g) è antilineare in x e il prodotto scalare (vx |y) è antilineare in vx ), esisterà anche un unico operatore g(T )0 ∈ L(H) per cui vx = g(T )0 x per ogni x ∈ H. E quindi Lx,y (g) = (g(T )0 x|y). La condizione (8.16) implica subito che g(T )0 è limitato: infatti ||g(T )0 x||2 = |(g(T )0 x|g(T )0 x)| = |Lx,g(T )0 x (g)| ≤ ||g||∞ ||x|| ||g(T )0 x|| , da cui ||g(T )0 x|| ≤ ||g||∞ ||x|| e quindi ||g(T )0 || ≤ ||g||∞ . Posto g(T ) := g(T )0∗ , abbiamo provato che, per g ∈ M (σ(T )), esiste un unico operatore g(T ) ∈ B(H) tale che, per ogni coppia x, y ∈ H: Lx,y (g) = (x|g(T )y) . L’applicazione lineare: ÒT : M (σ(T )) 3 f 7→ f (T ) ∈ B(H) , Φ dove, per ogni x, y ∈ H: Z Lx,y (f ) = (x|f (T )y) := f (λ) dµx,y (λ) , σ(T ) è, per costruzione, un’estensione di ΦT : in particolare vale (8.13). L’estensione è continua in ÒT (f )|| ≤ ||f ||∞ per ogni f ∈ M (σ(T )): infatti quanto ||Φ ÒT (f )|| = ||f (T )|| = ||f (T )0∗ || = ||f (T )0 || ≤ ||f ||∞ . ||Φ 243 ÒT estende l’omomorfismo di algebre con unità ΦT , per provare che Φ ÒT è un omoDato che Φ Ò Ò Ò morfismo di algebre con unità è sufficiente mostrare che ΦT (f · g) = ΦT (f )ΦT (g) quando f, g ∈ M (σ(T )). Se le due funzioni appartengono a C(σ(T )), la tesi è vera per il teorema precedente. Supponiamo f, g ∈ C(σ(T )); allora: Z f · g dµx,y ÒT (f · g)y) = (x|Φ ÒT (f )Φ ÒT (g)y) = = (x|Φ Z σ(T ) σ(T ) f dµx,Φ bT (g)y . Il teorema di Riesz citato prima implica che la misura dµx,Φ bT (g)y coincida con la misura g dµx,y . Quindi, se f ∈ M (σ(T )), si ha: Z f · g dµx,y = Z σ(T ) σ(T ) f dµx,Φ bT (g)y . Da questo segue che, per ogni coppia x, y ∈ H, per ogni f ∈ M (σ(T )) e g ∈ C(σ(T )): Z f · g dµx,y = σ(T ) Z σ(T ) ∗ Ò Ò Ò Ò f dµx,Φ bT (g)y = (x|ΦT (f )ΦT (g)y) = (ΦT (f ) x|ΦT (g)y) Z = σ(T ) g dµΦ b ∗ T (f ) x,y . Ragionando come sopra e usando il teorema di Riesz, si ha che l’uguaglianza Z f · g dµx,y = σ(T ) Z σ(T ) g dµΦ b T (f ) ∗ x,y , (8.18) valida per ogni g ∈ C(σ(T )), implica f dµx,y = dµΦ bT (f )∗ x,y e dunque la (8.18) deve essere vera per ogni coppia x, y ∈ H e per ogni coppia f, g ∈ M (σ(T )). Quindi, con tali scelte del tutto generali: ÒT (f · g)y) = (x|Φ Z σ(T ) da cui f · g dµx,y = Z σ(T ) g dµΦ b ∗ T (f ) x,y ÒT (f )∗ x|Φ ÒT (g)y) = (x|Φ ÒT (f )Φ ÒT (g)y) . = (Φ Ò Ò Ò x (Φ T (f · g) − ΦT (f )ΦT (g))y = 0 . Scegliendo x coincidente con il secondo argomento del prodotto scalare, si trova che ÒT (f · g)y = Φ ÒT (f )Φ ÒT (g)y Φ per ogni y ∈ H e per ogni coppia f, g ∈ M (σ(T )), da cui ÒT (f · g) = Φ ÒT (f )Φ ÒT (g) . Φ La proprietà (ii) di (a) vale in conseguenza di (v) di (b), che proviamo sotto, indipendentemente da (ii) di (a). 244 ÒT quando soddisfa le condizioPer concludere la dimostrazione di (a), proviamo l’unicità di Φ ni dette in (a). Se Ψ : M (σ(T )) → B(H) soddisfa le condizioni in (a), allora coincide con ÒT sui polinomi, e quindi, per continuità, coincide con Φ ÒT su C(σ(T )). Per fissati x, y ∈ H, Φ l’applicazione: νx,y : E 7→ (x|Ψ(χE )y) , dove E è un qualsiasi boreliano di σ(T ) e χE la sua funzione caratteristica, è una misura complessa su σ(T ). Infatti νx,y (∅) = (x|Ψ(0)y) = 0; inoltre, se {Sk }k∈N è una famiglia di boreliani a due a due disgiunti, si ha νx,y (∪k Sk ) = (x|Ψ(χ∪k Sk )y) = (x| lim Ψ( n→+∞ n X χSk )y) = lim n→+∞ k=0 n X (x|Ψ(χSk )y) = k=0 +∞ X νx,y (Sk ) , k=0 dove il primo membro è sempre finito e abbiamo tenuto conto della condizione (ii) di (a) e del fatto che, puntualmente: χ∪k Sk = +∞ X χSk . (8.19) k=0 Si osservi che la (8.19) non dipende dall’ordine con cui si etichettano gli insiemi Sk , essendo la serie di termini positivi. Di conseguenza, la relazione νx,y (∪k Sk ) = +∞ X νx,y (Sk ) k=0 vale indipendentemente dall’ordinamento della serie e quindi, per un noto teorema, la serie converge assolutamente. Abbiamo provato che νx,y è una misura complessa. Tenendo conto della linearità di Ψ e del prodotto scalare, nonché della definizione di integrale di una funzione semplice, si arriva facilmente a dimostrare che Z s(x) dνx,y = (x|Ψ(s)y) σ(T ) per ogni funzione semplice s ∈ S(σ(T )). Se f ∈ M (σ(T )) e {sn } ⊂ S(σ(T )) converge uniformemente a f (tale successione esiste per (b) di proposizione 7.8), allora, in virtù della continuità di Ψ nella norma || ||∞ e del teorema della convergenza dominata, si ha che, per ogni f ∈ M (σ(T )), vale: Z (x|Ψ(f )y) = f dνx,y . (8.20) σ(T ) ÒT . Di In particolare, questo fatto deve valere per f ∈ C(σ(T )), sul quale spazio Ψ coincide con Φ conseguenza, in virtù del teorema di Riesz sulle misure complesse, la misura νx,y coincide con la misura complessa µx,y introdotta all’inizio della dimostrazione, attraverso la quale abbiamo ÒT come: definito Φ Z ÒT (f )y) = (x|Φ f dµx,y , σ(T ) 245 ÒT (f ) per x, y ∈ H e f ∈ M (σ(T )). Ma allora, essendo νx,y = µx,y , (8.20) implica che Ψ(f ) = Φ per ogni f ∈ M (σ(T )). (b) Bisogna dimostrare solo (iii), (iv), (v) e (iv), dato che gli altri punti sono stati dimostrati nella prova di (a). La proprietà (iii) vale nel caso in cui f ∈ C(σ(T )), come noto da (b) della proposizione 8.4. Allora, Z ÒT (f )Ay) = (x|AΦ ÒT (f )y) = (A∗ x|Φ ÒT (f )y) = f dµx,Ay = (x|Φ σ(T ) Z f dµA∗ x,y , σ(T ) per ogni coppia di vettori x, y ∈ H e per ogni f ∈ C(σ(T )). Il teorema di Riesz sulla rappresentazione delle misure complesse sui Boreliani assicura allora che µA∗ x,y = µx,Ay , e quindi ÒT (f )Ay) = (x|Φ Z Z ÒT (f )y) = (x|AΦ ÒT (f )y) , f dµA∗ x,y = (A∗ x|Φ f dµx,Ay = σ(T ) σ(T ) per ogni coppia di vettori x, y ∈ H e per ogni f ∈ M (σ(T )). Per l’arbitrarietà dei vettori x, y, ÒT (f )A = AΦ ÒT (f ) se f ∈ M (σ(T )) e T A = AT . vale: Φ Passiamo a provare (iv). Se x ∈ H e g ∈ M (σ(T )), tenendo conto che µx,x è reale, si ha: Z ÒT (g)x) = (x|Φ Z ÒT (g)x|x) = (x|Φ ÒT (g)∗ x) . g dµx,x = (Φ g dµx,x = σ(T ) σ(T ) ÒT (g) − Φ ÒT (g)∗ )x) = 0 per ogni x ∈ H. Dall’esercizio (2) di esercizi 3.2 segue che Quindi (x|(Φ ∗ Ò Ò ΦT (g) = ΦT (g) . Dimostriamo (v). Sia {fn }n∈N ⊂ M (σ(T )) una successione, limitata (in valore assoluto) da K > 0, che converge a f : σ(T ) → C. Quindi ||f ||∞ ≤ K e f è misurabile, dunque f ∈ M (σ(T )). Fissati x, y ∈ H e usando (iv) di (b), ÒT (fn ) − Φ ÒT (f ))x||2 = ((Φ ÒT (fn ) − Φ ÒT (f ))x|(Φ ÒT (fn ) − Φ ÒT (f ))x) ||(Φ ÒT (fn − f )∗ Φ ÒT (fn − f )x) = (x|Φ ÒT (|f − fn |2 )x) . = (x|(Φ L’ultimo termine si può scrivere come Z σ(T ) |f − fn |2 dµx,x = Z |f − fn |2 hd|µx,x | , σ(T ) dove |µx,x | è la misura positiva (detta variazione totale) associata alla misura reale (con segno) µx,x e h è una funzione misurabile di valore assoluto costante pari a 1 [Rud82]. (In realtà, come abbiamo provato nel punto (a) di questa dimostrazione, µx,x è una misura reale positiva, per cui |µx,x | = µx,x e h = 1.) Dato che è |µx,x |(σ(T )) < +∞, per il teorema della convergenza dominata ÒT (fn ) − Φ ÒT (f ))x||2 → 0 |h||f − fn |2 converge a 0 in L1 (σ(T ), |µx,x |). Quindi, se n → +∞, ||(Φ per ogni scelta di x ∈ H. Per finire dimostriamo (vi). Se M (σ(T )) 3 f ≥ 0, allora f = g 2 con 0 ≤ g ∈ M (σ(T )). Pertanto, ÒT (f ) = Φ ÒT (g · g) = Φ ÒT (g)Φ ÒT (g). Inoltre Φ ÒT (g)∗ = Φ ÒT (g) = Φ ÒT (g) (per (iv)), per cui: per (a), Φ ∗ Ò Ò Ò ΦT (g · g) = ΦT (g) ΦT (g). Il secondo membro è evidentemente positivo. 2 246 8.3 Misure a valori di proiezione e teorema spettrale per operatori limitati normali. Le misure a valori di proiezione (anche dette misure spettrali, per i motivi che vedremo più avanti) sono lo strumento centrale per enunciare i teoremi spettrali. È chiaro dalla definizione seguente, che, nel caso in cui lo spazio X coincida con R, la misura a valori di proiezione determina una misura a valori di proiezione su R come definita nella definizione 7.7 e, di conseguenza, un’osservabile nel senso stabilito nel capitolo precedente ed in virtù della proposizione 7.8 quando lo spazio di Hilbert viene interpretato come lo spazio di Hilbert di un sistema quantistico. 8.3.1 Misure a valori di proiezione (PVM) dette anche misure spettrali. Introdurremo ora la nozione di misura a valori di proiezione (PVM), che ci servirà per enunciare e provare il teorema spettrale. Nel seguito lavoreremo solo con PVM definite su σ-algebre di Borel B(X) ricavate da spazi topologici X a base numerabile. Tale requisito non è strettamente necessario e quasi tutta la teoria si potrebbe sviluppare lavorando con σ-algebre generiche (vedi per esempio [Rud91]). La nostra scelta è unicamente dettata dalla comodità . In primo luogo, in questo modo, si può definire l’utile nozione di supporto della PVM, inoltre, in tutti i casi pratici che considereremo, l’insieme X e la σ-algebra considerata avranno la proprietà detta ed infine il teorema di decomposizione spettrale viene enunciato su C (o R), che ha topologia a base numerabile, e rispetto alla σ-algebra di Borel. Definizione 8.3. Siano H uno spazio di Hilbert e X uno spazio topologico a base numerabile. Se B(X) denota la σ-algebra di Borel su X, un’applicazione P : B(X) → B(H) è detta misura a valori di proiezione su X (PVM), oppure equivalentemente misura spettrale su X, se soddisfa i seguenti requisiti. (a) P (B) ≥ 0 per ogni B ∈ B(X); (b) P (B)P (B 0 ) = P (B ∩ B 0 ) per ogni coppia B, B 0 ∈ B(X); (c) P (X) = I; (d) per ogni insieme numerabile di boreliani di X, {Bn }n∈N , a due a due disgiunti, vale: s- +∞ X P (Bn ) = P (∪n∈N Bn ) . n=0 L’insieme chiuso definito come il complemento dell’unione degli insiemi aperti A ⊂ X per cui P (A) = 0 è detto supporto della misura a valori di proiezione e si indica con supp(P ). Una misura a valori di proiezione P su X = Rn o Cn è detta limitata se supp(P ) è limitato. Note. (1) Si osservi che gli operatori P (B) sono: (i) idempotenti per (b): infatti P (B)P (B) = P (B ∩ B) = P (B); (ii) autoaggiunti perché limitati e positivi (per (a)). 247 Pertanto essi risultano essere proiettori ortogonali. (2) Si osservi che (c) e (d) da sole implicano che I = P (X ∪ ∅) = I + P (∅), per cui P (∅) = 0 . La (d) e la (a) implicano anche che, se C ⊂ B con B, C ⊂ X sono Boreliani, allora P (C) ≤ P (B). Infatti: B = C ∪ (B \ C) e C ∩ (B \ C) = ∅ per cui, da (d): P (B) = P (C) + P (B \ C). Essendo P (B \ C) ≥ 0, vale P (C) ≤ P (B). (3) Se B ∈ B(X), allora X \ B ∈ B(X) e X = B ∪ (X \ B). Quindi, da (d), prendendo B0 = B, B1 = X \ B e tutti i rimanenti Bk = ∅, abbiamo che: I = P (B) + P (X \ B). In altre parole vale anche I − P (B) = P (X \ B) . (4) Vale la proprietà di subadditività : se B = ∪n∈N Bn con Bn boreliani di X, per ogni x ∈ H, X (x|P (B)x) ≤ (x|P (Bn )x) . n∈N La prova è semplice: si costruisca la successione di boreliani {Cn }n∈N con C0 := B0 , C1 := B1 \ B0 , C2 := B2 \ (B0 ∪ B1 ) e via di seguito. Evidentemente Ck ∩ Ch = ∅ se h 6= k e B = ∪n∈N Cn . Di conseguenza, per (d): P (B) = +∞ X P (Ck ) n=0 e quindi (x|P (B)x) = +∞ X (x|P (Ck )x) . n=0 Dato che Ck ⊂ Bk per ogni k ∈ N, per (2) varrà anche (x|P (Ck )x) ≤ (x|P (Bk )x) e pertanto: (x|P (B)x) ≤ +∞ X (x|P (Bk )x) . n=0 (5) Vale P (supp(P )) = I. Questo fatto è evidentemente equivalente (per (d) ristretto al caso finito) a P (A) = 0, dove A := X \ supp(P ). Per provare che P (A) = 0 notiamo che, per definizione A è unione di aperti con misura spettrale nulla. Dato che X è numerabile di secondo tipo, possiamo estrarre un sotto ricoprimento numerabile dal ricoprimento detto. In altre parole, vale A = ∪n∈N An con P (An ) = 0 per ogni n ∈ N. Usando (4), per ogni x ∈ H: 0 ≤ ||P (A)x||2 = (P (A)x|P (A)x) = (x|P (A)x) ≤ X (x|P (An )x) = 0 . n∈N per cui P (A) = 0. 248 Passiamo ora a costruire una procedura d’integrazione di funzioni misurabili limitate f : X → C rispetto ad una misura a valori di proiezione P : B(X) → B(H). Ricordiamo che, se X è uno spazio dotato di una σ-algebra Σ, una funzione f : X → C, che sia misurabile rispetto a Σ, è detta funzione semplice quando assume solo un numero finito di valori. Notazione 8.2. Se X è uno spazio topologico a base numerabile e B(X) la σ-algebra di Borel su X, S(X) denota lo spazio vettoriale (sul campo C) delle funzioni semplici su X, relative a B(X) ed a valori in C, dotato della norma dell’estremo superiore. Consideriamo una funzione s ∈ S(X). Possiamo sempre scriverla come: s= X ci χEi . i∈I Poiché, per definizione, una funzione semplice assume solo un numero finito di valori distinti, questa espressione è univocamente fissata da s se si richiede che gli insiemi Ei siano misurabili e a due a due disgiunti, e i numeri complessi ci siano tutti distinti (in particolare I è finito). Definiamo l’integrale di s rispetto a P come l’operatore di B(H): Z s(x) dP (x) := X X ci P (Ei ) . (8.21) i∈I Nota. Se non si richiede che i numeri ci nell’espressione di s scritta sopra siano distinti, ci sono molte possibilità nello scrivere s come combinazione lineare di funzioni caratteristiche di insiemi misurabili disgiunti. Tuttavia si prova facilmente, ripetendo la stessa dimostrazione del caso in cui si lavori con una misura ordinaria, che l’integrale di s non dipende dalla rappresentazione di s scelta. L’applicazione I : S(X) 3 s 7→ Z s(x) dP (x) ∈ B(X) , (8.22) X è lineare, ovvero I ∈ L(S(X), B(X)), come è facile dimostrare tenendo conto della nota precedente. Essendo S(X) e B(X) spazi normati, L(S(X), B(X)) è dotato della norma operatoriale. I risulta essere un operatore limitato rispetto a tale norma. Proviamolo. Se x ∈ H e E := supp(P ), allora: 2 2 ||I(s)x|| = (I(s)x|I(s)x) = = X ci P (Ei )x cj P (Ej )x j∈I i∈I X X ci P (Ei ∩ E)x cj P (Ej ∩ E)x . j∈I i∈I X Sopra abbiamo usato il fatto che, essendo P (Ei ) = P (Ei ∩ E) + P (Ei ∩ (X \ E)) = P (Ei ∩ E) + 0 = P (Ei ∩ E) , 249 allora X ci P (Ei ) = i∈I X ci P (Ei ∩ E) . i∈I Definiamo nel seguito: Ei0 := Ei ∩ E. Usando il fatto che P (Ei0 ) = P (Ei0 )∗ , il fatto che P (Ei0 )P (Ej0 ) = P (Ei0 ∩ Ej0 ) e tenendo conto che Ei0 ∩ Ej0 è l’insieme vuoto se i 6= j, otteniamo che: X ||I(s)x||2 = ci cj (x|P (Ei0 ∩ Ej0 )x) = i,j∈I X |ci |2 (x|P (Ei0 )x) ≤ sup |ci |2 i∈I 0 i∈I X (x|P (Ei0 )x) , i∈I 0 dove I 0 ⊂ I è costituito dagli indici per cui Ei0 6= ∅. Valendo Ei0 ⊂ E, segue che X P (EI0 ) ≤ P (∪i∈I 0 Ei0 ) ≤ P (E) = I i∈I 0 e quindi: X (x|P (Ei0 )x) ≤ (x|x) = ||x||2 . i∈I 0 Concludiamo che: ||I(s)x||2 ≤ ||x||2 sup |ci |2 = ||x||2 ||s supp(P ) ||2∞ , i∈I 0 da cui, prendendo l’estremo superiore sui vettori x ∈ H con ||x|| = 1: ||I(s)|| ≤ ||s supp(P ) ||∞ . Tuttavia, dato che ||s supp(P ) ||∞ coincide con uno dei valori finiti assunti da |s|, diciamo |ck |, se scegliamo x ∈ P (Ek0 )(H) (e quindi x = P (Ek0 )x), avremo che I(s)x = X ci P (Ei0 )x = i∈I 0 X ci P (Ei0 )P (Ek0 )x = i∈I 0 X ci P (Ei0 ∩ Ek0 )x = ck x , i∈I 0 avendo usato P (Ei0 ∩ Ek0 ) = 0 se i 6= k. Pertanto, scegliendo x con ||x|| = 1, si ottiene ||I(s)x|| = ||s supp(P ) ||∞ . Concludiamo che I è sicuramente continua, valendo: ||I(s)|| = ||s supp(P ) ||∞ ≤ ||s||∞ (8.23) ed è un’isometria se X = supp(P ): ||I(s)|| = ||s||∞ . (8.24) ||I|| ≤ 1 ; (8.25) Dalla (8.23), segue anche che R in realtà, osservando che X 1 dP (x) = I (come segue dalla definizione prendendo s data dalla funzione costante 1 su tutto X), si ottiene che, anche se X 6= supp(P ), ||I|| = 1 . 250 (8.26) Possiamo passare a definire l’integrale di funzioni Borel-misurabili limitate. È noto che un operatore lineare continuo T : D(T ) → Y, dove Y è uno spazio di Banach e D(T ) un sottospazio denso di uno spazio normato X, ammette un’unica estensione limitata TÒ : X → Y e vale ||TÒ|| = ||T || (vedi gli esercizi svolti (3) e (4) in esercizi 2.1). Mostriamo che ci troviamo proprio in questo caso. Lo spazio di Banach M (X) delle funzioni f : X → C Borel-misurabili e limitate contiene S(X) come sottospazio denso nella norma || ||∞ , per (b) di proposizione 7.7. L’operatore I : S(X) → B(X) è continuo. Di conseguenza esiste ed è unico un operatore limitato da M (X) in B(X) che estende I. Se X = supp(P ), allora I è un’isometria e tale sarà anche la sua estensione continua, per la continuità della norma. Definizione 8.4. Siano X uno spazio topologico a base numerabile, H uno spazio di Hilbert e P : B(X) → B(H) una misura a valori di proiezione definita sulla σ-algebra di Borel di X. b : M (X) → B(X) dell’operatore I : S(X) → B(X) (vedi (8.21) (a) L’unica estensione limitata I e (8.22)) si chiama operatore integrale rispetto alla misura di proiezione P . (b) Per ogni f ∈ M (X), Z b ) f (x) dP (x) := I(f X è detto integrale di f rispetto alla misura a valori di proiezione P . Per ogni E ⊂ B(X) e per ogni f ∈ M (X) oppure g ∈ M (E), gli integrali Z Z f (x) dP (x) := E e χE (x)f (x) dP (x) X Z Z g(x) dP (x) := g0 (x) dP (x) , E X dove g0 (x) := g(x) se x ∈ E oppure g0 (x) := 0 se x 6∈ E, sono detti, rispettivamente, integrale di f su E e integrale di g su E (rispetto alla misura a valori di proiezione P ). Note. (1) Sia P una PVM sullo spazio X, dove X è un boreliano dello spazio topologico Y: la topologia su X è quindi quella indotta su X da Y, per cui B(X) è costituita dalle restrizioni a X degli insiemi in B(Y). Possiamo estendere P ad una misura spettrale su Y, PY , definendo PY (E) := P (E ∩ X) , per ogni boreliano E in Y. In questo modo risulta che: Z Z f (x) dP (x) = f (x) dPY (x) X e X Z Z g(x) dP (x) = X g(x) dPY (x) X 251 per tutte le funzioni f ∈ M (X) e g ∈ M (Y), nel senso delle ultime due definizioni in (b) di definizione 8.4 rispettivamente. La prova di questo fatto è semplice ed è lasciata per esercizio al lettore. (2) Se P è una misura spettrale su X e supp(P ) 6= X, possiamo restringere P ad una misura spettrale Q su supp(P ) (dotato della topologia indotta da X), definendo Q(E) := P (E) per ogni boreliano E ⊂ supp(P ). Si verifica immediatamente che, nel senso della nota precedente, QX = P . (3) Se P è una misura spettrale su X, per ogni f ∈ M (X) vale: Z Z f (x) dP (x) = f (x) dP (x) . supp(P ) (8.27) X Infatti: Z Z Z f (x) dP (x) := supp(P ) X χsupp(P ) (x)f (x) dP (x) = X Z χsupp(P ) (x) dP (x) f (x) dP (x) , X dove, nell’ultima uguaglianza, abbiamo usato la proprietà (iii) di (a) in teorema 8.5, che verrà dimostrato più avanti, indipendentemente dall’attuale risultato. Ora osserviamo che Z X χsupp(P ) (x) dP (x) = P (supp(P )) = I per la nota (5) dopo definizione 8.3, per cui vale (8.27). Esempi 8.1. (1) Facciamo un esempio concreto affinché la procedura non sembri troppo astratta. In realtà, il seguente esempio, con un’estensione, esaurisce tutti i casi possibili, come vedremo più avanti. Consideriamo uno spazio di Hilbert H = L2 (X, µ), dove X è uno spazio topologico a base numerabile e µ è una misura sulla σ-algebra di Borel di X. Una misura spettrale su H si ottiene definendo, per ogni ψ ∈ L2 (X, µ) e E ∈ B(X): per quasi ogni x ∈ X . (P (E)ψ)(x) := χE (x)ψ(x) , (8.28) Si prova facilmente che l’applicazione B(X) 3 E 7→ P (E) definisce effettivamente una misura R spettrale su L2 (X, µ). Vogliamo ora capire come siano fatti gli operatori X f (x) dP (x) per ogni funzione di M (X). Notiamo che se ψ ∈ L2 (X, µ) e f ∈ M (X), allora f · ψ ∈ L2 (X, µ), dove · indica la moltiplicazione delle due funzioni punto per punto: infatti Z X |f (x)ψ(x)|2 dµ(x) ≤ ||f ||2∞ Z |ψ(x)|2 dµ(x) < +∞ . X In particolare, abbiamo anche provato che, se f ∈ M (X) e ψ ∈ L2 (X, µ), allora: ||f · ψ|| ≤ ||f ||∞ ||ψ|| . 252 Abbiamo pertanto provato un utile risultato. Se {fn }n∈N ⊂ M (X) e fn → f ∈ M (X) nella norma ||||∞ per n → +∞, allora anche fn ·ψ → f ·ψ nella convergenza di L2 (X, µ). R Notiamo inoltre che, se s ∈ S(X), l’operatore X s(x)dP (x) si scrive esplicitamente usando (8.28) e (8.21): risulta subito che, per ogni ψ ∈ L2 (X), vale Z s(y) dP (y)ψ (x) = s(x)ψ(x) . X Pertanto, se {sn } ⊂ S(X) converge uniformemente a f ∈ M (X) (in virtù di (b) di proposizione 7.8, una siffatta successione esiste per ogni f ∈ M (X)), si ha: sn · ψ = Z sn (x) dP (x)ψ → Z X f (x) dP (x)ψ X b di I. Ma quando n → +∞, per la definizione di integrale mediante l’estensione continua I allora, tenuto conto del risultato precedente (con fn := sn ), che implica sn · ψ → f · ψ nel senso di L2 (X) per n → +∞, otteniamo immediatamente Z f (y) dP (y)ψ (x) = f (x)ψ(x) per quasi ogni x ∈ X, (8.29) X per ogni f ∈ M (X) ed ogni ψ ∈ L2 (X, µ). (2) Come secondo esempio, consideriamo una base Hilbertiana N in uno spazio di Hilbert H separabile. Possiamo mettere su N la topologia discreta data dall’insieme delle parti di N . In tale topologia gli insiemi contenenti singoli punti sono aperti, la σ-algebra di Borel associata a tale topologia coincide con la stessa topologia e coincide quindi con l’insieme delle parti di N . Si osservi che N è numerabile di secondo tipo essendo H separabile. Se E ⊂ N è un boreliano, consideriamo il sottospazio chiuso HE := < {z}z∈E >. Il proiettore ortogonale che proietta su tale spazio è (cfr. (d) in proposizione 3.9): PE := s- X (z| )z , z∈E essendo E base hilbertiana di HE . Si verifica subito che P : B(N ) 3 E 7→ PE è effettivamente una misura a valori di proiezione. Infine si può dimostrare che, se f : N → C è una funzione limitata, vale: Z X f (z) dP (z) = sN f (z) (z| ) z . (8.30) z∈N La prova di ciò si può ottenere dall’esempio (1), usando il fatto che (teorema 3.6) H è isomorfo come spazio di Hilbert, sotto l’isometria suriettiva U : H → L2 (N, µ) che associa a x ∈ H la funzione z 7→ ψx (z) := (z|x), allo spazio L2 (N, µ), dove µ è la misura che conta i punti di N . Si 253 verifica subito che effettivamente QE := U PE U −1 è l’operatore moltiplicativo in L2 (N, µ), che moltiplica per la funzione caratteristica di E: in tal modo si ottiene (come è possibile verificare) una misura spettrale Q : B(N ) 3 E 7→ QE del tipo di quelle introdotte nell’esempio (1). Usando la definizione di integrale di una funzione f ∈ M (X) tramite l’integrale di funzioni semplici, per le quali vale evidentemente Z s(z) dQ(z) = N X ci Q(Ei ) = U i si ricava X ci P (Ei )U −1 = U Z i Z s(z) dP (z)U −1 , N Z f (z) dP (z)U −1 , f (z) dQ(z) = U N (8.31) N per la continuità della composizione di operatori in B(H). La (8.29) implica che Z f (z) dQ(z)ψ = f · ψ . (8.32) N Usando (8.31) e (8.32), si ha che: Z f (z) dP (z)φ = U −1 f · U φ = N X f (z) (z|φ) z , z∈N dove abbiamo ricordato la definizione di U (cfr. teorema 3.6) U : H 3 φ 7→ {(z|φ)}z∈N ∈ L2 (N, µ) e la sua inversa U −1 : L2 (N, µ) 3 {αz }z∈N 7→ X αz z ∈ H . z∈N In definitiva, abbiamo provato che: Z X f (z) dP (z) = sN f (z) (z| ) z . z∈N (3) Come terzo esempio, presentiamo una generalizzazione dell’esempio (2). Consideriamo un insieme X sul quale mettiamo una topologia a base numerabile per cui ogni insieme {x}, con x ∈ X, appartiene alla σ-algebra di Borel B(X) associata alla topologia. Per esempio, ciò accade se X è numerabile e si dota X della topologia discreta, ma si possono fare altri esempi ovvi: se è X = R dotato della topologia standard, oppure se è X := {0} ∪ {±1/n | n = 1, 2, . . .} ⊂ R e si dota X della topologia indotta da quella di R. Definiamo una classe di proiettori ortogonali, Pλ : H → H, sullo spazio di Hilbert H, per ogni λ ∈ X. Per avere una PVM richiediamo che valgano i seguenti fatti: (a) Pλ Pµ = 0 per λ, µ ∈ X con λ 6= µ; P (b) λ∈X ||Pλ ψ||2 < +∞ , per ogni ψ ∈ H; 254 (c) λ∈X Pλ ψ = ψ , per ogni ψ ∈ H. Dalla richiesta (b) segue che solo una quantità al più numerabile (cfr. proposizione 3.2) di elementi Pλ ψ sono non nulli, anche nel caso in cui X sia non numerabile; allora, tenendo anche conto del fatto che, per (a), i vettori Pλ ψ e Pµ ψ sono ortogonali se λ 6= µ, per il lemma 3.1 la somma in (c) è ben definita e può essere riordinata arbitrariamente. Il fatto che le richieste (a), (b) e (c) sono compatibili si verifica esibendo una classe di proiettori ortogonali che le soddisfano contemporaneamente. Il caso più semplice è fornito dalla classe dei proiettori P ({z}), z ∈ N , dell’esempio (2) nel caso in cui X è una base hilbertiana. Un ulteriore esempio, in cui X non è una base hilbertiana, sarà presentato in (2) di esempi 8.2. Un caso in cui le condizioni (a), (b) e (c) sono verificate si ha considerando un operatore autoaggiunto compatto T , definendo X = σp (T ) ed infine definendo Pλ con λ ∈ σp (T ) come il proiettore ortogonale sull’autospazio con autovalore λ. La topologia su X sarà quella indotta da R. Dai teoremi 4.2 e 4.3 segue facilmente che le condizioni (a), (b) e (c) sono verificate. Riscriveremo le due ultime richieste in forma sintetica come: P s- X Pλ = I . (8.33) λ∈X Con le condizioni poste, si verifica facilmente che P : B(X) → B(H), definita in modo tale che, per ogni E ⊂ B(X), valga X PE = sPλ , (8.34) λ∈E P è una misura a valori di proiezione su H. La somma λ∈E Pλ ψ esiste sempre in H, per ogni ψ ∈ H, e non dipende dall’ordinamento: ciò segue subito dalla condizione (b), tenendo conto di lemma 3.1. Vogliamo ora dimostrare che, per ogni f ∈ M (X): Z f (x) dP (x) = sX X f (x)Px . (8.35) x∈X Si osservi che il secondo membro è ben definito e può essere riordinato a piacimento, per il lemma 3.1, essendo, per ogni ψ ∈ H: X ||f (x)Px ψ||2 ≤ ||f ||2∞ x∈X X ||Px ψ||2 = ||f ||2∞ x∈X = X (ψ|Px ψ) = ||f ||2∞ x∈X (Px ψ|Px ψ) = ||f ||2∞ x∈X ||f ||2∞ X X (ψ|Px2 ψ) x∈X X ψ Px ψ x∈X = ||f ||2∞ (ψ|ψ) = ||f ||2∞ ||ψ||2 , dove la penultima uguaglianza vale per (8.33). Se s ∈ S(X) è una funzione semplice, applicando la definizione di integrale di funzione semplice e (8.34), segue subito che, per ogni ψ ∈ H: Z s(x) dP (x)ψ = X X ci P (Ei )ψ = X X i i x∈Ei 255 s(x)Px ψ = X x∈X s(x)Px ψ , (8.36) dove, nella seconda uguaglianza, abbiamo sfruttato il fatto che dall’espressione di s(x) = si ha ci = s(x) per ogni x ∈ Ei . Se {sn } ⊂ S(X) e sn → f ∈ M (X) uniformememente, allora, per ogni ψ ∈ H: Z f (x) dP (x)ψ − Z X P sn (x) dP (x)ψ → 0 , i ci χEi (8.37) X per n → +∞, per la definizione di integrale di funzioni misurabili limitate. D’altra parte, per (8.36) e usando la (a), si ottiene 2 X Z X = f (x) P ψ − s (x) dP (x)ψ |f (x) − sn (x)|2 ||Px ψ||2 ≤ ||f − sn ||2∞ ||ψ||2 . x n x∈X X x∈X L’ultimo membro tende a zero se n → +∞. Per (8.37) e per l’unicità del limite in H, deve allora valere che, per ogni ψ ∈ H: X Z f (x) Px ψ = x∈X f (x) dP (x)ψ , X pertanto vale (8.35). 8.3.2 Proprietà degli operatori ottenuti integrando funzioni limitate rispetto a PVM. Valgono le seguenti prime proprietà dell’operatore integrale. Teorema 8.4. Siano X uno spazio topologico a base numerabile, (H, ( | )) uno spazio di Hilbert e P : B(X) → B(H) una misura a valori di proiezione definita sulla σ-algebra di Borel di X. (a) Per ogni f ∈ M (X), Z f (x) dP (x) = ||f supp(P ) ||∞ ≤ ||f ||∞ . X (b) L’operatore integrale rispetto alla misura di proiezione P è positivo, nel senso che: Z f (x) dP (x) ≥ 0 se vale 0 ≤ f ∈ M (X) . X (c) Per ogni coppia ψ, φ ∈ H, si consideri l’applicazione Z µψ,φ : B(X) 3 E 7→ ψ χE dP (x)φ . X Valgono le proprietà seguenti di µψ,φ : (i) µψ,φ è una misura complessa su X, 256 (8.38) (ii) se ψ = φ, µψ := µψ,ψ è una misura positiva finita su X, detta misura spettrale associata a ψ, (iii) µψ,φ (X) = (ψ|φ) (e, in particolare, µψ (X) = ||ψ||2 ), (iv) per ogni funzione f ∈ M (X) vale: Z Z ψ f (x) dP (x)φ = f (x) dµψ,φ (x) , (8.39) X X (v) vale supp(µψ,φ ) ⊂ supp(P ). b soddisfa (8.38) quando ristretto allo spazio denso in M (X) Prova. (a) L’operatore continuo I b e delle norme, (8.38) rimarrà delle funzioni semplici (cfr. (8.22) e (8.23)); per la continuità di I valida anche su M (X). (b) Usando (c) della proposizione 7.8, se 0 ≤ f ∈ M (X), esiste una successione di funzioni semplici {sn }n∈N , con 0 ≤ sn ≤ sn+1 ≤ f per ogni n, che converge uniformemente a f . Di conseguenza, tenendo conto della definizione dell’integrale rispetto a P e del fatto che la convergenza R R uniforme implica quella debole, otteniamo che (ψ| s dP ψ) → (ψ| f X n X dP ψ) perR n → +∞ per R ogni ψ ∈ H. Per avere la positività di X f dP è allora sufficiente provare che (ψ| X sn dP ψ) ≥ 0 per ogni n. Direttamente da (8.21) troviamo che: Z X (n) (n) ψ sn dP ψ = ci ψ P (Ei ) ψ ≥ 0 , X i∈In (n) dato che ogni proiettore ortogonale è un operatore positivo ed i numeri ci sono non negativi, essendo sn ≥ 0. (c) Notiamo che, per (8.21), si ha: Z µψ,φ (E) = ψ χE (x) dP (x)φ = (ψ|1 · P (E)φ) = (ψ|P (E)φ) , (8.40) X ed è (ψ|P (E)ψ) ≥ 0. Allora, la proprietà definitoria (d) della misura a valori di proiezione data in definizione 8.3, unitamente alla continuità del prodotto scalare, implicano che µψ,φ è una misura complessa sulla σ-algebra di Borel B(X); inoltre, la stessa (d) unitamente alla (a) di definizione 8.3 implicano che, se ψ = φ, µψ è una misura positiva finita sulla σ-algebra di Borel B(X). Infine la (c) di definizione 8.3 comporta che µψ,φ (X) = (ψ|φ), e in particolare µψ (X) = (ψ|ψ) = ||ψ||2 . Dato che µψ e |µψ,φ | sono misure finite, l’integrale associato ad esse è continuo nella norma || ||∞ su M (X). (Infatti, per ogni f ∈ M (X), vale Z Z f (x) dµψ,φ (x) ≤ |f (x)| d|µψ,φ (x)| ≤ ||f ||∞ |µψ,φ |(X) , X X da cui segue la continuità dell’integrale nella norma dell’estremo superiore.) Se sn ∈ S(X), usando (8.40) e (8.21) si prova immediatamente che vale Z Z ψ sn (x) dP (x)φ = sn (x) dµψ,φ (x) . X X 257 Se ora f ∈ M (X) e {sn }n∈N ⊂ S(X) converge a f per n → +∞ in senso uniforme (cfr. (b) proposizione 7.8), usando la continuità del prodotto scalare e la continuità dell’integrale associato a µψ,φ rispetto alla convergenza uniforme, si ha subito che: Z Z Z ψ f (x) dP (x)φ = ψ lim sn (x) dP (x)φ = lim ψ sn (x) dP (x)φ = n→+∞ X ZX lim n→+∞ X n→+∞ X Z sn (x) dµψ,φ (x) = f (x) dµψ,φ (x) . X Proviamo la (v). La tesi equivale a dire che X \ supp(µψ,φ ) ⊃ X \ supp(P ). Sia x ∈ X \ supp(P ): allora esiste un aperto A ⊂ X tale che x ∈ A e P (A) = 0. Di conseguenza: Z Z µψ,φ (A) = χA (x) dP (x) = ψ χA (x) dP (x)φ = (ψ|P (A)φ) = 0 , X X per cui x ∈ X \ supp(µψ,φ ). Questo completa la dimostrazione del teorema. 2 Osservazione. Bisogna notare che se vogliamo che le misure positive µψ definite sulla σ-algebra di Borel di X, siano misure di Borel propriamente dette, bisogna anche richiedere che lo spazio X sia di Hausdorff e localmente compatto, per definizione di misura di Borel ([Rud82] e vedi l’Appendice). Nei casi concreti, per esempio lavorando con PVM che definiscono lo sviluppo spettrale di operatori, X è sempre (un sottoinsieme di) R o R2 e pertanto queste ipotesi sono soddisfatte. Il seguente teorema stabilisce la più importante proprietà delle misure a valori di proiezione: il fatto che diano luogo a ∗-omomorfismi di C ∗ -algebre. Tale ingrediente sarà essenziale nel provare il teorema spettrale che dimostreremo subito dopo. Teorema 8.5. Siano H uno spazio di Hilbert, X uno spazio topologico a base numerabile e P : B(X) → B(H) una misura a valori di proiezione. Valgono i fatti seguenti. b è uno ∗-omomorfismo, isometrico se vale X = supp(P ), dalla C ∗ (a) L’operatore integrale I algebra con unità M (X) alla C ∗ -algebra con unità B(H). In altre parole, oltre a valere (8.38), valgono anche: (i) se 1 denota la funzione costante con valore unitario su X, Z 1 dP (x) = I , X (ii) per ogni coppia f, g ∈ M (X) e per ogni α, β ∈ C, Z Z (αf (x) + βg(x)) dP (x) = α X Z f (x)dP (x) + β X g(x)dP (x) , X (iii) per ogni coppia f, g ∈ M (X), Z Z f (x) dP (x) X Z g(x) dP (x) = X f (x)g(x) dP (x) , X 258 (iv) per ogni f ∈ M (X), Z Z ∗ f (x)dP (x) . f (x) dP (x) = X X (b) Se ψ ∈ H e f ∈ M (X), allora vale: Z 2 Z f (x) dP (x)ψ = |f (x)|2 dµψ (x) . X X (c) Se {fn }n∈N ⊂ M (X) è limitata e converge puntualmente a f : X → C, allora esiste l’integrale di f rispetto alla misura spettrale P e vale Z Z f (x) dP (x) = s- lim n→+∞ X X fn (x) dP (x) . (d) Se X = R2 , dotato della topologia euclidea standard, e se supp(P ) è compatto, allora, pensando σ(T ) come sottoinsieme di R2 , si ha supp(P ) = σ(T ) , dove Z T := z dP (x, y) , supp(P ) essendo z la funzione R2 3 (x, y) 7→ z := x + iy. Note. (1) La proprietà (iii) di (a) implica, in particolare, la seguente proprietà di commutazione di operatori: Z Z Z Z f (x) dP (x) X g(x) dP (x) = X g(x) dP (x) X f (x) dP (x) , X per ogni coppia f, g ∈ M (X). R (2) Da (iv) e da (iii) di (a) segue che, per ogni f ∈ M (X), l’operatore X f (x) dP (x) è normale. Prova del teorema 8.5. (a) Le uniche proprietà non del tutto banali sono (iii) e (iv). Proviamo la prima. Scegliamo due successioni di funzioni semplici {sn } e {tm } che tendono uniformemente a f e g rispettivamente. Per computo diretto si verifica che Z Z sn (x) dP (x) X Z tm (x) dP (x) = X sn (x)tm (x) dP (x) . X Per m fissato, essendo tm limitata, sn · tm tende uniformemente a f · tm per n → +∞. Tenendo conto della continuità (nel senso di (a) di teorema 8.4) e della linearità dell’integrale come funzione della funzione integranda e prendendo il limite per n → +∞ nell’identità di sopra, si ottiene: Z Z Z f (x) dP (x) tm (x) dP (x) = f (x)tm (x) dP (x) , X X X 259 dove si è tenuto conto del fatto che la composizione di operatori limitati è continua nei due argomenti. Con la stessa procedura, tenendo conto che f · tm tende uniformemente a f · g se m → +∞, si ottiene (iii). La proprietà (iv) si verifica scegliendo una successione di funzioni semplici {sn } che tendono uniformemente a f . Per ψ, φ ∈ H, direttamente dalla definizione di integrale di una funzione semplice (tenendo conto che i proiettori ortogonali sono autoaggiunti), si verifica che: Z Z sn (x) dP (x)ψ φ = ψ sn (x) dP (x)φ . X X Si osservi che sn → f uniformemente per n → +∞. Quindi, usando la continuità e la linearità dell’integrale come funzione della funzione integranda (nel senso di (a) di teorema 8.4), tenendo conto della continuità del prodotto scalare, e prendendo il limite per n → +∞ dell’identità di sopra, si ottiene: Z Z X e quindi: Z f (x) dP (x)ψ φ = ψ f (x) dP (x) − Z X X f (x) dP (x)φ X ∗ f (x) dP (x) ψ φ = 0 . Dato che ψ, φ ∈ H sono arbitrari, si conclude che deve valere (iv). (b) Se ψ ∈ H, usando (iii) e (iv) di (a), si ha subito che vale: Z 2 Z Z f (x) dP (x)ψ = ψ |f (x)|2 dP (x)ψ = |f (x)|2 dµψ (x) , X X X dove, nell’ultima uguaglianza, abbiamo tenuto conto di (c) in teorema 8.4. (c) Per prima cosa notiamo che f ∈ M (X), dato che è una funzione misurabile, essendo limite di funzioni misurabili, ed è limitata dalla stessa costante che limita la successione delle fn . Se ψ ∈ H, la linearità dell’integrale e (b) implicano immediatamente che: Z Z 2 Z f (x) dP (x) ψ = |f (x) − fn (x)|2 dµψ (x) . f (x) dP (x) − n X X X La misura µψ è finita, per cui le funzioni costanti sono integrabili. Per ipotesi, |fn | < K < +∞ per ogni n ∈ N, quindi |f | ≤ K e pertanto |fn −f |2 ≤ (|fn |+|f |)2 < 4K 2 . Dato che |fn −f |2 → 0 puntualmente, possiamo applicare il teorema della convergenza dominata, ottenendo che, per n → +∞, Z ÊZ Z f (x) dP (x)ψ − X X fn (x) dP (x)ψ = |f (x) − fn (x)|2 dµψ (x) → 0 . X Data l’arbitrarietà di ψ ∈ H, questo risultato prova (c). (d) Se supp(P ) è compatto, l’applicazione R2 3 (x, y) 7→ zχsupp(P ) (x, y) ∈ C è limitata, per R R cui T := supp(P ) z dP (x, y) = R2 zχsupp(P ) (x, y) dP (x, y) è un operatore normale (cfr. nota (2) dopo teorema 8.5) di B(H) e quindi, in particolare, il suo spettro residuo è vuoto per (c) di 260 proposizione 8.3. Per definizione di insieme risolvente, la tesi è equivalente all’affermazione: C 3 λ 6∈ supp(P ) se e solo se λ ∈ ρ(T ). Proviamo che λ 6∈ supp(P ) implica λ ∈ ρ(T ). Tenendo conto che R2 3 (x, y) 7→ z = x + iy è limitata su supp(P ), supponiamo che λ 6∈ supp(P ). In tal caso c’è un aperto di R2 , A 3 (x0 , y0 ) con x0 + iy0 = λ, tale che P (A) = 0. Segue facilmente che (x, y) 7→ (z − λ)−1 è limitata sull’insieme chiuso supp(P ). Allora esiste l’operatore di B(H): Z supp(P ) 1 dP (x, y) . z−λ In virtù di (iii) e (i) di (a), vale: Z supp(P ) 1 dP (x, y) z−λ Z (z − λ) dP (x, y) = Z supp(P ) Z supp(P ) Z = (z − λ) dP (x, y) supp(P ) 1 dP (x, y) z−λ Z 1 dP (x, y) = 1 dP (x, y) = I , R2 supp(P ) che può essere scritto anche come, tenendo conto di (i) e (ii) di (a): Z supp(P ) 1 dP (x, y)(T − λI) = (T − λI) z−λ Z supp(P ) 1 dP (x, y) = I . z−λ In altre parole, T − λI è una biezione di H su H. Per (a) del teorema 8.1 (tenendo conto che T : H → H è chiuso, essendo limitato), si ha che λ ∈ ρ(T ). Mostriamo ora che λ ∈ ρ(T ) implica che λ 6∈ supp(P ). Per dimostrare questo fatto, proviamo la proposizione equivalente: λ ∈ supp(P ) implica λ ∈ σ(T ) = σp (T ) ∪ σc (T ). Se λ ∈ supp(P ), può accadere che T − λI : H → H non sia iniettivo: in tal caso λ ∈ σp (T ) e la dimostrazione finisce. Supponiamo invece che T − λI : H → H sia iniettivo e mostriamo che l’operatore inverso (T − λI)−1 : Ran(T − λI) → H non può essere limitato, per cui λ ∈ σc (T ). Per provare questo fatto, è sufficiente mostrare che, se λ ∈ supp(P ), per ogni n = 1, 2, . . . esiste ψn ∈ H, con ψn 6= 0, tale che ||(T − λI)ψn ||/||ψn || ≤ 1/n. (Infatti, nelle nostre ipotesi, vale ψn = (T − λ)−1 φn per ogni n = 1, 2, . . ., con φn 6= 0 per avere ψn 6= 0. Allora si ha: 1/n ≥ ||(T − λI)ψn ||/||ψn || = ||(T − λI)(T − λI)−1 φn ||/||(T − λI)−1 φn || . In altre parole, per ogni n = 1, 2, . . ., esiste φn ∈ H, con φn 6= 0, tale che: ||(T − λI)−1 φn || ≥n. ||φn || Allora (T − λI)−1 non può essere limitato e quindi λ ∈ σc (T ).) Se λ ∈ supp(P ), ogni aperto A 3 λ deve soddisfare P (A) 6= 0. Posto x0 + iy0 := λ, consideriamo 261 la classe di dischi aperti Dn ⊂ R2 , centrati in (x0 , y0 ) e di raggio 1/n, con n = 1, 2, . . .. Dato che P (Dn ) 6= 0, esisterà ψn 6= 0 tale che ψn ∈ P (Dn )(H). In tal caso, si ha: (T − λI)ψn = Z (z − λ) dP (x, y)ψn = Z supp(P ) (z − λ) dP (x, y) Z supp(P ) supp(P ) χDn (z) dP (x, y)ψn , R dove abbiamo tenuto conto di P (Dn ) = R2 χDn (z) dP (x, y) e di P (Dn )ψn = ψn . Usando (iii) di (a) del presente teorema, troviamo allora (T − λI)ψn = Z R2 χDn (z)(z − λ)dP (x, y) . Quindi, dalla proprietà (b), otteniamo: 2 ||(T − λI)ψn || = Z R2 2 2 |χDn (z)| |z − λ| dµψn (x, y) ≤ = n−2 Z R2 Z R2 1 · n−2 dµψn (x, y) 1 dµψn (x, y) = n−2 ||ψn ||2 , dove, nell’ultima uguaglianza, abbiamo usato il fatto che µψn (R2 ) = ||ψn ||2 per la (iii) di (c) in teorema 8.4. Estraendo le radici quadrate ad ambo i membri, si ha infine: ||(T − λI)ψn || ≤ 1/n . ||ψn || Questo conclude la dimostrazione. 2 8.3.3 Teorema di decomposizione spettrale per operatori limitati normali. Possiamo ora enunciare e provare il teorema di decomposizione spettrale per operatori in B(H) normali. Il teorema è valido, in particolare, per operatori limitati autoaggiunti e per operatori unitari, che sono sottocasi di operatori limitati normali. Teorema 8.6 (Teorema di decomposizione spettrale per operatori in B(H) normali). Siano H spazio di Hilbert e T ∈ B(H) operatore normale. Valgono i fatti seguenti. (a) Esiste, è unica e limitata una misura a valori di proiezione P (T ) su R2 (dotato della topologia standard) tale che: Z z dP (T ) (x, y) , T = (8.41) supp(P (T ) ) dove z è la funzione R2 3 (x, y) 7→ z := x + iy ∈ C. (a)’ Se T è autoaggiunto oppure unitario, l’enunciato (a) si può precisare ulteriormente sostip 2 1 2 2 tuendo R , rispettivamente, con R oppure con S := {(x, y) ∈ R | x + y 2 = 1}. (b) Vale: supp(P (T ) ) = σ(T ) . 262 In particolare, per λ = x + iy ∈ C (rispettivamente λ = x ∈ R, oppure λ = x + iy ∈ S1 ) valgono i seguenti fatti: (i) λ ∈ σp (T ) se e solo se P (T ) ({(x, y)}) 6= 0; (ii) λ ∈ σc (T ) se e solo se P (T ) ({(x, y)}) = 0 (rispettivamente, P (T ) ({x}) = 0 oppure (T P ) ({(x, y)}) = 0) e, per ogni aperto Aλ ⊂ R2 (rispettivamente, R oppure S1 ) con Aλ 3 (x, y), è P (T ) (Aλ ) 6= 0; (iii) se λ ∈ σ(T ) è un punto isolato, allora λ ∈ σp (T ); (iv) se λ ∈ σc (T ), allora, per ogni > 0, esiste φ ∈ H con ||φ || = 1 e 0 < ||T φ − λφ || ≤ . (c) Se f ∈ M (σ(T )), l’operatore supp(P (T ) ) f (x, y) dP (T ) (x, y) commuta con tutti gli operatori di B(H) che commutano con T e T ∗ . R Nota. La proprietà (iv) di (b) afferma in pratica che, se λ ∈ σc (T ), benché non esistano autovettori di T con tale autovalore (dato che lo spettro continuo e quello discreto sono disgiunti), possiamo costruire dei vettori che risolvono l’equazione degli autovalori con approssimazione migliorabile a piacimento. Prova del teorema 8.6. (a), (a)’ e (c). Unicità. Dimostriamo prima di tutto l’unicità della misura spettrale. Prima di tutto si noti che se una misura spettrale P soddisfa (8.41) deve avere supporto limitato, dato che la funzione z non è limitata su insiemi non limitati, e noi abbiamo definito l’integrazione di funzioni misurabili limitate. Siano dunque P e P 0 misure a valori di proiezione con supporto limitato (e quindi compatto, essendo supp(P ) chiuso in R2 per definizione) e tali che Z T = Z z dP 0 (x, y) . z dP (x, y) = (8.42) supp(P 0 ) supp(P ) Da tale relazione, usando (i), (ii), (iii) e (iv) di (a) nel teorema 8.5, segue che, per ogni polinomio p = p(z, z), vale: p(T, T ∗ ) = Z Z p(x + iy, x − iy) dP (x, y) = p(x + iy, x − iy) dP 0 (x, y) , supp(P 0 ) supp(P ) dove il polinomio p(T, T ∗ ) è definito nel modo più ovvio, ossia traducendo la moltiplicazione di numeri complessi z := x + iy e z := x − iy in p(z, z) nella composizione di operatori e ponendo T 0 := I e (T ∗ )0 := I. Se u, v ∈ H sono arbitrari, per ogni polinomio complesso p = p(z, z) su R2 , avremo allora che Z Z p(z, z) dµu,v (x, y) = u p(z, z) dP (x, y)v supp(P ) supp(µu,v ) = Z u p(z, z) dP 0 (x, y)v supp(P 0 ) 263 Z = supp(µ0u,v ) p(z, z) dµ0u,v (x, y) . Le due misure complesse µu,v e µ0u,v sono quelle introdotte in (c) del teorema 8.4 (con u e v sostituiti da ψ e φ.) Dato che i polinomi in z, z a coefficienti complessi individuano biunivocamente i polinomi complessi in x, y (tramite la sostituzione z := x + iy e z := x − iy), la classe dei polinomi p(x + iy, x − iy), rispettivamente ristretti ai compatti supp(µu,v ) e supp(µ0u,v ) (cfr (v) di (c) in teorema 8.4), è densa, nella norma dell’estremo superiore, negli spazi C(supp(µu,v )) e C(supp(µ0u,v )) rispettivamente, per il teorema di Stone-Weierstrass. Dato che gli integrali rispetto a misure complesse sono funzionali continui nella norma dell’estremo superiore, concludiamo che, per ogni funzione continua f = f (x, y), vale Z Z f (x, y) dµu,v (x, y) = supp(µ0u,v ) supp(µu,v ) f (x, y) dµ0u,v (x, y) . Quindi, se K è un compatto che include i supporti di entrambe le misure, possiamo estendere in modo ovvio le due misure su K senza alterarne il supporto (definendo la misura di un boreliano E di K come µu,v (E ∩ supp(µu,v )) e la stessa cosa per la misura rispetto a µ0u,v ); allora deve valere Z Z f (x, y) dµu,v (x, y) = f (x, y) dµ0u,v (x, y) . K K Il teorema di Riesz per le misure complesse assicura che le due misure estese a K devono coincidere. Di conseguenza, le misure non ancora estese a K devono avere lo stesso supporto e coincidere. Quindi, usando (iv) in (c) del teorema 8.4, abbiamo che, per ogni coppia di vettori u, v ∈ H e per ogni funzione misurabile g limitata su R2 , vale Z Z 0 u g(x, y) dP (x, y)v = u g(x, y) dP (x, y)v , supp(P 0 ) supp(P ) ossia Z u g(x, y) dP (x, y)v R2 Z = u g(x, y) dP 0 (x, y)v , R2 e quindi Z Z g(x, y) dP (x, y) = R2 g(x, y) dP 0 (x, y) , R2 per l’arbitrarietà di u e v. Se E è un arbitrario boreliano di R2 e si sceglie g = χE , l’identità di sopra implica infine che Z P (E) = R2 Z χE (x, y) dP (x, y) = R2 χE (x, y) dP 0 (x, y) = P 0 (E) . Questo prova che P = P 0 . Inoltre osserviamo che, in virtù di (8.42) e di (d) in teorema 8.5, si ha supp(P (T ) ) = σ(T ). L’unicità per i casi presentati in (a)’ è conseguenza di quanto appena provato, del fatto che supp(P (T ) ) = σ(T ) e di (a) (i) e (b) (i) in proposizione 8.3. Esistenza. Passiamo a provare l’esistenza della misura spettrale P (T ) . Divideremo la dimostrazione in due casi: il caso in cui T è autoaggiunto, ed il caso in cui T non lo è. 264 ÒT associato a T come nel teorema 8.3. Caso di T autoaggiunto. Si consideri lo ∗ -omomorfismo Φ 0 ÒT (χE 0 ). È chiaro Se E è un boreliano di R, definiamo E := E ∩ σ(T ) e quindi: P (T ) (E) := Φ (T ) Ò che P (E) è idempotente, essendo ΦT un omomorfismo e valendo χE 0 · χE 0 = χE 0 . Inoltre, la proprietà (vi) di (b) in teorema 8.3 ed il fatto che le funzioni caratteristiche sono positive implicano che P (T ) (E) ≥ 0 e quindi P (T ) (E) è anche autoaggiunto. In definitiva ogni P (T ) (E) è un proiettore ortogonale. Si verifica immediatamente che B(R) 3 E 7→ P (T ) (E) è una misura a valori di proiezione: P (T ) (E) ≥ 0 come provato sopra; (b) di definizione 8.3 segue dal fatto ÒT è omomorfismo; la proprietà (c) di definizione 8.3 che χE 0 · χF 0 = χE 0 ∩F 0 e dal fatto che Φ ÒT (χ segue immediatamente da Φ σ(T ) ) = I, valida per definizione di omomorfismo di algebre con unità (cfr. (a) del teorema 8.3); infine, la proprietà (d) della definizione 8.3 segue da (v) di P 0 0 = χ∪ (b) in teorema 8.3, tenendo conto del fatto che, puntualmente, limN →+∞ N n=0 χEn n∈N En 0 (T ) quando gli insiemi En sono disgiunti a due a due. Osserviamo che, per costruzione, supp(P ) è limitato in quanto supp(P (T ) ) ⊂ σ(T ), il secondo dei quali è compatto per (c) del teorema 8.1. Per proseguire con la dimostrazione, notiamo che, da quanto appena provato, tenendo conto della ÒT , segue immediatamente linearità dell’operatore integrale associato a P (T ) e della linearità di Φ che: Z ÒT (s Φ ) = s(x) dP (T ) (x) , σ(T ) supp(P (T ) ) per ogni funzione semplice s : R → C. Dato che entrambi i funzionali sono continui rispetto alla topologia dell’estremo superiore ((ii) in (b) di teorema 8.3 e (a) di teorema 8.4), applicando la proposizione 7.8 si ha che ÒT (f Φ σ(T ) ) = Z f (x) dP (T ) (x) , (8.43) supp(P (T ) ) per ogni funzione f : R → C misurabile e limitata. In particolare, quindi, per (i) in (a) del teorema 8.3, Z x dP (T ) (x) . T = supp(P (T ) ) Riguardo alla prova di (c), si osservi che (8.43) mostra anche che A ∈ B(H) commuta con (T ) (x, y) se A commuta con T , perché, sotto le ipotesi dette, A commuta supp(P (T ) ) f (x, y) dP ÒT (f con Φ σ(T ) ) come conseguenza di (iii) in (b) di teorema 8.3. R Caso di T normale non autoaggiunto. Decomponiamo T come in (8.7) mediante gli operatori X, Y ∈ B(H) autoaggiunti e commutanti, definiti in (8.8). Siano P := P (X) e Q := P (Y ) le misure spettrali limitate definite su R, associate rispettivamente a X e Y secondo la prima parte di questa dimostrazione. Si osservi che risulta P (E)Q(F ) = Q(F )P (E) per ogni coppia di boreliani E, F ⊂ R. Infatti, per (8.43), vale: ÒX (χE 0 ) = P (E) = Φ Z χE 0 (x) dP (x) . R Il secondo membro commuta con tutti gli operatori di B(H) che commutano con X (per (iii) di (b) del teorema 8.3), pertanto P (E)Y = Y P (E) per ogni boreliano E ⊂ R. Con lo stesso 265 ragionamento abbiamo allora che i proiettori Q(F ) (F ∈ B(R)) associati a Y , commutando con tutti gli operatori che commutano con Y , dovranno commutare con P (E). In definitiva, tutti gli operatori P (E × F ) := P (E)Q(F ) , con E, F boreliani di R, sono a loro volta proiettori ortogonali. Da (8.8) segue facilmente (ricordando anche che ||T ∗ || = ||T ||) che vale ||X|| ≤ ||T || e ||Y || ≤ ||T ||. Dato che supp(P ) = σ(X), supp(Q) = σ(Y ), per (c) del teorema 8.1 i supporti delle misure P e Q saranno contenuti nel segmento [−||T ||, ||T ||]. Nel seguito K denoterà il compatto di R2 definito come: K := [−||T ||, ||T ||] × [−||T ||, ||T ||] . D’ora in poi, una funzione a gradini su K sarà una funzione g : K → C esprimibile come g(x, y) := X gij χEi ×Fj , (8.44) (i,j)∈L dove L è un insieme finito di indici, Ei , Fj sono boreliani in K (dotato della topologia indotta da R2 ) tali che (Ei ×Fj )∩(Er ×Fs ) = ∅ se (i, j) 6= (r, s) e i numeri gij sono complessi. G(K) indicherà lo spazio vettoriale su C delle funzioni a gradini. Si osservi che tale spazio vettoriale è in realtà una ∗ -algebra con unità, in quanto è chiusa per prodotti (punto per punto) di funzioni a gradini, è chiusa rispetto alla coniugazione complessa e contiene la funzione che vale costantemente 1. È chiaro che G(K) ⊂ M (K). Definiamo l’operatore lineare Ψ0 : G(K) → B(H) come: Ψ0 (g) := X gij P (Ei × Fj ) . (8.45) (i,j)∈L Si verifica facilmente che, se la stessa funzione a gradini g ammette due differenti rappresentazioni del tipo (8.44), il valore di Ψ0 (g) è il medesimo quando valutato sulle due differenti rappresentazioni. Si prova facilmente che Ψ0 : G(K) → B(H) è uno ∗ -omomorfismo di algebre con unità, in quanto per costruzione è lineare, trasforma i prodotti di funzioni a gradini in prodotti di operatori, trasforma la coniugazione complessa nella coniugazione hermitiana ed associa alla funzione costante di valore unitario l’operatore identità. Ancora, mediante lo stesso procedimento con cui si dimostra che l’integrale delle funzioni semplici secondo una misura spettrale è una funzione continua dell’integrando rispetto alla norma || ||∞ (e rispetto alla norma della topologia uniforme in B(H)), si prova che Ψ0 : G(K) → B(H) è continua nella norma || ||∞ (e rispetto alla norma della topologia uniforme in B(H)). In particolare vale ||Ψ0 (g)|| ≤ ||g||∞ . Infine, se A ∈ B(H) commuta con T e T ∗ , allora commuterà con le loro combinazioni lineari e quindi, in particolare, con X e Y . Ma allora, ripetendo la dimostrazione già fatta sopra per la commutatività dei proiettori delle misure spettrali di X e Y , si prova che A commuta con i proiettori ortogonali della misura spettrale di X e con quelli della misura spettrale di Y . Di conseguenza, se A commuta con T e T ∗ , commuterà anche con Ψ0 (g) per ogni funzione a gradini 266 g. Passiamo ad estendere Ψ0 alle funzioni continue. Il cosiddetto “teorema dell’oscillazione limitata” dell’analisi elementare assicura che possiamo approssimare arbitrariamente, nella norma dell’estremo superiore, funzioni reali continue su K con funzioni reali a gradini su K; decomponendo le funzioni complesse in parte reale ed immaginaria, il risultato si generalizza a funzioni a valori complessi. In altre parole, risulta che G(K) è denso in C(K) nella topologia indotta dalla norma dell’estremo superiore. Usando (3) e (4) in esercizi 2.1, possiamo estendere in modo unico Ψ0 : G(K) → B(H) ad uno ∗ -omomorfismo continuo di C ∗ -algebre ΨT : C(K) → B(H) che soddisfa: ||ΨT (f )|| ≤ ||f ||∞ , per ogni f ∈ C(K) . (8.46) e tale che ΨT (f )A = AΨT (f ) per ogni f ∈ C(K) e ogni A ∈ B(H) che commuta con T e T ∗ . Tale ∗ -omomorfismo gode infine delle proprietà: ΨT (x) = X , (8.47) ΨT (y) = Y , (8.48) ΨT (x + iy) = T , (8.49) dove x, y, x + iy indicano le funzioni su K definite rispettivamente come (x, y) 7→ x, (x, y) 7→ y, (x, y) 7→ x + iy. È chiaro che la terza proprietà segue per linearità dalle prime due. La prima identità si prova come segue. Sia {sn }n∈N una successione di funzioni semplici su [−||T ||, ||T ||] che converge uniformemente alla funzione x ristretta a tale intervallo (tale successione esiste per (b) di proposizione 7.8). Possiamo definire la successione di funzioni a gradini su K, {gn }n∈N , come gn (x, y) := sn (x) per ogni n ∈ N. Tale successione tende ovviamente alla funzione (x, y) 7→ x su K nella topologia della norma dell’estremo superiore. Si verifica subito che, per costruzione, vale: Z sn dP (X) (x) = Ψ0 (gn ) . [−||T ||,||T ||] Prendendo il limite per n → +∞ della relazione precedente, il secondo membro tende a ΨT (x) e il primo membro tende a (si tenga conto che supp(P (X) ) = σ(X) ⊂ [−||T ||, ||T ||]) Z x dP [−||T ||,||T ||] (X) Z (x) = x dP (X) (x) = X , supp(P (X) ) per la continuità dell’operatore integrale e per il punto (a), già dimostrato, di questo teorema. Abbiamo provato che vale (8.47). Con una dimostrazione analoga si prova (8.48), e quindi (8.49) segue per linearità. Usando la stessa dimostrazione del teorema 8.3, possiamo infine Ò T : M (K) → univocamente estendere ΨT : C(K) → B(H) ad uno ∗ -omomorfismo di C ∗ -algebre Ψ B(H), che soddisfa (8.49) e gode di tutte le proprietà scritte in (b) del teorema 8.3, rimpiazzando σ(T ) con K e ΦT con ΨT (che, al contrario del primo, in generale non è isometrico) e rafforzando l’ipotesi in (iii) richiedendo che A commuti anche con T ∗ , oltre che con T . A questo punto la dimostrazione procede come nel caso di T autoaggiunto. Definiamo E 0 := Ò T (χE 0 ). È chiaro E ∩ K, dove E ⊂ R2 è un qualsiasi boreliano. Quindi poniamo: P (T ) (E) := Ψ 267 Ò T un omomorfismo e valendo χE 0 · χE 0 = χE 0 . Inoltre, la che P (T ) (E) è idempotente, essendo Ψ Ò T , unitamente al fatto proprietà (vi) di (b) in teorema 8.3, che, come detto sopra, vale anche per Ψ (T ) che le funzioni caratteristiche sono positive, implica che P (E) ≥ 0, e quindi P (T ) (E) è anche autoaggiunto. In definitiva ogni P (T ) (E) è un proiettore ortogonale. Si verifica immediatamente che B(R2 ) 3 E 7→ P (T ) (E) è una misura a valori di proiezione: P (T ) (E) ≥ 0 come provato sopra; Ò T è omomorfismo; (b) di definizione 8.3 segue dal fatto che χE 0 · χF 0 = χE 0 ∩F 0 e dal fatto che Ψ Ò la proprietà (c) di definizione 8.3 segue immediatamente da ΨT (χK ) = 1; infine, la proprietà (d) della definizione 8.3 segue da (v) di (b) in teorema 8.3, che, come detto sopra, vale anche Ò T , tenendo conto del fatto che, puntualmente, limN →+∞ PN χE 0 = χ∪ E 0 quando gli per Ψ n=0 n∈N n n insiemi En0 sono disgiunti a due a due. Osserviamo che, per costruzione, supp(P (T ) ) è limitato, in quanto supp(P (T ) ) ⊂ K, il secondo dei quali è compatto per costruzione. Per proseguire con la dimostrazione, notiamo che, da quanto appena provato, tenendo conto Ò T , segue immediatamente che: della linearità di Ψ Ò T (s K ) = Ψ Z s(x, y) dP (T ) (x, y) , R2 per ogni funzione semplice s : R2 → C. Dato che entrambi i funzionali sono continui rispetto Ò T , e (a) di alla topologia dell’estremo superiore ((ii) in (b) di teorema 8.3, valido anche per Ψ teorema 8.4), applicando la (b) di proposizione 7.8 si ha che Ò T (f K ) = Ψ Z f (x, y) dP (T ) (x, y) , (8.50) R2 per ogni funzione f : R2 → C misurabile e limitata. In particolare, quindi, per (8.49) si ha Z T = (x + iy) dP (T ) (x, y) . supp(P (T ) ) Si osservi che (8.50) mostra anche che A ∈ B(H) commuta con R2 f (x, y) dP (T ) (x, y) se A Ò T (f K ), come detto commuta con T e T ∗ , perché, sotto le nostre ipotesi, A commuta con Ψ sopra. Quindi anche la dimostrazione di (c) è conclusa. (b) Facciamo la dimostrazione per il caso generico in cui T non sia autoaggiunto e nemmeno unitario; la dimostrazione si specializza facilmente a tali casi. Il fatto che supp(P (T ) ) = σ(T ) è immediata conseguenza di (d) del teorema 8.5. Proviamo (i). Scriveremo P in luogo di P (T ) per semplicità notazionale. Sia λ := x0 + iy0 un complesso arbitrario. Tenendo conto di (iii) di (a) in teorema 8.5, vale: R Z Z T P ({(x0 , y0 )}) = σ(T ) (x + iy)χ{(x0 ,y0 )} (x, y) dP (x, y) = σ(T ) (x0 + iy0 )χ{(x0 ,y0 )} (x, y) dP (x, y) Z =λ σ(T ) χ{(x0 ,y0 )} (x, y) dP (x, y) = λP ({(x0 , y0 )}) . In definitiva, T P ({(x0 , y0 )}) = λP ({(x0 , y0 )}) . 268 Concludiamo che, se P ({(x0 , y0 )}) 6= 0, allora λ := x0 + iy0 è autovalore per T , dato che un qualsiasi vettore u 6= 0 appartenente al sottospazio su cui proietta P ({(x0 , y0 )}) è un autovettore con autovalore λ. Supponiamo viceversa che T u = λu con u 6= 0 e λ := x0 + iy0 . Allora (cfr. (b) di (i) in m proposizione 3.8) T ∗ u = λu, T n (T ∗ )m u = λn λ u e, per linearità, p(T, T ∗ )u = Z p(x + iy, x − iy) dP (x, y)u = p(λ, λ)u (8.51) supp(P ) per ogni polinomio p = p(x + iy, x − iy), dove abbiamo usato il fatto che l’integrale definisce uno ∗ -omomorfismo. Ogni polinomio p = p(x + iy, x − iy) è anche un polinomio complesso q = q(x, y) nelle variabili reali x e y, definendo punto per punto q(x, y) := p(x + iy, x − iy) e tale corrispondenza è biunivoca. Dato che con i polinomi q(x, y) possiamo approssimare a piacimento le funzioni continue f (x, y) nella norma dell’estremo superiore, la seconda uguaglianza in (8.51) varrà anche se, al posto del polinomio p(x + iy, x − iy) = q(x, y), si considera una funzione continua f = f (x, y). È facile provare che, se λ = x0 + iy0 , allora χ{(x0 ,y0 )} è il limite puntuale di una successione limitata di funzioni continue fn . In definitiva, usando (c) di teorema 8.4 ed il teorema della convergenza dominata (tenendo conto che µu è finita), vale: Z Z (u|P{(x0 ,y0 )} u) = u χ{(x0 ,y0 )} (x, y)dP (x, y) u = χ{(x0 ,y0 )} (x, y)dµu (x, y) supp(P ) Z = lim n→+∞ supp(P ) supp(P ) Z fn (x, y)dµu (x, y) = lim u n→+∞ f (x, y)dP (x, y) u supp(P ) n = lim (u|fn (x0 , y0 )u) = χ{(x0 ,y0 )} (x0 , y0 )(u|u) . n→+∞ Pertanto, tenendo conto del fatto che i proiettori ortogonali sono idempotenti ed autoaggiunti e che χ{(x0 ,y0 )} (x0 , y0 ) = 1 per definizione, si ha: (P{(x0 ,y0 )} u|P{(x0 ,y0 )} u) = (u|u) 6= 0 . Questo prova che P{(x0 ,y0 )} 6= 0. Passiamo a provare (ii). Dato che σc (T ) ∪ σp (T ) = σ(T ) (per (i) di (c) in proposizione 8.3) e σc (T ) ∩ σp (T ) = ∅ per definizione, deve essere che λ ∈ σc (T ) se e solo se λ ∈ σ(T ) e λ 6∈ σp (T ). Dato che supp(P (T ) ) = σ(T ), l’affermazione che λ ∈ σ(T ), equivale a dire che, per ogni aperto A di R2 che contiene (x0 , y0 ) con x0 + iy0 = λ, deve essere P (A) 6= 0. D’altra parte, per (i), λ 6∈ σp (T ) significa P (T ) ({(x0 , y0 )}) = 0. Proviamo (iii). Se λ = x0 + iy0 ∈ C è un punto isolato di σ(T ), allora, per definizione, c’è un aperto A 3 {(x0 , y0 )} che non interseca la parte rimanente di σ(T ). Se fosse P ({(x0 , y0 )}) = 0 non potrebbe essere λ ∈ supp(P (T ) ), valendo in tal caso P (A) = 0. Di conseguenza deve necessariamente essere P (T ) ({(x0 , y0 )}) 6= 0. Per (i) deve allora valere che λ ∈ σp (T ). La prova di (iv) è stata data nella dimostrazione di (d) del teorema 8.5, in cui abbiamo provato, tra le altre cose, che se λ ∈ σc (T ), allora, per ogni n > 0 naturale, esiste ψn ∈ H con ||ψn || = 6 0 269 e 0 < ||T ψn − λψn ||/||ψn || ≤ 1/n. Per provare (iv) è allora sufficiente definire φn := ψn /||ψn || con n tale che 1 ≤ n per il valore di fissato. 2 Il teorema successivo fornisce una rappresentazione spettrale di ogni operatore normale di B(H), mostrando che, di fatto, ogni operatore normale limitato può essere visto come un operatore moltiplicativo quando lo si rappresenta in un opportuno spazio L2 . Notazione 8.2. Se H è uno spazio di Hilbert e {Hα }α∈A è una famiglia di suoi sottospazi chiusi, scriveremo H = ⊕α∈A Hα se i sottospazi Hα sono a due a due ortogonali e vale H = < {Hα }α∈A >. Nota. In riferimento alla decomposizione ortogonale H = ⊕α∈A Hα nel senso appena definito, lasciamo al lettore la semplice dimostrazione delle seguenti identità. Esse derivano dal fatto che l’unione di basi hilbertiane, scelte in ogni Hα , è una base hilbertiana per H. Per ogni vettore ψ ∈ H vale (nel senso della definizione 3.4) ||ψ||2 = X ||Pα ψ||2 (8.52) α∈A dove Pα è il proiettore ortogonale su Hα , per ogni α ∈ A. Vale anche (tenendo conto del lemma 3.1) X ψ= Pα ψ (8.53) α∈A dove la serie può essere riordinata a piacimento. La somma si intende come una serie o una somma finita dato che solo una quantità al più numerabile di vettori Pα ψ è non nulla ((b) proposizione 3.2). Teorema 8.7 (Teorema di rappresentazione spettrale per operatori in B(H) normali). Siano H spazio di Hilbert e T ∈ B(H) operatore normale. Sia P (T ) la misura spettrale associata a T secondo (a) (o (a)’) del teorema 8.6. (a) È possibile decomporre H come H = ⊕α∈A Hα (con A al più numerabile se H è separabile), dove i sottospazi Hα sono chiusi ed ortogonali a due a due, e valgono le proprietà seguenti: (i) per ogni α ∈ A, valgono T Hα ⊂ Hα e T ∗ Hα ⊂ Hα ; (ii) per ogni α ∈ A esiste una misura di Borel positiva finita µα , su σ(T ) ⊂ R2 ed un operatore isometrico suriettivo Uα : Hα → L2 (σ(T ), µα ), tali che, se f ∈ M (σ(T )), Z (T ) Uα f (x, y)dP (x, y) Hα Uα−1 = f · , σ(T ) in particolare valgono:, Uα T Hα Uα−1 = (x + iy)· , Uα T ∗ Hα Uα−1 = (x − iy)· dove f · è l’operatore moltiplicativo per f su L2 (σ(T ), µα ): per ogni g ∈ L2 (σ(T ), µα ), (f · g)(x, y) = f (x, y)g(x, y) quasi ovunque su σ(T ) ; 270 (ii)’ se T è autoaggiunto oppure unitario, per ogni α ∈ A esiste una misura di Borel positiva finita, sui boreliani di σ(T ) ⊂ R oppure, rispettivamente σ(T ) ⊂ S1 , ed un operatore isometrico suriettivo Uα : Hα → L2 (σ(T ), µα ), tali che, se f ∈ M (σ(T )), Z (T ) Uα f (x)dP (x) Hα Uα−1 = f · , σ(T ) in particolare, Uα T Hα Uα−1 = x· , dove f · è l’operatore moltiplicativo per f su L2 (σ(T ), µα ): per ogni g ∈ L2 (σ(T ), µα ), (f · g)(x) = f (x)g(x) quasi ovunque su σ(T ) . (b) Vale σ(T ) = supp{µα }α∈A , dove supp{µα }α∈A è il complemento dell’insieme dei numeri λ ∈ C (rispettivamente R, S1 ) per cui esiste un aperto Aλ ⊂ C (rispettivamente R, S1 ) tale che Aλ 3 λ e µα (Aλ ) = 0 per ogni α ∈ A. (c) Se H è separabile, esistono uno spazio con misura (MT , µT ), con µT (MT ) < +∞, una funzione limitata FT : MT → C (e rispettivamente R oppure S1 a seconda che T sia autoaggiunto oppure unitario), un operatore unitario UT : H → L2 (MT , µT ) tale che: UT T UT−1 f (m) = FT (m)f (m) , UT T ∗ UT−1 f (m) = FT (m)f (m) per ogni f ∈ H. (8.54) Prova. (a) Dimostriamo (i), (ii) e (iii). La prova per (ii)’ è analoga a quella per (ii). Supponiamo inizialmente che esista un vettore ψ ∈ H tale che il sottospazio vettoriale Hψ R contenente i vettori di H del tipo σ(T ) g(x, y) dP (T ) (x, y)ψ, con g ∈ M (σ(T )) sia denso in H. Se µψ è la misura spettrale associata a ψ, che dunque è una misura finita perché Z supp(P (T ) ) dµψ = ||ψ||2 , deve risultare supp(µψ ) ⊂ supp(P (T ) ) per (iv) di (c) del teorema 8.4. Consideriamo lo spazio di Hilbert L2 (σ(T ), µψ ) e l’operatore lineare suriettivo Vψ : M (σ(T )) 3 g 7→ Z g(x, y) dP (T ) (x, y)ψ ∈ Hψ . σ(T ) Dato che µψ è finita, M (σ(T )) ⊂ L2 (σ(T ), µψ ) come sottospazio. Tenuto conto di ciò risulta che, per ogni coppia f, g ∈ M (σ(T )): Z Z Z (T ) (T ) g1 (x, y)g2 (x, y) dµψ (x, y) = g1 (x, y) dP (x, y)ψ g2 (x, y) dP (x, y)ψ , σ(T ) σ(T ) σ(T ) (8.55) 271 che equivale a scrivere Z g1 (x, y)g2 (x, y) dµψ (x, y) = (Vψ g1 |Vψ g2 ) . (8.56) σ(T ) La dimostrazione di (8.55) si ottiene notando che, se E, E 0 ⊂ σ(T ) sono boreliani, usando (iv) di (c) di teorema 8.4, (iii) di (a) di teorema 8.5 e (iv) di (a) di teorema 8.5, si ha: Z Z Z (T ) χE χE 0 dµψ = χE∩E 0 dµψ = ψ χE∩E 0 dP ψ = σ(T ) σ(T ) Z ψ χ χ 0 dP σ(T ) E E Z = (T ) ψ σ(T ) Z = ψ (T ) Z χ dP χE 0 dP σ(T ) E σ(T ) Z (T ) (T ) χE dP ψ χ 0 dP ψ ; σ(T ) E σ(T ) (T ) ψ per linearità (ed anti-linearità) del prodotto scalare e dell’integrale, se s e t sono funzioni semplici, dovrà ancora valere: Z Z Z (T ) (T ) s dP ψ st dµψ = t dP ψ . σ(T ) σ(T ) σ(T ) Tenendo conto della proposizione 7.8, usando la definizione di integrale di una funzione misurabile limitata secondo una misura spettrale, il teorema della convergenza dominata rispetto alla misura finita µψ ed infine la continuità del prodotto scalare, l’identità appena provata implica (8.55). Abbiamo provato che Vψ è un’isometria suriettiva da M (σ(T )) a Hψ . Si osservi che M (σ(T )) è denso in L2 (σ(T ), µψ ) in quanto, se g ∈ L2 (σ(T ), µψ ), le funzioni gn := χEn · g, con En := {(x, y) ∈ σ(T ) | |g(x, y)| < n} sono in M (σ(T )) e gn → g nel senso di L2 (σ(T ), µψ ), per il teorema della convergenza dominata (essendo |gn − g|2 → 0, per n → +∞, puntualmente e valendo |gn − g|2 ≤ 2|g|2 ∈ L1 (σ(T ), µψ )). Possiamo quindi estendere unicamente Vψ ad un Òψ : L2 (σ(T ), µψ ) → Hψ , il cui inverso sarà indicato con Uψ . operatore isometrico suriettivo V Nelle ipotesi fatte Hψ = H. Se f ∈ M (σ(T )), direttamente da (8.55) e facendo uso di (iii) in (a) di teorema 8.5, abbiamo che: Z g1 (x, y)f (x, y)g2 (x, y) dµψ (x, y) σ(T ) Z = Z = g1 (x, y) dP σ(T ) (T ) Z (T ) (x, y)ψ f (x, y)g2 (x, y) dP (x, y)ψ σ(T ) Z Z (T ) (T ) g1 (x, y) dP (x, y)ψ f (x, y) dP (x, y) g2 (x, y) dP (x, y)ψ σ(T ) σ(T ) σ(T ) Z (T ) = Vψ g1 f (x, y) dP (x, y)Vψ g2 . σ(T ) (T ) 272 Abbiamo quindi provato che, per ogni terna di funzioni g1 , g2 , f ∈ M (σ(T )), vale: Z Z (T ) g1 (x, y)f (x, y)g2 (x, y) dµψ (x, y) = Vψ g1 f (x, y) dP (x, y)Vψ g2 . σ(T ) σ(T ) L’operatore f · : L2 (σ(T ), µψ ) → L2 (σ(T ), µψ ), moltiplicativo per la funzione f ∈ M (σ(T )), è limitato come è facile provare; di conseguenza, tenendo conto che M (σ(T )) è denso in L2 (σ(T ), µψ ), R della definizione di Uψ , del fatto che σ(T ) f (x, y) dP (T ) (x, y) è limitato e, infine, della continutà del prodotto scalare, abbiamo che Z Z −1 −1 (T ) g1 (x, y)f (x, y)g2 (x, y) dµψ (x, y) = Uψ g1 f (x, y) dP (x, y)Uψ g2 , σ(T ) σ(T ) per ogni coppia di funzioni g1 , g2 ∈ L2 (σ(T ), µψ ). In altre parole: Z Uψ σ(T ) f (x, y) dP (T ) (x, y)Uψ−1 = f · . (8.57) Passiamo a considerare il caso in cui non esista alcun vettore ψ con Hψ = H. In tal caso, sia ψ un vettore arbitrario in H. Denotiamo con Hψ lo spazio vettoriale dei vettori R (T ) (x, y)ψ per ogni f ∈ M (σ(T )). Vale T (H ) ⊂ H e T ∗ (H ) ⊂ H , infatti, per ψ ψ ψ ψ σ(T ) f (x, y) dP ogni f ∈ M (σ(T )), si ha ((a) teorema 8.6 e (iii) in (a) di teorema 8.5): Z T f (x, y) dP (T ) σ(T ) Z ψ= (x + iy) dP (T ) Z f (x, y) dP (T ) σ(T ) σ(T ) Z (x + iy)f (x, y) dP (T ) ψ , ψ= σ(T ) per cui T σ(T ) f (x, y) dP (T ) ψ ∈ Hψ dato che la funzione (x, y) 7→ (x + iy)f (x, y) è un elemento di M (σ(T ))). La dimostrazione per T ∗ è analoga, usando il fatto che R ∗ Z T = (x − iy) dP (T ) . σ(T ) Per continuità, vale anche T (Hψ ) ⊂ Hψ e T ∗ (Hψ ) ⊂ Hψ . Definendo Uψ come fatto sopra, vale la (8.57). Mostriamo ora come costruire un altro sottospazio chiuso, Hψ0 ortogonale a Hψ , invariante sotto T e T ∗ e che verifichi la (8.57) per una corrispondente isometria suriettiva Uψ0 : Hψ0 → L2 (σ(T ), µψ0 ). Se ψ 0 ⊥ Hψ allora Z 0 (T ) ψ f (x, y) dP (x, y)ψ = 0 , σ(T ) per ogni f ∈ M (σ(T )). Ma allora, per le proprietà dell’integrale rispetto a misure spettrali ((iii) e (iv) di (a) in teorema 8.5) vale anche, per ogni coppia g, f ∈ M (σ(T )) Z Z Z Z (T ) 0 (T ) 0 (T ) (T ) f dP ψ = ψ g dP g dP ψ f dP ψ σ(T ) σ(T ) σ(T ) 273 σ(T ) = ψ 0 g(x, y)f (x, y) dP (T ) (x, y)ψ = 0 , dove si è tenuto conto che g · f ∈ M (σ(T )) nelle ipotesi fatte. In definitiva, se ψ 0 ⊥ Hψ allora Hψ0 è ortogonale a Hψ e quindi lo stesso fatto vale per le rispettive chiusure per la continuità del prodotto scalare. Lo spazio Hψ0 è invariante sotto T e T ∗ (la dimostrazione è la stessa che per Hψ ) ed è verificata (8.57) per una corrispondente isometria suriettiva Uψ0 : Hψ0 → L2 (σ(T ), µψ0 ) (la prova è quella data all’inizio di questa dimostrazione). In questo modo, scegliendo classi di vettori {ψα } opportunamente, si possono costruire classi di sottospazi chiusi Hα = Hψα , ciascuno dotato di un’isometria suriettiva Uα : Uα : Hα → L2 (σ(T ), µψ0 ), in modo tale che gli spazi (a) siano ortogonali a due a due, (b) siano separatamente invarianti sotto T e T ∗ e (c) verifichino Z Uα σ(T ) f (x, y) dP (T ) (x, y) Hα Uα−1 = f · . (8.58) per ogni f ∈ M (σ(T )). Indichiamo C l’insieme di tali classi di sottospazi. Possiamo mettere in C la relazione d’ordine parziale data dall’inclusione insiemistica. Con tale relazione d’ordine parziale, ogni sottoinsieme ordinato di C è limitato superiormente, per cui, per il Lemma di Zorn, ci deve essere in C un elemento massimale {Hα }α∈A . Il sottospazio banale H0 := {0} (per esso µ0 è la misura nulla – per cui L2 (σ(T ), µ0 ) contiene solo il vettore nullo – e U0 trasforma il vettore nullo di {0} nel vettore nullo di L2 (σ(T ), µ0 )) è contenuto in {Hα }α∈A : se non fosse contenuto {Hα }α∈A ∪ {H0 } maggiorerebbe {Hα }α∈A e si avrebbe un assurdo. Se esiste ψ ∈ H con ψ ⊥ Hα per ogni α ∈ A e ψ 6= 0, potremmo costruire uno spazio Hψ , differente da tutti gli Hα , ma che gode delle proprietà (a), (b) e (c). Allora {Hα }α∈A ∪ {Hψ } maggiorerebbe {Hα }α∈A e si avrebbe un assurdo. Concludiamo che, se ψ è ortogonale a tutti gli spazi Hα allora ψ = 0. In altre parole, < {Hα }α∈A > = H e quindi, essendo gli spazi a due a due ortogonali: H = ⊕α∈A Hα . Passiamo a provare (b) nel caso generale di T normale, il caso di T autoaggiunto e T unitario si provano specializzando la dimostrazione in modo ovvio. Proveremo che vale la doppia implicazione equivalente alla tesi: λ 6∈ supp{µα }α∈A ⇔ λ ∈ ρ(T ). ⇒ Se λ 6∈ supp{µα }α∈A , sia DR un disco aperto di raggio R > 0 centrato in λ con µα (DR ) = 0 per ogni α ∈ A, tale disco esiste sempre nelle ipotesi fatte. Si verifica subito che, in ogni spazio L2 (σ(T ), µα ), l’operatore moltiplicativo per (x + iy − λ)−1 è limitato con norma non superiore a 1/R (indipendentemente da α) ed è l’inverso destro e sinistro dell’operatore moltiplicativo per (x + iy − λ). Sia Rλ (α) : Hα → Hα l’operatore Uα−1 (x + iy − λ)−1 · Uα . Rλ (α) ha la stessa norma dell’operatore moltiplicativo (x + iy − λ)−1 ·, dato che Ua è isometrico suriettivo, per cui vale anche ||Rλ (α)|| ≤ 1/R. Si definisca l’operatore Rλ : H → H tale che: Rλ : X Pα ψ 7→ α∈A X Rλ (α)Pα ψ , α∈A per ogni ψ ∈ H. Tenendo conto di quanto detto nella nota precedente e del fatto che gli spazi Hα sono invarianti per T e per Rλ (che si riduce a Rλ (α) su ciascuno di essi), si verifica facilmente che, vale ||Rλ || ≤ 1/R ed inoltre Rλ (T − λI) = (T − λI)Rλ = I. Infatti, dato che RanRλ (α) = Hα , si ha: ||Rλ ψ||2 = || X α∈A Rλ (α)Pα ψ||2 = || X Pa Rλ (α)Pα ψ||2 = α∈A 274 X α∈A ||Pa Rλ (α)Pα ψ||2 = X ||Rλ (α)Pα ψ||2 ≤ R−2 α∈A X ||Pα ψ||2 = R−2 ||ψ||2 . α∈A Inoltre (T − λI)Rλ ψ = (T − λI)Rλ X Pα ψ α∈A X (T − λI)Rλ Pα ψ = α∈A X (T − λI) Hα Rλ (a)Pα ψ = α∈A X IPα ψ = ψ , α∈A per cui: (T − λI)Rλ = I. Similmente Rλ (T − λI)ψ = Rλ (T − λI) X Pα ψ α∈A X Rλ (T − λI)Pα ψ = α∈A X Rλ (a)(T − λI) Hα Pα ψ = α∈A X IPα ψ = ψ , α∈A per cui: Rλ (T − λI) = I. Per (a) di teorema 8.1, λ ∈ ρ(T ). ⇐ Supponiamo ora che λ ∈ ρ(T ) per cui esiste (T − λI)−1 : H → H inverso destro e sinistro di T − λI ed operatore limitato. Definiamo > 0 in modo tale che ||(T − λI)−1 || =: 1/. Sosteniamo che allora µα (D ) = 0 per ogni α ∈ A, dove D è il disco aperto di raggio centrato in λ. Procediamo per assurdo. Supponiamo sia falso quanto affermato per ultimo, allora esisterà β ∈ A tale che µβ (D ) > 0. Sia Dδ0 ⊂ D un secondo disco aperto centrato in un punto di D con raggio δ tale che 0 < δ < e µβ (Dδ ) > 0, se non esistesse un siffatto Dδ sarebbe µβ (D ) = 01 . Consideriamo un vettore ψ ∈ H \ {0} definito dal fatto che Pα ψ = 0 se α 6= β e Uβ ψ = f tale che suppf ⊂ Dδ . Possiamo sempre ridefinire ψ per un fattore moltiplicativo, in modo tale che ||ψ|| = 1. Vale allora, essendo |x + iy − λ| < se x + iy ∈ Dδ , 2 ||(T − λI)ψ|| = Z 2 2 2 |(x + iy) − λ| |f (x, y)| dµβ (x, y) < Z Dδ |f (x, y)|2 dµβ (x, y) = 2 . Dδ Quindi vale: ||(T − λI)ψ|| < . D’altra parte, per definizione di norma di un operatore: ||(T − λI)−1 || ≥ ||(T − λI)−1 φ|| ||φ|| per ogni φ ∈ H \ {0}. Di conseguenza, posto (T − λI)−1 φ = ψ, vale ||(T − λI)−1 || ≥ ||ψ|| , ||(T − λI)ψ|| 1 Per ogni z ∈ D , possiamo scegliere un disco aperto centrato in z di raggio positivo δ < in modo tale che Dδ ⊂ D . In tal modo abbiamo un ricoprimento dell’insieme D fatto da suoi sottoiniemi aperti. Per il lemma (i) (i) di Lindelöf, possiamo estrarre un sotto ricoprimento numerabile {Dδi }i∈N . Valendo D = ∪i∈N Dδi dovrà anche essere: µβ (E ) ≤ P i∈N (i) (i) µβ (Dδi ). Se fosse µβ (Dδi ) = 0 per ogni i, avremmo che µβ (D ) = 0. 275 e pertanto: 1/ ≥ 1 > 1/ , ||(T − λI)ψ|| che è assurdo. Concludiamo la dimostrazione provando (c). Nel caso di H separabile, consideriamo la classe di vettori {ψn }n∈N come detto sopra (ora α è indicato con n) scegliendoli in modo che ||ψn ||2 = 2−n . Definiamo MT := ∪+∞ n=1 σ(T ), cioè MT è l’unione disgiunta di infinite copie di σ(T ). Infine definiamo µT richiedendo che si restringa a µn sulla copia n-esima di σ(T ). Deve esser chiaro che in P 2 questo modo µT (MT ) = +∞ n=0 ||ψn || < +∞. La funzione FT è ovviamente quella che si restringe alla funzione (x + iy)· su ogni componente σ(T ). In questo modo FT risulta essere limitata dato che ogni copia di σ(T ) è limitato. L’operatore UT è costruito in modo ovvio attraverso gli Un . 2 Esempi 8.2. (1) Consideriamo l’operatore T su H := L2 ([0, 1] × [0, 1], dx ⊗ dy) definito da (T f )(x, y) = xf (x, y), quasi ovunque su X := [0, 1] × [0, 1], per ogni f ∈ H Si verifica facilmente che tale operatore è limitato, autoaggiunto e con spettro σ(T ) = σc (T ) = [0, 1]. Una misura spettrale su R a supporto limitato che riproduce T come integrale, è quella data dai (T ) proiettori ortogonali PE definiti come operatori moltiplicativi per le funzioni caratteristiche 0 χE 0 con E := (E ∩ [0, 1]) × [0, 1], per ogni boreliano E ⊂ R. Infatti, usando i lemmi A e B dell’esempio (1) in esempi 8.1, e con una scelta opportuna per i domini delle funzioni usate, si verifica che, per ogni g ∈ M (X), Z g(λ) P (λ)f (x, y) = g(x)f (x, y) , quasi ovunque su X . [0,1] Quindi in particolare Z λ P (λ)f (x, y) = xf (x, y) , quasi ovunque su X , [0,1] e quindi: Z T = λ dP (λ) , [0,1] come volevamo. Questa misura spettrale è allora l’unica, su R, a soddisfare (a) del teorema spettrale. Ci interessiamo ora al punto (c) dell’enunciato del teorema spettrale. Una decomposizione di H come quella precisata in tale punto si ottiene nel modo seguente. Sia {un }n∈N una base hilbertiana di L2 ([0, 1], dy). Consideriamo quindi i sottospazi di H := L2 ([0, 1] × [0, 1], dx ⊗ dy) dati da, per ogni n ∈ N, Hn := {f · un | f ∈ L2 ([0, 1], dx)} . È facile verificare che questa classe di sottospazi soddisfa, rispetto a T , tutte le richieste del punto (c) del teorema. In particolare, per costruzione Hn è isomorfo a L2 ([0, 1], dx) secondo la 276 trasformazione isometrica suriettiva: f · un 7→ f e quindi µn = dx. (2) Consideriamo un operatore compatto autoaggiunto T ∈ B(H) nello spazio di Hilbert H. Per il teorema 4.2, σp (T ) è un insieme discreto di punti in R, con eventualmente il punto 0 come unico punto di accumulazione. Di conseguenza, σ(T ) = σp (T ), eccetto il caso in cui 0 è punto di accumulazione di σp (T ), ma 0 6∈ σp (T ). In questo caso (essendo σ(T ) chiuso, per il teorema 8.1) σ(T ) = σp (T ) ∪ {0} e 0 è l’unico elemento di σc (T ) (essendo σr (T ) = ∅ per la proposizione 8.3). Seguendo l’esempio (3) in esempi 8.1, possiamo definire una misura a valori di proiezione su R che è nulla fuori da σ(T ): X PE := sPλ λ∈E con E ⊂ σ(T ) e con Pλ proiettore ortogonale sull’autospazio con autovalore λ, se λ è autovalore, Pλ = 0 (proiettore nullo) altrimenti. Quest’ultima possibilità può capitare solo se λ = 0 e 0 non è autovalore. Seguendo l’esempio (3) in esempi 3.1, troviamo che Z X λP (λ)ψ = σ(T ) λPλ ψ , λ∈σ(T ) per ogni ψ ∈ H. D’altra parte, per il teorema 4.3, vale anche: X λPλ = T , λ∈σ(T ) dove abbiamo definito P0 = 0 se 0 ∈ σc (T ). L’enunciato del teorema 4.3 precisa che tale decomposizione vale nella topologia operatoriale uniforme se si segue un ordine opportuno nell’etichettare gli autovalori. Seguendo tale ordinamento, vale anche che, per ogni ψ ∈ H: X λPλ ψ = T ψ . λ∈σ(T ) Possiamo interpretare la somma a primo membro nel senso degli integrali rispetto alla misura a valori di proiezione su σ(T ) definita sopra. Ciò prova anche che la serie a primo membro può essere riordinata a piacimento (quando i proiettori sono applicati su un vettore ψ ∈ H). Si osservi infine che, per costruzione, supp(P ) = σ(T ). Concludiamo che: la misura su σ(T ) definita sopra è la misura spettrale di T , unicamente associata a T dal teorema spettrale. Inoltre, la decomposizione spettrale di T coincide con la decomposizione di T nella topologia forte sui suoi autospazi : X T = sλPλ , λ∈σp (T ) l’eventuale punto 0 ∈ σc (T ) non fornisce contributo all’integrale. Esercizi 8.2. (1) Considerare l’operatore T limitato ed autoaggiunto su H := L2 ([0, 1], dx) che moltiplica le 277 funzioni per x2 : (T f )(x) := x2 f (x) . Trovarne la misura spettrale. Suggerimento. Costruire una trasformazione unitaria da H a L2 ([0, 1], dy) che trasformi l’operatore moltiplicativo per x2 nell’operatore moltiplicativo per y. (2) Considerare l’operatore T limitato ed autoaggiunto su H := L2 ([−1, 1], dx) che moltiplica le funzioni per x2 : (T f )(x) := x2 f (x) . Trovarne la misura spettrale. Suggerimento. Ragionare come nell’esercizio (1), dopo avere decomposto L2 ([−1, 1], dx) = 2 L ([−1, 0], dx) ⊕ L2 ([0, 1], dx). (3) Se T ∈ B(H), con H spazio di Hilbert, è un operatore normale, dimostrare che, per ogni α ∈ C, Z eαT = eα(x+iy) dP (T ) (x, y) , σ(T ) dove il primo membro è definito come eαT := +∞ X αn T n . n! n=0 n n α z Suggerimento. La serie +∞ n=0 n! converge assolutamente ed uniformemente in ogni cerchio chiuso di raggio finito centrato nell’origine di C. Inoltre, per ogni polinomio p(z) (dove z = x + iy), vale Z P p(x + iy) dP (T ) (x, y) . p(T ) = σ(T ) (4) Si dimostrare il seguente notevole risultato, noto come: Teorema di Fuglede. Se A ∈ B(H) è normale e B ∈ B(H) commuta con A, allora B commuta anche con A∗ . ∗ ∗ Traccia. Per z ∈ C, considerare Z(z) = e−zA BezA , dove gli esponenziali sono definiti per via spettrale in modo ovvio. Usando il fatto che tale definizione coincide con quel∗ la data tramite la serie nella topologia uniforme, concludere che Z(z) commuta con ezA e ∗ ∗ ∗ ∗ ∗ quindi Z(z) = e−zA +zA BezA −zA . Essendo U := e−zA +zA = ezA −zA unitario, risulta ||z(z)|| ≤ ||B|| e quindi la funzione olomorfa (perché ?) C 3 z 7→ (ψ|Z(z)φ) è limitata su tutto il piano complesso ed è di conseguenza costante. Valutandola per z = 0 si trova: ∗ ∗ S(z) = e−zA BezA = B costantemente, cioè ∗ ∗ BezA = ezA B . Usando la rappresentazione spettrale degli esponenziali, oppure facendo uso dello sviluppo in serie di potenze, e calcolando, per z = 0, la derivata nella topologia forte dei due membri dell’identità trovata, si ricava BA∗ = A∗ B. 278 Per concludere il paragrafo enunciamo un ultimo teorema che è un diretto corollario del teorema di decomposizione spettrale e del teorema 8.5. La dimostrazione è lasciata per esercizio al lettore. Teorema 8.8. Siano H spazio di Hilbert e T ∈ B(H) operatore normale. Ò T : M (σ(T )) → B(H), dalla C ∗ -algebra commu(a) Esiste un unico omomorfismo continuo, Ψ tativa con unità, M (σ(T )) (spazio delle funzioni misurabili limitate a valori complessi definite sul compatto di Hausdorff σ(T ) ⊂ R2 dotata della norma dell’estremo superiore || ||∞ e con involuzione data dalla coniugazione complessa) alla C ∗ -algebra con unità B(H), tale che: (i) vale l’identità: Ò T (z) = T , Ψ dove z è la funzione σ(T ) 3 (x, y) 7→ z := x + iy ; (8.59) (ii) se {fn }n∈N ⊂ M (σ(T )) è limitata e converge puntualmente a f : σ(T ) → C, allora Ò T (f ) = w- lim Ψ Ò T (fn ) . Ψ n→+∞ Ò T gode delle ulteriori seguenti proprietà: (b) Ψ Ò T (f )|| = ||f ||∞ ; (iii) per ogni f ∈ M (σ(T )) vale ||Ψ Ò T (f ) = Ψ Ò T (f )A per ogni (iv) se, per A ∈ B(H), vale AT = T A e AT ∗ = T ∗ A, allora AΨ f ∈ M (σ(T )); Ò T è uno ∗ -omomorfismo di C ∗ -algebre, valendo Ψ Ò T (f ) = Ψ Ò T (f )∗ per ogni f ∈ M (σ(T )); (v) Ψ (vi) se {fn }n∈N ⊂ M (σ(T )) è limitata e converge puntualmente a f : σ(T ) → C, allora Ò T (f ) = s- lim Ψ Ò T (fn ) , Ψ n→+∞ Ò T (f ) ≥ 0, (vii) se f ∈ M (σ(T )) assume solo valori reali e f ≥ 0, allora Ψ (viii) se f ∈ M (σ(T )), allora Ò T (f ) = Ψ Z f (x, y) dP (T ) (x, y) . σ(T ) 279 Capitolo 9 Teoria Spettrale su spazi di Hilbert II: operatori autoaggiunti non limitati ed applicazioni. In questo capitolo, che probabilmente è il più tecnico del libro, esamineremo varie questioni matematiche legate più o meno direttamente alla teoria spettrale per operatori autoaggiunti non limitati. Nella prima sezione, estenderemo il teorema spettrale provato nel capitolo precedente, al caso di operatori autoaggiunti non limitati. Per fare ciò , estenderemo la procedura di integrazione di rispetto a misure spettrali, al caso di funzioni non limitate. Con questa estenzione e facendo uso della trasformata di Cayley, dimostreremo il teorema di decomposizione spettrale per operatori autoaggiunti non limitati. Daremo quindi due esemi fisicamente importanti di operatori autoaggiunti non limitati e della loro decomposizione spettrale: l’hamiltoniano dell’oscillatore armonico e gli operatori posizione ed impulso. Enunceremo infine un teorema di rappresentazione spettrale per operatori autoaggiunti non limitati. Nella sezione successiva ci concentreremo sulla teoria dei gruppi ad un parametro fortemente continui di operatori unitari. In primo luogo proveremo l’equivalenza delle varie richieste di continuità . Quindi proveremo il teorema di von Neumann sulla continuità delle dei gruppi ad un parametro misurabili di operatori unitari, e successivamente dimostreremo il teorema di Stone e qualche importante conseguenza. In particolare daremo un utile criterio, basato sui gruppi unitari ad un parametro generati da operatori autoaggiunti, per stabilire quando le misure spettrali di due operatori autoaggiunti commutano. La terza sezione sarà dedicata alla nozione di prodotto tensoriale hilbertiano di spazi di Hilbert ed a quella di prodotto tensoriale di operatori (in generale non limitati) ed alle relative proprietà spettrali. Come esempio ed applicazione strudieremo gli operatori associati al momento angolare orbitale di una particella quantistica. La quarta sezione sarà dedicata alla procedura di esponenziazione di operatori non limitati, in relazione alla nozione di vettore analitico introdotto precedentemente. 280 La quinta sezione riguarderà l’estensione del teorema di decomposizione polare al caso di operatori non limitati, chiusi e densamente definiti. In tale sede discuteremo anche le proprietà notevoli degli operatori della forma A∗ A, con A densamente definito e chiuso, e delle radici quadrate di operatori autoaggiunti positivi non limitati. L’ultima sezione riguarderà l’enunciato la dimostrazione e qualche diretta applicazione del teorema di Kato-Rellich che stabilisce criteri affinché un operatore autoaggiunto perturbato additivamente tramite un operatore simmetrico dia ancora luogo ad un operatore autoaggiunto. 9.1 Teorema spettrale per operatori autoaggiunti non limitati. Ci occuperemo ora di generalizzare parte delle definizioni e dei risultati ottenuti nella sezione precedente. In particolare vogliamo dimostrare il teorema di decomposizione spettrale nel caso di operatori autoaggiunti non limitati. L’importanza in fisica di tale teorema risiede nel fatto che, nella Meccanica Quantistica, la maggior parte degli operatori autoaggiunti che rappresentano osservabili di concreto interesse fisico sono operatori non limitati. Il caso tipico è dato dall’operatore posizione introdotto nel capitolo 5. 9.1.1 Integrazione di funzioni non limitate rispetto a misure spettrali. L’estensione dei risultati del capitolo precedente al caso di operatori non limitati si basa sulla definizione di integrazione di funzioni non limitate rispetto a PVM. Se P è una misura spettrale sullo spazio topologico a base numerabile X nel senso della definizione 8.3 e se f : X → C è una funzione misurabile (rispetto all’algebra di Borel di X), ma non necessariamente limitata, la R scrittura: X f (x)dP (x) non ha alcun senso fino ad ora. Cerchiamo di dare senso a tale integrale. Consideriamo un vettore ψ ∈ H, spazio di Hilbert della PVM P , tale che: Z |f (x)|2 dµψ (x) < +∞ , (9.1) X dove la misura spettrale rispetto a ψ, µψ , è quella definita in (c) del teorema 8.4. Possiamo sempre trovare una successione di funzioni misurabili e limitate, fn , tali che fn → f per n → +∞ nel senso della norma di L2 (X, µψ ). Per esempio, come si prova facilmente dal teorema della convergenza dominata di Lebesgue, basta considerare la successione di funzioni fn := χFn · f , dove χFn è la funzione caratteristica dell’insieme Fn := {x ∈ X | |f (x)| < n}. Usando (iii) di (a) e (b) del teorema 8.5, si ricava immediatamente che vale l’identità: Z 2 Z Z fn (x)dP (x)ψ − fm (x)dP (x)ψ = |fn (x) − fm (x)|2 dµψ (x) . X X (9.2) X R Pertanto la successione di vettori X fn (x)dP (x)ψ converge a qualche vettore, che indicheremo R con X f (x)dP (x)ψ: Z Z f (x)dP (x)ψ := lim fn (x)dP (x)ψ . (9.3) X n→+∞ X 281 R È chiaro che X f (x)dP (x)ψ non dipende dalla successione {fn }n∈N . Se infatti {gn }n∈N è un’altra successione di funzioni misurabiliR limitate che converge a f nel senso della norma di L2 (X, µψ ), R la norma al quadrato del vettore X fn (x)dP (x)ψ − X gn (x)dP (x)ψ risulta essere maggiorata da, procedendo come sopra, Z |fn (x) − gn (x)|2 dµψ (x) → 0 se n → +∞ , X e pertanto: Z lim n→+∞ X Z fn (x)dP (x) = lim n→+∞ X gn (x)dP (x) . Possiamo allora enunciare e provare il primo fondamentale teorema, dopo avere enunciato e provato un lemma. Lemma 9.1. Sia X spazio topologico a base numerabile, B(X) la sua σ-algebra di Borel di X, H spazio di Hilbert, P : B(X) → B(H) una PVM e f : X → C una funzione misurabile. Se le misure µψ e µφ,ψ sono definite come nel teorema 8.4, dove φ, ψ ∈ H e vale: Z |f (x)|2 dµψ (x) < +∞ , X allora f è µφ,ψ -integrabile, cioè f ∈ L1 (X, |µφ,ψ |), e vale: ÊZ Z |f (x)|2 dµψ (x) . |f (x)|d|µφ,ψ (x)| ≤ ||φ|| (9.4) X X Prova. Cominciamo con il supporre che f sia limitata. In tal caso, da (iv) in (c) nel teorema 8.4: Z Z φ |f (x)|dP (x)ψ = |f (x)|dµφ,ψ (x) X X Il teorema di Radon-Nikodym (vedi (1) in esempi 2.2), esiste una funzione h : X → C con |h(x)| = 1 su X, tale che dµφ,ψ = hd|µφ,ψ |, e quindi: Z Z Z |f (x)|d|µφ,ψ (x)| = |f (x)|h−1 (x)dµφ,ψ (x) = φ |f (x)|h−1 (x)dP (x)ψ . X X X Di conseguenza, usando (b) del teorema 8.5 e notando che ||f (x)|h−1 (x)|2 = |f (x)|2 , abbiamo: ÊZ Z Z X |f (x)|d|µφ,ψ (x)| ≤ ||φ|| |f (x)|h−1 (x)dP (x)ψ = ||φ|| X |f (x)|2 dµψ (x) . X Sia ora f non limitata. Definiamo le funzioni limitate fn := χFn · f come detto sopra, in modo tale che 0 ≤ |fn (x)| ≤ |fn+1 (x)| → |f (x)| per n → +∞. Per il teorema della convergenza monotona, tenendo conto del fatto che f ∈ L2 (X, dµψ ), troviamo: ÊZ Z Z |f (x)|d|µφ,ψ (x)| = lim X n→+∞ X |fn (x)|2 dµψ (x) |fn (x)|d|µφ,ψ (x)| ≤ ||φ|| lim n→+∞ 282 X ÊZ |f (x)|2 dµψ (x) < +∞ . = ||φ|| X Questo prova la tesi. 2 Passiamo al teorema. Nell’enunciato, se T : D(T ) → H è un operatore nello spazio di Hilbert P k H con dominio (non necessariamente denso) D(T ) ⊂ H e p(x) = m k=0 ak x è un polinomio di grado m a coefficienti complessi, l’operatore p(T ) : D(p(T )) → H è definito sostituendo formalmente alla variabile x del polinomio p l’operatore T , dove T 0 := I e T k = T · · · T (k volte) è la composizione di k copie di T , per k = 1, 2, 3, . . . , m. Il dominio naturale D(p(T )) di p(T ) in tal caso è , in conformità con la definizione definizione 5.1: D(p(T )) := m \ D(ak T k ) , (9.5) k=0 dove il dominio naturale di D(ak T · · · T ) è definito nella definizione 5.1. Teorema 9.1. Sia X spazio topologico a base numerabile, B(X) la sua σ-algebra di Borel di X, H spazio di Hilbert e P : B(X) → B(H) una PVM. Per ogni f : X → C misurabile si definisca: Z § ª 2 ∆f := ψ ∈ H |f (x)| dµψ (x) < +∞ . (9.6) X Valgono allora i seguenti fatti. (a) ∆f è un sottospazio denso di H. (b) L’applicazione: Z f (x)dP (x) : ∆f 3 ψ 7→ X Z f (x)dP (x)ψ , (9.7) X dove il secondo membro è definito in (9.3) per una qualsiasi successione di funzioni misurabili limitate {fn }n∈N convergente a f in L2 (X, µψ ), definisce un operatore lineare. R (c) X f (x)dP (x) coincide con l’operatore in definizione 8.4 se ||f supp(P ) ||∞ < +∞. ValgonoR inoltre le seguenti proprietà nel caso generale. (i) X f (x)dP (x) : ∆f → H è un operatore chiuso. (ii) Vale l’identità: Z ∗ Z f (x)dP (x) = f (x)dP (x) e risulta ∆f = ∆f , (9.8) X X R quindi, in particolare, X f (x)dP (x) è autoaggiunto se f è reale. (iii) Se f : R → C e g : R → C sono misurabili allora, dove · denota il prodotto di funzioni punto per punto e D il dominio naturale: Z Z Z Z Z f (x)dP (x)+ g(x)dP (x)⊂ (f +g)(x)dP (x) con D f (x)dP (x)+ g(x)dP (x) = ∆f ∩∆g (9.9) X X X X 283 X e quindi = si sostituisce a ⊂ se e solo se ∆f +g = ∆f ∩ ∆g , mentre: Z Z Z Z Z f (x)dP (x) g(x)dP (x)⊂ (f · g)(x)dP (x) con D f (x)dP (x) g(x)dP (x) = ∆f ·g ∩ ∆g X X X X X (9.10) e quindi = si sostituisce a ⊂ se e solo se ∆f ·g ⊂ ∆g . In particolare: Z Z Z Z Z f (x)dP (x) f (x)dP (x)= |f (x)|2 dP (x) e quindi D f (x)dP (x) f (x)dP (x) = ∆|f |2 X X Z X Z f (x)dP (x) X X X X (9.11) Z Z g(x)dP (x) f (x)dP (x) ∆f ∩∆g ∩∆f ·g , (9.12) g(x)dP (x) ∆f ∩∆g ∩∆f ·g = X X infine, se f è limitata sul boreliano E ⊂ X, allora ∆χE ·f = H e: Z Z Z χE (x)dP (x) f (x)dP (x) ⊂ X X Z Z f (x)dP (x) χE (x)dP (x) = (χE · f )(x)dP (x) ∈ B(H) , (9.13) X X X (iv) Se X = R e p : R → C è un polinomio (di grado finito m ∈ N) e T := Z p(T ) = p(x)dP (x) dove R X xdP (x), D(p(T )) = D(T m ) = ∆p . vale: (9.14) R R (v) Definita µφ,ψ come in (c) del teorema 8.4, X f (x)dP (x) è l’unico operatore in H con dominio ∆f tale che, per ogni ψ ∈ ∆f e φ ∈ H: Z Z φ f (x)dP (x)ψ = f (x)dµφ,ψ (x) . (9.15) X X (vi) Per ogni ψ ∈ ∆f si ha Z 2 Z f (x)dP (x)ψ = |f (x)|2 dµψ (x) . X (9.16) X R (vii) L’operatore X f (x)dP (x) è positivo per f positiva, cioè: Z ψ f (x)dP (x)ψ ≥ 0 per ogni ψ ∈ ∆f se f (x) ≥ 0 per x ∈ X (9.17) X (d) Sia X0 un secondo spazio topologico a base numerabile con σ-algebra di Borel B(X0 ). Se φ : X → X0 è misurabile (cioè φ−1 (E 0 ) ∈ B(X) se E 0 ∈ B(X0 )), allora B(X0 ) 3 E 0 7→ PE0 0 := Pφ−1 (E 0 ) è una PVM su X0 e, per ogni funzione misurabile f : X0 → C: Z X0 f (x0 )dP 0 (x0 ) = Z (f ◦ φ)(x)dP (x) X 284 e quindi ∆0f = ∆f ◦φ , (9.18) avendo indicando con ∆0f il dominio dell’operatore di sinistra. Prova. (a) e (b) Dobbiamo per prima cosa provare che, per ogni fissata f : X → C misurabile, se φ, ψ ∈ ∆f allora φ + ψ ∈ ∆f e cφ ∈ ∆f per c ∈ C arbitrario. Si osservi che ∆f contiene almeno il vettore nullo di H per cui è non vuoto. Se φ, ψ ∈ ∆f e E ∈ B(X) si ha: µφ+ψ (E) = (PE (φ + ψ)|φ + ψ) = µφ (E) + µψ (E) + 2Re(PE φ|ψ) . Quindi: µφ+ψ (E) ≤ µφ (E) + µψ (E) + 2|(PE φ|ψ)| . Vale inoltre: 2|(PE φ|ψ)| ≤ È (PE φ|φ)(PE ψ|ψ) ≤ (PE φ|φ) + (PE ψ|ψ) = µφ (E) + µψ (E) . Concludendo: µφ+ψ (E) ≤ 2(µφ (E) + µψ (E)) . Questa identità implica che, se L2 (X, µφ ) 3 f e L2 (X, µψ ) 3 f , allora L2 (X, µφ+ψ ) 3 f . Cioè, se φ, ψ ∈ ∆f allora φ + ψ ∈ ∆f . D’altra parte, essendo µφ (E) = (PE φ|φ), è chiaro che f ∈ L2 (X, µcφ ) se f ∈ L2 (X,Rµφ ) e c ∈ C. Cioè, se φ ∈ ∆fR allora cφ ∈ ∆f . Il fatto che l’applicazione X f (x)dP (x) : ∆f 3 ψ 7→ X f (x)dP (x)ψ sia infine lineare segue immediatamente dal fatto che l’integrale di una funzione limitata rispetto ad una PVM è un operatore lineare. Passiamo a provare che il sottospazio ∆f ⊂ H è denso in H. Fissata f come nelle ipotesi, si definiscano gli insiemi: En := {x ∈ X | n − 1 ≤ |f (x)| < n} , per ogni naturale n ≥ 1. Si osservi che En ∩ Em = ∅ se n 6= m e ∪n En = X. Della definizione 8.3 segue immediatamente che i sottospazi chiusi Hn := P (En )H sono a due a due ortogonali e, per la proprietà (d) della suddetta definizione, le combinazioni lineari finite di elementi di tutti gli spazi Hn definiscono un sottospazio denso in H. Mostriamo che ∆f contiene tali combinazioni lineari. Dal teorema della convergenza monotona, se ψ ∈ H: Z |f (x)|2 dµψ (x) = lim k→+∞ X k Z X n=1 X |χEn (x)f (x)|2 dµψ (x) ≤ +∞ . (9.19) L’integrale dopo il simbolo di sommatoria può essere trascritto, usando (b) in teorema 8.5: Z Z χEn (x)f (x)dP (x)ψ χEn (x)f (x)dP (x)ψ . X X 285 D’altra parte, visto che x 7→ χEn (x)f (x) è limitata per costruzione e che χEn = χEn · χEn , usando (iii) in (a) di teorema 8.5 si ha Z Z X χEn (x)f (x)dP (x)ψ = X Z χEn (x)f (x)dP (x) X Z χEn (x)dP (x)ψ = X χEn (x)f (x)dP (x)◦P (En )ψ. Se quindi ψ ∈ Hn per un certo n, essendo i proiettori P (En ) ortogonali a due a due, varrà: Z X se k 6= n . χEk (x)f (x)dP (x)ψ = 0, Di conseguenza, nelle ipotesi dette per ψ, la serie in (9.19) si riduce a: Z |f (x)|2 dµψ (x) = X Z X |χEn (x)f (x)|2 dµψ (x) ≤ Z n2 dµψ (x) = n2 ||ψ||2 < +∞ . X Concludiamo che Hn ⊂ ∆f , per ogni n = 1, 2, . . .. Dato che ∆f è sottospazio conterrà anche il sottospazio denso delle combinazioni lineari finite di elementi di tutti gli spazi Hn . Pertanto ∆f è denso. (c) In tutta questa dimostrazione, per f : X → C, definiremo: Fk := {x ∈ X | |f (x)| < k}. Definiamo fn := χsupp(P ) · f + gn dove gn = χFn · χX\supp(P ) · f e le χn sono le funzioni. In tal caso fn → f puntualmente, se n → +∞, ed inoltre, per ogni ψ ∈ H Z 2 |fn (x) − f (x)| dµψ (x) = X Z |fn (x) − f (x)|2 dµψ (x) = 0 . supp(P ) Di conseguenza, banalmente, fn → f nel senso di L2 (X, µψ ) per ogni ψ ∈ H e quindi, per definizione, Z Z f (x)dP (x)ψ = lim X n→+∞ X Z Z fn (x)dP (x)ψ = lim n→+∞ supp(P ) f (x)dP (x)ψ = f (x)dP (x)ψ , supp(P ) R dove l’ultimo integrale è definito nel senso della definizione 8.4 e pertanto supp(P ) f (x)dP (x) è un operatore limitato. Prima di tutto notiamo che (vi) segue immediatamente per continuità dalla analoga proprietà , valida per funzioni limitate, stabilita in (b) del teorema 8.5, usando la nostra definizione di integrale di funzioni non limitate. Nello stesso modo (b) del teorema 8.4 implica (vii). Infatti se f ≥ 0, ψ ∈ ∆f , la successione di funzioni χFn · fn ≥ 0 converge a f in L2 (X, µψ ) per cui: Z Z 0 ≤ ψ (χFn · f (x))dP (x)ψ → ψ f (x)dP (x)ψ , se n → +∞, X X R e quindi ψ X f (x)dP (x)ψ ≥ 0. R Passiamo agli altri punti. (i) Mostriamo che T := X f (x)dP (x) definito su ∆f è un operatore chiuso. Per dimostrare questo cominciamo con il notare che, se definiamo gli operatori limitati: Z Tk := X χFk (x)f (x)dP (x) , 286 allora, per ogni ψ ∈ ∆f , vale: (1) T PFk ψ = PFk T ψ = Tk ψ e (2) Tk ψ → T ψ per k → +∞. La dimostrazione di (1) si ottiene similmente a quella fatta sopra per parte iniziale di (c), mentre quella di (2) segue dalla discussione che precede l’enunciato del teorema 9.1. Sia quindi {ψn }n∈N ⊂ ∆f tale che ψn → ψ ∈ H e T ψn → φ, per n → +∞. Mostriamo che φ ∈ ∆f e T ψ = φ dimostrando, in tal modo, la chiusura di T . Vale, per (1) e per il fatto che PFk → I in senso forte se k → +∞: Tk ψ = lim Tk ψn = lim PFk T ψn = PFk φ → φ n→+∞ n→+∞ in H se k → +∞. Se definiamo φk := Tk ψ e teniamo conto di abbiamo appena trovato che: Z χFk (x)f (x)dP (x)ψ = φk → φ X in H se k → +∞. (9.20) Quindi, da (b) del teorema 8.5: Z X χFk (x)|f (x)|2 dµψ (x) = ||φk ||2 → ||φ||2 < +∞ se n → +∞. Il teorema della convergenza monotona assicura allora che f ∈ L2 (X, µψ ), cioè che ψ ∈ ∆f . Riscrivendo l’identità in (9.20) come Tk ψ = φk e calcolando il limite per k → +∞ usando (2), abbiamo infine che: T ψ = φ, che è quanto volevamo provare. (ii) Il fatto che ∆f = ∆f è una ovvia conseguenza della definizione di ∆f e del fatto che |f | = |f |. Mostriamo ora che X f (x)dP (x) ⊂ X f (x)dP (x) ∗ . Infatti, se ψ ∈ ∆f , φ ∈ ∆f e fn → f in L2 (X, µφ ) e quindi fn → f in L2 (X, µψ ), dove le fn sono limitate, vale: Z Z Z ψ f (x)dP (x)φ = lim ψ fn (x)dP (x)φ = lim fn (x)dP (x)ψ φ = R R n→+∞ X X Z = X n→+∞ f (x)dP (x)ψ φ X (iv) in (a) del dove abbiamo usato la definizione dell’integrale di f e f rispetto a P e la proprietà R teorema 8.5 degli integrali di funzioni limitate fn . Quanto trovato significa che X f (x)dP (x) ⊂ R R R ∗ ∗ X f (x)dP (x) . Mostriamo ora che vale anche l’inclusione: X f (x)dP (x) ⊃ X f (x)dP (x) . Per Rquanto ottenuto sopra, l’inclusione che vogliamo dimostrare segue immediatamente da ∗ D X f (x)dP (x) ⊂ ∆f . Pertanto ci limitiamo a dimostriamo questa seconda inclusione R dei soli domini. Definiamo T := X f (x)dP (x) e gli operatori limitati Tk come nella dimostrazione parte iniziale di (c). Fissiamo ψ ∈ D(T ∗ ). Allora esiste h ∈ H tale che, per ogni φ ∈ ∆f : (ψ|T φ) = (h|φ). Scegliendo φ = Tk∗ ψ otteniamo (ψ|Tk Tk∗ ψ) = (h|Tk∗ ψ), dove abbiamo usato T Tk∗ = Tk Tk∗ che si prova da Tk∗ = PFk Tk∗ (che segue subito da (iv) e (iii) in (a) del teorema 8.5), ed ulteriormente la proprietà T PFk = Tk , che si prova come nella parte iniziale di (c). Abbiamo trovato che: ||Tk∗ ψ||2 = (h|Tk∗ ψ). Allora ||Tk∗ ψ||2 ≤ ||Tk∗ ψ|| ||h||, cioè ||Tk∗ ψ|| ≤ ||h||. Di conseguenza, usando (b) del teorema 8.5: Z X χFk (x)|f (x)|2 dµψ (x) ≤ ||h||2 287 per ogni k ∈ N, che implica che ψ ∈ ∆f , per il teorema della convergenza monotona. Abbiamo provato che D(T ∗ ) ⊂ ∆f che era quanto volevamo provare. (iii) La formula (9.9) ed il commento sotto di essa seguono banalmente dalle definizioni date e dalla definizione di dominio naturale. Passiamo a dimostrare (9.10). Assumiamo inizialmente che f sia limitata in modo tale che ∆f ·g ⊂ ∆g , e ψ ∈ ∆g . Sia {gn }n∈N una successione di funzioni misurabili limitate che converge a g in L2 (X, dµg ). Allora f · gn → f · g in L2 (X, dµg ) e quindi, tenendo conto che gli integrali di f , gn , f · gn sono tutti nel senso della definizione 8.4 e che vale (iii) di (a) del teorema 8.5, abbiamo subito che: Z Z Z f (x)dP (x) X X Dato che R X f dP (f · gn )(x)dP (x)ψ → gn (x)dP (x)ψ = X Z Z f (x)dP (x) g(x)dP (x)ψ = X Se ora φ := R X gdP ψ, Z (f · g)(x)dP (x)ψ per n → +∞. X è continua, abbiamo provato che: Z X Z (f · g)(x)dP (x)ψ se f è limitata e ψ ∈ ∆g . (9.21) X tenendo conto di (vi), l’identità trovata mostra che: 2 |f (x)| dµφ (x) = X Z |(f · g)(x)|2 dµψ (x) se f è limitata e ψ ∈ ∆g . (9.22) X Sia ora f misurabile arbitraria e quindi, eventualmente, illimitata. Dato che (9.22)R vale per ogni R funzione limitata, varrà anche per quelle illimitate. Dato che D X f (x)dP (x) X g(x)dP (x) contiene tutti i vettori ψ ∈ ∆g tali che φ ∈ ∆f e che questo succede, per (9.22), se e solo se ψ ∈ ∆f ·g , noi concludiamo che: Z Z D f (x)dP (x) gdP (x) = ∆g ∩ ∆f ·g . X X R Se ora φ ∈ ∆g ∩ ∆f ·g , se ψ = X g(x)dP (x)φ, e se fn := χFn · f (con gli insiemi Fn definiti come fatto precedentemente), allora fn → f in L2 (X, µψ ), fn · g → f · g in L2 (X, µφ ) e ora (9.21) e (vi) (con fn al posto di f ) implicano che: Z Z Z f (x) dP (x) X g(x) dP (x)φ = X Z f (x) dP (x)ψ = lim n→+∞ X X Z = lim n→+∞ X (fn · g)(x) dP (x)φ = Z fn (x) dP (x)ψ = (f · g)(x) dP (x)φ . X Questo conclude la dimostrazione di (9.10). L’inclusione (9.10) unitamente al fatto che in essa = si sostituisce a ⊂ se e solo se ∆g ⊃ ∆f ·g , implica facilmente (9.12) e (9.13). Riguardo a (9.12), vale ∆f ⊃ ∆f ·f = ∆|f |2 dal momento che, essendo µψ finita, se ψ ∈ ∆|f (x)|2 Z X 2 |f (x)| dµψ (x) = Z 2 |f (x)| · 1dµψ (x) ≤ ÊZ X X 288 |f (x)|4 dµψ (x) ÊZ X 12 dµψ (x) < +∞ . (iv) Cominciamo a notare che, in base a (9.10) e (9.9), vale: p(T ) ⊂ Z p(x) dP (x) . X Di conseguenza, la tesi è vera quando D(p(T )) = ∆p . Dimostriamo questa identità cominciando a provare che vale: D(T n ) = ∆xn per n ∈ N. (9.23) La prova si ottiene per induzione come segue. Per n = 0, 1, l’identità è vera: D(T 0 ) = ∆1 = H, D(T ) = ∆x . Assumiamo che sia vera per n e proviamo che lo è per n + 1: D(T n+1 ) = ∆xn+1 . Dobbiamo cioè provare che D(T T n ) = ∆x◦xn . Usando il commento dopo (9.10), sappiamo che questo è vero se e solo se ∆x◦xn ⊂ ∆xn . Questa inclusione è verificata dal momento che µψ è sempre una misura positiva finita e |xn+1 | > |xn | fuori da un compatto J ⊂ R per cui, se ψ ∈ ∆xn+1 , allora: Z 2n |x| dµψ (x) = Z Z 2n |x| dµψ (x) + J R 2n 2n |x| dµψ (x) ≤ sup |x| ≤ sup |x| Z Z 1dµψ (x) + J R Z 1dµψ (x) + J J R\J 2n Z |x|2n+2 dµψ (x) R\J |x|2n+2 dµψ (x) < +∞ . R Si osservi che, dato che sarà utile tra poco, abbiamo in particolare verificato che: D(T n+1 ) = ∆xn+1 ⊂ ∆xn = D(T n+1 ) . Per concludere la dimostrazione di D(p(T )) = ∆p , calcoliamo separatamente i due membri e proviamo che coincidono. Sia am 6= 0 il coefficiente di grado massimo del polinomio p. Dato che D(T n+1 ) ⊂ D(T n ) e che, nel caso generale, D(A+B) = D(A)∩D(B), abbiamo immediatamente che: D(p(T )) = D(T m ) . (9.24) Passiamo a calcolare ∆p . Dato che ∆xn+1 ⊂ ∆xn si ha subito che ∆xm ⊂ ∆p . Dimostriamo l’inclusione opposta. Dato che |p(x)|/|x|m → |am | se |x| → +∞, risulta che: |p(x)|/|x|m ≤ |am | + > 0, per ogni > 0, se x è fuori da un certo compatto sufficientemente grande J ⊂ R. Pertanto, se ψ ∈ ∆p , allora: Z R |x|2m+2 dµψ ≤ Z |x|2m+2 dµψ + Z J J R\J ≤ 1 (|am | + )2 sup |x|2m+2 dµψ ≤ Z Z R\J |p(x)|2 dµψ + sup |x|2m+2 J R |p(x)|2 dµψ +sup |x|2m+2 dµψ (|am | + )2 R J Z Z dµψ < +∞ , R e quindi ψ ∈ ∆xm . Concludiamo che ∆p ⊂ ∆xm e quindi ∆p = ∆xm . Da (9.23) e (9.24) abbiamo infine che ∆p = ∆xm = D(T m ) = D(p(T )) e questo conclude la dimostrazione. (v) Definiamo le solite funzioni limitate fn := χFn · f che tendono a f nel senso di L2 (X, µψ ). 289 Abbiamo allora che, tenendo conto della definizione di integrale di f , ma anche di d (iv) in (c) nel teorema 8.4: Z Z Z φ f (x)dP (x) ψ = lim φ fn (x)dP (x) ψ = lim fn (x)dµφ,ψ (x) . n→+∞ X n→+∞ X X Per concludere, proviamo, usando il lemma 9.1, che: Z lim n→+∞ X (fn (x) − f (x))dµφ,ψ (x) = 0 Infatti, dal teorema di Radon-Nikodym e dal lemma 9.1: Z Z Z (fn (x) − f (x))dµφ,ψ (x) = (fn (x) − f (x))h(x)d|µφ,ψ (x)| ≤ |fn (x) − f (x)|d|µφ,ψ (x)| X X X ÊZ |fn (x) − f (x)|2 dµψ (x) → 0 ≤ ||φ|| X R per n → +∞, dalla definizione di X f (x)dP (x)ψ. La proprietàR di unicità segue ora immediatamente. Se T : ∆f → H soddisfa la stessa prioprietà di X f (x)dP (x), allora T 0 := R T − X f (x)dP (x) verifica (φ|T 0 ψ) = 0 per ogni φ R∈ H, qualunque sia ψ ∈ ∆f . Pertanto, scegliendo φ = T 0 ψ, risulta ||T 0 ψ|| = 0 e dunque T = X f (x)dP (x). (d) Diamo solo una traccia della dimostrazione, dal momento che è elementare anche se lunga. Il fatto che P 0 sia un PVM si verifica subito, controllando che tutte le richieste siano soddisfatte Se f è una funzione semplice, l’asserto (9.18) vale banalmente. Usando la definizione 8.4, si generalizza facilmente (9.18) alle funzioni misurabili limitate e quindi, facendo uso della definizione di integrale che abbiamo dato sopra nel caso di f misurabile non limitata, (9.18) si estende al caso generale. 2 Possiamo quindi dare la seguente definizione basata sulla (9.7), che estende la nozione di integrale di una funzione rispetto ad una PVM. Possiamo anche sfruttare la proprietà (v) in (c) per dare una definizione equivalente più elegante. Definizione 9.1. Siano X uno spazio topologico a base numerabile, H uno spazio di Hilbert e P : B(X) → B(H) una misura a valori di proiezione definita sulla σ-algebra di Borel di X. (a) Se f : X → C una funzione misurabile con ∆f definito come in (9.6), l’operatore Z f (x)dP (x) : ∆f → H X dato in (9.7) è detto integrale di f rispetto alla misura a valori di proiezione P . R Equivalentemente, X f (x)dP (x) è definibile come l’unico operatore S : ∆f → H che soddisfa: (φ |Sψ ) = Z f (x)dµφ,ψ (x) , per ogni φ ∈ H e ogni ψ ∈ ∆f , X 290 dove la misura complessa spettrale µφ,ψ è data in (c) del teorema 8.4. (b) Per ogni E ⊂ B(X) e per ogni f : X → C misurabile oppure g : E → C misurabile, gli integrali Z Z f (x) dP (x) := E e χE (x)f (x) dP (x) X Z Z g(x) dP (x) := g0 (x) dP (x) , E X dove g0 (x) := g(x) se x ∈ E oppure g0 (x) := 0 se x 6∈ E, sono detti, rispettivamente, integrale di f su E e integrale di g su E (rispetto alla misura a valori di proiezione P ). Note. (1) Per (c) del teorema 9.1, questa definizione estende quella già data in definizione 8.4 per il caso di funzioni limitate. (2) Con la definizione data, per ogni f : X → C misurabile, vale: Z Z Z f (x)dP (x) = X f (x)dP (x) e quindi f (x)dP (x) = 0 . supp(P ) (9.25) X\supp(P ) La prova è quasi immediata notando che, dal momento che supp(µψ ) ⊂ supp(P ) per definizione di µψ , abbiamo che ∆f = ∆χsupp(P )·f e questo prova che i due operatori nei due membri della prima identità in (9.25) hanno lo stesso dominio. Siano ora fn delle funzioni limitate che convergono a f in L2 (X, µψ ). Allora χsupp(P ) · fnR → χsupp(P ) · f e quindi, tenendo conto del fatto R che (vedi (3) in note dopo la definizione 8.4) X χsupp(P ) · fn dP = X fn dP , abbiamo: Z Z f (x)dP (x)ψ := supp(P ) X (χsupp(P ) · f )(x)dP (x)ψ = lim Z n→+∞ X Z = lim n→+∞ X (χsupp(P ) · fn )(x)dP (x)ψ Z fn (x)dP (x)ψ = f (x)dP (x)ψ . X Esempi 9.1. (1) Consideriamo la misura spettrale: P : B(N ) 3 E 7→ PE = X z(z| ) z∈E introdotta in (2) di esempi 8.1 su una base hilbertiana N di uno spazio di Hilbert separabile H, dotando N di struttura topologico a base numerabile con la topologia banale dell’insieme delle parti. Ci interessa arrivare a scrivere una formula esplicita per l’integrale di funzioni f : N → C non limitate, facendo uso della definizione (9.3). Nel caso che stiamo studiando, la condizione R P |f (z)|2 dµψ (z) < +∞ si specializza nella richiesta z∈N |f (z)|2 |(z|ψ)|2 < +∞. Vogliamo N mostrare che, anche nel caso di funzioni f illimitate, si ottiene ancora la formula: Z X f (z)dP (z) = sN z∈N 291 f (z)z(z| ) , provata in (2) di esempi 8.1 per funzioni f limitate. Infatti, se {Nn }n∈N è una classe di sottoinsiemi finiti di N con Nn+1 ⊃ Nn e ∪n∈N Nn = N , la successione di funzioni limitate fn := χNn · f P converge nel senso della norma L2 (N, µψ ), per ogni ψ ∈ H tale che z |f (z)|2 |(z|ψ)|2 < +∞, come semplice applicazione del teorema della convergenza dominata di Lebesgue. Pertanto, in base alla definizione (9.3) adottata per l’integrale di una funzione non limitata rispetto ad una P PVM, abbiamo che, se z∈N |f (z)|2 |(z|ψ)|2 < +∞, allora: Z Z f (z)dP (z)ψ := lim n→+∞ N N fn (z)dP (z)ψ (9.26) D’altra parte, dato che fn è limitata, per quanto provato in (2) di esempi 8.1: Z fn (z)dP (z)ψ = sN X fn (z)(z|ψ) = z∈N X f (z)z(z|ψ) , z∈Nn dove, nella seconda identità la somma è finita, dato che Nn contiene un numero finito di punti. La definizione (9.26) si riduce allora a: Z f (z)dP (z)ψ = lim n→+∞ N cioè : Z f (z)z(z|ψ) , z∈N X f (z)dP (z) = sN X f (z)z(z| ) . (9.27) z∈N Nella prossima sezione vedremo un esempio concreto di operatore autoaggiunto non limitato costruito con questo tipo di misura spettrale. (2) In riferimento a (1) in esempi 8.1, consideriamo la stessa misura spettrale definita in quell’esempio. Consideriamo quindi uno spazio di Hilbert H = L2 (X, µ), dove X è uno spazio topologico a base numerabile e µ è una misura sulla σ-algebra di Borel di X. La misura spettrale su H che vogliamo prendere in considerazione si ottiene definendo, per ogni ψ ∈ L2 (X, µ) e E ∈ B(X): (P (E)ψ)(x) := χE (x)ψ(x) , per quasi ogni x ∈ X . (9.28) Si osservi che in questo caso, se ψ ∈ H, la misura µψ risulta: Z µψ (E) = (ψ|P (E)ψ) = |ψ(x)|2 dµ(x) , E per ogni E ∈ B(X) . Di conseguenza, se g : X → C è misurabile, risulta che: Z Z g(x)dµψ (x) = X g(x)|ψ(x)|2 dµ(x) . X Abbiamo provato in (1) in esempi 8.1, che se f : X → C è misurabile e limitata, allora: Z f (y) dP (y)ψ (x) = f (x)ψ(x) per ogni ψ ∈ L2 (X, µ), per quasi ogni x ∈ X . X 292 (9.29) Mostriamo che il risultato si generalizza a funzioni misurabili non limitate, purché ψ ∈ ∆f . Se f : X → C è misurabile non limitata, consideriamo una successione di funzioni misurabili limitate fn tali che fn → f per n → +∞ nel senso di L2 (X, µψ ), quando ψ ∈ ∆f . In altre parole, in base all’espressione esplicita della misura µψ ottenuta sopra, deve essere: Z |fn (x) − f (x)|2 |ψ(x)|2 dµ(x) → 0 per n → +∞. X Tenendo conto di (9.29) risulta allora immediatamente che: ||f · ψ − fn · ψ||2H = Z |f (x) − fn (x)|2 |ψ(x)|2 dµ(x) → 0 per n → +∞. X Conseguentemente, in base alla definizione di integrale di f rispetto a P , concludiamo che: per ogni ψ ∈ ∆f , dove f : X → C è misurabile anche non limitata, vale sempre: Z f (x)dP (x)ψ (y) = f (x)ψ(y) per quasi ogni y ∈ X. (9.30) X 9.1.2 Teorema di decomposizione spettrale per operatori autoaggiunti non limitati. Siamo ora in grado di enunciare e provare il teorema di decomposizione spettrale per operatori autoaggiunti non limitati. Ci limiteremo ad enunciare e provare tale teorema per il caso di operatori non limitati autoaggiunti. Tuttavia è possibile estendere il risultato agli operatori non limitati normali [Rud91]. Teorema 9.2. Sia T operatore autoaggiunto (non necessariamente limitato) sullo spazio di Hilbert H. Valgono i seguenti fatti. (a) Esiste ed è unica una misura a valori di proiezione P (T ) su R (dotato della topologia standard) tale che: Z λ dP (T ) (λ) . (9.31) supp(P (T ) ) = σ(T ) (9.32) T = R (b) Vale l’identità: e valgono in particolare i seguenti fatti (i) λ ∈ σp (T ) se e solo se P (T ) ({x}) 6= 0; (ii) λ ∈ σc (T ) se e solo se P (T ) ({x}) = 0 e, per ogni aperto Ax ⊂ R con Ax 3 x, è (T P ) (Ax ) 6= 0; (iii) se λ ∈ σ(T ) è un punto isolato, allora λ ∈ σp (T ); (iv) se λ ∈ σc (T ), allora, per ogni > 0, esiste φ ∈ D(T ) con ||φ || = 1 e 0 < ||T φ − λφ || ≤ . 293 Prova. (a) Sia V la trasformata di Cayley di T . V è un operatore unitario per il teorema 5.4, dato che T è autoaggiunto. Se S1 := {(x, y) ∈ R2 | x2 + y 2 = 1}, definiamo X := S1 \ {(1, 0)} e nel seguito z = x + iy. Dotiamo X della topologia indotta da R2 . Sia infine P (V ) la misura spettrale di V in R2 ≡ C, che esiste per il teorema 8.6. Se z = x + iy, vale: Z zdP (V ) (x, y) . V = (9.33) R2 Dal teorema 8.6 sappiamo anche che σ(V ) = supp(P (V ) ) ⊂ S1 . Inoltre I − T è iniettiva per (ii) in (b) del teorema 5.4 e di conseguenza 1 = 1 + i0 6∈ σp (V ). A sua volta questo implica che P (V ) ({(0, 1)}) = 0 per (ii) in (b) di teorema 8.6. Di conseguenza, la decomposizione spettrale R V = S1 zdP (V ) (x, y) data nel teorema 8.6, può scriversi equivalentemente come: Z zdP (V ) (x, y) . V = (9.34) X Si osservi che possiamo direttamente pensare P (V ) come una PVM su X rispetto alla sua σalgebra di Borel B(X), e la formula di decomposizione scritta sopra continua ad avere senso. (Più precisamente, l’applicazione B(X) 3 E 7→ P (V ) (E) è ancora una PVM e, per computo diretto, si vede facilmente che l’integrale di ogni f limitata definita su X rispetto a tale PVM coincide con quello di f , estesa come la funzione nulla sulla parte rimanente di R2 , calcolato rispetto alla PVM iniziale P (V ) . Applicando la definizione di integrale di funzioni misurabili non limitate, il risultato si estende anche a tale classe di funzioni). Definiamo ora la funzione a valori in C, misurabile non limitata su X: f (z) := i 1+z 1−z z ∈X, (9.35) e quindi integriamola rispetto alla misura spettrale P (V ) su X, ottenendo l’operatore (non limitato in generale): Z T 0 := f (z)dP (V ) (x, y) . (9.36) X Dato che f assume valori reali (quando (x, y) ∈ X), l’operatore T 0 è necessariamente autoaggiunto. L’identità f (z)(1 − z) = i(1 + z), in virtù di (iii) in (c) del teorema 9.1, implica: T 0 (I − V ) = i(I + V ) . (9.37) In particolare (9.37) implica che Ran(I − V ) ⊂ ∆f =: D(T 0 ). Dal teorema teorema 5.4 abbiamo che T (I − V ) = i(I + V ) e D(T ) = Ran(I − V ) ⊂ ∆f . Per confronto con (9.37), concludiamo che T 0 deve essere un estensione autoaggiunta di T . Dato che T = T ∗ e quindi non ammette altre estensioni autoaggiunte, deve essere T = T 0 . Abbiamo ottenuto che: Z T = f (z)dP (V ) (x, y) . (9.38) X 294 La funzione f : X → R è in realtà biettiva e pertanto ricopre tutto R. Applicando allora (d) del teorema 9.1, abbiamo finalmente che: B(R) 3 E 7→ P (T ) (E) := P (V ) (f −1 (E)) è una PVM su R ed inoltre (9.38) può essere riscritta come la (9.31): Z λdP (T ) (λ) . T = R Questo è lo sviluppo spettrale che volevamo provare esistere. Passiamo all’unicità della misura spettrale che soddisfa (9.31). Sia P 0 una PVM su R con: Z λdP 0 (λ) . T = R La trasformata di Cayley si può allora scrivere, in base a (c) del teorema 9.1: V = (T − iI)(T + iI) −1 Z = R λ−i dP (T ) (λ) . λ+i Usando (d) dello stesso teorema e dove f : X → R è la stessa funzione biettiva definita sopra: Z V = zdP (T ) (f −1 (x, y)) , S1 dove B(S1 ) 3 E 7→ Q(E) := P 0 (f −1 (E)) risulta essere una PVM su X = S1 \ {1}. Possiamo estendere in modo ovvio tale PVM su R2 richiedendo che, se F ∈ B(R2 ), Q(F ) = Q(F ∩ X). Abbiamo allora che: Z V = zdQ(x, y) . R2 Dato che vale anche (9.33), per l’unicità della misura spettrale associata ad un operatore normale limitato per il teorema 8.6, deve accadere che: Q(F ) = P (V ) (F ) per ogni boreliano di R2 . Riducendosi ad insiemi in X = S1 \ {1}, dovrà anche valere: P 0 (f −1 (E)) = P (T ) (f −1 (E)) e quindi, dato che f −1 è biettiva da R a X, deve essere: P 0 (G) = P (T ) (G) per ogni sottoinsieme boreliano G di R. (b) Passiamo a dimostrare che σ(T ) = supp(P (T ) ). Dimostreremo equivalentemente che λ0 ∈ ρ(T ) se e solo se λ0 6∈ supp(P (T ) ). Per prima cosa proviamo che λ0 6∈ supp(P (T ) ) implica λ0 ∈ ρ(T ). Infatti, nell’ipotesi fatta su λ0 , esiste un intervallo aperto (a, b) ⊂ R \ supp(P (T ) ) con λ0 ∈ (a, b). Di conseguenza: Z R 1 dP (T ) (λ) = λ − λ0 Z R χR\(a,b) (λ) 1 dP (T ) (λ) . λ − λ0 Applicando (c) del teorema 9.1, dato che, nel secondo integrale, la funzione integranda è limitata concludiamo che l’operatore: Z Rλ0 (T ) := R 1 dP (T ) (λ) λ − λ0 295 è limitato ed ha dominio pari a tutto H. Inoltre, sempre per (iii) in (c) dello lo stesso teorema, prestando attenzione ai domini su cui ha senso definire il prodotto di operatori, otteniamo: Rλ0 (T )(T − λ0 I) = ID(T ) , (T − λ0 I)Rλ0 (T ) = I . Si osservi che la seconda identità vale su tutto H e pertanto abbiamo da essa che deve anche valere: Ran(T − λ0 I) = H. L’operatore Rλ0 (T ) è quindi, come la notazione suggerisce, il risolvente di T associato a λ0 e quindi, per definizione λ0 ∈ ρ(T ). Passiamo ora a provare che λ0 ∈ ρ(T ) implica λ0 6∈ supp(P (T ) ). Nelle ipotesi dette per λ0 , P (T ) ({λ0 }) = 0, altrimenti (T ) esisterebbe ψ ∈ P{λ0 } (H) \ {0} che implicherebbe (per (iii) in (c) del teorema 9.1): Z Tψ = R (T ) λdP (T ) (λ)P{λ0 } ψ = Z Z λdP (T ) (λ) R Z χ{λ0 } (λ)dP (T ) (λ)ψ = Z R λχ{λ0 } (λ)dP (T ) (λ)ψ R (T ) = R λ0 χ{λ0 } (λ)dP (T ) (λ)ψ = λ0 P{λ0 } ψ = λ0 ψ e dunque ψ ∈ σp (T ) che è impossibile, dato che λ0 ∈ ρ(T ). Ulteriormente, nelle stesse ipotesi su λ0 esiste l’operatore risolvente Rλ0 (T ), cioè l’operatore limitato con dominio: D(Rλ0 (T )) = Ran(T − λ0 I) = H , per (a) in teorema 8.1, essendo T = T ∗ e quindi T è chiuso, che soddisfa (T − λ0 I)Rλ0 (T ) = I e anche Rλ0 (T )(T − λ0 I) = ID(T ) . D’altra parte, da (iii) in (c) del teorema 9.1 e tenendo conto che, P (T ) ({λ0 }) = 0, si trova subito (facendo attenzione ai domini sui quali valgono le identità ): Z Z 1 1 (T ) dP (λ) (T − λ0 I) = ID(T ) , (T − λ0 I) dP (T ) (λ) = I . R λ − λ0 R λ − λ0 1 Si osservi che dalla prima identità si evince anche che il dominio di R λ−λ dP (T ) (λ) è D(T −λ0 I), 0 cioè con tutto lo spazio H, per quanto detto sopra. Non è importante come abbiamo definito la 1 funzione λ 7→ λ−λ esattamente per λ = λ0 , dato che P (T ) ({λ0 }) = 0. Per l’unicità dell’operatore 0 inverso deve allora essere: Z 1 dP (T ) (λ) = Rλ0 (T ) , R λ − λ0 dunque l’operatore a primo membro deve essere limitato. Supponiamo allora, per assurdo, che sia λ0 ∈ supp(P (T ) ), allora ogni aperto che contiene λ0 e quindi, in particolare, ogni intervallo (T ) In := (λ0 − 1/n, λ0 + 1/n), deve soddisfare P (T ) (In ) 6= 0. Sia allora ψn ∈ PIn (H) \ {0} per ogni n = 1, 2, . . .. Senza perdere generalità supponiamo anche che: ||ψn || = 1. Con questa scelta ed usando (vi) in (c) del teorema 9.1, si ottiene che: R Z ||Rλ0 (T )ψn ||2 = ≥ inf In 1 |λ − λ0 |2 Z In R 2 1 dP (T ) (λ)ψn = λ − λ0 dµψn (λ) ≥ inf In Z In 1 dµψn (λ) |λ − λ0 |2 1 = n2 → +∞ |λ − λ0 |2 296 se n → +∞. Pertanto abbiamo raggiunto l’assurdo che Rλ0 (T ) non può essere limitato. Quindi deve valere λ0 6∈ supp(P (T ) ). Dimostriamo ora che vale (i). Come visto nella dimostrazione appena conclusa, se P (T ) ({x}) 6= 0, allora x ∈ σp (T ). Supponiamo ora che x ∈ σp (T ). Dalla definizione di trasformata di Cayley V di T , segue facilmente che ((x − i)/(x + i)) ∈ σp (V ). Possiamo allora applicare (i) in (b)del teorema 8.6 per l’operatore normale V (dato che è unitario) sostituito a T nell’enunciato di quel x−i teorema. Concludendo che P (V ) ( x+i ) 6= 0. Per come abbiamo ricavato la PVM associata a T x−i da quella associata a V , segue immediatamente che P (T ) (x) = P (V ) ( x+i ) 6= 0. Passiamo a dimostrare (ii). Per (a) in proposizione 8.3, x ∈ σc (T ) significa che (a) x ∈ σ(T ), ma (b) x 6∈ σp (T ). L’affermazione (a) equivale a x ∈ supp(P (T ) ) e quindi ogni aperto Ax che include x deve verificare P (T ) (Ax ) 6= 0, la (b) equivale quindi a dire P (T ) ({x}) = 0 (altrimenti, per (i) avremmo un assurdo). La prova di (iii) è immediata, se x ∈ supp(P (T ) ) ed è un punto isolato, deve essere P (T ) ({x}) 6= 0, altrimenti x non potrebbe appartenere a supp(P (T ) ), applicando (i) segue la tesi. Per concludere dimostriamo (iv). Se x ∈ σc (T ), allora applicando (iv) per la classe di intervalli In := (x − 1/n, x + 1/n), con n = 1, 2, . . ., deve risultare P (T ) (In ) 6= 0. Scegliamo pertanto (T ) ψn ∈ PIn (H), per ogni n e tale che ||ψn || = 1. Avremo allora che: Z Z 2 (T ) (T ) ||T ψn − xψn || = (λ − x)dP (λ)ψn ψ (λ − x)dP (λ)ψ = Z R R R Z (T ) (λ − x)dP (T ) (λ)PIn ψn (λ − x)dP (T ) (λ)ψn R Applicando (iii) in (c) in teorema 9.1, l’ultimo prodotto scalare si scrive Z Z χIn (x)(λ − x)2 dµψn (λ) ≤ =n −2 Z In dµψn (λ) = n −2 sup(λ − x)2 dµψn (λ) = In In R Z dµψn (λ) = n−2 ||ψn ||2 . R Abbiamo trovato che, per ogni n = 1, 2, . . ., esiste ψn 6= 0, con ||ψn || = 1 e tale che: ||T ψn − xψn || ≤ 1/n . Questo implica immediatamente la tesi dato che deve anche essere 0 < ||T ψn − xψn || perchè altrimenti sarebbe x ∈ σp (T ) cosa che abbiamo escluso, essendo x ∈ σc (T ) per ipotesi. 2 Dopo il teorema spettrale, possiamo dare una utile definizione per le applicazioni in meccanica quantistica. Definizione 9.2. Sia T operatore autoaggiunto sullo spazio di Hilbert H. Se f : R → C, l’operatore Z f (x)dP (T ) (x) , f (T ) := R 297 (9.39) § D(f (T )) = ∆f := ψ ∈ H con dominio Z ª |f (x)|2 dµψ (x) < +∞ R è detto funzione f dell’operatore T . Osservazioni. (1) Il teorema spettrale consente una differente decomposizione dello spettro di un operatore autoaggiunto T : D(T ) → H. Un decomposizione è quella in spettro discreto, σd (T ), e spettro essenziale, σess (T ) := σ(T ) \ σd (T ), dove: n (T ) σd (T ) := λ ∈ σ(T ) dim P(λ−,λ+) (H) è al più numerabile per qualche > 0 o . Si dimostra facilmente che λ ∈ σd (T ) se e solo se λ è un punto isolato di σ(T ). Di conseguenza, per il teorema 9.2, σd (T ) ⊂ σp (T ). Tuttavia, in generale, non è vera l’inclusione opposta, perchè possono esserci punti di σp (T ) non isolati (si pensi al caso in cui 0 è un autovalore ed anche punto di accumulazione dello spettro di alcuni operatori compatti autoaggiunti). (2) Una terza decomposizione dello spettro di un operatore autoaggiunto T : D(T ) → H, si ottiene decomponendo lo spazio di Hilbert nel sottospazio chiuso Hp generato dagli autovettori ⊥ e nel suo ortogonale: H = Hp ⊕ H⊥ p . Si vede facilmente che Hp , Hp ⊂ D(T ) e tali spazi sono invarianti sotto l’azione di T . Con ovvie notazioni: T = T Hp ⊕T H⊥ . p Vale ovviamente σp (T ) := σ(T Hp ), mentre si definisce lo spettro puramente continuo σpc (T ) := σ(T H⊥ ). Risulta σ(T ) = σp (T ) ∪ σpc (T ). Si noti che questa decomposizione non p è necessariamente in due insieme disgiunti e nel caso generale σpc (T ) 6= σc (T ). (3) Una quarta decomposizione dello spettro, per un operatore, T : D(T ) → H sullo spazio di Hilbert H (ma la definizione si può dare per un generico spazio normato), è quella in spettro puntuale approssimato, σpa (T ) e spettro residuo puro σrp (T ) := σ(T ) \ σps (T ), dove: σpa (T ) := λ ∈ σ(T ) | (T − λI)−1 : Ran(T − λI) → D(T ) non esiste oppure non è limitato. Osservando che la non limitatezza di (T − λI)−1 è equivalente al fatto che esiste δ > 0 con ||(T − λI)ψ|| ≥ δ||ψ|| per ogni ψ ∈ D(T ), si dimostra immediatamente il seguente risultato che giustifica la terminologia. λ ∈ σpa (T ) se e solo se, per ogni > 0, esiste ψ ∈ D(T ) con ||ψ|| = 1 tale che: ||T ψ − λψ|| ≤ . Dato che, per gli operatori autoaggiunti, la proprietà di sopra vale per ogni λ ∈ σc (T ) per (b) del teorema 8.6, ma anche per λ ∈ σp (T ) banalmente, e tenendo conto che σ(T ) = σp (T ) ∪ σc (T ) nel caso in esame, concludiamo che σpa (T ) = σ(T ) e σrp (T ) = ∅ per tutti gli operatori autoaggiunti. (4) Dato che supp(P (T ) ) = σ(T ), la definizione (9.39) può equivalentemente essere scritta: Z f (x)dP (T ) (x) . f (T ) := σ(T ) 298 (9.40) Nello stesso modo, dato che supp(µφ,ψ ) ⊂ supp(P (T ) ), possiamo equivalentemente scrivere per il dominio di f (T ): Z ¨ « 2 D(f (T )) = ψ ∈ H |f (x)| dµψ (x) < +∞ . σ(T ) (5) Da (iv) in (c) del teorema 9.1 risulta che, per ogni operatore autoaggiunto T , il dominio naturale di un polinomio p(T ) ed il dominio dello stesso operatore pensato come funzione di T coincidono. Dalla definizione di dominio naturale si ha anche che: D(T m ) ⊂ D(T n ) per ogni operatore autoaggiunto T e per 0 ≤ n ≤ m, con n, m ∈ N. (9.41) Le funzioni di un operatore godono allora delle notevoli proprietà che seguono immediatamente dal teorema 9.1. La seguente proposizione specifica ulteriori proprietà in relazione allo lo spettro dell’operatore autoaggiunto T . Ricordiamo che f : X → Y, con X, Y spazi normati, è detta essere localmente lipschitziana se, per ogni x ∈ X, esistono un intorno aperto Ix e una costante LIx ≥ 0 (che diremo di Lipschitz) tali che ||f (z) − f (z 0 )||Y ≤ LIx ||z − z 0 ||X per ogni z, z 0 ∈ X. Proposizione 9.1. Sia T operatore autoaggiunto sullo spazio di Hilbert H e f : R → C una funzione misurabile. L’operatore f (T ) gode delle seguenti proprietà. (a) σ(f (T )) ⊂ f (σ(T )) dove la barra indica la chiusura topologica. Vale σ(f (T )) = f (σ(T )) se f è derivabile su R oppure, più debolmente, se è localmente lipschitziana. (b) Vale f (σp (T )) ⊂ σp (f (T )). Prova. to che R (a) Sia x0 6∈ f (σ(T )). Allora la funzione σ(T ) 3 x 7→ 1 f (x)−x0 è limitata. Da- supp(P (T ) ) = σ(T ) per il teorema 9.2, dobbiamo allora concludere che l’operatore sia limitato e con dominio dato da tutto H. Vale inoltre, applicando (iii) in (c) del teorema 9.1 e tenendo conto dei domini degli operatori: 1 (T ) (x) R f (x)−x0 dP Z R e anche che: 1 dP (T ) (x) f (x) − x0 Z R Z (f (x) − x0 )dP (f (x) − x0 )dP (T ) (x) = ID(f (T )−x0 I) , R (T ) Z (x) R 1 dP (T ) (x) = I . f (x) − x0 Dalla seconda siRevince che Ran(f (T ) − x0 I) = H. Tenendo conto della prima identità e del fatto 1 che l’operatore R f (x)−x dP (T ) (x) è limitato, abbiamo ottenuto che quest’ultimo operatore è il 0 risolvente di f (T ) associato a x0 ; di conseguenza x0 ∈ ρ(f (T )), cioè x0 6∈ σ(f (T )). Abbiamo provato che, se x0 ∈ σ(f (T )), allora x0 ∈ f (σ(T )). In altre parole: σ(f (T )) ⊂ f (σ(T )). Mostriamo ora che l’inclusione è un identità se f è derivabile o localmente lipschitziana sull’asse reale. In realtà proveremo che f (σ(T )) ⊂ σ(f (T )). Questo concluderà la dimostrazione, in 299 quanto essendo ogni spettro chiuso, si ha di conseguenza f (σ(T )) ⊂ σ(f (T )). Supponiamo dunque che x0 = f (λ0 ) ∈ f (σ(T )), dove λ0 ∈ σ(T ) può non essere unico, e proviamo che x0 ∈ σ(f (T )). Nelle ipotesi su x0 , se qualche λ0 ∈ σp (T ), la dimostrazione si conclude per l’asserto (b) di questa proposizione (la cui dimostrazione non dipende da quella che stiamo facendo), valendo x0 = f (λ0 ) ∈ σp (f (T )) ⊂ σ(f (T )). Se per ogni λ0 che individua il fissato x0 tramite f vale λ0 6∈ σp (T ), allora per ciascuno di tali λ0 deve essere P (T ) ({λ0 }) = 0 per (ii) in (b) del teorema 9.2. Assumiamo di essere in questo caso e, per assurdo, che x0 6∈ σ(f (T )). Di conseguenza x0 ∈ ρ(f (T )) e questo significa che l’operatore chiuso f (T ) − x0 I è una biezione da D(f (T )) a tutto H, per (a) del teorema 8.1. Consideriamo infine l’identità , che sussiste su D(f (T )) in virtù di (iii) in (c) del teorema 9.1: Z R 1 dP (T ) (λ)(f (T ) − x0 I) = f (λ) − x0 Z R f (λ) − x0 (T ) dP (λ)D(f (T )) = ID(f (T )) . f (λ) − x0 Si osservi che la definizione della funzione 1/(f (λ)−x0 ) in (ogni) λ0 è del tutto irrilevante dato che R 1 (T ) (λ) dP P (T ) ({λ0 }) = 0. L’identità operatoriale trovata dice anche che il dominio di R f (λ)−x 0 deve essere tutto H, dato che Ran(f (T ) − x0 I) = H nelle nostre ipotesi: Z 1 (T ) D dP (λ) = H . (9.42) R f (λ) − x0 Dimostriamo che (9.42) è falsa se f è derivabile su R, arrivando ad un assurdo. Fissiamo uno R 1 dei valori λ0 . Dato che λ0 ∈ σ(T ), l’operatore R λ−λ dP (T ) (λ) non può essere definito su tutto 0 H, altrimenti, ragionando come sopra, T − λ0 I sarebbe una biezione da D(T ) a tutto H ed avremmo un assurdo. Dato che, per ogni intervallo aperto limitato I che include λ0 , la funzione (T ) 1/(λ − λ0 ) è limitata su R \ I, deve accadere che, per ogni detto I, esista ψI ∈ PI (H) tale che R 1 dP (T ) (λ) . ψI 6∈ D R λ−λ 0 (T ) (T ) (Altrimenti potremmo decomporre ogni ψ ∈ H come ψ = PI ψ + PR\I ψ ed avremmo, spezR 1 zando l’integrale nei due contributi su I e su R \ I, che R |λ−λ 2 dµψ (λ) < +∞ e quindi 0| R 1 (T ) D R λ−λ0 dP (λ) = H.) Se L := df dλ λ0 , 2 df vale dλ < |L|2 + e quindi, in un intervallo aperto I che include λ0 e per λ0 qualche > 0: |f (λ) − f (λ0 )|2 ≤ (|L|2 + )|λ − λ0 |2 . Si arriva allo stesso risultato se f è localmente lipschitziana e L è una costante di Lipschitz in I. Pertanto: Z R 1 dµψI (λ) ≥ |f (λ) − f (λ0 )|2 Z I R Abbiamo provato che ψI 6∈ D do conclude la dimostrazione. 1 1 dµψI (λ) ≥ 2 2 |f (λ) − f (λ0 )| |L| + 1 (T ) (λ) R f (λ)−x0 dP 300 Z I 1 dµψI (λ) = +∞ . |λ − λ0 |2 , in contraddizione con (9.42). Questo assur- (b) Se λ0 ∈ σp (T ), allora P (T ) ({λ0 }) = 6 0 per (i) di (b) del teorema 9.2. Valendo P (T ) ({λ0 }) = R (T ) (x), applicando (iii) in (c) del teorema 9.1, prestando attenzione ai domini di R χ{λ0 } (x)dP validità delle identità , si trova che: f (T )P (T ) ({x0 }) = Z R Z = f (x)dP (T ) (x) Z χ{x0 } (x)dP (T ) (x) = R f · χ{x0 } (x)dP (T ) (x) R f (x0 )χ{x0 } (x)dP (T ) (x) = f (λ0 ) R Z Z χ{x0 } (x)dP (T ) (x) = f (x0 )P (T ) ({x0 }) R che è la tesi. 2 Esercizi 9.1. (1) Si consideri una PVM P : B(X) 3 E 7→ P (E) ∈ B(H) e un operatore unitario (cioé ) isometrico suriettivo V : H → H0 , dove H è un secondo spazio di Hilbert complesso. Si dimostri che: P 0 : B(X) 3 E 7→ P 0 (E) := V P (E)V −1 ∈ B(H0 ) è ancora una PVM. (2) In riferimento all’esercizio (1), si provino i seguenti fatti. (i) Se f : X → C è misurabile allora ψ ∈ ∆f se e solo se V ψ ∈ ∆0f , dove ∆0f è il dominio dell’integrale di f secondo P 0 . R R (ii) V X f (x)dP (x)V −1 = X f (x)dP (x). (3) Dimostrare che (iv) in (b) del teorema 9.2 può essere rinforzata in: Sia T : D(T ) → H operatore autoaggiunto nello spazio di Hilbert H. λ ∈ σc (T ) se e solo se, per ogni > 0, esiste φ ∈ D(T ) con ||φ || = 1 e 0 < ||T φ − λφ || ≤ . Suggerimento. Se vale quanto detto, λ non può appartenere a σp (T ), quindi esiste sicuramente (T −λI)−1 : Ran(T −λI) → D(T ) e quindi λ ∈ σ(T ) = σp (T )∪σc (T ). Può essere limitato (T − λI)−1 ? (4) Si consideri uno spazio L2 (X, µ) con µ positiva e finita sulla sigma algebra di Borel di X spazio topologico. Se f : X → R è una qualunque funzione reale misurabile localmente L2 (cioé f · g ∈ L2 (X, µ) per ogni g ∈ Cc (X)) si consideri l’operatore su L2 (X, µ) Tf : h 7→ f · h dove D(Tf ) := {h ∈ L2 (X, µ) | f · h ∈ L2 (X, µ)}. Dopo aver provato che Tf è autoaggiunto, si dimostri che σ(Tf ) = ess ran(f ) . Se f : X → R, ess ran(f ) è il rango essenziale della funzione misurabile f definito come: C 3 v ∈ ran ess(f ) se e solo se µ f −1 (v − , v + ) > 0 per ogni > 0. Suggerimento. Il dominio di Tf è denso perché f è localmente L2 , il fatto che Tf sia autoaggiunto si prova calcolando direttamente Tf∗ e notando che coincide con Tf . La seconda parte 301 si dimostra osservando che λ ∈ ρ(Tf ) se solo se esiste il risolvente Rλ (Tf ) su tutto L2 (X, µ) ed è limitato, cioè , esiste M > 0 tale che: ||Rλ (Tf )h|| ≤ M per ogni h ∈ L2 (X, µ) con ||h|| = 1. In altre parole λ ∈ ρ(Tf ) se e solo se: Z X |h(x)|2 dµ(x) < M |f (x) − λ|2 per ogni h ∈ L2 (X, µ) con ||h|| = 1 . Se λ 6∈ ess ran(f ), si vede immediatamente dalla definzione di rango essenziale e usando µ(X) < +∞, che la condizione scritta sopra è soddisfatta, per cui: λ 6∈ ess ran(f ) implica λ 6∈ σ(Tf ). Se λ ∈ ess ran(f ), applicando ancora la definizione di rango essenziale, si costruisce una successione R 2 di hn , con ||hn || = 1 tale che: X |f|h(x)| dµ(x) > 1/n2 per ogni n = 1, 2, . . .. Quindi λ ∈ (x)−λ|2 ess ran(f ) implica λ ∈ σ(Tf ). 9.1.3 Un esempio a spettro puntuale: l’hamiltoniano dell’oscillatore armonico Consideriamo l’operatore, nello spazio di Hilbert complesso L2 (R, dx) (dove dx indica la misura di Lebesgue su R), 2 mω 2 2 1 P S(R) + XS(R) , H0 := − 2m 2 dove X e P sono l’operatore posizione ed impulso per la particella sulla retta reale introdotti nella sezione 5.3.2. In altre parole: H0 := − ~2 d2 mω 2 2 + x , 2m dx2 2 dove il termine x2 si deve intendere come l’operatore moltiplicativo per la funzione R 3 x 7→ x2 e ~, ω, ω sono costanti strettamente positive; infine D(H0 ) := S(R), dove S(R) è lo spazio di Schwartz su R delle funzioni complesse infinitamente differenziabili che si annullano all’infinito, con tutte le derivate, più velocemente di ogni potenza negativa di x (vedi sezione 3.6). Le costanti ~, ω, ω non hanno alcun interesse matematico e possono essere poste tutte uguali ad 1 nel seguito, tuttavia hanno un significato fisico importante. L’operatore H0 si dice hamiltoniano dell’oscillatore armonico unidimensionale e pulsazione caratteristica ω, per una particella di di massa m; h := 2π~ è la costante di Planck. Dal punto di vista fisico, H0 rappresenta l’osservabile energia per il sistema considerato, tuttavia, in questa sezione, non ci occuperemo delle motivazioni fisiche per introdurre tale operatore che studieremo esclusivamente da un punto di vista matematico, rimandando ogni commento di carattere fisico ai capitoli 11 e 12. H0 è evidentemente simmetrico dato che è hermitiano e S(R) è denso in L2 (R, dx). H0 ammette estensioni autoaggiunte per il criterio di von Neumann (teorema 5.7), dato che commuta con l’operatore antinunitario dato dalla coniugazione complessa delle funzioni di L2 (R, dx). Mostreremo che H0 è essenzialmente autoaggiunto, daremo la sua espressione esplicita in termini dello sviluppo spettrale della sua unica estensione autoaggiunta H0 e, contestualmente, preciseremo 302 la forma del suo spettro. Introduciamo tre operatori, detti rispettivamente operatore di creazione, operatore di distruzione e operatore numero di occupazione: É É mω mω ~ d ~ d ? A := x+ , A := x− , N := A? A . 2~ mω dx 2~ mω dx Anche in questo caso assumiamo che gli operatori siano densamente definiti con dominio D(A) = D(A? ) = D(N) := S(R). Deve essere chiaro che A? ⊂ A∗ , e questo giustifica la notazione, inoltre N è simmetrico. Si osservi anche che S(R) è uno spazio denso e invariante per H0 , A e A? . Usando A e A? costruiremo un insieme di autovettori per N e H0 che formano una base hilbertiana di L2 (R, dx). Dato che gli autovettori sono ovviamente vettori analitici, questo fatto prova, in base al criterio di Nelson (teorema 5.8), che H0 e N sono essenzialmente autoaggiunti sul loro dominio S(R). Cominciamo con il notare che, in base alle definizioni date per A e A? , valgono le relazioni di commutazione: [A, A? ] = I , (9.43) dove i due membri sono valutati sugli elementi dello spazio denso invariante S(R). La verifica delle relazioni di sopra è immediata dalle definizioni date. Ulteriormente, dalla definizione di A e A? , con qualche calcolo risulta che: 1 1 H0 = ~ω A? A + I = N + I . (9.44) 2 2 Consideriamo l’equazione in S(R): Aψ0 = 0 , (9.45) Una soluzione si ottiene facilmente essere: 2 1 − x √ e (2k)2 , ψ0 (x) = π 1/4 k Ê k := ~ , mω dove abbiamo scelto il fattore davanti alla funzione in modo tale che ||ψ0 || = 1. Notiamo che questa funzione altro non è che la prima funzione di Hermite introdotta √ in (4) di Esempi 3.2, 0 quando si passa alla variabile x = x/k e si tiene conto del fattore 1/ k per non alterare la normalizzazione. Se ora definiamo i nuovi vettori, per n = 1, 2, . . .: (A? )n ψn := √ ψ0 , n! si prova facilmente per induzione, usando solamente (9.45), (9.43) che, per n, m ∈ N: √ √ Aψn = nψn−1 , A? ψn = n + 1ψn+1 , (ψn |ψm ) = δnm . 303 (9.46) (9.47) Infatti, la seconda identità segue immediatamente dalla definizione dei vettori ψn , la prima si prova come segue: 1 1 1 1 Aψn = √ A(A? )n ψ0 = √ [A, (A? )n ]ψ0 + √ (A? )n Aψ0 = √ [A, (A? )n ]ψ0 + 0 ; n! n! n! n! d’altra parte, da (9.43) segue subito che: [A, (A? )n ] = n(A? )n−1 , che inserita sopra produce la prima identità in (9.47). La terza identità si dimostra come segue: 1 1 n (ψm−1 |A(A? )n ψ0 ) = √ (ψm−1 |[A, (A? )n ]ψ0 ) = √ (ψm−1 |(A? )n−1 ψ0 ) = n!m n!m n!m É n = (ψm−1 |ψn−1 ) . m! È Iterando la procedura, si ottiene il valore 0 se m 6= n, oppure n/n = 1 se m = n. La seconda identità in (9.47) (passando alla variabile x0 = x/k che non altera la normalizzazione √ delle funzioni a causa dell’ulteriore fattore 1/ k) altro non è che la relazione di ricorrenza tra le funzioni di Hermite citata in (4) di Esempi 3.2. Concludiamo che le funzioni ψn sono (a parte un fattore ed un cambio di variabile) le funzioni di Hermite e quindi formano una base hilbertiana di L2 (R, dx). Dall’ultima relazione risulta che {ψn }n∈N è , come deve essere, un insieme di vettori ortonormali di L2 (R, dx), mentre usando le prime due si ottiene subito che: (ψm |ψn ) = √ Nψn = nψn , (9.48) e quindi, da (9.44), abbiamo che i vettori ψn formano una base hilbertiana di autovettori di H0 , dato che vale: 1 H0 ψn = ~ω n + ψn . (9.49) 2 Per inciso questo mostra che H0 (ma anche N) è un operatore illimitato, dato che l’insieme {||H0 ψ|| | ψ ∈ D(H0 ) , ||ψ|| = 1} include tutti i numeri ~ω(n + 1/2) con n ∈ N. Concludiamo anche che, per il criterio di Nelson (teorema 5.8), gli operatori simmetrici N e H0 sono entrambi essenzialmente autoaggiunti, dato che nel loro dominio c’è un insieme di vettori analitici, {ψn }n∈N , le cui combinazioni lineari finite sono dense in L2 (R, dx). Per ottenere la decomposizione spettrale di H0 consideriamo spazio topologico dato dalla base hilbertiana N = {ψn }n∈N dotata dalla topologia dell’insieme delle parti, e costruiamo la misura spettrale: X P : B(N ) 3 E 7→ PE = ψn (ψn | ) ψn ∈E comein (1) in esempi 9.1. Costruiamo un’analoga misura spettrale su R che abbia supporto sull’insieme degli autovalori associati agli autovettori ψn di H0 : PF0 := s- X ψn (ψn | ~ω(n+1/2)∈F ) 304 per F ∈ B(R). Quindi consideriamo la funzione misurabile φ : N 3 ψn 7→ ~ω n + 12 . Applicando (c) del teorema 9.1, abbiamo che, per ogni funzione f : R → C misurabile: Z Z X 1 0 f ~ω n + f (x)dP (x) = f (φ(z))dP (z) = sψn (ψn | ) 2 R N n∈N dove l’ultima identità non è altro che la (9.27). Specializzando la funzione f a R 3 x 7→ x, abbiamo l’espressione esplicita dell’operatore autoaggiunto (per il teorema 9.1): Z X 1 ψn (ψn | ) . (9.50) H00 := xdP 0 (x) = s~ω n + 2 R n∈N Mostriamo ora che H00 = H0 . Sia < N > lo spazio denso delle combinazioni lineari finite dei vettori ψn . H0 <N > è ancora essenzialmente autoaggiunto per il criterio di Nelson. Questo significa che H0 = H0 <N > , cioè H0 e H0 <N > hanno la stessa (unica) estensione autoaggiunta (pari alla loro chiusura). D’altra parte H00 è sicuramente un’estensione autoaggiunta di H0 <N > , dato che, come si prova immediatamente da (9.50), 1 H00 ψn = ω n + ψn = H0 ψn 2 per ogni n, e quindi H00 <N > = H0 <N > . Concludiamo che l’operatore autoaggiunto H00 deve essere l’unica estensione autoaggiunta di H0 <N > e quindi anche di H0 . Concludiamo anche che la misura spettrale, associata a H0 dal teorema 9.2 di decomposizione spettrale è : PF0 := s- X ψn (ψn | ~ω(n+1/2)∈F ) per F ∈ B(R). ma anche che la decomposizione spettrale di H0 è : X 1 H0 = s~ω n + ψn (ψn | ) 2 n∈N Infine, usando (b) nel teorema 9.2, dalla misura spettrale trovata per H0 si evince facilmente che: § ª 1 σ(H0 ) = σp (H0 ) = ~ω n + n ∈ N . 2 Si deve notare che lo spettro di H0 è completamente puntuale e gli autospazi sono tutti finitodimensionali, anche se l’operatore in questione non è compatto, dato che è illimitato. Tuttavia le prime due potenze intere inverse di H0 sono compatte, essendo rispettivamente un operatore di Hilbert-Schmidt e uno di classe traccia (lo si provi per esercizio). I numeri in σp (H0 ) sono, dal punto di vista fisico, gli unici valori dell’energia meccanica totale che un oscillatore quantistico, con dati valori di ω ed m, può assumere, al contrario del caso classico in cui i valori dell’energia sono continui. 305 9.1.4 Un esempio a spettro continuo: gli operatori posizione ed impulso. Torniamo sugli operatori posizione Xi (5.9)-(5.10) ed impulso Pi (5.14)-(5.15), per i = 1, 2, 3, sullo spazio di Hilbert H = L2 (R3 , dx), dove dx è la misura di Lebesgue su R3 . Nel seguito x = (x1 , x2 , x3 ). Abbiamo visto che gli operatori suddetti sono autoaggiunti. Ora ne determineremo lo sviluppo spettrale e lo spettro. Cominciamo con l’operatore posizione X1 . Quanto diremo per esso vale anche per X2 e X3 , dato che la loro definizione è completamente simmetrica scambiando i nomi degli operatori. Una PVM su R a valori in B(H) = B(L2 (R3 , dx)) si ottiene definendo: per ogni E ∈ B(R) e ogni ψ ∈ L2 (R3 , dx). (9.51) (P (E)ψ)(x1 , x2 , x3 ) = χE (x1 )ψ(x1 , x2 , x3 ) In questo modo si vede facilmente che, se ψ ∈ L2 (R3 , dx), la misura µψ su B(R) è definita come: Z µψ (E) = E×R2 |ψ(x1 , x2 , x3 )|2 dx per ogni E ∈ B(R), conseguentemente, se g : R → C è misurabile: Z Z g(y)dµψ (y) = R E×R2 f (x1 )ψ(x1 , x2 , x3 )dx . (9.52) Procedendo similmente a quanto fatto in (2) in esempi 9.1, si verifica facilmente che, se f : R → C R è misurabile e ψ ∈ ∆f (cioè R |f (x1 )ψ(x1 , x2 , x3 )|2 dx < +∞), allora Z f (y)dP (y)ψ (x1 , x2 , x3 ) = f (x1 )ψ(x1 , x2 , x3 ) quasi ovunque per (x1 , x2 , x3 ) ∈ R3 . R (9.53) Possiamo allora definire l’operatore autoaggiunto X10 come l’operatore associato, nello sviluppo (9.53), alla funzione f := f1 con f1 : R 3 y 7→ y. Tale operatore è autoaggiunto per (ii) in (c) del teorema 9.1, dato che questa funzione è reale. Inoltre, per confronto con la (5.10) abbiamo immediatamente che ∆f1 = D(X1 ) e, da (9.53) troviamo subito che X10 ψ = X1 ψ per ogni ψ ∈ D(X1 ). Concludiamo, dall’unicità della misura spettrale sancita nel teorema di decomposizione spettrale (9.2), che (9.51) è la misura spettrale associata all’operatore posizione X1 . Lo sviluppo spettrale di Xi , per i = 1, 2, 3, deve dunque essere: Z ydP (Xi ) (y)ψ (x1 , x2 , x3 ) = (Xi ψ)(x1 , x2 , x3 ) quasi ovunque per (x1 , x2 , x3 ) ∈ R3 , (9.54) R dove: (P (Xi ) (E)ψ)(x1 , x2 , x3 ) = χE (xi )ψ(x1 , x2 , x3 ) 306 per ogni E ∈ B(R) e ogni ψ ∈ L2 (R3 , dx). (9.55) Questa misura spettrale consente di individuare lo spettro di Xi , per i = 1, 2, 3. Applicando (ii) in (b) del teorema 9.1, si trova immediatamente che σ(Xi ) = σc (Xi ) = R . (9.56) Passiamo agli operatori impulso. La discussione è abbastanza diretta in virtù della proposizione 5.6, tenendo conto del fatto che la trasformata di Fourier-Plancherel è una trasformazione unitaria. Prima di tutto, dato che le trasformazioni unitarie, conservano gli spettri degli operatori (vedi (7) in esercizi 8.1), abbiamo immediatamente che (indicando gli operatori posizione con Ki come nella proposizione 5.6): σ(Pi ) = σ(~F̂−1 Ki F̂) = ~R = R , cioè : σ(Pi ) = σc (Pi ) = R . (9.57) La misura spettrale di Pi deve dunque avere supporto su tutto R. Il lettore può facilmente dimostrare che, in base alla proposizione 5.6, e tenendo conto degli esercizi 9.1, la PVM associata all’operatore impulso Pi è semplicemente definita come P (Pi ) (E) = F̂−1 P (Ki ) F̂ per ogni E ∈ B(R). (9.58) dove P (Ki ) è la misura spettrale dell’operatore posizione, ora indicato con Ki . 9.1.5 Teorema di rappresentazione spettrale per operatori autoaggiunti non limitati. Per concludere citiamo, dando solo traccia di dimostrazione, il seguente teorema di rappresentazione spettrale che generalizza il teorema 8.7 al caso di un operatore autoaggiunto non limitatato. I dettagli della dimostrazione sono lasciati per esercizio. Teorema 9.3 (Teorema di rappresentazione spettrale per operatori autoaggiunti non limitati). Siano H spazio di Hilbert e T : D(T ) → H operatore autoaggiunto. Sia P (T ) la misura spettrale associata a T secondo il teorema 9.2. (a) È possibile decomporre H come H = ⊕α∈A Hα (con A al più numerabile se H è separabile), dove i sottospazi Hα sono chiusi ed ortogonali a due a due, e valgono le proprietà seguenti: (i) per ogni α ∈ A, vale T Hα ⊂ Hα ; (ii) per ogni α ∈ A esiste una misura di Borel positiva finita µα , su σ(T ) ⊂ R2 ed un operatore isometrico suriettivo Uα : Hα → L2 (σ(T ), µα ), tali che, se f : σ(T ) → C, Z (T ) Uα f (x)dP (x) Hα Uα−1 = f · , σ(T ) in particolare vale: Uα T Hα Uα−1 = x· , 307 dove f · è l’operatore moltiplicativo per f su L2 (σ(T ), µα ): per ogni g ∈ L2 (σ(T ), µα ), (f · g)(x) = f (x)g(x) quasi ovunque su σ(T ) . (b) Vale: σ(T ) = supp{µα }α∈A , dove supp{µα }α∈A è il complemento dell’insieme dei numeri λ ∈ R per cui esiste un aperto Aλ ⊂ R tale che Aλ 3 λ e µα (Aλ ) = 0 per ogni α ∈ A. (c) Se H è separabile, esistono uno spazio con misura (MT , µT ), con µT (MT ) < +∞, una funzione FT : MT → R, un operatore unitario UT : H → L2 (MT , µT ) tale che: UT T UT−1 f (m) = FT (m)f (m) , per ogni f ∈ H. (9.59) Prova. La dimostrazione si ottiene come segue, guardando la prova del teorema teorema 8.7 per T autoaggiunto ed in riferimento ad ogni spazio Hψ . Essenzialmente, a parte semplici riadattamenti, è sufficiente rimpiazzare sistematicamente lo spazio M (σ(T )), delle funzioni misurabili limitate su σ(T ), con lo spazio L2 (σ(T ), µψ ). 2 9.2 Gruppi unitari ad un parametro fortemente continui. Il fine di questa sezione è la dimostrazione del teorema di Stone, che è uno dei teoremi più importanti per le applicazioni in meccanica quantistica (e non solo). Per enunciarlo abbiamo bisogno di qualche definizione e qualche risultato preliminare sui gruppi ad un parametro di operatori unitari ed in particolare, l’importante teorema di von Neumann. Discuteremo anche qualche utile proprietà dei gruppi unitari ad un paramentro in relazione alla continutà . 9.2.1 Gruppi unitari ad un parametro fortemente continui, teorema di von Neumann. Definizione 9.3. Sia H è spazio di Hilbert. Una classe {Ut }t∈R ⊂ B(H) è detta gruppo ad un parametro se vale U0 = I e Ut Us = Ut+s per ogni coppia t, s ∈ R (9.60) Un gruppo ad un parametro costituito da operatori unitari è detto gruppo unitario ad un parametro. Un gruppo ad un parametro {Ut }t∈R ⊂ B(H) è detto debolmente continuo in t0 ∈ R oppure fortemente continuo in t0 ∈ R se l’applicazione t 7→ Ut è continua in t0 , rispettivamente, nella topologia operatoriale debole ovvero in quella operatoriale forte dotando R della topologia standard. 308 Un gruppo ad un parametro {Ut }t∈R ⊂ B(H) è detto debolmente continuo oppure fortemente continuo se è rispettivamente tale in ogni punto di R. Si osservi che dalla condizione (9.60), tenendo conto che gli operatori Ut sono unitari, segue immediatamente che (Ut )∗ = Ut−1 = U−t , per ogni t ∈ R . (9.61) La prova è ovvia: da Ut−1 Ut = I, applicando U−t al lato destro dei due membri ed usando la seconda di (9.60), si ha Ut−1 Ut−t = U−t ossia, dalla prima identità in (9.60), Ut−1 = U−t . Infine Ut−1 = (Ut )∗ dato che Ut è unitario. I gruppi unitari ad un parametro godono di diverse notevoli proprietà. Proposizione 9.2. Sia (H, (·|·)) uno spazio di Hilbert complesso e {Ut }t∈R un gruppo unitario ad un parametro. I seguenti fatti sono equivalenti. (a) (ψ|Ut ψ) → (ψ|ψ) per t → 0 e per ogni ψ ∈ H. (b) {Ut }t∈R è debolmente continuo in t = 0. (c) {Ut }t∈R è debolmente continuo. (d) {Ut }t∈R è fortemente continuo in t = 0. (e) {Ut }t∈R è fortemente continuo. Prova. Prima di tutto rietichettiamo come segue le proposizioni precedenti. (1) {Ut }t∈R è debolmente continuo in t = 0. (2) (ψ|Ut ψ) → (ψ|ψ) per t → 0 e per ogni ψ ∈ H. (3) {Ut }t∈R è fortemente continuo in t = 0. (4) {Ut }t∈R è fortemente continuo. (5) {Ut }t∈R è debolmente continuo. Infine mostriamo che (1) ⇒ (2) ⇒ (3) ⇒ (4) ⇒ (5) ⇒ (1). (1) ⇒ (2) e (2) ⇒ (3). La continuità per t = 0 nella topologia debole implica in particolare che, se t → 0, allora (ψ|Ut ψ) → (ψ|U0 ψ) = (ψ|ψ) ed anche, prendendo il complesso coniugato, (Ut ψ|ψ) → (U0 ψ|ψ) = (ψ|ψ). Viceversa, la continuità forte in t = 0 equivale a dire che, per ogni ψ ∈ H, se t → 0, ||Ut ψ − U0 ψ|| → 0 . Ricordando che U0 = I, prendendo il quadrato ed esprimento la norma in termine del prodotto scalare, tale identità equivale a (Ut ψ|Ut ψ) − (ψ|Ut ψ) − (Ut ψ|ψ) + (ψ|ψ) → 0 . La condizione di unitarietà per Ut implica che (Ut ψ|Ut ψ) = (ψ, ψ), da cui, l’identità di sopra si può ancora riscrivere come (ψ|ψ) − (ψ|Ut ψ) − (Ut ψ|ψ) + (ψ, ψ) → 0 , se t → 0 . Come precisato all’inizio della dimostrazione, questa identità è banalmente verificata nelle nostre ipotesi. (3) ⇒ (4). Se ψ ∈ H, vale Ut ψ − Ut0 ψ = Ut (ψ − Ut−1 Ut0 ψ) = Ut (ψ − Ut0 −t ψ) , 309 dove abbiamo sfruttato l’identità (9.61). In definitiva, usando il fatto che Ut è unitario, per ogni ψ ∈ H troviamo: ||Us ψ − Ut0 ψ|| = ||Us (ψ − Ut0 −s ψ)|| = ||ψ − Ut0 −s ψ|| Nelle ipotesi di forte continutà in t = 0, tenendo conto che t0 − s → 0 per s → t0 si ha che ||Us ψ − Ut0 ψ|| → 0. Quindi la continuità forte per t = 0 implica la continuità forte per ogni t0 ∈ R. (4) ⇒ (5). È ovvia dal fatto che la convergenza nella topologia forte implica quella nella topologia debole. (5) ⇒ (1). È banalmente vera per definizione. 2 Un’altra notevole proprietà dei gruppi unitari ad un parametro è la seguente. Proposizione 9.3. Sia (H, (·|·)) uno spazio di Hilbert complesso e {Ut }t∈R un gruppo unitario ad un parametro su di esso. Sia H ⊂ H un sottoinsieme tale che: (a) lo spazio hHi finitamente generato da H è denso in H, (b) {Ut }t∈R soddisfa (ψ|Ut ψ) → (ψ|ψ) per t → 0 e per ogni ψ ∈ H, allora {Ut }t∈R è un gruppo unitario ad un parametro fortemente continuo. Prova. Usando la stessa dimostrazione fatta per la proposizione 9.2, si ha subito che (φ0 |Ut φ0 ) → (φ0 |φ0 ) per t → 0 con φ0 ∈ H, implica che ||Ut φ0 − φ0 || → 0 per t → 0. Se più in generale P φ ∈ hHi allora φ = i∈I ci φ0i dove I è finito e φ0i ∈ H. Di conseguenza, se t → 0, ||Ut φ − φ|| = Ut ! X i ci φ0i − X i X X ci φ0i = ci (Ut φ0i − φ0i ) ≤ |ci |||Ut φ0i − φ0i || → 0 . i i Per la proposizione 9.2, per dimostrare la tesi è allora sufficiente estendere il risultato a tutto H. Dobbiamo cioé provare che ||Ut φ − φ|| → 0 per t → 0 per ogni φ ∈ hHi implica ||Ut ψ − ψ|| → 0 se t → 0 per ogni ψ ∈ H. Dato che hHi è denso, per ogni ψ ∈ H fissato esisterà una successione {ψn }n∈N ⊂ hHi con ψn → φ se n → +∞. Se {tm }m∈N è una successione di reali che tende a 0, vale allora, dalla disuguaglianza triangolare e per n ∈ N fissato: ||Utm ψ − ψ|| ≤ ||Utm ψ − Utm φn || + ||Utm φn − φn || + ||φn − ψ|| . Ossia, tenendo conto che gli Utm sono unitari e che la norma è non negativa: 0 ≤ ||Utm ψ − ψ|| ≤ ||Utm φn − φn || + 2||φn − ψ|| . (9.62) Per n fisso, il limite della successione di elementi am := ||Utm φn − φn || è nullo per ipotesi, per cui lim sup ||Utm φn − φn || = lim inf ||Utm φn − φn || = lim ||Utm φn − φn || = 0 . m m m→+∞ Di conseguenza, dalla disuguaglianza (9.62) abbiamo che, per ogni n ∈ N 0 ≤ lim sup ||Utm ψ − ψ|| ≤ 2||φn − ψ|| , m 310 0 ≤ lim inf ||Utm ψ − ψ|| ≤ 2||φn − ψ|| . m D’altra parte, prendendo n sufficientemente grande, possiamo rendere piccolo a piacere ||φn −ψ||. Concludiamo che: lim sup ||Utm ψ − ψ|| = lim inf ||Utm ψ − ψ|| = 0 , m m per cui esiste lim ||Utm ψ − ψ|| = 0 . m→+∞ Dato che ψ ∈ H e la successione {tm }m∈N con tm → 0 erano arbitrari, concludiamo che, per ogni ψ ∈ H: lim ||Ut ψ − ψ|| = 0 . t→0 La dimostrazione è terminata 2. La teoria fino ad ora dimostrata consente di provate un importante risultato dovuto a von Neumann che mostra come la continuità forte dei gruppi unitari ad un parametro sia effettivamente molto debole negli spazi di Hilbert separabili. Teorema 9.4 (von Neumann). Sia (H, (·|·)) uno spazio di Hilbert complesso e {Ut }t∈R un gruppo unitario ad un parametro. Se H è separabile, {Ut }t∈R è fortemente continuo se e solo se la funzione R 3 t 7→ (Ut ψ|φ) è misurabile per ogni scelta di ψ, φ ∈ H. Prova. Ovviamente se il gruppo è fortemente continuo allora ogni funzione R 3 t 7→ (Ut ψ|φ) è misurabile essendo continua. Mostriamo che vale il viceversa. Assumiamo che ognuna delle funzioni suddette sia misurabile. Dalla disuguaglianza di Schwartz e da ||Ut || = 1 concludiamo che tali funzioni sono anche limitate. Pertanto, per ogni fissato a ∈ R e ψ ∈ H: H 3 φ 7→ Z a (Ut ψ|φ)dt 0 è un funzionale lineare limitato con norma non superiore a a||ψ||. Per il teorema di Riesz esiste ψa ∈ H tale che: Z a (Ut ψ|φ)dt , per ogni φ ∈ H. (ψa |φ) = 0 Possiamo allora scrivere che: (Ub ψa |φ) = (ψa |U−b φ) = Z a Z a 0 Z a+b (Ut ψ|φ)dt . (Ut+b ψ|φ)dt = (Ut ψ|U−b φ)dt = 0 b Quindi: Z Z 0 a+b (Ut ψ|φ)dt ≤ 2b||φ|| ||ψ||. |(Ub ψa |φ) − (ψa |φ)| = (Ut ψ|φ)dt + b a Di conseguenza: (Ub ψa |φ) → (ψa |φ) se b → 0 e pertanto, prendendo il complesso coniugato di ambo membri: lim(φ | Ub ψa ) → (φ | ψa ) . t→0 311 Se riusciamo a provare che l’insieme dei vettori {ψa | ψ ∈ H, a ∈ R} genera finitamente un sottospazio denso in H, in base alla proposizione precedente e scegliendo φ = ψa , possiamo concludere che il gruppo unitario è fortemente continuo. Sia φ ∈ {ψa | ψ ∈ H, a ∈ R}⊥ e sia {ψ (n) }n∈N una base hilbertiana numerabile per H, che esiste in quanto H è separabile. Allora, per ogni n ∈ N, vale: 0 = (ψa(n) |φ) = Z a (Ut ψ (n) |φ)dt 0 per ogni a ∈ R , che implica che R 3 t 7→ (Ut ψ (n) |φ) sia nulla quasi ovunque. Sia Sn ⊂ R l’insieme su cui la S S funzione non si annulla e si fissi t0 ∈ R \ n∈N Sn . Si osservi che t0 esiste dato che n∈N Sn non può coincidere con R avendo misura nulla essendo unione numerabile di insiemi di misura nulla (in questo punto si usa la richiesta che la base hilbertiana sia numerabile e cioé H sia separabile). Deve allora essere (Ut0 ψ (n) |φ) = 0 per ogni n che implica che φ = 0, dato che Ut0 è unitario e quindi {Ut0 ψ (n) }n∈N è ancora base hilbertiana. Essendo {ψa | ψ ∈ H, a ∈ R}⊥ = {0}, lo spazio generato da {ψa | ψ ∈ H, a ∈ R} è denso come richiesto e ciò conclude la dimostrazione. 2 9.2.2 Gruppi unitari ad un parametro generati da operatori autoaggiunti e Teorema di Stone. In questa sezione enunceremo e proveremo il celebre teorema di Stone che caratterizza i gruppi unitari ad un parametro fortemente continui provando che si possono sempre ottenere esponenziando operatori autoaggiunti. Useremo successivamente tali tipi di gruppi per dare una condizione necessaria e sufficiente per la commutatività delle misure spettrali di operatori autoaggiunti. Abbiamo bisogno di un risultato tecnico preliminare che enunciamo separatamente visto che si tratta di una costruzione utile in vari contesti. Nell’enunciato, come al solito, χ[a,b] indica la funzione caratteristica di [a, b]. Proposizione 9.4. Sia H spazio di Hilbert complesso e {Vt }t∈R ⊂ B(H) una classe di operatori che soddisfi le due seguenti condizioni: (i) sia fortemente continua nel parametro t per ogni t ∈ R, (ii) esista C ≥ 0 tale che ||Vt || ≤ C per ogni t ∈ R. R Per ogni f ∈ L1 (R, dx) esiste un unico operatore in B(H), indicato con R f (t)Vt dt, tale che Z Z φ f (t)Vt dt ψ = f (t) (φ|Vt ψ) dt per ogni φ, ψ ∈ H. (9.63) R R Se f ∈ L1 (R, dx) ha supporto (essenziale) compatto, la validità della sola condizione (i) assicura R l’esistenza di R f (t)Vt dt. Tale operatore soddisfa in ogni caso le proprietà seguenti. (a) per ogni ψ ∈ H: Z Z R f (t)Vt dtψ ≤ |f (t)| ||Vt ψ|| dt . R 312 (9.64) (b) Se A ∈ B(H): Z Z A f (f )Vt dt = R (c) Posto (i) (ii) Rt s Z f (τ )Vτ dτ := R2 3 (s, t) 7→ f (t)AVt dt e R Z f (t)Vt dtA = R R R g(τ )f (τ )Vτ dτ f (t)Vt Adt . (9.65) R con g = χ[s,t] se s ≥ t e g = −χ[t,s] se t ≤ s allora: Z t f (τ )Vτ dτ è continua nella topologia uniforme; s se f è continua, allora s- d dt Z t f (τ )Vτ dτ = f (t)Vt s per ogni s, t ∈ R. (9.66) Prova. Siano ψ, φ ∈ H e f : R → C una funzione in L1 (R, dx). Consideriamo l’integrale: Z I(φ, ψ) := f (t) (φ|Vt ψ) dt . R Tale integrale è ben definito, dato che R 3 t 7→ (φ|Vt ψ) è continua essendo {Vt }t∈R debolmente continuo ed è limitata per (ii) dalla disuguaglianza di Schwartz. Da ciò segue banalmente che: |I(φ, ψ)| ≤ ||f ||1 C||ψ||||φ|| . Dato che H 3 ψ 7→ I(φ, ψ) è lineare e vale disuguaglianza scritta sopra, l’applicazione diretta del teorema di Riesz prova che, per ogni φ ∈ H esiste un unico vettore Φφ ∈ H che soddisfa: I(φ, ψ) = (Φφ |ψ) , per ogni ψ ∈ H. Si verifica subito che l’applicazione H 3 φ 7→ T φ := Φφ è lineare, inoltre, per costruzione vale: |(ψ|T φ)| = |(T φ|ψ)| = |(Φφ |ψ)| = |I(φ, ψ)| ≤ ||f ||1 C||ψ||||φ|| , per ogni coppia φ, ψ ∈ H. Scegliendo ψ = T φ si ha subito che T è limitato e quindi lo è il suo aggiunto che indichiamo con R f (t)V dt. Per costruzione vale allora (9.63). Da tale identità si ha anche: t R Z Z Z φ f (t)Vt dt ψ ≤ |f (t)| |(φ|Vt ψ)| dt ≤ |f (t)| ||Vt ψ|| dt ||φ|| R R R R e quindi, scegliendo φ = R f (t)Vt dtψ si arriva alla (9.64). L’identità (9.65) segue facilmente dalla (9.63). Nel caso in cui il supporto essenziale di f sia incluso in un intervallo limitato [a, b], si può , equivalentemente, definire I(ψ, φ) integrando su tale intervallo e procedere con il resto della dimostrazione come fatto sopra. In tal caso, l’esistenza della costante C in (ii) (con t ∈ [a, b]) è automaticamente garantita. Infatti, per continuità , comunque scegliamo ψ ∈ H, esiste Cψ ≥ 0 tale che ||Vt ψ|| ≤ Cψ se t ∈ [a, b]. Per il teorema di Banach-Steinhaus questo implica che esiste C ≥ 0 tale che ||Vt || ≤ C se t ∈ [a, b]. Passimo a provare (c). Sia [a, b] è grande 313 a sufficienza in modo che [a, b] × [a, b] includa un intorno aperto di (t, s) e (t0 , s0 ) appartengono a tale intorno, da (a) segue facilmente che: Z Z s0 s f (τ )V (τ )dτ ψ − f (τ )V (τ )dτ ψ ≤ (|t − t0 | + |s − s0 |) sup |f (τ )| sup ||Vτ ψ|| . t 0 t τ ∈[a,b] τ ∈[a,b] Prendendo anche l’estremo superiore su ||ψ|| ≤ 1 e tenendo conto che ||Vτ || ≤ C < +∞ se τ ∈ [a, b] come osservato sopra, abbiamo: Z Z s0 s f (τ )V (τ )dτ − f (τ )V (τ )dτ ≤ (|t − t0 | + |s − s0 |) sup |f (τ )|C , t 0 t τ ∈[a,b] da cui la continuità nella topologia uniforme. Riguardo alla seconda proprietà , notiamo che, dalla continuità in senso forte della funzione t 7→ f (t)Vt , nel caso in cui h → 0 vale: Z Z 1 τ +h 1 τ +h f (t)Vt dt ψ − f (τ )Vτ ψ = (f (t)Vt − f (τ )Vτ )dt ψ h τ h τ ≤ R τ +h dt τ |h| sup ||f (t0 )Vt0 ψ − f (τ )Vτ ψ|| = |t0 −τ |≤h sup ||f (t0 )Vt0 ψ − f (τ )Vτ ψ|| → 0 . |t0 −τ |≤h 2 Ecco il teorema di Stone. In realtà il risultato dovuto a Stone nel teorema seguente è la parte (b), che è la meno banale dell’enunciato. Teorema 9.5 (Teorema di Stone). Sia H uno spazio di Hilbert. Vale quanto segue. (a) Se A : D(A) → H, con D(A) denso in H, è un operatore autoaggiunto su H e P (A) è la sua misura spettrale, gli operatori itA Ut = e Z eiλt dP (A) (λ) , := σ(A) con t ∈ R, costituiscono un gruppo unitario ad un parametro fortemente continuo che soddisfa: Ut f (A)ψ = f (A)Ut ψ , ∀t ∈ R ∀ψ ∈ D(f (A)), ∀f : σ(A) → C misurabile. (9.67) Ulteriormente: (i) esiste in H lim t→0 Ut ψ − ψ t (9.68) se e solo se ψ ∈ D(A); (ii) se ψ ∈ D(A) vale dUt Ut ψ − ψ ψ := lim = −iAψ st→0 dt t=0 t 314 (9.69) (b) Se {Ut }t∈R è un gruppo unitario ad un parametro fortemente continuo su H esiste, ed è unico, un operatore autoaggiunto A : D(A) → H (con D(A) denso in H) tale che eitA = Ut , per ogni t ∈ R. (9.70) Prova. (a) Per la proposizione 9.2, per provare che il gruppo è fortemente continuo è sufficiente verificare che (ψ|Ut ψ) → (ψ|ψ) per t → 0 e per ogni ψ ∈ H. Questo fatto è vero dato che, per (vi) in (c) del teorema 9.1, tenendo conto che il dominio di eitA è tutto H dato che la funzione esponenziale con esponente immaginario puro è limitata: Z (ψ|Ut ψ) = itλ e σ(A) dµψ (λ) → Z 1dµψ (λ) = (ψ|ψ) per t → 0 . σ(A) Sopra abbiamo tenuto conto del fatto che eitλ → 1 e quindi possiamo applicare il teorema della convergenza dominata di Lebesgue dato che |eitλ | = 1 per ogni t e la funzione che vale costantemente 1 è integrabile perché µψ è finita. Passiamo all’identità (9.67). Per dimostrare tale identità si osservi che ψ ∈ D(f (A)) se e solo R se R |f (λ)|2 dµψ (λ) < +∞. D’altra parte, la misura µψ e la misura µUt ψ coincidono, in quanto (Ut ψ|P (A) (E)Ut ψ) = (ψ|Ut∗ P (A) (E)Ut ψ), ma Ut∗ P (A) (E)Ut = P (A) (E) come segue immediatamente da (iii) in (c) del teorema 9.1, tenendo conto che nel caso in esame tutti gli integrali sono riferiti a funzioni limitate e pertanto gli operatori coinvolti hanno tutti dominio dato da tutto lo spazio di Hilbert. Concludiamo che ψ ∈ D(f (A)) se e solo se Ut ψ ∈ D(f (A)). Viceversa vale banalmente f (A)ψ ∈ D(Ut ) = H essendo Ut unitario. In queste ipotesi, usando la seconda parte di (iii) in (c) del teorema 9.1, si ha che Ut f (A)ψ = f (A)Ut ψ per ogni ψ ∈ D(f (A)) e cioé vale (9.67). Passiamo ora a provare le proprietà (i) e (ii). Se ψ ∈ H, usando (c) del teorema 9.1, si trova Ut ψ − ψ Ut0 ψ − ψ 2 − = t t0 Z + σ(A) 0 0 2 − eiλt − e−iλt 2 2 − eiλt − e−iλt 2 λ dµψ (λ) + λ dµψ (λ) 2 2 λ t λ2 t0 2 σ(A) σ(A) 0 0 0 0 Z eiλ(t −t) − e−iλt + eiλt + 1 2 eiλ(t−t ) − e−iλt + eiλt + 1 2 λ dµψ (λ) + λ dµψ (λ) . λ2 tt0 λ2 tt0 σ(A) Z Z Ci riferiremo ora alla misura λ2 dµψ (λ). Tutte e tre le funzioni integrande (rispetto alla detta misura) sono limitate da costanti dato che si annullano per t e t0 piccoli, con la stessa velocità dei numeratori (per verificarlo è sufficiente sviluppare in serie di potenze centrata nell’origine tutti gli esponenziali) e per grandi valori di t e t0 tendono a zero. I primi due integrandi, tendono a zero se t e t0 rispettivamente tendono a zero, gli ultimi due tendono a zero quando t → t0 . Se ψ ∈ D(A), la misura λ2 dµψ (λ) è finita per definizione di dominio di A. Di conseguenza, Ut ψ−ψ U ψ−ψ 0 scegliendo t vicino a t ed entrambi vicini a 0, possiamo rendere t − t0 t0 piccolo a 315 piacere. Data la completezza di H, questo significa che esiste il limite per t → 0 di Ut ψ−ψ . Con t la stessa procedura si ha immediatamente che, se ψ ∈ D(A): 2 Z iλt − e−iλt iλt − e−iλt Ut ψ − ψ e 2 − e − iAψ = +1+i λ2 dµψ (λ) . t λ2 t2 λt σ(A) La funzione integranda (rispetto alla misura λ2 dµψ (λ)) è limitata e tende a zero puntualmente in λ per t → 0, la misura λ2 dµψ (λ) è finita nell’ipotesi che ψ ∈ D(A). Applicando il teorema 2 della convergenza dominata abbiamo che Ut ψ−ψ − iAψ → 0 se t → 0, quando ψ ∈ D(A). Per t concludere la prova di (i) e (ii), mostriamo che se Ut ψ−ψ → φψ ∈ H, per t → 0, allora ψ ∈ D(A). t Si verifica subito che l’insieme dei vettori ψ ∈ H per cui esiste il limite suddetto formano un sottospazio D(B) di H che contiene, ovviamente, D(A) ed è quindi denso. L’applicazione ψ 7→ iBψ := φψ definisce un operatore con dominio D(B) denso. Se ψ, ψ 0 ∈ D(B) vale, usando il fatto che Ut∗ = U−t : 0 0 Ut ψ 0 − ψ 0 U−t ψ − ψ 0 Ut ψ − ψ 0 ψ|Bψ = ψ −i lim = −i lim ψ = −i lim ψ t→0 t→0 t→0 t t t U−t ψ − ψ 0 = −i lim ψ = Bψ|ψ 0 . t→0 −t Concludiamo che B è un’estensione simmetrica di A. Tuttavia, dato che A è autoaggiunto deve essere B = A per (d) di proposizione 5.2 e quindi ogni vettore ψ per cui esiste il limite di Ut ψ−ψ t per t → 0 deve appartenere a D(A). Questo conclude la dimostrazione di (a). (b) Cominciamo a notare che la prova dell’unicità di A è immediata. Se ci sono due operatori 0 autoaggiunti A e A0 con eitA = Ut = eitA per ogni t ∈ R, in base a (i) e (ii) di (a), deve risultare A = A0 . Costruiamo ora un operatore autoaggiunto A che soddisfi Ut = eitA per un fissato gruppo unitario ad un parametro fortemente continuo. Specializziamo la situazione discussa nella proposizione 9.4 al caso Vt = Ut gruppo unitario ad un parametro fortemente continuo. Indichiamo con D, detto spazio di Gårding, lo spazio vettoriale dei vettori della forma R f (t)U dtφ con φ ∈ H con f ∈ D(R) arbitraria. Dalla (9.63) segue facilmente la proprietà di t R invarianza Us D ⊂ D per ogni s ∈ R, più precisamente vale: Z Us Z f (t)Ut dtψ = R f (t)Ut+s dtψ per ogni ψ ∈ H. (9.71) R Mostriamo che, se ψ ∈ D allora Ut ψ−ψ → ψ0 ∈ H se t → 0.R Supponiamo che ψ = R f (t)Ut dtφ. t Con qualche passaggio, usando (9.71) e la definizione di R f (t)Ut dtφ, si vede che il secondo membro di: 2 Z Z Z Ut ψ − ψ Ut ψ − ψ Ut ψ − ψ 0 0 0 − f (t)Ut dtφ = − f (s)Us dsφ − f (r)Ur drφ t t t R R R R si può scrivere: Z Z ds R drht (s)ht (r) (ψ|Ur−s ψ) , R 316 dove f (s − t) − f (s) − f 0 (s) . t Si osservi che, per ogni t ∈ R, la funzione s 7→ ht (s) ha supporto in un compatto ed è C ∞ (ed è quindi limitata). Dato che (r, s) 7→ (ψ|Ur−s ψ) è anch’essa una funzione limitata, concludiamo che possiamo interpretare l’integrale di sopra nella misura di Lebesgue prodotto: ht (s) := 2 Z Z Ut ψ − ψ 0 − f (t)Ut dtφ = t R dsdrht (s)ht (r) (ψ|Ur−s ψ) R×R Dato che l’integrando tende a 0 puntualmente se t → 0 e che le funzioni (s, r) 7→ ht (s)ht (r) (ψ|Ur−s ψ) hanno supporto contenuto in un unico compatto abbastanza grande quando t varia in un intervallo limitato attorno a 0 e che ivi sono uniformemente limitate da qualche costante indipendente da t (questo segue dal fatto che la funzione (t, s, r) 7→ ht (s)ht (r) (ψ|Ur−s ψ) è continua congiuntamente in tutte le variabili), possiamo applicare il teorema della convergenza dominata, ottenendo che entrambi i membri svaniscono per t → 0. Abbiamo ottenuto che, se ψ ∈ D, allora Ut ψ−ψ → ψ0 ∈ H per t → 0. L’applicazione ψ 7→ iSψ := ψ0 è lineare come si dimostra facilt mente. Procedendo come nella dimostrazione di (a) si verifica facilmente che S è hermitiano. In realtà S è simmetrico dato che D è denso come ora verifichiamo. Se φ ∈ H si consideri la R ∞ successione di vettori R fn (t)Ut dtφ, dove le funzioni fn ∈ Cc (R) soddisfano: fn ≥ 0, supp fn R ⊂ [−1/n, 1/n] e R fn (s)ds = 1. Abbiamo che Z Z Z Z Z fn Ut dtψ − ψ = fn Ut dtψ − ≤ |fn (t)| ||(Ut − I)ψ|| dt f dtψ = f (U − I)dtψ n n t R R R R R dove abbiamo usato (9.64) per la classe di operatori Vt = Ut − I. Dato che: Z |fn (t)| ||(Ut − I)ψ|| dt ≤ R Z 1/n −1/n |fn (t)| dt sup t∈[−1/n,1/n] ||(Ut − I)ψ|| = sup ||(Ut − I)ψ|| t∈[−1/n,1/n] e supt∈[−1/n,1/n] ||(Ut − I)ψ|| → 0 per n → ∞ essendo la classe degli Ut fortemente continua, concludiamo che Z D3 fn (t)Ut dtφ → φ ∈ H , per n → ∞ R e quindi D è denso in H. Di conseguenza S è simmetrico. Mostriamo ora che S è essenzialmente autoaggiunto su D. Se ψ± ∈ Ran(S ± iI)⊥ , allora, per ogni χ ∈ D vale: Uh Ut χ − Ut χ d (ψ± |Ut χ) = lim ψ± = (ψ± |iSUt χ) = i (ψ± |(S ± iI)Ut χ) ± (ψ± |Ut χ) h→0 dt h = ± (ψ± |Ut χ) 317 e quindi la funzione F± (t) := (ψ± |Ut χ) ha la forma F± (0)e±t . Dovendo essere limitata (dato che ||Ut || = 1 per ogni t ∈ R), questo è possibile solo se F± (0) = 0 e quindi ψ± = 0, che implica a sua volta che Ran(S ± iI) = H. Per il teorema 5.3, questo significa che S : D → H è essenzialmente autoaggiunto. Sia dunque S l’unica estensione autoaggiunta di S. Per concludere la dimostrazione si osservi che se Vt := eitS allora, per ogni coppia ψ, φ ∈ D vale: d d (ψ |(Vt )∗ Ut φ) = (Vt ψ|Ut φ) = (iSVt ψ|Ut φ)+(Vt ψ|iSUt φ) = − (Vt ψ|iSUt φ)+(Vt ψ|iSUt φ) = 0. dt dt Pertanto (ψ|(Vt )∗ Ut φ) = (ψ|Iφ) e quindi, essendo D denso: (Vt )∗ Ut = I cioé Ut = eitS per ogni t ∈ R. 2 Definizione 9.4. Sia H è spazio di Hilbert e {Ut }t∈R ⊂ B(H) un gruppo unitario ad un parametro fortemente continuo. L’unico operatore autoaggiunto su A tale da soddisfare (9.70) è detto generatore (autoaggiunto) di {Ut }t∈R ⊂ B(H). Il teorema di Stone ha un semplice ma utile corollario. L’utilità di questo corollario appare evidente quando l’operatore autoaggiunto A non è limitato, in caso contrario la tesi del corollario segue facilmente dal teorema spettrale per operatori autoaggiunti limitati, notando che se un operatore limitato commuta con A allora deve commutare con la sua misura spettrale. Corollario 9.1. Se A : D(A) → H, con D(A) denso in H, è un operatore autoaggiunto (in generale non limitato) sullo spazio di Hilbert H e se U : H → H1 è un isomorfismo di spazi di Hilbert (operatore isometrico suriettivo), allora: U eisA U −1 = eisU AU −1 , per ogni s ∈ R . In particolare la tesi è vera se H = H1 e U è unitario. Prova. L’operatore U AU −1 è evidentemente autoaggiunto sul dominio U D(A) come è facile provare applicando la definizione. Pertanto il gruppo unitario ad un parametro fortemente −1 continuo {eisU AU }s∈R è ben definito. Essendo U un isomorfismo di spazi di Hilbert, si verifica immediatamente che {U eisA U −1 }s∈R è un secondo gruppo unitario ad un parametro fortemente continuo definito sullo stesso spazio di Hilbert H1 . Ulteriormente, se ψ = U −1 φ ∈ U −1 D(A) allora: U eisA U −1 ψ − ψ U eisA φ − U φ eisA φ − φ = lim = U lim = iU Aφ = U AU −1 ψ . s→0 s→0 s→0 s s s lim In base al teorema di Stone il generatore del gruppo {U eisA U −1 }s∈R è quindi un’estensione autoaggiunta di U AU −1 che, essendo autoaggiunto, non ha estesioni autoaggiunte proprie. Di conseguenza il generatore del gruppo {U eisA U −1 }s∈R coincide con U AU −1 stesso e quindi: U eisA U −1 = eisU AU −1 , 318 per ogni s ∈ R . 2. Nota. Per certi aspetti, il teorema di Stone può vedersi come sottocaso di un teorema più generale che deriva dal Teorema di Hille-Yoshida [Rud91] che ha avuto importanti conseguenze in fisica matematica nelle applicazioni della teoria dei semigruppi. Ricordiamo che sullo spazio di Banach X, un semigruppo fortemente continuo di operatori, {Qt }t∈[0,+∞) , è una classe di operatori Qt ∈ B(X) tali che (a) Q(0) = I, (b) Qt+s = Qt Qs se s, t ∈ [0, +∞) e (c) ||Qt ψ − ψ|| → 0 se t → 0, per ogni ψ ∈ X. Si dimostra [Rud91] che ogni semigruppo fortmente continuo ammette un unico generatore, cioè un operatore A in X, completamente individuato dalla richiesta che, dove la derivata è calcolata rispetto alla norma di X: d Qt ψ = −AQt ψ = −Qt Aψ dt per ogni ψ ∈ D(A). Risulta che D(A) ⊂ X è un sottospazio denso. Specializzandoci al caso di un semigruppo fortemente continuo {Qt }t∈[0,+∞) , su X = H spazio di Hilbert e con operatori Qt normali (limitati), risulta [Rud91] che (1) esiste sempre un generatore A del semigruppo, (2) tale generatore è un operatore normale (non limitato in generale), (3) vale: Qt = e−tA , dove il secondo membro viene definito come integrale della funzione σ(A) 3 λ 7→ eλ rispetto alla PVM della decomposizione spettrale di A (estendendo il teorema spettrale 9.2 al caso di operatori normali non limitati [Rud91]). Infine, (4) lo spettro di A è limitato inferiormente nei reali, cioé : esiste γ ∈ R tale che γ < Re(λ) per ogni λ ∈ σ(A). 9.2.3 Condizioni per la commutatività di misure spettrali. Come ultimo risultato possiamo enunciare e provare un teorema riguardante la commutatività delle misure spettrali di due operatori autoaggiunti usando i gruppi ad un paramtro da essi generati. Nel caso di operatori autoaggiunti limitati le misure spettrali commutano se e solo se gli stessi operatori commutano come segue facilmente dal teorema spettrale (vedi anche (1) nelle osservazioni dopo la prova del teorema seguente). Nel caso di operatori non limitati vi sono in generale problemi di dominio e la condizione basata sulla commutatività degli operatori non è utilizzabile. L’uso dei gruppi unitari è un modo semplice per ovviare il problema dei domini. Il seguente teorema ha larghe applicazioni in Meccanica Quantistica Teorema 9.6. Siano A e B due operatori (in generale non limitati) sullo spazio di Hilbert H e sia A autoaggiunto. Valgono i fatti seguenti. (i) Assumendo B autoaggiunto e denotando con P (A) e P (B) le misure spettrali di A e B rispettivamente, le seguenti quattro richieste sono equivalenti. (a) Per ogni coppia di boreliani E, E 0 ⊂ R: P (A) (E)P (B) (E 0 ) = P (B) (E 0 )P (A) (E) . 319 (b) Per ogni boreliano E ⊂ R e ogni s ∈ R: P (A) (E)e−isB = e−isB P (A) (E) . (c) Per ogni coppia di numeri reali t, s ∈ R: e−itA e−isB = e−isB e−itA . (d) Per ogni numero reale t ∈ R: e−itA Bψ = Be−itA ψ , e−itA D(B) ⊂ D(B) e se ψ ∈ D(B). (ii) Se, nelle ipotesi di (i), vale una delle quattro condizioni precedenti allora vale anche: se ψ ∈ D(AB) ∩ D(BA) ABψ = BAψ (Aϕ|Bψ) − (Bϕ|Aψ) = 0 se ψ, ϕ ∈ D(A) ∩ D(B). (iii) Se B ∈ B(H) (non necessariamente autoaggiunto), le due seguenti condizioni sono equivalenti. (e) BAϕ = ABϕ per ogni ϕ ∈ D(A). (f ) Bf (A)ψ = f (A)Bψ per ogni ψ ∈ D(f (A)) e ogni f : σ(A) → R misurabile. Prova. (i) Facendo uso della definizione 9.2, l’identità in (b) può essere trascritta equivalentemente: Z (A) e−itλ dPλ Z e−isµ dPµ(B) = R R Z e−isµ dPµ(B) Z R (A) e−itλ dPλ per ogni t, s ∈ R, (9.72) R dove abbiamo usato la definizione standard di integrale di funzioni misurabili limitate rispetto ad una misura spettrale facendo uso di (i) in (c) del teorema 9.1. Il fatto che (a) implichi (c) è immediato dalla definizione stessa di integrale di una funzione limitata rispetto ad una misura spettrale introdotta nel capitolo 8, lavorando con la topologia operatoriale forte. Proviamo che (c) implica (b) e che (b) implica (a). Per dimostrare Rche (c) implica (b), notiamo Rche da (9.72), se (A) (A) −isB −itλ ∗ Us := e , ψ, φ ∈ H, s ∈ R sono fissati, si ha: ψ R e dPλ Us φ = Us ψ R e−itλ dPλ φ per ogni t ∈ R , ossia Z Z (A) R e−itλ dµψ,Us φ (λ) = (A) R e−itλ dµUs∗ ψ,φ (λ) , (9.73) dove abbiamo introdotto le misure complesse come in (c) del teorema 8.4. Possiamo trasformare gli integrali suddetti in integrali rispetto a misure positive finite usando il teorema RadonNykodim (vedere (1) in Esempi 2.2.). Successivamente, facendo uso del teorema di Fubini-Tonelli in (9.73), concludiamo che, se f è la trasformata di Fourier di una qualsiasi funzione dello spazio di Schwarz S(R) (vedi cap.3), deve risultare: Z Z Z Z (A) (A) −itλ −itλ f (t) e dt dµψ,Us φ (λ) = f (t) e dt dµUs∗ ψ,φ (λ) . R R R 320 R Dato che la trasformata di Fourier trasforma lo spazi S(R) nello stesso spazio S(R) biettivamente, concludiamo che l’identità di sopra può essere riscritta come: Z g(λ) R (A) dµψ,Us φ (λ) Z (A) = R g(λ) dµUs∗ ψ,φ (λ) per ogni g ∈ S(R). (9.74) Se h ∈ Cc (R) (spazio delle funzioni continue a supporto compatto) la successione di funzioni É Z n 2 gn (x) := e−n(x−y) /4 h(y)dy 4π R soddisfa gn ∈ D(R) e converge uniformemente ad h per n → +∞. Dato che gn ∈ D(R) ⊂ S(R) e gn → h ∈ Cc (R) nella norma dell’estremo superiore e le misure sono finite, (9.74) implica che: Z h(λ) R (A) dµψ,Us φ (λ) Z = R (A) h(λ) dµUs∗ ψ,φ (λ) per ogni h ∈ Cc (R). (9.75) Il teorema di Riesz per misure complesse (vedere (1) in Esempi 2.2.) implica che le due misure che definiscono i due integrali nei due membri dell’identià di sopra sono in realtà la stessa misura. In altre parole, tenendo conto dell’espressione esplicita di tali misure complesse come in (c) del teorema 8.4.: ψ P (A) (E)Ut φ = Us∗ ψ P (A) (E)φ per ogni boreliano E ⊂ R e ogni s ∈ R. (9.76) Con ovvi passaggi, data l’arbitrarietà di ψ e φ, si ricava che vale (b): P (A) (E)e−isB = e−isB P (A) (E) per ogni boreliano E ⊂ R e ogni s ∈ R. (9.77) Per concludere proviamo che (b) implica (a). Iterando un’altra volta il procedimanto per dimostrare che (c) implica (b), dove ora l’operatore e−isB rimpiazza il precedente e−itA e l’operatore unitario Us è sostituito dal proiettore ortogonale P (A) (E), si ottiene alla fine che (9.77) implica (A) (B) (B) (A) che vale (a): PE PE 0 = PE 0 PE per ogni coppia di boreliani E, E 0 ⊂ R. Per concludere notiamo che, se vale (c), dal teorema di Stone e dalla continuità di e−itA segue subito (d). D’altra parte (d) implica (c) per il seguente motivo. Prima di tutto (d) equivale a e−itA BeitA = B da cui, −itA BeitA ) esponenziando gli operatori autoaggiunto ad ambo membri, troviamo: e−is(e = e−isB . Dato che, per ogni fissato numero s ∈ R, i gruppi unitari ad un parametro fortemente continui −itA BeitA ) t 7→ e−is(e e t 7→ e−itA e−isB eitA ammettono lo stesso generatore, essi devono coincidere per il teorema di Stone. Conseguentemente dobbaimo avere e−itA e−isB eitA = e−isB , cioé (c). Proviamo (ii). Per provare la prima affermazione partiamo da (c) assumendo ψ ∈ D(AB) ∩ D(BA) per cui: e−itA e−isB ψ) = e−isB e−itA ψ. Derivando nell’origine in t, dal teorema di Stone: Ae−isB ψ = e−isB Aψ. A questo punto possiamo ancora derivare in s nell’origine. Il secondo membro fornisce immediatamente −iBAψ per il teorema di Stone. Nel primo membro possiamo passare la derivata oltre A, usando il fatto che A = A∗ è chiuso e tenendo conto del fatto che sappiamo che il limite esiste. In questo modo troviamo, come richiesto −iABψ = −iBAψ. Dimostriamo infine la seconda affermazione assumendo vera la proprietà (c). Da essa si trova 321 subito, se ψ ∈ D(A) e ϕ ∈ D(B) allora (eitA ψ|e−isB ϕ) = (eisB ψ|e−itA ϕ). Calcolando le derivate in t e s per t = s = 0, dal teorema di Stone abbiamo la tesi. L’affermazione (iii) si prova come segue. Prima di tutto è ovvio che (f) implica (e). Proviamo che (e) implica (f). Mostriamo per prima cosa che (e) implica che B commuti con e−itA per ogni t ∈ R. A tal fine usiamo (d) ed (f) in proposizione 9.8, la cui dimostrazione non dipende dal teorema che stiamo provando. (Il lettore può saltare questa parte e tornare sulla dimostrazione una volta provata la proposizione 9.8.) Sia ψ è un vettore analitico per A e per tutte le sue potenze nell’insieme denso che è provato esistere in (f) in proposizione 9.8, allora, dato che B è limitato ed usando (d) di proposizione 9.8: Be−itA ψ = +∞ X +∞ X (−it)n (−it)n BAn ψ = An Bψ = e−itA Bψ . n! n! n=0 n=0 Nei due ultimi passaggi abbiamo usato l’ipotesi che BAψ = ABψ ricorsivamente ed il fatto che ||An Bψ|| = ||BAn ψ|| ≤ ||B||||An ψ|| per cui Bψ è ancora analitico per A. Dato che ψ varia in un insieme denso e gli operatori B e e−itA sono continui, abbiamo ottenuto che Be−itA = e−itA B. Ora usiamo il fatto che, se B è limitato e commuta con ogni e−itA , allora B commuta con la misura spettrale di A. La prova è analoga a quella fatta sopra per dimostrare che (c) implica (b): in questo caso bisogna sostituire Us con B e seguire la stessa dimostrazione. Quindi, usando la definizione di g(A), segue facilmente che se g è limitata (e quindi lo è g(A)) allora Bg(A) = g(A)B. A questo punto si osserva che (A) (A) µBψ (E) = (Bψ|P (A) (E)Bψ) = (P (A) Bψ|P (A) (E)Bψ) ≤ ||B||2 (ψ|P (A) (E)ψ) = ||B||2 µψ (E) e pertanto ψ ∈ D(f (A)) implica Bψ ∈ D(f (A)). Applicando infine la definizione di f (A), prendendo una successione di funzioni misurabili limitate fn che convergono a f nel senso di L2 (σ(A), µψ ) si ha immediatamente la tesi prendendo il limite per n → +∞ dell’uguaglianza (vera perché tutte le fn sono limitate) Bfn (A)ψ = fn (A)Bψ, per ogni n ∈ N, dato che B è continuo. 2 Osservazioni. (1) Il teorema provato ha come immediata conseguenza che due operatori autoaggiunti limitati A, B ∈ B(H) commutano se e solo se commutano le loro misure spettrali. Infatti, un’im(A) (A) plicazione è ovvia, mentre da (iii) segue subito che, se AB = BA allora BPE = PE B (A) dato che PE = χE (A), essendo χE la funzione caratteristica del boreliano E. Dato che (A) (B) (A) (A) (B) PE ∈ B(H), possiamo applicare nuovamente (iii) ed ottenere PE 0 PE = PE PE 0 per ogni boreliano E 0 ⊂ R. (2) Esiste un interessante risultato che assicura condizioni sufficienti per la commutatività di misure spettrali di operatori autoaggiunti non limitati. Dato che è interessante, citiamo il risultato senza dimostrazione (che sia basa sul fondamentale lavoro di E. Nelson1 sui vettori analitici e l’esistenza delle rappresentazioni unitarie di gruppi di Lie). 1 E. Nelson, Analytic vectors, Ann. Math. 70, 572- 615, (1959) 322 Siano A : D(A) → H e B : D(B) → H due operatori simmetrici. Se esiste un sottospazio denso D ⊂ D(A2 + B 2 ) ∩ D(AB) ∩ D(BA) su cui A e B commutano e su cui A2 + B 2 è essenzialmente autoaggiunto, allora A e B sono essenzialmente autoaggiunti su D e le misure spettrali di A e B commutano. 9.3 Prodotto tensoriale hilbertiano. Come vedremo tra nel prossimo capitolo, i sistemi quantistici composti vengono descritti in spazi di Hilbert ottenuti prendendo il prodotto tensoriale Hilbertiano degli spazi di Hilbert dei sottosistemi componenti. Chiariamo nel seguito cosa intendiamo qui per prodotto tensoriale Hilbertiano, assumendo, per le motivazioni generali e le notazioni, che il lettore conosca la definizione di prodotto tensoriale nel caso di spazi vettoriali a dimensione finita. 9.3.1 Prodotto tensoriale di spazi di Hilbert. Consideriamo n spazi di Hilbert (complessi) (Hi , (·|·)i ) con i = 1, 2, · · · , n e scegliamo un vettore vi per ogni spazio Hi . In analogia al caso finito dimensionale, potremmo definire l’applicazione v1 ⊗ · · · ⊗ vn come un’applicazione multilineare dal prodotto cartesiano degli n spazi duali topologici H0i degli spazi Hi a valori in C, usando la definizione che si usa per il caso finito dimensionale: v1 ⊗ · · · ⊗ vn : H01 × · · · × H0n 3 (f1 , · · · , fn ) 7→ f1 (v1 ) · · · fn (vn ) . Del tutto equivalentemente, tenendo conto del teorema di Riesz, possiamo definire l’azione di v1 ⊗ · · · ⊗ vn sulle n-ple di vettori di H1 × · · · × Hn invece che su quelle di H01 × · · · × H0n . In questo modo teniamo conto dell’identificazione del duale di uno spazio di Hilbert con lo spazio di Hilbert stesso, ottenuta tramite un anti isomorfismo costruito con il prodotto scalare. Con questo approccio v1 ⊗ · · · ⊗ vn agisce su n-ple di vettori (u1 , · · · , un ) ∈ H1 × · · · × Hn per mezzo dei prodotti scalari e definisce un funzionale anti multi-lineare. Sceglieremo questa seconda via per motivi di praticità. Definizione 9.5. Consideriamo n spazi di Hilbert (complessi) (Hi , (·|·)i ) con i = 1, 2, · · · , n e scegliamo un vettore vi per ogni spazio Hi . Il prodotto tensoriale dei vettori v1 , . . . , vn , v1 ⊗ · · · ⊗ vn è l’applicazione multi anti-lineare: v1 ⊗ · · · ⊗ vn : H1 × · · · × Hn 3 (u1 , · · · , un ) 7→ (u1 |v1 )1 · · · (un |vn ) . n H indichiamo l’insieme di applicazioni {v ⊗ · · · ⊗ v | v ∈ H , i = 1, 2, · · · , n} mentre Con Ti=1 i 1 n i i N n ] i=1 Hi denota lo spazio vettoriale su C delle applicazioni multi anti-lineari date da combinan H . zioni lineari finite di elementi v1 ⊗ · · · ⊗ vn ∈ Ti=1 i 323 Osservazione. Con questa definizione, la funzione che associa (v1 , . . . vn ) a v1 ⊗ · · · ⊗ vn è comunque multi-lineare. Nn Possiamo definire un prodotto scalare (·|·) su ] i=1 Hi come segue. Consideriamo l’applicazione n H × T n H → C con da S : Ti=1 i i i=1 S(v1 ⊗ · · · ⊗ vn , v10 ⊗ · · · ⊗ vn0 ) := (v1 |v10 ) · · · (vn |vn0 ) . Vale il seguente risultato. n H × T n H → C si estende in maniera univoca, per Proposizione 9.5. L’applicazione S : Ti=1 i i=1 i antilinearità nell’argomento di sinistra e per linearità in quello di destra, ad un prodotto scalare Nn hermitiano sullo spazio vettoriale complesso ] i=1 Hi definito da: (Ψ|Φ) := XX i se Ψ = P i αi v1i αi βj S(v1i ⊗ · · · ⊗ vni , u1j ⊗ · · · ⊗ unj ) j ⊗ · · · ⊗ vni e Φ = P j βj u1j ⊗ · · · ⊗ unj (essendo entrambe le somme finite). Prova. Per semplicità di scrittura eseguiamo la prova nel caso n = 2. Per n > 2 la dimostrazione Ü H2 e valgono le decomposizioni è identica. Dobbiamo prima di tutto mostrare che se Ψ, Φ ∈ H1 ⊗ P P P P Ψ = j αj vj ⊗ vj0 = h βh uh ⊗ u0h e Φ = k γk wk ⊗ wk0 = s δs zs ⊗ zs0 , allora risulta XX j αj γk S(vj ⊗ vj0 , wk ⊗ wk0 ) = j k αj δs S(vj ⊗ vj0 , zs ⊗ zs0 ) (9.78) βh δs S(uh ⊗ u0h , zs ⊗ zs0 ) . (9.79) XX s e anche XX h βh γk S(uh ⊗ u0h , wk ⊗ wk0 ) = XX h k s Ü H2 è ben definita non dipendendo Questo proverebbe che l’estensione (anti-) lineare di S a H1 ⊗ dalla decomposizione usata per rappresentare gli argomenti di S. Dimostriamo l’indipendenza per l’argomento di sinistra (9.78), per l’argomento di destra (9.79) si procede analogamente. Il primo membro di (9.78) si può riscrivere ! XX j αj γk S(vj ⊗ vj0 , wk ⊗ wk0 ) = X X j k γ k wk ⊗ wk0 (αj vj , vj0 ) = X Φ(αj vj , vj0 ) j k e, con la stessa procedura, lavorando sul secondo membro di (9.78), si ha ugualmente XX X X X 0 0 0 αj δs S(vj ⊗ vj , zs ⊗ zs ) = δs zs ⊗ zs (αj vj , vj0 ) = Φ(αj vj , vj0 ) , j s j s j dove abbiamo usato l’ipotesi Φ = k γk wk ⊗wk0 = s δs zs ⊗zs0 . Quindi S si estende univocamente Ü H2 → C. Direttamente ad una applicazione lineare a destra ed antilineare a sinistra (·|·) : H1 ⊗ dalla definizione di S si ha che vale P P (Ψ|Φ) = (Φ|Ψ) . 324 Per mostrare che in effetti (·|·) definisce un prodotto scalare hermitiano è ora sufficiente provare P che (·|·) è positivo. La prova è semplice. Se Ψ = nj=1 αj vj ⊗ vj0 , dove, per ipotesi n < +∞, possiamo considerare una base Hilbertiana (finita!) u1 , · · · , um (m ≤ n) per il sottospazio generato da v1 , · · · , vn ed una base analoga u01 , · · · , u0l , (l ≤ n) per il sottospazio generato da Pl P 0 v10 , · · · , vn0 . Sfruttando la bi-linearità di ⊗, potremo alla fine scrivere Ψ = m j=1 k=1 bjk uj ⊗ uk dove i coefficienti bjk sono opportuni. Usando direttamente la definizione di S ed il fatto che le basi considerate sono ortonormali: (Ψ|Ψ) = m X l X bjk uj ⊗ j=1 k=1 u0k X l m X bis ui ⊗ u0s i=1 s=1 = n X l X |bjk |2 . j=1 k=1 La positività di (·|·) è ora evidente. 2 Definizione 9.6. Consideriamo n spazi di Hilbert (complessi) (Hi , (·|·)i ) con i = 1, 2, · · · , n. N Il prodotto tensoriale hilbertiano degli spazi Hi , ni=1 Hi , indicato equivalentemente con H1 ⊗ · · · ⊗ Hn , è lo spazio di Hilbert ottenuto prendendo il completamento hilbertiano (cfr sezione Nn 3.1) dello spazio ] i=1 Hi rispetto al prodotto scalare (·|·) della proposizione 10.4. È immediato verificare che la definizione si riduce a quella elementare nel caso in cui gli spazi Hi siano finito dimensionali. Inoltre sussiste il seguente utile risultato. Proposizione 9.6. Consideriamo n spazi di Hilbert (complessi) (Hi , (·|·)i ) con i = 1, 2, · · · , n e corrispondenti basi hilbertiane Ni ⊂ Hi con i = 1, 2, · · · , n. L’insieme N := {z1 ⊗ · · · ⊗ zn | zi ∈ Ni , i = 1, 2, · · · , n} è una base hilbertiana per H1 ⊗ · · · ⊗ Hn . Prova. Per costruzione N è un sistema ortonormale (la verifica è immediata usando la definizione del prodotto scalare sullo spazio prodotto tensoriale). Bisogna solo provare che N è denso in H1 ⊗ · · · ⊗ Hn . Dato che le combinazioni lineari di elementi del tipo v1 ⊗ · · · ⊗ vn sono dense in H1 ⊗ · · · ⊗ Hn è sufficiente provare che ogni elemento v1 ⊗ · · · ⊗ vn può essere approssimato a piacimento da combinazioni lineari di elementi z1 ⊗ · · · ⊗ zn di N . Per semplicità notazionale lavoriamo nel caso n = 2, dato che il caso n > 2 si dimostra nello stesso modo. Nelle nostre ipotesi, per una opportuna scelta di coefficienti γz e βz 0 , valgono gli sviluppi: v1 = X γz z , v2 = X βz 0 z 0 z 0 ∈N2 z∈N1 che equivale a dire (teorema 3.4 e definizione 3.4) X ||v1 ||2 = sup |γz |2 F1 sottoinsieme finito di N1 z∈F1 325 (9.80) e X ||v2 ||2 = sup |βz 0 |2 F2 sottoinsieme finito di N2 . 0 z ∈F2 (9.81) Il calcolo diretto, basato sull’ortonormalità dei vettori z ⊗ z 0 e sulla definizione di prodotto scalare in H1 ⊗ H2 , prova immediatamente che, se F ⊂ N1 × N2 è finito 2 X X 0 v1 ⊗ v2 − γz βz 0 z ⊗ z = ||v1 ||2 ||v2 ||2 − |γz |2 |βz 0 |2 . (z,z 0 )∈F (z,z 0 )∈F Valendo (9.80) e (9.81), possiamo rendere piccolo a piacere il secondo membro dell’identità scegliendo F sempre più grande. Questo conclude la prova. 2 Esempi 9.2. (1) Esemplificheremo la nozione di spazio prodotto tensoriale, mostrando che lavorando con spazi L2 separabili (spazi delle funzioni d’onda in meccanica quantistica), il prodotto tensoriale può essere visto in un altro modo equivalente passando alle misure prodotto. Consideriamo una coppia di spazi di Hilbert separabili, L2 (Xi , µi ) con i = 1, 2, e supponiamo che le misure siano entrambe σ-finite in modo tale che sia ben definita la misura prodotto µ1 ⊗ µ2 su X1 × X2 . Vogliamo mostrare che nelle ipotesi fatte: L2 (X1 , µ1 ) ⊗ L2 (X1 , µ1 ) e L2 (X1 × X2 , µ1 ⊗ µ2 ) sono isomorfi in modo naturale come spazi di Hilbert. La trasformazione unitaria che identifica tali spazi è l’unica estensione lineare limitata dell’applicazione U0 che associa ogni prodotto tensoriale elementare ψ ⊗ φ ∈ L2 (X1 , µ1 ) ⊗ L2 (X1 , µ1 ) alla corrispondente funzione ψ · φ ∈ L2 (X1 × X2 , µ1 ⊗ µ2 ), dove (ψ · φ)(x, y) := ψ(x)φ(y) per x ∈ X1 e y ∈ X2 . La prova è la seguente. Prima di tutto notiamo che, se N1 := {ψn }n∈N e N2 := {φn }n∈N sono basi hilbertiane in L2 (X1 , µ1 ) e L2 (X1 , µ1 ) rispettivamente, allora l’insieme N := {ψn · φm }(n,m)∈N×N è base hilbertiana in L2 (X1 × X2 , µ1 ⊗ µ2 ). Infatti N è banalmente un insieme ortonormale per proprietà elementari della misura prodotto, inoltre, se f ∈ L2 (X1 × X2 , µ1 ⊗ µ2 ) è tale che, per ogni ψn · φn , Z f (x, y)ψn (x)φm (y)dµ1 (x) ⊗ dµ2 (y) = 0 , X×X2 dal teorema di Fubini-Tonelli segue che Z Z f (x, y)ψn (x)dµ1 (x) φm (y)dµ2 (y) = 0 . X2 X1 Dato che le φm sono una base hilbertiana, questo implica che Z f (x, y)ψn (x)dµ1 (x) = 0 , X1 326 eccetto che per un insieme Sm ⊂ X2 di misura nulla rispetto a µ2 . Allora, per y 6∈ S := Um∈N Sm (che è di misura nulla essendo unione numerabile di insiemi di misura nulla) vale Z f (x, y)ψn (x)dµ1 (x) = 0 X1 per ogni ψn ∈ N1 , che implica che f (x, y) = 0, eccetto che per x ∈ B, essendo B di misura nulla rispetto a µ1 . In definitiva vale f (x, y) = 0, escludendo i punti dell’insieme S × B che, per le proprietà elementari di misura prodotto, è un insieme di misura nulla rispetto a µ1 ⊗ µ2 . In definitiva vale f = 0, dove f è pensato come elemento di L2 (X1 × X2 , µ1 ⊗ µ2 ). Allora N è una base hilbertiana essendo insieme ortonormale con ortogonale dato dal vettore nullo. Consideriamo infine l’unica applicazione lineare limitata U che associa l’elemento ψn ⊗ φm della base hilbertiana dello spazio di L2 (X1 , µ1 ) ⊗ L2 (X1 , µ1 ) con l’elemento ψn · φm della base hilbertiana dello spazio di L2 (X1 × X2 , µ1 ⊗ µ2 ). Per costruzione U è unitaria. È inoltre immediato verificare che U associa ogni elemento ψ ⊗ φ ∈ L2 (X1 , µ1 ) ⊗ L2 (X1 , µ1 ) con il corrispondente elemento ψ · φ ∈ L2 (X1 × X2 , µ1 ⊗ µ2 ) (basta notare che ψ ⊗ φ e ψ · φ hanno le stesse componenti nelle rispettive basi) per cui U è un’estensione lineare unitaria di U0 . Ogni altra estensione lineare limitata U 0 di U0 , dovendo estendere U0 , deve ridursi a U quando valutata sulle basi ψn ⊗ φm ψn · φm e pertanto deve coincidere con U stessa per linearità e per continuità. (2) Se (Hk , (·|·)) sono n < ∞ spazi di Hilbert, in generale distinti, la somma diretta HilberL tiana di tali spazi, nk=1 Hk , è definita come lo spazio di Hilbert i cui elementi sono le n-ple (ψ1 , . . . , ψn ) ∈ H1 × · · · × Hn , le operazioni di spazio vettoriale sono quelle standard di n-ple ed il prodotto scalare è ((ψ1 , . . . , ψn )|(φ1 , . . . , φn )) := n X (ψi |φi )i k=1 Un altro risultato importante riguardante il prodotto tensoriale hilbertiano è il seguente e riguarda il caso in cui tutti gli Hk di una somma hilbertiana coincidono. Se H è uno spazio di Hilbert e 0 < n ∈ N è fissato, lo spazio di Hilbert H ⊗ Cn è naturalmente L isomorfo a nk=1 H. La trasformazione unitaria che identifica i due spazi è l’unica estensione lineare limitata dell’applicazione V0 che associa il prodotto tensoriale elementare ψ ⊗ (v1 , . . . , vn ) a (v1 ψ, . . . , vn ψ) per ogni ψ ∈ H e (v1 , . . . , vn ) ∈ Cn . La dimostrazione si esegue come nell’analogo enunciato nell’esempio (1). Si fissa una base hilbertiana N ⊂ H. Per costruzione i vettori (ψ, 0, . . . , 0), (0, ψ, 0, . . . , 0), · · · (0, . . . , 0, ψ) definiscono L una base Hilbertiana di nk=1 H se ψ variano in N . Si considera l’unica trasformazione lineare limitata che associa ψ ⊗ ei a (0, . . . , ψ, . . . , 0) dove: ψ ∈ N , ei è l’i-esimo vettore di base della base canonica di Cn e nella n-pla l’unico posto non nullo, occupato da ψ, è proprio l’iesimo posto. È immediato verificare che tale applicazione è unitaria e si riduce a V0 lavorando su elementi ψ⊗(v1 , . . . , vn ). L’unicità dell’estensione lineare limitata si prova come nell’esempio (1). 327 9.3.2 Prodotto tensoriale di operatori (generalmente non limitati) e loro proprietà spettrali. Come ultimo argomento matematico introduciamo il prodotto tensoriale di operatori. Se A e B sono operatori con dominio, rispettivamente D(A) e D(B) nei rispettivi spazi di Hilbert H1 e H2 , indicheremo con D(A) ⊗ D(B) ⊂ H1 ⊗ H2 il sottospazio delle combinazioni lineari finite di elementi ψ ⊗ φ con ψ ∈ D(A) e φ ∈ D(B). Possiamo provare a definire un operatore A⊗B : D(A) ⊗ D(B) → H1 ⊗ H2 come estensione lineare di ψ ⊗ φ 7→ (Aψ) ⊗ (Bφ). Il punto da verificare è se una tale estensione lineare sia effettivamente ben definita. Supponiamo pertanto che, per Ψ ∈ D(A)⊗D(B), valgano P P le due decomposizioni (finite!) Ψ = k ck ψk ⊗ φk = j c0k ψj0 ⊗ φ0j . Dobbiamo verificare che X ck (Aψk ) ⊗ (Bφk ) = X c0j (Aψj0 ) ⊗ (Bφ0j ) . j k Per verificare ciò consideriamo una base hilbertiana (finita!) di vettori fr per lo spazio generato da tutti i vettori ψk unitamente ai vettori ψj0 , ed una analoga base di vettori gs per lo spazio generato da tutti i vettori φk unitamente ai vettori φ0j . In particolare avremo che ψk ⊗ φk = X ψj0 ⊗ φ0j = (i) αrs fr ⊗ gs , r,s X (j) βrs fr ⊗ gs . r,s Inoltre, dato che siamo partiti dallo stesso vettore Ψ decomposto in due modi diversi, deve valere anche X X (k) (j) ck αrs = c0j βrs . j k Usando queste tre identità si trova immediatamente che: Ü B) (A⊗ X ck ψk ⊗ φk = k = X X ( rs X X ( rs (k) ck αrs )((Afr ) ⊗ (Bgs )) k (j) c0j βrs )((Afr ) ⊗ (Bgs )) = (A ⊗ B) j X c0k ψj0 ⊗ φ0j . j Quindi A ⊗ B è in effetti ben definito. Definizione 9.7. Siano A e B operatori con domini, rispettivamente D(A) e D(B) nei rispettivi spazi di Hilbert H1 e H2 , e D(A) ⊗ D(B) ⊂ H1 ⊗ H2 denoti il sottospazio delle combinazioni lineari finite di elementi ψ ⊗ φ con ψ ∈ D(A) e φ ∈ D(B). Il prodotto tensoriale di A e B è l’operatore lineare A⊗B : D(A)⊗D(B) → H1 ⊗H2 ottenuto estendendo per linearià: ψ ⊗ φ 7→ (Aψ) ⊗ (Bφ) , per ψ ∈ D(A) e φ ∈ D(B). 328 La definizione si estende in modo ovvio al caso di N operatori Ak : D(Ak ) → Hk , con dominio D(Ak ) ⊂ Hk (Hk spazio di Hilbert), definendo l’operatore prodotto tensoriale degli Ak : A1 ⊗ · · · ⊗ AN : D(Ak ) ⊗ · · · ⊗ D(AN ) → H1 ⊗ · · · ⊗ HN . Per le applicazioni è utile il seguente primo elementare risultato. Proposizione 9.7. Se k = 1, . . . , N , siano Ak : D(Ak ) → Hk operatori sugli spazi di Hilbert Hk . Vale quanto segue. (a) Se D(Ak ) = Hk e Ak è chiudibile per k = 1, . . . , N , allora gli operatori definiti sul dominio D(Ak ) ⊗ · · · ⊗ D(AN ): I, A1 ⊗ I ⊗ · · · ⊗ I , . . . , I ⊗ · · · ⊗ Ak ⊗ · · · ⊗ Ah ⊗ · · · ⊗ I , . . . , A1 ⊗ · · · ⊗ An e, sullo stesso dominio, le combinazioni lineari finite di tali operatori, sono tutti operatori chiudibili. (b) Se D(Ak ) = Hk e Ak ∈ B(Hk ) per k = 1, . . . , N e allora A1 ⊗ · · · ⊗ AN ∈ B(H1 ⊗ · · · ⊗ HN ) e ||A1 ⊗ · · · ⊗ AN || = ||A1 || · · · ||AN || Prova. (a) Limitiamoci al caso n = 2, il caso generale è del tutto anaolgo. Si osservi che D(A1 ) ⊗ D(A2 ) è denso per costruzione, per cui gli operatori menzionati in (a) ammettono aggiunto. Si consideri il vettore generico Ψ ∈ D(A∗1 ) ⊗ D(A∗2 ). Per definizione: (Ψ|A1 ⊗ A2 Φ) = (A∗1 ⊗ A∗2 Ψ|Φ) per ogni Φ ∈ D(A1 ) ⊗ D(A2 ). Ma allora, dalla definizione di aggiunto: D(A∗1 ) ⊗ D(A∗2 ) ⊂ D((A1 ⊗ A2 )∗ ) . Per (b) di teorema 5.1, essendo A1 e A2 con domini densi e chiudibili, il dominio dei rispettivi aggiunti dovrà essere denso e di conseguenza D((A1 ⊗ A2 )∗ ) è anch’esso densamente definito per cui A1 ⊗ A2 è chiudibile. La prova per combinazioni lineari è la stessa. La prova di (b) è data negli esercizi 9.2. 2 Vogliamo ora studiarne alcune proprietà di polinomi di operatori A1 ⊗ · · · ⊗ AN , quando gli Ak siano autoaggiunti. Nell’enunciato del teorema, gli argomenti Ak del polinomio Q andrebbero più propriamente intesi come I ⊗ · · · ⊗ I ⊗ Ak ⊗ I ⊗ · · · ⊗ I, ma noi scriveremo semplicemente Ak per non sovraccaricare la notazione. Teorema 9.7. Siano Ak : D(Ak ) → Hk , con D(Ak ) ⊂ Hk , per k = 1, 2, . . . , N operatori autoaggiunti e sia Q(a1 , . . . , an ) un polinomio a coefficienti reali di grado nk nella k-esima variabile. Sia Dk ⊂ D(Ak ) un dominio di essenziale autoaggiunzione per Ank k . Vale quanto segue. NN N nk (a) Q (A1 , . . . , A1 ) è essenzialmente autoaggiunto su N k=1 D(Ak ) e su k=1 Dk ; 329 (b) Se ogni Hk è separabile, lo spettro di Q (A1 , . . . , A1 ) è la chiusura dell’immagine di Q sul prodotto degli spettri di Ak : σ Q (A1 , . . . A1 ) = Q (σ(A1 ), . . . , σ(AN )) . Osservazioni. (1) Usando il teorema 9.7 si può rispondere positivamente alla domanda naturale: se Ak è autoaggiunto, allora l’operatore chiuso I ⊗ · · · I ⊗ Ak ⊗ I ⊗ · · · ⊗ I è autoaggiunto? Basta scegliere Dk = D(Ak ) e Di = Hi per i 6= k e notare che un operatore chiuso essenzialmente autoaggiunto è autoaggiunto (l’unica estensione autoaggiunta è infatti la sua chiusura). (2) La seconda parte del teorema 9.8 implica per esempio che, se Ak è un proiettore ortogonale, allora lo è anche I ⊗ · · · I ⊗ Ak ⊗ I ⊗ · · · ⊗ I. Infatti, se A è proiettore ortogonale, il suo spettro è uguale o contenuto in {0, 1} (ed è chiuso). Per il teorema 9.9, usando il polinomio banale a 7→ a, l’operatore autoaggiunto I ⊗ · · · I ⊗ Ak ⊗ I ⊗ · · · ⊗ I risulta avere lo stesso spettro. Per il teorema spettrale, un operatore autoaggiunto è un proiettore ortogonale se e solo se ha spettro uguale o incluso in {0, 1}. Quindi I ⊗ · · · I ⊗ Ak ⊗ I ⊗ · · · ⊗ I è proiettore ortogonale. Prova del teorema 9.7. (a) Per prima cosa notiamo che l’operatore Q(A1 , . . . , An ) è ben defink nito su D := ⊗N k=1 D(Ak ) (in particolare per (iv) in (c) del teorema 9.1) ed è simmetrico su tale dominio, come si prova per computo diretto, applicando la definizione di prodotto tensoriale di operatori, tenendo conto che i coefficienti di Q sono reali e che ogni Am k con m ≤ nk nk è simmetrico su D(Ak ). Possiamo dire di più : Q(A1 , . . . , An ) è essenzialmente autoaggiunto su D, la prova segue facilmente dal teorema 5.8 di Nelson, esibendo un insieme di vettori analitici per Q(A1 , . . . , An ) il cui spazio generato sia denso nello spazio di Hilbert globale. Tenendo conto di (1) in esempi 9.2, una tale classe di vettori analitici si definisce come quella dei prodotti ten(L,k) (L,N ) (L,1) soriali ψαL ⊗ · · · ⊗ ψαL , con L = 1, 2, . . ., dove {ψαL }αL ∈GL ⊂ D è una base hilbertiana del sottospazio chiuso P (Ak ) ([−L, L) ∩ σ(Ak )), essendo P (Ak ) la misura spettrale di Ak ed avendo cura, ad ogni incremento di L: passando da [−L, L] a [−L − 1, L) ∪ [−L, L) ∪ [L, L + 1), di conservare gli stessi elementi di base relativi al sottospazio associato all’intervallo [−L, L). Il fatto che questi vettori siano analitici per Q(A1 , . . . , An ) si prova facilmente seguendo la stessa strada usata per dimostrare (f) nella proposizione 9.8 (la cui dimostrazione è indipendente dal presente teorema). Per provare che Q(A1 , . . . , An ) è anche essenzialmente autoaggiunto su D(e) := ⊗N k=1 Dk è ora sufficiente provare che vale l’inclusione operatoriale Q(A1 , . . . , An )D(e) ⊃ Q(A1 , . . . , An ) D (infatti, per costruzione Q(A1 , . . . , An ) D(e) ⊂ Q(A1 , . . . , An ) D e quindi Q(A1 , . . . , An )D(e) ⊂ Q(A1 , . . . , An )D ; se ancora Q(A1 , . . . , An )D(e) ⊃ Q(A1 , . . . , An ) D , allora deve essere Q(A1 , . . . , An )D(e) = Q(A1 , . . . , An )D ed il secondo membro è autoaggiunto per cui l’operatore Q(A1 , . . . , An ) D(e) è essenzialmente autoaggiunto essendo simmetrico con chiusura autoaggiunta.) Per provare che Q(A1 , . . . , An )D(e) ⊃ Q(A1 , . . . , An ) D si supponga che ⊗N k=1 φk ∈ D, allora φk ∈ D(Ank k ), ed essendo Dk dominio di essenziale autoaggiunzione di Ank k , deve esistere una successione {φlk }l∈N con φlk → φk e Ank k φl → Ank k φk se l → +∞. Una facile stima 330 implica allora che Ank k φl → Ank k φk se l → +∞ quando 1 ≤ m ≤ nk . Concludiamo che l N N l N ⊗N k=1 φk → ⊗k=1 φk e Q(A1 , . . . , AN )(⊗k=1 φk ) → Q(A1 , . . . , AN )(⊗k=1 φk ) quando l → +∞. Il risultato si estende alle combinazioni lineari finite di vettori della forma ⊗N k=1 φk . Questo implica che Q(A1 , . . . , An )D(e) ⊃ Q(A1 , . . . , An )D . Passiamo a provare (b). Per prima cosa, sfruttando (c) del teorema 9.3 ed tenendo conto della separabiltà di ciascuno spazio H, rappresentiamo ogni operatore autoaggiunto Ak in termini di un operatore moltiplicativo per la funzione Fk nello spazio di Hilbert L2 (Mk , µk ) che è identificato 2 2 N N con Hk . Ricordiamo che ⊗N k L (Mk , µk ) è isomorfo a L (×k=1 Mk , µ) con µ = ⊗k=1 µk , come discusso in (1) di esempi 9.2. Sotto tale isomorfismo, l’operatore Q(A1 , . . . , AN ) su D corrisponde alla moltiplicazione per la funzione Q(F1 , . . . , FN ) e D corrisponde allo spazio generato in nk 2 L2 (×N k=1 Mk , µ) da prodotti finiti φ1 (m1 ) · · · φN (mN ) tali che Fk · φk ∈ L (Mk , µk ). Supponiamo che λ ∈ Q(σ(A1 ), . . . , σ(AN )). Se I 3 λ è un intervallo aperto, allora Q−1 (I) ⊃ ×N k=1 Ik per qualche intervallo aperto Ik ⊂ R, in modo tale che Ik ∩ σ(Ak ) 6= ∅ per ogni k = 1, 2, . . . , N . Si osservi ora che σ(Ak ) = ess ran(Fk ), dove si è tenuto conto di (4) in esercizi 9.1. Conseguentemente µk (Fk−1 (Ik )) 6= 0 e quindi µ[Q(F1 , . . . , FN )−1 (I)] 6= 0. Questo significa che λ ∈ ess ranQ(F1 , . . . , FN ) = σ(Q(A1 , . . . , PN )) per (4) in esercizi 9.1. Viceversa, se λ 6∈ Q(σ(A1 ), . . . , σ(AN )) allora (λ − Q(F1 , . . . , FN )) : ×N k=1 Mk → R è limitata e dunque λ ∈ ρ(Q(A1 , . . . , AN )), cioé λ 6∈ σ(Q(A1 , . . . , AN )). 2 9.3.3 Un esempio: il momento angolare orbitale. In meccanica quantistica le osservabili che corrispondono alle 3 componenti cartesiane del momento angolare orbitale di una particella sono le uniche estensioni autoaggiunte dei tre operatori sullo spazio di Hilbert L2 (R3 , dx) (dove dx è la misura di lebesgue su R3 ): L1 := X2 S(R3 ) P3 S(R3 ) −X3 S(R3 ) P2 S(R3 ) , L2 := X3 S(R3 ) P1 S(R3 ) −X1 S(R3 ) P3 S(R3 ) L3 := X1 S(R3 ) P2 S(R3 ) −X2 S(R3 ) P1 S(R3 ) , (9.82) dove Xi e Pi sono gli operatori posizione ed impulso introdotti nella sezione 5.3, e S(R3 ) è lo spazio di Schwartz delle funzioni a valori complessi, infinitamente È differenziabili, che si annullano all’infinito più rapidamente di ogni potenza negativa di r := x21 + x22 + x23 . Nel seguito sceglieremo dominio come D(L1 ) = D(L2 ) = D(L3 ) = S(R3 ), dato che S(R3 ) è un sottospazio invariante per gli operatori Xi e Pi (e quindi anche per ogni Li ). Mostreremo nel seguito che gli operatori momento angolare orbitale Li , sul dominio detto, sono essenzialmente autoaggiunti e ne espliciteremo uno sviluppo spettrale e lo spettro. In questa sede ci occuperemo solo delle proprietà matematiche degli operatori in questione, lasciando ogno commento di carattere fisico ai capitoli 10 e 11. Nel seguito ci concentreremo unicamente sull’operatore L3 , dato che, cambiando i nomi delle coordinate, quanto diremo per esso si può estendere agli altri due analoghi operatori. Esplicitamente si può scrivere: ∂ ∂ L3 = −i~ x1 − x2 , ∂x2 ∂x1 331 dove x1 e x2 si devono intendere come operatori moltiplicativi per le corrispondenti funzioni. Un quarto operatore che useremo nel seguito è l’operatore momento angolare totale (elevato al quadrato): L2 := L21 + L22 + L23 ; definito su S(R3 ). Anche tale operatore è essenzialmente autoaggiunto su S(R3 ). Calcoleremo lo spettro e daremo la forma esplicita dello sviluppo spettrale di L2 := L2 . Per determinare gli sviluppi spettrali e gli spettri detti, conviene esplicitare gli operatori considerati in coordinate polari sferiche r, θ, φ dove x1 = r sin θ cos φ, x2 = r sin θ sin φ, x3 = r cos θ e quindi r ∈ (0 + ∞), θ ∈ (−π/2, π/2), φ ∈ (−π, π). In questo modo si trova, con qualche banale calcolo, che: ∂ 1 ∂ 1 ∂2 ∂ L3 = −i~ + , L2 = −~2 sin θ , (9.83) ∂φ ∂θ sin2 θ ∂φ2 sin θ ∂θ dove gli operatori agiscono sulle funzioni dello spazio di Schwartz S(R3 ) il cui argomento è sottoposto al cambio di coordinate indicato sopra. Dalla (9.83) risulta evidente che i due operatori non dipendono dalla coordinata radiale r. Questo fatto si rivelerà di cruciale importanza. Tenendo conto di ciò , notiamo che R3 = S2 × [0, +∞), dove (a meno di insiemi di misura nulla) la superficie sferica di raggio unitario S2 è lo spazio su cui variano le coordinate θ, φ, mentre [0, +∞) è lo spazio su cui varia la coordinata radiale r; ulteriormente la misura di Lebesgue di R3 può essere vista come il prodotto delle misure: dx = dω(θ, φ) ⊗ r2 dr , dove: dω(θ, φ) = sin θdθdφ è la misura standard su S2 identificata con il rettangolo (−π/2, π/2) × (−π, π) in coordinate (θ, φ) (l’insieme S2 \ ((−π/2, π/2) × (−π, π)) ha dω-misura nulla e pertanto non crea problemi). In questo modo abbiamo anche la decomposizione: L2 (R3 , dx) = L2 (S2 × [0, +∞), dω(θ, φ) ⊗ r2 dr) . In base a (1) in esempi 9.2, abbiamo infine che: L2 (R, dx) = L2 (S2 , dω) ⊗ L2 ((0, +∞), r2 dr) . A questo punto definiamo gli operatori nello spazio di Hilbert L2 (S2 , dω): ∂ 1 ∂ 1 ∂2 ∂ 2 2 , S2 L = −~ + sin θ , S2 L3 = −i~ ∂φ ∂θ sin2 θ ∂φ2 sin θ ∂θ (9.84) (9.85) con dominio C ∞ ((−π/2, π/2) × (−π, π)), riferito alle coordinate (θ, φ), che si può provare essere denso in L2 (S2 , dω) (lo si provi per esercizio). Tali operatori risultano essere hermitiani e quindi simmetrici come è facile verificare per computo diretto. Prima della formulazione della meccanica 332 quantistica, dallo studio dell’equazione di Laplace (e dall’elettrodinamica classica) era già noto che esiste una base hilbertiana di L2 (S2 , dω) costituito dalle cosiddette armoniche sferiche [NiOu82]: Ylm (θ, φ) (−1)l := l 2 l! s (2l + 1) (l + m)! imφ 1 dl−m e (1 − cos2 θ)l , m 4π (l − m)! sin φ d(cos θ)l−m (9.86) m ∈ N , |m| ≤ 2l + 1 . (9.87) dove: l = 0, 1, 2, . . . Le funzioni Yml ∈ C ∞ ((−π/2, π/2) × (−π, π)) sono note autofunzioni degli operatori differenziali S2 L3 e S2 Lz dati in (9.83), valendo: l S2 L3 Ym S2 L = ~ mYml , 2 Yml = ~2 l(l + 1)Yml . (9.88) Si osservi che la prima identità è ovvia per definizione delle funzioni Yml . In particolare i vettori Yml sono un insieme di vettori analitici degli operatori simmetrici S2 L2 e S2 L3 , definiti su C ∞ ((−π/2, π/2)×(−π, π)). Dato che le Yml formano una base hilbertiana dello spazio L2 (S2 , dω), esse garantiscono, per il criterio di Nelson (teorema 5.8), che gli operatori S2 L2 e S2 L3 definiti su C ∞ ((−π/2, π/2) × (−π, π)) siano essenzialmente autoaggiunti. Seguendo la stessa procedura usata nella sezione 9.1.3 per l’operatore hamiltoniano dell’oscillatore armonico unidimensionale, concludiamo che le decomposizioni spettrali di L2 := L2 e L3 := Lz sono: 2 ~2 l(l S2 L = sl∈N, m∈Z ,|m|≤2l+1 X + 1)Yml (Yml | ) e X ~ mYml (Yml | S2 L3 = sl∈N, m∈Z ,|m|≤2l+1 ) (9.89) e, contestualmente, gli spettri sono: n σ(S2 L2 ) = σp (S2 L2 ) = ~2 l(l + 1) l = 0, 1, 2 . . . o , (9.90) e σ(S2 L3 ) = σp (S2 L3 ) = { ~ m | |m| ≤ 2l + 1 , m ∈ Z, l = 0, 1, 2 . . . } . (9.91) Torniamo ora allo spazio Dato che lo spazio D(0, +∞) delle funzioni a supporto 2 2 compatto in (0, +∞) è denso nello spazio di Hilbert separabile L ((0 + ∞), r dr), per (b) in proposizione 3.4, esisterà una base hilbertiana {ψn }n∈N costituita da funzioni in D(0, +∞). Si verifica per computo diretto, passando in coordinate cartesiane, che le funzioni: C∞ L2 (R3 , dx). fl,m,n (x) = Yml (θ, φ)ψn (r) , (9.92) sono funzioni di classe C ∞ (R3 ) (le uniche singolarità apparirebbero per x = 0, ma in un intorno di tale punto le funzioni dette si annullano per costruzione). Per costruzione, le funzioni fl,m,n hanno anche supporto compatto e pertanto appartengono a S(R3 ). Notando che, con le definizioni date e tenendo conto dei domini degli operatori considerati: S2 L3 ⊗ ID(0,+∞) ⊂ L3 e 333 S2 L 2 ⊗ ID(0,+∞) ⊂ L2 , concludiamo che {Yml ⊗ ψn | n, l ∈ N, |m| ≤ 2l + 1 , m ∈ Z} ⊂ S(R3 ), è una base hilbertiana di L2 (R3 , dx) = L2 (S2 , dω) ⊗ L2 ((0, +∞), r2 dr) per quanto visto in (2) in esempi 9.2. Dato che, evidentemente, pensando L3 e L2 come operatori su S(R3 ), L3 Yml ⊗ ψn = ~ mYml ⊗ ψn , L2 Yml ⊗ ψn = ~2 l(l + 1)Yml ⊗ ψn . (9.93) possiamo concludere nuovamente che L2 e L3 sono essenzialmente autoaggiunti su tale dominio e valgono sviluppi spettrali per le loro uniche estensioni autoaggiunte L2 := L2 e Lz := Lz del tipo: L2 = s- X ~2 l(l+1)Yml ⊗ψn (Yml ⊗ψn | ) e Lz = s- X ~mYml ⊗ψn (Yml ⊗ψn | ), (9.94) l,n∈N, m∈Z ,|m|≤2l+1 l,n∈N, m∈Z ,|m|≤2l+1 Mentre gli spettri di L2 := e L3 sono ancora dati da (9.90) e (9.91). Si noti che le misure spettrali di L2 e di L3 commutano. Si può arrivare agli stessi risultati applicando in modo opportuno il teorema 9.7. Esercizi 9.2. (1) Si supponga che V : R3 → R sia tale che l’operatore simmetrico H1 individuato dall’operaP ∂2 tore differenziale −∆x + V (x) sia essenzialmente autoaggiunto su S(R3 ), dove ∆x := 3k=1 ∂x 2 i è l’operatore di Laplace. Si provi che l’operatore simmetrico H su L2 (R3 × R3 , dx ⊗ dy) dato dall’operatore differenziale −∆x + V (x) − ∆y + V (y) è essenzialmente autoaggiunto sullo spazio generato dai prodotti finiti di funzioni in S(R3 ), una nella variabile x e l’altra nella variabile y. Si provi infine che: σ(H) = σ(H1 ) + σ(H1 ) . (2) Provare che se Ak ∈ B(Hk ) per k = 1, . . . , N , allora A1 ⊗ · · · ⊗ Ak ∈ B(H1 ⊗ · · · ⊗ HN ). Soluzione. Consideriamo il caso N = 2, il caso generale è analogo. Se ψ = {fi }i∈I e {gj }j∈J P sono basi hilbertiane di H1 e H2 , si consideri la somma finita ψ := ij cij fi ⊗ gj . Allora P P P P ||(A1 ⊗ I)ψ||2 = j || i cij A1 fi ||2 ≤ j ||A1 ||2 i |cij |2 = ||A1 ||2 ||ψ||2 . Per densità si conclude che ||A1 ⊗ I|| ≤ A. Quindi ||A1 ⊗ A2 || ≤ ||A1 ⊗ I|| ||I ⊗ A2 || ≤ ||A1 || ||A2 ||. (3) Mostrare che, nelle ipotesi in (2), vale anche: ||A1 ⊗ · · · ⊗ Ak || = ||A1 || · · · ||AN || . Soluzione. Consideriamo ancora il caso n = 2, il caso generale ssendo analogo. Se A1 = 0 o A2 = 0 la tesi è ovvia, per cui assumiamo ||A1 ||, ||A2 || > 0. Nella soluzione di (2) abbiamo trovato che ||A1 ⊗ A2 || ≤ ||A1 || ||A2 ||, per cui è sufficiente mostrare la disuguaglianza opposta. () () Dalla definizione di ||A1 || e ||A2 ||, segue che per ogni > 0 esistono ψ1 ∈ H1 e ψ2 ∈ H2 , () () () () ||ψ1 ||, ||ψ2 || = 1, tali che | ||Ai ψi || − ||Ai || | < e quindi, in particolare, ||ψi || ≥ ||Ai || − . Con queste scelte: () () () () ||(A1 ⊗ A2 )(ψ1 ⊗ ψ2 )|| = ||A1 ψ1 || ||A2 ψ2 || ≥ ||A1 || ||A2 || − (||A1 || + ||A2 ||) + 2 . 334 () () e quindi, notando che ||ψ1 ⊗ ψ2 || = 1, ed essendo ||A1 ⊗ A2 || = sup||ψ||=1 ||A1 ⊗ A2 ψ|| ≥ () () ||(A1 ⊗ A2 )(ψ1 ⊗ ψ2 )||, abbiamo, che per ogni > 0: ||A1 ⊗ A2 || ≥ ||A1 || ||A2 || − (||A1 || + ||A2 ||) + 2 . Per > 0 in un intorno di 0, si ha −(||A1 || + ||A2 ||) + 2 < 0, e tale valore tende a 0 se → 0+ . Concludiamo che deve essere ||A1 ⊗ A2 || ≥ ||A1 || ||A2 || come richiesto. (4) Provare che se Ak ∈ B(Hk ) per k = 1, . . . , N allora (A1 ⊗ · · · ⊗ Ak )∗ = A∗1 ⊗ · · · ⊗ A∗N . Suggerimento. Tenendo conto di (2) e verificare che A∗1 ⊗· · ·⊗A∗N soddisfa le proprietà dell’operatore aggiunto per operatori limitati definiti su tutto lo spazio di Hilbert (proposizione 3.5). (5) Mostrare che se Pk ∈ B(Hk ) per k = 1, . . . , N sono proiettori oprtogonali allora P1 ⊗ · · · ⊗ Pk è un proiettore ortogonale. 9.4 Esponenziale di operatori non limitati: vettori analitici. In questa sezione tecnica sviluppiamo alcune proprietà dei vettoria analitici introdotti alla fine del capitolo 5. Ricordiamo che (definizione 5.11), se A è un operatore sullo spazio di Hilbert H con dominio D(A), un vettore ψ ∈ D(A) tale che, An ψ ∈ D(A) per ogni n ∈ N (A0 := I), è detto vettore C ∞ per A ed il sottospazio vettoriale di H dei vettori C ∞ per A si indica con C ∞ (A). ψ ∈ C ∞ (A) è detto vettore analitico per A, se vale: +∞ X ||An ψ|| n t < +∞ , n! n=0 per qualche t > 0. (9.95) Vale infine il teorema di Nelson (dimostrato come teorema 5.8) che afferma che: Teorema di Nelson. Un operatore A simmetrico nello spazio di Hilbert H è essenzialmente autoaggiunto se il suo dominio D(A) contiene un insieme di vettori analitici per A le cui combinazioni lineari finite sono dense in H. Osservazioni. (1) Se A : D(A) → H è autoaggiunto allora D(A) contiene un insieme denso di vettori analitici: si tratta di tutti i vettori ψ per i quali P (A) (E)ψ = ψ per qualche borelliano limitato E ⊂ σ(A), dove P (A) (E) è il generico proiettore della misura spettrale di A. Per ognuno di tali vettori il valore di t > 0 in (9.95) può essere scelto arbitrariamente grande. Lasciamo la semplice prova di tale fatto per esercizio. (2) Segue immediatamente dalla disuguaglianza triangolare che se ψ, φ ∈ C ∞ (A) soddisfano la (9.95) allora ogni loro combinazione lineare soddisfa la stessa disuguaglianza. Pertanto l’inseme dei vettori analitici di un operatore A per un fissato valore t è un sottospazio dello spazio di Hilbert. 335 Notazione. Se A è un operatore sullo spazio di Hilbert H con dominio D(A), nel seguito A (A, t) indicherà il sottospazio di C ∞ (A) che soddisfano (9.95) per il valore t > 0 indicato, T inoltre A (A, +∞) := t>0 A (A, t). Un risultato elementare che della nozione di vettore analitico è la seguente utile proposizione (essenzialmente dovuta a Nelson) che riguarada, in particolare, l’esponenziale di operatori non limitati. Proposizione 9.8. Sia A : D(A) → H operatore sullo spazio di Hilbert H con dominio dato dal sottospazio D(A) ⊂ H. Valgono i seguenti fatti. (a) A (A, t) è uno spazio vettoriale. (b) Se A è chiudibile allora: A (A, t) ⊂ A (A, t) . (c) Per ogni c ∈ C, definendo A + cI sul suo dominuo naturale, vale: A (A + cI, t) = A (A, t) , se inoltre A è hermitiano, definendo A2 sul suo dominuio naturale, vale anche: A (A2 , t) ⊂ A (A, t) . (d) Se A è autoaggiunto e ψ ∈ A (A, t) ∩ D(ezA ), allora: ezA ψ = +∞ X zn n A ψ n! n=0 per ogni z ∈ C con |z| ≤ t . (9.96) se Rez = 0 con |z| ≤ t la (9.96) vale per ogni ψ ∈ A (A, t). (e) Se A è autoaggiunto allora: eisA (A (A, t)) ⊂ A (A, t) per ogni s ∈ R. (f ) Se A è autoaggiunto allora D(A) contiene un sottoinsieme denso i cui elementi sono in A (PN (A), t) per ogni t > 0 e per ogni polinomio PN (A) dell’operatore A di ordine finito N = 0, 1, . . .. Prova. (a) La tesi affermazione segue immediatamente dalla definizione di vettore analitico e dalla maggiorazione: ||An (aψ + bφ)|| ≤ |a| ||An ψ|| + |b| ||An φ|| . (b) Segue immediatamente dalle definizioni tenendo conto che A è un’estensione di A e pertanto n A è un estensione di An . (c) Cominciamo con la prima proprietà . Si osservi prima di tutto che, per costruzione C ∞ (A) = √ C ∞ (A2 ). Inoltre, essendo A hermitiano e valendo x ≤ 1 + x per x ≥ 0, deve essere su C ∞ (A): È È È È ||An ψ|| = (ψ|A2n ψ) ≤ ||ψ|| ||A2n ψ|| ≤ ||ψ||(1 + ||(A2 )n ψ||) . 336 Vale allora, per t > 0, +∞ +∞ +∞ È È È X tn X tn X tn 2 n ||A ψ|| ≤ ||ψ|| ||(A ) ψ|| + ||ψ|| = ||ψ|| ||(A2 )n ψ|| + et n! n! n! n! n=0 n=0 n=0 n=0 +∞ X tn ! n , da cui segue immediatamente la tesi. Per la seconda proprietà notiamo che: k n +∞ +∞ n X 1 X XX n! 1 |c|n−k A ψ n n−k k ||(A + cI) ψ|| = |c| A ψ ≤ n! n! k=0 k!(n − k)!) n=0 k=0 (n − k)! k! n=0 n=0 +∞ X k +∞ X Ak ψ |c|p A ψ = = e|c| . p! k! k! p=0 k=0 k=0 +∞ X +∞ X Quanto ottenuto dimostra che A (A + cI, t) ⊂ A (A, t). Definiamo ora A0 := A + cI, per cui A = A0 + c0 I con c0 = −c. In base a quanto provato: A (A0 + c0 I, t) ⊂ A (A0 , t): Ma questo equivale a A (A, t) ⊂ A (A + cI, t) e quindi A (A, t) = A (A + cI, t). (d) Per un fissato φ ∈ H indichiamo con µφ,ψ la misura di Borel complessa µφ,ψ (E) := φ|P (A) (E)ψ e, per ogni fissato χ ∈ H, µχ indichi la misura positiva finita µχ (E) := χ|P (A) (E)χ . Usando la decomposizione di Radon-Nykodym (vedi Esempi 2.2) dµφ,ψ = hd|µφ,ψ | con |h| = 1 ovunque, si ha subito che, se ψ appartiene al dominio di f (A), allora ÊZ Z Z Z Z R f d|µφ,ψ | = R f h dP (A) ψ ≤ ||φ|| f h dµφ,ψ = φ R f h dP (A) ψ = ||φ|| R |f |2 dµψ . R Se z ∈ C e |z| ≤ t allora: +∞ XZ n=0 σ(A) n +∞ X z n Z z n x d|µφ,ψ (x)| = n! n! +∞ X n=0 ||φ|| |x |d|µφ,ψ (x)| ≤ σ(A) n=0 = n +∞ X tn n=0 n! ||φ|| Z 1/2 2n x dµψ (x) σ(A) +∞ X tn tn ||An ψ|| = ||φ|| ||An ψ|| < +∞ , n! n! n=0 dove abbiamo usato nell’ultimo passaggio: +∞ X ||An ψ|| n t < +∞ . n! n=0 (9.97) Il teorema di Fubini-Tonelli implica che, se |z| ≤ t, possiamo scambiare il simbolo di serie con quello di integrale in Z +∞ X zn xn dµφ,ψ (x) . n! σ(A) n=0 337 Allora, se |z| ≤ t e se ψ appartiene al dominio di ezA (cfr definizione 9.2) e valendo (v) in (c) nel teorema 9.1, si ha subito: (φ|e zA Z ψ) = zx e dµφ,ψ σ(A) +∞ X +∞ X zn zn n = x dµφ,ψ = n! σ(A) n=0 n! n=0 Z Z xn dµφ,ψ = σ(A) +∞ X zn (φ|An ψ) . n! n=0 Dato che in virtù di (9.97) la serie: +∞ X zn n A ψ n! n=0 converge in H ed il prodotto scalare è continuo, l’identità ottenuta sopra può essere trascritta come: ! +∞ X zn n zA A ψ . (φ|e ψ) = φ n! n=0 Per l’arbitrarietà di φ questa equivale a (9.96). Nel caso in cui Rez = 0, la funzione R 3 x 7→ ezx è banalmente limitata e pertanto il dominio di ezA è tutto lo spazio di Hilbert per il teorema 9.1 tenendo conto che ogni misura positiva µψ è finita. (e) Usando (iii) in (c) del teorema 9.1, segue immediatamente che se ψ ∈ C ∞ (A) ⊂ C ∞ (A) e An eisA ψ = eisA An ψ, ma, dato che eisA è unitario ||eisA An ψ|| = ||An ψ|| da cui segue immediatamente la tesi. R (f) Consideriamo la decomposizione spettrale A = R xdP (A) (x), quindi decomponiamo la retta reale R = ∪n∈Z (n, n + 1] ed infine consideriamo i sottospazi chiusi, aR due a due ortogonali, R Hn = Pn (H), dove abbiamo definito i proiettori ortogonali: Pn := (n,n+1] R 1dP (A) (x). Sceglien(n) do una base hilbertiana {ψk }k∈Kn ⊂ Hn per ogni n, l’unione di tali base forma ovviamente R (n) una base hilbertiana di H. Ogni vettore ψk appartiene a D(A) essendo R |x|2 dµψ(n) (x) = R 2 (n,n+1] |x| dµψ (n) (x) k k ≤ |n + 1|2 ed è banalmente un vettore analitico, dato che AHn è limitato con ||AHn || ≤ |n + 1|. Le combinazioni lineari finite di tali vettori sono, per costruzione, un sottospazio vettoriale denso in H, e sono anche vettori analitici per A in virtù di (a). Consideraimo ora un polinomio di ordine N a coefficienti generalmente complessi, PN (x) = PN n N k=0 x , e definiamo PN (A) sul dominio D(PN (A)) = D(A ). Vogliamo verificare che ciascuno (n) dei vettori ψk determinati sopra è un vettore analitico per l’opertaore chiuso (autoaggiunto se PN è reale) PN (A). Scegliamo uno dei vettori suddetti che indicheremo con ψ, e supponiamo che la sua misura spettrale µψ abbia supporto in qualche intervallo finito (−L, L]. Abbiamo allora R k k k 2 che ||A ψ|| ≤ L dato che: ||A ψ|| = (−L,L] x2k dµψ (x) ≤ L2k . Conseguentemente: X N N X X N |ak |||Ak ψ|| = |ak |Lk . ||P (A)ψ|| = ak Ak ψ ≤ k=0 k=0 k=0 Con la stessa procedura troviamo: X N N X ||P (A)n ψ|| = ak1 · · · akn Ak1 +···+kn ψ ≤ |ak1 | · · · |akn |||Ak1 +···+kn ψ|| k1 ,...,kn =0 k1 ,...,kn =0 338 ≤ N X |ak1 | · · · |akn |Lk1 +···+kn . k1 ,...,kn =0 Concludiamo che, se ML := PN k k=0 |ak |L , allora deve essere: ||P (A)n ψ|| ≤ MLn e pertanto ψ è un vettore analitico per P (A) per ogni valore di t > 0. 2 9.5 Teorema di decomposizione polare per operatori non limitati. Consideriamo un operatore chiuso e con dominio denso, A : D(A) → H, nello spazio di Hilbert H. Usando il fatto che, come vedremo, A∗ A è autoaggiunto positivo e sfruttando il teorema spettrale √ per operatori non limitati, è possibile definire l’operatore positivo autoaggiunto |A| := A∗ A. Se definiamo, almeno su Ran(|A|), l’operatore U = A|A|−1 , estendendolo all’operatore nullo sull’ortogonale di Ran(|A|), abbiamo immediatamente che vale la decomposizione: A = U |A| . Formalmente, e senza prestare troppa attenzione ai domini, si verifica che U Ran(|A|) è un’isometria. In questo modo si ottiene, a livello euristico, una generalizzazione del teorema 3.9 di decomposizione polare, che abbiamo provato per operatori limitati definiti su tutto lo spazio di Hilbert. Questo approccio diretto ha tuttavia il difetto che non è evidente su quale dominio valga la decomposizione di sopra (a priori i domini di A e di |A| possono essere differenti) ed il tentativo di rendere rigoroso il ragionamento si rivela piuttosto pesante. Pertanto noi seguiremo un approccio più indiretto basato su un teorema più generale. L’estensione del teorema di decomposizione polare che troveremo alla fine gioca un ruolo fondamentale nella teoria quantistica dei campi rigorosa, in riferimento alla teoria modulare di Tomita-Takesaki ed alla definizione degli stati termici KMS [BrRo02]. 9.5.1 Proprietà degli operatori A∗ A, radici quadrate di operatori autoaggiunti positivi non limitati. Procediamo in alcuni passi, dimostrando qui che A∗ A è autoaggiunto e che D(A∗ A) è un core per A, e quindi un teorema che, in un certo senso, generalizza in teorema di decomposizione polare avendo cura di specificare in modo chiaro i domini degli operatori ed una proposizione riguardate l’esistenza e l’unicità delle radici quadrate autoaggiunte positive di operatori autoaggiunti non limitati. Teorema 9.8. Si consideri un operatore chiuso e con dominio denso, A : D(A) → H, nello spazio di Hilbert H. Valgono i seguenti fatti: 339 (a) A∗ A, definito sul dominio naturale D(A∗ A) (definizione 5.1), è autoaggiunto; (b) il sottospazio denso D(A∗ A) è un core per A: AD(A∗ A) = A (9.98) Prova. Per dimostrare (a), indicato con I : H → H l’operatore identità , si introduce l’operatore I + A∗ A, definito sul suo dominio naturale (che coincide ancora con D(A∗ A), come si dimostra immediatamente dalla definizione 5.1). Si prova poi che esiste un operatore positivo P ∈ B(H) tale che Ran(P ) = D(I + A∗ A), e che soddisfa: (I + A∗ A)P = I , P (I + A∗ A) = ID(I+A∗ A) . (9.99) Per (f) in proposizione 3.8, l’operatore P ∈ B(H) deve essere autoaggiunto in quanto positivo. Per l’unicità della funzione inversa, l’operatore I + A∗ A deve allora coincidere con l’inverso di P ottenuto tramite la sua decomposizione spettrale: P −1 = Z λ−1 dP (P ) (λ) . σ(P ) Tale operatore è autoaggiunto in virtù del teorema 9.1. L’operatore A∗ A = (I + A∗ A) − I sarà allora autoaggiunto sul dominio D(I + A∗ A) = D(A∗ A), che dovrà essere denso di conseguenza. Per concludere la dimostrazione proviamo che esiste B ∈ B(H) positivo, con Ran(P ) = D(I + A∗ A) e che vale (9.99). Se f ∈ D(I + A∗ A) = D(A∗ A) allora Af ∈ D(A∗ ) per definizione di D(A∗ A). Di conseguenza: (f |f ) + (Af |Af ) = (f |f ) + (f |A∗ Af ) = (f |(I + A∗ A)f ) . Abbiamo in tal modo ottenuto che (I + A∗ A) ≥ 0, ma anche, dalla disuguaglianza di CauchySchwartz, che deve essere ||f ||2 ≤ ||f || ||(I + A∗ A)f || e dunque I + A∗ A : D(A∗ A) → H è iniettivo. Consideriamo ora l’operatore A che è chiuso e densamente definito. L’identità provata in (d) del teorema 5.1, implica che che, per ogni h ∈ H esiste un unico P h ∈ D(A), ed un unico Qh ∈ D(A∗ ) tali che in H ⊕ H: (0, h) = (−AP h, P h) + (Qh, A∗ Qh) . (9.100) Per costruzione P, Q sono definiti su tutto H ed inoltre i due vettori a secondo membro, pensati come vettori di H ⊕ H, sono artogonali. Per definizione della norma usata su H ⊕ H, l’dentità ottenuta ci dice anche che, per ogni h ∈ H: ||h||2 ≥ ||P h||2 + ||Qh||2 e quindi P, Q ∈ B(H) valendo ||P ||, ||Q|| ≤ 1. Considerando le singole componenti in (9.100), si ha anche che: Q = AP e h = P h + A∗ Qh = P h + A∗ AP h = (I + A∗ A)P h , 340 per ogni h ∈ H. Quindi (I + A∗ A)P = I e pertanto P : H → D(I + A∗ A) deve essere iniettiva, ma anche suriettiva dato che (I + A∗ A) è iniettiva, come provato sopra. Per l’unicità dell’inversa di funzioni biettive, deve anche essere P (I + A∗ A) = ID(I+A∗ A) . Fino ad ora abbiamo provato che P ∈ B(H) ha immagine che ricopre D(I + A∗ A) e che vale (9.99). Il fatto che P ≥ 0 si prova come segue. Se h ∈ H, allora h = (I + A∗ A)f per qualche f ∈ D(A∗ A) e quindi: (P h|h) = (P (I + A∗ A)f |(I + A∗ A)f ) = (f |(I + A∗ A)f ) ≥ 0 . Per concludere, dimostriamo (b). Dato che A è chiuso, il suo grafico è un sottospazio chiuso di H ⊕ H ed è di conseguenza uno spazio di Hilbert. Supponiamo allora che (f, Af ) ∈ G(A) sia ortogonale a G(AD(A∗ A) ), allora, per ogni x ∈ D(A∗ A) deve essere: 0 = ((f, Af )|(x, Ax)) = (f |x) + (Af |Ax) = (f |x) + (f |A∗ Ax) = (f |(I + A∗ A)x)) . Dato che Ran(I + A∗ A) = H, deve essere f = 0 e quindi l’ortogonale di G(AD(A∗ A) ) rispetto allo spazio di Hilbert G(A) è banale e dunque: G(AD(A∗ A) ) = G(A), che è la tesi. 2 Passiamo ora ad enunciare e provare un notevole teorema che, unitamente ad un teorema di unicità delle radici quadrate positive di operatori autoaggiunti positivi (non limitati) implica, come sottocaso, il teorema di decomposizione polare per operatori chiusi e densamente definiti. Ricordiamo che, per una coppia di oparatori con lo stesso dominio D, P ≤ Q significa (f |P f ) ≤ (f |Qf ) per ogni f ∈ D. Teorema 9.9. Si consideri una coppia di operatori chiusi e con dominio denso, A : D(A) → H, B : D(B) → H nello spazio di Hilbert H. (a) Se vale: D(A∗ A) ⊃ D(B ∗ B) unitamente a A∗ AD(B ∗ B) ≤ B ∗ B , (9.101) allora D(A) ⊃ D(B) ed esiste un operatore limitato C : H → H unicamente individuato dalle richieste: AD(B) = CB , Ker(C) ⊃ Ker(B ∗ ) . (9.102) Ulteriormente risulta ||C|| ≤ 1 e C(Ran(B))⊥ = 0. (b) Se vale: D(A∗ A) ⊃ D(B ∗ B) unitamente a A∗ AD(B ∗ B) = B ∗ B , allora CRan(B) è un isometria e Ker(C) = Ker(B ∗ ). (c) Se vale: D(A∗ A) = D(B ∗ B) unitamente a allora D(A) = D(B). 341 A∗ A = B ∗ B , (9.103) (9.104) Prova. (a) Per prima cosa proviamo l’unicità di C. Se C e C 0 sono limitati e soddisfano A = CB e A = C 0 B, allora C − C 0 è l’operatore nullo su Ran(A). Per continuità , abbiamo anche che C Ran(B) = C 0 Ran(B) . Dato che vale la deocmposizione ortogonale H = Ran(B) ⊕ (Ran(B))⊥ e (Ran(B))⊥ = Ker(B ∗ ), il fatto che KerC ⊃ Ker(B ∗ ), KerC 0 ⊃ Ker(B ∗ ) implica che C(Ran(B))⊥ = C 0 (Ran(B))⊥ . Di conseguenza C = C 0 . Passiamo a provare che esiste un operatore C ∈ B(H) che soddisfa A = CB su D(B) (e quindi questo implica che D(B) ⊂ D(A)), Ker(C) ⊃ Ker(B ∗ ) e che sono vere le proprietà ||C|| ≤ 1 e C(Ran(B))⊥ = 0. Siano A0 e B 0 le restrizioni di A e B a, rispettivamente, D(A∗ A) e D(B ∗ B). Dato che (per il teorema precedente) questi spazi sono core per A e B rispettivamente, abbiamo che: Ran(A0 ) = Ran(A) e Ran(B 0 ) = Ran(B). Notiamo infine che: Ker(A) = Ker(A0 ) e Ker(B) = Ker(B 0 ), dato che D(A∗ A) ⊂ D(A) e D(B ∗ B) ⊂ D(B). Cominciamo con il produrre un operatore che soddisfi: A0 = CB 0 . Questa richiesta individua completamente un operatore lineare C su Ran(B 0 ), definito come: A0 f = CB 0 f , per ogni f ∈ D(B ∗ B) ⊂ D(A∗ A) . Perché questa sia una definizione ben posta, bisogna che B 0 f = B 0 g implichi A0 f = A0 g cioè, detto in termini equivalenti: B 0 h = 0 implichi A0 h = 0 per h ∈ D(B ∗ B) ⊂ D(A∗ A). Questo fatto è vero. Infatti: B 0 h = 0 implica che (B 0 h|B 0 h) = 0 e quindi, essendo h ∈ D(B ∗ B) ⊂ D(A∗ A), deve valere 0 = (B 0 h|B 0 h) = (h|B ∗ Bh) ≥ (h|A∗ Ah) = (A0 h|A0 h) = ||A0 h||2 ≥ 0, che implica A0 h = 0. L’operatore C risulta essere limitato su Ran(B 0 ) con ||C|| ≤ 1. Infatti, essendo: A∗ A ≤ B ∗ B ed usando il fatto che D(A∗ A) ⊂ D(A) e D(B ∗ B) ⊂ D(B), si ha subito che, se f ∈ D(B ∗ B) ⊂ D(A∗ A): ||C(B 0 f )||2 = (CB 0 f |CB 0 f ) = (A0 f |A0 f ) = (f |A∗ Af ) ≤ (f |B ∗ Bf ) = (B 0 f |B 0 f ) = ||B 0 f ||2 , (9.105) Pertanto C si estende in modo unico su tutto Ran(B 0 ) = Ran(B), conservando la richiesta ||C|| ≤ 1. Per completare la definizione di C : H → H, è sufficiente definire C sull’ortogonale (Ran(B))⊥ = Ker(B ∗ ). Definiamo C come l’operatore nullo su questo spazio. In questo modo C : H → H risulta ancora essere limitato con ||C|| ≤ 1 e la condizione Ker(C) ⊃ Ker(B ∗ ) risulta essere soddisfatta. Per costruzione, per ogni f ∈ D(B ∗ B) ⊂ D(A∗ A), vale: Af = CBf . Dato che D(B ∗ B) è un core per B, se g ∈ D(B) esisterà una successione {fn }n∈N ⊂ D(B ∗ B) ⊂ D(A∗ A), tale che fn → g e Bfn → Bg. Avremo allora che, dalla continuità di C, lim Afn = lim CBfn = C lim Bfn = Bg . n→+∞ n→+∞ n→+∞ Dato che A è chiuso, questo risultato implica che g ∈ D(A) e che limn→+∞ Afn = Ag. Pertanto A0 = CB 0 si estende, in realtà , a A = CB valida su D(B) ⊂ D(A). 342 (b) Nell’ipotesi A∗ A = B ∗ B su D(B ∗ B) ⊂ D(A∗ A), la (9.105) risulta essere rimpiazzata da, se f ∈ D(B ∗ B) ⊂ D(A∗ A): ||C(B 0 f )||2 = (CB 0 f |CB 0 f ) = (A0 f |A0 f ) = (f |A∗ Af ) = (f |B ∗ Bf ) = (B 0 f |B 0 f ) = ||B 0 f ||2 Da tale identità si ricava che C è un isometria su Ran(B) e, per continuità , su Ran(B). Rimane da dimostrare che Ker(C) ⊂ Ker(B ∗ ), dato che l’altra inclusione è valida nel caso generale (a). Se s ∈ Ker(C), dato che si ha la decomposizione ortogonale H = Ran(B)⊕Ker(B ∗ ), deve essere s = r + n con r ∈ Ran(B) e n ∈ Ker(B ∗ ). Pertanto, dal momento che Ker(B ∗ ) ⊂ Ker(C), 0 = Cs = C(r + n) = Cr + Cn = Cr + 0 = Cr. D’altra parte, dato che C è un isometria su Ran(B), 0 = ||Cr|| = ||r|| e quindi Cr = 0. In definitiva, se s ∈ Ker(C), allora s = n ∈ Ker(B ∗ ) e questo conclude la dimostrazione di Ker(C) ⊂ Ker(B ∗ ). (c) Dobbiamo provare che D(A) = D(B) se D(A∗ A) = D(B ∗ B) e A∗ A = B ∗ B. Dalla dimostrazione del caso più generale (a), sappiamo che D(B) ⊂ D(A). Nelle ipotesi in (c), possiamo scambiare il ruolo di A e B, trovando che D(A) ⊂ D(B) e pertanto D(A) = D(B). 2 Ecco l’ultimo ingrediente che generalizza parte del teorema 3.8. Teorema 9.10. Sia A : D(A) → H un operatore autoaggiunto nello spazio di Hilbert H. Valgono i fatti seguenti. (a) A ≥ 0 (che significa (f |Af ) ≥ 0 per ogni f ∈ D(A)) se e solo se σ(A) ⊂ [0 + ∞) (b) Se A ≥ 0, esiste ed è unico un operatore autoaggiunto B ≥ 0 tale che B 2 = A, dove il primo membro è √ definito sul suo dominio naturale D(B 2 ) che coincide con D(A). Vale B = A definito usando l’integrale rispetto alla misura spettrale di A. Prova (a) Se σ(A) ⊂ [0 + ∞), (vii) in (c) nel teorema 9.1, riferito alla PVM P (A) di A, implica immediatamente che A ≥ 0. Viceversa, supponiamo che A ≥ 0 e, per assurdo, che esista λ tale che 0 > λ ∈ σ(A). Se λ ∈ σp (A) allora esistrebbe un autovettore ψ ∈ H \ {0} con autovalore λ e si avrebbe un assurdo: 0 ≤ (ψ|Aψ) = ||ψ||2 λ < 0. Se invece λ ∈ σc (A), dal teorema 9.2 (A) sappiamo che, per ogni intervallo aperto (a, b) 3 λ, vale P(a,b) 6= 0. Potremmo allora scegliere (A) (a, b) = (2λ, λ/2) ottenendo, se 0 6= ψ ∈ P(a,b) (H), usando le proprietà delle misure spettrali del teorema 9.1 ed il fatto che µψ si annulla fuori da (a, b): 0 ≤ (ψ|Aψ) = Z Z xdµψ (x) ≤ xdµψ (x) = (2λ,λ/2) R Z (2λ,λ/2) λ λ dµψ (x) = ||ψ||2 < 0 2 2 che è ancora un assurdo. (b) Una radice quadrata autoaggiunta positiva di A è semplicemente: √ B= √ Z A := xdP (A) (x) . σ(A) Tale operatore è ben definito, dato che σ(A) ⊂ [0, +∞), è autoaggiunto per (ii) in (c) nel teorema 9.1 e vale B 2 = A, dove il primo membro è definito sul suo dominio naturale D(B 2 ) che coincide 343 con D(A) in virtù di (iii) e (iv) in (c) nel teorema 9.1. Infine B ≥ 0 per (vii) in (d) nel teorema 9.1. Passiamo alla dimostrazione di unicità . Supponiamo che B ≥ 0 sia autoaggiunto, B ≥ 0 e B 2 = A. In tal caso, per le prime due ipotesi: Z xdP (B) (x) . B= [0,+∞) Possiamo applicare (c) del teorema 9.1 con P = P (B) , X = [0, +∞), φ(x) = x2 , f (x0 ) = x0 e: (B) 0 Pφ(E) = PE se E ⊂ [0, +∞) , (9.106) ottenendo che vale: 2 Z 2 A=B = x dP (B) Z (x) = [0,+∞) x0 dP 0 (x0 ) . [0,+∞) Per l’unicità della misura aspettrale associata ad A (teorema 9.2), dobbiamo concludere che P 0 = P (A) . Ma allora da (9.106), la PVM P (B) è completamente individuata da P (A) valendo: (B) PE (A) = Pφ(E) se E ⊂ [0, +∞) , e quindi A determina completamente B, che è quindi unico. 2 9.5.2 Teorema di decomposizione polare per operatori chiusi e densamente definiti. Possiamo finalmente enunciare e dimostrare il teorema di decomposizione polare per operatori chiusi densamente definiti. L’idea euristica della dimostrazione è quella di partire, non da A, ma da A∗ A.√Se il teorema di decomposizione polare vale, allora ci si aspetta che A∗ A = |A| |A|, dove |A| := A∗ A è definito per via spettrale, ricordando che A∗ A è autoaggiunto come provato precedentemente. A questo punto, il teorema 9.9, nel caso (c), produce la decomposizione polare di A voluta. La potenza dell’approccio si vede nel fatto che le proprietà dei domini degli operatori coinvolti, difficili da studiare con un approccio più diretto, risultano essere automaticamente fissate dal teorema 9.9. Teorema 9.11. Sia A : D(A) → H un operatore chiuso con dominio denso nello spazio di Hilbert H. Valgono i fatti seguenti. (a) Esiste una sola coppia di operatori P, U in H tali che valgano insieme le condizioni elencate di seguito: (1) vale la decomposizione A = UP , (9.107) (2) P è positivo, autoaggiunto e D(P ) = D(A), (3) U ∈ B(H) è isometrico su Ran(P ), 344 (4) Ker(U ) ⊃ Ker(P ). √ (b) Risulta essere P = |A| := A∗ A e Ker(U ) = Ker(P ) = Ker(A) = (Ran(P ))⊥ . (c) Se A è biettivo, U coincide con l’operatore unitario A|A|−1 . Prova. (a) e (b). Dimostriamo inizialmente l’unicità di P determinandolo esplicitamente, assumendo valida (9.107) insieme a (2), (3) e (4). Cominciamo con il provare che D(A∗ A) = D(P P ). Dalla definizione di operatore aggiunto, tenendo conto che U ∈ B(H), (9.107) implica A∗ = P ∗ U ∗ = P U ∗ . Di conseguenza f ∈ D(A∗ A) se e solo se f ∈ D(P U ∗ U P ). Si osservi ora che, decomponendo H come Ran(P ) ⊕ Ker(P ∗ ) = Ran(P ) ⊕ Ker(P ), tenendo conto del fatto che U è isometrico su Ran(P ) e si annulla su Ker(P ), segue facilmente che (U ∗ U )Ran(P ) = IRan(P ) . Pertanto l’asserzione f ∈ D(A∗ A) se e solo se f ∈ D(P U ∗ U P ) risulta essere equivalente a f ∈ D(A∗ A) se e solo se f ∈ D(P P ). Abbiamo ottenuto che D(A∗ A) = D(P P ). Usiamo ora tale fatto per ottenere l’unicità di P determinandolo esplicitamente. Se g ∈ D(A∗ A) ⊂ D(A) (che equivale a g ∈ D(P P ) ⊂ D(P )) e tenendo ancora conto del fatto U è isometrico su Ran(P ), si ha subito: (f |A∗ Ag) = (Af |Ag) = (U P f |U P g) = (P f |P g) = (f |P P g) per ogni f ∈ D(A) = D(P ). Essendo D(A) = D(P ) un insieme denso, si conclude che A∗ A = P P . Quindi P è una radice ∗ quadrata √ positiva autoaggiunta di A A, ed è dunque l’unica per il teorema 9.10. Vale pertanto ∗ P = A A =: |A|. A questo punto possiamo applicare il caso (c) del teorema 9.9 con B = P (che è chiuso e densamente definito essendo autoaggiunto), trovando che l’operatore U che verifica tutte le richieste coincide con l’operatore C. Il fatto che Ker(U ) = Ker(P ) = (Ran(P ))⊥ segue da (b) del teorema citato, tenendo conto che B = P = P ∗ = B ∗ nel caso in esame e del fatto che (Ran(P ∗ ))⊥ = Ker(P ). L’asserto Ker(A) = Ker(P ) si prova come segue: 0 = ||Af ||2 = (Af |Af ) = (f |A∗ Af ) = (f |P P f ) = (P f |P f ) = ||P f ||2 , dove abbiamo tenuto conto che se Af = 0 allora f ∈ D(A∗ A) per definizione di tale dominio naturale. (c) Se A è iniettivo, usando (b), si trova che Ker(A) = Ker(U ) è banale e quindi U è iniettivo. D’altra parte, direttamente dalla decomposizione polare A = U P si vede che Ran(U ) ⊃ Ran(A) e pertanto, se A è suriettivo, deve esserlo U . Concludiamo che, se A è biettivo, U deve essere tale. In tal caso, per (b), U è un operatore isometrico suriettivo su Ran(P ) = (Ker(P ))⊥ = {0}⊥ = H ed è quindi unitario. Infine, da A = U |A|, essendo A e U biettivi, segue che |A| è biettivo e quindi possiamo scrivere: U = A|A|−1 . 2 Esercizi 9.3. (1) Considerare gli operatori A e A? definiti in (2) di esempi 9.1. Provare che si tratta di operatori chiudibili e dimostrare che: ∗ A? A = A∗ A = A A . 345 (2) Per l’operatore A definito in (2) di esempi 9.1, studiare la decomposizione polare A = U P e dimostrare che l’operatore U soddisfa U ψn = ψn−1 se n ≥ 1 e {ψn }n∈N è la base hilbertiana di L2 (R, dx) definita in (2) di esempi 9.1. (3) Considerare gli operatori A e A? definiti in (2) di esempi 9.1 e sia {ψn }n∈N la base hilbertiana ? di L2 (R, dx) definita in quell’esempio. Calcolare eαA+αA ψn , con α ∈ C fissato. 9.6 I teoremi di Kato-Rellich e di Kato. Gli ultimi teoremi che enunceremo e dimostreremo ora sono quello di Kato-Rellich e quello di Kato. Tali teoremi risultano essere utilissimi nello studio delle proprietà di autoaggiunzione e limitatezza inferiore degli operatori della Meccanica Quantistica (specialmente i cosiddetti operatori hamiltoniani), nell’ambito della teoria delle perturbazioni. In effetti, il primo dei due teoremi fissa delle condizioni generali sufficienti affinchè un operatore T + V , perturbazione di T , sia autoaggiunto e con spettro limitato dal basso quando lo è T . Il secondo considera casi specifici in cui T è l’operatore di Laplace in R3 o Rn . 9.6.1 Il teorema di Kato-Rellich. Abbiamo bisogno di una definizione preliminare. Definizione 9.8. Siano T : D(T ) → H e V : D(V ) → H operatori densamente definiti sullo spazio di Hilbert H che verificano D(T ) ⊂ D(V ). Se esistono a, b ∈ [0, +∞) tali che ||V ϕ|| ≤ a||T ϕ|| + b||ϕ|| per ogni ϕ ∈ D(T ) , (9.108) si dice che V è T -limitato. L’estremo inferiore dei valori a che verificano (9.108) per qualche b è detto il limite relativo di V rispetto a T e, se esso risulta essere nullo, si dice che V è infinitesimo rispetto a T . Osservazioni. (1) Se T è chiudibile, come segue immediatamente dalla definizione di core (definizione 5.6), per provare che vale (9.108) è sufficiente mostrare che tale condizione è soddisfatta su un core di T . (2) La condizione (9.108) è equivalente alla condizione: ||V ϕ||2 ≤ a21 ||T ϕ||2 + b21 ||ϕ||2 per ogni ϕ ∈ D(T ) , (9.109) Infatti, se vale la (9.109) allora vale la (9.108) con a = a1 e b = b1 . Viceversa, se vale la (9.108) allora vale la (9.109) con a21 = (1 + δ)a2 , b21 = (1 − δ −1 )b2 per ogni δ > 0. Possiamo passare ad enunciare e provare il Teorema di Kato-Rellich. Ricordiamo che, per un operatore autoaggiunto A : D(A) → H, vale σ(A) ⊂ [M, +∞) se e solo se (ψ|Aψ) ≥ M (ψ|ψ) 346 per ogni ψ ∈ D(A) per (a) in teorema 9.10. Conseguentemente l’enunciato (c) del teorema può essere equivalentemente scritto in termini di limiti inferiori di forme quadratiche. Teorema 9.12 (Kato-Relich). Siano T : D(T ) → H e V : D(V ) → H operatori densamente definiti sullo spazio di Hilbert H che verificano: (i) T è autoaggiunto, (ii) V è simmetrico, (iii) V è T -limitato con limite relativo a < 1. Sotto tali ipotesi vale quanto segue. (a) T + V è autoaggiunto su D(T ). (b) T + V è essenzialmente autoaggiunto su ogni core di T . (c) Se σ(T ) ⊂ [M, +∞) allora σ(T + V ) ⊂ [M 0 , +∞) con: ¨ « b 0 M = M − max , a|M | + b con a e b che soddisfano (9.108). (1 − a) Prova. Per provare (a) cerchiamo di applicare il teorema 5.2, mostrando che, scegliendo D(T ) come dominio per l’operatore simmentrico T +V , risulta Ran(T +V ±iI) = H. In realtà proveremo che esiste ν > 0 per cui Ran(T + V ± iνI) = H, che implica immediatamente l’affermazione precedente per linearità . Se ϕ ∈ D(T ), nelle nostre ipotesi di T autoaggiunto deve valere Ran(T + iµI) = H e anche: ||(T + iµI)ϕ||2 = ||T ϕ||2 + µ2 ||ϕ||2 . Ponendo ϕ = (T + iµI)−1 ψ, si conclude che: ||T (T + iµI)−1 || ≤ 1 e ||(T + iµI)−1 || ≤ µ−1 . Applicando (9.108) con ϕ = (T + iµI)−1 ψ concludiamo che: b ||ψ|| . ||V (T + iµI)−1 ψ|| ≤ a||T (T + iµI)−1 ψ|| + b||(T + iµI)−1 ψ|| ≤ a + µ Prendendo µ = ν abbastanza grande, l’operatore limitato definito su tutto H, U := V (T + iνI)−1 , deve soddisfare ||U || < 1, dato che a < 1. Questo risultato implica che −1 6∈ σ(U ) per la teoria del raggio spettrale. Tenendo conto di (a) teorema 8.1 (notando che U è chiuso essendo limitato) avremo di conseguenza che Ran(I + U ) = H. D’altra parte, dato che T è autoaggiunto, deve anche essere Ran(T + iνI) = H per il teorema 5.2. Conseguentemente, l’equazione: (I + U )(T + iνI)ϕ = (T + V + iνI)ϕ con ϕ ∈ D(T ) implica che, come volevamo, Ran(T + V + iνI) = H. La prova per Ran(T + V − iνI) = H si esegue del tutto similmente. La prova di (a) è conclusa. Passiamo a provare (b). Da (9.108) segue che, se D ⊂ D(T ) è un core per T , allora: D(T ) = D T D ⊂ D (T + V )D . 347 D’altra parte, per costruzione e tenendo conto che T +V è autoaggiunto su D(T ) per cui è chiuso: D (T + V )D ⊂ D (T + V ) = D (T + V ) = D(T ) . Mettendo insieme le catene di inclusioni, si conclude che deve essere: D (T + V )D = D (T + V ) e quindi (T + V )D = T + V dato che T + V è chiuso. (T + V )D è allora essenzialmente autoaggiunto per la proposizione 5.3. Per concludere, passiamo alla prova di (c). Per ipotesi, dal teorema spettrale σ(T ) ≥ M . Si scelga s > −M (con s ∈ R). Di conseguenza σ(T + sI) > 0 e quindi 0 6∈ σ(T + sI). Dato che T + sI è autoaggiunto è anche chiuso e allora, per (a) in teorema 8.1: Ran(T + sI) = H e le stesse stime usate precedentemente mostrano che ||V (T + sI)−1 || < 1 se ¨ « b 0 −s < M := M − max , a|M | + b . (1 − a) Di conseguenza, per tali valori di s, Ran(T +V +sI) = H e (T +V +sI)−1 = (T +sI)−1 (I +U )−1 che implica −s ∈ ρ(T + V ), e quindi −s 6∈ σ(T + V ). Dato che T + V è autoaggiunto ed ha quindi spettro reale, questo significa che σ(T + V ) ≥ M 0 . 2 9.6.2 Un esempio: l’operatore −∆ + V ed il teorema di Kato. La condizione (9.108) nasce naturalmente in certi contesti e risulta essere di grande utilità nelle applicazioni, in fisica, allo studio dell’equazione di Schrödinger in cui appare l’operatore di Laplace ∆ perturbato tramite un potenziale V . Per discutere tale esempio di applicazione del teorema di Kato-Relich, premettiamo la seguente proposizione ed un successivo lemma. Proposizione 9.9. Sia ∆ := n X ∂2 i=1 ∂x2i (9.110) l’operatore di Laplace su Rn pensato come operatore su L2 (Rn , dx), valgono i fatti seguenti. b : L2 (Rn , dx) → L2 (Rn , dk) indica l’operatore unitario di Fourier-Plancherel (vedi (a) Se F n )) ed ammette b sezione 3.6), ∆ è essenzialmente autoaggiunto su S(Rn ), su D(Rn ) e su F(D(R la stessa (unica) estensione autoaggiunta ∆. (b) Vale: b F b −1 f (k) := −k 2 f (k) , F∆ (9.111) dove k 2 = k12 + k22 + . . . + kn2 , sul dominio naturale dato da: Z § ª 4 2 b −1 ) = f ∈ L2 (Rn , dk) b F D(F∆ k |f (k)| dk < +∞ . Rn (c) Vale il limite dal basso per −∆ = −∆: σ(−∆) ⊂ [0, +∞) che equivale a (ψ|−∆ψ) ≥ (ψ|ψ) per ogni ψ ∈ D(−∆). 348 (9.112) Prova. (a) e (b) sono stati provati in (4) e (5) in esercizi 5.2, eccetto il fatto che ∆ sia essenzialn )) e determini la stessa estensione autoaggiunta ottenuta partenb mente autoaggiunto su F(D(R n )), D(Rn ) ⊂ S(Rn ) e quindi le b do da D(Rn ) e S(Rn ). A tal fine si noti prima di tutto che F(D(R tre estensioni autoaggiunte devono coincidere per l’unicità dell’estensione autoaggiunta di operan )), b tori essenzialmente autoaggiunti. Il fatto che che ∆ sia esenzialmente autoaggiunto su F(D(R b e la (9.111), è equivalente all’essenziale autoaggiunzione di dell’operatore vista l’unitarietà di F simmetrico moltiplicativo per −k 2 su D(Rn ). La validità di tale proprietà segue subito dall’osservazione che tutti gli elementi ϕ = ϕ(k) di D(Rn ) sono vettori analitici dell’operatore moltiplicativo per −k 2 come si verifica direttamente, valendo || − (k 2 )n ϕ|| ≤ ||ϕ||(supk∈suppϕ |k|2 )n , e quindi tenendo conto del teorema 5.8 di Nelson. (c) segue immediatamente da (b) e da (a) in teorema 9.10. 2 Passiamo al seguente fondamentale classico lemma. Lemma 9.2. Se n = 1, 2, 3 è fissato, si consideri f ∈ L2 (Rn , dx) ∩ D(∆). In tal caso f coincide, a meno di insiemi di misura nulla, con una funzione continua e limitata e, per ogni a > 0, esiste b > 0 indipendente da f tale che: ||f ||∞ ≤ a||∆f || + b||f || . (9.113) b . Da (a) in proposizione 3.12 e dal teorema di Plancherel (teorema Prova. Nel seguito fˆ := Ff 3.10), la tesi è provata se si riesce a dimostrare che fˆ ∈ L1 (R3 , dk) e che, per ogni fissato a > 0, esiste b ∈ R con: ||fˆ||1 ≤ a||k 2 fˆ||2 + b||fˆ||2 . (9.114) Eseguiamo la dimostrazione di (9.114) nel caso n = 3, gli altri due casi sono analoghi. Se f ∈ b F b −1 ) e quindi (1 + k 2 )fˆ ∈ L2 (R3 , dk). Dato D(∆) allora, in base alla proposizione 5.8, fˆ ∈ D(F∆ 2 che (k1 , k2 , k3 ) 7→ 1/(1 + k ) appartiene allo stesso spazio di Hilbert, segue che fˆ ∈ L1 (R3 , dk) per la disuguaglianza di Cauchy-Schwarz e ancora: ||fˆ||1 ≤ c||(1 + k 2 )fˆ||2 ≤ c(||k 2 fˆ||2 + ||fˆ||2 ) (9.115) dove: c := (1 + k 2 )−1 dk. Se r > 0, definiamo fˆr (k) := r3 fˆ(rk). Con tale definizione risulta: ||fˆr ||1 = ||fˆ||1 , ||fˆr ||2 = r3/2 ||fˆ||2 e ||k 2 fˆr ||2 = r−1/2 ||k 2 fˆ||2 . Usando (9.115) per fˆr e tenendo conto delle tre identità trovate, si ottiene: R ||fˆ||1 ≤ cr−1/2 ||k 2 fˆ||2 + cr3/2 ||fˆ||2 per ogni r > 0. Scegliendo r opportunamente si trova cr−1/2 = a e quindi (9.114) risulta essere verificata. 2 Osservazione. Il lemma precedente si può generalizzare (vedi il vol. II di [ReSi80]) con la seguente proposizione basata sulla disuguaglianza di Young. 349 Sia f ∈ L2 (Rn , dx) con f ∈ D(∆). Se n ≥ 4 e 2 ≤ q < 2n/(n − 4), allora f ∈ Lq (Rn , dk) e, per ogni a > 0, esiste b ∈ R indipendente da f (ma dipendente da q, n e a) tale che ||f ||q ≤ a||∆f || + b||f ||. Possiamo ora applicare il teorema di Kato-Rellich ad un caso particolare di grande interesse in Meccanica Quantistica, provando un primo teorema dovuto a Kato. Successivamente vedremo un teorema più generale, sempre dovuto a Kato, che include il seguente teorema come caso particolare. Teorema 9.13 (Essenziale autoaggiunzione di −∆ + V ). Sia n = 1, 2, 3 fissato. Si supponga che V = V2 + V∞ con V0 ∈ L2 (Rn , dx) e V∞ ∈ L∞ (Rn , dx) funzioni a valori reali. Vale quanto segue. (a) −∆ + V è essenzialmente autoaggiunto su D(Rn ) e su S(Rn ). (b) L’unica estensione autoaggiunta −∆ + V degli operatori considerati in (a) coincide con l’operatore (autoaggiunto) −∆ + V definito su D(∆). (c) σ(−∆ + V ) è limitato dal basso. Prova. Dato che V è reale, esso individua un operatore moltiplicativo autoaggiunto sul dominio D(V ) := {ϕ ∈ L2 (Rn , dx) | V ϕ ∈ L2 (Rn , dx)} . Per costruzione si ha anche, se ϕ ∈ D(Rn ) oppure ϕ ∈ S(Rn ): ||V ϕ||2 ≤ ||V2 ||2 ||ϕ||∞ + ||V∞ ||∞ ||ϕ||2 < +∞ (9.116) quindi D(Rn ) ⊂ S(Rn ) ⊂ D(V ). Ulterioremente, dato che S(Rn ) ⊂ D(∆) (per la proposizione 9.9), usando (9.113) in nel lemma 9.2 (essendo n ≤ 3), troviamo allora che, per ogni a > 0, esiste un corrispondente b > 0 tale che: ||V ϕ||2 ≤ a||V2 ||2 || − ∆ϕ||2 + (b + ||V∞ ||∞ )||ϕ||2 per ogni ϕ ∈ S(Rn ) . In altre parole, se a0 > 0, esiste un corrispondente b0 > 0 tale che: ||V ϕ||2 ≤ a0 || − ∆ϕ||2 + b0 ||ϕ||2 per ogni ϕ ∈ S(Rn ) (9.117) e quindi, in particolare, anche per ogni ϕ ∈ D(Rn ). Di conseguenza vale anche: ||V ϕ − V ϕ0 ||2 ≤ a0 ||(−∆ϕ) − (−∆ϕ0 )||2 + b0 ||ϕ − ϕ0 ||2 per ϕ e ϕ0 in S(Rn ). Usando il fatto che V è chiuso perchè autoaggiunto e che S(Rn ) è un core per l’operatore autoaggiunto (e quindi chiuso) −∆ (per la proposizione 9.9), la disuguaglianza appena scritta mostra che D(V ) ⊃ D(−∆). Usando ancora la chiusura degli operatori, si conclude infine che la (9.117) vale su tutto il dominio di −∆: ||V ϕ||2 ≤ a0 ||−∆ϕ||2 + b0 ||ϕ||2 350 per ogni ϕ ∈ D(−∆). Se scegliamo a0 < 1 abbiamo che tutte le ipotesi del teorema 9.12 di Kato-Rellich sono soddisfatte per T := −∆ con V come nelle ipotesi di questo teorema. La tesi segue immediatamente dalla tesi del teorema di Kato-Rellich usando anche il fatto che S(Rn ) e D(Rn ) sono core per −∆ per la proposizione 9.9. 2 Osservazione. Tenendo conto dell’osservazione precedente, il teorema si generalizza al casi n > 3, con un’analoga dimostrazione, modificando la richiesta su V in V = Vp + V∞ con Vp ∈ Lp (Rn , dx) e V∞ ∈ L∞ (Rn , dx) dove p > 2 se n = 4 e p = n/2 se n ≥ 5. Passiamo al classico Teorema di Kato. Nel seguito f ∈ Lp (Rn , dx)+Lq (Rn , dx) si deve intepretare nel senso che la funzione f è la somma di un elemento in Lp (Rn , dx) e un elemento in Lq (Rn , dx). Teorema 9.14 (Teorema di Kato). Sia n = 1, 2, 3 fissato. Si indichino con (y1 , . . . , yN ) gli elementi di RnN , dove yk ∈ Rn per ogni k = 1, . . . , N . Se ∆ denota il laplaciano (9.110) su RnN , si consideri l’operatore differenziale −∆+V , dove V è l’operatore moltiplicativo individuato dalla funzione: V (y1 , . . . , yN ) := N X Vk (yk ) + N X Vij (yi − yj ) . (9.118) i,j=1 i<j k=1 dove {Vk }k=1,...,N ⊂ L2 (Rn , dx) + L∞ (Rn , dx) , {Vij }i<j i,j=1,...,N ⊂ L2 (Rn , dx) + L∞ (Rn , dx) sono due classi di funzioni a valori reali. Vale quanto segue. (a) −∆ + V è essenzialmente autoaggiunto su D(RnN ) e su S(RnN ). (b) L’unica estensione autoaggiunta −∆ + V degli operatori considerati in (a) coincide con l’operatore (autoaggiunto) −∆ + V definito su D(−∆). (c) σ(−∆ + V ) è limitato dal basso. Prova. Eseguiamo la prova per n = 3, negli altri casi la dimostrazione è identica. Consideriamo il potenziale V12 (y1 −y2 ) e indichiamo con ∆1 il laplaciano corrispondente alle sole tre coordinate di y1 . Sia ϕ ∈ S(R3N ). Fissiamo y2 , . . . yN ∈ R3(N −1) e definiamo la funzione: R3 3 y1 7→ ϕ0 (y1 ) := ϕ(y1 , y2 , . . . , yN ). ϕ0 è in D(R3N ) oppure in S(R3N ) a seconda che, rispettivamente, ϕ ∈ D(R3N ) 0 (y ) := V (y − y ). Procedendo oppure ϕ ∈ S(R3N ). Definiamo analogamente: R3 3 y1 7→ V12 1 12 1 2 esattamente come nella prova del teorema precedente, decomponendo V12 = (V12 )2 + (V12 )∞ , si arriva a scrivere, per ogni scelta di a > 0, la stima valida per ogni y2 , . . . , yN : 0 0 ||V12 ϕ ||L2 (R3 ) ≤ a||(V12 )2 ||L2 (R3 ) || − ∆1 ϕ0 ||L2 (R3 ) + (b + ||(V12 )∞ ||L∞ (R3 ) )||ϕ0 ||2 dove b > 0 dipende da a, ma non dipende dai valori y2 , . . . yN ∈ R3(N −1) . Le norme sono riferite agli spazi sul primo fattore R3 di R3N ed è fondamentale notare che, a causa dell’invarianza per traslazioni di (y1 , y2 ) 7→ V12 (y1 − y2 ), le norme ||(V12 )k ||Lk (R3 ) non dipendono dalla variabile y2 . Per quanto osservato nelle osservazioni sotto la definizione 9.8, questa disuguaglianza equivale a 0 0 2 ||V12 ϕ ||L2 (R3 ) ≤ a0 || − ∆1 ϕ0 ||2L2 (R3 ) + b0 ||ϕ0 ||2L2 (R3 ) 351 per opportuni numeri, a0 , b0 > 0 con a0 che può essere reso arbitrarimente piccolo dato che ciò è possibile per a||V12 ||2 . Se integriamo la disuguaglianza trovata nelle variabili y2 , . . . yN ∈ R3(N −1) otteniamo che, per ogni a0 > 0 esiste un corrispondente b0 > 0 tale che: ||V12 ϕ||2L2 (R3N ) ≤ a0 || − ∆1 ϕ||2L2 (R3N ) + b0 ||ϕ||2L2 (R3N ) . (9.119) Si osservi ora che, passando in trasformata di Fourier-Plancherel su R3N || − ∆1 ϕ||2L2 (R3N ) = ≤ Z R3N Z R3N 2 X 3 2 2 b k r |(Fϕ)(k1 , . . . , k3N )| dk1 · · · dkL2 (R3 N ) r=1 2 X 3N 2 2 2 b k r |(Fϕ)(k1 , . . . , k3N )| dk1 · · · dk3N = || − ∆ϕ||L2 (R3N ) . r=1 Sostituendo in (9.119), concludiamo che, se ϕ ∈ D(R3N ) oppure S(R3N ), per ogni a > 0, esiste un corrispondente b12 > 0 tale che: ||V12 ϕ||2L2 (R3N ) ≤ a || − ∆ϕ||2L2 (R3N ) + b12 ||ϕ||2L2 (R3N ) . La stesso risultato si ottiene per gli altri termini Vij e per i potenziali Vk per i quali la dimostrazione si esegue nello stesso modo, ma risulta essere ancora più semplice. Se ϕ ∈ D(R3N ) oppure S(R3N ), per ogni scelta di a > 0, esiste un corrispondente scelta di numeri bi > 0, bij > 0 con i, j = 1, . . . , N , j > i tale che: ||Vi ϕ||2L2 (R3N ) ≤ a || − ∆ϕ||2L2 (R3N ) + bi ||ϕ||2L2 (R3N ) i = 1, . . . , N . ||Vij ϕ||2L2 (R3N ) ≤ a || − ∆ϕ||2L2 (R3N ) + bij ||ϕ||2L2 (R3N ) i, j = 1, . . . , N , j > i. (9.120) (9.121) In ogni spazio vettoriale con prodotto scalare hermitiano, la disuguaglianza di Cauchy-Schwartz implica: X 2 M ψr ≤ r=1 M X !2 ||ψr || . r=1 Tenendo conto che i potenziali Vk e Vij sono in tutto N + N (N − 1)/2 = N (N + 1)/2, la disuguaglianza menzionata e le (9.120)-(9.121) implicano che: 2 2 2 X N X N N (N + 1) N (N + 1) 2 a||−∆ϕ||L2 (R3N ) + b||ϕ||2L2 (R3N ) Vk + Vij ϕ ≤ 2 2 k=1 i,j=1 i<j L2 (R3N ) dove b è il massimo nell’insieme di tutti i bk e bij . Per quanto osservato nelle osservazioni sotto la definizione 9.8, il risultato trovato può essere equivalentemente enunciato come segue. Per ogni a0 > 0 esiste un b0 > 0 tale che: ||V ϕ|| ≤ a0 || − ∆ϕ|| + b0 ||ϕ|| per ogni ϕ ∈ S(R3N ). 352 Da questo punto in poi la dimostrazione procede esattamente come quella del teorema 9.13 a partire dall’equazione (9.117) rimpiazzando ovunque Rn con R3N . 2 Per concludere citiamo senza dimostrazione completa un ulteriore importante teorema dovuto a Kato che richiede ipotesi differenti (e più deboli nel caso n = 3 rispetto a quelle nel teorema 9.13) sulle funzioni V affinché −∆ + V risulti essere essenzialmente autoaggiunto su D(Rn ). Ricordiamo che f : Rn → C è detta essere localmente a quadrato integrabile se f · g è in L2 (Rn , dx) per ogni g ∈ D(Rn ). Teorema 9.15. L’operatore −∆ + V∆ + VC in L2 (Rn , dx) è essenzialmente autoaggiunto sul dominio D(Rn ) e la sua unica estensione autoaggiunta −∆ + V∆ + VC è limitata dal basso, se valgono le seguenti ipotesi. (i) V∆ : Rn → R è una funzione misurabile che individua un operatore moltiplicativo (−∆)limitato con limite relativo a < 1 (nel senso del definizione 9.8). (ii) VC : Rn → R è una funzione localmente a quadrato integrabile con VC ≥ C quasi ovunque per qualche C ∈ R. Le ipotesi (i) sulla funzione misurabile V∆ sono soddisfatte se V∆ ∈ Lp (Rn , dx) + L∞ (Rn , dx) con p = 2 se n ≤ 3, p > 2 se n = 4 e p = n/2 se n ≥ 5. Traccia di dimostrazione. L’ultima affermazione della tesi è dimostrata nella prova del teorema 9.13 nel caso n ≤ 3. La dimostrazione è analoga per n > 4 in virtù dell’osservazione sotto il lemma 9.2. Se vale (i), −∆ + V∆ è essenzialmente autoaggiunto su D(Rn ) e −∆ + V∆ è limitato dal basso per il teorema di Kato-Rellich. Se vale anche (ii), −∆+V∆ +(VC −C) è essenzialmente autoaggiunto su D(Rn ) per il teorema X.29 in vol.II di [ReSi80], essendo Vc − C ≥ 0. Conseguentemente anche −∆ + V∆ + VC = (−∆ + V∆ + (VC − C)) + CI è essenzialmente autoaggiunto su D(Rn ). Dato che −∆ + V∆ e VC sono entrambi limitati dal basso su tale dominio, lo è −∆ + V∆ + VC e lo è anche la sua unica estensione autoaggiunta −∆ + V∆ + VC . 2 Esempi 9.3. (1) Un caso fisicamente interessante su R3 è quello in cui la perturbazione è il potenziale coulombiano attrattivo: eQ V (x) = , |x| È dove e < 0 e Q > 0 sono costanti e e |x| := x21 + x22 + x23 . In questo caso le ipotesi del teorema 9.14 (o 9.13) di Kato sono verificate come si prova subito (m, ~ > 0 sono costanti che non creano alcun problema nell’applicare il teorema precedente, dato che si può moltiplicare l’operatore per 2m/~2 prima di applicare il teorema senza perdere generalità ). Dunque l’operatore H0 := − ~2 ∆ + V (x) 2m risulta essere essenzialmente autoaggiunto se, indifferentemente, è definito su D(R3 ) oppure S(R3 ). L’unica estensione autoaggiunta H0 , se Q = −e, corrisponde all’hamiltoniano di un 353 elettrone nel campo elettrico di un protone (trascurando gli effetti dovuti allo spin e considerando il protone come un oggetto classico). Abbiamo in questo modo la più semplice descrizione quantistica dell’operatore hamiltoniano dell’atomo di idrogeno. In questo caso −e è il valore assoluto comune della carica dell’elettrone e del protone. m è la massa dell’elettrone. Infine ~ > 0 è la costante di Planck divisa per 2π. Lo spettro dell’unica estensione autoaggiunta di tale operatore individua, dal punto di vista fisico, i valori dell’energia totale ammessi per tale sistema. Un risultato importante è che, malgrado V non sia limitato dal basso, lo spettro dell’operatore considerato lo è in ogni caso e, conseguentemente, lo sono i valori dell’energia fisicamente permessi. Nei capitoli 10, 11 e 12 eseminaremo meglio il significato fisico degli operatori qui rapidamente descritti. (2) Un secondo caso fisicamente interessante, sempre in R3 , è quello individuato dal potenziale di Yukawa: −e−µ|x| V (x) = , |x| 2 ~ dove µ > 0 è ancora una costante positiva. Anche in questo caso l’operatore H0 = − 2m ∆ + V (x) 3 risulta essere essenzialmente autoaggiunto se, indifferentemente, definito su D(R ) oppure S(R3 ), come segue dal teorema 9.14 (o 9.13) di Kato. Il potenziale di Yukawa descrive, in prima approssimazione, processi d’interazione tra un pione ed una sorgente di forza forte pensata, in questa approssimazione, come dovuta ad una sorgente macroscopica. (3) Il terzo caso fisicamente importante è dato dall’hamiltoniano di un sistema di N particelle di vettori posizione xi ∈ R3 , masse mi > 0 e cariche ei ∈ R \ {0} (i = 1, . . . , N ), che interagiscono con un potenziale coulombiano esterno e con potenziali coulombiani di coppia (non necessariamente attrattivi). In questo caso l’operatore completo è : H0 := N X i=1 − N N X ~2 ei ej Qi ei X + , ∆i + 2mi |xi | |xi − xj | i<j i=1 dove ∆i è l’operatore di Laplace riferito alle sole 3 coordinate di xi . Per applicare il teorema ~2 davanti agli operatori ∆i . Si ottiene questo di Kato è necessario eliminare tutti i fattori 2m i √ i risultato semplicemente cambiando coordinate ed usando le nuove coordinate yi := 2m ~ xi . In tal modo la prima delle tre somme di sopra produce il laplaciano su R3N riferito alle 3N componenti di tutti gli N vettori yi . Si vede facilmente che la perturbazione V (y1 , . . . , yN ) soddisfa le ipotesi del teorema 9.14 di Kato e quindi l’operatore H0 sopra definito è essenzialmente autoaggiunto su D(R3N ) e la sua unica estensione autoaggiunta è limitata dal basso. (4) Il teorema 9.15 permette di affermare che, aggiungendo una qualsiasi funzione V 0 reale localmente integrabile e limitata dal basso agli operatori hamiltoniani H0 visti negli esempi precedenti, si ottiene ancora un operatore essenzialmente autoaggiunto sul corrispondente D(Rn ). Un esempio importante è il potenziale armonico (generalmente non isotropo) V 0 (x) = kx21 + k2 x2 + k3 x23 con k1 , k2 , k3 ≥ 0. 354 Capitolo 10 La formulazione matematica della Meccanica Quantistica non relativistica. In questo capitolo daremo gli assiomi della Meccanica Quantistica per il sistema elementare costituito da un particella non relativistica senza spin e discuteremo alcuni importanti risultati connessi alle relazione di commutazione canonica. Dopo avere riassunto, qui di seguito, i primi 4 assiomi generali formulati nel capitolo 7, nella prima sezione aggiungeremo un assioma relativo alla formalizzazione della teoria quantistica della particella senza spin. In particolare introdurremo le relazioni di commutazione canonica (CCR) e proveremo che non sono implementabili per mezzo di operatori limitati. Mostreremo infine come il principio di Indeterminazione di Heisenberg risulti essere una teorema nella formulazione presentata. La sezione successiva è dedicata al celebre teorema di Stone-von Neumann, completato da Mackey, e relativo alla caratterizzazione delle rappresentazioni unitarie continue delle CCR. Per enunciare e provare il teorema introdurremo la nozione di ∗-algebra di Weyl, discutendone le più importanti proprietà . Riformuleremo infine i teoremi detti in termini di gruppo di Heisenberg. Nell’ultima sezione discuteremo, molto brevemente il principio di corrispondenza di Dirac. Nel capitolo 7 abbiamo dato gli assiomi generali della Meccanica Quantistica. Riepiloghiamo parte del contenuto di quel capitolo alla luce della teoria spettrale sviluppata successivamente. Le proposizioni valide su un sistema quantistico sono formalizzate tramite proiettori ortogonali su uno spazio di Hilbert. A1. Le proposizioni riguardanti un sistema quantistico S in corrispondenza biunivoca con (un sottoinsieme de) il reticolo (rispetto all’inclusione di sottospazi) P(HS ) dei proiettori ortogonali di uno spazio di Hilbert (complesso) e separabile HS , detto spazio di Hilbert associato ad S. Inoltre: 355 (1) La compatibilità tra proposizioni corrisponde alla commutativià dei rispettivamente associati proiettori ortogonali; (2) l’implicazione logica tra due proposizioni compatibili P ⇒ Q corrisponde alla relazione P ≤ Q per i proiettori associati; (3) I (operatore identità) e 0 (operatore nullo) corrispondono rispettivamente alla proposizione sempre vera ed a quella sempre falsa; (4) la negazione di una proposizione P , ¬P corrisponde al proiettore ortogonale ¬P = I − P ; (5) solo quando le proposizioni P e Q sono compatibili le proposizioni P O Q e P E Q hanno senso fisico e corrispondono rispettivamente ai proiettori ortogonali P ∨ Q e P ∧ Q; (6) se {Qn }n∈N è un insieme numerabile di proposizioni a due a due compatibili, hanno senso fisico le proposizioni corrispondenti a ∨n∈N Qn e ∧n∈N Qn . Gli stati su un sistema quantistico sono quindi rappresentati come operatori positivi di classe traccia con traccia unitaria. A2. Uno stato ρ al tempo t su un sistema quantistico S, con spazio di Hilbert associato HS , è un operatore positivo di classe traccia con traccia unitaria su HS . La probabilità che la proposizione P ∈ P(HS ) sia vera sullo stato ρ vale tr(ρP ). Abbiamo visto che gli stati ρ sono combinazioni lineari convesse anche infinite (in tal caso la convergenza è nella topologia operatoriale uniforme) di stati estremali dell’insieme convesso S(HS ) di tutti gli stati. Gli stati estremali sono stati denominati stati puri e sono tutti del tipo ρ = ψ(ψ|·) con ψ ∈ HS tale che ||ψ|| = 1. Lo spazio degli stati puri è in corrispondenza biunivoca con lo spazio dei raggi di HS , cioé l’insieme HS / ∼ da cui si elimina la classe [0], dove la relazione di equivalenza ∼ è definita da φ ∼ φ0 s.se φ = aφ0 per qualche a ∈ C \ {0}. Gli stati non puri sono anche chiamati stati misti o miscele e gli operatori di classe traccia ad essi associati sono spesso chiamati in letteratura operatori statistici o anche matrici densità. Il processo di cambiamento di stato è descritto con una opportuna procedura di proiezione. A3. Se il sistema quantistico S si trova nello stato ρ ∈ S(HS ) al tempo t e la proposizione P ∈ P(HS ) risulta essere verificata in seguito al processo di misura allo stesso tempo t, lo stato del sistema immediatamente dopo la misura è ρP := P ρP . tr(ρP ) In particolare se ρ è puro ed è individuato dal vettore ψ ∈ HS con ||ψ|| = 1, lo stato del sistema immediatamente dopo la misura è ancora puro ed è individuato dal vettore: ψP = Pψ . ||P ψ|| 356 Una nozione fisicamente importante anche dal punto di vista storico è quella di ampiezza di transizione o di probabilità dello stato puro individuato dal vettore unitario φ sullo stato puro individuato dal vettore unitario ψ: (ψ|φ). Il modulo quadrato di essa rappresenta la probabilità che, essendo il sistema nello stato φ, passi allo stato ψ in seguito a processo di misura. Si osservi che possiamo scambiare il ruolo dei due stati per le proprietà del prodotto scalare hermitiano. Successivamente abbiamo definito le osservabili come misure a valori di proiezione (dette anche misure spettrali) su R. A4. Ogni osservabile A sul sistema quantistico S è descritta da una misura a valori di proiezione su R, P (A) , nello spazio di Hilbert del sistema HS , in modo tale che, se E è un boreliano di R, il proiettore P (A) (E) corrisponde alla proposizione “l’esito della misura di A cade nel boreliano E”. Il teorema spettrale per operatori autoaggiunti generalmente non limitati, enunciato e provato nella versione più generale nel capitolo 9, consente associare univocamente ad ogni osservabile un operatore autoaggiunto definito sullo spazio di Hilbert del sistema fisico. In questo senso, se HS è lo spazio di Hilbert di un sistema fisico, lo spettro σ(A) ⊂ R di un’osservabile A, cioé un operatore autoaggiunto A : D(A) → HS , contiene tutti i valori possibili che si possono ottenere misurando l’osservabile A. Dal punto di vista matematico, σ(A) coincide con il supporto della misura a valori di proiezione P (A) associata all’osservabile. Una nozione fisicamente importante è quella di osservabili compatibili: Definizione 10.1. Sia S un sistema quantistico descritto sullo spazio di Hilbert HS . Due osservabili A e B per S si dicono compatibili se le misure spettrali P (A) e P (B) degli operatori autoaggiunti rispettivamente associati a A e B commutano, ossia P (A) (E)P (B) (E) = P (B) (E)P (A) (E) , per ogni boreliano E ⊂ R. Due osservabili non compatibili sono dette incompatibili. Si osservi che, dal punto di vista fisico, la compatibilità tra osservabili equivale al fatto che possono essere misurate contemporaneamente (in armonia con l’assioma A1 e con il significato delle misure spettrali associate ad osservabili). Osservazione. In taluni testi di fisica si trova scritto che due osservabili sono compatibili (nel senso scritto sopra) se gli operatori autoaggiunti associati commutano. Questo è erroneo, perché è facile trovare controesempi lavorando con operatori autoaggiunti non limitati, che sono i più frequenti in meccanica quantistica. Una condizione per controllare se due osservabili A e B sono compatibili è data dal teorema 9.6. Per la compatibilità è necessario e sufficiente che, per ogni t ∈ R valga l’identità: eitA eisB = eisB eitA . La proposizione 7.9 permette di associare ad ogni coppia osservabile - stato A, ρ una misura di (A) (E)) (che coincide con (ψ|P (A) (E)ψ) nel caso di stato puro probabilità su R, µA ρ : E 7→ tr(ρP 357 individuato dal vettore ψ ∈ H con norma unitaria) dove E ⊂ R è un boreliano arbitrario di R. Per costruzione il supporto di tale misura è incluso nello spettro di A. Dato che per definizione µA ρ (E) coincide con la probabilità che il valore della misura di A cada in E (cioé la probabilità che P (A) (E) sia una proposizione vera quando la valuto sullo stato ρ), ha quindi senso definire il valore medio e lo scarto quadratico medio dell’osservabile A nello stato ρ come segue. Definizione 10.2. Sia A un’osservabile per il sistema fisico S descritto nello spazio di Hilbert (A) HS , sia ρ ∈ S(HS ) uno stato del sistema S e sia µρ la misura di probabilità associata a ρ e A come precisato sopra. Il valore medio e lo scarto quadratico medio dell’osservabile A nello stato ρ sono definiti, rispettivamente da: hAiρ := ÊZ Z λ dµ(A) ρ (λ) , (A) λ2 dµρ (λ) − hAi2ρ , ∆Aρ := (10.1) R (10.2) R e tali definizioni hanno senso nei casi in cui, rispettivamente, la funzione R 3 λ 7→ λ e le fun(A) zioni R 3 λ 7→ λk con k = 1, 2 sono in L1 (R, µρ ). Si noti che ∆Aρ è reale (non negativa) in virtù della disuguaglianza di Cauchy-Schwartz. Se le richieste finali nella definizione 10.1 non sono soddisfatte, semplicemente, il valor medio di A e/o il suo scarto quadratico medio non sono definibili sullo stato ρ. Vale il seguente risultato di dimostrazione immediata da (v) di teorema 9.1, dalla (9.41), e tenendo conto del fatto che tr(ρP (A) (E)) = (ψ|P (A) (E)ψ) se ρ = ψ(ψ|·) con ||ψ|| = 1 e delle proprietà di linearità della traccia. Proposizione 10.1. Sia A è un’osservabile per il sistema fisico S descritto nello spazio di Hilbert HS . (a) Sia ψ ∈ HS normalizzato a 1 in modo da individuare uno stato puro che indichiamo ancora con ψ. Se ψ ∈ D(A) e, rispettivamente ψ ∈ D(A2 ), allora esistono hAiψ e ∆Aψ e vale rispettivamente: hAiψ = (ψ|Aψ) , ∆A2ψ (10.3) = (ψ|A ψ) − hAiψ = ψ (A − hAiψ I)2 ψ . 2 2 (10.4) (b) Sia ρ ∈ S(HS ) con rango di dimensione finita generato da vettori φi che soddisfano φi ∈ D(A) e, rispettivamente φi ∈ D(A2 ), allora valgono rispettivamente: hAiρ = tr(ρA) , ∆A2ρ 2 (10.5) 2 = tr(ρA ) − hAiρ . (10.6) (10.5) e (10.6) valgono entrambe anche se non si fanno ipotesi sul rango di ρ, ma l’osservabile A ha rango di dimensione finita. 358 Bisogna specificare che le ipotesi in (b) non sono le uniche nelle quali valgono (10.5) e (10.6). In ogni caso queste ultime non sono le definizioni di media e scarto quadratico medio, che invece sono date, in tutta generalità dalle (10.1) e (10.2), indipendentemente dalla proposizione 10.1. Per proseguire ulteriormente nella formulazione matematica della Meccanica Quantistica dobbiamo fornire ulteriori assiomi che riguardano sistemi elementari particolari. Tali sistemi corrispondono alle particelle della teoria non relativistica. In altre parole il gruppo di trasformazioni sotto il quale la teoria è invariante è il gruppo di Galilei e non quello di Poincaré. Torneremo più avanti su questo punto. Dal punto di vista fisico, questa descrizione è una descrizione adeguata fino a quando le velocità in gioco non sono dell’ordine della velocità della luce (circa 300.000 km/sec). È importante sottolineare che, comunque, alcune nozioni matematiche (algebra di Weyl) introdotte in questa descrizione non relativistica hanno validità molto più generale, anche in regime relativistico, nella formulazione della teoria quantistica dei campi della quale non ci occuperemo. Con i sistemi elementari si costituiscono quelli complessi tramite una composizione basata sulla nozione di prodotto tensoriale di spazi di Hilbert, come vedremo più avanti studiando i sistemi composti. 10.1 Sistemi elementari non relativistici: particella a spin 0. Il più semplice sistema elementare in Meccanica Quantistica non relativistica è una particella quantistica di massa m > 0 con spin 0. Per essa vale il seguente assioma. A5. Considerando un riferimento inerziale I relativo a coordinate cartesiane ortonormali x1 , x2 , x3 , lo spazio di Hilbert di una particella non relativistica con spin 0 e massa m > 0 è individuato da: (a) lo spazio di Hilbert del sistema H = L2 (R3 , dx) essendo R3 identificato con lo spazio di quiete di I con coordinate canoniche identificate con x1 , x2 , x3 e dx l’ordinaria misura di Lebesgue su R3 ; (b) le osservabili associate alle coordinate x1 , x2 , x3 della particella sono rispettivamente date dagli operatori autoaggiunti, detti operatori posizione, (Xi ψ)(x1 , x2 , x3 ) = xi ψ(x1 , x2 , x3 ) , (10.7) per i = 1, 2, 3 con domini § D(Xi ) := ψ ∈ L2 (R3 , d3 x) Z R3 |xi ψ(x1 , x2 , x3 )|2 dx < +∞ ª ; (c) le osservabili associate alle componenti dell’impulso della particella rispetto a I, p1 , p2 , p3 , sono rispettivamente date dagli operatori autoaggiunti detti operatori impulso, Pk = −i~ 359 ∂ , ∂xk (10.8) per k = 1, 2, 3, dove l’operatore a secondo membro è la chiusura dell’operatore differenziale essenzialmente autoaggiunto: −i~ ∂ : S(R3 ) → L2 (R3 , dx) ∂xi e S(R3 )spazio di Schwartz su Rn è lo spazio di Schwartz su R3 (cfr sezione 3.6). Ricordiamo che in letteratura fisica i vettori (normalizzati a 1) di L2 (R3 , dx) associato ad una particella sono detti funzioni d’onda della particella. Le funzioni d’onda determinano (non in modo biunivoco a causa dell’arbitrarietà nello scegliere un fattore numerico) gli stati puri della particella. Osservazioni. (1) La discussione fatta nella sezione 5.3 prova che si arriva alle stesse definizioni di sopra definendo gli operatori Xi sostituendo la condizione ψ ∈ L2 (R3 , dx) con ψ ∈ D(R3 ) (cfr sezione 3.6). Lo stesso risultato si ottiene con la condizione ψ ∈ S(R3 ) nella definizione del dominio di tali operatori. In entrambi i casi si deve prendere, alla fine, l’unica estensione autoaggiunta dell’operatore definito su D(R3 ) oppure S(R3 ). (2) La definizione di Pi può essere equivalentemente data come (vedi definizione 5.9, la proposizione 5.5 e la discussione successiva) (Pi f )(x) = −i~wcon dominio: n ∂ f (x) , ∂xi ∂ D(Pi ) := f ∈ L2 (R3 , dx) esiste w- ∂x f ∈ L2 (R3 , dx) i o . ∂ dove w- ∂x indica la derivata in senso debole. La discussione fatta nella sezione 5.3 prova anche i che la definizione di Pi (vedi proposizione 5.5) può essere data equivalentemente sostituendo lo spazio di Schwartz con D(R3 ) e prendendo l’unica estensione autoaggiunta dell’operatore cosı̀ definito che risulta ancora essere essenzialmente autoaggiunto. (3) Ricordiamo infine che, per la proposizione 5.6, se Ki denota l’operatore posizione rispetto alla coordinata i-esima nello spazio di arrivo della trasformata di Fourier-Plancherel (cfr sezione b : L2 (R3 , dx) → L2 (R3 , dk), vale: 3.6) F b −1 K F̂ . Pi = ~ F i Questa proprietà può essere usata come un’ulteriore definizione alternativa, ma equivalente, dell’operatore impulso. (4) Dalla discussione nella sezione 9.14, sappiamo che: σ(Xi ) = σc (Xi ) = R , σ(Pi ) = σc (Pi ) = R 360 per i = 1, 2, 3. (10.9) 10.1.1 le Relazioni di Commutazione Canonica (CCR) e non implementabilità con operatori limitati. La definizione degli operatori posizione ed impulso è tale che, malgrado i domini delle 6 osservabili siano differenti, esistono comunque sottospazi H0 ⊂ L2 (R3 , dx) invarianti per tutte queste osservabili, cioé Xi (H0 ) ⊂ H0 e Pi (H0 ) ⊂ H0 per ogni i = 1, 2, 3. Per esempio si può prendere lo spazio di Schwartz H0 = S(R3 ). La verifica di ciò è immediata dalla stessa definizione di spazio di Schwartz. Su S(R3 ), per computo diretto usando (10.7) e (10.8), si verifica subito che valgono le relazioni di commutazione di Heisenberg o CCR (canonical commutation relations): [Xi , Pj ] = i~δij I , dove δij = 0 se i 6= j mentre δij = 1 se i = j . Più precisamente abbiamo che vale il seguente lemma. Lemma 10.1. Gli operatori posizione ed impulso Xi e Pj con i, j = 1, 2, 3, definiti in A5, soddisfano le relazioni relazioni di commutazione di Heisenberg: [Xi , Pj ]ψ = i~δij ψ per ogni ψ ∈ D(Xi Pj ) ∩ D(Pj Xi ), i, j = 1, 2, 3 . (10.10) La (10.10) continua ad essere verificata quando si sostituiscono a primo membro Xi con Xi0 := Xi + ai I e Pj con Pj0 := Pj + bj I, dove ai , bj ∈ R sono costanti arbitrarie. Le relazioni (10.10) valgono in particolare se ψ appartiene al sottospazio invariante (per tutti gli operatori Xi e Pj ) S(R3 ). Prova. Lavoriamo con ai e bj costanti generiche, la tesi principale si ottiene nel caso ai = bj = 0. Si osservi prima di tutto che, come si verifica immediatamente: D(Xi0 Pj0 ) ∩ D(Pj0 Xi0 ) = D(Xi Pj )∩D(Pj Xi ). Sulle funzioni ϕ ∈ D(R3 ), per costruzione l’operatore Pj0 si riduce all’azione di −i~∂/∂xj + bj I e pertanto, tenendo conto che Xi0 coincide con la semplice moltiplicazione per la coordinata traslata xi + ai , abbiamo l’identità : Pj0 Xi0 ϕ = −i~ϕδij ϕ + Xi0 Pj0 ϕ. Da essa segue immediatamente che, per ogni fissato ψ ∈ L2 (R3 , dx): Pj0 Xi0 ϕ − Xi0 Pj0 ϕ + i~δij ϕ ψ = 0 , per ogni ϕ ∈ D(R3 ). A sua volta, se ψ ∈ D(Xi0 Pj0 ) ∩ D(Pj0 Xi0 ) = D(Xi Pj ) ∩ D(Pj Xi ) e tenendo conto del fatto che Pj e Xi sono autoaggiunti, l’identità trovata si riscrive: ϕ Xi0 Pj0 ψ − Pj0 Xi0 ψ − i~δij ψ = 0 . Dato che D(R3 ) è denso in L2 (R3 , dx), quanto appena ottenuto prova che, se ψ ∈ D(Xi Pj ) ∩ D(Pj Xi ): Xi0 Pj0 ψ − Pj0 Xi0 ψ − i~δij ψ = 0 . 361 Questa è la tesi che volevamo provare che, in particolare, vale per ψ ∈ S(R3 ) ⊂ D(Xi Pj ) ∩ D(Pj Xi ). 2 Osservazione. In (1) in esercizi 10.1 si mostra come sia possibile lasciare cadere l’ipotesi ψ ∈ D(Xi Pj ) ∩ D(Pj Xi ), sostituendola con la più debole ψ ∈ D(Xi ) ∩ D(Pj ) e dimostrando ancora valide le relazioni (10.10), interpretate in un senso più debole (nel senso delle forme quadratiche). Coppie di osservabili che soddisfano le relazioni di Heisenberg (10.10) su un qualche dominio invariante come S(R3 ) sono spesso dette in letteratura osservabili coniugate. Le relazioni di Heisenberg sono il caso elementare di più generali CCR valide anche in teoria dei campi quantistici, per campi bosonici con la definizione appropriata per gli operatori corrispondenti all’operatore posizione ed all’operatore impulso. Dal punto di vista fisico si è constatato più volte, nella storia della Meccanica Quantistica e sue evoluzioni, che queste relazioni sono più importanti delle definizioni di Xi e Pi stessi. Come è evidente dalle definizioni date, gli operatori posizione ed impulso non sono limitati e non sono definiti su tutto lo spazio di Hilbert. Questo fatto è piuttosto fastidioso dal punto di vista tecnico perché costringe ad usare la teoria spettrale per operatori non limitati che è più complessa di quella per operatori limitati. Ci si può chiedere se non sia possibile definire in modo alternativo Xi e Pi in modo tale che le relazioni di Heisenberg siano mantenute, ma tali operatori siano limitati. La risposta è negativa e questa situazione è nella natura delle cose dato che discende direttamente dalle relazioni di commutazione di Heisenberg. Vale infatti la seguente proposizione. Proposizione 10.2. Non esistono 6 operatori autoaggiunti Xi e Pj , con i, j = 1, 2, 3 che soddisfino [Xi , Pj ] = i~δij I su un sottospazio invariante e che siano limitati su tale sottospazio. Prova. Supponiamo che Xi e Pi soddisfino [Xi , Pj ] = i~δij I su un sottospazio invariante D e siano limitati su di esso. Restringiamoci allora a lavorare su tale spazio (o sulla chiusura di esso se non è chiuso, estendendo gli operatori in modo unico ad operatori autoaggiunti definiti su tale chiusura), considerandolo come tutto lo spazio di Hilbert. Le restrizioni di tali operatori saranno ancora operatori autoaggiunti oltre che limitati. Da [Xi , Pj ] = i~δij I si ricava subito che Pi (Xi )n − (Xi )n Pi = −in(Xi )n−1 , da cui, se n è dispari, usando ricorrentemente (a) di proposizione 3.6 (tenendo conto che (Xi )p = ((Xi )p )∗ per ogni intero positivo p) e le proprietà elementari della norma: n||Xi ||n−1 = n||(Xi )n−1 || ≤ 2||Pi ||||(Xi )n || ≤ 2||Pi ||||Xi ||||(Xi )n−1 || = 2||Pi ||||Xi ||||Xi ||n−1 . Dato che ||Xi || = 6 0 (altrimenti (10.10) sarebbe falsa), concludiamo che, per ogni n = 1, 3, 5, . . . n ≤ 2||Pi ||||Xi || < +∞ 362 che è impossibile. 2 10.1.2 Il Principio di Indeterminazione di Heisenberg come teorema. Una conseguenza positiva immediata delle relazioni di Heisenberg e di tutto il formalismo introdotto è che il Principio di Indeterminazione di Heisenberg per le variabili posizione ed impulso (cfr sezione 6.4) diventa un teorema. Teorema 10.1 (Principio di indeterminazione di Heisenberg). Per ogni stato puro di un particella classica con spin 0, descritto da un vettore ψ ∈ D(Xi Pi ) ∩ D(Pi Xi ) ∩ D(Xi2 ) ∩ D(Pi2 ) (in particolare ψ ∈ S(R3 )) con ||ψ|| = 1, valgono le relazioni (∆Xi )ψ (∆Pi )ψ ≥ ~ 2 i=1,2,3 . (10.11) Prova. Prima di tutto notiamo che, nelle ipotesi fatte si ha in particolare che ψ ∈ D(Xi2 )∩D(Pi2 ) per cui gli scarti quadratici hanno senso. Usando (10.4) si vede immediatamente che (∆Xi )ψ = (∆Xi0 )ψ e (∆Pi )ψ = (∆Pi0 )ψ se Xi0 := Xi + ai I e Pi0 := Pi + bi I dove ai , bi sono costanti in R, per cui la validità di (10.11) con Xi e Pi rimpiazzati con Xi0 e Pi0 rispettivamente è equivalente alla validità di (10.11). Scegliamo pertanto ai = −hXi iψ e bi = −hPi iψ e dimostriamo (10.11) per i nuovi operatori Xi0 e Pi0 . Dalla (10.4) risulta immediatamente che, con le scelte fatte, (∆Xi0 )ψ = ||Xi0 ψ|| e (∆Pi0 )ψ = ||Pi0 ψ||. Quindi dobbiamo provare che ||Xi0 ψ||||Pi0 ψ|| ≥ ~/2 . (10.12) Xi0 e Pi0 soddisfano ancora (10.10), per cui, dalla disuguaglianza di Schwarz ed usando il fatto che gli operatori sono autoaggiunti e le proprietà elementari del prodotto scalare, si ha: 1 (ψ, Xi0 Pi0 ψ) − (ψ, Xi0 Pi0 ψ) 2 1 ~ ~ ≥ (ψ, (Xi0 Pi0 − Pi0 Xi0 )ψ) = (ψ|ψ) = . 2 2 2 Nel penultimo passaggio abbiamo usato il lemma 10.1. Abbiamo quindi provato (10.12) che era quanto si doveva fare. 2 ||Xi0 ψ||||Pi0 ψ|| ≥ |(Xi0 ψ, Pi0 ψ)| ≥ |Im(Xi0 ψ, Pi0 ψ)| = Osservazioni. (1) La dimostrazione rimane invariata lavorando su Rn invece che su R3 con operatori definiti estendendo nel modo più ovvio la definizione di operatori posizione ed impulso. (2) In (2) in esercizi 10.1 si mostra come sia possibile lasciare cadere l’ipotesi ψ ∈ D(Xi Pj ) ∩ D(Pj Xi ), sostituendola con la più debole ψ ∈ D(Xi ) ∩ D(Pj ) e dimostrando ancora le relazioni (10.11), interpretando le varianze in un senso più debole (nel senso delle forme quadratiche)1 . 1 L’idea può essere usata anche nel caso della relazione di indeterminazione tempo-energia come discusso in: R. Brunetti, K. Fredenhagen, Remarks on time energy uncertainty relations, Rev. Math. Phys. 14, 897-906, 2002. 363 10.2 Le relazioni di Weyl, il teorema di Stone-von Neumann ed il teorema di Mackey. Von Neumann e Stone sono riusciti a provare un fatto piuttosto importante: non è necessario dare l’assioma A5 precisando il fatto che lo spazio di Hilbert sia un L2 (e nemmeno che sia separabile) e che gli operatori posizione ed impulso siano della forma data. In qualche modo queste informazioni sono tutte contenute nelle relazioni di commutazione di Heisenberg purché, detto un poco impropriamente, la rappresentazione degli operatori posizione ed impulso sia irriducibile. Questo è il contenuto essenziale del famoso teorema di Stone-von Neumann che dimostreremo in questa sezione. Se cade la condizione di irriducibilità, Mackey ha provato (come conseguenza di teoremi molto più generali legati alla teoria dell’imprimitività) che lo spazio di Hilbert è comunque una somma diretta ortogonale di rappresentazioni irriducibili (il numero di tali rappresentazioni è numerabile se lo spazio di Hilbert è separabile). Dimostreremo anche il teorema di Mackey. 10.2.1 Famiglie irriducibili di operatori e lemma di Schur. Prima di procedere sono necessarie alcune nozioni generali riguardanti il concetto di famiglia irriducibile di operatori. Strettamente legato a tale nozione è il cosiddetto Lemma di Schur, che ha grande utilità nella teoria generale delle rappresentazioni unitarie di gruppi, che avremo occasione di incontrare nel prossimo capitolo. Definizione 10.4. H è uno spazio di Hilbert e A := {Ai }i∈J è una famiglia di operatori Ai : H → H, diremo che H è irriducibile rispetto a A, ovvero equivalentemente che A è irriducibile rispetto a H, se non esiste alcun sottospazio chiuso di H, diverso da {0} e da H stesso, che sia invariante per tutti gli elementi di A contemporaneamente. In altre parole, non deve esistere alcun sottospazio chiuso H0 ⊂ H, diverso da {0} e da H stesso, per cui Ai (H0 ) ⊂ H0 per ogni i ∈ I. Proviamo ora un utile risultato generale sull’irriducibilità di classi di operatori, noto come Lemma di Schur. Proposizione 10.3 (Lemma di Schur). Sia A := {Ai }i∈J ⊂ B(H) una famiglia di operatori sullo spazio di Hilbert, chiusa rispetto alla coniugazione hermitiana (cioè A∗i ∈ A se Ai ∈ A). Valgono i seguenti fatti. (a) La famiglia A è irriducibile se e solo se ogni operatore V ∈ B(H) che soddisfa: V A i = Ai V per ogni i ∈ J, è della forma V = χI per qualche numero complesso χ ∈ C. (b) Sia A0 := {A0i }i∈J ⊂ B(H0 ) un’altra famiglia di operatori sullo spazio di Hilbert H0 , etichettata sullo stesso insieme di indici J, che sia chiusa rispetto alla coniugazione hermitiana. Si 364 supponga infine che: se A∗i = Aji allora A0 ∗i = A0ji per ogni i ∈ J ed un corrispondente ji ∈ J. (10.13) Se A e A0 sono irriducibili, allora ogni operatore lineare limitato S : H → H0 che verifica: SAi = A0i S per ogni i ∈ J, deve essere della forma S = rU dove U : H → H0 è una trasformazione unitaria e r ∈ R (in particolare S è l’operatore nullo quando r = 0). Prova. Partiamo dalla dimostrazione di (b) che é più complessa e che viene in parte utilizzata per provare (a). (b) Prendendo l’aggiunto di SAi = A0i S abbiamo A∗i S ∗ = S ∗ A0 ∗i per ogni i ∈ J. In altre parole Aji S ∗ = S ∗ A0ji per ogni i ∈ J. Si osservi che ji varia in tutto J quando i varia in J, essendo A∗ji ∈ A e (A∗ji )∗ = Aji , pertanto possiamo riscrivere l’identità trovata come Ai S ∗ = S ∗ A0i per ogni i ∈ J. Per confronto con SAi = A0i S, abbiamo che Ai S ∗ S = S ∗ SAi e A0i SS ∗ = SS ∗ A0i . Dalla prima identità trovata abbiamo che l’operatore autoaggiunto limitato V := S ∗ S commuta con ogni Ai e pertanto, per (c) del teorema 8.6, la misura spettrale P (V ) di V su R commuta con (V ) ogni Ai . Ma allora ogni sottospazio chiuso PE (H) è invariante per ogni Ai . Essendo la famiglia (V ) (V ) (V ) degli Ai irriducibile, questo significa che PE (H) = H, cioè PE = I, oppure PE (H) = {0}, (V ) cioè PE = 0, per ogni boreliano E ⊂ R. Supponiamo che lo spettro di V contenga almeno due punti r 6= r0 ed usiamo i risultati in (b) del teorema 9.2. Consideriamo due intervalli aperti (V ) (V ) di R, I 3 r e I 0 3 r0 con I ∩ I 0 = ∅ Deve essere PI 6= 0 e PI 0 6= 0 perché i due intervalli (V ) (V ) contengono punti dello spettro, e quindi deve valere il caso PI = PI 0 = I. D’altra parte si (V ) (V ) deve anche avere PI PI 0 = 0 perché I ∩ I 0 = ∅. Abbiamo raggiunto un assurdo e pertanto lo spettro di V (che non può mai essere vuoto) deve contiene un unico punto che, essendo isolato, è parte dello spettro puntuale. Concludiamo che S ∗ S = V = λI per qualche λ ∈ [0, +∞). Con la stessa procedura si trova che vale anche SS ∗ = λ0 I per qualche λ0 ∈ [0, +∞). Ma allora deve essere: λS ∗ = S ∗ SS ∗ = λ0 S ∗ . Ne consegue che λ = λ0 oppure S ∗ = 0 e quindi S = (S ∗ )∗ = 0. Nel secondo caso la dimostrazione è conclusa. Nel primo caso, definendo U := λ−1/2 S, si trova subito U U ∗ = I 0 e U ∗ U = I dove I e I 0 sono gli operatoti identità su H e H0 rispettivamente. Ne consegue (vedi definizione 3.9) che U è un operatore unitario. La tesi è provata con λ := r. (a) Supponiamo che A sia irriducibile. Se V Ai = Ai V , allora A∗i V ∗ = V ∗ A∗i che, nell’ipotesi di A chiuso rispetto alla coniugazione hermitiana, significa Ai V ∗ = V ∗ Ai per ogni i ∈ J. Allora 1 gli operatori limitati autoaggiunti V+ := 21 (V + V ∗ ) e V− := 2i (V − iV ∗ ) commutano con gli elementi di A e questo implica che le loro misure spettrali commutano con gli elementi di A. Ragionando come nella dimostrazione di (b), si conclude subito che V± = λ± I per qualche coppia di reali λ± . Di conseguenza V = V+ + iV− = (λ+ + iλ− )I = χI con χ ∈ C. Supponiamo, 365 viceversa che gli unici operatori che commutano con A siano del tipo χI. Se H0 è un sottospazio invariante per A e P è il proiettore ortogonale su H0 allora deve essere P Ai P = Ai P per ogni i ∈ J. Prendendo l’aggiunto si ha subito che: P A∗i P = P A∗i per ogni i ∈ J. Dato che la classe A è chiusa rispetto alla coniugazione hermitiana ed i ∈ J è generico, l’identità trovata si può riscrivere P Ai P = P Ai . Per confronto con l’identità iniziale, troviamo: P Ai = Ai P per ogni i ∈ J. Nelle ipotesi fatte, deve allora essere P = χI per qualche χ ∈ C. P ∗ = P implica che χ ∈ R, e P P = P implica che χ2 = χ. Ci sono pertanto solo due possibilità : P = 0 e quindi H0 = {0} oppure P = I e quindi H0 = H. Abbiamo verificato che A è irriducibile.2 Osservazione. Il lemma di Schur è particolarmente utile quando le due famiglie A e A0 sono rappresentazioni unitarie di uno stesso gruppo G. In tal caso, le ipotesi di chiusura rispetto alla coniugazione hermitiana e la (10.13) sono automaticamente soddisfatte usando G come insieme degli indici I. 10.2.2 Le relazioni di Weyl dalle CCR. Per illustrare il teorema di Stone-von Neumann procediamo a piccoli passi. Un punto tecnicamente rilevante è che le relazioni di commutazione di Heisenberg sono troppo difficili da usare rigorosamente perché coinvolgono sottigliezze sui domini. Per liberaci dei problemi di dominio possiamo passare dagli operatori Xi e Pi ai gruppi unitari ad un parametro da essi generati. Si P può fare di meglio e considerare gli operatori ni=1 tk Xk + uk Pk , con tk , uk ∈ R, che risultano essere essenzialmente autoaggiunti su S(R3 ) e considerare gli esponenziali delle loro uniche estenP sioni autoaggiunte ni=1 tk Xk + uk Pk . Un calcolo diretto e “brutale” basato sulle sole relazioni di Heisenberg (10.10) e sullo sviluppo formale dell’esponenziale con la sua formula di Taylor (tale sviluppo non è giustificato fino ad ora), produce la seguente relazione2 : ( n X exp i ( n X ) tk Xk + uk Pk exp i k=1 ( i~ = exp − 2 n X t0k Xk + u0k Pk k=1 !) tk u0k ) − t0k uk ( n X exp i k=1 ) (tk + t0k )Xk + (uk + u0k )Pk . k=1 Queste relazioni dette relazioni di Weyl, sono conseguenze formali dirette delle relazioni di commutazione di Heisenberg. Possiamo allora enunciare la proposizione annunciata, che dimostra tra le altre cose ed indipendentemente da quanto già fatto con altre tecniche, che gli operatori Xi e Pi sono essenzialmente autoaggiunti se ristretti a S(R3 ), anche lavorando in dimensione maggiore di 3. Nel seguito 2 Se gli operatori negli esponenti fossero matrici n × n di C il risultato seguirebbe immediatamente dalla famosa formula di Campbell-Hausdorff-Baker: eA eB = e[A,B]/2 eA+B , valida quando la matrice [A, B] commuta sia con la matrice a A che con la matrice B. 366 assumeremo, per comodità notazionale ~ = 1. Proposizione 10.4. Si consideri lo spazio L2 (Rn , dx) con n = 1, 2, · · · fissato e dx l’ordinaria misura di Lebesgue su Rn . Per k = 1, 2, · · · , n si definiscano gli operatori simmetrici: Xk : S(Rn ) → L2 (Rn , dx) e Pk : S(Rn ) → L2 (Rn , dx) come: (Xk ψ) (x) = xk ψ(x) , ∂ψ (Pk ψ) (x) = −i (x) . ∂xk (10.14) (10.15) Valgono i seguenti fatti. P (a) Gli operatori simmetrici definiti su S(Rn ), nk=1 tk Xk + uk Pk ammettono S(Rn ) come spazio invariante e sono essenzialmente autoaggiunti per ogni scelta di (t, u) ∈ R2n . (b) Lo spazio L2 (Rn , dx) è irriducibile rispetto all’insieme di tutti gli operatori limitati: ( n X W ((t, u)) := exp i ) tk Xk + uk Pi , con (t, u) ∈ R2n . (10.16) k=1 (c) Gli operatori suddetti soddisfano le relazioni, dette relazioni di Weyl: i 0 0 W ((t, u))W ((t0 , u0 )) = e− 2 (t·u −t ·u) W ((t + t0 , u + u0 )) , W ((t, u))∗ = W (−(t, u)) . (10.17) (d) Per (t, u) ∈ R2n fissato, ogni applicazione R 3 s 7→ W (s(t, u)) soddisfa: s- lim W (s(t, u)) = W (0) . s→0 (10.18) Prova. Lavoriamo per iniziare nel caso n = 1, la generalizzazione al caso n > 1 finito sarà ovvia. In questo caso abbiamo solo l’operatore X e l’operatore P. Entrambi gli operatori sono ben definiti quando ristretti allo spazio di Schwartz S(R) ed ammettono un’unica estensione autoaggiunta partendo da tale spazio come precedentemente discusso che coincide con X e P rispettivamente. Vogliamo costruire un sottospazio denso di vettori analitici per tutti gli operatori simmetrici aX + bP : S(R) → L2 (R, dx), per ogni scelta di a, b ∈ R. Definiamo sul dominio denso S(R) gli operatori detti, rispettivamente, operatore di distruzione, operatore di creazione e operatore numero di occupazione: 1 d 1 d A := √ X + , A? := √ X − , N := A? A . (10.19) dx dx 2 2 Per costruzione A∗ ⊃ A? , (A? )∗ ⊃ A e N è simmetrico. Si verifica per computo diretto che le CCR (ovvero la stessa definizione data sopra) implicano che valgano le relazioni di commutazione su S(R): [A, A? ] = I . (10.20) 367 È un fatto noto della teoria dei polinomi ortogonali che il sistema ortonormale completo su L2 (Rn , dx) delle funzioni di Hermite (cfr (4) in Esempi 3.2) {ψn }n=0,1,... ⊂ S(R) soddisfa ψ0 = 2 d π −1/4 e−x /2 e la relazione di ricorrenza ψn+1 = (2(n + 1))−1/2 (x − dx )ψn . Questo è equivalente a dire che, come si prova facilmente dalla definizione di A? , assegnato ψ0 le altre funzioni di Hermite si ottengono come: Ê 1 ? n ψn = (A ) ψ0 . (10.21) n! D’altra parte, per computo diretto si verifica immediatamente che: Aψ0 = 0 (10.22) Usando (10.21), (10.22) e (10.20) si ha facilmente per induzione la seconda delle due equazioni seguenti: √ √ (10.23) A? ψn = n + 1ψn+1 , Aψn = nψn−1 , Nψn = nψn , dove, nella seconda formula il secondo membro è assunto nullo per definizione se n = 0 e, come si riconosce facilmente, la prima identità non è altro che la relazione di ricorrenza ψn+1 = d (2(n + 1))−1/2 (x − dx )ψn precedentemente introdotta; la terza è invece immediata conseguenza delle due precedenti. Tenendo conto che gli ψn sono normalizzati a 1, le prime 2 in (10.23) producono la seguente stima: È √ √ √ ||A1 A2 · · · Ak ψn || ≤ n + 1 n + 2 · · · n + k ≤ (n + k)! . (10.24) dove gli operatori Ai sono indifferentemente ed indipendentemente A oppure A? . Consideriamo ora un operatore simmetrico su S(R) dato da una qualsiasi combinazione lineare reale T := aX + bP con a, b ∈ R. Si ha immediatamente da (10.19) che, se z := a + ib allora T = zA + zA? √ . 2 (10.25) Da questa identità e da (10.24) segue subito che, per ogni funzione di Hermite ψn : È È ||T k ψn || = 2−k/2 ||(zA + zA? )k ψn || ≤ 2−k/2 2k |z|k (n + k)! = |z|k 2k (n + k)! . Pertanto, se t ≥ 0: È È √ √ +∞ k (n + k)! X ( 2|z|t)k (n + k)n ( 2|z|t) √ < +∞ . ||T k ψn || ≤ ≤ k! k! k! k=0 k=0 k=0 +∞ X tk +∞ X Il fatto che l’ultima serie converga si ha calcolando direttamente il raggio di convergenza r con la formula Ê !1/k n ln(k+n) ln k! ln k! (n + k)n 1/r = lim = lim e 2k − 2k = lim e− 2k = 0 . k→+∞ k→+∞ k→+∞ k! 368 Concludiamo che combinazioni lineari finite delle funzioni di Hermite sono un insieme di vettori analitici (più precisamente vettori di A (T, +∞) con la notazione introdotta nel capitolo 9) per tutti gli operatori T := aX + bP definiti su S(R). Dato che tali operatori sono simmetrici, concludiamo che devono anche essere essenzialmente autoaggiunti su S(R) per il teorema di Nelson (teorema 5.8). Questo conclude la prova di (a) per n = 1, per n > 1 la dimostrazione è la stessa, con semplici riadattamenti, tenendo conto che i polinomi di Hermite generalizzati: ψm1 ,...,mn (x1 , . . . , xn ) := ψm1 (x1 ) · · · ψmn (xm ) definiscono un sistema ortonormale completo per L2 (Rn , dx) (vedi (1) in Esempi 9.1). Quanto appena visto prova evidentemente (a) ma anche (d) e la seconda identità in (c). Infatti, per costruzione: ( W (s(t, u)) = exp is n X ) tk Xk + uk Pk ( = exp is n X ) tk Xk + uk Pk , k=1 k=1 dove abbiamo usato il risultato di verifica immediata, applicando la definizione di chiusura di P un operatore chiudibile a, sA = sA per ogni s ∈ C. A questo punto, dato che ni=1 tk Xk + uk Pk è autoaggiunto, il punto (a) del teorema 9.6 (di Stone), prova la continuità nella topologia forte del gruppo ¦ P unitario ad un© parametro R 3 s 7→ W (s(t, u)), tenendo conto del fatto che W (0) = exp i0 ni=1 tk Xk + uk Pk = I. La seconda identità in (c) è ovvia dato che R 3 s 7→ W (s(t, u)) è un gruppo unitario ad un parametro come appena verificato. Per dimostrare (b) faremo uso del Lemma 10.2 enunciato e provato dopo questa dimostrazione, che si basa unicamente sulla dimostrazione del punto (a) appena data. Supponiamo che esista un sottospazio chiuso H0 ⊆ L2 (Rn ) invariante per la classe degli operatori W ((t, u)) e che sia non banale, cioé contenga almeno un vettore ψ 6= 0. Sia φ ∈ H⊥ 0 , mostreremo che deve 2 n necessariamente essere φ = 0 e pertanto H0 = L (R ). Per ipotesi deve essere, dato che sia H0 che il suo ortogonale sono invarianti sotto l’azione degli operatori suddetti: (φ|W ((t, 0)W ((0, u))ψ) = 0 , In altre parole: P P φ ei k tk Xk ei k uk Pk ψ = 0 , per ogni (t, u) ∈ R2n . per ogni (t, u) ∈ R2n . Il primo membro può essere calcolato esplicitamente usando (10.32) e (10.33) del Lemma 10.2 trovando: Z eit·x φ(x)ψ(x + u) dx = 0 , per ogni t, u ∈ Rn . Rn Dato che la funzione x 7→ hu (x) := φ(x)ψ(x + u) è in L1 (Rn , dx) essendo le due funzioni a prodotto in L2 (Rn , dx), e data l’arbitrarietà di t ∈ Rn , l’identità di sopra dice semplicemente che la trasformata di Fourier di hu ∈ L1 (Rn , dx) è nulla. In base a (f) in proposizione 3.12, la funzione hu deve essere nulla quasi ovunque. In altre parole: φ(x)ψ(x + u) = 0 quasi ovunque per ogni u ∈ Rn . 369 (10.26) Sia E ⊂ Rn l’insieme su cui ψ non si annulla e F l’insieme su cui non si annulla mai φ. (Notare che entrambi gli insiemi sono misurabili perché controimmagini dell’aperto C \ {0} secondo funzioni misurabili.) Indicando con m la misura di Lebesgue di Rn , vale m(E) > 0 per ipotesi. Affinché sia valida la richiesta (10.26) deve accadere che: m(F ∩ (E − u)) = 0 per ogni u ∈ Rn , Z cioé χF (x)χE (x + u)dx = 0 per ogni u ∈ Rn . R Integrando in u abbiamo che deve anche valere: Z Z dy R χF (x)χE (x + u)dx = 0 . R Dato che le funzioni integrande sono non negative e che l’integrale iterato è finito, possiamo usare il teorema di Fubini-Tonelli per scambiare le integrazioni, sfruttare ancora l’invarianza per traslazioni della misura di Lebesgue ottenendo: Z 0= Z χE (x+u)du = dxχF (x) R Z R Z Z dxχF (x) 1du = E−x R Z dxχF (x) R χE (u)dy = m(F )m(E). R Dato che m(E) > 0 deve essere m(F ) = 0. Dunque φ è nulla quasi ovunque: è il vettore nullo di L2 (Rn , dx). Quindi H0 = L2 (Rn , dx) e questo prova l’irriducibilità enunciata in (b). Non resta che dimostrare le identità : i 0 0 W ((t, u))W ((t0 , u0 )) = e− 2 (t·u −t ·u) W ((t + t0 , u + u0 )) . (10.27) Per provare tali identità suddette procediamo come segue in due passaggi, introducendo gli operatori: i U ((t, u)) := e− 2 (t·u) W ((t, 0))W ((0, u)) . Per prima cosa dimostreremo che tali operatori soddisfano le identità : i 0 0 U ((t, u))U ((t0 , u0 )) = e− 2 (t·u −t ·u) U ((t + t0 , u + u0 )) . (10.28) Come secondo punto dimostreremo che U ((t, u)) = W ((t, u)) , (10.29) e ciò concluderà la dimostrazione. Esattamente come nella dimostrazione di (b), usando il lemma 10.2 segue immediatamente che: i (U ((t, u))ψ) (x) = e 2 t·u eit·x ψ(x + u) . (10.30) Da questa identità reiterata segue, con qualche banale calcolo che, per ogni fissata ψ ∈ L2 (Rn , dx): i 0 0 U ((t, u))U ((t0 , u0 ))ψ = e− 2 (t·u −t ·u) U ((t + t0 , u + u0 ))ψ . 370 Per l’arbitrarietà di ψ questo è equivalente alla (10.28) che risulta in tal modo provata. Passiamo a dimostrare (10.29). Consideriamo, per t, u fissati, la classe di operatori unitari Us := U (s(t, u)) per s ∈ R. Direttamente da (10.30) si verifica per computo diretto che Us+s0 = Us Us0 e U0 = I. Dato che gli operatori sono tutti unitari abbiamo ottenuto che {Us }s∈R è un gruppo ad un parametro di operatori unitari. La nostra strategia sarà ora quella di dimostrare che tale gruppo è fortemente continuo, calcolarne il generatore e dimostrare che esso coincide con quello di {W (s(t, u))}s∈R ; provate queste cose il teorema di Stone (teorema 9.5) dimostra che i due gruppi ad un parametro devono coincidere provando in tal modo (10.29). Per quanto concerne la continuità in senso forte, si osservi che, per ogni fissata coppia ψ, φ ∈ L2 (R2 , dx): P P is2 t·u is k tk Xk is k uk Pk 2 (φ|Us ψ) = e e ψ φ e =e is2 t·u 2 P P is k tk Xk is k uk Pk φ e ψ → (φ|ψ) e per s → 0 , in virtù della continuità del prodotto scalare e della continuità in senso forte dei gruppi unitari P P ad un parametro generati dagli operatori autoaggiunti k uk Pk e k tk Xk . La proposizione 9.2 assicura allora che {Us }s∈R è fortemente continuo. Consideriamo ora ψ ∈ S(Rn ) e verifichiamo che: ! 2 X Us ψ − ψ lim −i tk Xk + uk Pk ψ = 0 . (10.31) s→0 s k Con qualche passaggio si trova esplicitamente ! 2 X Us ψ − ψ −i tk Xk + uk Pk ψ s k 2 2 eis t·u/2 eistx ψ(x + su) − ψ(x) − it · xψ(x) − u · ∇x ψ dx . = n s R Z Pertanto ! 2 2 Z X Us ψ − ψ 2 t·u/2 istx ψ(x + su) − ψ(x) is −i tk Xk + uk Pk ψ ≤ − u · ∇x ψ dx e e n s s R k 2 2 eis t·u/2 eistx − 1 is t·u/2 istx ψ(x + su) − ψ(x) +2 e − u · ∇x ψ − i |t · xψ(x)|dx e n s st · x R Z 2 2 eis t·u/2 eistx − 1 + − i |t · xψ(x)|2 dx . n st · x R Z Consideriamo i tre integrali a secondo membro. L’integrale intermedio, a causa della disuguaglianza di Schwartz, deve tende a zero quando tendono a zero i rimanenti due, dato che il suo 371 quadrato è maggiorato dal prodotto degli altri due integrali. Per il teorema della convergenza dominata, l’ultimo integrale tende a 0 per s → 0 dato che l’integrando tende puntualmente a 0 ed è uniformemente maggiorato dalla funzione L1 data da C|t · xψ(x)|2 per qualche costante C > 0. L’integrando del primo integrale tende anch’esso puntualmente a 0 quando s → 0. Per applicare il teorema di Lebesgue bisogna trovare una maggiorazione dell’integrando, uniforme in s in un intorno di 0, data da una funzione L1 (quindi indipendente da s). Si osservi che, spezzando l’integrale e ricordando che ψ ∈ S(Rn ), si vede subito che è sufficiente trovare una maggiorazione uniforme in s ∈ [−, ], da parte di funzioni L1 per: ψ(x + su) − ψ(x) s ψ(x + su) − ψ(x) 2 , s e per avere una maggiorazione di tutto l’integrando. Assumendo ψ reale (e ci si può sempre ricondurre a tale caso decomponendo ψ in parte reale ed immaginaria), possiamo stimare con il teorema di Lagrange: ψ(x + su) − ψ(x) = |u · ∇ψ|x+s0 u | , s dove s0 ∈ [−, ]. Dato che ψ ∈ S(Rn ), per ogni fissato p = 1, 2, . . . esiste Kp ≥ 0 con |u · ∇ψ|x | ≤ Kp . 1 + ||x||p È facile vedere che se > 0, u ∈ Rn e p = 2, 3, . . . sono fissati, esiste Cp, > 0 tale che Cp, 1 ≤ p 1 + ||x + s0 u|| 1 + ||x||p−1 per ogni x ∈ Rn e s0 ∈ [−, ]. In definitiva possiamo concludere che per qualche costante C ≥ 0 ψ(x + su) − ψ(x) C ≤ s 1 + ||x||n+1 per ogni x ∈ Rn e s ∈ [−, ]. La funzione a secondo membro ed il suo quadrato sono funzioni L1 (Rn , dx) e ciò è quanto volevamo per poter applicare il teorema di Lebesgue. La (10.31) risulta essere provata. Abbiamo ottenuto che il generatore autoaggiunto del gruppo unitario ad un parametro fortemente continuo {U (s(t, u))}s∈R coincide con quello dell’analogo gruppo {W (s(t, u))}s∈R sullo spazio S(Rn ). Dato che il secondo generatore è essenzialmente autoaggiunto su tale spazio, e quindi ammette un’unica estensione autoaggiunta, i due generatori devono coincidere ovunque. Come conseguenza abbiamo allora che i due gruppi devono coincidere dato che si possono entrambi scrivere esponenziando lo stesso generatore autoaggiunto. Questo conclude la dimostrazione. 2 Enunciamo e proviamo un Lemma usato nella precedente dimostrazione per provare (b) e (c) una volta provato (a). Enunciamo tale lemma separatamente in quanto è interessante come 372 risultato tecnico. Lemma 10.2. In riferimento alle ipotesi della proposizione 10.4, se ψ ∈ L2 (Rn , dx) e t, u ∈ Rn , valgono le seguenti identità : P i k tk Xk e ψ (x) = eit·x ψ(x) , (10.32) P i k uk Pk ψ (x) = ψ(x + u) . e e (10.33) Prova. Per computo diretto si ha che il gruppo unitario ad un parametro {Us }s∈R con: (Us ψ) (x) := eist·x ψ(x) , ∀ψ ∈ L2 (Rn , dx) è fortemente continuo e soddisfa su S(Rn ): 1 −i lim (Us ψ − ψ) = s→0 s Infatti: ! X tk Xk ψ . k ! 2 2 Z ist·x X 1 −1 e (Us ψ − ψ) − i t X − it · x ψ = |ψ(x)|2 dx k k s 3 s R k 2 eist·x − 1 = − i |t · x|2 |ψ(x)|2 dx → 0 3 st · x R Z per s → 0 , dove abbiamo usato il fatto che x 7→ |t · x|2 |ψ(x)|2 è L1 dato che ψ ∈ S(Rn ), che la funzione 2 eist·x − 1 R × R 3 (s, x) 7→ − i ≤ 2 st · x 3 e tende puntualmente in x a 0 per s → 0, ed abbiamo infine applicato il teorema della convergenza dominata di Lebesgue. Per il teorema di Stone, il generatore del gruppo degli Us è un’estensione autoaggiunta di P P k tk Xk . D’altra parte, dato che k tk Xk è essenzialmente autoaggiunto per (a) del teorema precedente, e pertanto non ammette altre estensioni autoaggiunte eccetto la sua chiusura, P concludiamo che {Us }s∈R è il gruppo ad un parametro generato da k tk Xk . In questo modo abbiamo provato la (10.32). Passiamo alla seconda identità . In virtù di (3.58)-(3.61), del fatto che la trasformata di FourierPlancherel F̂ si riduce a quella di Fourier F su S(Rn ) e che quest’ultimo è uno spazio invariante sotto F: X X uk Pk = F̂−1 uk Kk F̂ , k k 373 dove Kk è l’operatore Xk al quale abbiamo cambiato nome dato che la variabile della funzione trasformata secondo Fourier è k e non x. Dato che la trasformata di Fourier è un isomorfismo di spazi di Hilbert abbiamo anche che: X uk Pk = F̂−1 X k uk Kk F̂ . k Infine per il corollario 9.1 deve anche valere: ei P k uk Pk = F̂−1 ei P k uk Kk F̂ . (10.34) Riducendosi al caso di ψ ∈ S(Rn ), dove la trasformata di Fourier-Plancherel F̂ e la sua inversa si calcolano con l’integrale di Fourier e si riducono alla trasformata di Fourier F e alla corrispondente inversa (cfr definizione 3.14 in sezione 3.6), (10.34) implica che: P P (10.35) ei k uk Pk ψ (x) = F−1 ei k uk Kk ψ̂ (x) = ψ(x + u) , per ogni ψ ∈ S(Rn ). Tenendo conto che S(Rn ) è denso in L2 (Rn , dx), che se S(Rn ) 3 ψn → ψ nel senso di L2 allora vale anche ψn (· +u) → ψ(· +u) in L2 dato che la misura di Lebesgue è invariante per traslazione, P la continuità dell’operatore unitario ei k uk Pk implica (10.33) dalla (10.35). 2 Esercizi 10.1. (1) Si provi che se ψ, φ ∈ D(Xi ) ∩ D(Pj ) allora valgono le relazioni di commutazione canonica nel senso delle forme quadratiche: (Xi ψ|Pj ϕ) − (Pj ψ|Xi ϕ) = i~δij (ψ|ϕ) . Suggerimento. Si considerino le relazioni (10.17) ottenendo in particolare: (W ((−t, 0))ψ |W ((0, u))ϕ )−(W ((0, −u))ψ |W ((t, 0))ϕ ) = (1−e−i(t·u)/2 ) (W ((−t, 0))ψ |W ((0, u))ϕ ) . Usando il teorema di Stone si ottiene facilmente l’identità richiesta. (2) Si provi che se ψ ∈ D(Xi ) ∩ D(Pj ) e ||ψ|| = 1, allora vale il principio di Heisenberg nel senso delle forme quadratiche: (δXi )ψ (δPj )ψ ≥ ~/2 , È dove, per ogni operatore autoaggiunto A : D(A) → H abbiamo definito (δA)ψ := (Aψ|Aψ) − (ψ|Aψ)2 per ψ ∈ D(A). Suggerimento. Per prima cosa si provi che il risultato dell’esercizio precedente vale anche sostituendo gli operatori Xi e Pj con Xi + ai I e Pj + bj I con ai e bj numeri reali (a tal fine non si deve ripetere tutta la dimostrazione, ma è sufficiente lavorare nel risultato finale). A questo punto si può procedere analogamente a quanto fatto nella dimostrazione del teorema 10.1. 374 10.2.3 Il teorema di Stone-von Neumann ed il teorema di Mackey. Mostriamo ora come le relazioni di Weyl valide per operatori limitati W ((t, u)) con (t, u) ∈ R2n che formino un insieme irriducibile di operatori su uno spazio di Hilbert complesso H e tali che s 7→ W (s(t, u)) siano continui per s = 0 nella topologia operatoriale forte, implichino che H sia connesso a L2 (Rn , dx) tramite un isomorfismo di spazi di Hilbert che identifica ogni W ((t, u)) P con ei k tk Xk +uk Pk . Si osservi che, in particolare, lo spazio di Hilbert H risulta essere separabile. Enunceremo il teorema in forma leggermente più generale introducendo alcune nozioni di teoria degli spazi vettoriali simplettici. Ricordiamo alcune nozioni elementari di teoria degli spazi simplettici. che una coppia (X, σ) è detta spazio simplettico quando X è spazio vettoriale reale e σ : X × X → R, detta forma simplettica, è un’applicazione è bilineare, antisimmetrica e non degenere (cioè vale che σ(u, v) = 0 per ogni u ∈ X implica v = 0). Per un noto teorema di Darboux [FaMa94], se (X, σ) è uno spazio simplettico di dimensione finita 2n, allora esiste una base (in realtà un’infinità di esse), detta base canonica {e1 , · · · , en , f1 , · · · , fn } ⊂ X rispetto alla quale σ è scritta nella seguente forma detta forma canonica: 0 σ(z, z ) := n X ! ti u0i − t0i ui per ogni coppia z, z0 ∈ X , (10.36) i=1 dove z = ni=1 ti ei + ni=1 ui fi e z0 = ni=1 t0i ei + ni=1 u0i fi . Un isomorfismo tra spazi vettoriali reali dotati di forma simplettica è detto simplettoisomorfismo se preserva le forme simplettiche. Si prova facilmente che un isomorfismo da uno spazio simplettico nello stesso spazio è un simplettoisomorfismo se e solo se trasforma basi canoniche in basi canoniche. P P P P Possiamo ora enunciare il teorema di Stone-von Neumann che proveremo più avanti dopo avere introdotto la nozione di ∗-algebra di Weyl. Alcuni commenti, sia di carattere matematico che fisico, sul teorema di Stone-von Neumann sono riportati in una sezione dopo la dimostrazione del teorema. Teorema 10.2. (Teorema di Stone-von Neumann). Si consideri uno spazio di Hilbert complesso H e uno spazio vettoriale simplettico (X, σ) di dimensione finita 2n. Si supponga che H sia dotato di una classe di operatori {W (z)}z∈X ⊂ B(H) che goda delle seguenti proprietà . (a) H sia irriducibile rispetto all’insieme dei generatori W (z). (b) Valgano le relazioni di Weyl: i 0 W (z)W (z0 ) = e− 2 σ(z,z ) W ((z + z0 )) , W (z)∗ = W (−z) . (10.37) (c) Per z ∈ X fissato, ogni applicazione R 3 s 7→ W (sz) soddisfa: s- lim W (sz) = W (0) . s→0 375 (10.38) Scelta una qualunque base canonica di X sulla quale z ∈ X è individuato da (t(z) , u(z) ) ∈ Rn ×Rn , esiste un isomorfismo di spazi di Hilbert S : H → L2 (Rn , dx) tale che: S W (z) S −1 ( n X (z) ) tk Xk + := exp i (z) uk Pk per ogni z ∈ X. , (10.39) k=1 dove gli operatori simmetrici sono Xi e Pi definiti come in proposizione 10.4. A completamento del teorema di Stone-von Neumann enunciamo il teorema di Mackey. Teorema 10.3. (Teorema di Mackey). Nelle stesse ipotesi del teorema Teorema 10.2. (Teorema di Stone-von Neumann) si assuma che, a parità delle altre ipotesi, l’ipotesi (a) sia sostituita da una delle seguenti ipotesi equivalenti. (a1) Ogni generatore W (z) ha nucleo banale per z ∈ X. (a2) Ogni generatore W (z) è un operatore unitario per z ∈ X. (a3) W (0) è l’operatore identità su H. In tal caso lo spazio di Hilbert H si decompone in una somma diretta ortogonale (numerabile se H è separabile) di sottospazi chiusi invarianti ed irriducibili rispetto all’insieme dei generatori W (z). In ciascuno di tali spazi è quindi valido il teorema di Stone-von Neumann per la classe di operatori W (z) ristretti al sottospazio considerato. Osservazione importante. Tenendo conto del teorema di Darboux citato sopra, un modo alternativo di formulare il teorema Teorema di Stone-von Neumann, che si trova più spesso in letteratura, è il seguente. Vale un’analoga riformulazione del teorema di Mackey che il lettore può facilmente ricavare e che omettiamo. Teorema 10.2b. (Teorema di Stone-von Neumann in formulazione alternativa). Sia H spazio di Hilbert complesso e {U (t)}t∈Rn , {V (u)}u∈Rn ⊂ B(H) tali che valgano le seguenti proprietà . (a) H sia irriducibile rispetto a {U (t)}t∈Rn , {V (u)}u∈Rn . (b) Siano soddisfatte le relazioni (anch’esse dette di Weyl): U (t)V (u) = V (u)U (t)eit·u U (t)U (t0 ) = U (t + t0 ) per ogni t, u ∈ Rn , V (u)V (u) = V (u + u0 ) per ogni t, u, t0 u0 ∈ Rn . (c) Per ogni coppia t ∈ Rn e u ∈ Rn s- lim U (st) = U (0) e s→0 s- lim V (su) = V (0) . s→0 Allora esiste un isomorfismo di spazi di Hilbert S1 : H → L2 (Rn , dx) che soddisfa: S1 U (t) S1−1 ( n X := exp i ) tk Xk e k=1 S1 V (u) S1−1 ( n X := exp i k=1 376 ) uk Pk . dove gli operatori simmetrici sono Xi e Pi definiti come in proposizione 10.4. Mostriamo che le due formulazioni sono equivalenti. Assumiamo che gli spazi di Hilbert H dei due teoremi siano lo stesso spazio di Hilbert. Proviamo subito che il teorema 10.2 implica il teorema 10.2b. Partendo dalle ipotesi del Teorema 10.2b ed usando le relazioni di Weyl presentate in tale teorema, si verifica immediatamente che gli operatori W ((t, u)) := eit·u/2 U (t)V (u) soddisfano le ipotesi del teorema 10.2 sullo spazio simplettico (Rn × Rn , σc ), dove σc è la forma simplettica già espressa in forma canonica 0 0 σc ((t, u), (t , u )) = n X ! ti u0i − t0i ui i=1 sulla base naturale di Rn × Rn . Scegliendo la base canonica come quella naturale di Rn × Rn , la validità della tesi del teorema 10.2 implica la validità dalla tesi del teorema 10.2b con S1 = S. Proviamo ora che il teorema 10.2b implica il teorema 10.2. Scegliamo una base canonica in X e identifichiamo gli elementi di X con le coppie (t, u) di Rn × Rn . Partendo dalla classe di operatori W ((t, u)) soddisfacenti le ipotesi del teorema 10.2, si verifica subito che i nuovi operatori V (t) := W ((t, 0)) e U (u) := W ((0, u)) soddisfano le ipotesi del teorema 10.2b. Per verifica diretta si ha subito che la validità della tesi del teorema 10.2b implica la validità dalla tesi del teorema 10.2 con S = S1 . 10.2.4 La ∗-algebra di Weyl. L’enunciato del teorema di Stone von Neumann contiene una nozione molto importante, non solo per la dimostrazione del teorema stesso, ma anche per i successivi sviluppi della MQ verso la teoria quantistica dei campi. Si tratta della nozione di ∗-algebra di Weyl. Ricordiamo che (definizioni 2.4 e 3.7) che un isomorfismo di ∗-algebre α : A → B è un’applicazione lineare, biettiva, che conserva i prodotti e le involuzioni passando dalla ∗-algebra A alla ∗-algebra B. Se tali ∗-algebre ammettono unità è anche richiesto che, per definizione, l’isomorfismo α trasformi l’unità di A nell’unità di B (di conseguenza α trasforma l’inverso di un elemento nella prima algebra nell’inverso del corrispondente elemento nella seconda). Nel caso in cui B è una sotto ∗-algebra della C ∗ -algebra B(H) degli operatori limitati sullo spazio di Hilbert complesso H, α : A → B è detta rappresentazione di A su H. Definizione 10.5. (Algebra di Weyl). Sia X uno spazio vettoriale (non banale) di dimensione arbitraria (anche non finita) sul campo reale e σ : X × X → R una forma simplettica su X. Una ∗-algebra (definizione 3.8) W (X, σ) è detta Algebra di Weyl associata a (X, σ) se esiste in W (X, σ) una classe {W (u)}u∈X di elementi non nulli, detti generatori (di W (X, σ)), tale che: (i) valgano le relazioni (di commutazione) di Weyl: i W (u)W (v) = e− 2 σ(u,v) W (u + v) , W (u)∗ = W (−u) , 377 per ogni u, v ∈ V ; (10.40) (ii) W (X, σ) sia generata da {W (u)}u∈V , cioé W (X, σ) coincida con lo spazio lineare delle combinazioni lineari finite di prodotti finiti degli elementi in W (X, σ). Mostriamo ora, tra le altre cose, che uno spazio simplettico (X, σ) determina in modo univoco, cioé a meno di ∗-isomorfismi, una ∗-algebra di Weyl. Teorema 10.4. Sia X uno spazio vettoriale (non banale) di dimensione arbitraria (anche non finita) sul campo reale e σ : X × X → R una forma simplettica su X. (a) Esiste sempre una ∗-algebra di Weyl, W (X, σ), associata a (X, σ). (b) Ogni ∗-algebra di Weyl W (X, σ) ammette unità I e vale: W (0) = I , W (u)∗ = W (−u) = W (u)−1 , per ogni u ∈ X . (10.41) i generatori {W (u)}u∈X sono linearmente indipendenti, in particolare W (u) 6= W (v) se u 6= v. (c) Se W (X, σ), generata da {W (u)}u∈X , e W 0 (X, σ), generata da {W 0 (u)}u∈X , sono algebre di Weyl associate a (X, σ), esiste un unico di ∗-isomorfismo α : W (X, σ) → W 0 (X, σ) completamente determinato dalla richiesta α(W (u)) = W 0 (u) , per ogni u ∈ X. (d) Ogni rappresentazione di W (X, σ) su uno spazio di Hilbert H, π : W (X, σ) → B(H) è fedele (cioé iniettiva) oppure è la rappresentazione nulla. Prova. (a) Si consideri lo spazio di Hilbert complesso H := L2 (X, µ) dove µ è la misura che conta i punti dell’insieme X. Se u ∈ X, si consideri W (u) ∈ B(L2 (X, µ)) definito da (W (u)ψ)(v) := eiσ(u,v) ψ(u + v) per ogni ψ ∈ L2 (X, µ) e v ∈ X. Si verifica immediatamente che tali operatori sono non nulli e soddisfano le relazioni di commutazione di Weyl (10.41) usando come involuzione la coniugazione hermitiana. (b) Dalla prima equazione in (10.40) segue che W (u)W (0) = W (0) = W (0)W (u) e anche W (u)W (−u) = W (0) = W (−u)W (u), dato che i W (u) sono non nulli e generano tutta la ∗algebra, segue che deve essere W (0) = I e W (−u) = W (u)−1 . Quest’ultima, tenendo conto della seconda in (10.40), implica che W (u)∗ = W (u)−1 . Passiamo a provare che i generatori W (u) sono linearmente indipendenti. Supponiamo di avere un sottoinsieme di n generatori {W (uj )}j=1,...,n , con u1 , . . . , un tutti distinti, e dimostriamo che i generatori W (uj ) sono linearmente indipendenti. Dato che il sottoinsieme è arbitrario (e le combinazioni lineari da usare sono supposte P sempre finite) ciò prova la tesi. Consideriamo la combinazione lineare nulla nj=1 aj W (uj ) = 0 e dimostriamo, per induzione, che aj = 0 per j = 1, . . . , n. Per n = 1 la tesi è vera dato che per definizione ogni W (u) non è nullo. Assumiamo che la tesi sia vera per n − 1 generatori, non importa come scelti, e mostriamo che è vera anche per n generatori. Senza perdere generalità possiamo pensare, per assurdo, che an 6= 0, eventualmente rietichettando i generatori. Pn j=1 aj W (uj ) = 0 implica che: W (un ) = n−1 X j=1 −aj W (uj ) . an 378 Di conseguenza: ∗ I = W (un ) W (un ) = n−1 X j=1 n−1 n−1 X −aj X −aj ∗ −iσ(−un ,uj )/2 W (un ) W (uj ) = e W (uj −un ) = bj W (uj −un ), an an j=1 j=1 −a dove bj := anj e−iσ(−un ,uj )/2 . Per provare l’enunciato è evidentemente sufficiente dimostrare che ogni bj = 0 per j = 1, 2, . . . , n − 1. Andiamo a dimostrare questo fatto. Fissiamo u ∈ X arbitrariamente ed, usando l’identità trovata, abbiamo che: I = W (u)IW (−u) = n−1 X bj W (u)W (uj − un )W (−u) = j=1 n−1 X bj e−iσ(u,uj −un )/2 W (uj − un ) . j=1 Confrontando le due espressioni ottenute per I abbiamo che deve essere: n−1 X bj W (uj − un ) = j=1 n−1 X bj e−iσ(u,uj −un )/2 W (uj − un ) . j=1 Moltiplicando ambo membri per W (un ) ed eseguendo un’ovvia semplificazione, si trova alla fine: n−1 X j=1 bj W (uj ) = n−1 X bj e−iσ(u,uj −un )/2 W (uj ) . j=1 Dato che i generatori W (uj ) con j = 1, 2, . . . , n − 1 sono linearmente indipendenti, deve accadere che: bj (1 − e−iσ(u,uj −un )/2 ) = 0 . Se fosse bj 6= 0 per qualche j avremmo che 1 = e−iσ(u,uj −un )/2 e quindi: σ(u, uj − un ) = k(u) ∈ Z . 2π Dato però che il primo membro dell’identità scritta è lineare in u ∈ X, la funzione X 3 u 7→ k(u) deve essere lineare. Dovendo essa assumere solo valori in Z, deve essere la funzione nulla. Di conseguenza: σ(u, uj − un ) = 0 per ogni u ∈ X. La non degeneratezza di σ implica che uj − un = 0 che è impossibile per ipotesi. (c) Si consideri l’unica applicazione lineare α : W (X, σ) → W 0 (X, σ) individuata dalla richiesta α(W (u)) = W 0 (u) per ogni u ∈ X. Dato che {W (u)}u∈X e {W 0 (u)}u∈X sono basi delle relative ∗algebre, α è un isomorfismo di spazi vettoriali. Dato che i prodotti di elementi delle due ∗-algebre si scrivono come combinazioni lineari dei generatori a causa del primo set delle relazioni di Weyl, che sono le stesse per le due ∗-algebre, si verifica facilmente che α trasforma prodotti in prodotti. α(W (0)) = W 0 (0) implica che α trasformi l’elemento neutro moltiplicativo della prima algebra nell’elemento neutro moltiplicativo della seconda. Infine la richiesta α(W (−u)) = W 0 (−u) e il 379 secondo set delle relazioni di Weyl implicano che α trasformi l’involuzione nella prima algebra nell’involuzione nella seconda. La procedura seguita mostra anche che α è univocamente determinato dalla richiesta α(W (u)) = W 0 (u) per ogni u ∈ X. (d) Si consideri una rappresentazione π : W (X, σ) → B(H). Per costruzione gli operatori {π(W (u))}u∈X soddisfano le relazioni di Weyl. Se ognuno dei π(W (u)) è non nullo, essi definiscono una ∗-algebra di Weyl associata a (X, σ). In base a (c) la rappresentazione π, quando si restringe il codominio a π(W (X, σ)), è uno ∗-isomorfismo e quindi π è iniettiva. Se al contrario, per qualche u ∈ X vale π(W (u)) = 0 allora π è la rappresentazione nulla. Infatti, in base alle relazioi i ni di Weyl, se z ∈ X, posto z − u =: v si trova: W (z) = e 2 σ(u,v) W (u)W (v) = e 2 σ(u,v) 0W (v) = 0. Quindi π si riduce alla rappresentazione nulla dato che i W (v) sono una base per W (X, σ). 2 Osservazioni. (1) Nel senso precisato dal punti (a) e (c) del teorema di sopra, la coppia (X, σ) e le relazioni (10.40) determinano in modo universale (cioè a meno di isomorfismi) l’algebra di Weyl associata a (X, σ). Ogni concreta ∗-algebra di Weyl associata alla coppia (X, σ) è detta spesso realizzazione della ∗-algebra di Weyl associata alla coppia (X, σ). (2) Se W (X, σ) è una rappresentazione sullo spazio di Hilbert H dell’algebra di Weyl associata a (X, σ), è in generale falso che I = I, dove I : H → H è l’operatore identità. Infatti, supponiamo che W (X, σ) sia una rappresentazione sullo spazio di Hilbert (H, (·|·)) dell’algebra di Weyl associata a (X, σ) dove W (0) = I = I. Consideriamo lo spazio di Hilbert H0 := H ⊕ C con prodotto scalare h(ψ, z)|(ψ 0 , z 0 )i = (ψ|ψ 0 ) + zz. Una rappresentazione su H0 dell’algebra di Wayl associata a (X, σ) è immediatamente costruita come quella generata dagli operatori W (u)0 : (ψ, z) 7→ (W (u)ψ, 0), dove gli operatori W (u) generano l’algebra di Weyl su H. Nel caso in esame I = W (0)0 : (ψ, z) 7→ (ψ, 0) per cui W (0)0 non è l’operatore identità su H0 , ma solo il proiettore ortogonale su H. Tuttavia vi sono delle rappresentazioni dell’algebra di Weyl in spazi di Hilbert che risultano sempre essere tali che i generatori sono operatori unitari, siffatte rappresentazioni sono, per esempio, le cosiddette rappresentazioni GNS3 che sono fondamentali nella formulazione della teoria dei campi quantistici. Valgono inoltre le seguente proposizioni generali. (3) Se W (V, σ) è una rappresentazione sullo spazio di Hilbert H dell’algebra di Weyl associata a (V, σ) e l’insieme dei generatori {W (u)}u∈V è irriducibile rispetto ad H, allora I = I (e di conseguenza gli operatori W (u) sono tutti unitari). Per provare ciò è sufficiente provare che I = I nelle ipotesi fatte. Se non valesse I = I, l’operatore W (0) = I sarebbe un proiettore, diverso dall’operatore nullo e dall’operatore identità su H, che commuta con ogni operatore W (u) valendo W (u)W (0) = W (0) = W (0)W (u). Sarebbe allora immediato verificare che il sottospazio chiuso su cui proietta W (0) (che per ipotesi non coincide con {0} e nemmeno con H) è invariante sotto l’azione di ogni W (u) e quindi sotto l’azione di ogni elemento di W (V, σ), contraddicendo le ipotesi. 3 In tal caso l’unitarietà degli operatori W (u) segue dall’esistenza del vettore ciclico e da come si costruisce materialmente la rappresentazione. 380 (4) Se W (V, σ) è una rappresentazione sullo spazio di Hilbert H dell’algebra di Weyl associata a (V, σ), vale I = I (e di conseguenza gli operatori W (u) sono tutti unitari) se e solo se ciascuno dei generatori {W (u)}u∈V ha nucleo banale. La dimostrazione è immediata. Se ciascuno dei generatori W (u) ha nucleo non banale, il proiettore ortogonale W (0) = I ha nucleo non banale e quindi può solo essere il proiettore I. Se viceversa W (0) = I allora i W (u) sono unitari e quindi hanno tutti nucleo banale. 10.2.5 Dimostrazione dei teoremi di Stone-von Neumann e di Mackey. In questa sezione dimostriamo per primo il teorema di Stone von Neumann nella formulazione data nel teorema 10.2. Successivamente dimostreremo il teorema di Mackey 10.3. Infine faremo alcuni commenti sia di carattere matematico che fisico sull’importanza di tali risultati e sulla loro validità in ambito più generale. Dimostrazione del Teorema 10.2 di Stone von Neumann. Prima di tutto notiamo che ogni operatore W (z) ∈ B(H) deve essere non nullo: se fosse W (z0 ) = 0, avremmo che per ogni z ∈ X e posto z − z0 =: v: i i W (z) = e 2 σ(z0 ,v) W (z0 )W (v) = e 2 σ(z0 ,v) 0W (v) = 0 . In questo caso lo spazio H non potrebbe essere irriducibile per la classe di tutti operatori W (z) ∈ B(H). Concludiamo, applicando la definizione 10.5, che l’insieme dei W (z) ∈ B(H) è un sistema di generatori per una realizzazione della ∗-algebra di Weyl A associata allo spazio simplettico (X, σ). Tale realizzazione è data dalle combinazioni lineari finite dei prodotti finiti degli operatori W (z) ed è l’immagine di una rappresentazione fedele π : A → B(H) di A . Dopo avere scelto una base canonica in X, in modo tale da associare biettivamente ad ogni z ∈ X il n , consideriamo lo spazio di Hilbert L2 (Rn , dx). vettore delle sue componenti (t(z) , u(z) ) ∈ Rn ×R§ § ªª La classe di operatori non nulli (perché unitari) exp i (z) k=1 tk Xk Pn (z) + uk Pk , per la proz∈X posizione 10.4 definisce un’altra realizzazione della stessa ∗-algebra A ed una corrispondente rappresentazione fedele π1 : A → B(L2 (Rn , dx)). Indicheremo con az§∈ A i generatori di Aª, in modo tale che π(az ) = W (z) e contemporaneamente π1 (az ) = exp i (z) k=1 tk Xk Pn (z) + uk Pk per ogni z ∈ X. Supponiamo che esistano due vettori non nulli Φ0 ∈ H e Ψ0 ∈ L2 (Rn , dx) per cui D := π(A )Φ0 è un sottospazio denso in H, D1 := π1 (A )Ψ0 è denso in L2 (Rn , dx) e vale (Φ0 |π(a)Φ0 ) = (Ψ0 |π1 (a)Ψ0 ) , per ogni a ∈ A . (10.42) Mostriamo che c’è di conseguenza un’applicazione lineare Se : D → D1 definita completamente dalla richiesta: e Sπ(a)Φ (10.43) 0 = π1 (a)Ψ0 per ogni a ∈ A , che si estende per continuità ad un isomorfismo di spazi di Hilbert da H a L2 (Rn , dx) soddisfacendo (10.39) e quindi provando il teorema di Stone- von Neumann. Prima di tutto verifichiamo 381 che l’applicazione sia ben definita: supponiamo che π(a)Φ0 = π(b)Φ0 , perché l’applicazione in (10.43) sia ben definita deve accadere che π1 (a)Ψ0 = π1 (b)Ψ0 . Da π(a)Φ0 = π(b)Φ0 abbiamo che, per ogni c ∈ A : (π(c)Φ0 |π(a)Φ0 ) = (π(c)Φ0 |π(b)Φ0 ) Usando il fatto che π è una rappresentazione di ∗-algebre e pertanto: π(c∗ ) = π(c)∗ e π(f )π(d) = π(f d), questa identità equivale a: (Φ0 |π(c∗ a)Φ0 ) = (Φ0 |π(c∗ b)Φ0 ) e quindi, valendo (10.42): (Ψ0 |π1 (c∗ a)Ψ0 ) = (Ψ0 |π1 (c∗ b)Ψ0 ) . Procedendo in senso inverso troviamo infine che deve valere, per ogni c ∈ A : (π(c)Φ0 |π(a)Φ0 ) = (π(c)Φ0 |π(b)Φ0 ) . Dato che π(c)Φ0 spazia in tutto lo spazio denso D1 , concludiamo che deve essere, proprio come volevamo provare, π1 (a)Ψ0 = π1 (b)Ψ0 . Pertanto Se in (10.43) è ben definita. Si verifica immediatamente, usando il fatto che π e π1 sono rappresentazioni, che Se è lineare. Per costruzione Se preserva il prodotto scalare ed è quindi isometrica: ∗ ∗ e e Sπ(a)Φ 0 |Sπ(b)Φ0 = (π1 (a)Ψ0 |π1 (b)Ψ0 ) = (Ψ0 |π1 (a) π1 (b)Ψ0 ) = (Ψ0 |π1 (a )π1 (b)Ψ0 ) = (Ψ0 |π1 (a∗ b)Ψ0 ) = (Φ0 |π(a∗ b)Φ0 ) = (Φ0 |π(a∗ )π(b)Φ0 ) = (Φ0 |π(a)∗ π(b)Φ0 ) = (π(a)Φ0 |π(b)Φ0 ) . Possiamo allora estendere, unicamente, per continuità la trasformazione Se dal dominio denso D ad tutto lo spazio di Hilbert ottenendo un’applicazione lineare S : H → L2 (Rn , dx). L’estensione S sarà ancora un operatore isometrico per continuità del prodotto scalare. In modo analogo possiamo costruire sullo spazio denso D1 prima e poi su tutto lo spazio di Hilbert L2 (Rn , dx) una trasformazione lineare isometrica S 0 : L2 (Rn , dx) → H che si ottiene estendendo unicamente per continuità : Se0 π1 (a)Ψ0 = π(a)Φ0 per ogni a ∈ A , (10.44) Dato che sugli spazi densi D1 e D vale rispettivamente SeSe0 = ID1 e Se0 Se = ID , queste identità continueranno ad essere verificate per le estensioni continue sui domini estesi: SS 0 = IL2 (Rn ,dx) e SS 0 = IH . In definitiva S : H → L2 (Rn , dx) è un isomorfismo di spazi di Hilbert che soddisfa: Sπ(a)Φ0 = π1 (a)Ψ0 per ogni a ∈ A . (10.45) Invertendo questa identità troviamo, per b ∈ A : π(b)Φ0 = S −1 π1 (b)Ψ0 . Sostituendo questo risultato in (10.45), dopo avere rimpiazzato π(a) da π(ab) = π(a)π(b), si trova: Sπ(a)S −1 π1 (b)Ψ0 = π1 (a) π1 (b)Ψ0 . Dato che i vettori π1 (b)Ψ0 definiscono uno spazio denso in L2 (Rn , dx), abbiamo ottenuto: Sπ(a)S −1 = π1 (a) 382 per ogni a ∈ A . Scegliendo az ∈ A § che corrisponde ad un generico generatore, in modo tale che π(a) = W (z) e ª Pn (z) (z) quindi π1 (a) = exp i k=1 tk Xk + uk Pk , l’identità ottenuta si riduce alla (10.39). Per concludere la dimostrazione è ora sufficiente esibire i vettori Φ0 e Ψ0 che soddisfano (10.42) e che generino, sotto l’azione delle rispettive rappresentazioni, sottospazi densi. Se Φ0 è un qualsiasi vettore non nullo, il sottospazio chiuso π(A )Φ0 è invariante sotto l’azione di ogni π(a) e, in particolare, di ogni π(W (z)) per costruzione. Dato che H è irriducibile rispetto a tali operatori, deve accadere che D := π(A )Φ0 è un sottospazio denso in H. Con lo stesso ragionamento si ha che D1 := π1 (A )Ψ0 è denso in L2 (Rn , dx) per ogni vettore non nullo Ψ0 ∈ L2 (Rn , dx). Consideriamo, nello spazio L2 (Rn , dx) il vettore Ψ0 dato da, se ψ0 è la prima funzione di Hermite: Ψ0 (x1) = ψ0 (x1 ) · · · ψ(xn ) = π −n/4 e−|x| Il calcolo diretto basato sul lemma 10.1 fornisce: ( n ) Ψ0 exp i e quindi X tk Xk + uk Pk Ψ0 = π −n/2 eit·x e−|x+u| . 2 /2 dx = e−|t| 2 /4−|u|2 /4 Rn k=1 ( n ) X Ψ0 exp i tk Xk + uk Pk Ψ0 k=1 Z 2 /2 = e−(|t| 2 +|u|2 )/4 , per ogni (t, u) ∈ Rn × Rn . (10.46) Se riusciamo a determinare un vettore Φ0 ∈ H che soddisfi: (Φ0 |W (z) Φ0 ) = e−(|t (z) |2 +|u(z) |2 )/4 , per ogni z ∈ X, (10.47) allora l’identità (10.42) risulta essere soddisfatta per linearità , tenendo conto che ogni elemento π1 (a) è una combinazione lineare di elementi π1 (az ) ed il corrispondente π(a) è una combinazione lineare (con gli stessi coefficienti) di elementi π(az ). L’esistenza di Φ0 è garantita dalla seguente proposizione. Proposizione 10.5. Nelle ipotesi del teorema 10.2, se è stata scelta una base canonica in X, in modo tale da associare biettivamente ad ogni z ∈ X il vettore delle sue componenti (t(z) , u(z) ) ∈ Rn × Rn , esiste Φ0 ∈ H che soddisfa la (10.47). Prova. Per prima cosa osserviamo che gli operatori W (z) sono unitari con W (0) = I in conseguenza dell’osservazione (3) dopo il teorema 10.4 e tenuto conto del fatto che H è irriducibile rispetto alla classe degli operatori W (z). Nel seguito W ((t(z) , u(z) )) := W (z). Mostriamo ora che le funzioni a valori operatoriali unitari Rn 3 t 7→ W ((t, 0)) e Rn 3 u 7→ W ((0, t)) sono continue nella topologia operatoriale forte (si osservi che l’ipotesi di regolarità s-lims→0 W (sz) = W (0) = I è più debole della forte continuità in z = 0, dato che il limite potrebbe non essere uniforme nelle varie direzioni verso l’origine). Dimostriamo ciò per 383 Rn 3 t 7→ W ((t, 0)) essendo identica la dimostrazione per l’altra funzione. Le relazioni di Weyl implicano che valga la regola di additività : W ((t, 0))W ((t0 , 0)) = W ((t + t0 , 0)). In conseguenza di ciò la continuità in senso forte in t = 0 implica quella in qualsiasi altro punto e ci riduciamo pertanto a provare la continuità in senso forte in z = 0. In base alla stessa regola di additività , se e1 , . . . , en indica la parte di base canonica su cui si decompongono P i vettori come t = nk=1 tk ek , possiamo scrivere: W ((t, 0)) = W ((t1 e1 , 0)) · · · W ((tn en , 0)). Ognuna delle funzioni R 3 tk 7→ W ((tk ek , 0)) è fortemente continua a causa dell’ipotesi di regolarità s-lims→0 W (sz) = W (0) = I nel teorema 10.2. Sia ora ψ ∈ H, mostriamo che ||W ((t, 0))ψ − ψ|| → 0 se t → 0 . Vale infatti: Y n ||W ((t, 0))ψ − ψ|| = W ((tk ek , 0))ψ − ψ k=1 Y n−1 n−1 n−2 Y Y n Y ≤ W ((tk ek , 0))ψ − W ((tk ek , 0))ψ + W ((tk ek , 0))ψ − W ((tk ek , 0))ψ + · · · k=1 k=1 k=1 k=1 + ||W ((t1 e1 , 0))ψ − ψ|| = ||W ((tn en , 0))ψ − ψ|| + ||W ((tn−1 en−1 , 0))ψ − ψ|| + · · · + ||W ((t1 e1 , 0))ψ − ψ|| , dove nell’ultimo passaggio abbiamo tenuto conto del fatto che gli operatori W ((tk ek , 0)) sono unitari e pertanto conservano la norma e quindi, per esempio: Y n−1 n−1 Y n Y W ((tk ek , 0))ψ − W ((tk ek , 0))ψ = W ((tk ek , 0)) (W ((tn en , 0))ψ − ψ) k=1 k=1 k=1 = ||W ((tn en , 0))ψ − ψ|| . La disuguaglianza: ||W ((t, 0))ψ − ψ|| ≤ n X ||W ((tk ek , 0))ψ − ψ|| k=1 e la continuità per tk → 0 delle funzioni W ((tk ek , 0))ψ implicano che valga W ((t, 0))ψ → ψ per t → 0 lavorando con intorni di z = 0 costruiti come prodotti di intervalli lungo gli assi cartesiani. In virtù di quanto appena provato, per ogni scelta di vettori φ1 , φ2 , la funzione X 3 z 7→ (φ1 |W (z) φ2 ) = W ((t(z) , 0))∗ φ1 W ((0, u(z) )) φ2 è continua. Di conseguenza è ben definito l’integrale (la misura dz è la misura di Lebesgue su Rn × Rn rispetto alle coordinate (t(z) , u(z) )): I(φ1 , φ2 ) = (2π)−n Z e−|z| R2n 384 2 /4 (φ1 |W (z) φ2 ) dz . Dato che (φ1 , φ2 ) 7→ I(φ1 , φ2 ) è lineare a destra ed antilineare a sinistra e vale la stima |I(φ1 , φ2 )| ≤ ||φ1 || ||φ2 ||, il teorema di Riesz implica facilmente che esiste un unico operatore P ∈ B(H) che soddisfa ||P || ≤ 1 e (φ1 |P φ2 ) = I(φ1 , φ2 ) per ogni φ1 , φ2 ∈ H. Abbiamo l’ulteriore risultato che P ∗ = P che segue dall’identità : ∗ −n (φ1 |P φ2 ) = (φ2 |P φ1 ) = (2π) Z e−|z| 2 /4 R2n (φ2 |W (z) φ1 ) dz , tenendo conto del fatto che la misura dz ed il fattore exp −|z2 /4| sono invarianti per riflessione z → −z e che vale: (φ2 |W (z) φ1 ) = (W (z)φ1 | φ2 ) = (φ1 | W (z)∗ φ2 ) = (φ1 | W (−z)φ2 ) . L’operatore P non può essere nullo: se fosse P = 0 avremmo: 0 = φ1 |W (z0 )P W (z0 )φ2 = (2π)−n Z e−|z| 2 /4 R2n φ1 W (z0 )W (z)W (z0 ) φ2 dz e cioé , usando le relazioni di Weyl: 0 = (2π)−n Z e−|z| 2 /4 eit (z0 ) ·t(z) −iu(z0 ) ·u(z) R2n (φ1 |W (z) φ2 ) dz 2 Questo equivale a dire che la trasformata di Fourier della funzione L1 z 7→ e−|z| /4 (φ1 |W (z) φ2 ) è nulla e quindi, per (f) di proposizione 3.12: z 7→ (φ1 |W (z) φ2 ) = 0 quasi ovunque. Dato che la funzione è continua questo significa che essa è nulla ovunque e quindi W (z) = 0, ma questo è impossibile come detto precedentemente. Mostriamo infine che vale l’ulteriore identità : P W (z)P = e−|z| 2 /4 P. (10.48) Sappiamo che: (φ1 |P W (z)P φ2 ) = (W (−z)P φ1 |P φ2 ) = (2π) = (2π)−n Z dz 0 e−z 02 /4 R2n −n Z dz 0 e−z Rn 0 02 /4 φ1 |P W (z)W (z0 )φ2 e−iσ(z,z )/2 φ1 |P W (z + z0 )φ2 . Ripetendo la procedura con il prodotto scalare rimasto abbiamo alla fine che: (φ1 |P W (z)P φ2 ) = 1 (2π)2n Z Z dz 0 dz 00 e−(z 02 +z002 )/4 0 e−iσ(z,z )/2 e−iσ(z 00 ,z+z0 )/2 φ1 |W (z + z0 + z00 )φ2 . (10.49) L’ordine d’integrazione può essere scambiato per il teorema di Fubini-Tonelli dato che, nelle variabili della misura prodotto, l’integrando converge assolutamente ed esponenzialmente a zero all’infinito, a causa delle funzioni esponenziali e della stima | (φ1 |W (z + z0 + z00 )φ2 ) | ≤ ||φ1 || ||φ2 ||. 385 Cambiando variabili e passando alle nuove variabili d’integrazione ζ := z0 + z00 + z e Z := z0 − z00 , con qualche passaggio, in particolare integrando in dZ, l’identità (10.49) si trasforma in: (φ1 |P W (z)P φ2 ) = e−|z| 2 /4 (2π)−n Z e−|ζ| R2n 2 /4 (φ1 |W (ζ) φ2 ) dζ che equivale alla (10.48). Dalla (10.48), scegliendo z = 0 si ricava: P P = P e quindi si conclude che P è un proiettore ortogonale non nullo. Se Φ0 ∈ P (H) \ {0} con ||Φ0 || = 1, dovendo essere P Φ0 = Φ0 , la stessa (10.48) implica che, per ogni z ∈ X: (Φ0 |W (z)Φ0 ) = e−|z| 2 /4 = e−(|t (z) |2 +|u(z) |2 )/4 . Abbiamo pertanto trovato un vettore che soddisfa l’identità (10.47) e la dimostrazione della proposizione è conclusa. 2 La prova della precedente proposizione conclude la dimostrazione del teorema di 10.2 (di Stonevon Neumann). 2 Dimostrazione del Teorema 10.3 di Mackey. Il fatto che le ipotesi (a1), (a2) e (a3) siano equivalenti è conseguenza immediata del commento (4) dopo il Teorema 10.4. Notiamo che in virtù di tali ipotesi gli operatori W (z) sono tutti unitari con W (0) = I. Usando tale fatto possiamo seguire nuovamente la dimostrazione del teorema 10.4, che usava solo il fatto che gli operatori W (z) sono tutti unitari con W (0) = I, ma non direttamente l’irriducibilità della rappresentazione, e costruire il proiettore ortogonale P , individuato completamente dalla richiesta che (φ1 |P φ2 ) = (2π)−n Z e−|z| 2 /4 R2n (φ1 |W (z) φ2 ) dz , per ogni z ∈ R2n e φ1 , φ2 ∈ H . in modo tale che ogni vettore Φ0 ∈ P (H) verifichi. (Φ0 |W (z)Φ0 ) = e−|z| 2 /4 = e−(|t (z) |2 +|u(z) |2 )/4 . Mostriamo ora che lo spazio H0 dato dalla chiusura dello spazio generato da tutti gli W (z)P (H), coincide con H stesso. Sia H1 l’ortogonale di tale spazio. Per costruzione H1 è invariante sotto l’azione di tutti gli operatori W (z) come è facile provare. Possiamo allora lavorare nello spazio di Hilbert H1 e, se H1 6= {0}, costruire l’unico proiettore ortogonale P1 tale che (φ01 |P1 φ02 ) = (2π)−n Z R2n e−|z| 2 /4 φ01 |W (z) φ02 dz , per ogni z ∈ R2n e φ1 , φ2 ∈ H1 . Ma il secondo membro vale (φ01 |P φ02 ), che a sua volta vale zero, visto che φ02 ∈ H1 ⊥ P (H). In definitiva P1 = 0. Questo è impossibile H1 6= {0} dato che deve anche valere, se Φ1 ∈ P1 (H), (Φ1 |W (z)Φ1 ) = e−|z| 2 /4 = e−(|t 386 (z) |2 +|u(z) |2 )/4 6= 0 . Concludiamo che H1 = {0} e quindi H0 = H. Sia {Φk }k∈I una base hilbertiana di P (H) e siano Hk i sottospazi chiusi ottenuti prendendo, rispettivamente per ogni fissato k ∈ I, la chiusura dello spazio generato da tutti i vettori W (z)Φk quando z ∈ R2n . Dato che vale la (10.48), se i 6= k 2 (Φj |W (z)Φk ) = (Φj |P W (z)P Φk ) = e−|z| /4 (Φj |P Φk ) = 0 . Abbiamo trovato che gli spazi Hj sono mutuamente ortogonali (quindi in particolare, j varia in un insieme j numerabile se H è separabile). Per costruzione si ha anche che lo spazio vettoriale generato dall’azione di tutti gli operatori W (z) su tutti i vettori Φk è denso in H. In altre parole, lo spazio delle combinazioni lineari finite di vettori negli spazi mutuamente ortogonali Hk è denso in H, cioè H è somma diretta ortogonale (o hilbertiana) dei sottospazi chiusi Hk con k ∈ I. Per concludere notiamo per ogni spazio di Hilbert Hk possiamo utilizzare nuovamente la dimostrazione già fatta per il teorema di Stone-von Neumann, con le stesse notazioni usate nella dimostrazione del teorema di Stone-von Neumann dove ora H è rimpiazzato da Hk e la rappresentazione π : A → B(H) è rimpiazzata da πk : A → B(Hk ), ottenuta restringendo le immagini di ciascun operatore di π(A ) al sottospazio invariante Hk . L’unica differenza con la dimostrazione citata è che, in questo caso, la richiesta che πk (A )Φk sia denso in Hk è verificata per ipotesi invece che come conseguenza del fatto che πk (A ) sia irriducibile. Si ottiene in questo modo che la restrizione πk (A ) di π(A ) ad ogni sottospazio invariante Hk è unitariamente equivalente alla rappresentazione standard π1 (A ) su L2 (Rn , dx). Dato che quest’ultima è irriducibile lo deve anche essere ogni πk . Questo completa la dimostrazione. 2. 10.2.6 Commenti finali sul teorema di Stone-von Neumann: il gruppo di Heisenberg. Il teorema di Stone-von Neumann si esprime nel gergo della fisica teorica, con l’affermazione: “tutte le rappresentazioni irriducibili dell’algebra di Weyl con un numero finito e fissato di gradi di libertà sono unitariamente equivalenti,” o anche “tutte le rappresentazioni irriducibili delle CCR con un numero finito e fissato di gradi di libertà sono unitariamente equivalenti,”. Sopra unitariamente equivalenti si riferisce all’esistenza dell’isomorfismo di spazi di Hilbert S e il numero finito di gradi di libertà è riferito alla dimensione finita dello spazio simplettico X sul quale è costruita l’algebra di Weyl. Cosa accade nel caso infinito dimensionale? Assumendo comunque l’irriducibilità e passando, da X finito dimensionale – descrivente per es. le coordinate del punto materiale nello spazio delle fasi – a X infinito dimensionale – descrivente per es. un appropriato spazio di soluzioni di equazioni di campo bosoniche libere–, il teorema di Stone - von Neumann cessa di valere. Nel linguaggio dei fisici teorici si dice che: “Esistono rappresentazioni delle CCR con un numero infinito di gradi di libertà che non sono unitariamente equivalenti,”. In pratica, in questo caso, si trovano rappresentazioni irriducibili fortemente continue π1 e π2 , 387 su rispettivi spazi di Hilbert (separabili) H1 , H2 , della ∗-algebra di Weyl A := W (V, σ) (in questo contesto pensata come C ∗ -algebra senza modificare i risultati) associata al sistema fisico in considerazione (tipicamente un campo bosonico quantizzato) per le quali non esiste alcun isomorfismo di spazi di Hilbert S : H1 → H2 tale che: Sπ1 (a) S −1 = π2 (a) , per ogni a ∈ A . Coppie di rappresentazioni siffatte sono dette inequivalenti o anche unitariamente inequivalenti. Il passaggio da X finito dimensionale a X infinito dimensionale corrisponde al passaggio dalla meccanica quantistica alla teoria dei campi quantistica (anche relativistica e su spaziotempo curvo). In tali contesti (ma non solo), l’esistenza di rappresentazioni inequivalenti è spesso legata a quella che si chiama rottura spontanea della simmetria. L’esistenza di rappresentazioni inequivalenti per uno stesso sistema fisico (individuato dalla coppia (X, σ)), mostra che la formulazione della teoria in un fissato spazio di Hilbert è inadeguata e bisogna emanciparsi dalla struttura di spazio di Hilbert per fondare le teorie quantistiche con maggiore generalità. Questo programma è stato largamente sviluppato, a partire da lavori pionieristici dello stesso von Neumann, e si chiama oggi formulazione algebrica delle teorie di campo quantistiche. In questo ambito, per esempio, si è potuta dare una veste rigorosa alla teoria dei campi in spaziotempo curvo anche in relazione ai fenomeni quantistici connessi alla termodinamica dei buchi neri. Un altro punto da sottolineare è che la particella elementare con spin 0 è descritta da una rappresentazione irriducibile di un’algebra (quella di Weyl). Si vede che la stessa cosa accade prendendo particelle con spin, carica ecc... allargando opportunamente l’algebra (o il gruppo) di riferimento. I sistemi elementari sono in tal modo descritti da rappresentazioni irriducibili di una certa algebra, in genere associata ad un gruppo di simmetria del sistema. Questo punto di vista si è rivelato fecondissimo nello sviluppo delle teorie quantistiche relativistiche – in particolare ad opera di Wigner – dove l’algebra usata per definire le particelle elementari non è più quella di Weyl, ma la condizione di irriducibilità rimane come caratterizzante un sistema elementare. Facciamo ora qualche commento di carattere matematico sul teorema di Stone-von Neumann. Useremo qui alcune nozioni che discuteremo più approfonditamente nel cap.11. Il nostro approccio si è basato sulla struttura di ∗-algebra (di Weyl) Tuttavia esiste un altro punto di vista, dovuto a Weyl e basata sul gruppo di Heisenberg, detto per tale motivo anche gruppo di Weyl-Heisenberg. Il gruppo di Heisenberg su R2n+1 , H (n), è il gruppo di Lie semplicemente connesso dotato della struttura differenziabile indotta da R2n+1 e con legge di composizione (al solito t ∈ Rn e u ∈ Rn , mentre η ∈ R) 0 0 0 (η, t, u) ◦ (η , t , u ) = n 1X η+η + ui t0 − u0i ti , t + t0 , u + u0 2 i=1 i 0 ! . Un calcolo diretto dell’algebra di Lie di questo gruppo mostra che esiste una base dell’algebra composta da 2n + 1 generatori: xi , pi , e con i = 1, 2, . . . , n e tali generatori soddisfano le relazioni di commutazione: [xi , pj ] = δij e , [xi , e] = [pi , e] = 0 , 388 i, j = 1, 2, . . . , n . Di conseguenza, se definiamo l’algebra di Lie delle combinazioni lineari reali finite degli operatori anti-autoaggiunti −iI, −iXk , −iPk ristretti al dominio comune denso ed invariante S(Rn ) e con commutatore [·, ·], l’applicazione lineare individuata da e 7→ −iI, xk 7→ −iXk e pk 7→ −iPk è un isomorfismo di algebre di Lie. Questo isomorfismo si estende a tutto il gruppo di Heisenberg. Infatti, se gli operatori W ((t, u)) sono definiti come in proposizione 10.4, la funzione: R2n+1 3 (η, t, u) 7→ eiη W ((t, u)) =: H((η, t, u)) (10.50) definisce una rappresentazione unitaria irriducibile e fedele (cioè iniettiva) del gruppo di Heisenberg 2n + 1 dimensionale su L2 (Rn , dx) come si prova facilmente per ispezione diretta. Ulteriormente vale: s- lim H(s(η, t, u)) = I s→0 per ogni fissato (η, t, u) ∈ R2n+1 . (10.51) Viceversa, abbiamo che: Proposizione 10.7. Se: R2n+1 3 (η, t, u) 7→ H((η, t, u)) è una rappresentazione unitaria irriducibile del gruppo di Heisenberg H (n) sullo spazio di Hilbert H, che soddisfa la (10.51), allora deve essere necessariamente della forma: H((η, t, u)) = eiη W ((t, u)) , dove gli operatori W ((t, u)) soddisfano le ipotesi del teorema 10.2 di Stone-von Neumann. Prova. Il fatto che valga la (10.50) segue dal fatto che il sottogruppo abeliano R del gruppo di Heisenberg deve essere rappresentato da un sottogruppo abeliano unitario. Ora, il fatto che gli elementi di R commutino con tutti gli elementi del gruppo di Weyl implica che ogni elemento H((η, 0, 0)) commuti con tutta la rappresentazione. Dato che la rappresentazione è irriducibile, questo implica, per il lemma di Schur, che H((η, 0, 0)) = χ(η)I con χ(η) ∈ C e deve valere |χ(η)| = 1 dato che H((η, 0, 0)) è unitario. Infine, dato che η → H((η, 0, 0)) è fortemente continuo, il teorema di Stone implica che χ(η) = eicη per ogni η ∈ R e qualche costante c. Le relazioni di commutazione del gruppo richiedono infine che c = 1. Le stesse relazioni di commutazione implicano la validità delle relazioni di Weyl per gli operatori W ((t, u)). 2 In questo contesto una formulazione alternativa (la prima volta dimostrata da Weyl) del teorema di Stone – von Neumann si enuncia dicendo che: Teorema 10.5. Ogni rappresentazione unitaria irriducibile del gruppo di Heisenberg H (n) che soddisfa la (10.51), è equivalente, tramite una trasformazione unitaria, alla rappresentazione su L2 (Rn , dx): R2n+1 3 (η, t, u) 7→ eiη W ((t, u)) . 389 dove gli operatori W ((t, u)) sono definiti in proposizione 10.4. Prova. Con il nostro approccio, la dimostrazione segue immediatamente dal teorema 3.10 e dalla proposizione 10.7. 2 Esistono infine formulazioni più o meno rigorose del teorema di Stone - von Neumann basate sulle sole relazioni di commutazione di Heisenberg (10.10) senza passare agli esponenziali (vedi [CCP82] per alcune discussioni euristiche non completamente rigorose). In tal caso però le ipotesi tecniche sui domini (spazi di vettori analitici) e sull’esistenza di estensioni autoaggiunte, sono non ovvie e non hanno un diretto significato fisico. Un risultato rigoroso importante è quello di J. Dixmier4 ed anche il fondamentale lavoro di E. Nelson5 , su cui torneremo nel prossimo capitolo, in cui si prova, generalizzandolo ad un numero finito ma arbitrario di dimensioni, che se P e Q sono simmetrici su un sottospazio denso invariante su cui soddisfano le relazioni di Heisenberg e P 2 + Q2 è essenzialmente autoaggiunto su tale spazio, allora P e Q generano una rappresentazione fortemente continua dell’algebra di Weyl sullo spazio di Hilbert e quindi, a meno di isomorfismi di spazi di Hilbert hanno la solita forma su L2 (R, dx). 10.3 Il principio di corrispondenza di Dirac. Rimane fino ad ora aperto il problema di come sia possibile individuare gli operatori in H corrispondenti alle osservabili di interesse fisico differenti da posizione ed impulso. È stato scritto moltissimo da parte di numerosi ed importanti autori su procedure che permettano di passare da osservabili classiche importanti ad osservabili quantistiche importanti. Bisogna dire comunque che, in un certo senso, si tratta di una “battaglia persa in partenza”: dal punto di vista fisico, la Meccanica Quantistica è più fondamentale di quella classica e pertanto la Meccanica Classica dovrebbe essere vista come caso limite della Meccanica Quantistica, anche se non è per nulla facile dimostrare ciò a parte pochi risultati generali noti tra cui il teorema di Eherenfest la cui formulazione rigorosa è stata data solo di recente6 . Ci si aspetta di conseguenza che ci siano enti fisici quantistici, in particolare osservabili, che non hanno corrispondente classico. Un esempio è sicuramente lo spin delle particelle. Fatta questa premessa, possiamo dire che, in linea di principio, per la particella senza spin, alcune osservabili quantistiche rilevanti saranno “funzioni” delle osservabili Xi e Pi . Ci si aspetta che, se F (x, p) è una grandezza classica, la corrispondente grandezza quantistica sia qualcosa del tipo F (X, P ). Tuttavia questa strada è molto più ardua da percorrere di quanto si creda per motivi di carattere matematico. Infatti: (1) non è affatto ovvio come dare significato ad una funzione di X e P quando questi operatori hanno misure spettrali che non commutano (nel caso di operatori con misure spettrali commutanti si possono usare procedure basate su cosiddette 4 J. Dixmier, “Sur la Relation i(P Q − QP ) = I” Compos. Math. 13, (1956), 263-269. E. Nelson,“Analytic Vectors” Ann. Math. 70, (1959), 572-614. 6 G.Friesecke, M.Koppen, On the Ehrenfest theorem of quantum mechanics, J. Math. Phys.50, 082102-082102-6 (2009). 5 390 joint measures che, in pratica, corrispondono ad una misura prodotto), (2) le ricette ingenue che cercano di percorrere questa via in genere non producono operatori autoaggiunti e nemmeno simmetrici quando sono coinvolti operatori non commutati. A titolo di esempio, si consideri la grandezza classica x · p. A quale osservabile – cioé operatore autoaggiunto – dovrebbe corrispondere? Non conviene passare per le misure spettrali degli operatori perché queste non commutano. Allora proviamo ad usare gli stessi operatori ristretti ad uno spazio invariante e denso su cui sono entrambi definiti. La speranza è di produrre un operatore essenzialmente autoaggiunto o almeno simmetrico e poi selezionarne, con qualche criterio, le estensioni autoaggiunte (se ce ne sono nel secondo caso). In quest’ottica, la risposta: P “x · p corrisponde a X · P (= ni=1 Xi Pi )” sarebbe del tutto inadeguata, anche interpretando gli operatori come definiti nello spazio invariante e denso S(R3 ). Questo perché X · P non è un operatore simmetrico su tale spazio, non commutando Xi e Pi (lo si verifichi per esercizio). Pertanto non ha nemmeno senso cercare estensioni autoaggiunte di X · P . Un’altra possibilità è quella di associare a x · p l’operatore simmetrico (X · P + P · X)/2 definito su S(R3 ) e quindi studiarne le estensioni autoaggiunte. Tuttavia se si prendono in considerazione casi più complessi, come x2k pk , si vede che questa ricetta è fortemente ambigua, perché ci sono più possibilità ammissibili a priori: (Xk2 Pk + Pk Xk2 )/2 è simmetrico sul dominio S(R3 ), ma lo è anche Xk (Xk Pk + Pk Xk )/4 + (Xk Pk + Pk Xk )Xk /4 e ci sarebbero ancora altre possibilità. Un criterio per aiutare nella scelta, ma che non risolve in generale i problemi sollevati, è dovuto allo stesso Dirac e si chiama solitamente “principio di corrispondenza di Dirac”. Per discuterlo, Ricordiamo che un’algebra di Lie è una coppia (V, [·, ·]), dove V è uno spazio vettoriale reale e [·, ·] : V × V → V, detto commutatore dell’algebra di Lie, è un’applicazione bilineare, antisimmetrica, che soddisfa l’identità di Jacobi: [u, [v, w]] + [v, [w, u]] + [w, [u, v]] = 0 , per ogni u, v, w ∈ V. Dirac notò che, per lo spazio delle fasi della particella classica F (in realtà ciò a validità del tutto generale), la coppia (G(F), {·, ·}), dove G(F) è lo spazio vettoriale reale delle funzioni sufficientemente regolari a valori reali definite sullo spazio delle fasi, e {·, ·} è la parentesi di Poisson: X ∂f ∂g ∂g ∂f {f, g} : − , f, g ∈ G(F) , ∂xi ∂pi ∂xi ∂pi i è un’algebra di Lie. Si noti in particolare che valgono le relazioni di commutazione canoniche {xi , pj } = δij . Queste relazioni sono le relazioni di Heisenberg quando si sostituiscono xi → Xi , pi → Pi e {·, ·} → −i~−1 [·, ·]. L’idea di Dirac è allora la seguente “Principio di Corrispondenza di Dirac”. Se fˆ denota il corrispondente quantistico (operatore almeno simmetrico definito su un dominio denso invariante indipendente dalla grandezza particolare considerata) della generica grandezza 391 classica f ∈ G(F), la corrispondenza deve essere tale che, se vale classicamente h = {f, g} , allora deve valere quantisticamente: ĥ = −i~−1 [fˆ, ĝ] per ogni terna di grandezze classiche f, g, h ∈ G(F) e corrispondenti quantistiche fˆ, ĝ, ĥ. A titolo di esempio, se si considera la solita particella classica, le componenti del momento angolare classico: li = 3 X ijk xj pk , j,k=1 corrispondono agli operatori, che risultano essere essenzialmente autoaggiunti su S(R3 ), Li = 3 X ijk Xj Pk , j,k=1 e le relazioni di commutazione classiche {li , lj } = 3 X ijk lk , k=1 corrispondono alle analoghe relazioni quantistiche su S(R3 ): [Li , Lj ] = i~ 3 X ijk Lk . k=1 Una giustificazione possibile del principio di Dirac si può dare per le osservabili che corrispondono ad i generatori di trasformazioni unitarie che rappresentano l’azione di un gruppo di simmetria sul sistema fisico. In tal caso è naturale richiedere che (a) l’algebra di Lie del gruppo, (b) quella della rappresentazione unitaria che rappresenta le trasformazioni sul sistema quantistico e (c) l’algebra di Lie dei generatori del gruppo delle trasformazioni canoniche classiche che corrispondono alle trasformazioni di simmetria sul sistema classico, siano tutte e tre isomorfe. Non ci addentreremo ulteriormente in questa direzione, diciamo solo che, in un certo senso, le idee di Dirac hanno trovato sviluppo rigoroso in certe procedure di quantizzazione che cadono sotto il nome di Quantizzazione à la Weyl7 nella quale non ci addentreremo. 7 Vedi per esempio: C. Zachos, D. Fairlie, and T. Curtright, Quantum Mechanics in Phase Space, World Scientific, Singapore, 2005. 392 Capitolo 11 Introduzione alle Simmetrie Quantistiche. In questo capitolo continueremo la presentazione della struttura matematica della Meccanica Quantistica, introducendo alcune nozioni fondamentali e strumenti matematici di grande rilievo. La prima sezione è dedicata alla nozione e caratterizzazione di simmetra quantistica. Dopo avere dato qualche esempio, ed avere discusso quallo che accade in presenza di regole di superselezione, daremo la definizione di simmetria nel senso di Kadison e poi di simmetria nel senso di Wigner. Dimostreremo poi i teoremi di Wigner e Kadison che provano che le due nozioni coincidono e sono implementate da operatori unitari oppure anti unitari. Nella seconda sezione, passeremo quindi al problema della rappresentazione di gruppi di simmetria, introducendo le nozioni di rappresentazioni proiettive, unitarie proiettive e di estensione centrale di un gruppo (di simmetria) tramite U (1). La terza sezione sarà inizialmente dedicata alla nozione di gruppo di simmetria topologico ed allo studio delle rappresentazioni unitarie proiettive fortemente continue. Esamineremo, in particolare il caso notevole del gruppo topologico abeliano R, che ha importanti applicazioni in Meccanica Quantistica. Successivamente, dopo avere richiamato alcune definizioni e risultati generali della teoria dei gruppi ed algebre di Lie, presenteremo alcuni importanti risultati dovuti a Bargmann, Gårding e Nelson (ed alcune generalizzazioni di tali risultati), riguardanti le rappresentazioni unitarie proiettive ed unitarie di gruppi di Lie. A titolo di esempio di grande importanza fisica studieremo le rappresentazioni unitarie del gruppo di simmetria SO(3) in realzione allo spin. Per concludere, applicheremo tutta la teoria presentata al gruppo di Galileo fino ad enunciare e provare la regola di Bargmann di superselezione della massa. 11.1 Nozione e caratterizzazione di simmetrie quantistiche. Una nozione estremamente importante in meccanica quantistica, anche per gli sviluppi successivi nelle teorie quantistiche dei campi, è la nozione di simmetria di un sistema quantistico. In 393 realtà esistono due nozioni di simmetria, una dinamica ed una più elementare, che non coinvolge l’evoluzione temporale. In questa sezione ci occuperemo del caso più elementare. Consideriamo un sistema fisico S, descritto nello spazio di Hilbert HS e con spazio degli stati S(HS ) e sottoinsieme degli stati puri Sp (HS ). Quando agiamo con una trasformazione fisica g sul sistema S, ne alteriamo lo stato quantistico. Alla trasformazione fisica g corrisponderà quindi un’applicazione γg : S(HS ) → S(HS ) nello spazio degli stati oppure, volendoci restringere agli stati puri: γg : Sp (HS ) → Sp (HS ). Il legame tra g e γg per il momento non ci interessa ed ammetteremo solo che sia noto; in ogni caso dipenderà dalla descrizione matematica di S. Se γg soddisfa certi requisiti che preciseremo in seguito, γg viene detta simmetria del sistema. Con abuso di linguaggio diremo a volte che g stessa è una simmetria del sistema quando lo è γg . I requisiti affinché γg sia una simmetria sono due: (a) che γg sia biettiva, (b) che conservi qualche struttura matematica, per il momento non ancora specificata, dello spazio degli stati S(HS ) o in quello degli stati puri Sp (HS ), che abbia qualche significato fisico preciso. Da un punto di vista fisico, il requisito (a) può essere in realtà imposto sulla trasformazione fisica g che agisce sul sistema, e corrisponde alla richiesta che g sia reversibile, cioè che (i) esista una trasformazione fisica inversa g −1 , associata all’applicazione γg−1 : S(HS ) → S(HS ), che ritrasformi il sistema, rispettivamente, lo stato quantistico, nella situazione iniziale, e (ii) si deve poter raggiungere qualsiasi configurazione del sistema, rispettivamente, qualsiasi stato quantistico, attraverso l’azione di g, rispettivamente di γg , scegliendo opportunamente la situazione di partenza. Le differenze tra le varie nozioni note di simmetria dipendono dalla precisazione del requisito (b), cioè dal tipo di struttura che rimane invariata sotto l’azione di γg . La struttura più semplice che tale applicazione può conservare è quella convessa dello spazio degli stati, che corrisponde fisicamente al fatto che uno stato si possa costruire miscelando altri stati con certi pesi statistici. Le operazioni di simmetria, in questo caso, alterano lo stato, ma non alterano i pesi statistici usati nella miscela. Questo genere di simmetrie quantistiche sono quelle definite da Kadison1 . Un seconda classe di simmetrie è quella dovuta a Wigner2 e si riferisce alle funzioni che agiscono da Sp (HS ) in Sp (HS ) e richiede che le simmetrie preservino la struttura di spazio metrico che ha lo spazio dei raggi. Tradotto nel linguaggio fisico, le trasformazioni modificano gli stati puri, ma lasciano invariate le probabilità di transizione tra coppie di stati puri. Una terza classe, della quale non ci occuperemo, è quella individuata da Segal3 che concerne la struttura di algebra di Jordan delle osservabili. Nel seguito studieremo i primi due tipi di simmetrie e proveremo che, a livello matematico, sono in realtà la stessa cosa, ma anche che sono sempre descritte dall’azione 1 Vedi R. Kadison, Isometries of Operator Algebras, Annals of Mathematics, 54 325-338, 1951. E. Wigner, Group Theory and its Applications to the Quantum Theory of Atomic Spectra, Academic Press, 1959. 3 I. Segal, Ann. Math. 48, 930-940 (1947) 2 394 di operatori unitari oppure anti unitari (quindi le simmetrie di Wigner si possono estendere a simmetrie di Kadison su tutto lo spazio degli stati). Questo risultato di caratterizzazione delle simmetrie in termini di operatori unitari o antiunitari è di enorme importanza in fisica ed è stato formulato in due teoremi che portano il nome di Teorema di Kadison e Teorema di Wigner rispettivamente. Il secondo è molto più noto del primo tra i fisici, anche se il primo è almeno altrettanto importante. 11.1.1 Qualche esempio. Prima di entrare nei dettagli matematici, facciamo qualche esempio di operazioni fisiche che risultano essere simmetrie di sistemi quantistici (sia di Wigner che di Kadison). Descrivendo un sistema fisico isolato S in un certo sistema di sistema di riferimento inerziale I, una trasformazione che, come ben noto, produce una simmetria di S, è ogni traslazione rigida di S secondo un fissato vettore, oppure la rotazione di un qualsiasi angolo attorno ad ogni fissato asse asse. In altre parole le isometrie continue dello spazio di quiete dei riferimenti inerziali producono simmetrie quantistiche. Un’altra trasformazione è il cambiamento di sistema di riferimento inerziale (anche nelle teorie relativistiche) nel senso che segue. Trasformiamo il sistema isolato S nel riferimento inerziale I, in modo tale che il sistema fisico trasformato appaia, in un altro sistema di riferimento inerziale I0 6= I, come appariva all’inizio in I. Infine, un altro tipo di trasformazione, per sistemi fisici isolati descritti in riferimenti inerziali, che produce simmetrie è la traslazione temporale (da non confondersi con l’evoluzione temporale) che discuteremo più avanti. Si deve notare che questo genere di trasformazioni sono tutte attive, nel senso che cambiano il sistema S (il suo stato quantistico). Bisogna anche avere ben chiaro che le trasformazioni di cui parliamo non avvengono in seguito ad evoluzione dello stato del sistema: sono trasformazioni ideali, cioè puramente matematiche. Tra l’altro, alcune di esse non potrebbero mai avvenire nella realtà in seguito all’evoluzione temporale del sistema secondo la propria legge dinamica, o potrebbero avvenire molto difficilmente. Un tipico esempio è l’inversione di parità . Con questa trasformazione fisica, il sistema S viene sostituito da un nuovo sistema che corrisponde all’immagine del sistema riflessa in uno specchio. In certi casi l’unico modo di ottenere in pratica l’inversione di parità è quello, idealmente, di distruggere il sistema e ricostruirne uno che corrisponde all’immagine speculare di quello iniziale. In taluni casi anche questa operazione astratta non è fisicamente sensata a causa della natura delle stesse leggi fisiche. Le particelle che interagiscono tramite l’interazione debole costituiscono, sorprendentemente, sistemi i cui stati non ammettono l’inversione di parità come simmetria in un senso molto drastico: nello spazio degli stati non vi è alcuna trasformazione γ che rappresenti la trasformazione fisica ideale d’inversione di parità . Questo significa, semplicemente, che la presunta simmetria non è , in realtà , una simmetria del sistema. Un altro genere di trasformazione che ha alcune particolarità in comune con l’inversione di parità e che, talvolta, è associata a simmetrie, è l’inversione del tempo. Le simmetrie illustrate fino ad ora sono relative da isometrie spaziotemporali. Benché siano sempre trasformazioni attive sugli stati, sono legate a trasformazioni passive di cambiamento di sistema di riferimento (o 395 semplicemente di coordinate) per mezzo di isometrie passive dello spaziotempo. In questo caso ci si aspetta (ma come visto non è sempre vero) che le trasformazioni attive sugli stati siano simmetrie, proprio in conseguenza del fatto che, i diversi sistemi di riferimento o coordinate connessi dalle corrispondenti trasformazioni passive (trasformazioni di Galileo o trasformazioni di Poincaré ) che usiamo per descrivere la realtà (almeno a livello macroscopica), sono equivalenti. In altre parole, se agisco sul sistema fisico S con una di queste trasformazioni attive, posso comunque annullare l’effetto della trasformazione cambiando riferimento (o semplicemente coordinate) e con la garanzia che il nuovo riferimento sia fisicamente equivalente al precedente. Ci sono trasformazioni associabili a simmetrie che, a differenza di tutte quelle menzionate fino ad ora, non sono associate ad isometrie dello spaziotempo e non sono annullabili cambiando riferimento. Un tipico esempio è la coniugazione di carica, attraverso la quale si cambia segno a tutte le cariche (del genere considerato) presenti in S e si cambia quindi settore di superselezione della carica. Esistono infine trasformazioni ancora più astratte legate a simmetrie interne e simmetrie di gauge, sulle quali non ci soffermiamo. Per concludere vogliamo sottolineare un fatto molto importante dal punto di vista fisico. La lezione che si impara dal caso delle interazioni deboli è che la questione se una trasformazione agente, idealmente, su un sistema rappresenti o meno una simmetria quantistica è , in ultima analisi e dopo che il requisito (b) è stato specificato, un fatto da decidere a livello sperimentale. Dopo avere enunciato e provato i teoremi di Kadison e Wigner, ci occuperemo della descrizione delle simmetrie, in termini di operatori unitari o antiunitari, nella situazione in cui le trasformazioni fisiche abbiano la struttura di un gruppo algebrico, topologico o di Lie [War75, NaSt84]. Nel prossimo capitolo ci occuperemo delle simmetrie dinamiche, che vengono introdotte nel momento in cui viene definita la nozione di evoluzione temporale dello stato quantistico di un sistema S. In questo contesto, si ritroverà lo stretto legame tra esistenza di simmetrie dinamiche ed esistenza di associate leggi di conservazione (come ben noto, a livello classico, codificato dalle varie formulazioni del celebre teorema di Nöther). 11.1.2 Simmetrie in presenza di regole di superselezione. Se M è un sottospazio chiuso dello spazio di Hilbert H possiamo identificare in modo naturale S(M ) (Sp (M )) con un sottoinsieme di S(H) (rispettivamente di Sp (H)), pensando S(M ) (risp. Sp (M )) come il sottoinsieme che contiene gli stati ρ ∈ S(H) (risp. Sp (H)), tali che Ran(ρ) ⊂ M . Tale identificazione è equivalente ad estendere ogni ρ ∈ S(M ) ad un operatore definito su tutto H, imponendo che sia l’operatore nullo su M ⊥ . In tutto il resto del capitolo assumeremo tacitamente tale identificazione. L’esistenza di tale identificazione risulta essere utile nella situazione che andiamo a considerare ora. Ricordiamo che, in talune situazioni, gli stati possibili per un sistema fisico non sono tutti gli elementi di S(HS ) (o Sp (HS ) nel caso di stati puri), ma sono in numero ridotto perché alcune combinazioni convesse di stati sono vietate. Questo accade in presenza di regole di superselezione (vedi cap.7). Senza ripetere quanto abbiamo spiegato precedentemente, diciamo solo che nel caso di presenza di regole di superselezione si ha una decomposizione di HS nella somma diretta 396 in sottospazi chiusi ortogonali detti settori coerenti: HS = M HSk . k∈K Possiamo allora definire gli spazi degli stati e degli stati puri di ciascun settore S(HSk ), Sp (HSk ). Si noti che S(HSk ) ∩ S(HSj ) = ∅ e Sp (HSk ) ∩ Sp (HSj ) = ∅ se k 6= j. Per quanto riguarda gli stati puri fisicamente ammissibili dalla regola di superselezione per il sistema fisico S descritto su H, questi saranno tutti e soli quelli dell’insieme: [ Sp (HSk ) . k∈K Gli stati misti fisicamente ammissibili dalla regola di superselezione per il sistema fisico S descritto su H saranno invece tutte e sole le possibili le combinazioni lineari convesse (anche infinite in riferimento alla topologia operatoriale forte) degli elementi dell’insieme: [ S(HSk ) . k∈K Quanto appena scritto è equivalente alla richiesta che gli stati fisicamente ammissibili siano gli elementi ρ di S(HS ) (o Sp (HS )) che ammettano ogni sottospazio HSk come spazio invariante. In questa situazione le simmetrie devono rispettare la struttura della decomposizione in stati coerenti e quello che si assume è che si possano avere simmetrie tra settori anche distinti, quindi funzioni: γkk0 : S(HSk ) → S(HSk0 ), k, k 0 ∈ K. Eventualmente può essere k 0 = k, ma ci si aspetta che le simmetrie, in generale, possano mischiare i vari settori. Ogni applicazione γkk0 : S(HSk ) → S(HSk0 ) deve essere biettiva e soddisfare il requisito d’invarianza di Wigner o di Kadison. 11.1.3 Simmetrie nel senso di Kadison. Consideriamo un sistema fisico quantistico S descritto sullo spazio di Hilbert HS e con spazio degli stati γ(HS ). Una richiesta (fisicamente molto debole) per definire una simmetria è quella che si riferisce alla procedura di miscela degli stati quantistici. Un’operazione sul sistema definisce una simmetria del sistema se la costruzione di miscele è invariante rispetto ad essa. In termini precisi: se uno stato si può ottenere come una miscela di altri stati, con certi pesi statistici, allora, trasformando il sistema secondo un’operazione fisica che individua una simmetria del sistema, lo stato trasformato si deve poter ottenere come miscela degli stati trasformati della miscela iniziale, con gli stessi pesi statistici. In altre parole un’applicazione biettiva γ : S(HS ) → S(HS ) rappresenta una simmetria del sistema quando conserva la struttura di insieme convesso di S(HS ): se ρi ∈ S(HS ), 0 ≤ pi ≤ 1 P e i∈J pi = 1, allora: ! γ X pi ρi = i∈J X i∈J 397 pi γ(ρi ) . Nel seguito assumeremo che J sia finito. In tal caso è ovvio che, senza perdere generalità , possiamo ridurci ad imporre il vincolo di sopra con J composto da due soli elementi. Possiamo dare la seguente definizione, che non è proprio quella dovuta a Kadison – la si ottiene comunque con una procedura di dualità – ma è più conforme con il nostro approccio. Diamo la definizione formalmente, tenendo conto della possibile presenza di settori coerenti di superselezione. Definizione 11.1 (Simmetria di Kadison). Si consideri un sistema fisico quantistico S descritto sullo spazio di Hilbert HS . Si supponga che HS sia decomposto in settori coerenti HS = ⊕k∈K HSk . Una simmetria (di Kadison) di S dal settore HSk al settore HSk0 , con k, k 0 ∈ K, è un’applicazione γ : S(HSk ) → S(HSk0 ) che goda delle due seguenti proprietà : (a) γ è biettiva; (b) γ conserva la struttura convessa di S(HSk ) e S(HSk0 ). In altre parole: γ (p1 ρ1 + p2 ρ2 ) = p1 γ(ρ1 ) + p2 γ(ρ2 ) se ρ1 , ρ2 ∈ S(HS ), p1 + p2 = 1 e p1 , p2 ∈ [0, 1]. (11.1) Nel caso in cui lo spazio di Hilbert H non contenga settori coerenti, ogni γ : S(H) → S(H), che sia biettiva e conservi la struttura di insieme convesso, è detta automorfismo di Kadison su H. Un esempio di simmetria nel senso della definizione 11.1 è quella indotta da un operatore U : HSk → HSk0 che sia unitario o antiunitario (definizione 5.10), definendo γ (U ) (ρ) := U ρU −1 per ogni ρ ∈ S(HSk ) . (11.2) Dimostriamolo. Abbiamo bisogno di un lemma elementare. Lemma 11.1 Sia U : H → H0 un operatore antiunitario dallo spazio di Hilbert H allo spazio di Hilbert H0 e N ⊂ H una base hilbertiana. Allora U = V C, dove V : H → H0 è un operatore unitario e C : H → H è un operatore di coniugazione (definizione 5.11) naturale associata a N definita da: X Cψ := (z|ψ)z . z∈N P Prova. Definendo V ψ := z∈N (z|ψ)U z, la dimostrazione segue immediatamente dalla proprietà di antiisometricità e continuità di ogni operatore antiunitario e dalle proprietà elementari delle basi hilbertiane, in particolare si osservi che {U z}z∈N è ancora una base hilbertiana. 2 Possiamo allora enunciare e provare la annunciata. 398 Proposizione 11.1. Sia U : HSk → HSk0 un operatore unitario (cioè isometrico e suriettivo) oppure antiunitario, sullo spazio di Hilbert HS , associato al sistema quantistico S con spazio degli stati S(H) e dove HSk e HSk0 sono due settori coerenti. γ (U ) : S(HSk ) → B(H) definita in (11.2) è una simmetria di Kadison per S dal settore HSk al settore HSk0 . Prova. La proprietà (11.1) è banalmente vera in ciascuna delle due ipotesi per U (si osservi che non lo sarebbe se permettessimo ai coefficienti pi di essere complessi). Dimostriamo che γ (U ) (ρ) ∈ S(HSk0 ) se ρ ∈ S(HSk ). Assumiamo inizialmente che U sia unitario. Se ρ è di classe traccia in HS lo deve essere anche U ρU −1 , dato che lo spazio degli operatori di classe traccia è un ideale bilatero in B(HS ) per (b) in teorema 4.7 interpretando U ρU −1 come una composizione di operatori di B(HS ). Per fare ciò è sufficiente, pensare ρ come operatore in S(HS ) che è nullo sull’ortogonale di sHSk e ρ(HSk ) ⊂ HSk quindi estendere U e U −1 come operatori nulli sull’ortogonale di HSk e HSk0 rispettivamente, estendendoli in tal modo ad operatori in B(HS ). Se ρ ≥ 0 allora (ψ|U ρU −1 ψ) = (U ∗ ψ|ρU ∗ ψ) ≥ 0 e pertanto γ (U ) (ρ) ≥ 0. Infine, usando una basehilbertiana data dall’unione di una base hilbertiana in HSk e una in (HSk )⊥ si ha subito che tr γ (U ) (ρ) = tr U ρU −1 = tr(U −1 U ρ) = tr(ρ) = 1. Nell’ultimo passaggio, calcolando la traccia sulla base prima menzionata, abbiamo usato l’identità U −1 U HSk = I HSk ed abbiamo tenuto conto del fatto che ρ = 0 su (HSk )⊥ . Pertanto γ (U ) (ρ) ∈ S(HSk0 ) se ρ ∈ S(HSk ). Passiamo al caso di U antiunitario. Decomponiamo U come detto nel lemma 5.1: U = V C, in riferimento alla base hilbertiana N ⊂ HS che preciseremo più avanti. Mostriamo che U ρU −1 è positivo, di classe traccia e con traccia unitaria. Dato che V è unitario (nel qual caso la tesi vale per la dimostrazione appena fatta) e che U ρU −1 = V (CρC −1 )V −1 , è sufficiente dimostrare la tesi per U = C. Specializziamo N , e quindi C, ad una base Hilbertiana N costituita di autovettori ψ dell’operatore ρ (che esiste per il teorema 4.3 di Hilbert) e pertanto, se φ ∈ H: ρφ = X pψ (ψ|φ)ψ . ψ∈N Di conseguenza, usando il fatto che C è continuo ed antilineare, che vale CC = I e (f |g) = (Cf |Cg) per definizione di coniugazione, che ogni autovettore di ρ, pψ è reale (e positivo) e, infine, che Cψ = ψ, otteniamo: CρC −1 φ = X pψ (ψ|Cφ)Cψ = ψ∈N = X ψ∈N X pψ (CCψ|Cφ)Cψ = ψ∈N pψ (Cψ|φ)Cψ = X pψ (ψ|Cφ)ψ = ρφ . ψ∈N Abbiamo provato che CρC −1 = ρ e quindi CρC −1 è di classe traccia, positivo e con traccia pari a 1 se ρ ∈ S(HSk ). 2 Esempi 11.1. Nel caso in cui la regola di superselezione sia quella della carica elettrica di un sistema fisico, ci saranno (in generale infiniti) settori Hq uno per ogni valore fissato della carica 399 q. La coniugazione di carica può essere costruita come una classe di simmetrie tra settori di tipo γ (Uq ) e vale che Uq : Hq → H−q per ogni valore di q. Mostreremo più avanti che, in realtà , tutte le simmetrie di Kadison hanno la struttura (11.2) per qualche operatore unitario o antiunitario U dipendente dalla simmetria. Questo è l’enunciato del famoso teorema di Kadison. 11.1.4 Simmetrie nel senso di Wigner. Passiamo ora alla nozione di simmetria quantistica nel senso proposto da Wigner. Consideriamo il solito sistema quantistico S descritto sullo spazio di Hilbert HS e con spazio degli stati S(HS ). Concentriamo l’attenzione sull’insieme degli stati puri Sp (HS ) (cioè sui raggi di HS ). Restringiamoci a trasformazioni δ : Sp (HS ) → Sp (HS ). Dal punto di vista sperimentale possiamo controllare le probabilità di transizione |(ψ|ψ 0 )|2 = tr(ρρ0 ) tra due stati puri ρ = ψ(ψ| ) e ρ0 = ψ 0 (ψ 0 | ). La richiesta di Wigner perché una funzione biettiva δ : Sp (HS ) → Sp (HS ) sia una simmetria è che preservi le probabilità di transizione. Se due stati puri hanno una certa probabilità di transizione, allora, trasformando il sistema secondo un’operazione fisica che individua una simmetria del sistema, gli stati trasformati devono avere la stessa probabilità di transizione di quelli iniziali. Possiamo dare la definizione seguente che tiene anche conto della possibile presenza di settori coerenti. Definizione 11.2 (Simmetria di Wigner). Si consideri un sistema fisico quantistico S descritto sullo spazio di Hilbert HS e con spazio degli stati S(HS ). Si supponga che HS sia decomposto in settori coerenti HS = ⊕k∈K HSk . Una simmetria (di Wigner) di S dal settore HSk al settore HSk0 , con k, k 0 ∈ K, è un’applicazione δ : Sp (HSk ) → Sp (HSk0 ) che goda delle due seguenti proprietà : (a) δ è biettiva; (b) δ conserva le probabilità di transizione. In altre parole: T r (ρ1 ρ2 ) = tr (δ(ρ1 )δ(ρ2 )) se ρ1 , ρ2 ∈ Sp (HSk ) . (11.3) Nel caso in cui lo spazio di Hilbert H non contenga settori coerenti, ogni δ : S(H) → S(H), che sia biettiva e che conservi le probabilità di transizione, è detta automorfismo di Wigner su H. Un esempio di simmetria nel senso della definizione 10.2, come nel caso delle simmetrie di Kadison, è quella indotta da un operatore U : HSk → HSk0 che sia unitario o antiunitario (definizione 5.10), definendo: δ (U ) (ρ) := U ρU −1 per ogni ρ ∈ Sp (HSk ) . 400 (11.4) A differenza del caso delle simmetrie di Kadison, qui la verifica è veramente immediata. Osservazioni. (1) Dato che gli stati puri sono tutti del tipo ψ(ψ| ) con ||ψ|| = 1, l’azione di δ (U ) sugli stati puri è equivalentemente descrivibile, con una certa improprietà di linguaggio, dicendo che δ (U ) trasforma lo stato puro ψ nello stato puro U ψ. Questo è la maniera in cui, molto spesso, si descrivono le simmetrie indotte dagli operatori (anti)unitari nei manuali di Meccanica Quantistica. (2) Ogni simmetria di Kadison mappa stati puri in stati puri e pertanto definisce un’applicazione biettiva sullo spazio degli stati puri. Tuttavia non è detto, a priori, che definisca una simmetria di Wigner, perchè non è affatto evidente che conservi le probabilità di transizione. Una simmetria nel senso di Wigner non si estende in modo ovvio dalla classe degli stati puri a quella degli stati misti. Pertanto non è ovvio che le due nozioni di simmetria siano la stessa. Tuttavia ogni operatore unitario oppure anti unitario individua contemporaneamente una simmetria di Wigner ed una di Kadison tramite la mappa ρ 7→ U ρU −1 . Questa sarà l’osservazione per provare che le due simmetrie sono in realtà la stessa cosa. Mostreremo nella prossima sezione che tutte le simmetrie di Wigner tra coppie di settori hanno la struttura (11.4) per qualche operatore unitario o antiunitario U dipendente dalla simmetria. Questo è l’enunciato del famoso teorema di Wigner. Per concludere, possiamo dare una nozione di simmetria di Wigner in senso generale, senza precisare i settori. Definizione 11.3 (Simmetria di Wigner generale). Si consideri lo spazio di Hilbert HS del sistema S e si assuma che sia decomposto in settori coerenti, in modo che gli stati puri fisicamente ammissibili siano solo gli elementi dell’insieme: [ Sp (HS )ammiss := Sp (HSk ) . k∈K Una simmetria di Wigner δ (senza specificare i settori) è un’applicazione da Sp (HS )ammiss in Sp (HS )ammiss biettiva che conserva le probabilità di transizione. In realtà questa definizione si può ricondurre alla definizione di simmetria di Wigner tra coppie settori nel modo che segue. Proposizione 11.2. Sia δ una simmetria di Wigner del sistema S e si assuma che lo spazio di Hilbert HS di S sia decomposto in settori coerenti, in modo che gli stati puri fisicamente ammissibili siano solo gli elementi dell’insieme: [ Sp (HS )ammiss = k∈K 401 Sp (HSk ) . Allora esiste una funzione biettiva f : K → K e una classe di simmetrie di Wigner, con settori fissati, δf,f (k) : Sp (HSk ) → Sp (HSf (k) ) con k ∈ K, tali che δSp (HSk ) = δf,f (k) per ogni k. In questo senso δ non è altro che una classe di simmetrie di Wigner che scambiano i settori senza sovrapporsi. Prova. Si definisca su Sp (HS ) la distanza d(ρ, ρ0 ) := ||ρ − ρ0 ||1 := tr(|ρ − ρ0 |), dove || ||1 è la norma naturale nello spazio degli operatori di classe traccia. Con questa definizione risulta che gli insiemi Sp (HSk ) sono le componenti connesse di Sp (HS )ammiss (vedi esercizi 11.1). La funzione δ : Sp (HS )ammiss → Sp (HS )ammiss è un isometria biettiva in riferimento alla distanza d, in particolare è un omeomorfismo. Pertanto trasforma insiemi connessi massimali in insiemi connessi massimali e di conseguenza si deve decomporre in isometrie biettive che operano tra coppie di settori differenti, cioè simmetrie di Wigner tra coppie di settori differenti. 2 11.1.5 Teoremi di Wigner, di Kadison. Cominciamo ad enunciare e provare il teorema di Wigner. Successivamente, usando tale risultato, proveremo il teorema di Kadison. L’enunciato dei due teoremi permette di definire in modo elementare un’azione duale delle simmetrie sulle osservabili del sistema quantistico, come vedremo dopo avere dimostrato il teorema di Kadison. La dimostrazione del teorema di Wigner che daremo ora è molto diretta. Ne esistono di più eleganti, ma indirette, come quella dovuta Bargmann4 . Quella che presenteremo ha il merito di mostrare esplicitamente come si costruisce U su una base hilbertiana. Teorema 11.1 (Teorema di Wigner) Si consideri un sistema fisico quantistico S descritto sullo spazio di Hilbert (complesso separabile) HS . Si supponga che HS sia decomposto in settori coerenti HS = ⊕k∈K HSk (dove eventualmente K = ∅ ed in tal caso quanto segue vale sostituendo ovunque HSk e HSk0 con HS ). Se la funzione: δ : Sp (HSk ) → Sp (HSk0 ) è una simmetria (di Wigner) di S dal settore HSk al settore HSk0 , con k, k 0 ∈ K, allora valgono i fatti seguenti. (a) Esiste un operatore U : HSk → HSk0 , unitario oppure antiunitario (e la scelta è fissata da δ stessa), tale che: δ(ρ) = U ρU −1 per ogni stato puro ρ ∈ Sp (HSk ). (11.5) (b) U è determinato a meno di una fase, cioè U1 e U2 (entrambi unitari oppure entrambi antiunitari) soddisfano (11.5) (sostituendo separatamente ciascuno di essi a U ) se e solo se U2 = χU1 dove χ ∈ C con |χ| = 1. 4 J. Bargamann, J. math. Phys. 5, 862-868, (1964). 402 (c) Se {ψn }n∈N è una base hilbertiana di HSk e scegliamo i vettori ψn0 ∈ HSk0 in modo tale che ψn0 (ψn0 | ) = δ (ψn0 (ψn0 | )), allora {ψn0 }n∈N è base hilbertiana di HSk0 , inoltre un operatore U che soddisfa (11.5) risulta essere: U :ψ= X X an ψn 7→ n∈N an ψn0 nel caso unitario, n∈N oppure: U :ψ= X n∈N an ψn 7→ X an ψn0 nel caso antiunitario. n∈N Prova. (b) Prima di tutto mostriamo che U , se esiste, è unico a meno di una fase. Ovviamente, se U1 soddisfa la tesi rispetto a δ, allora U2 := χU1 la soddisferà ancora se χ ∈ C con |χ| = 1. Mostriamo che questo è l’unico caso possibile. Supponiamo che esistano U1 e U2 (entrambi unitari oppure anti unitari) che soddisfino la tesi in riferimento a δ. Deve accadere che, se ρ = ψ(ψ| ), allora, posto L := U1−1 U2 , vale Lψ(ψ|L−1 φ) = ψ(ψ|φ) per ogni coppia di vettori normalizzati a 1, ψ, φ. Di conseguenza varrà Lψ(Lψ|φ) = ψ(ψ|φ), dato che L è unitario. In definitiva, essendo Lψ(Lψ| ) = ψ(ψ| ), Lψ e ψ determinano lo stesso stato puro, per cui deve essere Lψ = χψ ψ e cioé U1 ψ = χψ U2 ψ, oppure U1 ψ = χψ U2 ψ (se gli operatori sono antiunitari) per ogni ψ ∈ HSk , e per qualche χψ ∈ C con |χψ | = 1. Moltiplicando i due membri per un numero c ∈ C, segue che l’identità vale per ogni ψ ∈ HSk . Mostriamo χψ non dipende da ψ. Scegliendo ψ 6= ψ 0 e a, b ∈ C \ {0}, la linearità di L implica che: χaψ+bψ0 (aψ + bψ 0 ) = L(aψ + bψ 0 ) = aLψ + bLψ 0 = aχψ ψ + bχψ0 ψ 0 . Di conseguenza: a(χaψ+bψ0 − χψ )ψ = b(χψ0 − χaψ+bψ0 )ψ 0 . Dato che ψ 6= ψ 0 , a, b 6= 0, deve essere (χaψ+bψ0 − χψ ) = 0 e (χψ0 − χaψ+bψ0 ) = 0 e quindi χψ = χψ0 . Abbiamo ottenuto che, per qualche χ ∈ C con |χ| = 1, vale: U2 ψ = χU1 ψ per ogni ψ ∈ HSk . (a) e (c) Passiamo ora a costruire un operatore U che rappresenti δ. Sia {ψn }n∈N una base hilbertiana di HSk . Ad ognuno dei vettori ψn associamo il corrispondente stato puro ρn := ψn (ψn | ). Quindi facciamo agire δ su tali stati, ottenendo la classe di stati puri δ(ρn ) = ψn0 (ψn0 |) ∈ Sp (HSk0 ), dove i vettori unitari ψn0 ∈ HSk0 sono individuati a meno di una fase. Supponiamo di fissare una volta per tutte tale fase in modo arbitrario. Per prima cosa notiamo che {ψn0 }n∈N è una base 0 )|2 = tr(δ(ρ )δ(ρ )) = hilbertiana di HSk0 . Infatti, i vettori sono ortonormali valendo: |(ψn0 |ψm n m 2 0 0 0 tr(ρn ρm ) = |(ψn |ψm )| = δnm , inoltre ψ ⊥ ψn implica ψ = 0 come ora dimostriamo. Sia ψ 0 ⊥ ψn0 per ogni n ∈ N. Se ψ 0 6= 0, senza perdere generalità possiamo assumere che ||ψ 0 || = 1 e definire ρ0 := ψ 0 (ψ 0 | ) ∈ Sp (HSk0 ). Dato che δ è suriettiva, deve essere ρ0 = δ(ρ) con ρ = ψ(ψ| ), per qualche ψ ∈ HSk con ||ψ|| = 1. Di conseguenza: |(ψ 0 |ψn0 )|2 = tr(δ(ρ0 )δ(ρ0n )) = tr(ρρn ) = |(ψ|ψn )|2 = 0 403 e quindi deve essere ψ = 0, dato che {ψn }n∈N è base hilbertiana, ma questo è impossibile dato che ||ψ|| = 1. Deve dunque essere ψ 0 = 0, e quindi {ψn0 }n∈N è base hilbertiana. Ora, usando le due basi {ψn }n∈N e {ψn0 }n∈N definiremo l’operatore U in varie tappe. Per prima cosa definiamo i vettori unitari ausiliari: Ψk := 2−1/2 (ψ0 + ψk ) per k ∈ N \ {0} ed i corrispondenti stati puri: (Ψk | ) Ψk , per k ∈ N\{0}. Il trasformato δ(Ψk (Ψk | )) = Ψ0k (Ψ0k | ) deve soddisfare, in particolare: |(Ψ0k |ψn0 )|2 = tr Ψ0k (Ψ0k | )δ(ρn ) = tr (δ(Ψk (Ψk | ))δ(ρn )) = |(Ψk |ψn )|2 = e deve anche essere ||Ψ0k || = 1. Decomponendo Ψ0k = 0 n an ψn , P δ0n + δkn , 2 si vede che l’unica possibilità è : Ψ0k = χ0k 2−1/2 (ψk0 + χk ψk0 ) con |χ0k | = |χk | = 1. Le fasi χk sono individuate da δ mentre le fasi χ0k si possono fissare arbitrariamente. Le fasi χk portano l’informazione di √ δ e ne faremo uso tra poco. Cominciamo a definire U sui vettori ψn , (ψ0 + ψk )/ 2 stabilendo che, per definizione, dove k ∈ N \ {0}: U ψ0 := ψ00 , U ψk := χk ψk0 , U (2−1/2 (ψ0 + ψk )) := 2−1/2 (ψ00 + χk ψk0 ) . (11.6) Con questa scelta siamo sicuri che, se φ è uno dei vettori nell’argomento di U scritti sopra e ρφ è lo stato puro associato ad esso, allora δ(ρφ ) è associato a U φ. Ora estenderemo U su ogni vettore: ψ= X an ψn ∈ HSk , n∈N in modo che U continui a rappresentare δ. Assumiamo sopra che ||ψ|| = 1 e che a0 ∈ R \ {0}. Sia poi ψ 0 ∈ HSk0 con ||ψ 0 || = 1, tale che ψ 0 (ψ 0 | ) = δ(ρψ ). Avremo uno sviluppo: ψ0 = X a0n ψn0 . (11.7) n∈N i coefficienti a0k sono individuati, a meno di una fase globale, dai coefficienti an e da δ. Nelle nostre ipotesi su δ vale comunque: |(ψ 0 |ψn0 )|2 = tr(δ(ρψ )δ(ρn )) = tr(ρψ ρn ) = |(ψ|ψn )|2 . Il risultato si può riscrivere come |a0n | = |an |. Usando questo risultato insieme alle prime due identità in (11.6) nel secondo membro di (11.7), arriviamo a: ψ0 = χ a0 U ψ0 + X n∈N\{0} 404 0 χ−1 n an U ψn , dove χ, con |χ| = 1, è arbitrario. Possiamo allora definire: U ψ := a0 U ψ0 + X 0 χ−1 n an U ψn . (11.8) n∈N\{0} In questo modo siamo sicuri che, per costruzione, U ψ(U ψ| ) = δ(ρψ ) e si verifica che la definizione appena data di U estende quella già data in (11.6). Tuttavia non abbiamo ancora completamente definito U ψ, perché non conosciamo quanto valgono i coefficienti a0n in funzione delle componenti an di ψ. Siamo ora in grado di determinare tale legame. Per costruzione di U e nelle nostre ipotesi su δ, deve risultare |(Ψk |ψ)| = |(U Ψk |U ψ)|, che significa, facendo uso di (11.8): 0 |a0 + ak |2 = |a0 + χ−1 k ak | . Questa identità , tenendo conto che |ak | = |a0k |, implica che: 0 Re(a0 ak ) = Re(a0 χ−1 k ak ) . Tenendo infine conto del fatto che a0 ∈ R \ {0}, le identità di sopra sono possibili solo in uno dei seguenti casi: a0k = χk ak oppure a0k = χk ak . Di conseguenza, per ogni ψ = P n an ψn con a0 ∈ R \ {0} vale: ψ0 = U ψ = X an ψn0 + n∈Aψ X an ψn0 . n∈Bψ Si osservi che, per il fissato vettore ψ, si può sempre sempre scegliere uno dei due insiemi Aψ e Bψ come vuoto5 . Supponiamo infatti che ciò non sia possibile. Allora per le componenti di ψ e del corrispondente ψ 0 deve succedere che a0p = χp ap mentre a0q = χq aq , per qualche coppia di indici p 6= q, dove Imap , Imaq 6= 0. Se φ = 3−1/2 (ψ0 +ψp +ψq ) deve allora essere per costruzione: |(φ0 |ψ 0 )|2 = |(φ|ψ)|2 , dove φ0 := U φ = 3−1/2 (ψ00 + ψp0 + ψq0 ). L’identità tra i moduli quadri si esplicita in: |a0 + ap + aq |2 = |a0 + ap + aq |2 , cioè , con qualche calcolo: Re(ap aq ) = Re(ap aq ) che è impossibile nelle nostre ipotesi, perché implica che Imaq = −Imaq . P Se ψ = n an ψn ∈ HSk con ||ψ|| = 1 e se a0 ∈ R \ {0}, abbiamo pertanto le due alternative per definire U ψ: X X an ψn . (11.9) Uψ = an ψn oppure U ψ = n∈N n∈N 5 Si osservi che c’è una certa ambiguità nel definire gli insiemi Aψ e Bψ dato che gli indici n degli eventuali coefficienti an reali possono essere scelti come membri di An oppure Bn indifferentemente. 405 Mostriamo ora che la scelta tra i due casi non dipende da ψ e quindi deve dipendere dalla natura P di δ. Consideriamo un generico vettore ψ = n an ψn ∈ HSk con ||ψ|| = 1 e a0 ∈ R \ {0}. Quindi definiamo il vettore ψ (nc) associato a c ∈ C con Imc 6= 0, per ogni n = 1, 2, . . ., dato da: 1 ψ (nc) := È (ψ0 + cψn ) . 1 + |c|2 Dovendo essere valido il vincolo: |(ψ|ψ (nc) )| = |(U ψ|U ψ (nc) )|, si vede immediatamente che questo è possibile solo se ψ (nc) e ψ sono dello stesso tipo tra le due possibilità in (11.9). Di conseguenza P tutti i vettori ψ = n an ψn ∈ HSk con ||ψ|| = 1 e a0 ∈ R \ {0} sono dello stesso tipo. Definiamo ora l’operatore U : HSk → HSk0 dato da: U :ψ= X an ψn 7→ n∈N X an ψn0 nel caso lineare, n∈N oppure: U :ψ= X n∈N an ψn 7→ an ψn0 X nel caso antilineare. n∈N Si osservi che, per costruzione, il primo operatore è isometrico surgettivo cioè unitario, il secondo è antisometrico surgettivo, cioè antiunitario. Si deve osservare che la scelta tra il caso unitario e quello antiunitario deve dipendere dalla natura di δ e non è possibile rappresentare lo stesso δ si con un operatore unitario che con uno anti unitario. Questo segue dal fatto che è impossibile P P P P che ψ 0 := n∈N an ψn 7→ n∈N an ψn0 e ψ̃ 0 = n∈N an ψn 7→ n∈N an ψn0 differiscano per una sola fase per ogni scelta dei coefficienti an , cioè del vettore ψ, come dovrebbe essere se ψ 0 e ψ̃ 0 individuassero lo stesso stato puro δ(ψ(ψ| )). Per costruzione, questo operatore soddisfa U ρU −1 = δ(ρ) purché si possa esprimere ρ ∈ Sp (HSk ) P come ψ(ψ| ) dove, nello sviluppo ψ = n∈N an ψn , a0 6= 0. Infatti, in tal caso è possibile ridefinire ψ cambiando una sola fase totale: ψ̃ = χψ, senza alterare ρ = ψ(ψ| ) = ψ̃(ψ̃| ), in modo tale che, nello sviluppo di ψ̃, ã0 ∈ R \ {0}; a questo punto la costruzione che abbiamo fatto per U implica che: U ρU −1 = U ψ(ψ| )U −1 = U ψ̃(ψ̃| )U −1 = U ψ̃(U ψ̃| ) = δ(ρ) . Rimane da provare che questo risultato vale anche per gli stati puri associati a vettori ψ = P n∈N an ψn con a0 = 0. A tal fine notiamo che tutta la costruzione può essere rifatta rimpiazzando ψ0 con un qualsiasi altro vettore di base ψk . In tal caso si trova banalmente che, se si definisce U esattamente come detto sopra, vale U ρU −1 = δ(ρ) per gli stati puri associati a P vettori ψ = n∈N an ψn con ak 6= 0. (Non può accadere che, usando come vettore di riferimento ψk invece di ψ0 , il nuovo operatore U sia di tipo diverso (lineare o antilineare) di quello definito P prendendo come riferimento ψ0 . Infatti, sui vettori ψ = n∈N an ψn con ak 6= 0 e a0 6= 0 insieme, i due operatori si devono comportare nello stesso modo e questo ne determina il tipo come provato sopra.) L’osservazione fatta conclude la dimostrazione, perché se consideriamo ρ ∈ Sp (HSk ) P e ρ = ψ(ψ| ), con ψ = n∈N an ψn , e a0 = 0, ci deve essere comunque almeno un coefficiente ak 6= 0 essendo ||ψ|| = 1. Pertanto possiamo rifare la dimostrazione di sopra rimpiazzando ψ0 406 con quel ψk . 2 Passiamo ora al teorema di Kadison con una procedura di riduzione al teorema di Wigner dovuta a Roberts e Roepstorff6 . Per prima cosa dimostriamo parte del teorema nel caso bidimensionale. Proposizione 11.3. Se H è uno spazio di Hilbert bidimensionale e se γ : S(H) → S(H) è un automorfismo di Kadison, allora esiste U : H → H unitario oppure anti unitario tale che: γ(ρ) = U ρU −1 per ogni ρ ∈ S(H). Prova. Per prima cosa caratterizziamo geometricamente gli stati e gli stati puri su H attraverso la cosiddetta sfera di Poincarè . Uno stato ρ ∈ S(H) è , nel caso in esame, una matrice hermitiana positiva con traccia pari a 1. Lo spazio vettoriale reale delle matrici hermitiane possiede una base costituita dall’identità I e dalle 3 matrici di Pauli: 0 −i 1 0 0 1 , σ2 = , σ3 = . (11.10) σ1 = i 0 0 −1 1 0 Quindi, dovrà essere per a, bn ∈ R: ρ = aI + 3 X bn σn . n=1 La condizione tr(ρ) = 1 fissa a = 1/2, dato che le tre matrici σn hanno traccia nulla. La richiesta di positività , cioè È la richiesta che gli autovalori di ρ siano entrambi positivi, risulta allora essere equivalente a b11 + b22 + b23 ≤ 1/2. La verifica è immediata per computo diretto. In definitiva gli elementi ρ di S(H) risultano essere in corrispondenza biunivoca con i vettori n ∈ R3 con ||n|| ≤ 1 attraverso la relazione, con ovvie notazioni: ρ= 1 (I + n · σ) . 2 (11.11) Infine, la richiesta che ρ sia puro, e cioè che si abbia un unico autovalore pari a 1, è equivalente al fatto che ||n|| = 1, come si prova per verifica diretta. In definitiva, gli elementi di S(H) sono in corrispondenza biunivoca con la palla chiusa B in R3 di raggio 1 e centrata nell’origine, e gli elementi del sottoinsieme degli stati puri, Sp (H), sono in corrispondenza biunivoca con i punti sulla superficie della palla ∂B. La corrispondenza biunivoca appena definita: B 3 n 7→ ρn ∈ S(H) è in realtà un vero isomorfismo, dato che conserva le strutture convesse dei rispettivi spazi, risultando da (11.11): ρpn+qm = pρn + qρm 6 per ogni coppia n, m ∈ B se p, q ≥ 0 e p + q = 1 . J. Roberts and G. Roepstorff, Commun. Math. Phys. 11, 321-338, (1969). 407 Una proprietà importante nel seguito dell’isomorfismo trovato è la seguente formula che segue immediatamente dalle relazioni (che si provano per verifica diretta): tr(σj ) = 0, tr(σi σj ) = 2δij . tr (ρm ρn ) = 1 (1 + m · n) . 2 (11.12) Possiamo ora caratterizzare gli automorfismi di Kadison. Assegnare un automorfismo di Kadison γ : S(H) → S(H) è evidentemente equivalente ad assegnare una corrispondente funzione biettiva γ 0 : B → B che soddisfi: γ 0 (pn + qm) = pγ 0 (n) + qγ 0 (m) per ogni coppia n, m ∈ B se p, q ≥ 0 e p + q = 1 . Se l’automorfismo di Kadison γ : S(H) → S(H) individua la funzione γ 0 : B → B come detto sopra, la funzione Γ : R3 → R3 definita da: v 0 Γ(0) := 0 , Γ(v) := ||v||γ , se v ∈ R3 \ {0} ||v|| risulta allora essere un’estensione di γ 0 e risulta anche essere lineare e biettiva. La prova di ciò è diretta. (Bisogna tuttavia osservare che non tutte le funzioni lineari biettive L : R3 → R3 si restringono ad automorfismi di Kadison quando ristrette a B: deve essere soddisfatta la condizione che L(B) = B.) Si osservi che gli automorfismi di Kadison, essendo isomorfismi, devono trasformare elementi estremali in elementi estremali e pertanto deve anche risultare: Γ(n) = γ 0 (n) = 1 se ||n|| = 1 e ancora, per la linearità di Γ: ||Γ(v)|| = ||v|| per ogni v ∈ R3 . Concludiamo che la funzione lineare Γ : R3 → R3 associata all’automorfismo di Kadison γ deve essere un’isometria di R3 che ammette l’origine come punto fisso. Questo è possibile se e solo se Γ ∈ O(3), il gruppo delle matrici ortogonali reali di dimensione 3. (Viceversa, se Γ ∈ O(3), allora la sua restrizione a B individua un automorfismo di Kadison come si prova immediatamente.) Questo risultato, tenendo conto del teorema di Wigner, conclude la prova del teorema di Kadison nel caso in esame. In effetti, il fatto che Γ ∈ O(3) implica che γ Sp (H) sia un automorfismo di Wigner per la proprietà (11.12). Se infatti ρn e ρm sono stati puri, la probabilità di transizione ad essi associata è : 1 tr (ρn ρm ) = (1 + n · m) . 2 D’altra parte, usando il fatto che Γ è una matrice ortogonale, si ha anche: tr (γ(ρn )γ(ρm )) = 1 1 (1 + Γ(n) · Γ(m)) = (1 + n · m) , 2 2 e quindi: tr (γ(ρn )γ(ρm )) = tr (ρn ρm ) . Tenendo conto del fatto che γ 0 ∂B = Γ∂B : ∂B → ∂B è banalmente una biezione (ciò accade per tutte le metrici ortogonali), abbiamo che γSp (H) : Sp (H) → Sp (H) è una biezione. Concludiamo 408 che γSp (H) : Sp (H) → Sp (H) è un automorfismo di Wigner. Il teorema di Wigner implica allora che esiste un operatore unitario o anti unitario U : H → H tale che γ(ρ) = U ρU −1 per ogni ρ ∈ Sp (H) . Se ρ ∈ S(H) si potrà comunque decomporre come combinazione convessa di due stati puri associati agli autovettori di ρ. Se ρ1 , ρ2 ∈ Sp (H) sono questi stati, per qualche p ∈ [0, 1] dovrà essere: ρ = pρ1 + (1 − p)ρ2 . Quindi γ(ρ) = pγ(ρ1 ) + (1 − p)γ(ρ2 ) = pU ρ1 U −1 + (1 − p)U ρ2 U −1 = U (pρ1 + (1 − p)ρ2 ) U −1 = U ρU −1 . Concludiamo che l’operatore unitario o antiunitario U verifica la tesi della proposizione e la dimostrazione si conclude. 2 Osserviamo che, nella dimostrazione appena conclusa, l’esistenza dell’operatore U si può dimostrare usando la teoria delle rappresentazioni del gruppo SU (2), delle matrici unitarie 2 × 2 a determinante unitario, e del fatto che esso sia il rivestimento universale di SO(3), senza invocare il teorema di Wigner. Non abbiamo seguito questa strada per non dover introdurre nuove nozioni. Passiamo ad enunciare e provare il teorema di Kadison nel caso generale. (Il contenuto originale del teorema provato realmente da Kadison si riferisce solo ai punti (a) e (b)). Teorema 11.2 (Teorema di Kadison) Si consideri un sistema fisico quantistico S descritto sullo spazio di Hilbert (complesso separabile) HS . Si supponga che HS sia decomposto in settori coerenti HS = ⊕k∈K HSk (dove eventualmente K = ∅ ed in tal caso quanto segue vale sostituendo ovunque HSk e HSk0 con HS ). Se la funzione: γ : S(HSk ) → S(HSk0 ) è una simmetria (di Kadison) di S dal settore HSk al settore HSk0 , con k, k 0 ∈ K, allora valgono i fatti seguenti. (a) Esiste un operatore U : HSk → HSk0 , unitario oppure antiunitario, tale che: γ(ρ) = U ρU −1 per ogni stato puro ρ ∈ S(HSk ). (11.13) (b) U è determinato a meno di una fase, cioè U1 e U2 (entrambi unitari oppure entrambi antiunitari) soddisfano (11.13) (sostituendo separatamente ciascuno di essi a U ) se e solo se U2 = χU1 dove χ ∈ C con |χ| = 1. (c) La restrizione di γ allo spazio degli stati puri è una simmetria di Wigner (e la scelta del carattere unitario o anti unitario di U in (a) è fissata da γSp (HSk ) ). (d) Ogni simmetria di Wigner δ : Sp (HSk ) → Sp (HSk0 ) si estende, in modo unico, ad una simmetria di Kadison γ (δ) : S(HSk ) → S(HSk0 ). 409 Prova. (b) Prima di tutto mostriamo che U , se esiste ed è unitario oppure è anti unitario, è unico a meno di una fase nella corrispondente classe di operatori. Ovviamente, se U1 soddisfa la tesi rispetto a γ, allora U2 := χU1 la soddisferà ancora se χ ∈ C con |χ| = 1. Mostriamo che questo è l’unico caso possibile. Supponiamo che esistano U1 e U2 (entrambi unitari oppure anti unitari) che soddisfino la tesi in riferimento a γ. Deve accadere in particolare che, se ρ ∈ S(HSk ), allora U1 ρU1−1 = U2 ρU2−1 e quindi: LρL−1 = ρ dove L := U1−1 U2 è lineare ed unitario. Scegliendo uno stato puro ρ = ψ(ψ| ), l’identità trovata si riscrive: Lψ(Lψ| ) = ψ(ψ| ) e quindi Lψ deve appartenere allo stesso raggio di ψ e pertanto Lψ = χψ ψ per qualche numero χψ ∈ C con |χ| = 1. Esattamente come nella dimostrazione del punto (b) del teorema di Wigner, si trova allora che χψ non dipende da ψ e questo conclude la dimostrazione di (b). Passiamo a dimostrare (a). Dividiamo la dimostrazione in alcuni passi. Per prima cosa notiamo che γ è biettiva e conserva la struttura convessa. Conseguentemente, trasforma elementi estremali in elementi estremali ed elementi non estremali in elementi non estremali, cioè stati puri in stati puri e stati misti in stati misti. Di conseguenza, se M ⊂ HSk è un sottospazio bidimensionale allora esisterà un analogo sottospazio bidimensionale M0 ⊂ HSk0 tale che γ (S(M)) ⊂ S(M0 ). (Se ψ1 , ψ2 è una base di M, il generico elemento di S(M) è ρ = pψ1 (ψ1 | )+qψ2 (ψ2 | ) con p+q = 1 e p, q ≥ 0. Quindi γ(ρ) = pγ(ψ1 (ψ1 | )) + qγ(ψ2 (ψ2 | )) = pψ10 (ψ10 | ) + q(ψ20 (ψ20 | ) , dove, i vettori unitari ψ10 e ψ20 si ottengono (a meno di fasi) richiedendo che individuino gli stati puri γ(ψ1 (ψ1 | )) e γ(ψ1 (ψ1 | )) rispettivamente. Questi due stati puri devono essere differenti tra di loro, altrimenti la biezione γ −1 : S(HSk0 ) → S(HSk ) che conserva la struttura conforme, mapperebbe uno stato puro in uno stato misto. Pertanto i vettori ψ10 e ψ20 , che devono essere di norma unitaria, soddisfano necessariamente: ψ10 6= aψ20 per ogni a ∈ C e pertanto sono linearmente indipendenti. Lo spazio M 0 è allora quello generato da ψ10 e ψ20 .) Abbiamo ora due lemmi. Lemma 1. Nelle nostre ipotesi su γ, esiste una simmetria di Wigner δ : Sp (HSk ) → Sp (HSk0 ) che soddisfa γ(ρ) = δ(ρ) per ogni ρ ∈ Sp (HSk ). Prova del lemma 1. Dato che γ e γ −1 trasformano elementi estremali in elementi estremali ed elementi non estremali in elementi non estremali, γ Sp (HSk ) : Sp (HSk ) → Sp (HSk0 ) è biettiva, dato che la sua inversa destra e sinistra non è altro che γ −1 Sp (HSk0 ) : Sp (HSk0 ) → Sp (HSk ). La dimostrazione si conclude provando che γ Sp (HSk ) conserva le probabilità di transizione. Dato φ, ψ ∈ HSk supposti essere unitari e diversi, sia M lo spazio vettoriale generato da essi e sia M 0 ⊂ HSk0 lo spazio bidimensionale che soddisfa γ (S(M )) ⊂ S(M 0 ) menzionato sopra. Sia infine U : M 0 → M un qualsiasi operatore unitario. Definiamo: γ 0 (ρ) := U γ(ρ)U −1 per ogni ρ ∈ S(M ). 410 Si verifica immediatamente che γ 0 è una simmetria di Kadison se ci si restringe a lavorare nello spazio di Hilbert 2-dimensionale H = M . Come provato nella proposizione 11.3, in questo caso il teorema di Kadison è vero e quindi esiste un operatore unitario o anti unitario V : M → M tale che γ 0 (ρ) = U γ(ρ)U −1 = V ρV −1 . In altre parole: γ(ρ) = U V ρ(U V )−1 per ogni ρ ∈ S(M ). In particolare, scegliendo ρ = ψ(ψ| ) e poi ρ = φ(φ| ) abbiamo che tr (γ(ψ(ψ| ))γ(φ(φ| ))) = tr U V ψ(ψ| )(U V )−1 U V φ(φ| )(U V )−1 = = tr U V ψ(ψ| )φ(φ| )(U V )−1 = tr (ψ(ψ| )φ(φ| )) . Nel caso ψ(ψ| ) = φ(φ| ) si ottiene banalmente lo stesso risultato come è immediato verificare. Abbiamo provato che γSp (HSk ) conserva le probabilità di transizione ed è quindi una simmetria di Wigner. 2 Per il lemma precedente ed applicando il teorema 11.1 di Wigner, esiste un operatore unitario oppure anti unitario U : HSk → HSk0 tale che: γ(ρ) = U ρU −1 per ogni ρ ∈ Sp (HSk ). (11.14) La dimostrazione si conclude dimostrando che l’identà trovata vale anche nel caso di ρ ∈ S(HSk ). A tal fine, notiamo che (11.14) è equivalente a: U −1 γ(ρ)U = ρ per ogni ρ ∈ Sp (HSk ), e quindi Γ : S(HSk ) → Sp (HSk ) è ancora una simmetria di Kadison (anzi un automorfismo di Kadison) che si riduce all’identità sugli stati puri. La dimostrazione del teorema di Kadison si conclude immediatamente provando il seguente lemma. Lemma 2. Sia H uno spazio di Hilbert. Se Γ : S(H) → S(H) è un automorfismo di Kadison che si riduce all’identità sugli stati puri, allora è l’identità . Prova del lemma 2. Se ρ = puri, allora: Γ(ρ) = Γ PN N X k=0 k=0 pk ψk (ψk | ) è una combinazione lineare (convessa) finita di stati ! pk ψk (ψk | ) = N X pk Γ (ψk (ψk | )) = k=0 N X ! pk I = I . k=0 Di conseguenza, la tesi varrà per ogni ρ ∈ S(H), se le combinazioni lineari (convesse) finite di stati puri sono dense in S(H) in una topologia rispetto alla quale Γ è continuo. Mostriamo che ciò accade rispetto alla topologia degli operatori di classe traccia indotta dalla norma ||T ||1 := 411 tr(|T |) (vedi cap.4). Se ρ ∈ S(H), possiamo decomporre l’operatore nel suo sviluppo spettrale: ρ= X pk ψk (ψk | ) . k∈N P dove pk > 0 e k∈N pk = 1. La convergenza è nella topologia operatoriale forte e anche nella topologia di || ||1 . Mostriamo che possiamo approssimare ρ con elementi ρN ∈ S(H), combinazioni lineari (convesse) finite di stati puri, in modo tale che: ||ρN − ρ||1 → 0 per N → +∞. A tal fine definiamo: ρN := N X (N ) qk ψk (ψk | ) , k=0 (N ) qk pk := PN j=0 pj , N=0,1,2,. . . . (N ) Evidentemente ρN ∈ S(H) per ogni N ∈ N ed inoltre, tenendo conto che qk < pk e che i vettori unitari ψk (aggiungendo una base hilbertiana di ker(ρ) ⊃ ker(ρN )) formano una base hilbertiana di H, fatta di autovettori di ρ e di ρN , si trova facilmente che, per N → +∞ ||ρ − ρN ||1 = tr (|ρ − ρN |) = N X +∞ X (N ) − (pk − qk ) + pk k=0 k=N +1 = 1− PN j=0 pj PN j=0 pj N X k=0 pk + +∞ X pk → 0 , k=N +1 in virthù dei soli fatti che pn > 0 e +∞ n=1 pn = 1. Mostriamo ora che Γ è continua nella topologia di || ||1 e questo completa la dimostrazione. Per prima cosa estendiamo Γ da S(H) alla classe degli operatori di classe traccia positivi su H definendo, se A ∈ B1 (H) con A ≥ 0 (e quindi tr(A) > 0 se A 6= 0): 1 A , Γ1 (0) := 0 . Γ1 (A) := tr(A)Γ trA P Con questa definizione, segue immediatamente che Γ1 (A) ∈ B1 (H) e Γ1 (A) ≥ 0, inoltre: Γ1 (αA) = αΓ1 (A) se α ≥ 0, e tr (Γ1 (A)) = tr(A) . Tenendo conto che Γ conserva la struttura convessa, si prova immediatamente che Γ1 (A + B) = Γ1 (A) + Γ1 (B) . Per concludere estendiamo Γ1 sulla classe degli operatori autoaggiunti di classe traccia, definendo: Γ2 (A) := Γ1 (A+ ) − Γ1 (A− ) , 412 dove A− := − (−∞,0) xdP (A) (x) e A+ := (0,+∞) xdP (A) (x). Si osservi che A+ − A− = A e |A| = A+ + A− , per definizione, essendo P (A) la PVM di A. Con questa definizione, se A ∈ B1 (H) è autoaggiunto, allora Γ2 (A) ∈ B1 (H) ed è autoaggiunto, inoltre: ||Γ2 (A)||1 ≤ ||Γ1 (A+ )||1 + ||Γ1 (A− )||1 = tr (A+ ) + tr (A− ) = ||A||1 . R R Segue che Γ2 è continua nella topologia di || ||1 e di conseguenza lo è Γ : S(H) → S(H) che ne è una restrizione. 2 Abbiamo quindi provato l’esistenza di U unitario o anti unitario che soddisfa la richiesta γ(ρ) = U ρU −1 per ogni ρ ∈ S(HSk ). Questo conclude la prova di (a). (c) Si osservi che, valendo: γSp (HSk ) (ρ) = U ρU −1 , si conclude che γSp (HSk ) è una simmetria di Wigner come si prova immediatamente. In particolare, l’operatore U che verifica (a) (di questo teorema) soddisfa anche la tesi in (a) del teorema di Wigner per γSp (HSk ) . In base al teorema di Wigner il carattere unitario o antiunitario di U che soddisfa (a) è quindi fissato da γSp (HSk ) . (d) Se δ è una simmetria di Wigner, per il teorema di Wigner esiste U , unitario o antiunitario per cui δ(ρ) = U ρU −1 per ogni stato puro. U definisce la simmetria di Kadison γ (δ) (ρ) = U ρU −1 che estende δ su tutto lo spazio degli stati. Dimostriamo l’unicità . Se due simmetrie di Kadison, γ, γ 0 , associate agli operatori (unitari o antiunitari) U , U 0 rispettivamente, coincidono 0 su Sp (HSk ), allora le simmetrie di Wigner δ (U ) = U · U −1 e δ (U ) = U 0 · U 0−1 coincidono. Per il teorema di Wigner U e U 0 devono essere entrambi unitari o entrambi antiunitari e U = χU 0 con |χ| = 1. Conseguentemente, per le simmetrie di Kadison iniziali vale γ(ρ) = U ρU −1 = χU 0 ρU 0−1 χ−1 = χχ−1 U 0 ρU 0−1 = U 0 ρU 0−1 = γ 0 (ρ) per ogni ρ ∈ S(HSk ) e quindi γ = γ 0 . Questo conclude la dimostrazione del teorema di Kadison. 2 Dall’ultima parte della dimostrazione estraiamo una proposizione che è interessante per sua natura. Proposizione 11.4. Sia γ un automorfismo di Wigner, oppure di Kadison, sullo spazio di Hilbert H, e B1 (H)R ⊂ B1 (H) indichi il sottospazio reale di B1 (H) contenente gli operatori autoaggiunti di classe traccia sullo spazio di Hilbert complesso H. Esiste, ed è unico, un operatore lineare γ2 : B1 (H)R → B1 (H)R , continuo nella norma naturale || ||1 di B1 (H), tale che si restringa a γ su Sp (H) oppure, rispettivamente, su S(H). Più precisamente vale: ||γ2 (A)||1 ≤ ||A||1 per ogni A ∈ B1 (H)R Prova. La dimostrazione di esistenza, nel caso di automorfismi di Kadison è stata data nella dimostrazione, del lemma 2, dimostrando l’esistenza di Γ2 (ora indicato con γ2 ), quando è assegnato Γ (ora indicato con γ). L’unicità segue direttamente dalla costruzione fatta, nella 413 dimostrazione del lemma 2, per ottenere Γ2 (ora indicato con γ2 ) da Γ (ora indicato con γ). Per gli automorfismi di Wigner, la dimostrazione segue immediatamente da quella per gli automorfismi di Kadison, applicando (d) del teorema di Kadison. 11.1.6 Azione duale delle simmetrie sulle osservabili. I teoremi di Wigner e Kadison consentono di definire in modo molto elementare la nozione di azione (duale) di una simmetria sulle osservabili del sistema fisico. Consideriamo un sistema fisico S descritto sullo spazio di Hilbert (complesso separabile) HS . Per semplicità ci occuperemo della situazione in cui si abbia un unico settore, dato che la generalizzazione al caso di presenza di più settori coerenti è immediata. Sia P(HS ) l’insieme delle osservabili elementari su S, descritte, come sappiamo dai proiettori ortogonali su H. Le osservabili su S sono PVM costruite con tali proiettori, ovvero sono gli operatori autoaggiunti (non limitati in generale) associati a tali PVM. Supponiamo che γ : S(HS ) → S(HS ) sia una simmetria. Definiamo l’azione duale di γ sul reticolo dei proiettori, γ ∗ : P(HS ) → P(HS ) come: γ ∗ (P ) := U −1 P U per ogni P ∈ P(HS ). (11.15) Con questa scelta vale l’identità di dualità : tr (ργ ∗ (P )) = tr (γ(ρ)P ) , (11.16) come si verifica immediatamente, tenendo conto che γ(ρ) = U ρU −1 per il teorema di Kadison e tenendo conto, nel calcolo della traccia e nel caso in cui U sia antinunitario, che gli operatori antiunitari trasformano basi hilbertiane in basi hilbertiane. L’applicazione γ ∗ : P(HS ) → P(HS ) non solo trasforma proiettori ortogonali in proiettori ortogonali, ma preserva la struttura di reticolo limitato, ortocomplementato e σ-completo. Per esempio i proiettori ortogonali P e Q di P(HS ) commutano se e solo se γ ∗ (P ) e γ ∗ (Q) commutano. In tal caso γ ∗ (P ∨ Q) = γ ∗ (P ) ∨ γ ∗ (Q) e via di seguito. Se A : D(A) → H è un operatore autoaggiunto su H con misura spettrale P (A) ⊂ P(HS ), risulta facilmente (vedi (1) in esercizi 9.1 per il caso unitario, e (6) in esercizi 11.1 per il caso antiunitario) che U −1 AU : U −1 D(A) → HS è ancora autoaggiunto ed ha misura spettrale γ ∗ P (A) . Questa osservazione consente di estendere l’azione di γ ∗ a tutte le osservabili in modo coerente con l’idea della decomposizione spettrale, definendo, se A : D(A) → HS è un operatore autoaggiunto che rappresenta qualche osservabile di S: γ ∗ (A) := U −1 AU . (11.17) Il significato fisico di γ ∗ (A) è il seguente. Nel momento in cui definiamo una simmetria di Kadison γ, assegniamo una serie di prescrizioni sperimentali con cui trasformare il sistema S. Matematicamente parlando, l’azione sugli stati è descritta proprio da γ : S(HS ) → S(HS ). L’azione γ ∗ sulle osservabili rappresenta invece una serie di prescrizioni operative sugli strumenti di misura che, in termini intuitivi, corrisponde e generalizza la nozione di trasformazione passiva 414 di coordinate. Più precisamente, tale prescrizione è tale che se attuiamo γ sul sistema oppure γ ∗ sull’apparato di misura, otteniamo lo stesso risultato (valori di aspettazione, varianze, frequenze di esiti) quando guardiamo gli esiti delle misure. Per esempio, il valore di aspettazione hγ ∗ (A)iρ risulta essere lo stesso di hAiγ(ρ) : hγ ∗ (A)iρ = tr (γ ∗ (A)ρ) = tr U −1 AU ρ = tr AU ρU −1 = tr(Aγ(ρ)) = hAiγ(ρ) . Questo è , in definitiva, il risultato espresso nell’equazione di dualità (11.16). Il risultato è equivalente a dire che l’azione di γ sul sistema può essere annullata, ai fini dell’osservazione degli esiti delle misure sul sistema, dall’azione contemporanea di (γ ∗ )−1 sugli strumenti. Si noti che, dal punto di vista sperimentale non è affatto ovvio che una trasformazione agente sul sistema possa essere annullata da un’azione contemporanea sull’apparto di misura. Le simmetrie, nel senso di Kadison e di Wigner, hanno la proprietà che questo deve essere possibile possibile. Esempi 11.2. (1) Consideriamo una particella quantistica senza spin descritta su R3 , pensato come spazio di quiete di un sistema di riferimento inerziale descritto da fissate coordinate ortonormali destrorse. Sappiamo, dal cap 10, che in tal caso lo spazio di Hilbert della particella è L2 (R3 , dx). Gli stati puri sono dunque individuati, a meno di fasi arbitrarie, dalle funzioni d’onda, cioè dai vettori R 2 3 ψ ∈ L (R , dx) tali che R3 |ψ(x)|2 dx = 1. Le isometrie di R3 individuano simmetrie di Wigner (e quindi di Kadison) nel modo che segue, a causa dell’invarianza della misura di Lebesgue dx sotto di esse. Alcune nozioni di teoria dei gruppi che useremo di seguito saranno richiamate più avanti (la teoria elementare è brevemente richiamata nell’Appendice A). Indichiamo con IO(3) il gruppo (di Lie) delle isometrie di R3 che risulta essere il prodotto semidiretto (vedi Appendice A) di O(3) e del gruppo abeliano delle traslazioni R3 . In pratica, ogni elemento del gruppo Γ ∈ IO(3) è una coppia Γ = (R, t) che agisce sui punti di R3 come segue: Γ(x) := t + Rx. La legge di composizione gruppale di IO(3) si ottiene di conseguenza come: (t0 , R0 ) ◦ (t, R) = (t0 + R0 t, R0 R) e quindi (t, R)−1 = (−R−1 t, R−1 ) . Sia Γ : R3 → R3 un elemento di IO(3), quindi in particolare Γ potrebbe essere una traslazione lungo un asse t, Γ : R3 3 x 7→ x + t oppure una rotazione di O(3) attorno all’origine R3 3 x 7→ Rx (includendo le rotazioni improprie descritte dagli elementi di O(3) con determinante negativo) oppure una combinazione di questi due tipi di trasformazioni. Possiamo allora definire la trasformazione delle funzioni a quadrato integrabile: (UΓ ψ) (x) := ψ Γ−1 x per ogni ψ ∈ L2 (R3 , dx). (11.18) L’operatore U è evidentemente lineare, suriettivo (dato che ogni isometria Γ di R3 è biettiva) ed è un operatore isometrico, dato che la matrice jacobiana J di ogni isometria ha determinante che vale ±1: Z Z Z 2 2 −1 0 2 0 ψ x0 2 dx0 = ||ψ||2 . ψ x |detJ|dx = ||UΓ ψ|| = ψ Γ x dx = R3 R3 R3 415 La trasformazione γΓ indotta dall’operatore unitario UΓ sugli stati (puri e non) è una simmetria (di Wigner o Kadison rispettivamente), che ha come significato naturale l’azione dell’isometria Γ sul sistema S dato dalla particella in esame. Si osservi che l’applicazione IO(3) 3 Γ 7→ UΓ soddisfa, in virtù di (11.18) e dove id è l’identità di IO(3): Uid = I , UΓ UΓ0 = UΓ◦Γ0 per ogni Γ, Γ0 ∈ IO(3). Abbiamo quindi che IO(3) 3 Γ 7→ UΓ conserva la struttura di gruppo (in particolare UΓ−1 = (UΓ )−1 ) ed è pertanto una rappresentazione del gruppo IO(3) in termini di operatori unitari. Discuteremo tali rappresentazioni nella prossima sezione. Consideriamo ora una PVM su R3 , che indicheremo con P (X) , e che è detta misura spettrale congiunta dei tre operatori posizione ed è definita da: (X) (PE ψ)(x) = χE (x)ψ(x) per ogni ψ ∈ L2 (R3 , dx). Si dimostra facilmente che i tre operatori posizione si ottengono integrando le corrispondenti funzioni rispetto a tale PVM: Z Xi = R3 xi dP (X) (x) per i = 1, 2, 3. Direttamente dalla definizione (11.18) si verifica che vale la condizione di imprimitività : (X) (X) = UΓ PE UΓ−1 = PΓ(E) . (11.19) Infatti, per una generica funzione ψ ∈ L2 (R3 , dx): (X) (X) UΓ PE UΓ−1 ψ (x) = χE Γ−1 (x) ψ( Γ Γ−1 (x) ) = χΓ(E) (x)ψ(x) = PΓ(E) ψ (x) . Per l’arbitrarietà di ψ segue la (11.19). Si osservi che la condizione di imprimitività si può equivalentemente scrivere in termini dell’azione duale della simmetria di Kadison: (X) γΓ∗ PE (X) = PΓ−1 (E) . In generale, se abbiamo (i) una misura spettrale P sull’algebra di Borel dello spazio topologico a base numerabile e localmente compatto X, (ii) un gruppo topologico G di trasformazioni di X ed (iii) una rappresentazione unitaria G 3 g 7→ Vg che sia continua nella topologia operatoriale forte, se vale la condizione: Vg PE Vg−1 = Pg(E) , si dice che si ha un sistema di imprimitività su X. Abbiamo verificato (a parte le questioni topologiche che in ogni caso valgono dotando IO(3) della sua naturale struttura di gruppo di Lie matriciale sottogruppo di GL(4)), che P (X) , IO(3), U , formano un sistema di imprimitività su R3 . L’azione di γΓ∗ sugli operatori posizione si può ottenere per computo diretto, analogamente a 416 come abbiamo ricavato la condizione di imprimitività , oppure tenendo conto di quest’ultima ed integrando la misura spettrale. Se X = (X1 , X2 , X3 ) indica il vettore colonna di operatori X1 , X2 , X3 ristretti al dominio comune invariante dato dalla spazio di Schwartz S(R3 ) su cui sono essenzialmente autoaggiunti: γΓ∗ (X) = UΓ−1 XUΓ = RX + tI , (11.20) in particolare, per traslazioni pure: −1 ∗ γ(t,I) (X) = U(t,I) XU(t,I) = X + tI , (11.21) −1 ∗ γ(0,R) (X) = U(0,R) XU(0,R) = RX . (11.22) e per rotazioni pure: L’elemento (0, −I) ∈ IO(3) definisce la riflessione rispetto all’origine. La rappresentazione unitaria P := U(0,−I) , ed anche la simmetria di Wigner o Kadison γP ad essa associata, si dice inversione di parità . Un po’ impropriamente, la stessa (0, −I) è spesso detta inversione di parità . Si verifica facilmente che P∗ = P (e quindi PP = I, dato che vale anche P−1 = P∗ ). Pertanto l’inversione di parità ammette un’osservabile ad essa associata che si chiama parità ed ha i due possibili autovalori ±1. Bisogna però precisare che, in realtà , l’operatore unitario che rappresenta (0, −I) è al solito definita a meno di una fase e quindi l’osservabile P, associata alla simmetria di inversione di parità , corrisponde ad una precisa scelta di tale fase. Sono in realtà possibili due scelta, dato che −P è ancora un’osservabile e rappresenta l’inversione di parità . (2) Consideriamo ora il sistema trattato nell’esempio precedente, ma studiamo il sistema nella rappresentazione impulso. In altre parole, sfruttando la trasformata di Fourier-Plancherel, identifichiamo H con L2 (R3 , dk), in modo tale che le tre osservabili impulso (le tra componenti dell’impulso riferite al sistema di coordinate cartesiane ortonormali solidali con un riferimento inerziale) siano rappresentati dagli operatori moltiplicativi e Pi ψb (k) = ~ki ψ(k) , b come discusso nel cap. 10. Abbiamo indicato con ψe = F(ψ) la trasformata di Fourier-Plancherel 2 3 di ψ ∈ L (R , dx). Una simmetria di grande interesse fisico è l’inversione del tempo, γT , che è descritta da operatori antiunitari (vedremo più avanti perché ). Dal punto di vista fisico corrisponde all’operazione che cambia segno al tempo, ma anche alle velocità delle particelle quindi al loro impulso. Una scelta (l’unica a meno di fasi) per l’operatore anti unitario Tf che descrive l’inversione del tempo è : e Tfψe (k) := ψ(−k) per ogni ψe ∈ L2 (R3 , dk). (11.23) Si osservi che, a differenza di P nell’esempio precedente, con ogni scelta per la fase arbitraria dell’operatore Tf, vale sempre TfTf = I a causa dell’antiunitarietà di Tf. Tuttavia Tf non 417 è un’osservabile perchè l’operatore non è lineare. Si può facilmente dimostrare che, tornando in rappresentazione posizione e con la scelta fatta per la fase, la simmetria γT è associata ad un b è la trasformata di Fourier-Plancherel usata come nel cap. 10): operatore antiunitario (dove F b −1 T b −1 fF T := F tale che: (T ψ) (x) := ψ(x) per ogni ψ ∈ L2 (R3 , dx). (11.24) (3) Consideriamo una particella con carica elettrica rappresentata dall’osservabile Q con spettro discreto di autovalori ±1. Fissando un riferimento inerziale I, dotato di un sistema di coordinate solidali cartesiane ortonormali che identificano lo spazio di quiete del riferimento con R3 , lo spazio di Hilbert del sistema è dato, in questo caso, da H = C2 ⊗ L2 (R3 , dx) ≡ L2 (R3 , dx) ⊕ (R3 , dx) , dove ⊕ si deve intendere come una somma diretta ortogonale. L’isomorfismo canonico tra i due spazi scritti sopra, segue dal fatto che ogni vettore Ψ ∈ C2 ⊗ L2 (R3 , dx) è scrivibile come Ψ = |+i ⊗ ψ+ + |−i ⊗ ψ− , dove {|+i, |−i} è la base canonica di C2 , costituita da due autovettori della matrice di Pauli σ3 (vedi (11.10)) rispettivamente con autovalore +1 e autovalore −1. L’isomorfismo canonico è dato dunque da: L2 (R3 , dx) ⊕ (R3 , dx) 3 (ψ+ , ψ− ) 7→ |+i ⊗ ψ+ + |−i ⊗ ψ− ∈ C2 ⊗ L2 (R3 , dx) . Si verifica subito che l’isomorfismo conserva la struttura di spazio di Hilbert (cioè il prodotto scalare), quando si pensa L2 (R3 , dx)⊕(R3 , dx) come una somma diretta ortogonale. L’osservabile di carica può pensarsi come la matrice di Pauli σ3 in C2 e quindi, sullo spazio completo: Q = σ3 ⊗ I dove I è l’operatore identità su L2 (R3 , dx). La regola di superselezione della carica, in questo caso elementare, richiede che lo spazio si decomponga in due settori coerenti H = H+ ⊕ H− , dove H± sono, rispettivamente, i due autospazi di Q con autovalore ±. Per costruzione, la decomposizione in settori coerenti coincide proprio con la decomposizione naturale: H = L2 (R3 , dx) ⊕ (R3 , dx) . In riferimento a tale decomposizione, gli stati puri fisicamente ammissibili sono allora solamente quelli individuati dai vettori (ψ, 0) oppure dai vettori (0, ψ) con ψ ∈ L2 (R3 , dx). Abbiamo 418 allora che la simmetria γC+ detta coniugazione di carica dal settore H+ al settore H− erappresentata dall’operatore unitario C : H+ → H− : C+ : (ψ, 0) 7→ (0, ψ) per ogni ψ ∈ L2 (R3 , dx). (11.25) La simmetria γC− detta coniugazione di carica dal settore H− al settore H+ si definisce analogamente C− : (0, φ) 7→ (φ, 0) per ogni φ ∈ L2 (R3 , dx). (11.26) Si noti che C− risulta essere l’inverso di C+ . Possiamo infine definire la simmetria di Wigner di coniugazione di carica, che opera su tutto lo spazio di Hilbert (tenendo conto della presenza dei settori), e che si riduce alle due simmetrie tra settori definite sopra su ogni spazio coerente. C := C+ ⊕ C− . Si osservi che, per costruzione, CC = I e pertanto C = C∗ , per cui I è autoaggiunto. Inoltre si ha che: C∗ QC = −Q . (11.27) Esercizi 11.1. (1) In riferimento all’esempio (1), e con IO(3) 3 Γ = (t, R), dimostrare che γΓ∗ (P) = UΓ−1 PUΓ = RP , (11.28) dove P indica la terna dei tre operatori corrispondenti alle tre componenti dell’impulso e l’identità di sopra vale restringendosi allo spazio di Schwartz S(R) come dominio per gli operatori impulso. (2) In riferimento agli esempi (1) e (2), e con le convenzioni dell’esercizio (1) per le notazioni e riguardanti i domini degli operatori, dimostrare che: γP∗ (X) = P−1 XP = −X , γP∗ (P) = P−1 PP = −P (11.29) γT∗ (P) = T −1 PT = −P (11.30) mentre: γT∗ (X) = T −1 XT = X , dove P indica la terna dei tre operatori corrispondenti alle tre componenti dell’impulso e l’identità di sopra vale restringendosi allo spazio di Schwartz S(R) come dominio per gli operatori impulso. (3) Considerare i tre operatori autoaggiunti L1 , L2 , L3 che rappresentano le tre componenti dell’operatore momento angolare orbitale (vedi cap 9). Se L indica il vettore colonna contenente i tre operatori menzionati, vale: LS(R3 ) = XS(R3 ) ∧PS(R3 ) . 419 Dimostrare i seguenti fatti, dove i domini sono ristretti a S(R3 ): In riferimento all’esempio (1), e con SO(3) 3 Γ = (0, R), dimostrare che vale quanto segue. γΓ∗ (L) = UΓ−1 LUΓ = RL , (11.31) γP∗ (L) = P−1 LP = L , (11.32) γT∗ (L) = T −1 LT = −L . (11.33) SO(3) è il sottogruppo di O(3) contenente le matrici con determinante positivo (quindi pari a +1) ed il prodotto vettoriale è definito sopra con la regola del determinante formale in riferimento ad una base destrorsa. (4) Si consideri lo spazio di Hilbert HS del sistema S e si assuma che sia decomposto in settori coerenti, in modo che lo spazio degli stati puri fisicamente ammissibili sia decomposto come: [ Sp (HS )ammiss = Sp (HSk ) . k∈K Si definisca su Sp (HS ) la distanza d(ρ, ρ0 ) := ||ρ − ρ0 ||1 := tr(|ρ − ρ0 |), dove || ||1 è la norma naturale nello spazio degli operatori di classe traccia. Si provi che gli insiemi Sp (HSk ) sono le componenti connesse di Sp (HS )ammiss . Può essere utile sapere che,È come proveremo in seguito, 0 0 0 0 se ρ = ψ(ψ| ) e ρ = ψ (ψ | ) sono in Sp (HSk ), allora ||ρ − ρ ||1 = 2 1 − |(ψ|ψ 0 )|2 . Traccia di soluzione. Per la prima domanda si considerino due stati puri ρ, ρ0 ∈ Sp (HSk ) con ρ = ψ(ψ| ) e ρ0 = ψ 0 (ψ 0 | ) e ψ non parallelo a ψ 0 (altrimenti individuano lo stesso stato), si definisca ψt = tψ + (1 − t)ψ 0 ed infine la curva [0, 1] 3 t 7→ ||ψψtt||2 (ψt | ). Si provi che tale curva è continua ed è tutta contenuta in Sp (HSk ). Per la seconda domanda è sufficiente calcolare ||ρ − ρ0 ||1 quando ρ ∈ Sp (HSk ) e ρ0 ∈ Sp (HSk0 ) con k 6= k 0 . Notare che in tal caso i vettori che individuano ρ e ρ0 sono sempre perpendicolari e pertanto ρ − ρ0 è già la decomposizione in parte positiva e parte negativa di ρ − ρ0 e quindi |ρ − ρ0 | = ρ + ρ0 , per cui ||ρ − ρ0 ||1 = 2. Consideriamo allora un aperto Ak ⊃ Sp (HSk ), unione di palle aperte di raggio 1/2 centrate sugli elementi di Sp (HSk ), ed un aperto Ak0 ⊃ Sp (HSk0 ), unione di palle aperte di raggio 1/2 centrate sugli elementi di Sp (HSk0 ). I due aperti non possono intersecarsi a causa della disuguaglianza triangolare e quindi Sp (HSk ) e Sp (HSk0 ) sono sconnessi. (5) Si dimostri che la distanza d(ρ, ρ0 ) tra stati puri introdotta nell’esercizio 4 soddisfa: d ψ(ψ| ), ψ 0 (ψ| ) = ψ(ψ| ) − ψ 0 (ψ 0 | )B(H) per ogni coppia di vettori ψ, ψ 0 ∈ H con ||ψ|| = ||ψ 0 || = 1 e dove la norma || ||B(H) indica la norma operatoriale standard. (6) Sia U : H → H un operatore anti unitario sullo spazio di Hilbert H e sia A : D(A) → H un operatore autoaggiunto su H. Si dimostri che valgono i seguenti fatti: 420 (a) U −1 AU : U −1 (D(A)) → H è autoaggiunto, (b) σ(U −1 AU ) = σ(A), (A) (c) B(R) 3 E 7→ U −1 PE U è la misura spettrale associata a U −1 AU dal teorema spettrale, cioé Z Z −1 (A) U λdP (λ)U = λd(U −1 P (A) U )(λ) , R R itU −1 AU (d) U −1 eitA U = e . Suggerimenti. (a) e (b) seguono dalla definizione di operatore autoaggiunto. (c) si ottiene provando che per funzioni f : R → C limitate, direttamente dalla definizione di integrale di funR R −1 (A) zioni limitate rispetto a una PVM (cap 8), vale U (x)U = R fR (x)d(U −1 P (A) U )(x); R f (x)dP quindi osservando che per ogni operatore autoaggiunto vale T = s-limn→+∞ R χ[−n,n] (x)dP (T ) (x). (d) si ottiene da (d) oppure, direttamente, sviluppando in serie l’esponenziale sull’insieme denso (A) di vettori analitici di U −1 AU della forma ψ ∈ U −1 P[−n,n] (H) con n ∈ N. 11.2 Introduzione ai gruppi di simmetria. In questa sezione introdurremo alcuni argomenti elementari della teoria delle rappresentazioni proiettive applicata ai gruppi di simmetria quantistica. Vista la vastità e l’importanza dell’argomento, rimandiamo all’esaustivo trattato [BaRa86] per approfondimenti. 11.2.1 Rappresentazioni proiettive, unitarie proiettive, estensioni centrali. Consideriamo la situazione in cui esista un gruppo G (con prodotto gruppale indicato con · ed elemento neutro e) che possa essere interpretato come gruppo di trasformazioni che possano agire su un sistema fisico S, descritto nello spazio di Hilbert HS . Per semplicità supponiamo che HS non ammetta settori coerenti (quindi HS stesso è l’unico settore). Supponiamo infine che, a ciascuna di queste trasformazioni g ∈ G, sia associata una simmetria γg , che quindi possiamo pensare come automorfismo di Kadison (o di Wigner). Abbiamo incontrato questa situazione in (1) in esempi 11.1. In tal caso G era il gruppo delle isometrie dello spazio di quiete tridimensionale di un riferimento inerziale e S era la particella senza carica e senza spin. Gli automorfismi di Kadison da S(HS ) in S(HS ) formano naturalmente un gruppo rispetto alla composizione di applicazioni. Arriviamo naturalmente in questo modo all’idea che esista una rappresentazione di G in termini di automorfismi di Kadison che rappresentino l’azione del gruppo di trasformazioni G sugli stati quantistici del sistema S. In altre parole, possiamo supporre che l’applicazione G 3 g 7→ γg sia un omomorfismo gruppale, cioè conservi la struttura di gruppo: γg·g0 = γg ◦ γg0 , γe = id , γg−1 = γg−1 per ogni g, g 0 ∈ G, dove abbiamo indicato con id l’automorfismo identità . In realtà non è necessario imporre la terza condizione, dato che essa segue dalle precedenti due in virtù dell’unicità dell’elemento inverso in un gruppo. Ci si aspetta anche che, come accade nella maggior parte dei casi concreti in fisica, la rappresentazione G 3 g 7→ γg sia fedele, cioè che l’omomorfismo gruppale G 3 g 7→ γg 421 sia iniettivo. La situazione descritta è molto frequente in fisica. Definizione 11.4. Si consideri un sistema quantistico S descritto sullo spazio di Hilbert HS . Sia G un gruppo che ammette un omomorfismo gruppale iniettivo (cioè una rappresentazione fedele) G 3 g 7→ γg , in termini di automorfismi di Wigner γg ∈ Sp (HS ) → Sp (HS ). In tal caso diremo che G è un gruppo di simmetria di S e G 3 g 7→ γg è la sua rappresentazione proiettiva su Sp (HS ). Osservazioni. (1) Nella definizione ci siamo riferiti solo a simmetrie di Wigner, questo non è riduttivo dato che, per il teorema di Kadison (nella formulazione che abbiamo dato noi), ogni automorfismo di Wigner γg si estende, in modo unico, ad un automorfismo di Kadison γg0 : S(HS ) → S(HS ). Si prova immediatamente che G 3 g 7→ γg0 è un omomorfismo gruppale iniettivo, cioè una rappresentazione fedele di G in termini di automorfismi di Kadison. Viceversa, ogni rappresentazione fedele di G in termini di automorfismi di Kadison individua univocamente una rappresentazione fedele di G in termini di automorfismi di Wigner, restringendo ogni automorfismo di Kadison a Sp (HS ). Nel seguito, anche se scriveremo prevalentemente simmetria di Wigner, penseremo indifferentemente la rappresentazione G 3 g 7→ γg come costituita da automorfismi di Wigner o di Kadison a seconda di quello che è conveniente. (2) Il termine rappresentazione proiettiva, è appropriato perché Sp (Hs ) è uno spazio proiettivo come menzionato nel capitolo 7 e l’applicazione γg Sp (HS ) : Sp (HS ) → Sp (HS ) è ben definita. (3) Dato che l’omomorfismo G 3 g 7→ γg è esplicitamente supposto essere iniettivo, possiamo equivalentemente considerare come gruppo di simmetria, o più precisamente il gruppo di simmetrie, l’insieme degli automorfismi γg , con g ∈ G, dotato della struttura naturale di gruppo rispetto alla legge di composizione dei funzioni. Tale gruppo è infatti isomorfo a G per costruzione. Una questione interessante è la seguente. Supponiamo ancora di avere un gruppo di simmetria, con rappresentazione proiettiva G 3 g 7→ γg . L’applicazione G 7→ γg è certamente una rappresentazione, ma non è una rappresentazione lineare, dato che le funzioni γg : Sp (HS ) → Sp (HS ) non sono funzioni lineari. Notando però che ad ogni automorfismo γg corrisponde un operatore unitario (lineare) o antiunitario Ug : HS → HS , che soddisfa γg (ρ) = Ug ρUg−1 per ogni ρ ∈ Sp (HS ), sorge spontanea la questione se possa accadere che l’applicazione G 3 g 7→ Ug sia una rappresentazione (anti)lineare di G cioè in termini di operatori (anti)lineari (unitari e/o antiunitari) di B(H). In altre parole ci chiediamo se sia possibile che l’applicazione G 3 g 7→ Ug sia un omomorfismo gruppale, cioè conservi la struttura di gruppo: Ug·g0 = Ug Ug0 , Ue = I , Ug−1 = Ug−1 per ogni g, g 0 ∈ G, (11.34) dove I : HS → HS è l’operatore identità . La questione è importante anche dal punto di vista tecnico, in quanto esistono moltissimi risultati della teoria delle rappresentazioni lineari dei gruppi 422 su spazi vettoriali (di Hilbert), che possono essere usati nello studio dei gruppi di simmetria dei sistemi quantistici. La risposta, in generale è negativa, dato che la condizione Ug·g0 = Ug Ug0 non è in generale verificata. Infatti, dato che γg ◦ γg0 = γgg0 , deve essere: −1 Ug Ug0 ρ(Ug Ug0 )−1 = Ug·g0 ρUg·g 0 per ogni ρ ∈ S(HS ). Conseguentemente: (Ug·g0 )−1 Ug Ug0 ρ(Ug Ug0 )−1 Ug·g0 = ρ per ogni ρ ∈ Sp (HS ). Questi significa che, se ρ = ψ(ψ| ), allora (Ug·g0 )−1 Ug Ug0 ψ e ψ devono differire al più per una fase. Tale fase non può dipendere da ψ (la dimostrazione è la stessa che abbiamo fatto nell’enunciato relativo all’unicità nel teorema di Wigner), tuttavia tale fase può dipendere da g e g 0 . Deve essere chiaro che è impossibile ottenere un risultato più preciso, proprio perchè gli stessi operatori U sono definiti a meno di una fase. In definitiva, se gli Ug sono gli operatori (unitari o antiunitari) associati ad una rappresentazione proiettiva di un certo gruppo di simmetria, la condizione Ug·g0 = Ug Ug0 , nel caso generale si indebolisce in: Ug Ug0 = ω(g, g 0 )Ug·g0 per ogni g, g 0 ∈ G, dove ω(g, g 0 ) ∈ C con |ω(g, g 0 )| = 1 sono numeri complessi che dipendono dalla scelta che abbiamo fatto nell’associare gli operatori Ug agli automorfismo γg in rispetto della libertà permessa dai teoremi di Wigner e Kadison. Quindi se U (1) indica il gruppo dei numeri complessi di modulo unitario, deve accadere che ω(g, g 0 ) ∈ U (1). Non è affatto ovvio che sia possibile riassegnare le fasi degli operatori Ug , in modo tale che risulti ω(g, g 0 ) = 1 per ogni g, g 0 ∈ G. Nota. D’ora in poi ci restringeremo a lavorare con operatori esplicitamente unitari tralasciando il caso antiunitario. Daremo qualche motivazione alla fine di questa sezione. Le funzioni G × G 3 (g, g 0 ) 7→ ω(g, g 0 ) ∈ U (1) non sono completamente arbitrarie, dato che deve valere la proprietà associativa: (Ug Ug0 )Ug00 = Ug (Ug0 Ug00 ) . Il calcolo prova immediatamente che la proprietà associativa è valida se e solo se è soddisfatta l’identità : ω(g, g 0 )ω(g · g 0 , g 00 ) = ω(g, g 0 · g 00 )ω(g 0 , g 00 ) (11.35) Da questa identità seguono immediatamente le importanti proprietà (dove e è l’elemento neutro di G): ω(g, e) = ω(e, g) , ω(g, e) = ω(g1 , e) , ω(g, g −1 ) = ω(g −1 , g) , 423 per ogni g, g1 ∈ G. (11.36) Possiamo dare la seguente definizione che prescinde dal significato fisico degli oggetti matematici coinvolti. Definizione 11.5. Se G è un gruppo e H uno spazio di Hilbert (complesso), una rappresentazione unitaria proiettiva di G su H è applicazione: G 3 g 7→ Ug ∈ B(H) , (11.37) in cui Ug sono operatori unitari e, definiti i moltiplicatori della rappresentazione: −1 ω(g, g 0 ) := Ug·g 0 Ug Ug 0 per ogni g, g 0 ∈ G, (11.38) risulti ω(g, g 0 ) ∈ U (1) (e di conseguenza vale la (11.35)) per ogni g, g 0 ∈ G. La rappresentazione proiettiva su Sp (H) individuata da (con ovvie notazioni): G 3 g 7→ Ug · Ug∗ si dice essere indotta dalla rappresentazione unitaria proiettiva (11.37). La rappresentazione unitaria proiettiva (11.37) è detta rappresentazione (propriamente) unitaria di G su H se tutti i suoi moltiplicatori sono 1. La rappresentazione unitaria proiettiva (11.37) è detta irriducibilerappresentazione unitaria proiettiva irriducibile, se non esiste alcun sottospazio chiuso H0 ⊂ H diverso da H e da {0} tale che Ug (H0 ) ⊂ H0 per ogni g ∈ G. Due rappresentazioni unitarie proiettive G 3 g 7→ Ug ∈ B(H) e G 3 g 7→ Ug0 ∈ B(H0 ), con H e H0 spazi di Hilbert (eventualmente coincidenti), si dicono equivalentirappresentazioni unitarie proiettive equivalenti se esiste un operatore unitario S : H → H0 ed una funzione χ : G 3 g 7→ χ(g) ∈ U (1) tali che: χ(g)SUg S −1 = Ug0 per ogni g ∈ G. (11.39) Nota. Il lettore deve avere ben chiara la differenza tra rappresentazioni proiettive e rappresentazioni unitarie proiettive e rappresentazioni unitarie. Le prime agiscono su Sp (HS ) o S(HS ) rappresentando gruppi di simmetria e non contengono scelte arbitrarie senza significato fisico. Quelle di secondo e terzo tipo agiscono su HS , inducono rappresentazioni proiettive, ma sono affette da scelte arbitrarie nella definizione delle fasi degli operatori unitari che le costituiscono. Osservazioni. (1) La nozione data di rappresentazioni unitarie proiettive equivalenti è : transitiva, simmetrica e riflessiva. Pertanto individua una relazione di equivalenza tra le rappresentazioni unitarie proiettive di un fissato gruppo su un fissato spazio di Hilbert. Se G è un gruppo di simmetria per il sistema fisico S, descritto sullo spazio di Hilbert HS , le rappresentazioni proiettive di G su Sp (HS ) sono evidentemente in corrispondenza biunivoca con le classi di equivalenza di rappresentazioni unitarie proiettive di G. (2) La proprietà che una data rappresentazione unitaria proiettiva G 3 g 7→ Ug sia equivalente 424 ad una rappresentazione unitaria, è in realtà una proprietà riguardante classe di equivalenza di tale rappresentazione unitaria proiettiva: corrisponde al fatto che la classe di equivalenza contenga una rappresentazione unitaria. Nel caso in cui ci riferiamo ad un gruppo di simmetrie di un sistema quantistico, è dunque una proprietà della rappresentazione proiettiva su S(HS ) alla quale corrisponde tale classe di equivalenza. (3) La proprietà che una data rappresentazione unitaria proiettiva G 3 g 7→ Ug sia irriducibile è in realtà una proprietà riguardante tutti gli elementi della classe di equivalenza di tale rappresentazione unitaria proiettiva: se un elemento è irriducibile, allora lo sono tutti gli altri, come si verifica immediatamente dalle definizioni date. L’importanza delle rappresentazioni irriducibili è dovuta al fatto che con tali rappresentazioni si costruiscono tutte le rimanenti rappresentazioni come somma diretta o come integrale diretto di rappresentazioni irriducibili [BaRa86]. La questione se un data rappresentazione proiettiva G 3 g 7→ γg di un gruppo di simmetria G ammetta una descrizione, sullo spazio HS , in termini di una rappresentazione unitaria di g può porsi come segue, in termini concreti. Nella classe di equivalenza di rappresentazioni proiettive unitarie associate a G 3 g 7→ γg , se ne fissa una arbitrariamente (quanto segue non dipende dal particolare elemento della classe di equivalenza per l’osservazione (2) di sopra) e si considerano i suoi moltiplicatori. La questione si riduce ora allo stabilire se esista o meno una funzione χ : G 3 g 7→ χ(g) ∈ C con |χ(g)| = 1 che verifichi la condizione: ω(g, g 0 ) = χ(g · g 0 ) χ(g)χ(g 0 ) per ogni g, g 0 ∈ G . (11.40) Infatti se la suddetta funzione χ esiste, inserendo essa a primo membro in (11.39), i moltiplicatori di G 3 g 7→ Ug0 risultano essere banali per le identità (11.40). Se, viceversa i moltiplicatori di G 3 g 7→ Ug0 sono banali, la funzione χ, che appare a primo membro in (11.39), soddisfa la (11.40). Esistono vari approcci per affrontare e risolvere il problema dell’esistenza di χ suddetta [BaRa86], e si vede che ci sono gruppi, in particolare i gruppi di Lorentz e Poincaré , le cui rappresentazioni proiettive sono descrivibili da rappresentazioni unitarie sullo spazio di Hilbert associato al sistema fisico. Altri, come il gruppo di Galileo, le cui rappresentazioni proiettive (non banali) non ammettono descrizioni in termini di rappresentazioni unitarie, ma solo unitarie proiettive e non si possono sopprimere i moltiplicatori. Esiste una vasta letteratura in proposito e le rappresentazioni unitarie proiettive irriducibili dei gruppi di interesse fisico (specialmente gruppi di Lie) sono state studiate e catalogate. Come ultima osservazione vogliamo precisare che se, per un certo gruppo di simmetria G, esistono rappresentazioni unitarie proiettive differenti associate a classi di equivalenza disgiunte, allora si possono avere conseguenti regole di superselezione come spiegato nell’esempio 11.3 sotto. Torniamo ora ad esaminare la questione dell’unitarietà o antiunitarietà degli operatori Ug . Supponiamo di avere un gruppo di simmetria, con rappresentazione proiettiva G 3 g 7→ γg . Ad ogni automorfismo γg corrisponde un operatore unitario oppure antiunitario, Ug : HS → HS , 425 che soddisfa γg (ρ) = Ug ρUg−1 per ogni ρ ∈ Sp (HS ), in base al teorema di Wigner. Ci sono criteri per decidere se gli operatori Ug sono tutti unitari, tutti anti unitari oppure di tipo differente a seconda del particolare g ∈ G? Se Ug e Ug0 fossero entrambi antiunitari, il vincolo Ug Ug0 = χ(g, g 0 )Ug·g0 imporrebbe che Ug·g0 sia, al contrario, unitario. Di conseguenza rappresentazioni con più di due elementi costituite da soli operatori antiunitari (a parte l’identità che è sempre unitaria) non possono esistere e la situazione in cui appaiono alcuni (più di uno) operatori antiunitari è comunque non banale per l’esistenza di vincoli come quello trovato. Sussiste la seguente elementare proposizione a riguardo, che mostra che la natura stessa di G può imporre che gli operatori siano tutti unitari. Proposizione 11.5. Sia H uno spazio di Hilbert complesso e G un gruppo. Si supponga che ogni g ∈ G sia il prodotto di elementi g1 , g2 , . . . , gn ∈ G (dipendenti da g) che ammettono una radice quadrata (cioè esiste rk ∈ G tale che gk = rk · rk per ogni k = 1, . . . , n). Allora per ogni rappresentazione proiettiva G 3 g 7→ γg gli elementi γg possono essere associati solo ad operatori unitari in base al teorema di Wigner (o Kadison). Prova. La prova è ovvia, essendo Urk Urk lineare anche quando Urk è antilineare e valendo Ugk = χ(rk , rk )Urk Urk , segue che Ugk deve essere lineare ed, infine, anche Ug deve essere lineare. 2 Abbiamo il seguente importante caso per le applicazioni, specialmente per n = 1. Proposizione 11.6. In riferimento alla proposizione 11.5, le rappresentazioni proiettive del gruppo additivo G = Rn possono solo essere associate ad operatori unitari. Prova. Se t ∈ Rn allora t = t/2 + t/2. La tesi allora segue dalla proposizione 11.5. 2. Come vedremo più avanti, l’ipotesi della proposizione 11.5 è automaticamente soddisfatta nel momento in cui si assume che G sia un gruppo di Lie connesso, e la presenza di operatori antiunitari si ha solo in presenza di gruppi discreti o discontinuità (cambiando componente connessa del gruppo di Lie). Pertanto nel seguito ci riferiremo al caso in cui tutti gli operatori Ug siano sempre unitari. Esiste un approccio [BaRa86] che permette di studiare tutte le possibili rappresentazioni proiettive unitarie di un gruppo, vedendole come restrizioni di rappresentazioni unitarie di un gruppo più grande detto estensione centrale del gruppo iniziale. Questa procedura, apparentemente macchinosa, risulta invece tecnicamente utile (anche per determinare l’esistenza di eventuali rappresentazioni unitarie del gruppo iniziale G) perché permette di utilizzare tecniche proprie della teoria delle rappresentazioni unitarie (dell’estensione centrale), che è molto più semplice di quella delle rappresentazioni proiettive. Spieghiamo brevemente l’idea fondamentale di questa procedura. Bisogna precisare che essa è davvero utile nel caso in cui G sia un gruppo di Lie (semplicemente connesso) come vedremo più avanti; tuttavia questa caratterizzazione non entra 426 in gioco nell’idea fondamentale che stiamo per spiegare, in cui la sola struttura algebrica di gruppo è sufficiente. Se G è un gruppo arbitrario, e G 3 g 7→ Ug è una rappresentazione proiettiva sullo spazio di b ω che ha come elementi le coppie Hilbert H con moltiplicatori ω, definiamo il nuovo gruppo G b (χ, g) ∈ U (1) × G e definiamo il prodotto gruppale in Gω come: (χ, g) ◦ (χ0 , g) = χχ0 ω(g, g 0 ) , g · g 0 per ogni (χ, g), (χ0 , g 0 ) ∈ U (1) × G. Lasciamo al lettore la verifica che la definizione data sia ben posta, come sola conseguenza del fatto che la funzione ω soddisfi (11.35), e che individui effettivamente una struttura di gruppo con elemento neutro (χ(e, e)−1 , e), essendo e l’elemento neutro di G (si tenga conto delle (11.36)). Possiamo dare la seguente definizione che prescinde da come abbiamo ottenuto la funzione ω, purché essa soddisfi (11.35). Definizione 11.6. si consideri un gruppo G ed una funzione ω : G × G → U (1) che soddisfa b ω costruito sull’insieme U (1) × G con prodotto gruppale (11.35). Il gruppo G (χ, g) ◦ (χ0 , g) = χχ0 ω(g, g 0 ) , g · g 0 per ogni (χ, g), (χ0 , g 0 ) ∈ U (1) × G, lo diremo estensione centrale del gruppo G tramite U (1) con funzione dei moltiplicatori ω. b ω e l’omomorfismo surgettivo G b ω 3 (χ, g) 7→ g ∈ L’omomorfismo iniettivo U (1) 3 χ 7→ (χ, e) ∈ G G sono detti, rispettivamente, l’iniezione canonica e la proiezione canonica dell’estensione centrale. A giustificazione della terminologia (vedi Appendice A), notiamo che la proiezione canonica b ω 3 (χ, g) 7→ g ∈ G è un omomorfismo surgettivo, il cui nucleo è dato dal sottogruppo normale G N (immagine dell’iniezione canonica e isomorfo a U (1)) di elementi (χ, e) con χ ∈ U (1). N b dato che i suoi elementi commutano con tutti gli elementi di è incluso nel centro del gruppo G, b Gω (visto che ω(e, g) = ω(g, e)). In pratica, il gruppo G è stato esteso fino ad ottenere il gruppo b ω , la cui parte che differisce da G (il nucleo dell’applicazione surgettiva G b ω 3 (χ, g) 7→ g ∈ G) G è nel centro dell’estensione. Si osservi anche che G si identifica naturalmente con il gruppo b ω /N. quoziente G Ci sono ora tre importanti osservazioni che portano ad individuare una procedura per ottenere tutte le rappresentazioni unitarie proiettive di G. (1) Il primo punto importante è che, ora, l’applicazione: b ω 3 (χ, g) 7→ V G (χ,g) := χUg , b ω su H, infatti, gli operatori V è sempre una vera rappresentazione unitaria di G (χ,g) : H → H sono tutti unitari, risulta subito che V(1,e) = I ed infine: V(χ,g) V(χ0 ,g0 ) = χUg χ0 Ug0 = χχ0 ω(g, g 0 )Ug·g0 = V(χ,g)◦(χ0 ,g0 ) . (2) Il secondo punto importante è che la rappresentazione unitaria proiettiva di partenza, si b ω 3 (χ, g) 7→ V ottiene dalla rappresentazione unitaria G (χ,g) per restrizione: restringendo cioè il 427 dominio di V all’insieme di elementi (1, g) con g ∈ G cioè , con un piccolo abuso di linguaggio, restringendo la rappresentazione unitaria V a G . (3) Il terzo punto importante è che, data una qualsiasi rappresentazione unitaria b ω 3 (χ, g) 7→ V G (χ,g) di un’estensione centrale che soddisfi la condizione (notare che Ue = χ(e, e)I nelle rappresentazioni unitarie proiettive): V(χ,e) = χω(e, e)I per ogni χ ∈ U (1), (11.41) la sua restrizione all’insieme di elementi (1, g) con g ∈ G produce sempre una rappresentazione unitaria proiettiva. Concludiamo che vale la seguente proposizione. Proposizione 11.7. Ogni rappresentazione unitaria proiettiva di un gruppo G si ottiene restringendo a G una opportuna rappresentazione unitaria di una opportuna estensione centrale b ω la cui funzione dei moltiplicatori soddisfa (11.41). G In definitiva, considerando prima tutte le possibili estensioni centrali di G, ottenute tramite tutte le funzioni dei moltiplicatori G × G 3 (g, g 0 ) 7→ ω(g, g 0 ) ∈ U (1) (che soddisfino (11.35)), e poi studiando tutte le possibili rappresentazioni unitarie di tali estensioni che soddisfino (11.41), si ottengono anche, per restrizione a G, tutte le rappresentazioni unitarie proiettive di G. Questa procedura in certi casi, in particolare considerando gruppi G che abbiano struttura di gruppi di Lie, è estremamente potente e, applicando metodi di coomologia gruppale consente di catalogare le rappresentazioni unitarie proiettive continue in un certa topologia (e le eventuali rappresentazioni unitarie) di un gruppo di Lie semplicemente connesso, partendo dalla sola conoscenza dell’algebra di Lie di G [BaRa86]. Torneremo su ciò più avanti. Nella procedura proposta sopra per ottenere tutte le rappresentazioni unitarie proiettive di Gω b ω , non è necessario conoscere restringendo le rappresentazioni unitarie delle estensioni centrali G tutte le estensioni centrali di G. In effetti, è sufficiente conoscere le estensioni centrali i cui moltiplicatori non sono equivalenti nel senso che segue. Date due funzioni dei moltiplicatori sullo stesso gruppo, G × G 3 (g, g 0 ) 7→ ω(g, g 0 ) ∈ U (1) e G × G 3 (g, g 0 ) 7→ ω 0 (g, g 0 ) ∈ U (1), diremo che esse sono equivalenti, se esiste una funzione χ : G → U (1) tale che: ω(g, g 0 ) = χ(g · g 0 ) 0 ω (g, g 0 ) χ(g)χ(g 0 ) per ogni g, g 0 ∈ G. Se due rappresentazioni unitarie proiettive U e U 0 di G sono equivalenti, allora si possono cobω e G b 0 che hanno struire restringendo a G due rappresentazioni unitarie di estensioni centrali G ω 0 funzioni dei moltiplicatori ω e ω equivalenti. Quindi, se conosciamo tutte le estensioni centrali di G i cui moltiplicatori non sono equivalenti e le rappresentazioni unitarie di esse, conosciamo 428 tutte le classi di equivalenza di rappresentazioni unitarie proiettive di G e di conseguenza tutte le rappresentazioni unitarie proiettive di G. Si noti ancora che, se ω(e, e) 6= 1 per una certa scelta della funzione ω, attraverso una trasformazione di equivalenza con una funzione χ costante, possiamo sempre ridurci ad avere soddisfatta la condizione χ(e, e) = 1. In questo caso, l’estensione centrale ha come elemento neutro (1, e) e la condizione (11.41) si riduce a: V(χ,e) = χI per ogni χ ∈ U (1) . (11.42) Di conseguenza, senza perdere generalità , possiamo sempre lavorare con rappresentazioni unitarie proiettive (che si ottengono restringendo a G le rappresentazioni unitarie dell’estensione centrale) che soddisfano Ue (:= V(1,e) ) = I. Moltiplicatori tali che ω(e, e) = 1 (e quindi ω(e, g) = ω(g, e) = ω(e, e) = 1) vengono detti normalizzati. b nel caso in cui non Per concludere, facciamo qualche considerazione fisica sul significato di G, esistano rappresentazioni unitarie di G, ma solo rappresentazioni unitarie proiettive. Supponiamo quindi di avere un gruppo di simmetria G 3 g 7→ γg per il sistema fisico S, e quindi una sua rappresentazione proiettiva su S(HS ), che non sia descrivibile tramite una rappresentazione unitaria. Possiamo comunque fare una scelta delle fasi arbitrarie ed estendere il gruppo da G b ω usando i moltiplicatori trovati e pensare G b ω come il vero gruppo di simmetria di S. Tale aG gruppo esteso ammette dunque due rappresentazioni: una data dal gruppo G stesso: b ω 3 (χ, g) 7→ g ∈ G , G che rappresenta l’azione classica del gruppo. L’altra quantistica ed unitaria: b ω 3 (χ, g) 7→ χUg , G che rappresenta l’azione del gruppo sugli stati del sistema (in realtà sui vettori dello spazio di Hilbert del sistema e, di conseguenza, sugli stati). b ω è a volte detto il gruppo quantistico associato a quello classico G. In quest’ottica, il gruppo G b ω non può essere fatta con Si osservi che tuttavia la scelta di una precisa estensione centrale G la costruzione che abbiamo presentato fino ad ora, in cui solo le rappresentazioni proiettive in termini di automorfismi di Wigner o di Kadison hanno un significato fisico. Per poter scegliere tra le varie estensioni centrali è necessario dare un significato fisico alle singole rappresentazioni unitarie proiettive di G oppure alle singole rappresentazioni unitarie delle possibili estensioni b Questo può essere fatto arricchendo la struttura di G fino a farlo diventare un gruppo centrali G. di Lie, come vedremo più avanti. Nel caso delle rappresentazioni unitarie proiettive del gruppo di Galileo, i moltiplicatori hanno un diretto significato fisico perché sono legati alla massa del sistema fisico come chiariremo meglio più avanti, dopo avere introdotto i gruppi di Lie come gruppi di simmetria. 429 11.2.2 Gruppi di simmetria topologici. Ci occupiamo ora di introdurre la nozione di gruppo di simmetria topologico, dando alcuni semplici risultati generali per lo più dovuti a Wigner. Studieremo in particolare il caso del gruppo topologico additivo R che riveste un particolare significato fisico oltre ad essere tecnicamente importante. La maggior parte dei gruppi di simmetria quantistici, escluse in particolare le simmetrie discrete (inversione di parità ed inversione del tempo) sono date da gruppi di Lie, di cui diremo nel prossimo paragrafo. I gruppi di Lie sono un sottocaso dei gruppi topologici. Un gruppo topologico, per definizione, è un gruppo G che è anche spazio topologico e le cui operazioni di composizione, G×G 3 (f, g) 7→ f ·g ∈ G, e di calcolo dell’inverso G 3 g 7→ g −1 , sono funzioni continue rispetto alla topologia prodotto di G ed alla topologia di G, rispettivamente. La teoria dei gruppi topologici e delle loro rappresentazioni è un capitolo molto vasto della matematica [NaSt84], noi ci limiteremo a presentare alcuni risultati elementarissimi e strettamente legati ai nostri modelli fisici. Esempi 11.3. (1) Il gruppo GL(n, R), ovvero GL(n, C), delle matrici n×n non singolari reali, rispettivamente, complesse, è (evidentemente) un gruppo topologico, quando lo si pensa dotato della topologia 2 2 indotta da Rn , rispettivamente Cn . (2) Sono quindi gruppi topologici tutti i sottogruppi di GL(n, R) e GL(n, C) che si incontrano in fisica, come il gruppo unitario U (n) = {U ∈ GL(n, C) | U U ∗ = I}, il gruppo unitario speciale SU (n) := {U ∈ SU (n) | detU = 1}7 , il gruppo ortogonale O(n) := {R ∈ GL(n, R) | RRt = I} ed il suo sottogruppo speciale SO(n) := {R ∈ O(n) | detR = 1}, il sottogruppo lineare speciale SL(n, R) := SGL(n, R) := {A ∈ GL(n) | detA = 1}, i gruppi simplettici Sp(n, R) ecc... (3) Vi sono gruppi topologici che, apparentemente, non sono gruppi matriciali, come il gruppo additivo R. In realtà anche tale gruppo topologico, come il gruppo additivo Rn (delle traslazioni di Rn ) o il gruppo IO(n) delle isometrie proprie di Rn , si possono realizzare come gruppi matriciali. Nel caso di Rn , la sua realizzazione matriciale è data dal gruppo – sottogruppo di 2 GL(n + 1, R) e dotato della topologia indotta da R(n+1) – delle matrici reali (n + 1) × (n + 1) della forma: 1 0t M (t) := per ogni t ∈ Rn . (11.43) t I Sopra I indica la matrice identità n × n. La funzione R 3 t 7→ M (t) è un isomorfismo gruppale, ma anche un omeomorfismo, dotando il gruppo di matrici suddette della topologia indotta da 2 R(n+1) . (4) Il gruppo di Galileo e quello di Poincaré , oltre che quello di Lorentz, sono gruppi topologici, che si possono costruire come gruppi matriciali. Esistono comunque gruppi topologici (che sono 7 Ricordiamo che speciale, nella teoria dei gruppi matriciali, significa con determinante 1 e si indica con la lettera S davanti al (o all’interno del) nome del gruppo di cui il gruppo speciale è sottogruppo. 430 comunque gruppi di Lie), che non ammettono nessuna realizzazione matriciale, come il rivestimento universale del gruppo conforme (matriciale) SL(2, R). Vogliamo ora specializzare la nozione di gruppo di simmetria al caso in cui il gruppo sia topologico, imponendo requisiti topologici anche sulla rappresentazione proiettiva associata. Supponiamo dunque di avere una gruppo di simmetria quantistico G 3 g 7→ γg per il sistema fisico S descritto sullo spazio di Hilbert HS . Se G è un gruppo topologico, ci aspettiamo che l’omomorfismo gruppale g 7→ γg sia continuo in qualche senso. Dobbiamo in particolare scegliere una topologia per lo spazio delle funzioni γg , che possiamo pensare, indifferentemente come automorfismi di Kadison oppure di Wigner. Nel seguito adotteremo il punto di vista di Wigner. Diamo la nostra definizione che poi giustificheremo sia matematicamente che fisicamente. Definizione 11.7. Si consideri un sistema fisico quantistico S descritto sullo spazio di Hilbert HS . Sia G un gruppo topologico che ammette una rappresentazione proiettiva su H, G 3 g 7→ γg che soddisfa: lim tr (ρ1 γg (ρ2 )) = tr (ρ1 γg0 (ρ2 )) g→g0 per ogni g0 ∈ G e ogni ρ1 , ρ2 ∈ Sp (HS ). In tal caso G è detto gruppo topologico di simmetria per S e G 3 g 7→ γg , è detta rappresentazione proiettiva continua su Sp (HS ). Dal punto di vista fisico, la definizione è ragionevole e afferma che le probabilità di transizione tra due stati puri, di cui uno trasformato dall’azione del gruppo di simmetria, sono funzioni continue sotto l’azione del gruppo. Nell’ottica dell’analisi di Wigner della nozione di simmetria quantistica, questa definizione di continuità è accettabile. Tuttavia la definizione data ha anche una sua naturalezza in termini matematici come andiamo a dimostrare. Nel seguito B1 (HS )R è spazio vettoriale reale degli operatori autoaggiunti di classe traccia dotato della norma || ||1 degli operatori di classe traccia. Come sappiamo, dalla proposizione 11.4, ogni automorfismo di Wigner γg è individuato restringendo, sullo spazio Sp (HS ), un unico operatore lineare (γ2 )g : B1 (HS )R → B1 (HS )R continuo nella norma naturale di tale spazio || ||1 . Consideriamo allora l’applicazione Γ : G 3 g 7→ (γ2 )g . Usando la topologia operatoriale forte in B1 (HS )R e quella di G nel dominio, possiamo dire che Γ è continua quando, per ogni ρ ∈ B1 (HS ) e g0 ∈ G vale: lim ||(γ2 )g (ρ) − (γ2 )g0 (ρ)||1 = 0 . g→g0 Restringendoci a lavorare su Sp (HS ) e tornando a alla nostra rappresentazione iniziale G 3 g 7→ γg in termini di automorfismi di Wigner, diremo che G 3 g 7→ γg è continua, se per ogni ρ ∈ Sp (HS ) e g0 ∈ G vale: lim ||γg (ρ) − γg0 (ρ)||1 = 0 . g→g0 Apparentemente, questa nozione di continuità è differente da quella usata nella definizione 11.7. In realtà è esattamente la stessa, come ora proveremo. Vale a tal fine il seguente semplice risultato. Nella prossima proposizione l’ultima affermazione è interessante perché Sp (H) non è uno 431 spazio normato, non essendo uno spazio vettoriale. Tuttavia risulta essere uno spazio metrico e la funzione distanza ha un significato fisico, essendo legata all’ampiezza di probabilità . Proposizione 11.8. Sia H spazio di Hilbert complesso. Se ||ρ||1 = tr(|ρ|) indica norma dello spazio S(HS ) degli operatori di classe traccia, allora, riducendosi a lavorare con stati puri, vale: È ||ρ − ρ0 ||1 = 2 1 − (tr(ρρ0 ))2 se ρ, ρ0 ∈ Sp (H). (11.44) Equivalentemente: È ||ψ(ψ| ) − ψ 0 (ψ 0 | )||1 = 2 1 − |(ψ|ψ 0 )|2 se ψ, ψ 0 ∈ H e ||ψ|| = ||ψ 0 || = 1. (11.45) Pertanto Sp (H) è uno spazio metrico se dotato della funzione distanza: È d(ρ, ρ0 ) := 2 1 − (tr(ρρ0 ))2 per ogni ρ, ρ0 ∈ Sp (H). Prova. Possiamo dimostrare la seconda affermazione dato che la prima è , banalmente, una trascrizione della seconda e la terza è ovvia, se valgono le prime due, dalle proprietà generali delle norme. Per dimostrare la seconda è sufficiente costruire una base ortonormale ψ1 , ψ2 dello spazio generato da ψ e ψ 0 , assumendo ψ1 = ψ e decomponendo ψ 0 sulla stessa base. Si vede allora che, se b := (ψ 0 |ψ2 ), vale: ψ(ψ| ) − ψ 0 (ψ 0 | ) = −|b|ψ1 (ψ1 | ) + |b|ψ2 (ψ2 | ) . Dato che quella ottenuta è la decomposizione spettrale di ρ − ρ0 , deve essere: |ρ0 − ρ| = |b|ψ1 (ψ1 | ) + |b|ψ2 (ψ2 | ) = |b|I , e quindi, dato che 1 = ||ψ 0 ||2 = |(ψ 0 |ψ1 )|2 + |(ψ 0 |ψ2 )|2 , vale: È È ||ψ(ψ| ) − ψ 0 (ψ 0 | )||1 = tr(|b|I) = 2|b| = 2 1 − |(ψ 0 |ψ1 )|2 = 2 1 − |(ψ 0 |ψ)|2 . Questo completa la dimostrazione. 2 Possiamo allora concludere che vale il seguente risultato che riappacifica fisica e matematica. Proposizione 11.9. Si consideri un sistema fisico quantistico S descritto sullo spazio di Hilbert HS . Sia G un gruppo topologico. Una rappresentazione proiettiva su H, G 3 g 7→ γg è continua nel senso della definizione 11.7, e quindi G è un gruppo di simmetria topologico per S, se e solo se è continua adottando: (i) la topologia di G nel dominio, 432 (ii) la topologia operatoriale forte, ristretta a Sp (HS ), nel codominio, cioè : lim ||γg (ρ) − γg0 (ρ)||1 = 0 per ogni ρ ∈ Sp (HS ) e g0 ∈ G. g→g0 (11.46) Prova. La (11.44) implica che: È ||γg (ρ) − γg0 (ρ)||1 = 2 1 − tr (γg (ρ)γg0 (ρ)) . Se G 3 g 7→ γg è continua nel senso della definizione 11.7 allora limg→g0 tr (γg (ρ)γg0 (ρ)) = tr (γg0 (ρ)γg0 (ρ)) = 1. Sostituendo nell’identità di sopra si ha che vale (11.46): lim ||γg (ρ) − γg0 (ρ)||1 = 0 . g→g0 Viceversa, dalla (11.44) si ha anche che usando la proprietà ciclica della traccia: 1 tr (γg0 (ρ)γg (ρ)) = 1 − ||γg (ρ) − γg0 (ρ)||21 , 4 ponendo poi ρ1 := γg0 (ρ) (senza perdere generalità dato che γg0 è suriettiva), e ρ2 := ρ, abbiamo: lim tr (ρ1 γg (ρ2 )) = 1 − g→g0 1 1 lim ||γg0 (ρ) − γg (ρ)||21 = 1 − ||γg0 (ρ) − γg0 (ρ)||21 = tr (ρ1 γg0 (ρ2 )) . g→g 0 4 4 Quindi (11.46) implica la continuità della rappresentazione nel senso della definizione 11.7. 2 11.2.3 Rappresentazioni unitarie proiettive fortemente continue. Consideriamo un sistema fisico S, descritto sullo spazio di Hilbert HS , ed un suo gruppo di simmetria topologico, G, con rappresentazione proiettiva continua G 3 g 7→ γg . Associamo al gruppo di simmetria topologico una rappresentazione unitaria proiettiva G 3 g 7→ Ug , nel senso che γg (ρ) = Ug ρUg−1 per ogni stato puro ρ ∈ Sp (HS ) del sistema e per ogni elemento del gruppo g ∈ G. Un problema interessante, che si pone immediatamente, è allora quello di stabilire se sia possibile fissare le fasi arbitrarie per gli operatori unitari Ug in modo da ottener una rappresentazione unitaria proiettiva che sia fortemente continua. Cioè : Ug ψ → Ug0 ψ se g → g0 e per ogni ψ ∈ H. Il problema è molto difficile nel caso generale, benchè esista un risultato generale locale dovuto a Wigner. Mostreremo infatti che, se G è un gruppo di simmetria topologico e G 3 g 7→ γg la sua rappresentazione proiettiva continua, allora è possibile fissare i moltiplicatori ω di una sua rappresentazione unitaria proiettiva G 3 g 7→ Ug in modo tale che essa risulti fortemente continua in un intorno dell’elemento neutro del gruppo G ed i moltiplicatori stessi risultano continui in 433 tale intorno. Tale risultato, in generale, non si estende a tutto il gruppo. Successivamente useremo questo risultato, restringendoci al caso di G = R, per provare che in quel caso, non solo il risultato detto si estende a tutto il gruppo, ma è possibile porre tutti i moltiplicatori uguali a 1 ed ottenere una rappresentazione che è , contemporaneamente, unitaria e fortemente continua. Le conseguenze fisiche di tale