1 1.1 Operatori negli spazi di Hilbert Operatori lineari in spazi normati Definizione 1 Una mappa lineare (operatore) tra spazi normati f : X → Y è una mappa che preserva la struttura lineare f (αx + βy) = αf (x) + βf (y), x, y ∈ X, α, β ∈ C (1) Un operatore che abbia come immagine C (X → C) viene anche chiamato funzionale lineare. Definizione 2 Una mappa lineare tra spazi normati f : X → Y si dice limitata se esiste una costante K tale per cui kf (x)k ≤ Kkxk ∀x ∈ X. (2) Una mappa limitata manda insiemi limitati in insiemi limitati. Infatti, un insieme è limitato se è contenuto in una sfera di raggio r (kxk ≤ r); l’immagine della sfera di raggio r è però contenuta nella sfera di raggio Kr a causa della definizione 2 (kf (x)k ≤ Kr). Negli spazi normati il concetto di limitatezza è equivalente a quello di continuità. Vale infatti il seguente teorema, Teorema 1 Sia f : X → Y una mappa lineare tra spazi normati. Le seguenti affermazioni sono tra loro equivalenti: a) f è limitata b) f è continua c) f è continua in un punto Dim: a) → b): da kf (y) − f (x)k = kf (y − x)k ≤ Kkx − yk, segue che x → y implica f (x) → f (y). b) → c): ovvio. c) → a): f sia continua in x0 . Per ogni esiste un δ tale per cui kf (x + x0 ) − f (x0 )k = kf (x) + f (x0 ) − f (x0 )k = kf (x)k < (3) δy per ogni kxk < δ. Fissato e un generico y ∈ X, x = (2kyk) soddisfa kxk = δy kf ( 2kyk )k < e, di conseguenza, kf (y)k < 2δ kyk. f è quindi limitata. 2 δ 2 < δ. Quindi Definizione 3 Si definisce norma della mappa lineare f il più piccolo dei numeri K per cui l’identità (2) è valida. La norma di f viene indicata con kf k. Vale quindi kf (x)k ≤ kf kkxk 1 (4) x per ogni x ∈ X. Poichè f è lineare, questa identità si può riscrivere come kf ( kxk )k ≤ kf k. La formula (4) è quindi equivalente a kf (x)k ≤ kf k, kxk = 1 (5) e kf k può anche essere definito come kf k = supkxk=1 kf (x)k. (6) L’insieme degli operatori continui tra due spazi normati X e Y B(X, Y ) = {f : X → Y |f lineare limitato} (7) munito della mappa f → kf k è uno spazio vettoriale normato. Teorema 2 B(X, Y ) è uno spazio vettoriale normato. È completo se Y è completo. Dim: È immediato verificare che kf k definisce una norma. Sia An una successione di Cauchy in B(X, Y ). Vale quindi kAn − Am k < per n, m > n0 . Da kAn (x) − Am (x)k = k(An − Am )(x)k ≤ kAn − Am kkxk < kxk (8) concludiamo che kAn (x)k è una successione di Cauchy in Y per ogni x fissato. Poichè Y è completo, An (x) convergerà a un vettore in Y che chiamiamo A(x). A è ovviamente un operatore lineare ed è anche continuo; infatti passando al limite nell’equazione (8) otteniamo kA(x)−An (x)k ≤ kxk e kA(x)k = k(A(x)−An (x))+An (x)k ≤ (+kAn k)kxk. Quindi A ∈ B(X, Y ). Infine dalle stesse equazioni segue che kAn − Ak ≤ e che la successione An converge ad A nella norma di B(X, Y ). 2 Ricordiamo che uno spazio vettoriale normato completo si chiama spazio di Banach. Se Y è uno spazio di Banach anche B(X, Y ) lo è. In particolare, B(H) ≡ B(H, H), cioè lo spazio vettoriale degli operatori lineari continui in uno spazio di Hilbert, è uno spazio di Banach. 1.2 Isomorfismo tra spazi di Hilbert Definizione 3: Un isomorfismo tra spazi normati (o spazi di Hilbert) è una mappa lineare biunivoca che preserva la norma: kf (x)k = kxk. Osservazioni: una mappa che preserva la norma si chiama anche isometria. In generale, un isomorfismo tra spazi è una mappa biunivoca che preserva le proprietà (algebriche, topologiche, etc...) che sono definite su questi spazi. Nel caso particolare in cui lo spazio normato sia anche uno spazio di Hilbert sembrerebbe più naturale definire un isomorfismo come una mappa lineare che preserva il prodotto scalare: (f (x), f (y)) = (x, y). 2 Le due definizioni sono in realtà equivalenti: qualora in uno spazio siano definiti sia un prodotto scalare che l’associata norma, una mappa lineare che preserva l’uno preserva anche l’altra, e viceversa. Infatti, norma e prodotto scalare si possono ricostruire una dall’altro attraverso le identità kxk2 = (x, x) 4(x, y) = kx + yk2 − kx − yk2 + i(kx + iyk2 − kx − iyk2 ) (9) Esempio 1: Ogni spazio di Hilbert H separabile è isomorfo a l 2 . Ricordiamo che uno spazio di Hilbert si dice separabile quando possiede un sistema ortonormale completo (s.o.n.c.) numerabile. In uno spazio di Hilbert separabile, scelto un s.o.n.c. {xi }, ogni P x ∈ H si scrive in maniera unica come x = ai xi . Questa identificazione induce una 2 mappa H → l : x → {ai } che è un isomorfismo di spazi di Hilbert. Innanzitutto, la P mappa è ben definita ed è un’isometria perchè |ai |2 = kxk2 . La mappa è iniettiva per l’unicità dei coefficienti di Fourier, ed è suriettiva perchè, per ogni successione in l 2 P P vale |ai |2 < ∞ e di conseguenza la formula x = ai xi definisce un elemento di H. L’isomorfismo in questione non è naturale perchè richiede la scelta di una base. Esempio 2: La trasformata di Fourier può essere pensata come una mappa lineare da L2 (R) in L2 (R). Preserva la norma kfˆk = kf k (teorema di Parseval) ed è biunivoca. È pertanto un isomorfismo. 1.3 Il teorema di Riesz Il teorema di Riesz caratterizza i funzionali lineari continui in uno spazio di Hilbert. Ricordiamo dall’algebra lineare che l’insieme dei funzionali lineari in uno spazio vettoriale V è anch‘esso uno spazio vettoriale che prende il nome di spazio duale V ∗ . Nel caso di spazi normati è utile modificare la definizione richiedendo che V ∗ sia lo spazio vettoriale dei funzionali lineari continui. Dal teorema 2, segue che V ∗ è uno spazio vettoriale normato completo. Nel caso finito-dimensionale, V e V ∗ hanno la stessa dimensione e sono quindi banalmente isomorfi. La struttura di spazio di Hilbert consente di definire un isomorfismo naturale tra H e il suo duale H ∗ per ogni spazio di Hilbert. Per ogni x0 ∈ H possiamo definire un particolare funzionale lineare continuo H → C : x → (x, x0 ). Il teorema di Riesz garantisce che ogni funzionale continuo ha questa forma e stabilisce un’isomorfismo tra H e H ∗ . Teorema 3 (Riesz): Ogni funzionale lineare continuo L su uno spazio di Hilbert H si può scrivere in maniera univoca come L(x) = (x, x0 ). Vale inoltre kLk = kx0 k. 3 Dimostrazione: Nel caso particolare L = 0, x0 = 0 e il teorema è ovvio. Possiamo quindi supporre L 6= 0. Definiamo M = {x ∈ H|Lx = 0}. Poichè L è lineare e continuo, M è un sottospazio chiuso di H ed ammette quindi un complemento ortogonale M ⊥ . Scegliamo un particolare z ∈ M ⊥ con kzk = 1. Definito u = L(x)z − L(z)x, abbiamo che L(u) = L(x)L(z) − L(z)L(x) = 0; quindi u ∈ M . Visto che u ∈ M e z ∈ M ⊥ , 0 = (u, z) = L(x)(z, z) − L(z)(x, z). Ne segue che L(x) = L(z)(x, z) = (x, L(z)z). Quindi il teorema vale con x0 = L(z)z. Da |L(x)| = |(x, x0 )| ≤ kxkkx0 k segue che kLk ≤ kx0 k. Visto che |L(x0 )| = kx0 k2 , la disuguaglianza precedente è certamente saturata e kLk = kx0 k. L’unicità segue dal fatto che, se L(z) = (x, x0 ) = (x, x00 ), allora (x, x0 − x00 ) = 0; x0 − x00 è quindi nullo perchè ortogonale a qualunque vettore nello spazio di Hilbert. 2 1.4 Esempi di operatori negli spazi di Hilbert Consideremo operatori lineari A : H → H. Per semplicità le parentesi tonde in A(x) saranno a volte omesse: Ax sta per A(x). Se non altrimenti specificato, useremo lettere maiuscole dell’alfabeto latino per indicare operatori negli spazi di Hilbert, lettere minuscole (della parte finale) dell’alfabeto latino per indicare vettori in H e lettere greche per indicare scalari. Esempio 1: caso finito dimensionale. A : H → H, dimH = N . Scegliamo una PN base ei , i = 1, ..., N . Consideriamo lo sviluppo di x e di Ax: x = i=1 xi ei e Ax = PN i=1 (Ax)i ei . Si ha che N N X X (Ax)i = (Ax, ei ) = (A( xj ej ), ei ) = xj (Aej , ei ) j=1 (10) j=1 Vediamo che A, in termini delle coordinate rispetto alla base scelta, è rappresentato da una matrice N X (Ax)i = Aij xj , Aij = (Aej , ei ) (11) j=1 Gli operatori negli spazi infinito dimensionali generalizzano il concetto di matrice. Come dimostrano i seguenti esempi, molte proprietà valide negli spazi di dimensione finita sono false negli spazi di dimensione infinita. Esempio 2: operatore di shift in H = l 2 . A({a1 , a2 , ....}) = {0, a1 , a2 , ....} definisce un operatore lineare continuo con norma 1. È infatti un’isometria: kAxk = kxk. È iniettivo ma non suriettivo: l’elemento z = {1, 0, 0, ....} non è infatti nell’immagine di A. A mappa 4 H biunivocamente in un suo sottoinsieme proprio A(H) = ({z})⊥ . Questo è possibile solo perchè H è infinito-dimensionale. A si può rappresentare come una matrice infinita Aij , i, j = 1, 2.... le cui sole entrate non nulle sono Ai+1,i = 1, i = 1, 2.... Esempio 3: gli operatori posizione e momento della Meccanica Quantistica. Definiamo in L2 [a, b] − ∞ ≤ a < b ≤ ∞ gli operatori x̂ : p̂ : x̂f (x) = xf (x) df p̂f (x) = −i (x) dx (12) I due operatori soddisfano le regole di commutazione di Heisenberg [x̂, p̂] = i come segue dal semplice calcolo x̂p̂f (x) − p̂x̂f (x) = −ix d d f (x) + i (xf (x)) = if (x) dx dx (13) Esistono operatori A e B che soddisfano l’algebra astratta di Heisenberg [A, B] = i soltanto in spazi infinito dimensionali. Infatti, in uno spazio di dimensione finita N , A e B sarebbero rappresentabili da matrici N per N e l’equazione [A, B] = i sarebbe inconsistente, come si vede prendendo la traccia: 0 = Tr[A, B] = Tr(AB) − Tr(BA) = Tr(AB) − Tr(AB) ≡ N (14) dove si è usata la properietà di ciclicità della traccia. Esempio 4: operatori differenziali in H = L2 (X), X sottoinsieme di Rn . Per semplicità consideriamo X = (a, b), −∞ ≤ a < b ≤ ∞ e il più semplice degli operatori differenziali: A = −i∂x . L’operatore A ha due seri problemi: 1) Non è continuo. Consideriamo ad esempio yn (x) = e−nx in L2 [0, π]. Ayn = inyn e di conseguenza kAyn k/kyn k = n non può essere limitato. 2) Non è nemmeno definito ovunque. Infatti non tutte le funzioni a quadrato sommabile sono derivabili con derivata ancora appartenente allo stesso spazio. A è definito solo su un sottoinsieme D(A) di H che prende il nome di dominio dell’operatore. D(A) contiene almeno tutte le funzioni C 1 [a, b] ed è un sottoinsieme denso di L2 [a, b]. I problemi 1)+2) sono comuni a tutti gli operatori differenziali. Osservazione sul dominio: l’esempio 4 descrive una caratteristica generale della teoria degli operatori negli spazi di Hilbert: gli operatori di maggior interesse non sono continui e non sono nemmeno definiti sull’intero H. Gli operatori continui possono sempre estesi all’intero H. Se un operatore continuo A è definito in un dominio D(A) può sempre essere esteso a D(A) per continuità. Vale infatti 5 Teorema 4: Un operatore lineare A in uno spazio normato completo X che sia definito e continuo in un sottoinsieme denso U può essere esteso ad un operatore continuo definito sull’intero X. Dim: Vale kAxk ≤ kAkkxk in U . Poichè U è denso in X, ogni x ∈ X sarà limite di una successione di elementi xn in U . Poichè xn converge, sarà di Cauchy, quindi kxn −xm k < per n, m sufficientemente grandi. Da kAxn − Axm k = kA(xn − xm )k ≤ kAkkxn − xm k < kAk segue che la successione Axn è di Cauchy, e quindi, per la completezza di X, converge ad un elemento che chiamiamo Ax. Prendendo il limite dell’equazione kAxn k ≤ kAkkxn k otteniamo kAxk ≤ kAkkxk. La mappa x → Ax definisce quindi un’estensione di A all’intero spazio X. L’estensione è ancora un operatore continuo con la stessa norma di A definito in U .2 A si può poi estendere ad H in molti modi possibili. Il più semplice è richiedere, ad ⊥ esempio, che si annulli in D(A) . In questo modo si ottiene un’estensione continua di A all’intero H. Nel seguito supporremo pertanto che ogni operatore continuo sia definito sull’intero H. Come abbiamo visto, gli operatori non continui sono invece definiti solo su un sottoinsieme di H e, in generale, non sono estendibili all’intero H. In questo caso è importante specificare il dominio di definizione. Poichè le proprietà degli operatori possono variare a seconda dell’insieme di definizione, nel seguito, la parola operatore implicitamente indicherà la coppia (A, D(A)). È ragionevole richiedere almeno che il dominio D(A) sia un sottoinsieme denso di H. La mancanza di continuità viene solitamente rimpiazzata da una condizione più debole ma sufficiente per molte applicazioni, la chiusura. Un operatore si dice chiuso se le due condizioni xn → x e Axn → y implicano y = Ax 1 . Richiederemo sempre agli operatori non continui di essere densamente definiti (cioè D(A) = H) e chiusi. 1.5 Operatori autoaggiunti e unitari Dato un operatore (A, D(A)) densamente definito in H (cioè D(A) = H) esiste l’operatore aggiunto (A∗ , D(A∗ )) che soddisfa (Ax, y) = (x, A∗ y), x ∈ D(A), y ∈ D(A∗ ) (15) ed è definito in D(A∗ ) = {y ∈ H|Ly : H → C, x → (Ax, y) funzionale lineare continuo} 1 (16) Nel caso di operatori continui la sola condizione xn → x implica Axn → Ax. Nel caso di operatori non continui Axn potrebbe anche non convergere. Per operatori chiusi, se xn converge a x e Axn converge, quest’ultimo deve convergere a Ax. La definizione di chiusura si può riformulare in maniera più semplice cosı̀: un operatore A si dice chiuso se il suo grafico, cioè l’insieme delle coppie {(x, Ax)}, è un sottoinsieme chiuso di H × H. 6 Nel caso di operatori continui l’equazione (15) vale per tutti gli x, y ∈ H. Nel caso di operatori non continui, l’aggiunto è definito nel dominio indicato, che potrebbe essere diverso da quello di A. L’esistenza dell’aggiunto è garantita dal teorema di Riesz. Per y ∈ D(A∗ ) fissato, la mappa Ly : D(A) → C : x → (Ax, y) è un funzionale lineare continuo definito in D(A). Poichè D(A) è denso in H, il teorema 4 garantisce che Ly si può estendere ad un funzionale continuo su H. Per il teorema di Riesz, esiste allora z ∈ H tale per cui Ly (x) = (Ax, y) = (x, z) per ogni x. z dipenderà da y: chiamiamolo z = A∗ y. La mappa A∗ che associa ad ogni y uno z è un operatore lineare che soddisfa l’equazione (15). Esempio 1 Ogni operatore A in CN è associato ad una matrice Aij . Calcoliamo la matrice associata a A∗ . Usando l’equazione (11): (A∗ )ij = (A∗ ej , ei ) = (ej , Aei ) = (Aei , ej ) = Aji . La matrice dell’aggiunto di A è quindi la matrice aggiunta (o coniugata hermitiana), cioè la matrice trasposta coniugata: A∗ij = Aji . Non è difficile dimostrare che Teorema 3: Se A è continuo anche A∗ è un operatore continuo e kA∗ k = kAk. Inoltre A∗∗ = A. Dim: Se A è continuo, è anche limitato: kAk < ∞. Usando l’identità di Schwarz, otteniamo: |(A∗ x, y)| = |(x, Ay)| ≤ kxkkAyk ≤ kxkkAkkyk (17) Scegliendo y = A∗ x otteniamo: kA∗ xk2 ≤ kxkkAkkA∗ xk cioè kA∗ xk ≤ kxkkAk; ne segue che A∗ è limitato, quindi continuo, con kA∗ k ≤ kAk. (18) In particolare, visto che A∗ è continuo, anche A∗∗ esiste ed è continuo; l’equazione (15) ci dice che (A∗∗ x, y) = (x, A∗ y) = (Ax, y) per ogni x, y e quindi A∗∗ = A. La disuguaglianza (18) applicata a A∗∗ ci dice che kAk = kA∗∗ k ≤ kA∗ k, da cui kA∗ k = kAk. 2 Si può dimostrare [1] che il teorema precedente vale per operatori illimitati nella seguente forma: se A è chiuso e densamente definito, A∗ è anch‘esso chiuso e densamente definito e soddisfa A∗∗ = A. Considereremo tre classi importanti di operatori: 1. Operatori autoaggiunti. A si dice autoaggiunto se A = A∗ . 7 Osservazione importante: nella definizione di autoaggiuntezza, l’affermazione A = A∗ va intesa come: (A, D(A)) = (A∗ , D(A∗ )). può succedere che, dato A definito su D(A), A∗ esista e coincida con A in D(A) ma sia definito in un dominio più ampio D(A∗ ) ⊃ D(A). In questo caso l’operatore è solo formalmente autoaggiunto. Possiamo quindi definire due forme di autoaggiuntezza: A è simmetrico se vale x, y ∈ D(A) (Ax, y) = (x, Ay), (19) Questa condizione garantisce semplicemente che A∗ esiste e coincide con A in D(A). In generale A∗ sarà un’estensione di A: D(A∗ ) ⊃ D(A). A è autoaggiunto se vale A ≡ A∗ , cioè se A e A∗ coincidono come operatori (dominio incluso!): D(A) = D(A∗ ). Come vedremo, gli operatori autoaggiunti hanno proprietà che gli operatori simmetrici non possiedono. Per operatori continui, che non hanno problemi di dominio, autoaggiuntezza e simmetria coincidono. Esempio 1: nel caso finito-dimensionale, A è autoaggiunto se lo è la matrice corrispondente: Aij = Aji . Una matrice con questa proprietà si chiama anche simmetrica (nel caso reale) o hermitiana (nel caso complesso). Esempio 2: un altro esempio importante di operatore autoaggiunto è l’operatore A = −i∂x in L2 [a, b], −∞ ≤ a < b ≤ ∞. L’operatore non è continuo. Consideriamo la formula (15) per funzioni f, g molto regolari, in modo che tutte le formule e le manipolazioni formali abbiano senso (notare che la i nella definizione di A è importante): Z (−i∂x f, g) = b 0 (−if (t)g(t))dt = −if g|ba Z + b f (t)(−ig 0 (t))dt = −if g|ba + (f, −i∂x g) a a (20) Condizione necessaria perchè l’operatore sia autoaggiunto è che il termine di bordo si annulli. È quindi necessario specificare un dominio D(A), ovvero dire quali sono le condizioni al contorno delle funzioni considerate. In particolare, l’annullarsi dei termini di bordo per tutte le funzioni f, g ∈ D(A) garantisce l’equazione (Af, g) = (f, Ag), f, g ∈ D(A) (21) garantisce cioè che l’operatore è simmetrico. A∗ è quindi un’estensione di A. Tipicamente D(A) viene inizialmente scelto sulla base del problema in considerazione, in modo da 8 annullare i termini al bordo. Se una considerazione più attenta mostra che in realtà A∗ è definito su un dominio più ampio, si può tentare di estendere il dominio di A sperando che quello di A∗ si restringa. Per approssimazioni successive si può arrivare ad un operatore autoaggiunto: D(A) ⊂ D(A1 ) ⊂ ... ⊂ D(Aaut ) ⊂ ... ⊂ D(A∗1 ) ⊂ D(A∗ ), dove Aaut ≡ A∗aut , dominio incluso. Esistono molti domini diversi in cui A risulta simmetrico, mentre ne esiste uno solo in cui A è autoaggiunto. Consideriamo, ad esempio, l’operatore −i∂x in L2 (R). Ogni funzione in L2 (R) si annulla all’infinito e i termini al bordo nell’equazione (20) si annullano automaticamente. Occorre però scegliere ancora il dominio dell’operatore imponendo opportuni requisiti di regolarità alle funzioni. La scelta più semplice di un dominio denso in L2 (R) composto da funzioni molto regolari è S(R). L’operatore −i∂x non è però autoaggiunto S(R). Esistono infatti funzioni g ∈ / S(R) che soddisfano la condizione (−i∂f, g) = (f, −i∂g) per ogni f ∈ S(R). Si può dimostrare che −i∂x in L2 (R) è simmetrico nel dominio S(R) e autoaggiunto nel dominio {fAC , f 00 ∈ L2 (R)} 2 . Consideriamo ora l’operatore −i∂x definito sull’intervallo limitato [0, 1]. Definiamo cinque operatori diversi, che differiscono solo per la scelta del dominio : AL = −i∂x D(AL ) = {hAC , h0 ∈ L2 [0, 1]|h(0) = 0} AR = −i∂x D(AR ) = {hAC , h0 ∈ L2 [0, 1]|h(1) = 0} A1 = −i∂x D(A1 ) = {hAC , h0 ∈ L2 [0, 1]|h(0) = h(1) = 0} A2 = −i∂x D(A2 ) = {hAC , h0 ∈ L2 [0, 1]|h(0) = h(1)} A3 = −i∂x D(A3 ) = {hAC , h0 ∈ L2 [0, 1]} (22) Non è difficile verificare che A1 è simmetrico, A2 è autoaggiunto, A∗1 = A3 e A∗L = AR . Cominciamo con l’osservare che i termini di bordo nell’equazione (20) non si annullano per funzioni f, g che appartengono ai domini di AL , AR ; questi operatori non sono quindi simmetrici. Calcoliamo l’aggiunto di AL : questo dovrà soddisfare l’equazione (AL f, g) = (f, A∗L g) per ogni f ∈ D(AL ) e g ∈ D(A∗L ). Consideriamo la formula (20): AL e AR agiscono entrambi come −i∂x e, se scegliamo f (0) = 0, i termini al bordo si cancellano per ogni funzione che soddisfi g(1) = 0. Ne segue che (AL f, g) = (f, AR g) per ogni f ∈ D(AL ) e g ∈ D(AR ), da cui concludiamo che A∗L = AR 3 . Consideriamo ora A1 , A2 2 Il suffisso AC indica che la funzione deve essere scelta assolutamente continua (cfr Rudin, Real and Complex Analysis). Questa richiesta serve a garantire la validità del teorema fondamentale del calcolo Rb integrale (f (b) − f (a) = a f 0 (x)dx) e la possibilità di integrare per parti. È un requisito tecnico che serve ad eliminare alcune funzioni patologiche che pure sono L2 con derivata L2 . Alcuni testi riformulano le condizioni fAC , f 0 ∈ L2 in maniera equivalente richiedendo di lavorare nello spazio di Sobolev H 1 (che è uno spazio di distribuzioni). 3 Per essere precisi, abbiamo solo dimostrato che A∗L è un‘estensione di AR : il dominio di A∗L potrebbe essere più grande di quello di AR . Possiamo dimostrare che A∗L ≡ AR come segue. Sia dato g ∈ D(A∗L ), 9 e A3 : abbiamo una catena di operatori, con domini che soddisfano D(A1 ) ⊂ D(A2 ) ⊂ D(A3 ) e che coincidono a coppie nell’intersezione dei loro domini. Gli operatori A1 e A2 sono simmetrici poichè i termini di bordo nell’equazione (20) si annullano per funzioni f, g ∈ D(Ai ), i = 1, 2. A3 non è invece simmetrico. Notiamo tuttavia che A1 non è autoaggiunto. Infatti i termini di bordo nell’equazione (20) si annullano anche nel caso in cui f si annulla agli estremi e g è arbitraria; per ogni coppia di funzioni f ∈ D(A1 ) e g ∈ D(A3 ) vale l’equazione (A1 f, g) = (f, A3 g). Ne concludiamo che A∗1 = A3 . In maniera analoga ci si può convincere che A2 = A∗2 . A1 è quindi un operatore simmetrico ma non autoaggiunto, mentre A2 è autoaggiunto. 2. Operatori unitari. U si dice unitario se U U ∗ = U ∗ U = I, dove I è l’identità. Nel caso finito-dimensionale, U è unitario se lo è la matrice corrispondente. Gli operatori unitari preservano norma e prodotto scalare: infatti (U x, U y) = (x, U ∗ U y) = (x, y). U è ovviamente invertibile con inverso U ∗ . Un operatore unitario è quindi un’isomorfismo di H in sè stesso. Visto che kU (x)k = kxk, U è necessariamente continuo e di norma 1. È anche possibile pensare agli operatori unitari come cambi di base nello spazio di Hilbert: se {φi } è un s.o.n.c. anche {U φi } lo è, come si verifica facilmente usando le proprietà che abbiamo appena discusso. Un esempio notevole di operatore unitario in L(R) è l’operatore Trasformata di Fourier. 3. Proiettori. Per ogni sottospazio chiuso S di H abbiamo la decomposizione ortogonale H = S + S ⊥ . Ogni x si scrive in maniera unica come x = y + z con y ∈ S, z ∈ S ⊥ . Il proiettore P sul sottospazio S è definito dalla formula P x = y. Teorema: P è continuo, autoaggiunto e idempotente (cioè P 2 = P ). Dim: P 2 = P è ovvio. Da kxk2 = kyk2 + kzk2 , otteniamo kP xk2 = kyk2 ≤ kxk2 . Quindi P è continuo e kP k ≤ 1. Infine, date le decomposizioni ortogonali di due vettori xi = yi + zi , i = 1, 2 con P xi = yi , (P x1 , x2 ) = (y1 , x2 ) = (y1 , y2 + z2 ) = (y1 , y2 ) = (y1 + z1 , y2 ) = (x1 , P x2 ) quindi P è autoaggiunto. 2 1.6 Autovalori e teoria spettrale La teoria spettrale generalizza agli spazi di Hilbert lo studio di autovalori ed autovettori. È noto dall’algebra elementare che ogni matrice autoaggiunta ha autovalori reali e una che quindi soddisfa (AL f, g) = (f, A∗L g) per ogni f ∈ D(AL ). A∗L g esiste ed è L2 . Esiste quindi anche R1 φ(x) = −i x A∗L gdx che soddisfa φ(1) = 0 e −i∂x φ = A∗L g. Vogliamo dimostrare che φ ≡ g, da cui deduciamo che l’azione di A∗L su g è una derivata e che g(1) = 0, cioè A∗L = AR . Da (g, AL f ) = R1 ∗ R1 R1 (A∗ g, f ) = A g f¯ = −i ∂φf¯ = −iφf¯|1 + φ(−i∂f ) = (φ, AL f ) deduciamo (g − φ, AL f ) = 0. L 0 L 0 0 0 Non è difficile convincersi che l’immagine di AL è perlomeno densa in L2 : concludiamo che g = φ. Un ragionamento analogo può essere usato per rendere rigorosi gli altri argomenti riportati nel testo. 10 base ortonormale di autovettori. In questa base la matrice è diagonale. In uno spazio di Hilbert è necessario estendere il concetto di autovalore introducendo autovalori generalizzati e lo spettro di un operatore. La teoria spettrale garantisce che un operatore autoaggiunto ha spettro reale e può essere diagonalizzato. Ricordiamo che λ ∈ C e x ∈ H non nullo si definiscono autovalore e autovettore dell’operatore A in H se vale Ax = λx (23) Il nucleo Ker(A − λI) dell’operatore A − λI è quindi non nullo e si definisce autospazio associato all’autovalore λ. L’operatore A − λI non è ovviamente invertibile. È utile generalizzare il concetto di autovalore estendendolo a tutti i numeri λ ∈ C per cui A − λI non è invertibile nel senso della seguente definizione: Def: Si definisce spettro σ(A) dell’operatore A in uno spazio di hilbert H l’insieme dei λ ∈ C per cui (A − λI)−1 ∈ / B(H). Lo spettro si divide naturalmente in tre sottoinsiemi disgiunti: Spettro discreto: l’insieme dei λ ∈ C per cui A − λI non è iniettivo, e quindi non è invertibile come mappa lineare Spettro continuo: l’insieme dei λ ∈ C per cui A − λI è invertibile come mappa lineare, è densamente definito ma (A − λI)−1 : Im(A − λI) → H non è un operatore continuo Spettro residuo: l’insieme dei λ ∈ C per cui A − λI è invertibile come mappa lineare ma non è densamente definito Lo spettro discreto corrisponde all’insieme degli autovalori di A. Infatti se A−λI non è iniettivo, Ker(A−λI) 6= 0 ed esiste almeno una soluzione non nulla dell’equazione Ax = λx. Lo spettro continuo è la vera novità per gli operatori in spazi infinito dimensionali. Poichè A − λI è invertibile, Ker(A − λI) = 0 e λ non è un autovalore. λ appartenente allo spettro continuo è però un autovalore approssimato: Teorema 5: Per ogni λ ∈ C appartenente allo spettro continuo, esiste una successione di vettori xn tali per cui kAxn − λxn k → 0. Dim: (A − λI)−1 non è continuo, quindi esiste una sucessione yn tale per cui k(A − λI)−1 yn k ≥ nkyn k. Definendo wn = (A − λI)−1 yn si ha che kAwn − λwn k ≤ kwn k/n. Infine se xn = wn /kwn k si ha che kAxn − λxn k ≤ 1/n → 0. 2 11 L’equazione agli autovalori può quindi essere approssimata a piacere quando λ appartiene allo spettro continuo. Ovviamente la successione xn non può convergere in H. In caso contrario, se xn → x ∈ H, il teorema 5 garantisce che Axn → λx, e quindi, sotto la sola condizione che A sia chiuso, Ax = λx e λ sarebbe un autovalore. Tipicamente, esiste uno spazio topologico H ⊂ Y di funzioni o distribuzioni a cui può essere estesa la definizione dell’operatore A in cui la successione xn ∈ H converge a un vettore x ∈ Y e vale l’equazione Ax = λx come equazione per vettori e operatori in Y . Per questa ragione λ appartenente allo spettro continuo si chiama anche autovalore generalizzato e la distribuzione x autofunzione generalizzata. Lo spettro residuo è il meno interessante. Gli operatore interessanti hanno spettro residuo vuoto. Teorema 6: Se A è autoaggiunto, i suoi autovalori sono reali e gli autovettori corrispondenti ad autovalori diversi sono mutuamente ortogonali. L’intero spettro σ(A) è un sottoinsieme dell’asse reale e lo spettro residuo è vuoto. Dim: Dato u 6= 0 con Au = λu: λ(u, u) = (λu, u) = (Au, u) = (u, Au) = (u, λu) = λ(u, u). Da (u, u) 6= 0 segue che λ = λ, cioè gli autovalori sono reali. Analogamente, siano u1 , u2 due autovettori corrispondenti a due autovalori distinti: Aui = λi ui , i = 1, 2. λ1 (u1 , u2 ) = (λ1 u1 , u2 ) = (Au1 , u2 ) = (u1 , Au2 ) = (u1 , λ2 u2 ) = λ2 (u1 , u2 ). Dalla realtà degli autovalori segue che (λ1 − λ2 )(u1 , u2 ) = 0. Infine dal fatto che λ1 6= λ2 , segue che (u1 , u2 ) = 0. Dimostriamo ora che lo spettro continuo è reale e lo spettro residuo vuoto. Dato λ = λ1 + iλ2 con λi ∈ R calcoliamo k(A − λI)xk2 = k(A − λ1 I)x − iλ2 xk2 = k(A − λ1 I)xk2 + |λ2 |2 kxk2 (24) (i termini misti si annullano per la simmetria di A: ((A − λ1 I)x, −iλ2 x) + (−iλ2 , (A − λ1 I)x) = iλ2 (((A − λ1 I)x, x) − (x, (A − λ1 I)x)) = 0). Dall’equazione precedente segue che k(A − λI)xk2 ≥ |λ2 |2 kxk2 . Definendo y = (A − λI)x si ha che k(A − λI)−1 yk2 ≤ kyk2 /|λ2 |2 . Se λ2 6= 0 l’operatore inverso (A − λI)−1 è continuo e quindi ogni λ con parte immaginaria non nulla non appartiene allo spettro continuo. Infine, se λ non è un autovalore anche λ̄ non lo è, poichè gli autovalori sono reali. Quindi Ker(A − λ̄I) = {0}. Ora, se x ∈ Ker(A − λ̄I) allora 0 = (Ax − λ̄x, y) = (x, Ay) − λ̄(x, y) = (x, (A − λI)y) per ogni y a causa dell’autoaggiuntezza di A; quindi x ∈ (Im(A − λI))⊥ . Ne segue (Im(A − λI))⊥ = Ker(A − λ̄I) ≡ {0}. L’immagine dell’operatore A − λI, che è il dominio dell’operatore inverso (A − λI)−1 è quindi denso in H e λ non può appartenere allo spettro residuo che è quindi vuoto. 2 Si dimostra analogamente che Teorema 7: Se A è unitario, i suoi autovalori sono numeri complessi di modulo unitario 12 e gli autovettori corrispondenti ad autovalori diversi sono mutuamente ortogonali. Lo spettro è un sottoinsieme del cerchio unitario e lo spettro residuo è vuoto. Esempio 1: consideriamo il caso finito-dimensionale. È ben noto che ogni matrice autoaggiunta può essere diagonalizzata. Infatti l’equazione agli autovalori (23) si riduce ad un‘equazione matriciale Ax = λx in CN . Da (A − λI)x = 0 segue che gli autovalori soddisfano l’equazione caratteristica det(A − λI) = 0 (25) Questa è un’equazione polinomiale di grado N in λ che quindi ha esattamente N soluzioni. Ne concludiamo che esistono esattamente N autovalori λi , i = 1, ..., N . Se sono tutti distinti, il teorema 6 garantisce l’esistenza di N autovettori mutuamente ortogonali. Possiamo costruire una base o.n.c. {ui }, i = 1, ..., N usando gli autovettori opportunamente normalizzati. Questo cambiamento di base è quello che nei corsi di algebra lineare si usa per diagonalizzare una matrice simmetrica o autoaggiunta. Nella base {ui }, infatti, la matrice associata ad A è diagonale, A = diag(λ1 , ..., λN ), poichè Aij = (Auj , ui ) = λj (uj , ui ) = λi δij . Nel caso ci siano autovalori multipli, ognuno di questi è associato a un sottospazio di CN di dimensione pari alla molteplicità; in ognuno di questi sottospazi possiamo scegliere autovettori mutuamente ortogonali in modo da completare un s.o.n.c. in CN . Esempio 2: consideriamo l’operatore A2 = −i∂x autoaggiunto in D(A2 ) = {fAC , f 0 ∈ L2 [0, 1]|f (0) = f (1)}. I suoi autovalori e autovettori si determinano dall’equazione differenziale −iy 0 = λy che ha soluzioni y = Aeiλx . Le condizioni al contorno (periodicità di y) impongono λ = 2πn = 0, 1, 2, .... L’insieme degli autovettori, opportunamente normalizzati, un = e2πnx è un s.o.n.c. in L2 [0, 1] (base di Fourier). Vediamo che l’esempio 2 generalizza in maniera molto semplice il risultato valido in uno spazio finito-dimensionale: gli autovettori dell’operatore autoaggiunto possono essere scelti in modo da formare un s.o.n.c. in H. Questa situazione non si generalizza ad ogni operatore in uno spazio di Hilbert, come dimostra l’esempio seguente: Esempio 3: consideriamo ancora l’operatore A = −i∂x definito però in D(A) = {fAC , f 0 ∈ L2 (R)}. È anch‘esso autoaggiunto. I suoi autovalori e autovettori si determinano ancora una volta dall’equazione differenziale −iy 0 = λy che ha soluzioni y = Aeiλx . Queste soluzioni però non sono L2 (R) per nessun valore di λ. L’operatore A non possiede alcun autovalore nè autovettore. Notiamo tuttavia che, sebbene non sia possibile trovare alcun vettore x ∈ H che soddisfi l’equazione Ax = λx, è possibile trovare vettori xn ∈ H che 13 approssimino questa equazione con un errore arbitrariamente piccolo per ogni λ reale: kAxn − λxn k ≤ . Infatti non è difficile definire delle funzioni xn ∈ C 1 (R), nulle al di fuori dell’intervallo (−n − 1, n + 1) e coincidenti con eiλx nell’intervallo (−n, n) che soddisfino alla proprietà limn→∞ kAxn − λxn k = 0 per λ reale. Si può dimostrare infatti [1] che lo spettro dell’operatore è puramente continuo e coincidente con l’asse reale. Le funzioni uλ = eiλx con λ ∈ R vengono chiamate autovettori generalizzati. In effetti le funzioni xn che soddisfano la proprietà dell’autovalore approssimato in questo esempio convergono a uλ = eiλx quando n tende all’infinito. Le funzioni uλ non appartengono allo spazio di Hilbert L2 (R) ma possono essere interpretate come elementi di uno spazio più ampio di distribuzioni Y . Nello spazio Y l’equazione −i∂x uλ = λuλ è soddisfatta. Un operatore autoaggiunto generico possiede sia spettro discreto che spettro continuo. Il teorema spettrale viene formulato come segue. È possibile associare ad ogni autovalore generalizzato λ una distribuzione uλ chiamata autovettore generalizzato. uλ è definito come limite nello spazio delle distribuzioni dei vettori xn ∈ H che appaiono nella definizione di autovalore generalizzato. La successione xn non converge ad alcun elemento di H, ma converge nel senso delle distribuzioni a uλ che non appartiene ad H. Teorema Spettrale: ogni operatore autoaggiunto A in uno spazio di Hilbert è caratterizzato dai suoi autovalori e autovettori {λn , un } che formano un s.o.n. (spettro discreto) e da una o più famiglie continue di autovalori e autovettori generalizzati (spettro continuo) {λ, uλ } tali per cui ogni elemento dello spazio di Hilbert si può scrivere come Z X an un + a(λ)uλ dλ (26) f= n Attraverso il teorema spettrale abbiamo effettivamente diagonalizzato l’operatore e abbiamo la possibilità di sviluppare il generico elemento x ∈ H nella base degli autovettori, ordinari e generalizzati. La diagonalizzazione di A segue dalla formula Z X Af = λn an un + λa(λ)uλ dλ (27) n Per una definizione corretta dell’integrale nella precedente formula rimandiamo a [1]. Esempio 3. Continuazione: ogni funzione in L2 (R) si può sviluppare nel set di autovettori generalizzati uλ nel senso dell’equazione (26): Z f (x) = a(λ)eiλx dλ, (28) 14 Il teorema spettrale, in questo caso, non è altro che l’affermazione che ogni funzione in L2 (R) possiede una trasformata di Fourier. L’operatore, in questo caso, ha spettro puramente continuo, coincidente con l’asse reale. Esempio 4: l’operatore posizione in L2 [a, b], −∞ ≤ a < b ≤ ∞ è autoaggiunto nel dominio D(x̂) = {f ∈ L2 [a, b]|xf ∈ L2 [a, b]} come si verifica facilmente. L’equazione x̂ψ = λψ richiede xψ(x) = λψ(x) che non può essere risolta da nessuna funzione ψ(x). L’operatore x̂ non ha quindi autovalori. Si può pero’ dimostrare [1] che il suo spettro è puramente continuo e coincide con l’intervallo [a, b]. L’equazione agli autovalori è risolta dalle distribuzioni uλ = δ(x − λ) per λ ∈ [a, b]. È facile verificare che esiste una successione di funzioni in L2 [a, b] che converge a uλ e che soddisfa la proprietà dell’autovalore apprssimato. Il teorema spettrale si riduce in questo caso alla banale formula Z b δ(x − λ)ψ(λ)dλ ψ(x) = (29) a che è valida per ogni ψ ∈ L2 [a, b]. Esiste una classe di operatori che ha spettro puramente discreto. Per questi il teorema spettrale vale nella forma: Teorema Spettrale per operatori a spettro discreto: l’insieme degli autovettori di un operatore autoaggiunto A con spettro puramente discreto possono essere scelti in modo da formare un s.o.n.c. Gli operatori con spettro puramente discreto generalizzano la teoria spettrale valida per spazi finito dimensionali in una forma particolarmente semplice. Ogni elemento f dello spazio di Hilbert si può sviluppare nella base degli autovettori di A, {ui }, X f= ai ui (30) i La base degli autovettori, in analogia con quanto succede nel caso finito-dimensionale, è la base in cui l’operatore è diagonale (Aui = λi ui ). Questa proprietà si esprime formalmente con l’equazione X Af = λi ai ui (31) i che risulta essere vera anche se A non è continuo. Usando l’isomorfismo H ∼ l 2 , f → {ai } determinato dalla scelta della base {ui }, l’operatore A può essere rappresentato come una matrice (infinito-dimensionale) diagonale, con entrate uguali agli autovalori. 15 Per concludere, è opportuno notare che il teorema 6 e il teorema spettrale valgono per operatori autoaggiunti e non è detto che valgano per operatori che sono soltanto simmetrici. Operatori simmetrici hanno spettro discreto e continuo reale, ma genericamente lo spettro residuo non è vuoto e complesso ed infine il teorema spettrale non è valido. 1.7 1.7.1 Esempi: equazioni integrali, alle derivate ordinarie e parziali Equazioni integrali Gli operatori integrali sono particolarmente semplici. Alcune applicazioni storiche della teoria degli spazi di Hilbert sono infatti alle equazioni integrali. Consideriamo un operatore integrale definito in L( Ω) dove Ω è un sottoinsieme di Rn . Z 2 K : f ∈ L (Ω) → Kf (x) = k(x, y)f (y)dy (32) Ω 2 Se il nucleo integrale k(x, y) ∈ L (Ω × Ω) l’operatore K è continuo. Infatti, dalla disuguaglianza di Holder segue che Z Z Z Z Z 2 2 2 kKf k = | k(x, y)f (y)dy| dx ≤ ( |k(x, y)| dy |f (w)|2 dw)dx Ω Ω Ω Ω ZΩ ≤ kf k2 |k(x, y)|2 dxdy (33) Ω×Ω È facile verificare che se k(x, y) = k(y, x), K è autoaggiunto. K in realtà è più che continuo, è un operatore compatto, cioè manda insiemi limitati in insiemi la cui chiusura è compatta [1]. Lo spettro degli operatori compatti è puramente discreto e particolarmente semplice. Teorema 8: Un operatore autoaggiunto compatto ha autovalori reali λn → 0 ed autovettori un che formano un s.o.n.c. Lo spettro è discreto con al più uno spettro continuo che consiste del solo punto λ = 0 se questo non è un autovalore. 1.7.2 Equazioni Differenziali Ordinarie: Problemi agli autovalori Un problema classico delle equazioni differenziali ordinarie è il problema agli autovalori o problema al contorno. Questo tipo di problema è naturale in Meccanica Quantistica e si incontra spesso anche in fisica classica, in particolare quando si risolvono problemi al contorno per equazioni differenziali alle derivate parziali. Esempio 1: sia data l’equazione differenziale lineare del secondo ordine dipendente da un parametro λ y 00 + λy = 0 (34) 16 Il teorema di esistenza e unicità garantisce che, date le condizioni iniziali (problema di Chauchy) y(x0 ) = y0 y 0 (x0 ) = y1 (35) la soluzione esiste, è unica e dipende continuamente dai dati iniziali. Chiediamoci ora se la stessa equazione ha soluzioni nell’intervallo [x0 , x1 ] che soddisfano il problema al contorno y(x0 ) = 0 y(x1 ) = 0 (36) Un equazione del II ordine ha sempre due soluzioni linearmente indipendenti yi (x; λ), i = 1, 2 e la generica soluzione si può esprimere come loro combinazione lineare y(x) = c1 y1 (x; λ) + c2 y2 (x; λ). (37) λ appare in generale come parametro nell’espressione delle soluzioni. Sappiamo che il problema di Chauchy (35) ha sempre una soluzione. Nel caso del problema al contorno (36), c‘e’ sempre la soluzione banale c1 = c2 = 0. Esisterà una seconda soluzione se e solo se il sistema c1 y1 (x0 ; λ) + c2 y2 (x0 ; λ) = 0 c1 y1 (x1 ; λ) + c2 y2 (x1 ; λ) = 0 (38) ha una soluzione. Solo per alcuni valori particolari di λ, quelli per cui la matrice dei coefficienti yi (xj ; λ) ha determinante nullo, esisterà una soluzione non banale al problema al contorno. Questi valori sono chiamati autovalori. Possiamo riformulare il problema in questi termini: risolvere l’equazione agli autovalori Ly = λy per l’operatore L = −∂ 2 /∂x2 nel dominio D(L) = {fAC , f 00 ∈ L2 [x0 , x1 ]|f (x0 ) = f (x1 ) = 0}. L è il quadrato dell’operatore A1 = −i∂x ; è simmetrico e, coi metodi della sezione 1.4, si può verificare che è anche autoaggiunto 4 . Il problema è cosı̀ ridotto alla ricerca di autovalori e autovettori di un operatore autoaggiunto in uno spazio di Hilbert. 4 Notiamo che −i∂x , con le condizioni f (x0 ) = f (x1 ) = 0, non è autoaggiunto mentre il suo quadrato −∂x2 lo è. Le condizioni al contorno da imporre agli operatori possono variare col numero di derivate, poichè questo influisce sui termini provenienti dall’integrazione per parti. Intuitivamente, il numero di condizioni da imporre ad un operatore differenziale con derivate ordinarie è pari all’ordine dell’operatore stesso: f (x0 ) = f (x1 ) = 0 contiene due condizioni su f ed è ragionevole da imporre per un operatore del secondo ordine ed è invece troppo restrittivo per un operatore del prim’ordine. Per evitare errori, è bene verificare l’autoaggiuntezza esaminando i termini al bordo caso per caso. 17 Esaminiamo il caso generale di un‘equazione differenziale lineare del II ordine: L̂y = λ̂y (39) con L̂y = a2 (x)y 00 + a1 (x)y 0 + a0 (x), a2 (x) > 0. (40) È facile verificare che (ridefinendo L e λ) si può sempre ricondurre il problema al seguente: d d p(x) + q(x). (41) Ly = λωy, L=− dx dx con R a0 R e (a1 /a2 )dx p(x) = e (a1 /a2 )dx , q(x) = − e (a1 /a2 )dx , ω(x) = a2 a2 Notiamo che p(x) > 0 e ω(x) > 0. Si definisce problema di Sturm-Liouville (SL) il problema agli autovalori: R Ly = λωy (42) a≤x≤b , α1 y(a) + α2 y 0 (a) = 0 β1 y(b) + β2 y 0 (b) = 0 (43) con αi , βi reali e con almeno uno degli αi e uno dei βi diversi da zero. Nell’equazione (43) abbiamo scelto condizioni al contorno indipendenti per i due estremi. È possibile scegliere altre condizioni al contorno, ad esempio si possono scegliere condizioni di periodicità: f 0 (a) = f 0 (b) f (a) = f (b) , (44) oppure due condizioni più complicate che coinvolgano ciascuna f (a), f (b), f 0 (a), f 0 (b). Come discusso a breve, ogni set di condizioni con la proprietà di rendere autoaggiunto l’operatore L definisce un buon problema di SL. Vogliamo formalizzare il problema in un opportuno spazio di Hilbert. Dalla teoria generale delle equazioni differenziali, sappiamo che le soluzioni del problema (43) definito in un intervallo limitato [a, b] e con funzioni p, q, ω sufficientemente regolari sono anch’esse funzioni regolari, in particolare sono L2 [a, b]. Osservazione: della presenza della funzione ω in (43) si può facilmente tener conto conRb siderando la misura ω(x)dx in [a, b]. Consideriamo cioè L2ω [a, b] = {f | a |f (x)|2 ω(x)dx < Rb ∞} con prodotto scalare (f, g)ω = a f (x)g(x)ω(x)dx. Il problema (43) per l’operatore Lω = L/ω diventa un problema agli autovalori Lω y = λy in L2ω . Notiamo che nel Rb prodotto scalare (Lω f, g)ω = a (Lf )g tutti i fattori di ω si cancellano. Senza perdita di 18 generalità si può anche porre ω = 1: la teoria generale si ottiene sostituendo ovunque L → Lω , (f, g) → (f, g)ω . Consideriamo quindi il problema agli autovalori: Ly = λy 00 D(L) = {fAC , f ∈ L [a, b]ω |α1 y(a) + α2 y 0 (a) = β1 y(b) + β2 y 0 (b) = 0} 2 (45) L è un operatore autoaggiunto. Infatti, (Lf, g) = Rb a Rb Rb ((−pf 0 )0 + qf )gdx = −pf 0 g|ba + a pf 0 g 0 dx + a qf gdx = Rb −p(f 0 g − f g 0 )|ba + a f ((−pg 0 )0 + qg) = (f, Lg) (46) I termini di bordo che vengono dall’integrazione per parti si annullano a causa delle condizioni al contorno scelte (43) o (44). Ad esempio, per (43) e β2 6= 0, all’estremo b otteniamo: p(f 0 g − f g 0 )(b) = p(b)(−β1 /β2 )(f g − f g)(b) = 0. Lo stesso risultato vale per β2 = 0 e per l’estremo a. L’operatore L e’ quindi simmetrico; coi metodi della sezione 1.4 si può dimostrare che è anche autoaggiunto. Lo stesso vale per le condizioni (44). Condizioni al contorno più generali dovranno essere scelte in modo che i termini al bordo dell’integrazione per parti si cancellino e che l’operatore sia autoaggiunto oltre che simmetrico. Nel caso in cui l’intervallo [a, b] sia illimitato, i termini al bordo valutati nel punto all’infinito si annullano automaticamente piochè ogni funzione L2 [a, b] si annulla all’infinito. Perciò se a o b o entrambi sono infiniti, in questi punti non occorre imporre alcuna condizione. Si richiede tuttavia di trovare una soluzione L2 [a, b]: la condizione implicita che deve essere imposta all’infinito alle soluzioni dell’equazione differenziale è di essere a quadrato sommabile. Questa è la condizione naturale da imporre se si vuole formulare il problema in uno spazio di Hilbert. È anche la condizione naturale da imporre in un problema di Meccanica Quantistica. Usando il teorema 6 otteniamo immediatamente Teorema 9: Dato un sistema di SL formulabile come un problema agli autovalori per un operatore in uno spazio di Hilbert: a) gli autovalori sono reali b) le soluzioni (autovettori) corrispondenti ad autovalori diversi sono ortogonali nel prodotto scalare di L2ω . Gli autovettori di un sistema di SL formano un s.o.n. che non è necessariamente completo, dato che un generico operatore avrà anche spettro continuo. Il problema di 19 E E2 V=x 2 /2 V=0 x E1 determinare lo spettro di un operatore differenziale è complesso. I metodi più usati per determinare lo spettro sono: I: studiare il risolvente di L. Ogni equazione differenziale ordinaria si può convertire in un’equivalente equazione integrale, ottenuta invertendo l’operatore differenziale Z b −1 k(x, y)u(y)dy (47) Lu(x) = λu(x) , → u(x) = λL u(x) ≡ a Il nucleo integrale k(x, y) si chiama funzione di Green associata all’operatore differenziale L. Gli operatori integrali sono più semplici studiare e lo spettro di L si può determinare studiando lo spettro dell’operatore integrale associato. In particolare, se la funzione di Green k(x, y) risulta essere a quadrato sommabile, il teorema 8 garantisce che lo spettro dell’operatore integrale, e quindi lo spettro di L, è puramente discreto. Operatori differenziali di questo tipo si chiamano a risolvente compatto. In questo caso gli autovettori di L formano un s.o.n.c. II: ridurre, se possibile, l’equazione differenziale ad un’equazione di Schroedinger stazionaria. Consideriamo l’equazione di Schroedinger stazionaria per una particella sulla retta soggetta al potenziale V (x) d2 u − 2 + V (x)u = Eu (48) dx L’equazione è evidentemente della forma SL con p = 1, q = V (x) e ω = 1; per uniformarci alle notazioni della MQ, abbiamo chiamato E l’autovalore λ. La funzione d’onda u R rappresenta una densità di probabilità, ed è normalizzata R |u|2 dx = 1. La condizione da imporre all’infinito è quindi l’integrabilità L2 . Equivalentemente, dobbiamo risolvere d2 il problema agli autovalori Hu = Eu in L2 (R) per l’operatore autoaggiunto H = − dx 2 + V (x). Alla funzione V (x) si richiede di essere sufficientemente regolare. Consideriamo il potenziale indicato a sinistra nella figura. Classicamente la particella di energia E è obbligata a muoversi nell’intervallo definito dalla disuguaglianza E − V (x) = p2 /2 ≥ 0. Nell’intervallo di energia [E1 , E2 ] la particella è costretta ad oscillare in una regione finita di spazio, nell’intervallo [E2 , ∞] la particella può muoversi fino all’infinito. Come discusso 20 in ogni buon testo di MQ, quantisticamente esisteranno dei livelli energetici discreti En da cercarsi dove il moto classico é limitato in una regione finita, σd (H) = {En } ⊂ [E1 , E2 ] e uno spettro continuo di energie corrispondente ai valori classici dell’energia per cui il moto è illimitato, σc (H) = [E2 , ∞]. Notiamo che gli autovalori dell’operatore H corrispondono solo ai livelli energetici discreti. L’intero insieme dei possibili valori dell’osservabile energia è associato all’intero spettro dell’operatore H. Gli autovalori generalizzati uE per E ∈ σc (H) sono tipicamente delle funzioni non in L2 (R) che hanno la forma di onde piane per grande x positivo. Nella figura sono indicati due casi limite. Per V (x) = 0 lo spettro è puramente continuo σc (H) = [0, ∞] con autofunzioni generalizzate che sono onde piane uE = eipx , E = p2 /2. Il caso V (x) = x2 /2, corrispondente ad un oscillatore armonico, ha spettro puramente discreto En = (n + 1/2) con autofunzioni che 2 sono i polinomi di Hermite un = Hn (x)e−x /2 . Un risultato generale è il seguente. Il problema di SL con a e b finiti, p, p0 , ω e q funzioni continue reali in [a, b] e p, ω > 0 il problema si dice regolare. Per sistemi di SL regolari vale il teorema [1]: Teorema 10: Gli autovettori di un sistema di SL regolare formano un insieme numerabile {yn } che, opportunamente normalizzato, è un s.o.n.c. in L2ω [a, b]. I problemi di SL regolari sono in assoluto i più semplici ma hanno poche applicazioni. Esempio 1. continuazione: consideriamo il problema di SL y 00 + λy = 0, 0≤x≤π y(0) = y(π) = 0 (49) √ Il problema è regolare con p = 1, q = 0 e ω = 1. La soluzione generale è y = A sin λx + √ √ B cos λx. Le condizioni al contorno impongono B = 0 e sin λπ = 0 da cui λ = n2 , n = 1, 2, .... Otteniamo l’insieme di autovalori e autovettori: {λn = n2 , yn = sin nx}. Osserviamo che gli autovalori sono reali, gli autovettori mutuamente ortogonali e che gli autovettori, opportunamente normalizzati, formano un s.o.n.c.: i seni sono la base di Fourier (dispari) per il semi-periodo [0, π]. Esempio 1a: consideriamo il problema di SL y 00 + λy = 0, 0≤x≤π y(0) = y(π) y 0 (0) = y 0 (π) 21 (50) Il problema è anch‘esso regolare. Le condizioni al contorno questa volta selezionano il sistema di autovettori {e2inx } con autovalori λ = 4n2 , n ∈ Z. Anche in questo esempio gli autovalori sono reali, gli autovettori mutuamente ortogonali e che gli autovettori, opportunamente normalizzati, formano un s.o.n.c.: la base di Fourier sul periodo [0, π]. Notiamo che, in questo esempio, ogni autovalore ha molteplicità due (e±2inx sono entrambi associati all’autovalore 4n2 ). Autovettori corrispondenti ad autovalori diversi sono ortogonali. All’interno di ogni autospazio (di dimensione due) sono stati scelti due autovettori ortogonali in modo che l’insieme di tutti gli autovettori formi un s.o.n.c.. I problemi di SL più interessanti sono però singolari. Un problema può essere singolare, ad esempio, se p o ω si annullano (o divergono) in a o in b, oppure, ancora più semplicemente, se l’intervallo [a, b] non è limitato. Le soluzioni delle equazioni differenziali potrebbero essere discontinue e illimitate agli estremi dell’intervallo. Usualmente, all’estremo singolare si impongono condizioni quali la limitatezza oppure l’integrabilità L2 (quest’ultima è la condizione che si impone ad esempio nei problemi provenienti dalla Meccanica Quantistica). Esempio 2: polinomi di Legendre. Consideriamo d 2 dy (1 − x ) + λy = 0, dx dx −1 ≤ x ≤ 1 (51) e richiediamo alle soluzioni di essere limitate in x = ±1. Abbiamo p = 1−x2 , q = 0, ω = 1. Il problema è singolare perchè p(±1) = 0. Gli autovalori sono λl = l(l+1) con autovettori i polinomi di Legendre Pl (x) che formano, dopo normalizzazione, un s.o.n.c. in L2 [−1, 1]. Esempio 3: polinomi di Hermite. Consideriamo d 2 −x2 dy e + e−x λy = 0, dx dx −∞ < x < ∞ (52) e richiediamo che le soluzioni siano L2 all’infinito. L’equazione di Hermite si incontra in Meccanica Quantistica nello studio dell’oscillatore armonico. La condizione al contorno 2 che abbiamo imposto è quella naturale in Meccanica Quantistica. p = ω = e−x , q = 0. Il problema è singolare perchè l’intervallo è infinito. Gli autovalori sono λn = 2n con 2 autovettori Hn (x) che definiscono un s.o.n.c. in L2 (R, e−x dx). Notiamo che la presenza di una funzione non banale ω ci dice che gli autovettori del problema di SL sono un sistema ortonormale in L2 (R) col prodotto scalare (f, g)ω o equivalentemente in L2 (R) 2 con misura e−x dx. L’equazione per i polinomi di Hermite si riconduce all’equazione di 2 Schroedinger per V (x) = x2 /2 con un semplice cambio di variabile u(x) = y(x)e−x /2 . 22 Esempio 4: polinomi di Laguerre. Consideriamo d −x dy e + e−x λy = 0, dx dx 0<x<∞ (53) e richiediamo che le soluzioni siano L2 all’infinito. l’equazione di Laguerre si incontra in Meccanica Quantistica nello studio dell’atomo di idrogeno: x è la coordinata radiale in coordinate sferiche. Gli autovalori sono λn = n con autovettori Ln (x) che definiscono un 2 s.o.n.c. in L2 ((0, ∞), e−x dx). 1.7.3 Equazioni Differenziali alle Derivate Parziali Consideriamo una classe particolare di operatori alle derivate parziali, gli operatori ellittici. Un operatore del II ordine D X D X ∂2 ∂ L= aij (x) + bi (x) + c(x) ∂xi ∂xj ∂xi i,j=1 i=1 (54) si dice ellittico se la matrice simmetrica corrispondente ai termini con due derivate aij (x) è definita positiva (o definita negativa). L’equazione di Laplace, l’equazione di Poisson, l’equazione di Schoedinger stazionaria sono esempi di equazioni ellittiche. Gli operatori ellittici sono in assoluto i più semplici, a cominciare dalle proprietà dello spettro, Teorema 11: lo spettro di un operatore ellittico su uno spazio compatto L2 (K) è puramente discreto. Esempio 1: armoniche sferiche. Sono le autofunzioni del Laplaciano ristretto alla sfera S 2 . Si ottengono in tutta una classe di equazioni della fisica matematica con simmetria sferica. Dalla separazione delle variabili u(r, θ, φ) = U (r)Y (θ, φ) nell’equazione di Laplace otteniamo due equazioni per Y = P (cos θ)Φ(φ): d m2 2 dP (1 − x ) + (λ − )P = 0, −1 ≤ x ≤ 1 dx dx 1 − x2 Φ00 + λ̃Φ = 0 (55) dove x = cos θ e λ, λ̃ sono gli autovalori da determinare. La seconda equazione è immediatamente risolta Φ = eimφ , λ̃ = m2 ; l’ovvia condizione al contorno da richiedere è la periodicità in φ ∈ [0, 2π] che richiede che |m| = 0, 1, 2, .... Nella prima equazione, richiediamo invece alle soluzioni di essere limitate in x = ±1; x = ±1 corrispondono infatti al polo nord e al polo sud della sfera unitaria in cui nulla di speciale deve succedere. 23 Per la prima equazione abbiamo p = 1 − x2 , q = m2 /(1 − x2 ), ω = 1. Il problema è singolare perchè p(±1) = 0 e q(±1) = ∞. Gli autovalori sono λl = l(l + 1), |m| ≤ l, l = 0, 1, 2... con autovettori Plm (x), polinomi di Legendre generalizzati. Le armoniche sferiche Ylm (θ, φ) = Plm (cos θ)eimφ formano, dopo normalizzazione, un s.o.n.c. in L2 [S 2 , dΩ(2) ], dove dΩ(2) = sin θdθdφ è la misura sulla sfera unitaria S 2 . Gli operatori ellittici hanno inoltre importanti proprietà di regolarità Teorema 12 - lemma di Weyl: ogni funzione o distribuzione u(x) che risolva l’equazione ellittica Lu = f è C ∞ nei punti in cui i coefficienti aij (x), bi (x), c(x) e il termine noto f (x) sono C ∞ . Questo teorema si applica ad esempio all’equazione di Laplace e di Schroedinger stazionaria. Le soluzioni dell’equazione di Laplace sono automaticamente C ∞ , le soluzioni dell’equazione di Poisson o dell’equazione di Schoedinger stazionaria sono C ∞ nei punti in cui la densità di carica o il potenziale sono C ∞ . Infine, per operatori ellittici, i problemi al contorno formulati su insiemi compatti soddisfano teoreni di esistenza, unicità e dipendenza continua dai dati iniziali. 2 Appendice: Il complemento ortogonale Una proprietà importante degli spazi di Hilbert riguarda la possibilità di proiettare un vettore su un sottospazio. Teorema A: Dato un sottospazio chiuso V dello spazio di Hilbert H, per ogni vettore f ∈ H esiste unico un vettore f ∗ ∈ V con la proprietà kf − f ∗ k = minv∈V kf − vk (56) Dim: sia d = inf{kf − vk, v ∈ V }. Occorre dimostrare che l’estremo inferiore è in realtà un minimo. Se d = 0, f ∈ V e f ∗ = f . Possiamo quindi supporre che d > 0. Consideriamo gli insiemi Cn = {v ∈ V |kv −f k ≤ d+1/n}. Dall’identità 2(kxk2 +kyk2 ) = kx + yk2 + kx − yk2 segue che, se v1 , v2 ∈ V , 2(kv1 − f k2 + kv2 − f k2 ) = kv1 + v2 − 2f k2 + kv1 − v2 k2 kv1 − v2 k2 = 2kv1 − f k2 + 2kv2 − f k2 − kv1 + v2 − 2f k2 ≤ 2 d + n1 + 2 d + n1 − 4d2 ≤ 8 nd + n42 (57) Nel penultimo passaggio si è usato il fatto che, poiché (v1 +v2 )/2 ∈ V , kf −(v1 +v2 )/2k ≥ d. Scegliendo una successione di vettori {vn } ∈ Cn avremo che d 4 kvn − vn+p k2 ≤ 8 + 2 (58) n n 24 tende a zero per n → ∞ per qualunque p, poiché vn , vn+p ∈ Cn . Questo implica che {vn } ∈ Cn è di Chauchy e quindi converge. Il limite f ∗ sarà contenuto in V poiché V è chiuso. Da kvn − f k ≤ d + 1/n segue che kf − f ∗ k ≤ d. Poiché d è l’estremo inferiore dei possibili valori kf − vk, ne segue che kf − f ∗ k = d. f ∗ è unico: supponiamo infatti che esistano due vettori che soddisfino d = kf − f1 k = kf − f2 k. Usando una minorazione analoga a quella della formula (57) otteniamo kf1 − f2 k2 = 2kf1 − f k2 + 2kf2 − f k2 − kf1 + f2 − 2f k2 = 4d2 − kf1 + f2 − 2f k2 ≤ 4d2 − 4d2 = 0 che è possibile solo per f1 = f2 . 2 Osservazione: il teorema è valido nell’ipotesi meno restrittiva che V sia un insieme convesso chiuso. La chiusura è un’ipotesi necessaria. Il vettore f ∗ è noto come la miglior approssimazione di f in V . È anche caratterizzabile come la proiezione ortogonale di f su V . Vale infatti: Teorema B: f ∗ è univocamente determinato dalla proprietà (f − f ∗ , v) = 0 per tutti i vettori v ∈ V . Dim: Se (f − f ∗ , v) = 0 per tutti i vettori v ∈ V , vale anche (f − f ∗ , f ∗ − v) = 0. Dal teorema di Pitagora segue che kf −vk2 = kf −f ∗ k2 +kf ∗ −vk2 e quindi kf −f ∗ k2 ≤ kf −vk2 per ogni v ∈ V . Ne segue che f ∗ è la miglior approssimazione di f in V . Viceversa, sia f ∗ la miglior approssimazione. Prendiamo v = f ∗ + αw con w ∈ V, α ∈ C. Abbiamo che kf − f ∗ k2 ≤ kf − vk2 = kf − f ∗ − αwk2 = kf − f ∗ k2 + kα|2 kwk2 − α(w, f − f ∗ ) − α∗ (w, f − f ∗ )∗ da cui α(w, f − f ∗ ) + α∗ (w, f − f ∗ )∗ ≤ |α|2 kwk2 . Prendendo α = |α|eiθ con |α| → 0 si ottiene eiθ (w, f − f ∗ ) + e−iθ (w, f − f ∗ )∗ ≤ 0. Prendendo θ = 0, π/2, π, 3π/2 si ottiene Re, Im(w, f − f ∗ ) ≥ 0 e contemporaneamente Re, Im(w, f − f ∗ ) ≤ 0, da cui si conclude (f − f ∗ , w) = 0. 2 Dato un insieme S definiamo il suo complemento ortogonale come l’insieme S ⊥ = {f ∈ H|(f, s) = 0, s ∈ S} (59) S ⊥ è sempre un sottospazio chiuso di H. Infatti da x, y ∈ S ⊥ segue che (αx + βy, s) = 0 per ogni s ∈ S per la linearità del prodotto scalare, e da xn ∈ S → x segue che (x, s) = lim(xn , s) = 0 per la continuità del prodotto scalare. 25 Teorema C: Dato un sottospazio chiuso V di H, ogni f ∈ H si scrive in maniera unica come f = x + y con x ∈ V, y ∈ V ⊥ . In simboli H =V ⊕V⊥ (60) Dim: x è definito come la proiezione f ∗ di f su V e y come f − f ∗ . y ∈ V ⊥ per il Teorema B. L’unicità della decomposizione segue dal fatto che, se f = x + y = x0 + y 0 , x − x0 = y − y 0 uguaglia vettori in V e V ⊥ che hanno in comune il solo vettore zero. Ne segue x = x0 e y = y 0 . 2 Osservazione: Se V è un sottospazio non chiuso il Teorema C si può riformulare come H = V̄ ⊕ V ⊥ . Vale anche S ⊥⊥ = S̄. Quest’ultimo risultato segue dalla doppia applicazione del risultato precedente, una volta a V = S̄ e l’altra a V = S ⊥ : H = S̄ ⊕ S ⊥ = S ⊥ ⊕ S ⊥⊥ . Eliminando il fattore comune S ⊥ si ottiene il risultato voluto. References [1] Dispense per Metodi Matematici della Fisica, http://castore.mib.infn.it/.̃zaffaron/ [2] Reed e Simon, Methods of Modern Mathematical Physics, Academic Press, Quattro Volumi. [3] Mikusinski, Introduction to Hilbert Spaces, Academic Press. [4] W. Rudin, Functional Analysis, MacGraw-Hill. 26