1 Operatori negli spazi di Hilbert

1
1.1
Operatori negli spazi di Hilbert
Operatori lineari in spazi normati
Definizione 1 Una mappa lineare (operatore) tra spazi normati f : X → Y è una
mappa che preserva la struttura lineare
f (αx + βy) = αf (x) + βf (y),
x, y ∈ X, α, β ∈ C
(1)
Un operatore che abbia come immagine C (X → C) viene anche chiamato funzionale
lineare.
Definizione 2 Una mappa lineare tra spazi normati f : X → Y si dice limitata se
esiste una costante K tale per cui
kf (x)k ≤ Kkxk
∀x ∈ X.
(2)
Una mappa limitata manda insiemi limitati in insiemi limitati. Infatti, un insieme è
limitato se è contenuto in una sfera di raggio r (kxk ≤ r); l’immagine della sfera di raggio
r è però contenuta nella sfera di raggio Kr a causa della definizione 2 (kf (x)k ≤ Kr).
Negli spazi normati il concetto di limitatezza è equivalente a quello di continuità.
Vale infatti il seguente teorema,
Teorema 1 Sia f : X → Y una mappa lineare tra spazi normati. Le seguenti affermazioni
sono tra loro equivalenti:
a) f è limitata
b) f è continua
c) f è continua in un punto
Dim: a) → b): da kf (y) − f (x)k = kf (y − x)k ≤ Kkx − yk, segue che x → y implica
f (x) → f (y). b) → c): ovvio. c) → a): f sia continua in x0 . Per ogni esiste un δ tale
per cui
kf (x + x0 ) − f (x0 )k = kf (x) + f (x0 ) − f (x0 )k = kf (x)k < (3)
δy
per ogni kxk < δ. Fissato e un generico y ∈ X, x = (2kyk)
soddisfa kxk =
δy
kf ( 2kyk
)k < e, di conseguenza, kf (y)k < 2δ kyk. f è quindi limitata. 2
δ
2
< δ. Quindi
Definizione 3 Si definisce norma della mappa lineare f il più piccolo dei numeri K per
cui l’identità (2) è valida. La norma di f viene indicata con kf k. Vale quindi
kf (x)k ≤ kf kkxk
1
(4)
x
per ogni x ∈ X. Poichè f è lineare, questa identità si può riscrivere come kf ( kxk
)k ≤ kf k.
La formula (4) è quindi equivalente a
kf (x)k ≤ kf k,
kxk = 1
(5)
e kf k può anche essere definito come
kf k = supkxk=1 kf (x)k.
(6)
L’insieme degli operatori continui tra due spazi normati X e Y
B(X, Y ) = {f : X → Y |f lineare limitato}
(7)
munito della mappa f → kf k è uno spazio vettoriale normato.
Teorema 2 B(X, Y ) è uno spazio vettoriale normato. È completo se Y è completo.
Dim: È immediato verificare che kf k definisce una norma. Sia An una successione di
Cauchy in B(X, Y ). Vale quindi kAn − Am k < per n, m > n0 . Da
kAn (x) − Am (x)k = k(An − Am )(x)k ≤ kAn − Am kkxk < kxk
(8)
concludiamo che kAn (x)k è una successione di Cauchy in Y per ogni x fissato. Poichè Y
è completo, An (x) convergerà a un vettore in Y che chiamiamo A(x). A è ovviamente
un operatore lineare ed è anche continuo; infatti passando al limite nell’equazione (8)
otteniamo kA(x)−An (x)k ≤ kxk e kA(x)k = k(A(x)−An (x))+An (x)k ≤ (+kAn k)kxk.
Quindi A ∈ B(X, Y ). Infine dalle stesse equazioni segue che kAn − Ak ≤ e che la
successione An converge ad A nella norma di B(X, Y ). 2
Ricordiamo che uno spazio vettoriale normato completo si chiama spazio di Banach.
Se Y è uno spazio di Banach anche B(X, Y ) lo è. In particolare, B(H) ≡ B(H, H), cioè
lo spazio vettoriale degli operatori lineari continui in uno spazio di Hilbert, è uno spazio
di Banach.
1.2
Isomorfismo tra spazi di Hilbert
Definizione 3: Un isomorfismo tra spazi normati (o spazi di Hilbert) è una mappa
lineare biunivoca che preserva la norma: kf (x)k = kxk.
Osservazioni: una mappa che preserva la norma si chiama anche isometria. In generale, un isomorfismo tra spazi è una mappa biunivoca che preserva le proprietà (algebriche, topologiche, etc...) che sono definite su questi spazi. Nel caso particolare in cui lo
spazio normato sia anche uno spazio di Hilbert sembrerebbe più naturale definire un isomorfismo come una mappa lineare che preserva il prodotto scalare: (f (x), f (y)) = (x, y).
2
Le due definizioni sono in realtà equivalenti: qualora in uno spazio siano definiti sia un
prodotto scalare che l’associata norma, una mappa lineare che preserva l’uno preserva
anche l’altra, e viceversa. Infatti, norma e prodotto scalare si possono ricostruire una
dall’altro attraverso le identità
kxk2 = (x, x)
4(x, y) = kx + yk2 − kx − yk2 + i(kx + iyk2 − kx − iyk2 )
(9)
Esempio 1: Ogni spazio di Hilbert H separabile è isomorfo a l 2 . Ricordiamo che uno
spazio di Hilbert si dice separabile quando possiede un sistema ortonormale completo
(s.o.n.c.) numerabile. In uno spazio di Hilbert separabile, scelto un s.o.n.c. {xi }, ogni
P
x ∈ H si scrive in maniera unica come x =
ai xi . Questa identificazione induce una
2
mappa H → l : x → {ai } che è un isomorfismo di spazi di Hilbert. Innanzitutto, la
P
mappa è ben definita ed è un’isometria perchè
|ai |2 = kxk2 . La mappa è iniettiva
per l’unicità dei coefficienti di Fourier, ed è suriettiva perchè, per ogni successione in l 2
P
P
vale
|ai |2 < ∞ e di conseguenza la formula x =
ai xi definisce un elemento di H.
L’isomorfismo in questione non è naturale perchè richiede la scelta di una base.
Esempio 2: La trasformata di Fourier può essere pensata come una mappa lineare da
L2 (R) in L2 (R). Preserva la norma kfˆk = kf k (teorema di Parseval) ed è biunivoca. È
pertanto un isomorfismo.
1.3
Il teorema di Riesz
Il teorema di Riesz caratterizza i funzionali lineari continui in uno spazio di Hilbert.
Ricordiamo dall’algebra lineare che l’insieme dei funzionali lineari in uno spazio vettoriale
V è anch‘esso uno spazio vettoriale che prende il nome di spazio duale V ∗ . Nel caso di
spazi normati è utile modificare la definizione richiedendo che V ∗ sia lo spazio vettoriale
dei funzionali lineari continui. Dal teorema 2, segue che V ∗ è uno spazio vettoriale
normato completo. Nel caso finito-dimensionale, V e V ∗ hanno la stessa dimensione e
sono quindi banalmente isomorfi. La struttura di spazio di Hilbert consente di definire
un isomorfismo naturale tra H e il suo duale H ∗ per ogni spazio di Hilbert. Per ogni
x0 ∈ H possiamo definire un particolare funzionale lineare continuo H → C : x → (x, x0 ).
Il teorema di Riesz garantisce che ogni funzionale continuo ha questa forma e stabilisce
un’isomorfismo tra H e H ∗ .
Teorema 3 (Riesz): Ogni funzionale lineare continuo L su uno spazio di Hilbert H si
può scrivere in maniera univoca come L(x) = (x, x0 ). Vale inoltre kLk = kx0 k.
3
Dimostrazione: Nel caso particolare L = 0, x0 = 0 e il teorema è ovvio. Possiamo
quindi supporre L 6= 0. Definiamo M = {x ∈ H|Lx = 0}. Poichè L è lineare e continuo,
M è un sottospazio chiuso di H ed ammette quindi un complemento ortogonale M ⊥ .
Scegliamo un particolare z ∈ M ⊥ con kzk = 1. Definito u = L(x)z − L(z)x, abbiamo
che L(u) = L(x)L(z) − L(z)L(x) = 0; quindi u ∈ M . Visto che u ∈ M e z ∈ M ⊥ ,
0 = (u, z) = L(x)(z, z) − L(z)(x, z). Ne segue che L(x) = L(z)(x, z) = (x, L(z)z).
Quindi il teorema vale con x0 = L(z)z. Da |L(x)| = |(x, x0 )| ≤ kxkkx0 k segue che
kLk ≤ kx0 k. Visto che |L(x0 )| = kx0 k2 , la disuguaglianza precedente è certamente
saturata e kLk = kx0 k. L’unicità segue dal fatto che, se L(z) = (x, x0 ) = (x, x00 ), allora
(x, x0 − x00 ) = 0; x0 − x00 è quindi nullo perchè ortogonale a qualunque vettore nello spazio
di Hilbert. 2
1.4
Esempi di operatori negli spazi di Hilbert
Consideremo operatori lineari A : H → H. Per semplicità le parentesi tonde in A(x)
saranno a volte omesse: Ax sta per A(x). Se non altrimenti specificato, useremo lettere
maiuscole dell’alfabeto latino per indicare operatori negli spazi di Hilbert, lettere minuscole (della parte finale) dell’alfabeto latino per indicare vettori in H e lettere greche per
indicare scalari.
Esempio 1: caso finito dimensionale. A : H → H, dimH = N . Scegliamo una
PN
base ei , i = 1, ..., N . Consideriamo lo sviluppo di x e di Ax: x =
i=1 xi ei e Ax =
PN
i=1 (Ax)i ei . Si ha che
N
N
X
X
(Ax)i = (Ax, ei ) = (A(
xj ej ), ei ) =
xj (Aej , ei )
j=1
(10)
j=1
Vediamo che A, in termini delle coordinate rispetto alla base scelta, è rappresentato da
una matrice
N
X
(Ax)i =
Aij xj ,
Aij = (Aej , ei )
(11)
j=1
Gli operatori negli spazi infinito dimensionali generalizzano il concetto di matrice.
Come dimostrano i seguenti esempi, molte proprietà valide negli spazi di dimensione
finita sono false negli spazi di dimensione infinita.
Esempio 2: operatore di shift in H = l 2 . A({a1 , a2 , ....}) = {0, a1 , a2 , ....} definisce un
operatore lineare continuo con norma 1. È infatti un’isometria: kAxk = kxk. È iniettivo
ma non suriettivo: l’elemento z = {1, 0, 0, ....} non è infatti nell’immagine di A. A mappa
4
H biunivocamente in un suo sottoinsieme proprio A(H) = ({z})⊥ . Questo è possibile
solo perchè H è infinito-dimensionale. A si può rappresentare come una matrice infinita
Aij , i, j = 1, 2.... le cui sole entrate non nulle sono Ai+1,i = 1, i = 1, 2....
Esempio 3: gli operatori posizione e momento della Meccanica Quantistica. Definiamo
in L2 [a, b] − ∞ ≤ a < b ≤ ∞ gli operatori
x̂ :
p̂ :
x̂f (x) = xf (x)
df
p̂f (x) = −i (x)
dx
(12)
I due operatori soddisfano le regole di commutazione di Heisenberg [x̂, p̂] = i come segue
dal semplice calcolo
x̂p̂f (x) − p̂x̂f (x) = −ix
d
d
f (x) + i (xf (x)) = if (x)
dx
dx
(13)
Esistono operatori A e B che soddisfano l’algebra astratta di Heisenberg [A, B] = i
soltanto in spazi infinito dimensionali. Infatti, in uno spazio di dimensione finita N ,
A e B sarebbero rappresentabili da matrici N per N e l’equazione [A, B] = i sarebbe
inconsistente, come si vede prendendo la traccia:
0 = Tr[A, B] = Tr(AB) − Tr(BA) = Tr(AB) − Tr(AB) ≡ N
(14)
dove si è usata la properietà di ciclicità della traccia.
Esempio 4: operatori differenziali in H = L2 (X), X sottoinsieme di Rn . Per semplicità
consideriamo X = (a, b), −∞ ≤ a < b ≤ ∞ e il più semplice degli operatori differenziali: A = −i∂x . L’operatore A ha due seri problemi: 1) Non è continuo. Consideriamo
ad esempio yn (x) = e−nx in L2 [0, π]. Ayn = inyn e di conseguenza kAyn k/kyn k = n
non può essere limitato. 2) Non è nemmeno definito ovunque. Infatti non tutte le funzioni a quadrato sommabile sono derivabili con derivata ancora appartenente allo stesso
spazio. A è definito solo su un sottoinsieme D(A) di H che prende il nome di dominio
dell’operatore. D(A) contiene almeno tutte le funzioni C 1 [a, b] ed è un sottoinsieme denso
di L2 [a, b]. I problemi 1)+2) sono comuni a tutti gli operatori differenziali.
Osservazione sul dominio: l’esempio 4 descrive una caratteristica generale della teoria
degli operatori negli spazi di Hilbert: gli operatori di maggior interesse non sono continui
e non sono nemmeno definiti sull’intero H. Gli operatori continui possono sempre estesi
all’intero H. Se un operatore continuo A è definito in un dominio D(A) può sempre
essere esteso a D(A) per continuità. Vale infatti
5
Teorema 4: Un operatore lineare A in uno spazio normato completo X che sia definito
e continuo in un sottoinsieme denso U può essere esteso ad un operatore continuo definito
sull’intero X.
Dim: Vale kAxk ≤ kAkkxk in U . Poichè U è denso in X, ogni x ∈ X sarà limite di una
successione di elementi xn in U . Poichè xn converge, sarà di Cauchy, quindi kxn −xm k < per n, m sufficientemente grandi. Da kAxn − Axm k = kA(xn − xm )k ≤ kAkkxn − xm k <
kAk segue che la successione Axn è di Cauchy, e quindi, per la completezza di X, converge
ad un elemento che chiamiamo Ax. Prendendo il limite dell’equazione kAxn k ≤ kAkkxn k
otteniamo kAxk ≤ kAkkxk. La mappa x → Ax definisce quindi un’estensione di A
all’intero spazio X. L’estensione è ancora un operatore continuo con la stessa norma di
A definito in U .2
A si può poi estendere ad H in molti modi possibili. Il più semplice è richiedere, ad
⊥
esempio, che si annulli in D(A) . In questo modo si ottiene un’estensione continua di A
all’intero H. Nel seguito supporremo pertanto che ogni operatore continuo sia definito
sull’intero H.
Come abbiamo visto, gli operatori non continui sono invece definiti solo su un sottoinsieme di H e, in generale, non sono estendibili all’intero H. In questo caso è importante
specificare il dominio di definizione. Poichè le proprietà degli operatori possono variare
a seconda dell’insieme di definizione, nel seguito, la parola operatore implicitamente indicherà la coppia (A, D(A)). È ragionevole richiedere almeno che il dominio D(A) sia
un sottoinsieme denso di H. La mancanza di continuità viene solitamente rimpiazzata
da una condizione più debole ma sufficiente per molte applicazioni, la chiusura. Un
operatore si dice chiuso se le due condizioni xn → x e Axn → y implicano y = Ax
1
. Richiederemo sempre agli operatori non continui di essere densamente definiti (cioè
D(A) = H) e chiusi.
1.5
Operatori autoaggiunti e unitari
Dato un operatore (A, D(A)) densamente definito in H (cioè D(A) = H) esiste l’operatore
aggiunto (A∗ , D(A∗ )) che soddisfa
(Ax, y) = (x, A∗ y),
x ∈ D(A), y ∈ D(A∗ )
(15)
ed è definito in
D(A∗ ) = {y ∈ H|Ly : H → C, x → (Ax, y) funzionale lineare continuo}
1
(16)
Nel caso di operatori continui la sola condizione xn → x implica Axn → Ax. Nel caso di operatori
non continui Axn potrebbe anche non convergere. Per operatori chiusi, se xn converge a x e Axn
converge, quest’ultimo deve convergere a Ax. La definizione di chiusura si può riformulare in maniera
più semplice cosı̀: un operatore A si dice chiuso se il suo grafico, cioè l’insieme delle coppie {(x, Ax)},
è un sottoinsieme chiuso di H × H.
6
Nel caso di operatori continui l’equazione (15) vale per tutti gli x, y ∈ H. Nel caso di
operatori non continui, l’aggiunto è definito nel dominio indicato, che potrebbe essere
diverso da quello di A.
L’esistenza dell’aggiunto è garantita dal teorema di Riesz. Per y ∈ D(A∗ ) fissato, la
mappa Ly : D(A) → C : x → (Ax, y) è un funzionale lineare continuo definito in
D(A). Poichè D(A) è denso in H, il teorema 4 garantisce che Ly si può estendere ad
un funzionale continuo su H. Per il teorema di Riesz, esiste allora z ∈ H tale per cui
Ly (x) = (Ax, y) = (x, z) per ogni x. z dipenderà da y: chiamiamolo z = A∗ y. La mappa
A∗ che associa ad ogni y uno z è un operatore lineare che soddisfa l’equazione (15).
Esempio 1 Ogni operatore A in CN è associato ad una matrice Aij . Calcoliamo la
matrice associata a A∗ . Usando l’equazione (11): (A∗ )ij = (A∗ ej , ei ) = (ej , Aei ) =
(Aei , ej ) = Aji . La matrice dell’aggiunto di A è quindi la matrice aggiunta (o coniugata
hermitiana), cioè la matrice trasposta coniugata: A∗ij = Aji .
Non è difficile dimostrare che
Teorema 3: Se A è continuo anche A∗ è un operatore continuo e kA∗ k = kAk. Inoltre
A∗∗ = A.
Dim: Se A è continuo, è anche limitato: kAk < ∞. Usando l’identità di Schwarz,
otteniamo:
|(A∗ x, y)| = |(x, Ay)| ≤ kxkkAyk ≤ kxkkAkkyk
(17)
Scegliendo y = A∗ x otteniamo: kA∗ xk2 ≤ kxkkAkkA∗ xk cioè kA∗ xk ≤ kxkkAk; ne segue
che A∗ è limitato, quindi continuo, con
kA∗ k ≤ kAk.
(18)
In particolare, visto che A∗ è continuo, anche A∗∗ esiste ed è continuo; l’equazione (15)
ci dice che (A∗∗ x, y) = (x, A∗ y) = (Ax, y) per ogni x, y e quindi A∗∗ = A. La disuguaglianza (18) applicata a A∗∗ ci dice che kAk = kA∗∗ k ≤ kA∗ k, da cui kA∗ k = kAk.
2
Si può dimostrare [1] che il teorema precedente vale per operatori illimitati nella seguente
forma: se A è chiuso e densamente definito, A∗ è anch‘esso chiuso e densamente definito
e soddisfa A∗∗ = A.
Considereremo tre classi importanti di operatori:
1. Operatori autoaggiunti. A si dice autoaggiunto se A = A∗ .
7
Osservazione importante: nella definizione di autoaggiuntezza, l’affermazione A = A∗
va intesa come: (A, D(A)) = (A∗ , D(A∗ )). può succedere che, dato A definito su D(A), A∗
esista e coincida con A in D(A) ma sia definito in un dominio più ampio D(A∗ ) ⊃ D(A).
In questo caso l’operatore è solo formalmente autoaggiunto. Possiamo quindi definire
due forme di autoaggiuntezza:
A è simmetrico se vale
x, y ∈ D(A)
(Ax, y) = (x, Ay),
(19)
Questa condizione garantisce semplicemente che A∗ esiste e coincide con A in D(A). In
generale A∗ sarà un’estensione di A: D(A∗ ) ⊃ D(A).
A è autoaggiunto se vale A ≡ A∗ , cioè se A e A∗ coincidono come operatori (dominio
incluso!): D(A) = D(A∗ ).
Come vedremo, gli operatori autoaggiunti hanno proprietà che gli operatori simmetrici
non possiedono. Per operatori continui, che non hanno problemi di dominio, autoaggiuntezza e simmetria coincidono.
Esempio 1: nel caso finito-dimensionale, A è autoaggiunto se lo è la matrice corrispondente: Aij = Aji . Una matrice con questa proprietà si chiama anche simmetrica (nel
caso reale) o hermitiana (nel caso complesso).
Esempio 2: un altro esempio importante di operatore autoaggiunto è l’operatore A =
−i∂x in L2 [a, b], −∞ ≤ a < b ≤ ∞. L’operatore non è continuo. Consideriamo la formula
(15) per funzioni f, g molto regolari, in modo che tutte le formule e le manipolazioni
formali abbiano senso (notare che la i nella definizione di A è importante):
Z
(−i∂x f, g) =
b
0
(−if (t)g(t))dt =
−if g|ba
Z
+
b
f (t)(−ig 0 (t))dt = −if g|ba + (f, −i∂x g)
a
a
(20)
Condizione necessaria perchè l’operatore sia autoaggiunto è che il termine di bordo si
annulli. È quindi necessario specificare un dominio D(A), ovvero dire quali sono le
condizioni al contorno delle funzioni considerate. In particolare, l’annullarsi dei termini
di bordo per tutte le funzioni f, g ∈ D(A) garantisce l’equazione
(Af, g) = (f, Ag),
f, g ∈ D(A)
(21)
garantisce cioè che l’operatore è simmetrico. A∗ è quindi un’estensione di A. Tipicamente
D(A) viene inizialmente scelto sulla base del problema in considerazione, in modo da
8
annullare i termini al bordo. Se una considerazione più attenta mostra che in realtà A∗ è
definito su un dominio più ampio, si può tentare di estendere il dominio di A sperando che
quello di A∗ si restringa. Per approssimazioni successive si può arrivare ad un operatore
autoaggiunto: D(A) ⊂ D(A1 ) ⊂ ... ⊂ D(Aaut ) ⊂ ... ⊂ D(A∗1 ) ⊂ D(A∗ ), dove Aaut ≡
A∗aut , dominio incluso. Esistono molti domini diversi in cui A risulta simmetrico, mentre
ne esiste uno solo in cui A è autoaggiunto.
Consideriamo, ad esempio, l’operatore −i∂x in L2 (R). Ogni funzione in L2 (R) si annulla
all’infinito e i termini al bordo nell’equazione (20) si annullano automaticamente. Occorre
però scegliere ancora il dominio dell’operatore imponendo opportuni requisiti di regolarità
alle funzioni. La scelta più semplice di un dominio denso in L2 (R) composto da funzioni
molto regolari è S(R). L’operatore −i∂x non è però autoaggiunto S(R). Esistono infatti
funzioni g ∈
/ S(R) che soddisfano la condizione (−i∂f, g) = (f, −i∂g) per ogni f ∈ S(R).
Si può dimostrare che −i∂x in L2 (R) è simmetrico nel dominio S(R) e autoaggiunto nel
dominio {fAC , f 00 ∈ L2 (R)} 2 .
Consideriamo ora l’operatore −i∂x definito sull’intervallo limitato [0, 1]. Definiamo cinque
operatori diversi, che differiscono solo per la scelta del dominio :
AL = −i∂x
D(AL ) = {hAC , h0 ∈ L2 [0, 1]|h(0) = 0}
AR = −i∂x
D(AR ) = {hAC , h0 ∈ L2 [0, 1]|h(1) = 0}
A1 = −i∂x
D(A1 ) = {hAC , h0 ∈ L2 [0, 1]|h(0) = h(1) = 0}
A2 = −i∂x
D(A2 ) = {hAC , h0 ∈ L2 [0, 1]|h(0) = h(1)}
A3 = −i∂x
D(A3 ) = {hAC , h0 ∈ L2 [0, 1]}
(22)
Non è difficile verificare che A1 è simmetrico, A2 è autoaggiunto, A∗1 = A3 e A∗L = AR .
Cominciamo con l’osservare che i termini di bordo nell’equazione (20) non si annullano
per funzioni f, g che appartengono ai domini di AL , AR ; questi operatori non sono quindi
simmetrici. Calcoliamo l’aggiunto di AL : questo dovrà soddisfare l’equazione (AL f, g) =
(f, A∗L g) per ogni f ∈ D(AL ) e g ∈ D(A∗L ). Consideriamo la formula (20): AL e AR
agiscono entrambi come −i∂x e, se scegliamo f (0) = 0, i termini al bordo si cancellano
per ogni funzione che soddisfi g(1) = 0. Ne segue che (AL f, g) = (f, AR g) per ogni
f ∈ D(AL ) e g ∈ D(AR ), da cui concludiamo che A∗L = AR 3 . Consideriamo ora A1 , A2
2
Il suffisso AC indica che la funzione deve essere scelta assolutamente continua (cfr Rudin, Real and
Complex Analysis). Questa richiesta serve a garantire la validità del teorema fondamentale del calcolo
Rb
integrale (f (b) − f (a) = a f 0 (x)dx) e la possibilità di integrare per parti. È un requisito tecnico che
serve ad eliminare alcune funzioni patologiche che pure sono L2 con derivata L2 . Alcuni testi riformulano
le condizioni fAC , f 0 ∈ L2 in maniera equivalente richiedendo di lavorare nello spazio di Sobolev H 1 (che
è uno spazio di distribuzioni).
3
Per essere precisi, abbiamo solo dimostrato che A∗L è un‘estensione di AR : il dominio di A∗L potrebbe
essere più grande di quello di AR . Possiamo dimostrare che A∗L ≡ AR come segue. Sia dato g ∈ D(A∗L ),
9
e A3 : abbiamo una catena di operatori, con domini che soddisfano D(A1 ) ⊂ D(A2 ) ⊂
D(A3 ) e che coincidono a coppie nell’intersezione dei loro domini. Gli operatori A1 e A2
sono simmetrici poichè i termini di bordo nell’equazione (20) si annullano per funzioni
f, g ∈ D(Ai ), i = 1, 2. A3 non è invece simmetrico. Notiamo tuttavia che A1 non è
autoaggiunto. Infatti i termini di bordo nell’equazione (20) si annullano anche nel caso
in cui f si annulla agli estremi e g è arbitraria; per ogni coppia di funzioni f ∈ D(A1 )
e g ∈ D(A3 ) vale l’equazione (A1 f, g) = (f, A3 g). Ne concludiamo che A∗1 = A3 . In
maniera analoga ci si può convincere che A2 = A∗2 . A1 è quindi un operatore simmetrico
ma non autoaggiunto, mentre A2 è autoaggiunto.
2. Operatori unitari. U si dice unitario se U U ∗ = U ∗ U = I, dove I è l’identità. Nel
caso finito-dimensionale, U è unitario se lo è la matrice corrispondente. Gli operatori
unitari preservano norma e prodotto scalare: infatti (U x, U y) = (x, U ∗ U y) = (x, y). U
è ovviamente invertibile con inverso U ∗ . Un operatore unitario è quindi un’isomorfismo
di H in sè stesso. Visto che kU (x)k = kxk, U è necessariamente continuo e di norma
1. È anche possibile pensare agli operatori unitari come cambi di base nello spazio di
Hilbert: se {φi } è un s.o.n.c. anche {U φi } lo è, come si verifica facilmente usando le
proprietà che abbiamo appena discusso. Un esempio notevole di operatore unitario in
L(R) è l’operatore Trasformata di Fourier.
3. Proiettori. Per ogni sottospazio chiuso S di H abbiamo la decomposizione ortogonale
H = S + S ⊥ . Ogni x si scrive in maniera unica come x = y + z con y ∈ S, z ∈ S ⊥ . Il
proiettore P sul sottospazio S è definito dalla formula P x = y.
Teorema: P è continuo, autoaggiunto e idempotente (cioè P 2 = P ).
Dim: P 2 = P è ovvio. Da kxk2 = kyk2 + kzk2 , otteniamo kP xk2 = kyk2 ≤ kxk2 .
Quindi P è continuo e kP k ≤ 1. Infine, date le decomposizioni ortogonali di due vettori
xi = yi + zi , i = 1, 2 con P xi = yi , (P x1 , x2 ) = (y1 , x2 ) = (y1 , y2 + z2 ) = (y1 , y2 ) =
(y1 + z1 , y2 ) = (x1 , P x2 ) quindi P è autoaggiunto. 2
1.6
Autovalori e teoria spettrale
La teoria spettrale generalizza agli spazi di Hilbert lo studio di autovalori ed autovettori.
È noto dall’algebra elementare che ogni matrice autoaggiunta ha autovalori reali e una
che quindi soddisfa (AL f, g) = (f, A∗L g) per ogni f ∈ D(AL ). A∗L g esiste ed è L2 . Esiste quindi anche
R1
φ(x) = −i x A∗L gdx che soddisfa φ(1) = 0 e −i∂x φ = A∗L g. Vogliamo dimostrare che φ ≡ g, da cui
deduciamo che l’azione di A∗L su g è una derivata e che g(1) = 0, cioè A∗L = AR . Da (g, AL f ) =
R1 ∗
R1
R1
(A∗ g, f ) =
A g f¯ = −i ∂φf¯ = −iφf¯|1 +
φ(−i∂f ) = (φ, AL f ) deduciamo (g − φ, AL f ) = 0.
L
0
L
0
0
0
Non è difficile convincersi che l’immagine di AL è perlomeno densa in L2 : concludiamo che g = φ. Un
ragionamento analogo può essere usato per rendere rigorosi gli altri argomenti riportati nel testo.
10
base ortonormale di autovettori. In questa base la matrice è diagonale. In uno spazio
di Hilbert è necessario estendere il concetto di autovalore introducendo autovalori generalizzati e lo spettro di un operatore. La teoria spettrale garantisce che un operatore
autoaggiunto ha spettro reale e può essere diagonalizzato.
Ricordiamo che λ ∈ C e x ∈ H non nullo si definiscono autovalore e autovettore
dell’operatore A in H se vale
Ax = λx
(23)
Il nucleo Ker(A − λI) dell’operatore A − λI è quindi non nullo e si definisce autospazio
associato all’autovalore λ. L’operatore A − λI non è ovviamente invertibile.
È utile generalizzare il concetto di autovalore estendendolo a tutti i numeri λ ∈ C per
cui A − λI non è invertibile nel senso della seguente definizione:
Def: Si definisce spettro σ(A) dell’operatore A in uno spazio di hilbert H l’insieme dei
λ ∈ C per cui (A − λI)−1 ∈
/ B(H). Lo spettro si divide naturalmente in tre sottoinsiemi
disgiunti:
Spettro discreto: l’insieme dei λ ∈ C per cui A − λI non è iniettivo, e quindi non è
invertibile come mappa lineare
Spettro continuo: l’insieme dei λ ∈ C per cui A − λI è invertibile come mappa lineare,
è densamente definito ma (A − λI)−1 : Im(A − λI) → H non è un operatore continuo
Spettro residuo: l’insieme dei λ ∈ C per cui A − λI è invertibile come mappa lineare
ma non è densamente definito
Lo spettro discreto corrisponde all’insieme degli autovalori di A. Infatti se A−λI non
è iniettivo, Ker(A−λI) 6= 0 ed esiste almeno una soluzione non nulla dell’equazione Ax =
λx. Lo spettro continuo è la vera novità per gli operatori in spazi infinito dimensionali.
Poichè A − λI è invertibile, Ker(A − λI) = 0 e λ non è un autovalore. λ appartenente
allo spettro continuo è però un autovalore approssimato:
Teorema 5: Per ogni λ ∈ C appartenente allo spettro continuo, esiste una successione
di vettori xn tali per cui kAxn − λxn k → 0.
Dim: (A − λI)−1 non è continuo, quindi esiste una sucessione yn tale per cui k(A −
λI)−1 yn k ≥ nkyn k. Definendo wn = (A − λI)−1 yn si ha che kAwn − λwn k ≤ kwn k/n.
Infine se xn = wn /kwn k si ha che kAxn − λxn k ≤ 1/n → 0. 2
11
L’equazione agli autovalori può quindi essere approssimata a piacere quando λ appartiene
allo spettro continuo. Ovviamente la successione xn non può convergere in H. In caso
contrario, se xn → x ∈ H, il teorema 5 garantisce che Axn → λx, e quindi, sotto la
sola condizione che A sia chiuso, Ax = λx e λ sarebbe un autovalore. Tipicamente,
esiste uno spazio topologico H ⊂ Y di funzioni o distribuzioni a cui può essere estesa la
definizione dell’operatore A in cui la successione xn ∈ H converge a un vettore x ∈ Y
e vale l’equazione Ax = λx come equazione per vettori e operatori in Y . Per questa
ragione λ appartenente allo spettro continuo si chiama anche autovalore generalizzato e
la distribuzione x autofunzione generalizzata. Lo spettro residuo è il meno interessante.
Gli operatore interessanti hanno spettro residuo vuoto.
Teorema 6: Se A è autoaggiunto, i suoi autovalori sono reali e gli autovettori corrispondenti ad autovalori diversi sono mutuamente ortogonali. L’intero spettro σ(A) è
un sottoinsieme dell’asse reale e lo spettro residuo è vuoto.
Dim: Dato u 6= 0 con Au = λu: λ(u, u) = (λu, u) = (Au, u) = (u, Au) = (u, λu) =
λ(u, u). Da (u, u) 6= 0 segue che λ = λ, cioè gli autovalori sono reali. Analogamente,
siano u1 , u2 due autovettori corrispondenti a due autovalori distinti: Aui = λi ui , i = 1, 2.
λ1 (u1 , u2 ) = (λ1 u1 , u2 ) = (Au1 , u2 ) = (u1 , Au2 ) = (u1 , λ2 u2 ) = λ2 (u1 , u2 ). Dalla realtà
degli autovalori segue che (λ1 − λ2 )(u1 , u2 ) = 0. Infine dal fatto che λ1 6= λ2 , segue che
(u1 , u2 ) = 0. Dimostriamo ora che lo spettro continuo è reale e lo spettro residuo vuoto.
Dato λ = λ1 + iλ2 con λi ∈ R calcoliamo
k(A − λI)xk2 = k(A − λ1 I)x − iλ2 xk2 = k(A − λ1 I)xk2 + |λ2 |2 kxk2
(24)
(i termini misti si annullano per la simmetria di A: ((A − λ1 I)x, −iλ2 x) + (−iλ2 , (A −
λ1 I)x) = iλ2 (((A − λ1 I)x, x) − (x, (A − λ1 I)x)) = 0). Dall’equazione precedente segue
che k(A − λI)xk2 ≥ |λ2 |2 kxk2 . Definendo y = (A − λI)x si ha che k(A − λI)−1 yk2 ≤
kyk2 /|λ2 |2 . Se λ2 6= 0 l’operatore inverso (A − λI)−1 è continuo e quindi ogni λ con
parte immaginaria non nulla non appartiene allo spettro continuo. Infine, se λ non è un
autovalore anche λ̄ non lo è, poichè gli autovalori sono reali. Quindi Ker(A − λ̄I) = {0}.
Ora, se x ∈ Ker(A − λ̄I) allora 0 = (Ax − λ̄x, y) = (x, Ay) − λ̄(x, y) = (x, (A − λI)y)
per ogni y a causa dell’autoaggiuntezza di A; quindi x ∈ (Im(A − λI))⊥ . Ne segue
(Im(A − λI))⊥ = Ker(A − λ̄I) ≡ {0}. L’immagine dell’operatore A − λI, che è il
dominio dell’operatore inverso (A − λI)−1 è quindi denso in H e λ non può appartenere
allo spettro residuo che è quindi vuoto. 2
Si dimostra analogamente che
Teorema 7: Se A è unitario, i suoi autovalori sono numeri complessi di modulo unitario
12
e gli autovettori corrispondenti ad autovalori diversi sono mutuamente ortogonali. Lo
spettro è un sottoinsieme del cerchio unitario e lo spettro residuo è vuoto.
Esempio 1: consideriamo il caso finito-dimensionale. È ben noto che ogni matrice
autoaggiunta può essere diagonalizzata. Infatti l’equazione agli autovalori (23) si riduce
ad un‘equazione matriciale Ax = λx in CN . Da (A − λI)x = 0 segue che gli autovalori
soddisfano l’equazione caratteristica
det(A − λI) = 0
(25)
Questa è un’equazione polinomiale di grado N in λ che quindi ha esattamente N soluzioni.
Ne concludiamo che esistono esattamente N autovalori λi , i = 1, ..., N . Se sono tutti
distinti, il teorema 6 garantisce l’esistenza di N autovettori mutuamente ortogonali.
Possiamo costruire una base o.n.c. {ui }, i = 1, ..., N usando gli autovettori opportunamente normalizzati. Questo cambiamento di base è quello che nei corsi di algebra lineare si usa per diagonalizzare una matrice simmetrica o autoaggiunta. Nella
base {ui }, infatti, la matrice associata ad A è diagonale, A = diag(λ1 , ..., λN ), poichè
Aij = (Auj , ui ) = λj (uj , ui ) = λi δij . Nel caso ci siano autovalori multipli, ognuno di
questi è associato a un sottospazio di CN di dimensione pari alla molteplicità; in ognuno
di questi sottospazi possiamo scegliere autovettori mutuamente ortogonali in modo da
completare un s.o.n.c. in CN .
Esempio 2: consideriamo l’operatore A2 = −i∂x autoaggiunto in D(A2 ) = {fAC , f 0 ∈
L2 [0, 1]|f (0) = f (1)}. I suoi autovalori e autovettori si determinano dall’equazione differenziale −iy 0 = λy che ha soluzioni y = Aeiλx . Le condizioni al contorno (periodicità
di y) impongono λ = 2πn = 0, 1, 2, .... L’insieme degli autovettori, opportunamente
normalizzati, un = e2πnx è un s.o.n.c. in L2 [0, 1] (base di Fourier).
Vediamo che l’esempio 2 generalizza in maniera molto semplice il risultato valido in
uno spazio finito-dimensionale: gli autovettori dell’operatore autoaggiunto possono essere
scelti in modo da formare un s.o.n.c. in H. Questa situazione non si generalizza ad ogni
operatore in uno spazio di Hilbert, come dimostra l’esempio seguente:
Esempio 3: consideriamo ancora l’operatore A = −i∂x definito però in D(A) = {fAC , f 0 ∈
L2 (R)}. È anch‘esso autoaggiunto. I suoi autovalori e autovettori si determinano ancora
una volta dall’equazione differenziale −iy 0 = λy che ha soluzioni y = Aeiλx . Queste
soluzioni però non sono L2 (R) per nessun valore di λ. L’operatore A non possiede alcun
autovalore nè autovettore. Notiamo tuttavia che, sebbene non sia possibile trovare alcun
vettore x ∈ H che soddisfi l’equazione Ax = λx, è possibile trovare vettori xn ∈ H che
13
approssimino questa equazione con un errore arbitrariamente piccolo per ogni λ reale:
kAxn − λxn k ≤ . Infatti non è difficile definire delle funzioni xn ∈ C 1 (R), nulle al
di fuori dell’intervallo (−n − 1, n + 1) e coincidenti con eiλx nell’intervallo (−n, n) che
soddisfino alla proprietà limn→∞ kAxn − λxn k = 0 per λ reale. Si può dimostrare infatti
[1] che lo spettro dell’operatore è puramente continuo e coincidente con l’asse reale. Le
funzioni uλ = eiλx con λ ∈ R vengono chiamate autovettori generalizzati. In effetti le
funzioni xn che soddisfano la proprietà dell’autovalore approssimato in questo esempio
convergono a uλ = eiλx quando n tende all’infinito. Le funzioni uλ non appartengono allo
spazio di Hilbert L2 (R) ma possono essere interpretate come elementi di uno spazio più
ampio di distribuzioni Y . Nello spazio Y l’equazione −i∂x uλ = λuλ è soddisfatta.
Un operatore autoaggiunto generico possiede sia spettro discreto che spettro continuo.
Il teorema spettrale viene formulato come segue. È possibile associare ad ogni autovalore generalizzato λ una distribuzione uλ chiamata autovettore generalizzato. uλ
è definito come limite nello spazio delle distribuzioni dei vettori xn ∈ H che appaiono
nella definizione di autovalore generalizzato. La successione xn non converge ad alcun
elemento di H, ma converge nel senso delle distribuzioni a uλ che non appartiene ad H.
Teorema Spettrale: ogni operatore autoaggiunto A in uno spazio di Hilbert è caratterizzato dai suoi autovalori e autovettori {λn , un } che formano un s.o.n. (spettro discreto) e
da una o più famiglie continue di autovalori e autovettori generalizzati (spettro continuo)
{λ, uλ } tali per cui ogni elemento dello spazio di Hilbert si può scrivere come
Z
X
an un + a(λ)uλ dλ
(26)
f=
n
Attraverso il teorema spettrale abbiamo effettivamente diagonalizzato l’operatore e abbiamo la possibilità di sviluppare il generico elemento x ∈ H nella base degli autovettori,
ordinari e generalizzati. La diagonalizzazione di A segue dalla formula
Z
X
Af =
λn an un + λa(λ)uλ dλ
(27)
n
Per una definizione corretta dell’integrale nella precedente formula rimandiamo a [1].
Esempio 3. Continuazione: ogni funzione in L2 (R) si può sviluppare nel set di autovettori generalizzati uλ nel senso dell’equazione (26):
Z
f (x) = a(λ)eiλx dλ,
(28)
14
Il teorema spettrale, in questo caso, non è altro che l’affermazione che ogni funzione
in L2 (R) possiede una trasformata di Fourier. L’operatore, in questo caso, ha spettro
puramente continuo, coincidente con l’asse reale.
Esempio 4: l’operatore posizione in L2 [a, b], −∞ ≤ a < b ≤ ∞ è autoaggiunto nel
dominio D(x̂) = {f ∈ L2 [a, b]|xf ∈ L2 [a, b]} come si verifica facilmente. L’equazione
x̂ψ = λψ richiede xψ(x) = λψ(x) che non può essere risolta da nessuna funzione ψ(x).
L’operatore x̂ non ha quindi autovalori. Si può pero’ dimostrare [1] che il suo spettro
è puramente continuo e coincide con l’intervallo [a, b]. L’equazione agli autovalori è
risolta dalle distribuzioni uλ = δ(x − λ) per λ ∈ [a, b]. È facile verificare che esiste
una successione di funzioni in L2 [a, b] che converge a uλ e che soddisfa la proprietà
dell’autovalore apprssimato. Il teorema spettrale si riduce in questo caso alla banale
formula
Z
b
δ(x − λ)ψ(λ)dλ
ψ(x) =
(29)
a
che è valida per ogni ψ ∈ L2 [a, b].
Esiste una classe di operatori che ha spettro puramente discreto. Per questi il teorema
spettrale vale nella forma:
Teorema Spettrale per operatori a spettro discreto: l’insieme degli autovettori
di un operatore autoaggiunto A con spettro puramente discreto possono essere scelti in
modo da formare un s.o.n.c.
Gli operatori con spettro puramente discreto generalizzano la teoria spettrale valida per
spazi finito dimensionali in una forma particolarmente semplice. Ogni elemento f dello
spazio di Hilbert si può sviluppare nella base degli autovettori di A, {ui },
X
f=
ai ui
(30)
i
La base degli autovettori, in analogia con quanto succede nel caso finito-dimensionale,
è la base in cui l’operatore è diagonale (Aui = λi ui ). Questa proprietà si esprime
formalmente con l’equazione
X
Af =
λi ai ui
(31)
i
che risulta essere vera anche se A non è continuo. Usando l’isomorfismo H ∼ l 2 , f → {ai }
determinato dalla scelta della base {ui }, l’operatore A può essere rappresentato come una
matrice (infinito-dimensionale) diagonale, con entrate uguali agli autovalori.
15
Per concludere, è opportuno notare che il teorema 6 e il teorema spettrale valgono
per operatori autoaggiunti e non è detto che valgano per operatori che sono soltanto simmetrici. Operatori simmetrici hanno spettro discreto e continuo reale, ma genericamente
lo spettro residuo non è vuoto e complesso ed infine il teorema spettrale non è valido.
1.7
1.7.1
Esempi: equazioni integrali, alle derivate ordinarie e parziali
Equazioni integrali
Gli operatori integrali sono particolarmente semplici. Alcune applicazioni storiche della
teoria degli spazi di Hilbert sono infatti alle equazioni integrali.
Consideriamo un operatore integrale definito in L( Ω) dove Ω è un sottoinsieme di Rn .
Z
2
K : f ∈ L (Ω)
→
Kf (x) =
k(x, y)f (y)dy
(32)
Ω
2
Se il nucleo integrale k(x, y) ∈ L (Ω × Ω) l’operatore K è continuo. Infatti, dalla disuguaglianza di Holder segue che
Z Z
Z Z
Z
2
2
2
kKf k =
| k(x, y)f (y)dy| dx ≤ ( |k(x, y)| dy |f (w)|2 dw)dx
Ω
Ω Ω
Ω
ZΩ
≤ kf k2
|k(x, y)|2 dxdy
(33)
Ω×Ω
È facile verificare che se k(x, y) = k(y, x), K è autoaggiunto. K in realtà è più che
continuo, è un operatore compatto, cioè manda insiemi limitati in insiemi la cui chiusura è
compatta [1]. Lo spettro degli operatori compatti è puramente discreto e particolarmente
semplice.
Teorema 8: Un operatore autoaggiunto compatto ha autovalori reali λn → 0 ed autovettori un che formano un s.o.n.c. Lo spettro è discreto con al più uno spettro continuo
che consiste del solo punto λ = 0 se questo non è un autovalore.
1.7.2
Equazioni Differenziali Ordinarie: Problemi agli autovalori
Un problema classico delle equazioni differenziali ordinarie è il problema agli autovalori
o problema al contorno. Questo tipo di problema è naturale in Meccanica Quantistica e
si incontra spesso anche in fisica classica, in particolare quando si risolvono problemi al
contorno per equazioni differenziali alle derivate parziali.
Esempio 1: sia data l’equazione differenziale lineare del secondo ordine dipendente da
un parametro λ
y 00 + λy = 0
(34)
16
Il teorema di esistenza e unicità garantisce che, date le condizioni iniziali (problema di
Chauchy)
y(x0 ) = y0
y 0 (x0 ) = y1
(35)
la soluzione esiste, è unica e dipende continuamente dai dati iniziali. Chiediamoci ora
se la stessa equazione ha soluzioni nell’intervallo [x0 , x1 ] che soddisfano il problema al
contorno
y(x0 ) = 0
y(x1 ) = 0
(36)
Un equazione del II ordine ha sempre due soluzioni linearmente indipendenti yi (x; λ), i =
1, 2 e la generica soluzione si può esprimere come loro combinazione lineare
y(x) = c1 y1 (x; λ) + c2 y2 (x; λ).
(37)
λ appare in generale come parametro nell’espressione delle soluzioni. Sappiamo che il
problema di Chauchy (35) ha sempre una soluzione. Nel caso del problema al contorno
(36), c‘e’ sempre la soluzione banale c1 = c2 = 0. Esisterà una seconda soluzione se e
solo se il sistema
c1 y1 (x0 ; λ) + c2 y2 (x0 ; λ) = 0
c1 y1 (x1 ; λ) + c2 y2 (x1 ; λ) = 0
(38)
ha una soluzione. Solo per alcuni valori particolari di λ, quelli per cui la matrice dei
coefficienti yi (xj ; λ) ha determinante nullo, esisterà una soluzione non banale al problema
al contorno. Questi valori sono chiamati autovalori. Possiamo riformulare il problema
in questi termini: risolvere l’equazione agli autovalori Ly = λy per l’operatore L =
−∂ 2 /∂x2 nel dominio D(L) = {fAC , f 00 ∈ L2 [x0 , x1 ]|f (x0 ) = f (x1 ) = 0}. L è il quadrato
dell’operatore A1 = −i∂x ; è simmetrico e, coi metodi della sezione 1.4, si può verificare che
è anche autoaggiunto 4 . Il problema è cosı̀ ridotto alla ricerca di autovalori e autovettori
di un operatore autoaggiunto in uno spazio di Hilbert.
4
Notiamo che −i∂x , con le condizioni f (x0 ) = f (x1 ) = 0, non è autoaggiunto mentre il suo quadrato
−∂x2 lo è. Le condizioni al contorno da imporre agli operatori possono variare col numero di derivate,
poichè questo influisce sui termini provenienti dall’integrazione per parti. Intuitivamente, il numero di
condizioni da imporre ad un operatore differenziale con derivate ordinarie è pari all’ordine dell’operatore
stesso: f (x0 ) = f (x1 ) = 0 contiene due condizioni su f ed è ragionevole da imporre per un operatore
del secondo ordine ed è invece troppo restrittivo per un operatore del prim’ordine. Per evitare errori, è
bene verificare l’autoaggiuntezza esaminando i termini al bordo caso per caso.
17
Esaminiamo il caso generale di un‘equazione differenziale lineare del II ordine:
L̂y = λ̂y
(39)
con
L̂y = a2 (x)y 00 + a1 (x)y 0 + a0 (x),
a2 (x) > 0.
(40)
È facile verificare che (ridefinendo L e λ) si può sempre ricondurre il problema al seguente:
d
d
p(x)
+ q(x).
(41)
Ly = λωy,
L=−
dx
dx
con
R
a0 R
e (a1 /a2 )dx
p(x) = e (a1 /a2 )dx ,
q(x) = − e (a1 /a2 )dx ,
ω(x) =
a2
a2
Notiamo che p(x) > 0 e ω(x) > 0.
Si definisce problema di Sturm-Liouville (SL) il problema agli autovalori:
R
Ly = λωy
(42)
a≤x≤b
,
α1 y(a) + α2 y 0 (a) = 0
β1 y(b) + β2 y 0 (b) = 0
(43)
con αi , βi reali e con almeno uno degli αi e uno dei βi diversi da zero. Nell’equazione (43)
abbiamo scelto condizioni al contorno indipendenti per i due estremi. È possibile scegliere
altre condizioni al contorno, ad esempio si possono scegliere condizioni di periodicità:
f 0 (a) = f 0 (b)
f (a) = f (b) ,
(44)
oppure due condizioni più complicate che coinvolgano ciascuna f (a), f (b), f 0 (a), f 0 (b).
Come discusso a breve, ogni set di condizioni con la proprietà di rendere autoaggiunto
l’operatore L definisce un buon problema di SL.
Vogliamo formalizzare il problema in un opportuno spazio di Hilbert. Dalla teoria generale delle equazioni differenziali, sappiamo che le soluzioni del problema (43) definito in
un intervallo limitato [a, b] e con funzioni p, q, ω sufficientemente regolari sono anch’esse
funzioni regolari, in particolare sono L2 [a, b].
Osservazione: della presenza della funzione ω in (43) si può facilmente tener conto conRb
siderando la misura ω(x)dx in [a, b]. Consideriamo cioè L2ω [a, b] = {f | a |f (x)|2 ω(x)dx <
Rb
∞} con prodotto scalare (f, g)ω = a f (x)g(x)ω(x)dx. Il problema (43) per l’operatore
Lω = L/ω diventa un problema agli autovalori Lω y = λy in L2ω . Notiamo che nel
Rb
prodotto scalare (Lω f, g)ω = a (Lf )g tutti i fattori di ω si cancellano. Senza perdita di
18
generalità si può anche porre ω = 1: la teoria generale si ottiene sostituendo ovunque
L → Lω , (f, g) → (f, g)ω .
Consideriamo quindi il problema agli autovalori:
Ly = λy
00
D(L) = {fAC , f ∈ L [a, b]ω |α1 y(a) + α2 y 0 (a) = β1 y(b) + β2 y 0 (b) = 0}
2
(45)
L è un operatore autoaggiunto. Infatti,
(Lf, g) =
Rb
a
Rb
Rb
((−pf 0 )0 + qf )gdx = −pf 0 g|ba + a pf 0 g 0 dx + a qf gdx =
Rb
−p(f 0 g − f g 0 )|ba + a f ((−pg 0 )0 + qg) = (f, Lg)
(46)
I termini di bordo che vengono dall’integrazione per parti si annullano a causa delle
condizioni al contorno scelte (43) o (44). Ad esempio, per (43) e β2 6= 0, all’estremo
b otteniamo: p(f 0 g − f g 0 )(b) = p(b)(−β1 /β2 )(f g − f g)(b) = 0. Lo stesso risultato vale
per β2 = 0 e per l’estremo a. L’operatore L e’ quindi simmetrico; coi metodi della
sezione 1.4 si può dimostrare che è anche autoaggiunto. Lo stesso vale per le condizioni
(44). Condizioni al contorno più generali dovranno essere scelte in modo che i termini al
bordo dell’integrazione per parti si cancellino e che l’operatore sia autoaggiunto oltre che
simmetrico. Nel caso in cui l’intervallo [a, b] sia illimitato, i termini al bordo valutati nel
punto all’infinito si annullano automaticamente piochè ogni funzione L2 [a, b] si annulla
all’infinito. Perciò se a o b o entrambi sono infiniti, in questi punti non occorre imporre
alcuna condizione. Si richiede tuttavia di trovare una soluzione L2 [a, b]: la condizione
implicita che deve essere imposta all’infinito alle soluzioni dell’equazione differenziale è
di essere a quadrato sommabile. Questa è la condizione naturale da imporre se si vuole
formulare il problema in uno spazio di Hilbert. È anche la condizione naturale da imporre
in un problema di Meccanica Quantistica.
Usando il teorema 6 otteniamo immediatamente
Teorema 9: Dato un sistema di SL formulabile come un problema agli autovalori per
un operatore in uno spazio di Hilbert:
a) gli autovalori sono reali
b) le soluzioni (autovettori) corrispondenti ad autovalori diversi sono ortogonali nel
prodotto scalare di L2ω .
Gli autovettori di un sistema di SL formano un s.o.n. che non è necessariamente
completo, dato che un generico operatore avrà anche spettro continuo. Il problema di
19
E
E2
V=x 2 /2
V=0
x
E1
determinare lo spettro di un operatore differenziale è complesso. I metodi più usati per
determinare lo spettro sono:
I: studiare il risolvente di L. Ogni equazione differenziale ordinaria si può convertire in
un’equivalente equazione integrale, ottenuta invertendo l’operatore differenziale
Z b
−1
k(x, y)u(y)dy
(47)
Lu(x) = λu(x) ,
→
u(x) = λL u(x) ≡
a
Il nucleo integrale k(x, y) si chiama funzione di Green associata all’operatore differenziale
L. Gli operatori integrali sono più semplici studiare e lo spettro di L si può determinare
studiando lo spettro dell’operatore integrale associato. In particolare, se la funzione di
Green k(x, y) risulta essere a quadrato sommabile, il teorema 8 garantisce che lo spettro
dell’operatore integrale, e quindi lo spettro di L, è puramente discreto. Operatori differenziali di questo tipo si chiamano a risolvente compatto. In questo caso gli autovettori
di L formano un s.o.n.c.
II: ridurre, se possibile, l’equazione differenziale ad un’equazione di Schroedinger stazionaria.
Consideriamo l’equazione di Schroedinger stazionaria per una particella sulla retta soggetta
al potenziale V (x)
d2 u
− 2 + V (x)u = Eu
(48)
dx
L’equazione è evidentemente della forma SL con p = 1, q = V (x) e ω = 1; per uniformarci
alle notazioni della MQ, abbiamo chiamato E l’autovalore λ. La funzione d’onda u
R
rappresenta una densità di probabilità, ed è normalizzata R |u|2 dx = 1. La condizione
da imporre all’infinito è quindi l’integrabilità L2 . Equivalentemente, dobbiamo risolvere
d2
il problema agli autovalori Hu = Eu in L2 (R) per l’operatore autoaggiunto H = − dx
2 +
V (x). Alla funzione V (x) si richiede di essere sufficientemente regolare. Consideriamo
il potenziale indicato a sinistra nella figura. Classicamente la particella di energia E è
obbligata a muoversi nell’intervallo definito dalla disuguaglianza E − V (x) = p2 /2 ≥ 0.
Nell’intervallo di energia [E1 , E2 ] la particella è costretta ad oscillare in una regione finita
di spazio, nell’intervallo [E2 , ∞] la particella può muoversi fino all’infinito. Come discusso
20
in ogni buon testo di MQ, quantisticamente esisteranno dei livelli energetici discreti En
da cercarsi dove il moto classico é limitato in una regione finita, σd (H) = {En } ⊂
[E1 , E2 ] e uno spettro continuo di energie corrispondente ai valori classici dell’energia
per cui il moto è illimitato, σc (H) = [E2 , ∞]. Notiamo che gli autovalori dell’operatore
H corrispondono solo ai livelli energetici discreti. L’intero insieme dei possibili valori
dell’osservabile energia è associato all’intero spettro dell’operatore H. Gli autovalori
generalizzati uE per E ∈ σc (H) sono tipicamente delle funzioni non in L2 (R) che hanno la
forma di onde piane per grande x positivo. Nella figura sono indicati due casi limite. Per
V (x) = 0 lo spettro è puramente continuo σc (H) = [0, ∞] con autofunzioni generalizzate
che sono onde piane uE = eipx , E = p2 /2. Il caso V (x) = x2 /2, corrispondente ad un
oscillatore armonico, ha spettro puramente discreto En = (n + 1/2) con autofunzioni che
2
sono i polinomi di Hermite un = Hn (x)e−x /2 .
Un risultato generale è il seguente. Il problema di SL con a e b finiti, p, p0 , ω e q
funzioni continue reali in [a, b] e p, ω > 0 il problema si dice regolare. Per sistemi di SL
regolari vale il teorema [1]:
Teorema 10: Gli autovettori di un sistema di SL regolare formano un insieme numerabile
{yn } che, opportunamente normalizzato, è un s.o.n.c. in L2ω [a, b].
I problemi di SL regolari sono in assoluto i più semplici ma hanno poche applicazioni.
Esempio 1. continuazione: consideriamo il problema di SL
y 00 + λy = 0,
0≤x≤π
y(0) = y(π) = 0
(49)
√
Il problema
è
regolare
con
p
=
1,
q
=
0
e
ω
=
1.
La
soluzione
generale
è
y
=
A
sin
λx +
√
√
B cos λx. Le condizioni al contorno impongono B = 0 e sin λπ = 0 da cui λ =
n2 , n = 1, 2, .... Otteniamo l’insieme di autovalori e autovettori: {λn = n2 , yn = sin nx}.
Osserviamo che gli autovalori sono reali, gli autovettori mutuamente ortogonali e che gli
autovettori, opportunamente normalizzati, formano un s.o.n.c.: i seni sono la base di
Fourier (dispari) per il semi-periodo [0, π].
Esempio 1a: consideriamo il problema di SL
y 00 + λy = 0,
0≤x≤π
y(0) = y(π)
y 0 (0) = y 0 (π)
21
(50)
Il problema è anch‘esso regolare. Le condizioni al contorno questa volta selezionano il
sistema di autovettori {e2inx } con autovalori λ = 4n2 , n ∈ Z. Anche in questo esempio gli autovalori sono reali, gli autovettori mutuamente ortogonali e che gli autovettori,
opportunamente normalizzati, formano un s.o.n.c.: la base di Fourier sul periodo [0, π].
Notiamo che, in questo esempio, ogni autovalore ha molteplicità due (e±2inx sono entrambi associati all’autovalore 4n2 ). Autovettori corrispondenti ad autovalori diversi
sono ortogonali. All’interno di ogni autospazio (di dimensione due) sono stati scelti due
autovettori ortogonali in modo che l’insieme di tutti gli autovettori formi un s.o.n.c..
I problemi di SL più interessanti sono però singolari. Un problema può essere singolare, ad esempio, se p o ω si annullano (o divergono) in a o in b, oppure, ancora più
semplicemente, se l’intervallo [a, b] non è limitato. Le soluzioni delle equazioni differenziali potrebbero essere discontinue e illimitate agli estremi dell’intervallo. Usualmente,
all’estremo singolare si impongono condizioni quali la limitatezza oppure l’integrabilità
L2 (quest’ultima è la condizione che si impone ad esempio nei problemi provenienti dalla
Meccanica Quantistica).
Esempio 2: polinomi di Legendre. Consideriamo
d
2 dy
(1 − x )
+ λy = 0,
dx
dx
−1 ≤ x ≤ 1
(51)
e richiediamo alle soluzioni di essere limitate in x = ±1. Abbiamo p = 1−x2 , q = 0, ω = 1.
Il problema è singolare perchè p(±1) = 0. Gli autovalori sono λl = l(l+1) con autovettori
i polinomi di Legendre Pl (x) che formano, dopo normalizzazione, un s.o.n.c. in L2 [−1, 1].
Esempio 3: polinomi di Hermite. Consideriamo
d
2
−x2 dy
e
+ e−x λy = 0,
dx
dx
−∞ < x < ∞
(52)
e richiediamo che le soluzioni siano L2 all’infinito. L’equazione di Hermite si incontra in
Meccanica Quantistica nello studio dell’oscillatore armonico. La condizione al contorno
2
che abbiamo imposto è quella naturale in Meccanica Quantistica. p = ω = e−x , q = 0.
Il problema è singolare perchè l’intervallo è infinito. Gli autovalori sono λn = 2n con
2
autovettori Hn (x) che definiscono un s.o.n.c. in L2 (R, e−x dx). Notiamo che la presenza
di una funzione non banale ω ci dice che gli autovettori del problema di SL sono un
sistema ortonormale in L2 (R) col prodotto scalare (f, g)ω o equivalentemente in L2 (R)
2
con misura e−x dx. L’equazione per i polinomi di Hermite si riconduce all’equazione di
2
Schroedinger per V (x) = x2 /2 con un semplice cambio di variabile u(x) = y(x)e−x /2 .
22
Esempio 4: polinomi di Laguerre. Consideriamo
d
−x dy
e
+ e−x λy = 0,
dx
dx
0<x<∞
(53)
e richiediamo che le soluzioni siano L2 all’infinito. l’equazione di Laguerre si incontra in
Meccanica Quantistica nello studio dell’atomo di idrogeno: x è la coordinata radiale in
coordinate sferiche. Gli autovalori sono λn = n con autovettori Ln (x) che definiscono un
2
s.o.n.c. in L2 ((0, ∞), e−x dx).
1.7.3
Equazioni Differenziali alle Derivate Parziali
Consideriamo una classe particolare di operatori alle derivate parziali, gli operatori ellittici. Un operatore del II ordine
D
X
D
X
∂2
∂
L=
aij (x)
+
bi (x)
+ c(x)
∂xi ∂xj
∂xi
i,j=1
i=1
(54)
si dice ellittico se la matrice simmetrica corrispondente ai termini con due derivate aij (x)
è definita positiva (o definita negativa). L’equazione di Laplace, l’equazione di Poisson,
l’equazione di Schoedinger stazionaria sono esempi di equazioni ellittiche. Gli operatori
ellittici sono in assoluto i più semplici, a cominciare dalle proprietà dello spettro,
Teorema 11: lo spettro di un operatore ellittico su uno spazio compatto L2 (K) è
puramente discreto.
Esempio 1: armoniche sferiche. Sono le autofunzioni del Laplaciano ristretto alla sfera
S 2 . Si ottengono in tutta una classe di equazioni della fisica matematica con simmetria
sferica. Dalla separazione delle variabili u(r, θ, φ) = U (r)Y (θ, φ) nell’equazione di Laplace
otteniamo due equazioni per Y = P (cos θ)Φ(φ):
d
m2
2 dP
(1 − x )
+ (λ −
)P = 0,
−1 ≤ x ≤ 1
dx
dx
1 − x2
Φ00 + λ̃Φ = 0
(55)
dove x = cos θ e λ, λ̃ sono gli autovalori da determinare. La seconda equazione è immediatamente risolta Φ = eimφ , λ̃ = m2 ; l’ovvia condizione al contorno da richiedere è
la periodicità in φ ∈ [0, 2π] che richiede che |m| = 0, 1, 2, .... Nella prima equazione,
richiediamo invece alle soluzioni di essere limitate in x = ±1; x = ±1 corrispondono infatti al polo nord e al polo sud della sfera unitaria in cui nulla di speciale deve succedere.
23
Per la prima equazione abbiamo p = 1 − x2 , q = m2 /(1 − x2 ), ω = 1. Il problema è
singolare perchè p(±1) = 0 e q(±1) = ∞. Gli autovalori sono λl = l(l + 1), |m| ≤ l, l =
0, 1, 2... con autovettori Plm (x), polinomi di Legendre generalizzati. Le armoniche sferiche
Ylm (θ, φ) = Plm (cos θ)eimφ formano, dopo normalizzazione, un s.o.n.c. in L2 [S 2 , dΩ(2) ],
dove dΩ(2) = sin θdθdφ è la misura sulla sfera unitaria S 2 .
Gli operatori ellittici hanno inoltre importanti proprietà di regolarità
Teorema 12 - lemma di Weyl: ogni funzione o distribuzione u(x) che risolva l’equazione
ellittica Lu = f è C ∞ nei punti in cui i coefficienti aij (x), bi (x), c(x) e il termine noto
f (x) sono C ∞ .
Questo teorema si applica ad esempio all’equazione di Laplace e di Schroedinger
stazionaria. Le soluzioni dell’equazione di Laplace sono automaticamente C ∞ , le soluzioni
dell’equazione di Poisson o dell’equazione di Schoedinger stazionaria sono C ∞ nei punti
in cui la densità di carica o il potenziale sono C ∞ .
Infine, per operatori ellittici, i problemi al contorno formulati su insiemi compatti
soddisfano teoreni di esistenza, unicità e dipendenza continua dai dati iniziali.
2
Appendice: Il complemento ortogonale
Una proprietà importante degli spazi di Hilbert riguarda la possibilità di proiettare un
vettore su un sottospazio.
Teorema A: Dato un sottospazio chiuso V dello spazio di Hilbert H, per ogni vettore
f ∈ H esiste unico un vettore f ∗ ∈ V con la proprietà
kf − f ∗ k = minv∈V kf − vk
(56)
Dim: sia d = inf{kf − vk, v ∈ V }. Occorre dimostrare che l’estremo inferiore è in
realtà un minimo. Se d = 0, f ∈ V e f ∗ = f . Possiamo quindi supporre che d > 0.
Consideriamo gli insiemi Cn = {v ∈ V |kv −f k ≤ d+1/n}. Dall’identità 2(kxk2 +kyk2 ) =
kx + yk2 + kx − yk2 segue che, se v1 , v2 ∈ V ,
2(kv1 − f k2 + kv2 − f k2 ) = kv1 + v2 − 2f k2 + kv1 − v2 k2
kv1 − v2 k2 = 2kv1 − f k2 + 2kv2 − f k2 − kv1 + v2 − 2f k2 ≤
2 d + n1 + 2 d + n1 − 4d2 ≤ 8 nd + n42
(57)
Nel penultimo passaggio si è usato il fatto che, poiché (v1 +v2 )/2 ∈ V , kf −(v1 +v2 )/2k ≥
d. Scegliendo una successione di vettori {vn } ∈ Cn avremo che
d
4
kvn − vn+p k2 ≤ 8 + 2
(58)
n n
24
tende a zero per n → ∞ per qualunque p, poiché vn , vn+p ∈ Cn . Questo implica che
{vn } ∈ Cn è di Chauchy e quindi converge. Il limite f ∗ sarà contenuto in V poiché V è
chiuso. Da kvn − f k ≤ d + 1/n segue che kf − f ∗ k ≤ d. Poiché d è l’estremo inferiore dei
possibili valori kf − vk, ne segue che kf − f ∗ k = d. f ∗ è unico: supponiamo infatti che
esistano due vettori che soddisfino d = kf − f1 k = kf − f2 k. Usando una minorazione
analoga a quella della formula (57) otteniamo
kf1 − f2 k2 = 2kf1 − f k2 + 2kf2 − f k2 − kf1 + f2 − 2f k2 = 4d2 − kf1 + f2 − 2f k2 ≤
4d2 − 4d2 = 0
che è possibile solo per f1 = f2 . 2
Osservazione: il teorema è valido nell’ipotesi meno restrittiva che V sia un insieme
convesso chiuso. La chiusura è un’ipotesi necessaria.
Il vettore f ∗ è noto come la miglior approssimazione di f in V . È anche caratterizzabile come la proiezione ortogonale di f su V . Vale infatti:
Teorema B: f ∗ è univocamente determinato dalla proprietà (f − f ∗ , v) = 0 per tutti i
vettori v ∈ V .
Dim: Se (f − f ∗ , v) = 0 per tutti i vettori v ∈ V , vale anche (f − f ∗ , f ∗ − v) = 0. Dal
teorema di Pitagora segue che kf −vk2 = kf −f ∗ k2 +kf ∗ −vk2 e quindi kf −f ∗ k2 ≤ kf −vk2
per ogni v ∈ V . Ne segue che f ∗ è la miglior approssimazione di f in V . Viceversa, sia
f ∗ la miglior approssimazione. Prendiamo v = f ∗ + αw con w ∈ V, α ∈ C. Abbiamo che
kf − f ∗ k2 ≤ kf − vk2 = kf − f ∗ − αwk2 =
kf − f ∗ k2 + kα|2 kwk2 − α(w, f − f ∗ ) − α∗ (w, f − f ∗ )∗
da cui α(w, f − f ∗ ) + α∗ (w, f − f ∗ )∗ ≤ |α|2 kwk2 . Prendendo α = |α|eiθ con |α| → 0 si
ottiene eiθ (w, f − f ∗ ) + e−iθ (w, f − f ∗ )∗ ≤ 0. Prendendo θ = 0, π/2, π, 3π/2 si ottiene
Re, Im(w, f − f ∗ ) ≥ 0 e contemporaneamente Re, Im(w, f − f ∗ ) ≤ 0, da cui si conclude
(f − f ∗ , w) = 0. 2
Dato un insieme S definiamo il suo complemento ortogonale come l’insieme
S ⊥ = {f ∈ H|(f, s) = 0, s ∈ S}
(59)
S ⊥ è sempre un sottospazio chiuso di H. Infatti da x, y ∈ S ⊥ segue che (αx + βy, s) = 0
per ogni s ∈ S per la linearità del prodotto scalare, e da xn ∈ S → x segue che (x, s) =
lim(xn , s) = 0 per la continuità del prodotto scalare.
25
Teorema C: Dato un sottospazio chiuso V di H, ogni f ∈ H si scrive in maniera unica
come f = x + y con x ∈ V, y ∈ V ⊥ . In simboli
H =V ⊕V⊥
(60)
Dim: x è definito come la proiezione f ∗ di f su V e y come f − f ∗ . y ∈ V ⊥ per il
Teorema B. L’unicità della decomposizione segue dal fatto che, se f = x + y = x0 + y 0 ,
x − x0 = y − y 0 uguaglia vettori in V e V ⊥ che hanno in comune il solo vettore zero. Ne
segue x = x0 e y = y 0 . 2
Osservazione: Se V è un sottospazio non chiuso il Teorema C si può riformulare come
H = V̄ ⊕ V ⊥ . Vale anche S ⊥⊥ = S̄. Quest’ultimo risultato segue dalla doppia applicazione del risultato precedente, una volta a V = S̄ e l’altra a V = S ⊥ : H = S̄ ⊕ S ⊥ =
S ⊥ ⊕ S ⊥⊥ . Eliminando il fattore comune S ⊥ si ottiene il risultato voluto.
References
[1] Dispense per Metodi Matematici della Fisica, http://castore.mib.infn.it/.̃zaffaron/
[2] Reed e Simon, Methods of Modern Mathematical Physics, Academic Press, Quattro
Volumi.
[3] Mikusinski, Introduction to Hilbert Spaces, Academic Press.
[4] W. Rudin, Functional Analysis, MacGraw-Hill.
26