Appunti del corso METODI MATEMATICI PER LA FISICA I 5 febbraio 2004 2 Prefazione Quanto segue è la trascrizione degli appunti del corso ”Metodi Matematici per la Fisica I” tenuto nell’anno accademico 2002/2003 dal prof. Luciano Bracci al II anno del Corso di Laurea in Fisica dell’Università di Pisa. Aggiunte agli argomenti trattati nel corso originario sono state effettuate principalmente per dimostrare risultati enunciati senza dimostrazione durante le lezioni. In questo senso i risultati la cui dimostrazione risultava eccessivamente laboriosa oppure si sarebbe distaccata troppo dal contesto del corso sono stati dimostrati nelle appendici. Per poter capire queste note è necessaria una conoscenza elementare della teoria della misura e della integrazione secondo Lebesgue (principalmente teoremi di passaggio al limite e teoremi di Fubini, Tonelli) e di geometria (in effetti non molto di più di sapere cosa sono uno spazio vettoriale ed una applicazione lineare). i Indice Prefazione i 1 Spazi normati e con prodotto scalare 1.1 Definizioni e proprietà elementari . . . . 1.2 Topologia . . . . . . . . . . . . . . . . . 1.3 Spazi di Banach . . . . . . . . . . . . . . 1.4 Prodotti scalari . . . . . . . . . . . . . . 1.5 Proprietà elementari degli sp. di Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 4 9 16 20 2 Equazioni differenziali alle derivate parziali 2.1 Serie di Fourier . . . . . . . . . . . . . . . . 2.2 Problema ai limiti per il quadrato . . . . . . 2.2.1 Caso ua . . . . . . . . . . . . . . . . 2.2.2 caso uF . . . . . . . . . . . . . . . . 2.3 Problema ai limiti per il cerchio . . . . . . . 2.3.1 caso u0 . . . . . . . . . . . . . . . . 2.3.2 caso uF . . . . . . . . . . . . . . . . 2.3.3 Funzioni armoniche . . . . . . . . . . 2.3.4 Lemma di Green e sue conseguenze . 2.4 Equazione delle onde . . . . . . . . . . . . . 2.4.1 caso uf . . . . . . . . . . . . . . . . 2.4.2 caso ug . . . . . . . . . . . . . . . . 2.4.3 caso uF . . . . . . . . . . . . . . . . 2.4.4 caso ua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 24 29 29 31 33 33 35 38 41 45 45 46 47 49 3 Spazi di Hilbert ed Operatori lineari 3.1 Geometria degli spazi di Hilbert . . . 3.2 Operatori e funzionali lineari . . . . 3.3 Proiettori . . . . . . . . . . . . . . . 3.4 Particolari classi di operatori . . . . 3.5 Trasformata di Fourier . . . . . . . . 3.6 Operatori chiusi e chiudibili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 50 55 59 63 74 85 A Spazi Lp A.1 Definizioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.2 Proprietà fondamentali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.3 Proprietà di densità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 94 95 97 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B Convergenza puntuale della serie di Fourier 103 B.1 Criterio di Dirichlet-Jordan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 B.2 Teorema di Fejer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 ii INDICE C Riflessività iii 110 D Complementi sugli operatori compatti 112 D.1 Teorema dell’alternativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 D.2 Teoria spettrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 E Problema di Sturm-Liouville 117 E.1 Problemi ai limiti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 E.2 Problema di Sturm-Liouville . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 F Conseguenze del lemma di Baire 128 G Il teorema fondamentale del calcolo 132 G.1 Premesse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 G.2 Il teorema fondamentale del calcolo . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 G.3 Altra dimostrazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 iv INDICE Capitolo 1 Spazi normati e con prodotto scalare 1.1 Definizioni e proprietà elementari Definizione 1.1.1. Sia X uno spazio vettoriale sul campo C; una funzione k chiama norma se valgono kX : X → R si 1. se x ∈ X allora kxkX ≥ 0 2. x = 0 ⇔ kxkX = 0 3. se x ∈ X e λ ∈ C allora kλxkX = |λ| kxkX 4. se x, y ∈ X allora kx + ykX ≤ kxkX + kykX La proprietà (4) si chiama disuguaglianza triangolare. (Se X è uno spazio vettoriale su R, nella (3) si deve avere λ ∈ R) Definizione 1.1.2. Si chiama spazio normato uno spazio vettoriale su cui sia definita una norma. La notazione (X, k kX ) significa che X è uno spazio normato con norma k kX . Esempio 1.1.1. Sono spazi normati: 1. il campo C considerato come spazio vettoriale su C con come norma il modulo. 2. lo spazio delle funzioni limitate f : A → C dove A è un insieme, kf kX = supx∈A |f (x)|. 3. lo spazio Cn con la norma k(a1 , . . . , an )kX = |a1 | + · · · + |an |. 4. lo spazio Cn con la norma k(a1 , . . . , an )kX = supi=1,...,n |ai |. 5. lo spazio delle funzioni f : Rn → R continue ed integrabili con la norma kf kX = R |f (x)|dx 6. lo spazio delle successioni limitate con come norma k{ai }kX = supi∈N |ai |. 7. lo spazio delle successioni assolutamente sommabili con come norma k{ai }kX = P∞ i=0 |ai |. Definizione 1.1.3. Siano (X, k kX ), (Y, k kY ) spazi normati, A ⊂ X e f : A → Y una funzione. Sia x̄ ∈ X e ` ∈ Y ; si dice che il limite di f (x) per x che tende a x̄ è ` (in simboli limx→x̄ f (x) = `) se per ogni > 0 esiste un δ > 0 tale che se x ∈ X ∩ A e 0 < kx − x̄kX < δ, allora kf (x) − `kY < . Se ` ∈ Y si scrive limx→∞ f (x) = ` (o, più precisamente, limkxkX →∞ f (x) = `) se per ogni > 0 esiste un M tale che se kxkX > M e x ∈ A si ha kf (x) − `kY < . 1 2 CAPITOLO 1. SPAZI NORMATI E CON PRODOTTO SCALARE Definizione 1.1.4. Sia (X, k kX ) uno spazio normato e A ⊂ X. Sia x̄ ∈ X; si dice che x̄ è un punto di accumulazione per A se per ogni δ > 0 esiste un a ∈ A, a 6= x̄ tale che kx̄ − akX < δ. Definizione 1.1.5. Sia (X, k kX ) uno spazio normato e sia A ⊂ X. Si dice che A è limitato se esiste un K > 0 tale che per ogni x ∈ A si abbia kxkX < K. Lemma 1.1.1. Siano (X, k kX ), (Y, k kY ) spazi normati, A ⊂ X, f : A → Y una funzione e x̄ un punto di accumulazione per A, allora se esiste limx→x̄ f (x) tale limite è unico. Dimostrazione. supponiamo per assurdo che esistano due limiti `1 e `2 distinti. Sia = k`1 − `2 kY /3 > 0; allora esiste un δ1 > 0 tale che se 0 < kx − x̄kX < δ1 e x ∈ A si ha kf (x) − `1 kY < ; analogamente deve esistere un δ2 > 0 tale che se 0 < kx − x̄kX < δ2 e x ∈ A si ha kf (x) − `2 kY < . Sia δ = min(δ1 , δ2 ); poichè x̄ è un punto di accumulazione per A, esiste un x1 ∈ A tale che kx1 − x̄kX = η < δ, η > 0. Allora si deve avere kf (x1 ) − `1 kY < ; kf (x1 ) − `2 kY < (1.1.1) ma allora k`1 −`2 kY = k`1 −f (x1 )+f (x1 )−`2 kY ≤ k`1 −f (x1 )kY +kf (x1 )−`2 kY < 2 = 2 k`1 −`2 kY (1.1.2) 3 quindi k`1 − `2 kY = 0 e `1 = `2 . Analogamente si mostra il seguente Lemma 1.1.2. Siano (X, k kX ), (Y, k kY ) spazi normati, A ⊂ X non limitato e f : A → Y una funzione. Allora se esiste limx→∞ f (x) tale limite è unico. Definizione 1.1.6. Sia (X, k kX ) uno spazio normato, {ai } una successione in X e ` ∈ X; si dice che il limite della successione {ai } è ` (limn→∞ an = `) se per ogni > 0 esiste un N tale che se n > N , n ∈ N, allora kan − `kX < . Lemma 1.1.3. Sia (X, k kX ) uno spazio vettoriale, {ai } una successione in X che ammette limite, allora tale limite è unico. Dimostrazione. supponiamo esistano due limiti `1 6= `2 , allora fissato = k`1 −`2 kX /3 > 0 esistono N1 , N2 tali che se n > N1 si ha kan − `1 kX < , mentre se n > N2 si ha kan − `2 kX < . Si pone N = max(N1 , N2 ), si sceglie n > N e si ottiene k`1 − `2 kX ≤ k`1 − an kX + k`2 − an kX < 2 k`1 − `2 kX 3 (1.1.3) quindi k`1 − `2 kX = 0 e `1 = `2 . È inoltre semplice vedere che se una successione converge a ` allora anche ogni sua sottosuccessione converge a `. Definizione 1.1.7. Siano (X, k kX ), (Y, k kY ) spazi normati, A ⊂ X e f : A → Y una funzione. Sia x̄ ∈ A; si dice che f è continua in x̄ se per ogni > 0 esiste un δ > 0 tale che se x ∈ A è tale che kx̄ − xkX < δ si ha kf (x̄) − f (x)kY < . Lemma 1.1.4. Siano (X, k kX ), (Y, k kY ) spazi normati, A ⊂ X e f : A → Y una funzione. Sia x̄ ∈ A, allora f è continua in x̄ se e solo se limx→x̄ f (x) = f (x̄). Dimostrazione. discende immediatamente dalle definizioni. Lemma 1.1.5. Siano (X, k kX ), (Y, k kY ) spazi normati, A ⊂ X e f : A → Y una funzione. Sia x̄ ∈ A; allora f è continua in x̄ ⇔ per ogni successione {an } tale che ai ∈ A e limn→∞ an = x̄ si ha limn→∞ f (an ) = f (x̄). 1.1. DEFINIZIONI E PROPRIETÀ ELEMENTARI 3 Dimostrazione. ⇒) sia {an } una successione tale che limn→∞ an = x̄. Fissato > 0 sia δ > 0 come nella definizione di continuità, allora esiste un N > 0 tale che se n > N si ha kan − x̄kX < δ, quindi se n > N si ha kf (an ) − f (x̄)kY < , quindi limn→∞ f (an ) = f (x̄). ⇐) supponiamo per assurdo che f non sia continua in x̄, allora esiste un > 0 tale che per ogni δ > 0 esiste un xδ ∈ A tale che kxδ − x̄kX < δ e kf (xδ ) − f (x̄)kY ≥ . Consideriamo allora la successione {x1/n }, n ∈ N, n > 0. Si vede subito che essa converge a x̄ e poichè kf (x1/n )−f (x̄)kY ≥ non si può avere limn→∞ f (an ) = f (x̄), assurdo. Teorema 1.1.1. Siano (X, k kX ), (Y, k kY ) spazi normati, A ⊂ X e f, g : A → Y due funzioni. Se x̄ ∈ A e f, g sono continue in x̄ allora f + g è continua in x̄ Dimostrazione. sia > 0, allora esistono δ1 , δ2 > 0 tali che se x ∈ A e kx − x̄kX < δ1 allora kf (x) − f (x̄)kY < /2 mentre se kx − x̄kX < δ2 allora kg(x) − g(x̄)kY < /2. Usando la disuguaglianza triangolare si ha allora se kx − x̄kX < δ = min(δ1 , δ2 ) e x ∈ A kf (x) + g(x) − f (x̄) − g(x̄)kY ≤ kf (x) − f (x̄)kY + kg(x) − g(x̄)kY < (1.1.4) Analogamente si mostra il seguente: Lemma 1.1.6. Siano (X, k kX ), (Y, k kY ) spazi normati, A ⊂ X e f, g : A → Y due funzioni e x̄ ∈ X. Se limx→x̄ f (x) = `1 e limx→x̄ g(x) = `2 , allora limx→x̄ [f (x) + g(x)] = `1 + `2 . (Un enunciato analogo vale se limx→∞ f (x) = `1 e limx→∞ g(x) = `2 ). Teorema 1.1.2. Siano (X, k kX ), (Y, k kY ), (Z, k kZ ) tre spazi normati, siano A ⊂ X, B ⊂ Y , f : A → Y , g : B → Z, f (A) ⊂ B, x̄ ∈ A, f continua in x̄, g continua in f (x̄), allora g ◦ f è continua in x̄. Dimostrazione. discende immediatamente dalle definizioni. Definizione 1.1.8. Siano (X, k kX ), (Y, k kY ) spazi normati, A ⊂ X e f : A → Y una funzione. Si dice che f è continua se è continua in ogni punto di A. Definizione 1.1.9. Siano (X, k kX ), (Y, k kY ) spazi normati, A ⊂ X e f : A → Y una funzione. Si dice che f è lipschitziana in A se esiste una costante L > 0 tale che per ogni x, y ∈ A si ha kf (x) − f (y)kY ≤ Lkx − ykX (1.1.5) Lemma 1.1.7. Una funzione lipschitziana è anche continua. Dimostrazione. discende immediatamente dalle definizioni. Teorema 1.1.3. Sia (X, k chitziana. kX ) uno spazio normato, allora x → kxkX è una funzione lips- Dimostrazione. siano x, y ∈ X, allora usando le proprietà della norma si ha kxkX = kx + y − ykX ≤ kx − ykX + kykX (1.1.6) kykX = ky − x + xkX ≤ kx − ykX + kxkX (1.1.7) −kx − ykX ≤ kxkX − kykX ≤ kx − ykX (1.1.8) | kxkX − kykX | ≤ kx − ykX (1.1.9) da cui si ottiene cioè 4 CAPITOLO 1. SPAZI NORMATI E CON PRODOTTO SCALARE Definizione 1.1.10. Sia X uno spazio vettoriale e siano k k1 , k k2 due norme su X. Si dice che esse sono due norme equivalenti se esistono due costanti k, K > 0 tali che per ogni x ∈ X si ha: kkxk1 ≤ kxk2 ≤ Kkxk1 (1.1.10) Lemma 1.1.8. Sia X uno spazio vettoriale e siano k k1 , k k2 due norme equivalenti su X. Sia {ai } una successione in X, allora limn→∞ an = ` secondo la norma k k1 ⇔ limn→∞ an = ` secondo la norma k k2 Dimostrazione. ⇒) sia > 0, allora esiste un N > 0 tale che se n > N si ha kan − `k1 < /K (dove K è come nella definizione 1.1.10), ma allora kan − `k2 < , quindi limn→∞ an = ` anche secondo la norma k k2 . ⇐) dimostrazione analoga. analogamente si mostrano i seguenti lemmi: Lemma 1.1.9. Sia X uno spazio vettoriale e k kX1 , k kX2 due norme equivalenti su X. Sia Y uno spazio vettoriale e k kY 1 , k kY 2 due norme equivalenti su Y . A ⊂ X, f : A → Y , x̄ ∈ X e ` ∈ Y , allora sono equivalenti le due affermazioni seguenti 1. limx→x̄ f (x) = ` considerando (X, k kX1 ), (Y, k kY 1 ). 2. limx→x̄ f (x) = ` considerando (X, k kX2 ), (Y, k kY 2 ). Lemma 1.1.10. Sia X uno spazio vettoriale e k kX1 , k kX2 due norme equivalenti su X. Sia Y uno spazio vettoriale e k kY 1 , k kY 2 due norme equivalenti su Y . A ⊂ X, f : A → Y e x̄ ∈ A allora sono equivalenti le due affermazioni seguenti 1. f è continua in x̄ considerando (X, k kX1 ), (Y, k kY 1 ). 2. f è continua in x̄ considerando (X, k kX2 ), (Y, k kY 2 ). 1.2 Topologia Definizione 1.2.1. Se (X, k kX ) è uno spazio normato, x ∈ X e r > 0 si chiama palla aperta di centro x e raggio r l’insieme B(x, r) = {y ∈ X| kx − ykX < r} (1.2.1) Si chiama palla chiusa di centro x e raggio r l’insieme B(x, r) = {y ∈ X| kx − yk ≤ r} (1.2.2) Definizione 1.2.2. Se (X, k kX ) è uno spazio normato e A ⊂ X un insieme, si dice che A è aperto se per ogni a ∈ A esiste un ra > 0 tale che B(a, ra ) ⊂ A oppure se A = ∅. Si dice che A è chiuso se Ac è aperto (dove Ac è il complementare di A). Lemma 1.2.1. Se (X, k kX ) è uno spazio vettoriale, x ∈ X e r > 0 allora 1. B(x, r) è un insieme aperto 2. B(x, r) è un insieme chiuso. Dimostrazione. 1) sia y ∈ B(x, r), allora kx − ykX = r1 < r e sia = r − r1 . Allora B(y, ) ⊂ B(x, r), infatti se z ∈ B(y, ) si ha ky − zkX < e quindi kx − zkX = kx − y + y − zkX ≤ kx − ykX + ky − zkX < r1 + = r (1.2.3) 1.2. TOPOLOGIA 5 c c 2) sia ora y ∈ B(x, r) , allora ky − xkX = r2 > r. Sia δ = r2 − r, allora B(y, δ) ⊂ B(x, r) , infatti se ky − zkX < δ, allora kx − ykX ≤ kx − zkX + kz − ykX (1.2.4) kx − zkX ≥ kx − ykX − kz − ykX > r2 − δ = r (1.2.5) e quindi c quindi B(x, r) è aperto e B(x, r) è chiuso. Teorema 1.2.1. Sia (X, k kX ) uno spazio normato, allora 1. ∅ e X sono insiemi aperti. 2. l’unione di una famiglia di insiemi aperti è un insieme aperto. 3. l’intersezione di un numero finito di aperti è un insieme aperto. Dimostrazione. le affermazioni (1) e (2) sono immediate. Dimostriamo la (3): per induzione basta mostrarla nel caso di due insiemi A, B. Se A ∩ B = ∅ la tesi è vera. Se x ∈ A ∩ B allora esistono 1 , 2 tali che B(x, 1 ) ⊂ A e B(x, 2 ) ⊂ B. Allora se = min(1 , 2 ) si ha B(x, ) ⊂ A ∩ B. Usando le formule di De Morgan [ !c Ai = i∈I \ \ Aci (1.2.6) Aci (1.2.7) i∈I !c Ai i∈I = [ i∈I si ottiene il seguente Teorema 1.2.2. Sia (X, k kX ) uno spazio normato, allora 1. ∅ e X sono insiemi chiusi 2. l’intersezione di una famiglia di insiemi chiusi è un insieme chiuso 3. l’unione di un insieme finito di insiemi chiusi è un insieme chiuso. Teorema 1.2.3. Sia (X, k kX ) uno spazio normato e A ⊂ X, allora A è chiuso ⇔ ogni successione convergente di elementi di A converge ad un elemento di A. Dimostrazione. ⇒) sia {ai } una successione di elementi tale che an → y. Si deve mostrare che y ∈ A. Supponiamo per assurdo che y ∈ / A, allora esiste > 0 tale che B(y, ) ⊂ Ac e per la definizione di limite esiste un N tale che, se n > N , an ∈ B(y, ), quindi aN +1 ∈ / A, contrariamente all’ipotesi che {an } sia una successione di elementi di A. ⇐) supponiamo ora che ogni successione convergente di elementi di A converga ad un elemento di A e supponiamo per assurdo che A non sia chiuso; allora Ac non è aperto, quindi esiste x ∈ Ac tale che per ogni > 0 B(x, ) 6⊂ Ac , quindi per ogni > 0 esiste un x ∈ A tale che x ∈ B(x, ). La successione {x1/n } è allora una successione di elementi di A che converge a x, quindi per ipotesi x ∈ A, mentre x ∈ Ac . Dal teorema 1.2.3 e dal lemma 1.1.8 segue allora immediatamente il seguente teorema Teorema 1.2.4. Sia X uno spazio normato, k allora 1. A è chiuso nella norma k k1 , k k2 due norme equivalenti su X e A ⊂ X, k1 se e solo se è chiuso nella norma k k2 . 6 CAPITOLO 1. SPAZI NORMATI E CON PRODOTTO SCALARE 2. A è aperto nella norma k k1 se e solo se è aperto nella norma k k2 . Definizione 1.2.3. Sia (X, k kX ) uno spazio normato e A ⊂ X, allora si chiama chiusura di A il più piccolo insieme chiuso che contiene A ovvero l’intersezione di tutti gli insiemi chiusi che contengono A e si indica con A. Teorema 1.2.5. Sia (X, k kX ) uno spazio normato e A ⊂ X, A 6= ∅ allora x ∈ A ⇔ esiste una successione di elementi di A che converge a x. Dimostrazione. sia C l’insieme cosı̀ definito: x ∈ C se esiste una successione di elementi di A che converge ad x. Dalla definizione segue che dato y ∈ C, per ogni > 0 esiste x ∈ A tale che kx − ykX < . Mostriamo che C è chiuso: sia {c(n) } una successione di elementi di C che (n) converge a c; si deve mostrare che c ∈ C. Consideriamo la successione {c1/n } di elementi di A: evidentemente anch’essa converge a c, quindi per definizione c ∈ C. Sia ora D un chiuso tale che A ⊂ D. Sia {an } una successione di elementi di A che converge a x; per il teorema 1.2.3 si ha allora x ∈ D, ma allora C ⊂ D, quindi C è contenuto in ogni chiuso che contiene A, quindi è il più piccolo chiuso che contiene A, cioè la sua chiusura. Corollario 1.2.1. Sia (X, k di B(x, r). kX ) uno spazio normato, x ∈ X e r > 0, allora B(x, r) è la chiusura Dimostrazione. sia y ∈ B(x, r), allora ky − xkX ≤ r; sia {tn } una successione in R tale che tn → 1 e |tn | < 1, allora è semplice vedere che la successione {x + tn (y − x)} è una successione di elementi di B(x, r) che converge a y, quindi B(x, r) è contenuto nella chiusura di B(x, r), ma per il lemma 1.2.1 B(x, r) è un insieme chiuso, quindi è la chiusura di B(x, r). Definizione 1.2.4. Sia (X, k kX ) uno spazio normato e A ⊂ X. A si dice insieme compatto (più precisamente compatto per successioni) se da ogni successione di elementi di A si può estrarre una sottosuccessione che converge ad un elemento di A. Un insieme si dice relativamente compatto se la sua chiusura è un insieme compatto. A causa del lemma 1.1.8, se k k1 , k k2 sono due norme equivalenti su X e A ⊂ X, allora A è compatto secondo la norma k k1 se e solo se è compatto per la norma k k2 . Lemma 1.2.2. Sia (X, k chiuso e limitato. kX ) uno spazio normato e A ⊂ X un insieme compatto, allora A è Dimostrazione. verifichiamo che A è chiuso: sia {an } una successione di elementi di A che converge a x ∈ X, allora esiste una sottosuccessione di {an } che converge ad un elemento di A, ma ogni sotosuccessione di {an } converge ad x, quindi x ∈ A e per il teorema 1.2.3 A è un insieme chiuso. Verifichiamo che A è limitato. Supponiamo per assurdo che A non sia limitato, allora si può costruire una successione {xn } tale che limn→∞ kxn kX = ∞. Supponiamo esista una sottosuccessione {xnk } convergente a y ∈ X, allora per la continuità della norma (teorema 1.1.3) si dovrebbe avere limk→∞ kxnk kX = kykX < +∞ mentre limk→∞ kxnk kX = ∞. Teorema 1.2.6 (Weierstrass). Sia (X, k kX ) uno spazio normato, A ⊂ X un insieme compatto e f : A → R una funzione continua, allora esiste xm ∈ A in cui f assume il suo valore minimo e xM ∈ A in cui f assume il suo valore massimo. Dimostrazione. sia M = supx∈A f (x) e sia {yn } una successione in A tale che f (yn ) → M . Per la compattezza di A, esiste una sottosuccessione ynk che converge ad un elemento di A, sia esso xM , quindi si ha ynk → xM ; f (ynk ) → M (1.2.8) poichè f è continua, si ha f (xM ) = limk→∞ f (ynk ) = M , quindi in xM la funzione f assume il suo massimo. Analogamente si prova l’esistenza del minimo. 1.2. TOPOLOGIA 7 Definizione 1.2.5. Siano (X, k kX ), (Y, k kY ) due spazio normati, A ⊂ X e f : A → Y ; si dice che f è uniformemente continua se per ogni > 0 esiste un δ > 0 tale che per ogni x, y ∈ A si ha kx − ykX < δ ⇒ kf (x) − f (y)kY < (1.2.9) Evidentemente ogni funzione uniformemente continua è continua; il viceversa non è vero (f (x) = x2 su (R, | |) è continua ma non uniformemente continua). Teorema 1.2.7 (Heine-Cantor-Borel). Siano (X, k kX ), (Y, k kY ) spazi normati, A ⊂ X un insieme compatto e f : A → Y una funzione continua, allora f è uniformemente continua. Dimostrazione. supponiamo per assurdo che f non sia uniformemente continua, allora esisterebbe un > 0 tale che per ogni δ > 0 esisterebbero due elementi xδ , yδ di A tali che kxδ − yδ kX < δ; kf (xδ ) − f (yδ )kY ≥ (1.2.10) Consideriamo la successione {x1/n } di elementi di A; poichè A è compatto esiste una sottosuccessione {x1/nk } che converge ad a ∈ A. A causa della prima delle relazioni 1.2.10 anche {y1/nk } converge ad a, ma allora f (x1/nk ) → f (a) e f (y1/nk ) → f (a) per la continuaità di f e quindi per la continuità della norma (teorema 1.1.3) si dovrebbe avere kf (x1/nk ) − f (y1/nk )kY → 0 (1.2.11) contrariamente alla seconda disuguaglianza in 1.2.10. Teorema 1.2.8. Sia X uno spazio vettoriale di dimensione finita, allora in X tutte le norme sono equivalenti. Dimostrazione. sia {e1 . . . , en } una base di X e definiamo la norma k k1 come segue ka1 e1 + · · · + an en k1 = |a1 | + · · · + |an | (1.2.12) è immediato verificare che k k1 è effettivamente una norma su X. Verifichiamo ora che l’insieme S(0, 1) = {x ∈ X| kxk1 = 1} è un sottoinsieme compatto di X per la norma k k1 : sia {x(n) } una (n) (n) successione in S(0, 1), allora kx(n) k1 = 1 quindi le n successioni delle componenti {x1 }, . . . , {xn } sono successioni limitate in R, quindi è possibile estrarre dalla prima una sottosuccessione con(i (1) (1) ) (i ) vergente in R, sia essa {x1 k }; allora la sottosuccessione {x2 k } è limitata, quindi vi si può (2) (ik ) estrarre una sottosuccessione {x2 } convergente. Procedendo in questo modo n volte si ottiene (i (n) ik (n) ) un insieme di indici, sia esso tale che {xj k } converge per ogni j = 1, . . . , n ad un elemento x̄j quando k → ∞. A questo punto per come è stata definita k k1 è immediato vedere che (i (n) kx̄1 e1 + · · · + x̄n en − x1 k ) (i (n) e1 − · · · − xn k ) en kX → 0 se k → ∞ (1.2.13) cioè esiste una sottosuccessione convergente di {x(n) }. Si deve ora mostrare che l’elemento a cui tale sottosuccessione tende sia in S(0, 1); per fare ciò basta mostrare che S(0, 1) è un insieme chiuso, ma esso è intersezione di due chiusi, poichè S(0, 1) = B(0, 1)c ∩ B(0, 1) (1.2.14) quindi per il teorema 1.2.2 è un insieme chiuso. Si è cosı̀ visto che S(0, 1) è un compatto. Sia ora k k una qualsiasi norma su X; allora ka1 e1 + · · · + an en k ≤ |a1 | ke1 k + · · · + |an | ken k ≤ Kka1 e1 + · · · + an en k1 (1.2.15) dove K = max(ke1 k, . . . , ken k), quindi per ogni x ∈ X si ha kxk ≤ Kkxk1 quindi la funzione x → kxk è lipschitziana rispetto alla norma k k1 (per il teorema 1.1.3), in particolare è continua. 8 CAPITOLO 1. SPAZI NORMATI E CON PRODOTTO SCALARE Per il teorema di Weierstrass, poichè S(0, 1) è compatto, x → kxk assume il suo minimo su S(0, 1) in un punto xm . Poichè xm 6= 0 (poiché kxm k1 = 1 6= 0) si avrà kxm k = m > 0, quindi kyk ≥ m per ogni y ∈ S(0, 1). Sia ora x ∈ X, x 6= 0, allora è immediato vedere che x/kxk1 ∈ S(0, 1) quindi x (1.2.16) kxk1 ≥ m cioè kxk ≥ mkxk1 che insieme a 1.2.15 mostra che le due norme k k e k k1 sono equivalenti. Poichè l’equivalenza tra norme è una relazione di equivalenza e si è appena visto che tutte le norme sono equivalenti a k k1 , tutte le norme sono equivalenti tra loro. Il teorema precedente è falso in dimensione infinita: sia X lo spazio delle funzioni continue e limitate con derivata continua e limitata. Si vede semplicemente che le seguenti sono norme su X: kf k0 = sup |f (x)| x∈R kf k1 = sup |f (x)| + sup |f 0 (x)| x∈R (1.2.17) x∈R Si consideri la successione fn = n1 sin(nx) si vede semplicemente che fn → 0 nella norma k k0 ma non nella norma k k1 (poichè kfn k1 = n1 + 1) quindi per il lemma 1.1.8 le due norme non possono essere equivalenti. Corollario 1.2.2 (Bolzano-Weierstrass). Sia (X, k X un insieme limitato e chiuso, allora A è compatto. kX ) uno spazio di dimensione finita, A ⊂ Dimostrazione. per il teorema precedente basta mostrare la tesi per la norma k k1 introdotta nella dimostrazione precedente. In questo caso la dimostrazione è identica a quella con cui nel teorema precedente si è visto che S(0, 1) è compatto. Anche questo teorema non è in generale vero in dimensione infinita: si consideri lo spazio B(R) delle funzioni limitate su R con la norma kf k = supx∈R |f (x)| (norma della convergenza 2 uniforme). Verifichiamo che l’insieme B(0, 1), chiuso e limitato, non è compatto: sia fn = e−nx , allora fn ∈ B(0, 1) e fn converge puntualmente alla funzione f tale che f (0) = 1 e f (x) = 0 se x 6= 0, ma kf − fn k = 1 quindi non esistono sottosuccessioni di {fn } che convergono nella norma k k, quindi B(0, 1) in questo caso non è compatto. In alcuni testi viene citato come teorema di Bolzano-Weierstrass il seguente: Corollario 1.2.3 (Bolzano-Weierstrass). Sia (X, k kX ) uno spazio normato di dimensione finita e sia A ⊂ X un insieme limitato avente un numero infinito di elementi, allora A ha almeno un punto di accumulazione in X. Dimostrazione. poichè A è limitato, esiste R > 0 tale che A ⊂ B(0, R) e quindi A ⊂ B(0, R), quindi A è un insieme chiuso e limitato in uno spazio normato di dimensione finita, quindi per il teorema di Bolzano-Weierstrass (prima forma) A è compatto. Poichè A ha un numero infinito di elementi, esiste una successione di elementi distinti di A, sia essa {xn }. Poichè A ⊂ A e A è compatto, la successione {xn } ammette una sottosuccessione convergente che continueremo ad indicare con {xn } per semplicità di notazione, quindi esite un y ∈ X tale che xn → y, cioè per ogni > 0 esiste un N tale che se n > N si ha xn ∈ B(y, ). Se y è diverso da xn per ogni n è allora ovvio che y è un punto di accumulazione di A. Se esiste un n̄ tale che y = xn̄ , per come è stata costruita la successione si ha che se n > max(N, n̄) si ha xn ∈ B(y, ) e xn 6= y = xn̄ quindi y è un punto di accumulazione di A Definizione 1.2.6. Sia (X, k kX ) uno spazio normato e siano A, B ⊂ X tali che A ⊂ B. Si dice che A è denso in B se B ⊂ A. Dal teorema 1.2.5 segue immediatamente che A è denso in B se e solo se per ogni b ∈ B, > 0 esiste un a ∈ A tale che a ∈ B(b, ). 1.3. SPAZI DI BANACH 9 Definizione 1.2.7. Sia (X, k kX ) uno spazio normato e sia A ⊂ X. Si chiama parte interna di A l’insieme Å costituito dall’unione di tutti gli aperti contenuti in A, ovvero il più grande aperto contenuto in A. Dalla definizione segue immediatamente che a ∈ Å se e solo se esiste un > 0 tale che B(a, ) ⊂ A. Lemma 1.2.3. Sia (X, k kX ) uno spazio normato e A ⊂ X, allora Å = ∅ ⇔ Ac è denso in X. Dimostrazione. ⇒) se Å = ∅ (e A 6= ∅ altrimenti la tesi è ovvia) per ogni a ∈ A, per ogni > 0 si ha B(a, ) ∩ Ac 6= ∅, quindi A ⊂ Ac , ma evidentemente Ac ⊂ Ac e Ac ∪ A = X, quindi X ⊂ Ac . ⇐) sia A tale che Ac sia denso in X (e nuovamente A 6= ∅), allora per ogni a ∈ A, per ogni > 0 esiste un b ∈ Ac tale che b ∈ B(a, ) e quindi B(a, ) non è contenuto completamente in A, quindi Å = ∅. 1.3 Spazi di Banach Definizione 1.3.1. Sia (X, k kX ) uno spazio normato e sia {xn } una successione in X; si dice che la successione {xn } è una successione di Cauchy (in alcuni testi si trova successione fondamentale) se per ogni > 0 esiste un N ∈ N tale che se n, m > N allora si ha kxn − xm k < . È immediato verificare che se X è uno spazio vettoriale, k k1 , k k2 sono due norme equivalenti su X e {xn } è una successione in X, allora {xn } è una successione di Cauchy per la norma k k1 se e solo se è una successione di Cauchy per la norma k k2 . Lemma 1.3.1. Sia (X, k kX ) uno spazio normato e sia {xn } una successione convergente, allora {xn } è una successione di Cauchy. Dimostrazione. sia limn→∞ xn = x, allora per ogni > 0 esiste un N tale che se n > N si ha kx − xn kX < /2, quindi se n, m > N si ha kxn − xm kX ≤ kxn − xkX + kxm − xkX < (1.3.1) Definizione 1.3.2. Sia (X, k kX ) uno spazio normato. Esso si dice completo se ogni successione di Cauchy converge. Uno spazio normato completo si chiama anche spazio di Banach . Lemma 1.3.2. Sia X uno spazio vettoriale e siano k k1 , k k2 due norma equivalenti su X, allora X è completo rispetto a k k1 se e solo se è completo rispetto a k k2 . Dimostrazione. discende subito dal lemma 1.1.8. Si userà il fatto, dimostrato nei corsi di Analisi del primo anno, che lo spazio (R, | |) è uno spazio normato completo. Teorema 1.3.1. Ogni spazi normato di dimensione finita è completo. Dimostrazione. poichè in dimensione finita tutte le norme sono equivalenti (vedi teorema 1.2.8), per il lemma 1.3.2 basta dimostrare che X è completo rispetto ad una particolare norma. Se {e1 , . . . , en } è una base di X, introduciamo la norma ka1 e1 + · · · + an en k1 = |a1 | + · · · + |an | (1.3.2) Sia ora {x(i) } una successione di Cauchy in X rispetto alla norma k k1 . Si vede subito che allora (i) (i) le successioni {x1 }, . . . , {xn } delle componenti di x(i) sono successioni di Cauchy in R e quindi convergono ad elementi x1 , . . . , xn . Allora si ha (i) kx(i) − (x1 e1 + · · · + xn en )k1 = |x1 − x1 | + · · · + |x(i) n − xn | (1.3.3) 10 CAPITOLO 1. SPAZI NORMATI E CON PRODOTTO SCALARE e poichè per i → ∞ il secondo membro tende a 0 per costruzione si ha che lim x(i) = x1 e1 + · · · + xn en i→∞ (1.3.4) quindi ogni successione di Cauchy converge e quindi lo spazio è completo Corollario 1.3.1. Sia (X, k finita, allora Y è chiuso. kX ) uno spazio normato e sia Y ⊂ X un sottospazio di dimensione Dimostrazione. usiamo il teorema 1.2.3: sia {yn } una successione di elementi di Y che converge a y ∈ X; si deve mostrare che y ∈ Y . Poichè {yn } converge, è una successione di Cauchy in X, quindi è una successione di Cauchy nello spazio normato ottenuto restringendo a Y la norma di X, quindi {yn } è una successione di Cauchy nello spazio normato (Y, k kX|Y ) che, per il teorema precedente è completo, quindi esiste ȳ ∈ Y tale che yn → ȳ nello spazio (Y, k kX|Y ) ma, per come tale spazio è stato costruito, si ha anche evidentemente yn → ȳ nello spazio (X, k kX ) e per l’unicità del limite si ha quindi y = ȳ e quindi y ∈ Y . Teorema 1.3.2. sia (X, k kX ) uno spazio normato, allora esiste uno spazio normato completo X̂ tale che X è isomorfo ad un sottospazio X̃ di X̂ tramite l’isomorfismo v → v̂, si ha kvkX = kv̂kX̂ e X̃ è denso in X̂. Dimostrazione. sia A l’insieme delle successioni di Cauchy di elementi dello spazio (X, k kX ). Siano {xn }, {yn } ∈ A, allora scriviamo {xn } ∼ {yn } se limn→∞ kxn − yn kX = 0; è immediato vedere che ∼ è una relazione di equivalenza in A; inoltre definendo {xn } + {yn } = {xn + yn }, α{xn } = {αxn } l’insieme A diventa uno spazio vettoriale. Poniamo X̂ = A/ ∼, cioè X̂ è l’insieme quoziente di A rispetto alla relazione di equivalenza ∼; se a ∈ A, indichiamo con [a] la classe di equivalenza cui appartiene a. Siano ora u, v ∈ X̂, allora esistono due successioni di Cauchy di elementi di X, {xn }, {yn } tali che u = [{xn }], v = [{yn }]; definiamo allora u + v = [{xn + yn }]; è immediato vedere che questa definizione è non ambigua, cioè non dipende dalla particolare scelta delle successioni {xn }, {yn }: siano {x0n }, {yn0 } due successioni tali che {x0n } ∼ {xn } e {yn0 } ∼ {yn }, allora si ha lim kxn + yn − x0n − yn0 kX ≤ lim kxn − x0n k + lim kyn − yn0 kX = 0 n→∞ n→∞ n→∞ (1.3.5) quindi {xn + yn } ∼ {x0n + yn0 } e quindi u + v = [{xn + yn }] = [{x0n + yn0 }]. Analogamente si vede che se u ∈ X̂, u = [{xn }], allora ha senso porre αu = [{αxn }]. Dotato di queste operazioni l’insieme X̂ diventa uno spazio vettoriale. Se u ∈ X̂, u = [{xn }] poniamo kukX̂ = limn→∞ kxn kX ; poichè {xn } è una successione di Cauchy in X e | kxn kX − kxm kX | ≤ kxn − xm kX (vedi teorema 1.1.3) la successione {kxn kX } è una successione di Cauchy in R, quindi ammette limite, quindi limn→∞ kxn kX < +∞; inoltre, se {xn } ∼ {x0n }, si ha | kxn kX − kx0n kX | ≤ kxn − x0n kX → 0 quindi limn→∞ kx0n kX = limn→∞ kxn kX e quindi la definizione di kukX̂ è non ambigua. È semplice vedere che k kX̂ è una norma nello spazio vettoriale X̂. Sia ora x ∈ X, allora la successione {yn = x} è evidentemente una successione di Cauchy, quindi {yn = x} ∈ A e quindi [{yn = x}] ∈ X̂. Poniamo x̂ = [{yn = x}]. È immediato verificare che se x 6= y in X, allora x̂ 6= ŷ in X̂, infatti kx̂ − ŷkX̂ = lim kx − ykX = kx − ykX > 0 n→∞ (1.3.6) è anche semplice vedere che x̂ + ŷ = x[ + y e che αx̂ = αx, c quindi la applicazione x → x̂ è un isomorfismo tra lo spazio vettoriale X ed un sottospazio X̃ di X̂. Inoltre questo isomorfismo conserva le norme, infatti kx̂kX̂ = lim kxkX = kxkX (1.3.7) n→∞ Mostriamo ora che X̃ è denso in X̂: sia y ∈ X̂ e [{yn }] = y, allora yn ∈ X e quindi ŷn ∈ X̃ e si ha ky − ŷn kX̂ = lim kyk − yn kX k→∞ (1.3.8) 1.3. SPAZI DI BANACH 11 e poichè {yn } è una successione di Cauchy in X, fissato > 0 esiste un N tale che se k, n > N si ha kyk − yn kX < , quindi ky − ŷN +1 kX̂ < , quindi X̃ è denso in X̂. Mostriamo ora che (X̂, k kX̂ ) è uno spazio di Banach: sia {yn } una successione di Cauchy in X̂, quindi fissato > 0, se n, m > N si ha kyn −ym kX̂ < /4; sia x̂n ∈ X̃ tale che kyn − x̂n kX̂ < 1/n (ciò è possibile poichè si è appena visto che X̃ è denso in X̂), allora si ha kxn − xm kX = kx̂n − x̂m kX̂ ≤ kx̂n − yn kX̂ + kyn − ym kX̂ + kym − x̂m kX̂ ≤ 1 1 + + (1.3.9) n 4 m quindi la successione {xn } è una successione di Cauchy in X, quindi si può porre z = [{xn }] ∈ X̂ e si ha 1 kz − yk kX̂ ≤ kz − x̂k kX̂ + kx̂k − yk kX̂ ≤ lim kxn − xk kX + (1.3.10) n→∞ k Se ora n, k > N > 4/, da 1.3.9 e 1.3.10 si ottiene kz − yk kX̂ ≤ 1 1 1 + + + < n 4 k k (1.3.11) quindi limk→∞ yk = z. Definizione 1.3.3. Lo spazio (X̂, k spazio (X, k kX ). kX̂ ) del teorema precedente si dice completamento dello Definizione 1.3.4. Si indica con C([a, b]) lo spazio delle funzioni continue nell’intervallo [a, b], con C(−∞, ∞) lo spazio delle funzioni continue su tutta la retta reale. Si indica con Cc ([a, b]) il sottoinsieme di C([a, b]) costituito dalle funzioni f tali che f (a) = f (b) = 0; si indica con Cc (−∞, ∞) l’insieme delle funzioni f di C(−∞, ∞) tali che esiste un M > 0 tale che f (x) = 0 se |x| > M . Rb Lemma 1.3.3. Lo spazio Cc ([a, b]) con la norma kf k1 = a |f (x)|dx non è uno spazio normato completo. Dimostrazione. consideriamo ad esempio lo spazio Cc ([−1, 1]) (ovviamente il caso generale si tratta in modo analogo) e la successione di funzioni su [−1, −1/n] 0 nx + 1 su (−1/n, 0] fn (x) = (1.3.12) −x + 1 su (0, 1] sia f (x) = 0 su −x + 1 su [−1, 0] (0, 1] (1.3.13) allora è immediato verificare che kfn −f k1 = 1/(2n), quindi f = limn→∞ fn , ma f ∈ / Cc ([−1, 1]). Definizione 1.3.5. Si chiama L1 (a, b) il completamento dello spazio Cc ([a, b]) con la norma k del lemma precedente (questa definizione vale anche se a = −∞, b = +∞) k1 Teorema 1.3.3. Lo spazio L1 (a, b) è lo spazio delle funzioni integrabili secondo Lebesgue, in cui si identificano funzioni uguali quasi ovunque, con la norma Z b kf k1 = |f (x)|dx (1.3.14) a (il teorema è vero anche se a = −∞, b = +∞) Dimostrazione. per dimostrare il teorema, si dovrebbe mostrare che lo spazio delle funzioni integrabili secondo Lebesgue (con l’identificazione della tesi) è completo rispetto alla norma k k1 e che Cc (a, b) è denso in esso. La dimostrazione di questi fatti è nella appendice A nel caso più generale di dimensione n. 12 CAPITOLO 1. SPAZI NORMATI E CON PRODOTTO SCALARE Teorema 1.3.4 (Weierstrass). Lo spazio Vp (a, b) dei polinomi in una variabile, è denso nello spazio C([a, b]) (|a|, |b| < ∞) con la norma kf k∞ = supx∈[a,b] |f (x)|. Dimostrazione. si dimostrerà il teorema per il caso [a, b] = [0, 1] poichè tramite un cambiamento lineare di variabile ci si può sempre ricondurre a questo caso. Sia f ∈ C([0, 1]); si può supporre f (0) = f (1) = 0, altrimenti si considera la funzione g(x) = f (x)−f (0)−x[f (1)−f (0)] e se esiste un polinomio p(x) tale che kg−pk∞ < allora kf (x)−{p(x)+f (0)+x[f (1)−f (0)]}k∞ = kg−pk∞ < . Supponiamo quindi f (0) = f (1) = 0 e prolunghiamo f su [0, 1]c ponendo ivi f (x) = 0. Definiamo ora (1 − x2 )n δn (x) = R 1 (1.3.15) (1 − x2 )n −1 R1 allora δn (x) ≥ 0 e −1 δn (x)dx = 1. Definiamo quindi Z Z 1 Pn (x) = 1−x f (y)δn (y − x)dy = 0 f (z + x)δn (z)dz (1.3.16) −x dalla prima delle due forme risulta che Pn è un polinomio nella variabile x. Si ha inoltre Pn (x) = R1 f (z + x)δn (z)dz, infatti se z < −x, allora x + z < 0 e quindi f (x + z) = 0, analogamente se −1 z > 1 − x, allora z + x > 1 e f (x + z) = 0. Si ha quindi Z |Pn (x)−f (x)| = Z 1 1 f (z + x)δn (z)dz − f (x) −1 −1 Z δn (z)dz ≤ 1 δn (z)|f (x+z)−f (x)|dz (1.3.17) −1 Poichè f è continua su un compatto essa è uniformemente continua (teorema di Heine-CantorBorel), quindi dato > 0 esiste un δ > 0 tale che se |z| < δ allora |f (x + z) − f (x)| < . Risulta quindi conveniente spezzare la disuguaglianza 1.3.17 in 3 parti: Z Z Z ! −δ |Pn (x) − f (x)| ≤ δ + −1 1 δn (z)|f (x + z) − f (x)|dz = I1 + I2 + I3 + δ si ha Z Z δ I2 ≤ 1 δn (z)dz ≤ −δ δn (z)dz = 0 da cui si deduce δn (z) ≤ n+1 2 (1 Z I3 = 0 2 n+1 (1.3.20) − z 2 )n . Sia M = kf k∞ , allora si ha Z 1 δn (z)|f (x + z) − f (x)|dz ≤ δ (1.3.19) −1 inoltre si ha la stima Z 1 Z 1 Z 1 (1 − x2 )n dx = 2 (1 − x)n (1 + x)n dx ≥ 2 (1 − x)n dx = −1 (1.3.18) δ 1 2M δn (z)dz ≤ (1.3.21) δ Z 1 ≤ 2M δ n+1 (1 − z 2 )n dz ≤ M (n + 1)(1 − δ 2 )n 2 dove nell’ultimo passaggio si è usato il fatto che (1−z 2 )n è decrescente su [δ, 1]. Quindi limn→∞ I3 = 0. Analogamente si vede che limn→∞ I1 = 0, quindi esiste un N > 0 tale che |PN (x) − f (x)| < 2 per ogni x e quindi kPN − f k∞ < 2. È semplice vedere che il teorema precedente non è più vero se, ad esempio, b = ∞: basta considerare la funzione continua f (x) = ex , allora per ogni polinomio p(x) si ha limx→+∞ |ex − p(x)| = ∞. 1.3. SPAZI DI BANACH 13 Corollario 1.3.2. Sia |a|, |b| < +∞, e sia Vp (a, b) lo spazio dei polinomi in una variabile su [a, b], allora Vp (a, b) è denso in L1 (a, b). Dimostrazione. sia f ∈ L1 (a, b), allora, fissato > 0, per definizione esiste una funzione φ ∈ Cc ([a, b]) tale che kf − φk1 < /2. Sia ora p(x) un polinomio, allora si ha Z b |φ(x) − p(x)|dx ≤ (b − a) sup |φ(x) − p(x)| = (b − a)kφ − pk∞ kφ − pk1 = (1.3.22) x∈[a,b] a per il teorema di Waierstrass kφ − pk∞ può essere reso piccolo a piacere, quindi esiste un polinomio p(x) tale che kφ − pk1 < /2 e quindi kf − pk1 < . Definizione 1.3.6. Si indica con C ∞ ([a, b]) lo spazio delle funzioni di C([a, b]) infinitamente derivabili in (a, b) con derivate prolungabili per continuità su [a, b]. Si indica con Cc∞ ([a, b]) l’insieme delle funzioni di Cc ([a, b]) ∩ C ∞ ([a, b]). Corollario 1.3.3. Se |a|, |b| < ∞, l’insieme C ∞ ([a, b]) è denso in L1 (a, b). Dimostrazione. per il corollario 1.3.2 i polinomi sono densi in L1 (a, b) e evidentemente i polinomi sono contenuti in C ∞ ([a, b]). Teorema 1.3.5. Se |a|, |b| < ∞, allora Cc∞ ([a, b]) è denso in L1 (a, b). Dimostrazione. sia δ > 0 da fissare e definiamo 1 N e− (x−a)(a+δ−x) se x ∈ (a, a + δ) ωδ (x) = 0 se x ∈ [a + δ, b], x = a 1 N 0 e− (b−x)(x−b+δ) se x ∈ (b − δ, b) 0 se x ∈ [a, b − δ], x = b Rb Rb e siano N, N 0 tali che a ωδ (x)dx = a ωδ0 (x)dx = 1. Definiamo quindi ωδ0 (x) (1.3.23) = Z ηδ (x) = a x [ωδ (t) − ωδ0 (t)]dt (1.3.24) (1.3.25) È semplice vedere che ηδ ha le seguenti proprietà: ηδ ∈ Cc∞ ([a, b]), 0 ≤ ηδ ≤ 1 e se x ∈ (a + δ, b − δ) si ha ηδ (x) = 1. Sia ora f ∈ L1 (a, b) e, fissato > 0, sia p(x) un polinomio tale che kf − pk1 < . Sia ora M = maxx∈[a,b] |p(x)| e scegliamo δ < /M , allora ηδ (x)p(x) ∈ Cc∞ ([a, b]) e si ha Z b kf − ηδ pk1 ≤ kf − pk1 + kp − ηδ pk1 ≤ + Z Z a+δ =+ |p(x)|(1 − ηδ (x))dx = |p(x)|(1 − ηδ (x))dx + a Z ≤+ Z a+δ |p(x)|(1 − ηδ (x))dx ≤ b−δ b |p(x)|dx + a (1.3.26) a b |p(x)|dx ≤ + 2δM ≤ 3 b−δ Definizione 1.3.7. Dato E ⊂ Rn si indica con χE la funzione caratteristica dell’insieme E cioè la funzione che vale 1 su E e 0 altrove (in taluni testi la funzione caratteristica è indicata con 1E ) Corollario 1.3.4. Cc∞ ([a, b]) è denso in L1 (a, b) anche se a = −∞, b = ∞. 14 CAPITOLO 1. SPAZI NORMATI E CON PRODOTTO SCALARE Dimostrazione. sia f ∈ L1 (−∞, ∞) e sia fR (x) = f (x)χ[−R,R] , allora limR→∞ |fR (x) − f (x)| = 0 (almeno per q.o. x) e |f − fR | ≤ 2|f |, quindi per il teorema della convergenza dominata Z ∞ lim |f (x) − fR (x)|dx = 0 (1.3.27) R→∞ −∞ quindi per ogni > 0 esiste un R > 0 tale che kf − fR k1 < e evidentemente fR ∈ L1 (−R, R), RR quindi esiste una funzione φ ∈ Cc∞ ([−R, R]) tale che −R |fR (x) − φ(x)| ≤ . Prolunghiamo ora φ ponendo φ(x) = 0 se x ∈ [−R, R]c , quindi si ha φ ∈ Cc∞ (−∞, ∞) e si ha Z ∞ kf − φk1 ≤ kf − fR k1 + kfR − φk1 ≤ + |fR (x) − φ(x)|dx = (1.3.28) Z −∞ R =+ |fR (x) − φ(x)|dx ≤ 2 −R Definizione 1.3.8. Se p ≥ 1 si definisce spazio Lp (a, b) l’insieme delle funzioni f tali che Rb |f (x)|p dx < ∞ in cui si identificano funzioni ugauali q.o. a Su Lp (a, b) si definisce la norma k kp Z b kf kp = !1/p |f (x)|p dx (1.3.29) a kp cosı̀ definita è effettivamente una norma in Lp (a, b). si può mostrare che k Teorema 1.3.6 (Fischer-Riesz). Lo spazio Lp (a, b) con la norma k per ogni p ≥ 1, a, b ∈ R (anche a = −∞, b = ∞). kp è uno spazio di Banach Teorema 1.3.7. Cc∞ ([a, b]) è denso in Lp (a, b) per ogni p ≥ 1, per ogni a, b (anche a = −∞, b = ∞). Teorema 1.3.8 (Disuguaglianza di Hölder). Siano r, s ≥ 1 tali che 1r + f ∈ Lr (a, b), g ∈ Ls (a, b), allora f g ∈ L1 (a, b) e si ha !1/r Z !1/s Z Z b b |f (x)g(x)|dx ≤ a b |f (x)|r dx a 1 s |g(x)|s dx = 1 e siano (1.3.30) a il teorema vale anche se a = −∞, b = +∞. Per i dettagli delle dimostrazioni precedenti ed alcune generalizzazioni si rimanda all’appendice A. Corollario 1.3.5. se |a|, |b| < ∞, e p > q ≥ 1, allora Lp (a, b) ⊂ Lq (a, b). Dimostrazione. se f ∈ Lp (a, b) allora |f |q ∈ Lp/q (a, b) e inoltre p/q > 1, quindi esiste t > 1 tale 1 = 1, allora usando la disuguaglianza di Holder si ha che 1t + p/q Z b Z q |f (x)| dx ≤ a !1/t b Z b 1dx a !q/p q p/q (|f (x)| ) a dx = kf kqp (b − a)1/t < ∞ (1.3.31) Il corollario non è più vero se |a|, |b| 6< ∞: consideriamo ad esempio a = 1, b = ∞, allora 1/x ∈ L2 (1, ∞) ma 1/x ∈ / L1 (1, ∞). Vedremo ora come sono legate la convergenza puntuale, uniforme ed in norma Lp (la convergenza in norma Lp è detta anche convergenza in media di ordine p). 1.3. SPAZI DI BANACH 15 Teorema 1.3.9. Sia fn una successione di funzioni di Lp (a, b) che converge in Lp (a, b) alla funzione f , allora esiste una sottosuccessione di f che converge a f puntualmente per q.o. x ∈ (a, b) (il teorema vale anche se a = −∞, b = ∞). Dimostrazione. vedi appendice A Esempio 1.3.1. La convergenza in Lp di una successione di funzioni non implica la convergenza puntuale (neppure q.o.) della stessa. Dimostrazione. per ogni i > 0, 0 ≤ j < i definiamo fj,i = χ[j/i,(j+1)/j] . Indichiamo allora con {gn } la successione f0,1 ; f0,2 ; f1,2 ; f0,3 ; f1,3 ; f2,3 ; . . . ; f0,n ; . . . ; fn−1,n ; f0,n+1 ; . . . È semplice vedere che kfm,n kp = 1/np , quindi gn → 0 in norma Lp (0, 1) ed è altrettanto semplice vedere che per nessun x ∈ [0, 1] la successione gn (x) ammette limite in R. Teorema 1.3.10. Sia [a, b] un intervallo limitato e sia {fn } un successione di funzioni di Lp (a, b) che converge uniformemente a f , allora fn → f in Lp (a, b). Dimostrazione. per ipotesi per ogni > 0 esiste un N tale che se n > N si ha |f (x) − fn (x)| < , quindi !1/p Z b p ≤ (b − a)1/p (1.3.32) kf − fn kp = |f (x) − fn (x)| dx a quindi kf − fn kp → 0. Esempio 1.3.2. Se [a, b] non è limitato la convergenza uniforme non implica la convergenza in Lp (a, b). √ Dimostrazione. sia fn = 1/ p nχ[0,n] allora fn tende uniformemente a 0. Supponiamo ora che esista f tale che fn → f in norma Lp (0, ∞), allora per il teorema 1.3.9 una sottosuccessione di {fn } dovrebbe convergere puntualmente quasi ovunque a f e poichè {fn } converge uniformemente a 0 si deve avere f = 0 (in Lp ), ma kfn kp = 1 per ogni n, quindi non è possibile che fn → 0 in Lp , poichè altrimenti dovrebbe aversi kfn kp → 0. Teorema 1.3.11. Se {fn } è una successione in Lp tale che fn → f puntualmente e |fn (x)| ≤ g(x), dove g ∈ Lp (a, b), allora fn → f in Lp (a, b) (il teorema vale anche se a = −∞, b = ∞). Dimostrazione. dell’ipotesi |fn | ≤ g e fn → f puntualmente segue che |f | ≤ g e quindi si ha |f (x)−fn (x)| → 0 puntualmente e |f (x)−fn (x)| ≤ 2g(x), quindi |f −fn |p ≤ 2p g p ∈ L1 (a, b) quindi usando il teorema di Lebesgue della convergenza dominata si ottiene che kf − fn kp → 0. Esempio 1.3.3. La sola convergenza puntuale non implica la convergenza in norma Lp (a, b). Dimostrazione. sia fn (x) = 0 se x = 0 o 1/n < x ≤ 1 n se 0 < x ≤ 1/n (1.3.33) allora fn (x) → 0 per ogni x ma kfn kp ≥ 1 per ogni n ∈ N e p ≥ 1. Una importante proprietà degli spazi completi è il seguente Teorema 1.3.12 (delle contrazioni di Banach). Sia (X, k kX ) uno spazio normato completo e sia f : X → X tale che esiste 0 ≤ k < 1 tale che per ogni x, y ∈ X si abbia kf (x) − f (y)kX ≤ kkx − ykX (1.3.34) (in questo caso f è detta contrazione ) allora esiste un unico x̄ ∈ X tale che x̄ = f (x̄) (un punto che abbia questa caratteristica è detto punto fisso o punto unito) e inoltre dato un generico x0 ∈ x e costruita la successione {xn } come xn+1 = f (xn ) si ha x̄ = limn→∞ xn . 16 CAPITOLO 1. SPAZI NORMATI E CON PRODOTTO SCALARE Dimostrazione. mostriamo innanzitutto l’unicità del punto fisso: supponiamo per assurdo che esistano due distinti punti fissi x̄, ȳ, allora si avrebbe kx̄ − ȳkX = kf (x̄) − f (ȳ)kX ≤ kkx̄ − ȳkX (1.3.35) e poichè k < 1 si ottiene kx̄ − ȳkX = 0, assurdo. Mostriamo ora l’esistenza del punto fisso: sia x0 ∈ X e costruiamo la successione {xn } ponendo xn+1 = f (xn ); vediamo che {xn } è una successione di Cauchy in (X, k kX ). Si ha kxn − xn+1 kX = kf (xn−1 ) − f (xn )kX ≤ kkxn−1 − xn kX ≤ · · · ≤ k n kx0 − f (x0 )kX (1.3.36) quindi kxn − xn+p kX ≤ kxn − xn+1 + · · · + xn+p−1 − xn+p kX ≤ n+p−1 X k j kx0 − f (x0 )kX ≤ (1.3.37) j=n ≤ ∞ X k j kx0 − f (x0 )kX = k n j=n ∞ X k j kx0 − f (x0 )kX = j=0 kn kx0 − f (x0 )kX (1.3.38) 1−k e, poichè limn→∞ k n = 0, la successione {xn } risulta essere una successione di Cauchy, quindi, per la completezza, esiste un x̄ ∈ X tale che xn → x̄, inoltre per la continuità di f (f è lipschitziana) si ha x̄ = lim xn+1 = lim f (xn ) = f ( lim xn ) = f (x̄) (1.3.39) n→∞ n→∞ n→∞ quindi x̄ è il punto fisso cercato. 1.4 Prodotti scalari Definizione 1.4.1. Sia X uno spazio vettoriale su C; una funzione ( , ) : X × X → C si chiama prodotto scalare se soddisfa le seguenti proprietà: 1. per ogni x ∈ X si ha (x, x) ∈ R e (x, x) ≥ 0 2. se x ∈ X allora (x, x) = 0 ⇔ x = 0 3. se x, y ∈ X allora (y, x) = (x, y) 4. se x, y ∈ X, λ ∈ C allora (x, λy) = λ(x, y) 5. se x, y, z ∈ X allora (x, y + z) = (x, y) + (x, z) In alcuni testi quello che qui è chiamato prodotto scalare viene chiamato prodotto hermitiano, mentre il nome prodotto scalare viene riservato al caso di spazi vettoriali su R. Inoltre in quasi tutti i testi di matematica al posto della proprietà (4) si usa la seguente (λx, y) = λ(x, y) Ovviamente tutta la teoria non cambia, essendo ciò solo questione di nomenclatura. In taluni testi gli spazi vettoriali con prodotto scalare vengono detti pre-Hilbertiani. Teorema 1.4.1 (Cauchy-Schwarz). Sia X uno spazio con prodotto scalare, allora per ogni x, y ∈ X si ha p (1.4.1) |(x, y)| ≤ (x, x)(y, y) e l’uguaglianza vale solo se x e y sono linearmente dipendenti. 1.4. PRODOTTI SCALARI 17 Dimostrazione. se t ∈ R si ha (x + teiφ y, x + teiφ y) ≥ 0. Sviluppando il primo membro si ottiene (x + teiφ y, x + teiφ y) = (x, x + teiφ y) + t(eiφ y, x + teiφ y) = (x, x) + t(x, eiφ y) + t(eiφ y, x) + t2 (eiφ y, eiφ y) = = (x, x) + 2t<[eiφ (x, y)] + t2 (y, y) ≥ 0 (1.4.2) a questo punto si può scegliere φ in modo che eiφ (x, y) = |(x, y)| ottenendo quindi (x, x) + 2t|(x, y)| + t2 (y, y) ≥ 0 (1.4.3) Affinchè questa disequazione valga per ogni t ∈ R il discriminante del polinomio di secondo grado a primo membro deve essere ≤ 0 cioè si deve avere |(x, y)|2 − (x, x)(y, y) ≤ 0 (1.4.4) da cui si deduce 1.4.1. Inoltre l’uguaglianza in 1.4.1 vale se e solo se |(x, y)|2 − (x, x)(y, y) = 0, in questo caso allora l’equazione (x, x) + 2t|(x, y)| + t2 (y, y) = 0 ha una soluzione t0 , ma allora si avrebbe (x + t0 eiφ y, x + t0 eiφ y) = 0 (1.4.5) quindi per la proprietà (2) della definizione 1.4.1 si ha allora x + t0 eiφ y = 0. Dimostrazione. per ogni x, y ∈ X si ha kx(x, y) − ykxk2 k2 ≥ 0 da cui si ottiene subito kxk2 (kxk2 kyk2 − |(x, y)|2 ) ≥ 0 e quindi |(x, y)| ≤ kxk kyk (si può supporre kxk 6= 0 poichè in questo caso 1.4.1 si riduce a 0=0), inoltre se vale l’uguaglianza si ha (x, y)x − kxky = 0, cioè λx + µy = 0. Notiamo che nella dimostrazione del precedente teorema la proprietà (2) della definizione di prodotto scalare è stata usata solo per dimostrare la seconda parte della tesi e che quindi la disuguaglianza 1.4.1 è valida anche per una funzione ( , ) che non soddisfi la proprietà (2) della definizione 1.4.1. p Corollario 1.4.1. Sia X uno spazio con prodotto scalare, allora la funzione x → (x, x) è una norma su X. Dimostrazione. l’unica proprietà della norma che non risulta immediatamente evidente è la disuguaglianza triangolare. Usando la disuguaglianza di Cauchy-Schwarz si ha (x + y, x + y) = (x, x) + 2<[(x, y)] + (y, y) ≤ (x, x) + 2|(x, y)| + (y, y) ≤ p p p (x, x) + 2 (x, x)(y, y) + (y, y) = [ (x, x) + (y, y)]2 da cui si ottiene p p p (x + y, x + y) ≤ (x, x) + (y, y) (1.4.6) (1.4.7) che è la disuguaglianza triangolare. A causa delpcorollario precedente ogni spazio X con prodotto scalare è uno spazio normato con la norma (x, x) indotta dal prodotto scalare. Si vedrà ora che il viceversa non è vero, cioè datopuno spazio normato (X, k kX ) non è detto esista un prodotto scalare su X tale che kxkX = (x, x). Teorema 1.4.2. Sia X uno spazio con prodotto scalare ( , ), allora, se xn → x e yn → y rispetto alla norma indotta dal prodotto scalare, si ha (xn , yn ) → (x, y). Dimostrazione. usando la disuguaglianza di Schwarz si ha |(xn , yn ) − (x, y)| = |(xn , yn ) − (xn , y) + (xn , y) − (x, y)| ≤ |(xn , yn − y)| + +|(xn − x, y)| ≤ kxn k kyn − yk + kxn − xk kyk (1.4.8) poichè xn → x, si ha kxn k → kxk quindi la successione kxn k è limitata, quindi si ha |(xn , yn ) − (x, y)| → 0. 18 CAPITOLO 1. SPAZI NORMATI E CON PRODOTTO SCALARE Teorema 1.4.3. Sia X uno spazio con prodotto scalare e sia k k la norma indotta dal prodotto scalare, allora se x, y ∈ X vale la seguente (identità del parallelogramma) kx + yk2 + kx − yk2 = 2(kxk2 + kyk2 ) (1.4.9) Dimostrazione. usando le proprietà del prodotto scalare si ha: kx + yk2 + kx − yk2 = (x + y, x + y) + (x − y, x − y) = = (x, x) + (y, y) + (x, y) + (y, x) + (x, x) + (y, y) − (y, x) − (x, y) = = 2(x, x) + 2(y, y) = 2kxk2 + 2kyk2 A questo punto si può vedere che non tutte le norme derivano da un prodotto scalare: sia X = B(R) lo spazio delle funzioni limitate su R e sia kf kX = supx∈R |f (x)|: consideriamo ora le due funzioni 1 se x ≥ 0 0 se x ≥ 0 f1 = f2 = (1.4.10) 0 se x < 0 1 se x < 0 allora si ha kf1 + f2 k2X = kf1 − f2 k2X = 1, kf1 k2X = 1 e kf2 k2X = 1 quindi kf1 + f2 k2X + kf1 − f2 k2X = 2 6= 4 = 2(kf1 k2X + kf2 k2X ) (1.4.11) quindi non è soddisfatta la relazione 1.4.9 e quindi non esiste nessun prodotto scalare su X che induca la norma k kX . Teorema 1.4.4. Sia X uno spazio con prodotto scalare ( , ) e sia k prodotto scalare, allora vale la seguente (formula di polarizzazione) k la norma indotta dal 4(x, y) = kx + yk2 − kx − yk2 − ikx + iyk2 + ikx − iyk2 (1.4.12) kx + yk2 = (x + y, x + y) = kxk2 + kyk2 + 2<(x, y) (1.4.13) kx + iyk2 = (x + iy, x + iy) = kxk2 + kiyk2 − 2=(x, y) (1.4.14) Dimostrazione. si ha e analogamente Usando l’identità del parallelogramma si ha allora 4<(x, y) = 2kx + yk2 − 2kxk2 − 2kyk2 = kx + yk2 − kx − yk2 −4=(x, y) = 2kx + iyk2 − 2kxk2 − 2kiyk = kx + iyk2 − kx − iyk2 (1.4.15) (1.4.16) da cui si ottiene 1.4.12. Teorema 1.4.5 (von Neumann). Sia (X, k kX ) uno spazio normato tale che la norma k kX soddisfi l’identità del parallelogramma 1.4.9, allora esiste un prodotto scalare su X che induce la norma k kX . Dimostrazione. per il teorema precedente se un prodotto scalare come nella tesi esiste esso deve essere 1 (1.4.17) (x, y) = [kx + yk2X − kx − yk2X − ikx + iyk2X + ikx − iyk2X ] 4 Mostriamo che questo è effettivamente un prodotto scalare: per ogni x si ha (x, x) = 1 [4kxk2X − i|(1 + i)|2 kxk2X + i|(1 − i)|2 kxk2X ] = kxk2X 4 (1.4.18) 1.4. PRODOTTI SCALARI 19 quindi è evidente che (x, x) ≥ 0 e (x, x) = 0 ⇔ x = 0. Inoltre (y, x) = = 1 [ky + xk2X − ky − xk2X − iky + ixk2X + iky − ixk2X ] = 4 1 [ky + xk2X − ky − xk2X − i|i|2 kx − iyk2X + i| − i|2 kx + iyk2X ] = (x, y) 4 (1.4.19) (1.4.20) dimostriamo ora che (x, y + z) = (x, y) + (x, z): usando l’identità del parallelogramma si ha (x, y) + (x, z) = 1 [2kx + yk2X − 2kx − yk2X − 2ikx + iyk2X + 2ikx − iyk2X + 8 +2kx + zk2X − 2kx − zk2X − 2ikx + izk2X + 2ikx − izk2X ] = 1 [k2x + y + zk2X + ky − zk2X − k2x − y − zk2X − ky − zk2X − 8 −ik2x + iy + izk2X − ikiy − izk2X + ik2x − iy − izk2X + ikiy − izk2X ] = = 1 [k2x + y + zk2X − k2x − y − zk2X − ik2x + iy + izk2X + ik2x − iy − izk2X ] = 8 1 = [2k2x + y + zk2X + 2ky + zk2X − 2ky + zk2X − 2k2x − y − zk2X − 16 −2ik2x + iy + izk2X − 2ikiy + izk2X + 2ikiy + izk2X + 2ik2x − iy − izk2X ] = 1 = [k2x + 2y + 2zk2X + k2xk2X − k2xk2X − k2x − 2y − 2zk2X − 16 −ik2x + 2iy + 2yzk2X − ik2xk2X + ik2xk2X + ik2x − 2iy − 2izk2X ] = 1 = [kx + (y + z)k2X − kx − (y + z)k2X − ikx + i(y + z)k2X + ikx − i(y + z)k2X ] = 4 = (x, y + z) = Servirà per il seguito notare che, poichè la norma è una funzione continua (teorema 1.1.3), la funzione (x, y) come definita in 1.4.17, fissato x ∈ X, è una funzione continua di y. Dal fatto che (x, y + z) = (x, y) + (x, z) segue per induzione che per ogni n ∈ N si ha (x, ny) = n(x, y); inoltre è immediato vedere che si ha (x, −y) = −(x, y), quindi per ogni intero m si ha (x, my) = m(x, y); sia ora z = pq y, con p, q interi, allora si ha q(x, z) = (x, zq) = (x, py) = p(x, y) (1.4.21) p p (x, y) = (x, y) q q (1.4.22) e quindi da cui si ottiene che per ogni razionale r ∈ Q si ha (x, ry) = r(x, y). Sia ora λ un numero reale e sia {rn } una successione di numeri razionali tale che rn → λ, allora per la continuità di (x, y) rispetto a y si ha (x, λy) = (x, lim rn y) = lim (x, rn y) = lim rn (x, y) = λ(x, y) n→∞ n→∞ n→∞ (1.4.23) È inoltre immediato vedere che (x, iy) = i(x, y) e in modo analogo a come si è dimostrata la 1.4.23 si vede allora che per ogni µ reale si ha (x, iµy) = iµ(x, y) da cui, insieme a 1.4.23 e (x, y + z) = (x, y) + (x, z) si deduce allora che per ogni numero complesso η si ha (x, ηy) = η(x, y), che conclude la dimostrazione. Corollario 1.4.2. Sia (X, k kX ) uno spazio normato, allora esiste un prodotto scalare su X che induce la norma k kX se e solo se essa soddisfa l’identità del parallelogramma. Dimostrazione. segue dai teoremi 1.4.3 e 1.4.5. 20 CAPITOLO 1. SPAZI NORMATI E CON PRODOTTO SCALARE Corollario 1.4.3. Gli spazi Lp hanno la norma che deriva da un prodotto scalare se e solo se p = 2. Dimostrazione. è immediato vedere che la norma L2 deriva dal prodotto scalare Z (f, g)2 = f (x)g(x)dx (1.4.24) consideriamo le funzioni 1 se x ∈ [−1, 0] 1 se x ∈ [0, 1] (1.4.25) f = 2 0 se x ∈ [−1, 0]c 0 se x ∈ [0, 1]c √ quindi kf1 + f2 kp = kf1 − f2 kp = p 2 e kf1 kp = kf2 kp = 1 e l’identità del parallelogramma diventa 2(2)2/p = 4 che è soddisfatta se e solo se p = 2. f1 = 1.5 Proprietà elementari degli sp. di Hilbert Definizione 1.5.1. Si dice che lo spazio vettoriale X munito del prodotto scalare ( , ) è uno spazio di Hilbert se è completo rispetto alla norma indotta dal prodotto scalare. Teorema 1.5.1. Lo spazio L2 (a, b) munito del prodotto scalare Z b (f, g) = f (x)g(x)dx (1.5.1) a è uno spazio di Hilbert. Dimostrazione. l’espressione 1.5.1 è ben definita per la disuguaglianza di Holder e si verifica immediatamente che è un prodotto scalare su L2 (a, b) e che genera la norma k k2 rispetto a cui L2 (a, b) è uno spazio completo ( vedi teorema 1.3.6). Definizione 1.5.2. Sia H uno spazio di Hilbert e sia V = {xn } un insieme di vettori di H. Si dice che l’insieme V è completo se lo spazio delle combinazioni lineari finite di elementi di V è denso in H. Un insieme completo di vettori di H si dice base di H se è composto da elementi linearmente indipendenti . Serve osservare il seguente fatto: sia X uno spazio vettoriale che munito del prodotto scalare ( , ) diviene uno spazio di Hilbert H, allora se l’insieme V è una base dello spazio di Hilbert H non è detto che V sia una base dello spazio vettoriale X, infatti se V è una base dello spazio vettoriale X allora ogni elemento di X può essere scritto come combinazione lineare finita di elementi di V , mentre se V è una base per lo spazio di Hilbert H allora ogni elemento di H può essere scritto come limite di una successione di combinazioni lineari finite di elementi di V . Lemma 1.5.1. Sia H uno spazio di Hilbert e sia V = {vn } un insieme completo di vettori, allora se (v, vn ) = 0 per ogni vn ∈ V si ha v = 0. Dimostrazione. dato v ∈ H tale che (v, vn ) = 0 per ogni vn ∈ V , per ipotesi esiste una successione di combinazioni lineari finite di elementi di V che converge a v, sia essa {fn }, allora si ha kvk2 = (v, v) = (v, lim fn ) = lim (v, fn ) = lim n→∞ n→∞ n→∞ Nn X ak (v, vk ) = 0 (1.5.2) k=1 quindi v = 0. Definizione 1.5.3. Sia H uno spazio di Hilbert, un insieme {ek } di vettori si dice ortonormale se (ei , ej ) = δij dove δij vale 0 se i 6= j e 1 altrimenti. 1.5. PROPRIETÀ ELEMENTARI DEGLI SP. DI HILBERT 21 Teorema 1.5.2 (Disuguaglianza di Bessel). Sia H uno spazio di Hilbert e sia {ek } una successione di vettori ortonormali, allora per ogni v ∈ H si ha ∞ X |(ek , v)|2 ≤ kvk2 (1.5.3) k=1 Dimostrazione. si ha, fissato N , 2 N N N X X X 0 ≤ v − (ek , v)ek = kvk2 + |(ek , v)|2 − (v, (ek , v)ek ) − k=1 − N X k=1 ((ek , v)ek , v) = kvk2 + k=1 N X (1.5.4) k=1 |(ek , v)|2 − 2 k=1 N X |(ek , v)|2 = k=1 = kvk2 − N X |(ek , v)|2 k=1 quindi PN k=1 |(ek , v)|2 ≤ kv 2 k per ogni N , quindi vale la relazione 1.5.3. Corollario 1.5.1. Sia H uno spazio di Hilbert e sia {ek } una successione ortonormale di vettori, allora per ogni v ∈ H si ha limn→∞ |(en , v)| = 0. Teorema 1.5.3. Sia H uno spazio di Hilbert e sia V = {vn } una successione di vettori tale che se (vn , v) = 0 per ogni n allora v = 0, allora V è un insieme completo in H. Dimostrazione. dalla definizione di insieme completo segue che si può supporre senza restrizione che tutti gli elementi di V siano linearmente indipendenti. Costruiamo la successione di vettori {ek } definiti da Pk−1 vk − i=1 (ei , vk )ei v1 v2 − (e1 , v2 )e1 e1 = (1.5.5) ; e2 = ; · · · ; ek = Pk−1 kv1 k kv2 − (e1 , v2 )e1 k kvk − i=1 (ei , vk )ei k la successione precedente è ben definita in quanto se uno dei denominatori si annullasse si otterrebbe che i vettori {vn } non sono indipendenti, come si è invece supposto. È inoltre immediato notare che i vettori {ei } sono ortonormali. Vediamo ora che le relazioni precedenti sono invertibili ed in particolare che ogni vi si può scrivere come combinazione lineare di e1 , · · · , ei : per i = 1 ciò è ovvio, supponiamo ora che la affermazione sia vera per i = k − 1, allora usando la formula generale 1.5.5 è immediato vedere che è vera anche per i = k e quindi la affermazione è vera per ogni i, quindi vk = α1 e1 + α1 e2 + · · · + αk ek (1.5.6) Analogamente si vede che per ogni k si ha ek = β1 v1 + · · · + βk vk , quindi è immediato vedere per induzione che (v, en ) = 0 per ogni n ⇔ (v, vn ) = 0 per P ogni n, quindi è sufficiente mostrare il n teorema per V = {en }. Sia ora v ∈ H e definiamo v (n) = k=1 (ek , v)ek ; se N > M si ha allora kv (N ) − v (M ) k2 = k N X (ek , v)ek k2 = N X |(ek , v)|2 (1.5.7) M +1 k=M +1 PN per la disuguaglianza di Bessel la successione { k=1 |(ek , v)|2 } è convergente in R, quindi è una successione di Cauchy; di conseguenza {v (n) } è una successione di Cauchy in H, quindi esiste un f ∈ H tale che v (n) → f . Per concludere la dimostrazione basterà mostrare che f = v. Si ha (en , f − v) = (en , f ) − (en , v) = (en , lim v (N ) ) − (en , v) = N →∞ (1.5.8) lim (en , v (N ) ) − (en , v) = (en , v)(en , en ) − (en , v) = 0 N →∞ (dove si è usato il fatto che gli {ek } sono una successione ortonormale) quindi dall’ipotesi segue f = v. 22 CAPITOLO 1. SPAZI NORMATI E CON PRODOTTO SCALARE Dal lemma 1.5.1 e dal teorema precedente segue Corollario 1.5.2. Sia H uno spazio di Hilbert e sia V = {xn } una successione di vettori, allora V è completo se e solo se l’unico v ∈ H tale che (xn , v) = 0 per ogni n è v = 0. Nella dimostrazione del teorema 1.5.3 si è in effetti mostrato di più di quanto affermato nella tesi: si è mostrato anche Teorema 1.5.4. Sia H uno spazio di Hilbert e sia V = {en } una successione ortonormale completa (quindi una base ortonormale numerabile) allora per ogni v ∈ V si ha v= ∞ X (ei , v)ei (1.5.9) i=1 la serie a secondo membro è detta serie di Fourier . Il precedente teorema può anche essere dedotto dal seguente (vedi dimostrazione corollario 1.5.3). Teorema 1.5.5. Sia H uno spazio di Hilbert e {ei } una successione ortonormale (non necessariamente completa). Siano ora v ∈ H e αi ∈ C, allora il valore di 2 N X αi ei v − (1.5.10) i=1 è minimo se e solo se αi = (ei , v) ed il minimo vale kvk2 − PN i=1 |(ei , v)|2 . Dimostrazione. si ha kv − N X α1 e1 k2 = kvk2 + i=1 N X |αi |2 − i=1 N X (v, ei )αi − i=1 2 = kvk − N X n X (ei , v)αi = (1.5.11) i=1 2 |(ei , v)| + i=1 N X |αi − (ei , v)|2 i=1 da cui si deduce il teorema. Corollario 1.5.3 (identità di Parsevall). Sia H uno spazio di Hilbert e {eP i } una successione ∞ di vettori ortonormali, allora {ei } è completo ⇔ per ogni v ∈ H si ha kvk2 = 1 |(ei , v)|2 . Dimostrazione. ⇒) Se {ei } è completo allora lo spazio delle combinazioni Pnlineari finite degli {ei } è denso in HPe quindi per il teorema precedente si ha limn→∞ kv − i=1 (ei , v)ei k = 0, cioè n v = limn→∞ i=1 (ei , v)ei (altra dimostrazione del teorema 1.5.4) e quindi per la continuità della norma si ha n n ∞ X X X kvk2 = lim k (ei , v)ei k2 = lim |(ei , v)|2 = |(ei , v)|2 (1.5.12) n→∞ i=1 n→∞ i=1 Pn i=1 Pn ⇐) Se v ∈ H, allora (usando il teorema precedente) kv− i=1 (ei , v)ei k2 = kvk2 − i=1 |(ei , v)|2 e quest’ultima espressione tende a 0 per n → ∞ a causa della identità di Parsefall, ma allora P∞ v = limn→∞ i=1 (ei , v)ei e quindi {ei } è un insieme completo. Riassumendo, per le successioni ortonormali si ha il seguente teorema: Teorema 1.5.6 (Fischer-Riesz). Sia H uno spazio di Hilbert e {ei } una successione ortonormale, allora sono fatti equivalenti P∞ 1. per ogni x, y ∈ H si ha (x, y) = i=1 (ei , x)(ei , y). 1.5. PROPRIETÀ ELEMENTARI DEGLI SP. DI HILBERT 2. per ogni x ∈ H si ha kxk2 = P∞ i=1 23 |(ek , x)|2 . 3. {ei } è un insieme completo. 4. se (ei , v) = 0 per ogni i allora v = 0. P∞ 5. per ogni x ∈ H si ha x = i=1 (ei , x)ei . Dimostrazione. 1⇒2) ovvia. 2⇒3) dimostrato nel corollario 1.5.3. 3⇒4) vedi corollario 1.5.2. 4⇒5) vedi corollario 1.5.2 e teorema 1.5.4. 5⇒1) usando la continuità del prodotto scalare (teorema 1.4.2) si ha: (x, y) = ( lim n→∞ n n +∞ X X X (ei , x)ei , y) = lim (ei , x)(ei , y) = (ei , x)(ei , y) n→∞ i=1 (1.5.13) i=1 i=1 Teorema 1.5.7. Sia P H uno spazio di Hilbert e {en } una successione ortonormale completa, allora, P∞ ∞ dati αn ∈ C, la serie n=1 αn en converge se e solo se converge la serie n=1 |αn |2 . Dimostrazione. si ha k N X αn en − n=1 quindi la successione PN n=1 M X n=1 αn en k2 = k N X M +1 αn en k2 = N X |αn |2 (1.5.14) M +1 αn en è di Cauchy se e solo se la successione PN i=1 |αn |2 è di Cauchy. Capitolo 2 Equazioni differenziali alle derivate parziali Si assumerà da ora in avanti una minima conoscenza della funzione esponenziale complessa e della sua relazione con le funzioni trigonometriche. Sostanzialmente si userà il fatto che per l’esponenziale complesso valgono le relazioni (z1 , z2 ∈ C, x ∈ R) ez1 ez2 = ez1 +z2 eix = cos x + i sin x per la dimostrazione di questi fatti elementari usando le serie di potenze si rimanda alle primissime pagine del testo [8] della bibliografia (o ad un qualunque altro testo che tratti di funzioni analitiche complesse). 2.1 Serie di Fourier Teorema 2.1.1 (Lemma di Riemann-Lebesgue). Sia f ∈ L1 (−∞, +∞) allora (per α ∈ R) si ha Z +∞ lim f (x)eiαx dx = 0 (2.1.1) α→∞ −∞ Dimostrazione. fissato > 0, poichè Cc∞ (−∞, ∞) è denso in L1 (−∞, +∞), si può scegliere φ ∈ R +∞ Cc∞ (−∞, +∞) tale che −∞ |f (x) − φ(x)|dx < ; sia inoltre (a, b) un intervallo limitato tale che φ(x) = 0 se x ∈ (a, b)c , allora si ha Z +∞ −∞ Z +∞ iαx f (x)e [f (x) − φ(x)]e dx + φ(x)e dx ≤ −∞ Z −∞ Z Z +∞ b b iαx iαx |f (x) − φ(x)|dx + φ(x)e dx ≤ + φ(x)e dx −∞ a a iαx Z dx ≤ +∞ iαx Valutiamo ora l’ultimo integrale: integrando per parti si ha Z Z b b 1 1 iαx b 0 iαx iαx φ (x)e dx = φ(x)e dx = [e φ(x)]a − a iα iα a Z Z i b 1 b 0 φ0 (x)eiαx dx ≤ |φ (x)|dx = α a α a 24 (2.1.2) (2.1.3) 2.1. SERIE DI FOURIER 25 e poichè φ ∈ Cc∞ (−∞, +∞) anche φ0 ∈ Cc∞ (−∞, +∞) quindi l’ultimo integrale ha un valore finito indipendente da α, sia esso M , quindi si ha Z b M lim =0 (2.1.4) φ(x)eiαx dx = lim α→∞ a α→∞ α e quindi si ottiene infine che se |α| > K (dove K > 0 è sufficientemente grande) si ha Z ∞ iαx f (x)e dx < 2 −∞ Teorema 2.1.2. Sia φ ∈ Cc∞ (−∞, ∞) allora per ogni r ∈ R si ha Z lim α α→∞ r +∞ φ(x)eiαx dx = 0 (2.1.5) −∞ Dimostrazione. integrando per parti l’ultimo integrale dell’ equazione 2.1.3 per n − 1 volte (n ∈ N qualunque) si ottiene che Z +∞ Z Z +∞ 1 +∞ (n) iαx iαx ≤ 1 φ(x)e dx |φ(n) (x)|dx (2.1.6) = φ (x)e dx αn αn −∞ −∞ −∞ e poichè φ(n) ∈ Cc∞ (−∞, +∞) l’ultimo integrale assume un valore finito per ogni n ∈ N e indipendente da α, sia esso M (n) . A questo punto basta scegliere n > r per ottenere 2.1.5. Definizione 2.1.1. siano αn ∈ Z, allora si chiama polinomio trigonometrico una combinazione lineare finita a coefficienti complessi di funzioni della forma eiαn x . Poichè si ha eiαx = cos(αx) + i sin(αx) un polinomio trigonometrico si può anche scrivere come combinazione lineare a coefficienti complessi di funzioni della forma sin(αn x) e cos(αn x). Lemma 2.1.1. Le funzioni sinn x e cosn x sono polinomi trigonometrici. Dimostrazione. dimostriamo ad esempio che cosn x è un polinomio trigonometrico. Si ha cos x = eix + e−ix 2 (2.1.7) quindi usando la formula di Newton per lo sviluppo della potenza di un binomio e le proprietà elementari della funzione esponenziale si vede che cosn x è un polinomio trigonometrico. Per sinn x si usa il fatto che eix − e−ix (2.1.8) sin x = 2i Teorema 2.1.3 (Weierstrass). I polinomi trigonometrici sono densi in Cc ([−π, π]) con la norma kf k∞ = supx∈[−π,π] |f (x)|. Dimostrazione. si definisce cos2n (z/2) δn (z) = R π cos2n (z/2) −π (2.1.9) Rπ a questo punto, data φ ∈ Cc ([−π, +π]), si considera la successione di funzioni Pn (x) = −π δn (y − x)φ(y)dx (che sono polinomi trigonometrici per il lemma precedente) e si procede in modo identico a come si è fatto per mostrare la densità dei polinomi nello spazio C([a, b]) (teorema 1.3.4). 26 CAPITOLO 2. EQUAZIONI DIFFERENZIALI ALLE DERIVATE PARZIALI Corollario 2.1.1. I polinomi trigonometrici sono un sottoinsieme denso di L2 (−π, π) con la norma k k2 . Dimostrazione. le funzioni Cc ([−π, π]) sono dense in L2 (−π, π) con la norma k k2 , quindi, fissati > 0 e f ∈ L2 (−π, π), esiste una funzione φ ∈ Cc ([−π, π]) tale che kf − φk2 < , quindi basta mostrare che per ogni φ ∈ Cc ([−π, π]) esiste un polinomio trigonometrico tale che kφ − P k2 < ma per il teorema precedente esiste una successione di polinomi trigonometrici Pn che converge uniformemente a φ e per il teorema 1.3.10 la successione Pn tende quindi a φ anche in norma k k2 . Lemma 2.1.2. Sia ( , ) il prodotto scalare di L2 (−π, π) allora (einx , eimx ) = 2πδnm . Dimostrazione. dimostrazione immediata. Teorema 2.1.4. La successione {gn = einx √ } 2π n∈Z è una base ortonormale in L2 (−π, π). Dimostrazione. per il corollario precedente i polinomi trigonometrici sono densi in L2 (−π, π), ma einx i polinomi trigonometrici sono le combinazioni lineari finite di elementi dell’insieme { √ } , 2π n∈Z quindi tale insieme è un insieme completo; inoltre il lemma precedente mostra che questo è un insieme ortonormale, quindi in particolare tutti i suoi elementi sono linearmente indipendenti, quindi esso è una base ortonormale. Alla base ortonormale {gn } si può quindi applicare il teorema di Riesz-Fischer 1.5.6, quindi in particolare si ha per ogni funzione f, g ∈ L2 (−π, π) Z N X einx π lim f (x) − f (y)e−iny dy = 0 N →+∞ 2π −π −N kf k22 (2.1.10) 2 Z 2 ∞ X 1 π −iny f (y)e dy = 2π −π −∞ (2.1.11) Z π Z π ∞ X 1 inx f (x)e dx g(y)e−iny dy (f, g) = 2π −π −π −∞ (2.1.12) Analogamente al teorema precedente si vede che √nx }n∈N\{0} , { cos √ nx }n∈N } è una base ortonormale nello spazio Teorema 2.1.5. La successione {{ sin π π 2 L (−π, π). P∞ LemmaP 2.1.3. Se {bn }n∈Z è una successione di numeri complessi tali che −∞ |bn | < +∞, allora ∞ la serie −∞ bn gn converge uniformemente (in particolare è quindi una funzione continua). Dimostrazione. applicando il criterio di Weierstrass della convergenza totale si ottiene ∞ X ∞ 1 X √ sup |bn gn (x)| = |bn | < ∞ 2π −∞ −∞ x∈[−π,π] (2.1.13) quindi la serie converge uniformemente. Lemma 2.1.4. Se {an }n∈Z è una successione di numeri complessi tale che P+∞ P+∞ allora S(x) = −∞ an gn (x) è continua, derivabile e S 0 (x) = −∞ an gn0 (x). P+∞ −∞ |nan | < +∞ 2.1. SERIE DI FOURIER 27 Dimostrazione. si ha an gn0 (x) = ina P∞n gn (x) quindi chiamando inan = bn e applicando il lemma precedente si ottiene che la serie −∞ an gn0 (x) converge uniformemente (e poichè ogni gn0 è una funzione continua la somma della serie è quindi continua) si può quindi integrare elemento per elemento ottenendo # Z x "X Z x +∞ +∞ +∞ X X 0 an gn (x) dx = an gn0 (x)dx = an [gn (x) − gn (x0 )] = S(x) − S(x0 ) (2.1.14) x0 −∞ x0 −∞ −∞ quindi S(x) è derivabile e la sua derivata è la funzione (continua) S 0 (x) = P+∞ −∞ an gn0 (x). La serie di Fourier di una funzione è stata quı̀ introdotta nel contesto degli spazi di Hilbert (in tale contesto è talora detta serie di Fourier astratta) e quindi applicabile in linea di principio solo agli spazi L2 ; nonostante ciò ha senso introdurre la serie di funzioni (detta ancora per semplicità serie di Fourier) Z +∞ X 1 inx π S(x) = e f (y)e−iny dy (2.1.15) 2π −π n=−∞ più in generale per funzioni di L1 (−π, π) e studiare la relazione di questa funzione (ovviamente qualora la serie converga) con la funzione iniziale f , in particolare è possibile studiare ad esempio in quali casi la serie converga puntualmente alla funzione f . Teorema 2.1.6. Siano f ∈ L1 (−π, π) e x0 ∈ (−π, π); supponiamo inoltre che f sia continua in x0 (x0 ) e che f (x0 +h)−f sia integrabile in un intorno di h = 0, allora la serie di Fourier di f converge h puntualmente ad f in x0 . Dimostrazione. sia Z Z π n n X X 1 ikx π 1 −iky Sn (x) = e f (y)e dy = f (y) eik(x−y) dy 2π 2π −π −π k=−n (2.1.16) k=−n definiamo ora il nucleo di Dirichlet 1 −inz (e + · + einz ) 2π Dn (z) = si ha Rπ −π (2.1.17) Dn (z)dz = 1 e moltiplicando 2.1.17 per eiz si ottiene eiz Dn (z) = 1 −i(n−1)z ei(n+1)z e−inx (e + · · · + ei(n+1)z ) = Dn (z) + − 2π 2π 2π da cui si ottiene Dn (z) = 1 e−inz − ei(n+1)z 2π 1 − eiz allora da 2.1.16, 2.1.17 si ottiene Z π Z Sn (x0 ) = f (y)Dn (x0 − y)dy = −π (2.1.18) (2.1.19) x0 +π f (x0 − z)Dn (z)dz (2.1.20) x0 −π allora si ottiene (usando il fatto che Dn è periodica di periodo 2π e prolungando f in modo periodico di periodo 2π) Z π |f (x0 ) − Sn (x0 )| = | f (x0 )Dn (z)dz − Sn (x0 )| = (2.1.21) Z −π +π =| Z = [f (x0 ) − f (x0 − z)]Dn (z)dz| = −π +π −π f (x0 ) − f (x0 − z) e−inz − ei(n+1)z z dz iz z 2π 1−e 28 CAPITOLO 2. EQUAZIONI DIFFERENZIALI ALLE DERIVATE PARZIALI f (x0 )−f (x0 −z) z z è integrabile per ipotesi, 1−e iz è limitata su [−π, π] (come si vede sviluppando l’esponenziale in serie di Taylor), quindi usando il lemma di Riemann-Lebesgue si vede che l’ultima espressione tende a zero. Teorema 2.1.7 (Criterio di Dini). Siano f ∈ L1 (−π, π) e x0 ∈ (−π, π); supponiamo esistano − f (x+ 0 ) = limx→x+ f (x) e f (x0 ) = limx→x− f (x) e che esistano δ1 , δ2 > 0 tali che 0 0 f (x+ 0) f (x0 + h) − f (x0 − h) − f (x− 0) ∈ L1 (0, δ1 ); ∈ L1 (0, δ2 ) h h − allora la serie di Fourier di f converge a 12 [f (x+ 0 ) + f (x0 )] in x0 . (2.1.22) Dimostrazione. prolunghiamo innanzitutto la f in modo periodico, in modo che diventi una funzione f : R → C periodica di periodo 2π. Serve ora notare che Dn (−z) = Dn (z), infatti da 2.1.17 si ha 1 −inz Dn (z) = (e + · · · + einz ) = Dn (−z) (2.1.23) 2π Allora si ha (usando 2.1.20) Z x0 +π Z π Sn (x0 ) = f (x0 − z)Dn (z)dz = Dn (z)f (x0 − z)dz = (2.1.24) x0 −π Z Z π = 0 −π π Z 0 Dn (z)f (x0 − z)dz + Dn (z)f (x0 − z)dz = Dn (z)f (x0 − z)dz + −π 0 Z π Z π + Dn (−z)f (x0 + z)dz = Dn (z)[f (x0 − z) + f (x0 + z)]dz 0 inoltre Z f (x+ 0) + f (x− 0) 0 Z π = −π Dn (z)[f (x+ 0) + f (x− 0 )]dz π =2 0 − Dn (z)[f (x+ 0 ) + f (x0 )]dz (2.1.25) − f (x+ 0 ) + f (x0 ) = 2 (2.1.26) quindi da 2.1.25 e 2.1.24 si ottiene Sn (x0 ) − Z = π [ 0 f (x0 + z) − f (x+ f (x0 − z) − f (x− z 0) 0) 1 + ] [e−inz − ei(n+1)z ]dz z z 2π 1 − eiz e si conclude applicando il lemma di Riemann-Lebesgue analogamente al teorema precedente. Teorema 2.1.8. Se f è periodica di periodo 2π e di classe C 1 allora la serie di Fourier di f converge uniformemente ad f . Dimostrazione. siano βn i coefficienti della serie di Fourier di f 0 (x), allora integrando per parti si ha Z π Z π 0 −inx −inx π βn = f (x)e dx = [f (x)e ]−π − in f (x)e−inx dx = −inαn (2.1.27) −π −π dove αn sono P∞i coefficienti di Fourier della funzione f , quindi si ha |αn | = segue che −∞ |βn |2 < +∞, quindi X1 X X1 1 |β| ≤ (|β|2 + 2 ) < ∞ |αn | = n 2 n n6=0 n6=0 1 n |βn |. Inoltre da 2.1.11 (2.1.28) n6=0 quindi per il lemma 2.1.3 la serie di Taylor di f converge uniformemente ad una funzione continua F , quindi in particolare la serie di Taylor di f converge ad F su L2 (−π, π), quindi per l’unicità del limite in L2 (−π, π) si ha f (x) = F (x) per quasi ogni x ∈ [−π, π], ma poichè sia f che F sono continue, si ha f = F su [−π, π] e per periodicità f = F . Per ulteriori informazioni circa la convergenza puntuale delle serie di Fourier vedi appendice B. 2.2. PROBLEMA AI LIMITI PER IL QUADRATO 2.2 29 Problema ai limiti per il quadrato In questa sezione si discuterà la soluzione dell’equazione differenziale 4u = F 2 (2.2.1) 2 ∂ ∂ 2 (dove 4 = ∂x 2 + ∂y 2 è il laplaciano, talora indicato anche con ∇ ), dove F : [0, π] × [0, π] → C è 2 una assegnata funzione di L , con assegnate condizioni ai limiti u(x, 0) = a(x) u(π, y) = b(y) (2.2.2) u(x, π) = c(x) u(0, y) = d(y) dove a, b, c, d sono funzioni a quadrato integrabile. A causa della linearità del problema che si vuole risolvere, la soluzione può essere cercata nella forma u = uF + ua + ub + uc + ud , dove • uF soddisfa la equazione 2.2.1 con condizioni al bordo a = b = c = d = 0 • ua soddisfa la equazione 4ua = 0 con le condizioni al bordo u(x, 0) = a(x) u(π, y) = 0 u(x, π) = 0 u(0, y) = 0 (2.2.3) • ub , uc , ud sono definite analogamente a ua . 2.2.1 Caso ua Per evitare confusioni con altre ”a” la funzione a(x) sarà quı̀ di seguito indicata con f (x). Sia {Xn (x)} una successione ortonormale completa in L2 (0, π), allora per ogni fissato y ∈ [0, π] la funzione x →P u(x, y) può essere sviluppata in serie di Fourier rispetto ad Xn (x) ottenendo quindi u(x, y) = an Xn (x), dove i coefficienti dello sviluppo di Fourier dipendono in generale dal particolare y, quindi X u(x, y) = Yn (y)Xn (x) (2.2.4) Imponiamo ora la condizione che per ogni n si abbia 4(Yn (y)Xn (x)) = 0 cioè Xn00 (x)Yn (y) + Xn (x)Yn00 (y) = 0 e quindi (se Xn (x) 6= 0 e Yn (y) 6= 0) si ha Xn00 (x) Y 00 (y) =− n Xn (x) Yn (y) (2.2.5) ma il primo membro è funzione della sola x mentre il secondo membro è funzione della sola y, quindi affinchè l’equazione precedente valga per ogni x, y si deve avere Y 00 (y) Xn00 (x) =− n = −λ Xn (x) Yn (y) (2.2.6) dove λ è una costante, quindi si ottengono le equazioni Xn00 (x) + λXn (x) = 0; Yn00 (y) − λYn (y) = 0 (2.2.7) √ √ La soluzione generale della prima delle 2.2.7 è Xn = an sin( λx) + bn cos( λx); imponendo le condizioni ai limiti Xn (0) = Xn (π) = 0 si ottiene bn = 0 e λ = n2 , quindi Xn = an sin nx. La soluzione generale della seconda delle 2.2.7 con λ = n2 è Yn = an sinh n(π − y) + bn sinh ny; imponendo Yn (π) = 0 si ottiene Yn (y) = an sinh n(π − y). 30 CAPITOLO 2. EQUAZIONI DIFFERENZIALI ALLE DERIVATE PARZIALI q Affinchè quanto appena fatto abbia senso si deve ora verificare che { 2 π sin(nx)}n∈N\{0} sia ef- 2 fettivamente un insieme ortonormale completo in L (0, π); è immediato vedere che esso è un insieme ortonormale, verifichiamo quindi che è anche completo: sia g ∈ L2 (0, π) tale che (g, sin nx) = 0 per ogni n ∈ N\{0} e definiamo se 0<x≤π g(x) 0 se x=0 gd (x) = (2.2.8) −g(−x) se −π ≤ x < 0 allora la gd cosı̀ definita è una funzione dispari, quindi è immediato vedere che Z π gd (x) cos(nx)dx = 0 (2.2.9) −π Z Z π gd (x) sin(nx)dx = 2 −π Z π gd (x) sin(nx)dx = 2 0 π g(x) sin(nx)dx = 0 (2.2.10) 0 2 quindi, usando il fatto che {sin nx, cos nx}q n∈N è un insieme completo in L (−π, π), si vede che gd = 0 q.o. e quindi g = 0 q.o., quindi { π2 sin nx} è un insieme ortonormale completo per il teorema di Riesz-Fischer. P∞ Da quanto precede segue quindi che si può scrivere u(x, y) = n=1 an sin(nx) sinh n(π − y) dove gli a sono coefficienti da determinarsi nel seguente modo: si impone la condizione n P∞ X (x)Y (0) = f (x), quindi si devono determinare gli a ∈ C in modo tale che sia n n n=1 n ∞ X an sinh(nπ) sin(nx) = f (x) (2.2.11) n=1 La condizione precedente può essere soddisfatta qualunque sia f ∈ L2 (0, π) poichè si è appena visto q P∞ che { π2 sin nx}n∈N è un insieme ortonormale completo in L2 (0, π), quindi f (x) = i=1 bn sin(nx) Rπ dove bn = π2 0 f (z) sin(nz)dz, quindi basta porre an = bn / sinh(nπ). Si ottiene in conclusione ∞ X 2 u(x, y) = sinh n(π − y) sin(nx) π sinh(nπ) n=1 Z π f (z) sin(nz)dz (2.2.12) 0 Verifichiamo che quella che si è appena costruito è la soluzione del problema iniziale: si deve innanzitutto mostrare che 4u = 0 all’interno di [0, π] × [0, π]. Se π ≥ y > 0 la successione sinh n(π − y)/ sinh nπ tende a 0 esponenzialmente con n, infatti se n è abbastanza grande si ha 0≤ en(π−y) − e−n(π−y) sinh n(π − y) = ≤ sinh nπ enπ − e−nπ en(π−y) en(π−y) 1 ≤ nπ ≤ = e−ny e − e−nπ enπ /2 2 (2.2.13) bn → 0 per la disuguaglianza di Bessel ed il seno è una funzione limitata, quindi se π ≥ y > 0 si ottiene che per ogni k la serie Z π ∞ X 2 nk sinh n(π − y) sin(nx) f (z) sin(nz)dz (2.2.14) π sinh(nπ) 0 n=1 converge, quindi la serie che compare in 2.2.12 converge a una funzione derivabile infinite volte e può essere derivata termine a termine un numero arbitrario di volte, quindi per come sono stati costruiti Xn , Yn si ottiene X X 4u(x, y) = 4 Xn Yn = 4(Xn Yn ) = 0 (2.2.15) 2.2. PROBLEMA AI LIMITI PER IL QUADRATO 31 Verifichiamo le condizioni ai limiti: è immediato vedere che u(0, y) = u(π, y) = u(x, π) = 0 e per come sono stati determinati gli an si ha u(x, 0) = f (x) (in L2 ). Vediamo ora che limy→0 kf (x) − u(x, y)k2 = 0: sia > 0 fissato, allora ∞ ∞ X X sinh n(π − y) sinh n(π − y) kf (x) − bn sin nxk22 = k bn sin nx 1 − k22 ≤ (2.2.16) sinh nπ sinh nπ n=1 i=1 2 ∞ X sinh n(π − y) 2 2 |bn | 1 − ≤ π sinh nπ i=1 n(π−y) si ha 0 ≤ 1 − sinh ≤ 1 e poichè sinh nπ P∞ i=1 |bi |2 < ∞ esiste un N tale che P∞ i=N +1 |bi |2 < quindi 2 N X sinh n(π − y) 2 sinh n(π − y) 2 2 sin nxk2 ≤ + |bn | 1 − kf (x) − bn sinh nπ π sinh nπ n=1 n=1 ∞ X (2.2.17) è immediato vedere che l’ultima espressione è continua in y quindi esiste un δ > 0 tale che se 0 ≤ y ≤ δ allora ∞ X sinh n(π − y) kf (x) − bn sin nxk22 ≤ 2 (2.2.18) sinh nπ n=1 che conclude. 2.2.2 caso uF Sia Xn (x)Pun sistema ortogonale completo in L2 (0, π) e scriviamo nuovamente u nella forma u(x, y) = Xn (x)Yn (y) dove si impongono le condizioni Xn (0) = 0; Xn (π) = 0; Yn (0) = 0; Yn (π) = 0 (2.2.19) Per le Xn si può imporre Xn00 = −λXn in modo che analogamente al caso precedente si abbia P λ = n2 e Xn = an sin nx. La funzione F può essere scritta come F (x, y) = Fn (y)Xn (x) ed imponiamo che X X 4(Xn (x)Yn (y)) = Fn (y)Xn (x) (2.2.20) da cui si ottiene X Xn00 (x)Yn (y) + Yn00 (y)Xn (x) = X Fn (y)Xn (x) (2.2.21) e a causa della scelta delle Xn effettuata si ottiene infine 00 2 Y (y) − n Yn (y) = Fn (y); 2 Fn (y) = π Z π F (ξ, y) sin nξdξ (2.2.22) 0 Cercando una soluzione dell’equazione precedente usando il metodo della variazione delle costanti arbitrarie sostituendo Yn (y) = A(y) sinh ny + B(y) sinh n(π − y), dove si deve avere A(π) = 0 e B(0) = 0, si ottiene il seguente sistema nA0 (y) cosh ny − nB 0 (y) cosh n(π − y) = Fn (y) (2.2.23) A0 (y) sinh ny + B 0 (y) sinh n(π − y) = 0 moltiplicando la prima equazione per sinh ny e sottraendola alla seconda moltiplicata per n cosh ny si ottiene B 0 (y)(n sinh n(π − y) cosh ny + n cosh n(π − y) sinh ny) = −Fn (y) sinh ny (2.2.24) scrivendo y1 = sinh ny e y2 = sinh n(π − y) si ha B 0 (y)(y2 y10 − y1 y20 ) = −Fn (y) sinh ny e inoltre (y2 y10 − y1 y20 )0 = y2 y100 − y1 y200 = n2 sinh n(π − y) sinh ny − n2 sinh n(π − y) sinh ny = 0 (2.2.25) 32 CAPITOLO 2. EQUAZIONI DIFFERENZIALI ALLE DERIVATE PARZIALI quindi y2 y10 − y1 y20 = cost = n sinh nπ, quindi si ottiene B 0 (y) = −Fn (y) sinh ny ; n sinh nπ A0 (y) = Fn (y) sinh n(π − y) n sinh nπ da cui, ricordando che A(π) = 0 e B(0) = 0 si ottiene Z π Z y sinh n(π − η) sinh(nη) A(y) = − dη; B(y) = − dη Fn (η) Fn (η) n sinh nπ n sinh nπ y 0 quindi è semplice vedere che Yn (y) può essere scritto nella seguente forma: Z π Fn (η) Yn (y) = A(y) sinh ny + B(y) sinh n(π − y) = − Gn (y, η)dη 0 n sinh nπ (2.2.26) (2.2.27) (2.2.28) dove si è introdotta la funzione sinh nη sinh n(π − y) se sinh n(π − η) sinh ny se Gn (y, η) = η<y n≥y (2.2.29) Si ottiene quindi per u l’espressione u(x, y) = ∞ X n=1 sin nx Yn (y) = − ∞ X Z π sin nx 0 n=1 2 π Z π F (ξ, η) sin nξdξ 0 Gn (y, η) dη = n sinh nπ ! Z 2 sin nx sin nξ =− F (ξ, η) Gn (y, η) dS = F (ξ, η)G(x, y, ξ, η)dS (2.2.30) nπ sinh nπ Q Q n=1 Z ∞ X dove Q = [0, π] × [0, π] e dS = dξdη e si è introdotta la funzione G(x, y, ξ, η) detta funzione di Green del problema. La funzione G risulta quindi definita da −G(x, y, ξ, η) = P∞ n=1 2 sinh n(π−y) sinh nη sin nx sin nξ πn sinh nπ se η < y 2 sinh ny sinh n(π−η) sin nx sin nξ n=1 πn sinh nπ se η ≥ y P∞ (2.2.31) La funzione precedente, di cui non è chiaro neppure se le serie convergano, può essere riscritta nella forma −G(x, y, ξ, η) = ∞ 1 X 1 h −n|y−η| e + 2π n=1 n (2.2.32) e−n(2π+|y−η|) + e−n(2π−|y−η|) − e−n(2π−y−η) − e−n(y+η) {cos n(x − ξ) − cos n(x + ξ)} + 1 − e−2nπ valutiamo ora la parte di questa serie che deriva dal termine e−n|y−η| : se poniamo z = P eiα , con |P | < 1 allora si ha ∞ X n=1 P n cos nα = ∞ X n=1 = Inoltre <(P eiα )n = < ∞ X zn = < n=1 z(1 − z) z =< = 1−z |1 − z|2 (2.2.33) <z − |z|2 P cos α − P 2 P cos α − P 2 = = |1 − z|2 |1 − P eiα |2 1 + P 2 − 2P cos α Z P ∞ X 1 n P cos nα = n 0 n=1 ∞ X n=1 ! p n−1 cos nα dp (2.2.34) 2.3. PROBLEMA AI LIMITI PER IL CERCHIO 33 quindi utilizzando 2.2.33 si ha Z P ∞ X 1 n cos α − p 1 P cos nα = dp = − log[1 + P 2 − 2P cos α] 2 − 2p cos α n 1 + p 2 0 1 (2.2.35) quindi ponendo P = e−|y−η| ed applicando la formula precedente si ottiene 1 log[1 + e−2|y−η| − 2e−|y−η| cos(x − ξ)] + 4π 1 − log[1 + e−2|y−η| − 2e−|y−η| cos(x + ξ)] + 4π ∞ X e−n(2π+|y−η|) + e−n(2π−|y−η|) − e−n(2π−y−η) − e−n(y+η) sin nx sin nξ − nπ(1 − e−2nπ ) n=1 G(x, y, ξ, η) = + (2.2.36) e la serie che compare ancora, fissati ξ, η, converge uniformemente in x, y. 2.3 Problema ai limiti per il cerchio In questa sezione si discuterà la soluzione dell’equazione differenziale 4u(x, y) = F (x, y) (2.3.1) con condizioni al contorno u(R cos φ, R sin φ) = f (φ), dove F ∈ L2 (B(0, R)) e f ∈ L2 (0, 2π) sono funzioni assegnate. Analogamente al caso precedente la soluzione u del problema può essere scritta come u = u0 + uF , dove • u0 soddisfa il problema con F = 0, f generica • uF soddisfa il problema con f = 0, F generica 2.3.1 caso u0 Ricordiamo innanzitutto che in coordinate polari il laplaciano di una funzione si scrive come ∂ 2 u 1 ∂u 1 ∂2u + + 2 2 (2.3.2) 2 ∂r r ∂r r ∂φ P Cerchiamo una soluzione della forma u(r, φ) = Rn (r)φn (φ) e imponiamo che 4(Rn φn ) = 0, cioè 4u(r, φ) = 1 1 Rn00 φn + Rn0 φn + 2 Rn φ00n = 0 r r (2.3.3) Imponiamo la ulteriore condizione che φ00n = −λφ, con φn (0) = φn (2π) e φ0n (0) = φ0n (2π) da cui è semplice ottenere λ = n2 ; φn (φ) = an sin nφ + bn cos nφ (2.3.4) si ottiene allora la seguente equazione per Rn : n2 1 Rn00 + Rn0 − 2 Rn = 0 r r (2.3.5) Se n = 0 la soluzione generale della precedente equazione è R0 = a0 + b0 log r; se n 6= 0, cercando soluzioni della forma rα , si ottiene che Rn = an rn + bn r−n , quindi l’espressione Rn φn assume la forma • se n = 0 a0 + b0 log r 34 CAPITOLO 2. EQUAZIONI DIFFERENZIALI ALLE DERIVATE PARZIALI an rn cos nφ + bn rn sin nφ + • se n 6= 0 cn rn cos nφ + dn rn sin nφ poichè però si vuole che la soluzione sia definita anche in r = 0 ci si restringe a considerare per Rn φn i valori • se n = 0 a0 • se n 6= 0 an rn cos nφ + bn rn sin nφ Per soddisfare la condizione al bordo è necessario che lo sviluppo in serie di Fourier di f , si ottiene P Rn (R)φn (φ) = f (φ) quindi, considerando Z 2π 1 a0 + (an R cos nφ + bn R sin nφ) = f (θ)dθ + 2π 0 n=1 Z Z ∞ X sin nφ 2π cos nφ 2π f (θ) cos nθdθ + f (θ) sin nθdθ + π π 0 0 n=1 ∞ X n n (2.3.6) da cui si determinano ai , bi , ottenendo quindi per u l’espressione u(r, φ) = 1 2π Z 2π f (θ)dθ + 0 Z ∞ 1 X r n 2π f (θ)[cos nθ cos nφ + sin nθ sin nφ]dθ π n=1 R 0 Se 0 ≤ r ≤ r0 < R la serie converge uniformemente, quindi può essere riscritta come ( ) Z 2π ∞ n X r 1 f (θ) 1 + 2 cos n(θ − φ) dθ u(r, φ) = 2π 0 R n=1 (2.3.7) (2.3.8) Se poniamo z = P eiα , con |P | < 1 allora si ha ∞ X n=1 P n cos nα = ∞ X <(P eiα )n = < n=1 = Inoltre 1+2 ∞ X n=1 zn = < z(1 − z) z =< = 1−z |1 − z|2 (2.3.9) <z − |z|2 P cos α − P 2 P cos α − P 2 = = 2 iα 2 |1 − z| |1 − P e | 1 + P 2 − 2P cos α P cos α − P 2 1 − P2 = 2 1 + P − 2P cos α 1 + P 2 − 2P cos α (2.3.10) quindi, ponendo P = r/R e α = θ − φ, si ottiene Z u(r, φ) = 2π f (θ) 0 R2 − r 2 1 dθ 2 2 2π R + r − 2rR cos(θ − φ) (2.3.11) L’equazione 2.3.11 è nota come formula di Posson e l’espressione che moltiplica f nell’integrando è nota come nucleo di Poisson. Utilizzando la formula 2.3.2 è semplice vedere, utilizzando il teorema di derivazione sotto il segno di integrale, che la funzione in 2.3.11 soddisfa effettivamente l’equazione 4u = 0, poichè il nucleo di Poisson soddisfa questa equazione se r < R. Notiamo ora una proprietà del nucleo di Poisson che sarà tra poco utilizzata: se f = 1 si vede subito dallo sviluppo 2.3.7 che si ha u(r, φ) = 1 per ogni r, φ con r < R, quindi ponendo f (θ) = 1 nella formula di Poisson 2.3.11 si ottiene Z 2π R2 − r 2 1 dθ (2.3.12) 1= 2 2 2π R + r − 2rR cos(θ − φ) 0 2.3. PROBLEMA AI LIMITI PER IL CERCHIO 35 Utilizzando la formula trigonometrica cos α = 1 − 2 sin2 α 2 (2.3.13) si ottiene θ−φ θ−φ ≥ 4rR sin2 2 2 (2.3.14) 1 R2 − r 2 R2 − r 2 η dθ ≤ 2 2π 4rR sin 2 4rR sin2 η2 (2.3.15) R2 + r2 − 2rR cos(θ − φ) = R2 + r2 − 2rR + 4rR sin2 quindi se η > 0 si ha Z |θ−φ|>η 1 R2 − r 2 dθ ≤ 2 2 2π R + r − 2rR cos(θ − φ) Z |θ−φ|>η e l’ultimo membro tende a 0 se r → R− . Notiamo infine che il nucleo di Poisson è una funzione positiva. Dopo queste semplici premesse verifichiamo ora infine che se f è una funzione continua di θ, allora si ha (dove u è definita dall formula di Poisson) lim (r,φ)→(R,φ0 ) u(r, φ) = f (φ) (2.3.16) Si ha infatti (usando 2.3.12) Z 2π 1 R2 − r 2 dθ = 2 2 2π R + r − 2rR cos(θ − φ) 0 1 R2 − r 2 [f (θ) − f (φ0 )] dθ + 2 2 2π R + r − 2rR cos(θ − φ) |θ−φ0 |≤η Z 1 R2 − r 2 + [f (θ) − f (φ0 )] dθ 2π R2 + r2 − 2rR cos(θ − φ) |θ−φ0 |>η u(r, φ) − f (φ0 ) = Z = [f (θ) − f (φ0 )] (2.3.17) A causa della relazione 2.3.12 il primo integrale può essere stimato in valore assoluto da sup |f (θ) − f (φ0 )| (2.3.18) |θ−φ0 |<η che per la continuità di f può essere reso piccolo a piacere scegliendo η abbastanza piccolo. Se ora si sceglie φ tale che |φ − φ0 | < η/2, da |θ − φ0 | > η segue |θ − φ| > η/2 quindi, se M = max |f (θ)|, il secondo integrale si stima in valore assoluto con Z 2M |θ−φ|>η/2 R2 − r 2 1 dθ 2π R2 + r2 − 2rR cos(θ − φ) (2.3.19) che per 2.3.15 tende a zero se r → R. 2.3.2 caso uF P Cercando soluzioni della forma u(r, φ) = n Rn (r)φn (φ) è semplice vedere che le φn devono avere la stessa forma del caso precedente e quindi si deve avere n2 1 Rn00 (r) + Rn0 (r) − 2 Rn = Fn (r) r r dove F (r, φ) = P∞ n=0 (2.3.20) Fn (r)φn (φ). Per la soluzione di 2.3.20 distingeremo i due casi n = 0 e n 6= 0. 36 CAPITOLO 2. EQUAZIONI DIFFERENZIALI ALLE DERIVATE PARZIALI n=0 Se n = 0 l’equazione 2.3.20 si riduce a rR000 + R00 = rF0 cioè Z rR00 (r) = d 0 dr (rR0 ) = rF0 quindi r xF0 (x)dx (2.3.21) 0 dove l’estremo inferiore di integrazione è 0 per evitare singolarità in r = 0. Quindi si ottiene Z R R0 (r) = − r 1 t Z t xF0 (x)dx dt (2.3.22) 0 dove gli estremi di integrazione sono stati scelti in modo da avere R0 (R) = 0. Applicando il teorema di Fubini si ottiene allora Z r Z R Z R Z R 1 1 R0 (r) = − dx xF0 (x)dt − dx xF0 (x) dt = (2.3.23) t t 0 r r x Z r Z R r x = xF0 (x) log dx + xF0 (x) log dx R R 0 r (non è ovvio che il teorema di Fubini sia applicabile ma si può controllare semplicemente che il risultato finale è giusto, cioè verifica ancora 2.3.20). n 6= 0 Poichè rn e r−n sono soluzioni dell’equazione omogenea si cercano soluzioni del tipo A(r)rn + B(r)r−n ottenendo il sistema A0 (r)rn + B 0 r−n = 0 (2.3.24) 0 nA (r)rn−1 − nB 0 (r)r−n−1 = Fn (r) da cui si ottiene 1 A0 (r) = 2n (rFn (r))r−n 1 0 B (r) = − 2n (rFn (r))rn (2.3.25) per evitare sigolarità in 0 si impone B(0) = 0; inoltre da Rn (R) = 0 segue che R2n A(R) = −B(R), da cui si ottiene Z r 1 B(r) = − (xF (x))xn dx (2.3.26) 2n 0 Z R Z r 1 1 1 1 n (xFn (x))x dx + (xFn (x)) n dx = (2.3.27) A(r) = A(R) + A (x)dx = 2n 2n R 2n x 0 R R Z r Z R Z R x n x n 1 1 1 1 = (xFn ) dx + (xF ) dx − (xFn ) n dx n 2 2 2n 0 R 2n r R 2n r x Z r 0 da cui si ottiene 1 Rn (r) = 2n Z r (xFn ) 0 h rx n R2 − x n i r 1 dx + 2n Z R (xFn ) r h rx n R2 − r n i x dx (2.3.28) Per semplificare i passaggi successivi notiamo che sia nel caso n = 0 che nel caso n 6= 0 gli Rr RR integrandi di 0 e r , a parte il fattore comune xFn (x), si ottengono l’uno dall’altro scambiando x con r. 2.3. PROBLEMA AI LIMITI PER IL CERCHIO 37 Analogamente al caso precedente si ottiene u confrontando il suo sviluppo con lo sviluppo di Fourier di F , ottenendo quindi Z r Z 2π r 1 x F (x, θ)dθ log dx + (2.3.29) u(r, φ) = 2π 0 R 0 Z r Z 2π ∞ X 1 1 + x F (x, θ) cos nθdθ cos nφ+ 2n 0 π 0 n=1 n Z Z R 1 2π rx n x n o + F (x, θ) sin nθdθ sin nφ − dx + ··· = π 0 R2 r r ( ) Z Z ∞ h rx n x n i X r 1 1 = F (x, θ) log + cos n(θ − φ)) − dS + ··· 2π x<r R n=1 n R2 r x>r dove dS = xdθdx; non si è prestata molta attenzione allo scambio di sommatoria e integrale poichè una volta arrivati alla forma finale si verificherà direttamente la giustezza della stessa. Applicando xr x 2.2.35 con P = R 2 e P = r si ottiene ( ) 2 Z Z 1 + xr2 − 2 xr cos(θ − φ) 1 r2 u(r, φ) = F (x, θ) log 2 + log dS + · · · = (2.3.30) 2 2 4π x<r R 1 + xRr4 − 2xr cos(θ − φ) x>r ( ) Z Z r2 + x2 − 2rx cos(θ − φ) 1 log = F (x, θ) dS + ··· 2 2 4π R2 + xRr2 − 2rx cos(θ − φ) x<r x>r poichè il termine {· · · } è simmetrico per lo scambio di r con x si ottiene quindi infine ) ( Z r2 + x2 − 2rx cos(θ − φ) 1 dS u(r, φ) = F (x, θ) log 2 2 4π R2 + xRr2 − 2rx cos(θ − φ) S (2.3.31) dove S = B(0, R); la funzione 1 r2 + x2 − 2rx cos(θ − φ) log = 2 2 4π R2 + xRr2 − 2rx cos(θ − φ) 1 x2 r 2 = log[r2 + x2 − 2rx cos(θ − φ)] − log[R2 + 2 − 2rx cos(θ − φ)] 4π R G(r, φ, x, θ) = (2.3.32) è detta funzione di Green. Verifichiamo ora che la funzione 2.3.31 è effettivamente la soluzione cercata del problema. Per fare ciò notiamo innanzitutto che la funzione G(r, φ, x, θ) soddisfa l’equazione 4G = 0 come funzione di r, φ in S\{x, θ}. Poichè ∂G/∂r e ∂G/∂φ sono integrabili in S, si può derivare sotto il segno di integrale, ottenendo Z ∂u ∂G = F (x, θ) dS (2.3.33) ∂r ∂r S Z ∂u ∂G = F (x, θ) dS (2.3.34) ∂φ ∂φ S le derivate seconde ∂ 2 G/∂r2 e ∂ 2 G/∂φ2 non sono invece integrabili, quindi non si può derivare ulteriormente sotto l’integrale. Notiamo ora che se poniamo F = 1, si ottiene F0 = 1 e Fn = 0 se n > 0, quindi dalla espressione 2.3.29 si ottiene Z R Z r x 1 r x log dx = (r2 − R2 ) (2.3.35) u(r, φ) = x log dx + R R 4 r 0 inoltre in questo caso gli scambi di integrale e sommatoria sono evidentemente leciti, quindi si ottiene, inserendo F = 1 in 2.3.31 Z 1 G(r, φ, x, θ)dS = (r2 − R2 ) (2.3.36) 4 S 38 CAPITOLO 2. EQUAZIONI DIFFERENZIALI ALLE DERIVATE PARZIALI da cui si ottiene 1 r= 2 Z ∂G dS ∂r ZS ∂G 0= dS S ∂φ (2.3.37) (2.3.38) moltiplicando le equazioni precedenti per F (r, φ) e sottraendole a 2.3.33, 2.3.34 si ottiene Z ∂G ∂u 1 − rF (r, φ) = [F (x, θ) − F (r, φ)]dS (2.3.39) ∂r 2 S ∂r Z ∂u ∂G = [F (x, θ) − F (r, φ)]dS (2.3.40) ∂φ S ∂φ Se ora si suppone che F sia di classe C 1 allora il rapporto [r2 F (x, θ) − F (r, φ) + x2 − 2rx cos(θ − φ)]1/2 (2.3.41) è limitato, poichè [r2 + x2 − 2rx cos(θ − φ)]1/2 è la distanza tra i punti (r, φ) e (x, θ). Con questa assunzione è semplice vedere che le funzioni che si ottengono derivando gli integrandi di 2.3.39 e 2.3.40 sono integrabili, quindi è possibile derivare sotto il segno di integrale, ottenendo Z 2 ∂2u 1 1 ∂F ∂ G ∂G ∂F − F (r, φ) − r (r, φ) = [F (x, θ) − F (r, φ)] − (r, φ) dS (2.3.42) ∂r2 2 2 ∂r ∂r2 ∂r ∂r S Z ∂2u ∂2G ∂G ∂F = [F (x, θ) − F (r, φ)] − (r, φ) dS (2.3.43) ∂φ2 ∂φ2 ∂φ ∂φ S quindi si ottiene infine ∂ 2 u 1 ∂u 1 ∂2u 1 ∂F 4u = + + = F (r, φ) + r (r, φ) + 2 2 2 ∂r r ∂r r ∂φ 2 ∂r Z 2 ∂ G 1 ∂G 1 ∂2G + + [F (x, θ) − F (r, φ)]dS − + ∂r2 r ∂r r2 ∂φ2 S Z Z ∂F ∂G ∂F ∂G − (r, φ) dS − dS = F (r, φ) ∂r ∂r ∂φ S S ∂φ (2.3.44) Se inoltre F è limitata, allora si ha Z Z |u(r, φ)| ≤ M |G|dS = −M S GdS = S M 2 (R − r2 ) 4 (2.3.45) (dove si è usato il fatto che G(r, φ, x, θ) ≤ 0) quindi si ha lim (r,φ)→(R,φ0 ) 2.3.3 u(r, φ) = 0 (2.3.46) Funzioni armoniche Definizione 2.3.1. Sia Ω ⊂ Rn un insieme aperto e f : Ω → C una funzione; si dice che f è una funzione armonica su Ω se per ogni punto di Ω la funzione f soddisfa l’equazione 4f = n X ∂2f i=1 ∂x2i =0 (2.3.47) 2.3. PROBLEMA AI LIMITI PER IL CERCHIO 39 Definizione 2.3.2. Sia Ω ⊂ Rn un aperto, sia ∂Ω = Ω\Ω e sia data una funzione continua f : ∂Ω → C; si chiama problema di Dirichlet il problema consistente nel trovare una funzione ψ : Ω → C continua tale che ψ sia armonica su Ω e ψ|∂Ω = f . Teorema 2.3.1. Sia Ω = B(0, R) ⊂ R2 e f : ∂Ω → C una funzione continua assegnata, allora il problema di Dirichlet su Ω con condizione al bordo f ammette come soluzione (in coordinate polari) ( f (φ) se r = R R 2π u(r, φ) = (2.3.48) 1 R2 −r 2 f (θ) 2π R2 +r2 −2rR cos(θ−φ) dθ se r < R 0 Dimostrazione. per quanto visto in precedenza u(r, φ) cosı̀ definita è una funzione armonica su Ω e continua su Ω (vedi equazione 2.3.16). Teorema 2.3.2 (Principio del massimo). Sia Ω ⊂ Rn un aperto limitato, F : Ω → R una funzione e sia u : Ω → R una funzione continua tale che in Ω si abbia 4u = −F , allora se F ≤ 0 si ha sup u(x) ≤ max u(x) (2.3.49) x∈∂Ω x∈Ω Dimostrazione. dimostriamo innanzitutto il teorema nel caso F < 0: se in questo caso u avesse un massimo in x̄ ∈ Ω si dovrebbe avere ∂2u (x̄) ≤ 0 ∂x2i ∂u (x̄) = 0; ∂xi (2.3.50) quindi 4u(x̄) ≤ 0, mentre in Ω si deve avere 4u = −F > 0, quindi u deve assumere il suo massimo su ∂Ω ed in questo caso è mostrata la relazione 2.3.49. Se definiamo g(x) = x21 + · · · + x2n si ha 4g = 2n > 0; poniamo allora v(x) = u(x) + g(x) (2.3.51) dove > 0 è una costante. Evidentemente v : Ω → R è una funzione continua e soddisfa in Ω all’equazione 4v = −(F − 2n) (2.3.52) e poichè F ≤ 0 si ha F − 2n < 0, quindi si può applicare il primo caso dimostrato, quindi v assume il suo massimo su ∂Ω. Sia M = maxx∈∂Ω u(x) e R > 0 tale che Ω ⊂ B(0, R), allora si ha per ogni x∈Ω u(x) ≤ v(x) ≤ max v(y) ≤ M + R2 (2.3.53) y∈∂Ω L’equazione precedente deve valere per ogni > 0, quindi passando al limite per → 0 si ottiene l’enunciato. Corollario 2.3.1. Sia Ω ⊂ Rn un aperto limitato e sia f : ∂Ω → R una funzione continua, allora se u : Ω → R è soluzione del problema di Dirichlet con condizione al bordo f si ha per ogni x ∈ Ω min f (y) ≤ u(x) ≤ max f (y) y∈∂Ω (2.3.54) y∈∂Ω Dimostrazione. per il principio del massimo si ha per ogni x ∈ Ω u(x) ≤ max u(y) = max f (y) y∈∂Ω (2.3.55) y∈∂Ω inoltre −u è soluzione del problema di Dirichlet con condizione al bordo −f , quindi si ha −u(x) ≤ max [−u(y)] = max [−f (y)] = min f (y) y∈∂Ω y∈∂Ω y∈∂Ω (2.3.56) 40 CAPITOLO 2. EQUAZIONI DIFFERENZIALI ALLE DERIVATE PARZIALI Corollario 2.3.2. Sia Ω ⊂ Rn un aperto limitato, allora l’unica soluzione del problema di Dirichlet con condizione al bordo nulla su ∂Ω è u = 0. Dimostrazione. u = 0 è evidentemente una soluzione e se nel corollario precedente si pone f = 0 si vede che è anche l’unica. Corollario 2.3.3. Sia Ω ⊂ Rn una aperto limitato e f : ∂Ω → C una funzione continua, allora se il problema di Dirichlet con condizione al bordo f ammette almeno una soluzione esso ammette solo una soluzione. Dimostrazione. supponiamo per assurdo che esistano due soluzioni distinte u1 , u2 , allora v = u1 −u2 soddisfa al problema di Dirichlet con condizioni al bordo nulle su ∂Ω, quindi per il corollario precedente v = 0 e quindi u1 = u2 . Il corollario precedente è in generale falso se Ω non è limitato: consideriamo ad esempio Ω = c B(0, 1) (in Rn con n ≥ 3) con condizione al bordo f = 1, allora due soluzioni distinte sono ad esempio u1 (x) = 1; u2 (x) = (x21 + · · · + x2n )(n−2)/2 (2.3.57) Corollario 2.3.4. La funzione 2.3.48 è l’unica soluzione del problema di Dirichlet considerato nel teorema 2.3.1. Corollario 2.3.5 (Teorema della media). Sia Ω ⊂ R2 un insieme aperto e B(a, R) ⊂ Ω, allora se u : Ω → C è una funzione armonica si ha Z 2π 1 u(a) = u(a + Reiθ )Rdθ (2.3.58) 2πR 0 ossia u(a) coincide con la media dei valori che u assume su ∂B(a, R) (il teorema è vero anche in dimensione superiore utilizzando integrali superficiali) Dimostrazione. all’interno di B(a, R) la funzione u coincide (per l’unicità) con la soluzione del problema di Dirichlet con condizione al bordo u su B(a, R), quindi è applicabile la formula di Poisson; in questo caso essa diviene, in coordinate polari centrate in a Z 2π 1 R2 − r 2 u(r, φ) = u(a + Reiθ ) dθ (2.3.59) 2π R2 + r2 − 2rR cos(θ − φ) 0 ponendo r = 0 si ottiene il valore di u calcolato nel punto a, quindi l’espressione 2.3.58. Corollario 2.3.6. Sia Ω ⊂ R2 un insieme aperto limitato tale che non possa scriversi come unione di due aperti disgiunti non vuoti (si dice che è connesso). Sia u : Ω → C una funzione armonica, allora se |u| ha un punto di massimo in Ω la funzione u è costante (anche questo è vero anche in dimensione superiore ma poichè si è dimostrato il teorema della media solo nel caso n = 2 ci si limiterà anche quı̀ al caso n = 2). Dimostrazione. sia a ∈ Ω un punto di massimo per |u| e vediamo che l’insieme {x ∈ Ω|u(x) = u(a)} è un insieme aperto: se u(a) = 0 il teorema è ovvio, quindi supponiamo u(a) 6= 0 e, a meno di moltiplicare u per una costante di modulo 1, si può supporre u(a) > 0. Per r ≥ 0 abbastanza piccolo, sia M (r) = sup |u(a + reiθ )| 0≤θ≤2π per ipotesi si ha (per r sufficientemente piccolo) M (r) ≤ u(a), inoltre da 2.3.58 segue u(a) ≤ M (r), quindi u(a) = M (r); ciò assicura che la funzione <[u(a) − u(z)] è positiva per z vicino ad a e nulla R 2π in z se e solo se u(z) = u(a). Da 2.3.58 segue che 0 <(u(a) − u(a + reiθ ))dθ = 0 per r piccoli, che per quanto visto implica che in B(a, R) la funzione u è costante, quindi A = {x ∈ Ω|u(x) = u(a)} è aperto. 2.3. PROBLEMA AI LIMITI PER IL CERCHIO 41 Poichè u è continua, è immediato vedere che B = {x ∈ Ω|u(x) = 6 u(a)} è un insieme aperto. Ma allora Ω = A ∪ B, A ∩ B = ∅ e A e B sono aperti, quindi dall’ipotesi (poichè a ∈ A) segue B = ∅, cioè A = Ω. 2.3.4 Lemma di Green e sue conseguenze In questa sezione si utilizzeranno tecniche leggermente più sofisticate che in quelle precedenti, in particolare si farà un pesante uso di integrali superficiali, questo per esporre il teorema generale della media per le funzioni armoniche ed alcune nozioni circa la teoria generale delle funzioni di Green nei problemi ai limiti per l’operatore di Laplace. Ricordiamo innanzitutto il contenuto del teorema della divergenza: se v(x) è un campo vettoriale di classe C 1 in Rn , S è una varietà con bordo di dimensione n di classe C 1 a tratti avente per bordo σ e n è la normale uscente a S si ha Z Z ∇ · vdS = v · ndσ (2.3.60) S σ Dal teorema della divergenza si può ottenere un analogo multidimensionale dell’integrazione per parti: si ha innanzitutto se u : Rn → R è di classe C 1 ∇ · (uv) = (∇u) · v + u∇ · v dal teorema della divergenza si ottiene allora Z Z Z u∇ · vdS = uv · ndσ − v · ∇udS S σ (2.3.61) (2.3.62) S Se si pone in particolare v = v(x)ei si ottiene Z Z Z ∂v ∂u u dS = uvni dσ − vdS ∂x ∂x i i S σ S (2.3.63) dove ni è la componente i−esima di n. D’ora in avanti ogni volta che si considereranno integrali di volume o superficie si supporranno verificate le condizioni di regolarità necessarie per poter applicare il teorema della divergenza Lemma 2.3.1 (Lemma di Green). Siano f, g funzioni di classe C 2 , allora si ha Z Z ∂g ∂f (f 4g − g4f )dS = f −g dσ ∂n ∂n S σ dove ∂f ∂n (2.3.64) = ∇f · n. Dimostrazione. utilizzando l’identità 2.3.61 si ottiene Z Z Z Z ∂g ∇ · (f ∇g)dS = (f 4g + ∇f · ∇g)dS = f ∇g · ndσ = f dσ ∂n S S σ Z Z Z Z ∂f ∇ · (g∇f )dS = (g4f + ∇g · ∇f )dS = g∇f · ndσ = g dσ ∂n S S σ (2.3.65) (2.3.66) e quindi sottraendo si ottiene 2.3.64. Teorema 2.3.3 (Teorema della media). Sia Ω un aperto in Rn e sia u : Ω → C armonica, sia y ∈ Ω e sia δ > 0 tale che B(y, δ) ⊂ Ω, allora se si indica con |s(δ)| la superficie della sfera n−dimensionale s(δ) = {x ∈ Rn | kx − yk = δ} si ha Z 1 udσ (2.3.67) u(y) = |s(δ)| s 42 CAPITOLO 2. EQUAZIONI DIFFERENZIALI ALLE DERIVATE PARZIALI Dimostrazione. dal lemma di Gauss segue innanzitutto, ponendo f = u e g = 1 che Z ∂u dσ = 0 σ ∂n (2.3.68) Supponiamo ora n > 2 e sia 0 < < δ; nel lemma di Green poniamo ora g(x) = kx − yk2−n , f (x) = u(x) e S = {x ∈ Rn | ≤ kx − yk ≤ δ}; notando che anche g è armonica si ottiene Z Z Z Z ∂u ∂u 1−n 2−n 1−n 2−n udσ − δ dσ − (2 − n) udσ + dσ (2.3.69) 0 = (2 − n)δ ∂n ∂n s(δ) s(δ) s() s() quindi usando 2.3.68 si ottiene Z 0 = δ 1−n Z udσ − 1−n s(δ) udσ (2.3.70) s() quando → 0 si ottiene a meno di infinitesimi di ordine superiore in Z n−1 |s()| udσ ∼ |s()|u(y) = |s(δ)|u(y) = |s(δ)|u(y) |s(δ)| δ s() quindi inserendo in 2.3.70 si ottiene infine Z 1−n Z udσ = udσ → |s(δ)|u(y) δ s(δ) s() (2.3.71) (2.3.72) Se n = 2 si procede in modo identico ponendo g(x) = log kx − yk. La parte seguente di questa sezione è ripresa dal testo [2] della bibliografia. Definizione 2.3.3. Dato un aperto Ω ⊂ R2 , sia ∂Ω = Ω\Ω. Definiamo la funzione di Green per il laplaciano in 2 dimensioni come una funzione G(x, y, ξ, η) : Ω × Ω → R che soddisfa i seguenti criteri 1. eccetto nel punto (x, y) = (ξ, η) la funzione G(x, y, ξ, η) è continua in x, y e le sue derivate prime e seconde rispetto a x, y sono continue in Ω\{ξ, η} rispetto a x, y. La funzione G ha la forma G(x, y, ξ, η) = 1 log r + γ(x, y, ξ, η); 2π r= p (x − ξ)2 + (x − η)2 (2.3.73) dove γ e le sue derivate prime e seconde in x, y sono continue rispetto a x, y [ovunque, non più tranne in (x, y) = (ξ, η) ]. 2. G(x, y, ξ, η) = 0 se (x, y) ∈ ∂Ω 3. in Ω\{ξ, η} si deve avere 4G(x, y, ξ, η) = 0 (il laplaciano è applicato alle coordinate x, y ). Dal punto (3) della definizione precedente, poichè 4 log r = 0 su Ω\{ξ, η}, segue che 4γ = 0 su Ω\{ξ, η} e per la continuità delle derivate seconde si ha 4γ = 0 su tutto Ω. Lemma 2.3.2. sia f : Ω → R una funzione continua nel punto (x, y) = (ξ, η) e sia s() = {(x, y) ∈ R2 | r = } ⊂ Ω, allora si ha Z ∂G f dσ = f (ξ, η) (2.3.74) lim →0 s() ∂n 2.3. PROBLEMA AI LIMITI PER IL CERCHIO 43 Dimostrazione. notiamo innanzitutto che si ha ∇G(x, y, ξ, η) = 1 1 (x − ξ, y − η) + ∇γ 2π r2 (2.3.75) e che quindi se n è la normale esterna a s() si ha ∂G (x − ξ, y − η) 1 ∂γ = ∇G · n = ∇G · = + ∂n r 2πr ∂n (2.3.76) quindi Z f 1 = 2π s() Z 2π ∂G dσ = ∂n Z f s() 1 dσ + 2πr Z f s() Z ∂γ dσ = ∂n f f (ξ + cos θ, η + sin θ)dθ + 0 s() (2.3.77) ∂γ dσ ∂n poichè ∂γ/∂n è continua in (x, y) = (ξ, η), il secondo integrale tende a 0 se → 0, mentre è semplice vedere che il primo tende a f (ξ, η). Teorema 2.3.4 (Simmetria della funzione di Green). Si ha G(x, y, ξ, η) = G(ξ, η, x, y) Dimostrazione. sia k = B((ξ, η), ) e k 0 = B((ξ 0 , η 0 ), ) ed applichiamo il lemma di Green con S = Ω\{k ∪ k 0 }, f (x, y) = G(x, y, ξ, η) e g(x, y) = G(x, y, ξ 0 , η 0 ), allora si ottiene Z ∂g ∂f 0= f −g dσ (2.3.78) ∂n ∂n σ dove n è la normale uscente di Ω\{k ∪ k 0 } e quindi è entrante per k e k 0 . L’equazione precedente equivale a Z Z ∂g ∂f ∂g ∂f f −g dσ + f −g dσ = 0 (2.3.79) ∂n ∂n ∂n ∂n ∂k ∂k0 poichè su ∂Ω sia f che g sono nulle. Passando al limite per → 0 si ottiene usando il lemma 2.3.2 (con la sostituzione n → −n poichè lı̀ n era uscente) g(ξ, η) − f (ξ 0 , η 0 ) = 0 (2.3.80) che equivale alla tesi. Vediamo ora il teorema da cui dipende l’importanza della funzione di Green. Teorema 2.3.5. 1) Sia Ω ⊂ R2 e sia u : Ω → R una funzione continua con derivate prime continue e 4u integrabile che soddisfa su Ω l’equazione 4u = φ(x, y) e tale che u = 0 su ∂Ω allora si ha Z u(x, y) = G(x, y, ξ, η)φ(ξ, η)dξdη (2.3.81) Ω 2) se φ : Ω → R è una funzione continua con derivate prime continue in Ω, allora la funzione u(x, y) definita in 2.3.81 è continua in Ω, ha derivate prime e seconde continue in Ω, si ha 4u = φ in Ω e u = 0 su ∂Ω. Dimostrazione. 1) applichiamo la formula di Green con f (x, y) = u(x, y), g(x, y) = G(x, y, ξ, η) e S = Ω\k, dove k = B((ξ, η), ), allora si ottiene Z Z ∂u ∂G −G dσ = − Gφdξdη (2.3.82) u ∂n ∂n Ω\k ∂k dove n è uscente per Ω\k e quindi entrante per k. Passando al limite per → 0 usando il lemma 2.3.2 (con la sostituzione n → −n) si ottiene la formula 2.3.81 44 CAPITOLO 2. EQUAZIONI DIFFERENZIALI ALLE DERIVATE PARZIALI 2) usando 2.3.81 e 2.3.73 si può scrivere u = ψ + χ, dove Z Z 1 ψ(x, y) = φ(ξ, η) log rdξdη; χ(x, y) = γ(x, y, ξ, η)φ(ξ, η)dξdη 2π Ω Ω (2.3.83) poichè γ e le sue derivate fino al secondo ordine sono continue si può calcolare 4χ derivando sotto l’integrale e poichè 4γ = 0 si ottiene 4χ = 0, quindi resta solo da mostrare che 4ψ = φ. Per calcolare ∂ψ/∂x (o analogamente ∂ψ/∂x) si può derivare sotto l’integrale, poichè in coordinate polari si ha Z Z ∂ ψ cos θdrdθ < +∞ (2.3.84) log rdξdη = ψ Ω Ω ∂x quindi chiamando S(x, y, ξ, η) = 1 2π log r si ha ∂ψ = ∂x Z Ω ∂S φdξdη ∂x Inoltre è immediato vedere che ∂S/∂x = −∂S/∂ξ, quindi Z ∂ψ ∂S =− φdξdη ∂x Ω ∂ξ Integrando per parti tramite la formula 2.3.63 si ottiene Z Z ∂ψ ∂φ =− Sφnξ dσ + S dξdη ∂x ∂ξ ∂Ω Ω (2.3.85) (2.3.86) (2.3.87) dove nξ è la componente ξ della normale esterna a Ω. A questo punto si può derivare ulteriormente, ottenendo Z Z Z Z ∂S ∂S ∂φ ∂S ∂S ∂φ ∂2ψ = − φn dσ + dξdη = φn dσ − dξdη (2.3.88) ξ ξ ∂x2 ∂x ∂x ∂ξ ∂ξ ∂Ω Ω ∂Ω Ω ∂ξ ∂ξ Analogamente si ottiene quindi si ottiene Z 4ψ = ψ ∂Ω ∂2ψ = ∂y 2 Z ∂Ω ∂S φnη dσ − ∂η Z Ω ∂S ∂φ dξdη ∂η ∂η Z ∂S ∂S ∂S ∂φ ∂S ∂φ nξ + nη dσ − + dξdη = ∂ξ ∂η ∂ξ ∂ξ ∂η ∂η Ω Z Z ∂S = φ dσ − ∇S · ∇φ dξdη ∂Ω ∂n Ω se si scrive k = B((ξ, η), ) allora si ha anche per continuità Z Z ∂S ∇S · ∇φ dξdη 4ψ(x, y) = φ dσ − lim →0 Ω\k ∂Ω ∂n (2.3.89) (2.3.90) (2.3.91) inoltre usando la formula 2.3.65 con g(x, y) = S(x, y, ξ, η) e f (x, y) = φ(x, y) si ottiene (poichè 4g = 0) Z Z Z ∂S ∂S ∇S · ∇φdξdη = φ dσ + φ dσ (2.3.92) Ω\k ∂Ω ∂n ∂k ∂n dove n è la normale esterna a Ω\k e quindi interna a k, quindi si ottiene Z ∂S 4ψ(x, y) = − φ dσ ∂k ∂n (2.3.93) e quindi usando il lemma 2.3.2 (con n → −n) e la simmetria di S tra x, y e ξ, η, si ottiene 4ψ(x, y) = φ(x, y) che conclude. Tramite il teorema precedente non è difficile mostrare che 2.2.30 soddisfa effettivamente il problema 4u = F su (0, π) × (0, π) con condizione al bordo nulle (ovviamente se F soddisfa le condizioni della φ del teorema precedente). 2.4. EQUAZIONE DELLE ONDE 2.4 45 Equazione delle onde In questo capitolo si discuterà la soluzione dell’equazione u = 1 ∂2u ∂2u − = F (x, t) c2 ∂t2 ∂x2 (2.4.1) con le condizioni ai limiti ∂u (x, 0) = g(x); ∂t u(x, 0) = f (x); u(0, t) = a(t); u(`, t) = b(t) (2.4.2) dove f è derivabile con continuità una volta ed è deririvabile due volte quasi ovunque, g continua e derivabile q.o, F (x, t) è derivabile una volta rispetto a x con derivata continua q.o. ed F e ∂F/∂x sono integrabili sugli intervalli compatti rispetto a t, a, b sono funzioni derivabili con continuità due volte. A causa della linearità del problema si può scrivere u = uf + ug + uF + ua + ub dove • uf soddisfa il problema con F = 0, a = b = 0, g = 0 • ug soddisfa il problema con F = 0, a = b = 0, f = 0 • uF soddisfa il problema con a = b = 0, f = g = 0 • ua soddisfa il problema con F = 0, f = g = 0, b = 0 • ub soddisfa il problema con F = 0, f = g = 0, a = 0 2.4.1 caso uf Scriviamo u = P Xn (x)Tn (t) e imponiamo (Xn Tn ) = 0, allora si ottiene 1 Tn00 (t) Xn00 (x) − =0 c2 Tn (t) Xn (x) e quindi Xn00 + λXn = 0; (2.4.3) Tn00 + λc2 T = 0 (2.4.4) √ cui si impongono le condizioni Xn (0) = Xn (`) = 0 e T (0) = 0, allora si ottiene Xn = an sin λx 2 2 nπc e λ = n`2π , quindi Xn = an sin nπ ` x e Tn = bn cos ` t, quindi 0 u(x, t) = ∞ X an sin n=1 Inoltre si deve avere u(x, t = 0) = ∞ X n=1 nπ nπc x cos t ` ` an sin nπ x = f (x) ` (2.4.5) (2.4.6) Utilizzando la formula trigonometrica sin α cos β = 1 [sin(α + β) + sin(α − β)] 2 (2.4.7) l’equazione 2.4.5 si può riscrivere come u(x, t) = ∞ i 1X h nπ nπ (x + ct) + sin (x − ct) an sin 2 n=1 ` ` (2.4.8) quindi confrontando con 2.4.6 si ottiene u(x, t) = 1 1 fp (x + ct) + fp (x − ct) 2 2 (2.4.9) 46 CAPITOLO 2. EQUAZIONI DIFFERENZIALI ALLE DERIVATE PARZIALI nell’ultima espressione fp sta per f prolungata, infatti f è inizialmente definita solo su [0, `] (e a causa delle altre condizioni si deve avere f (0) = f (`) = 0) mentre nell’ultima espressione x + ct può diventare arbitrariamente grande. Dalle espressioni 2.4.6, 2.4.8 si ottiene che la f deve essere prolungata nel seguente modo: dapprima si prolunga la f in modo dispari sull’intervallo [−`, `], quindi si prolunga ulteriormente f in modo periodico con periodo 2`. 2.4.2 caso ug Procedendo come nel caso precedente ed imponendo le condizioni Xn (0) = Xn (`) = 0 e Tn (0) = 0 si ottiene ∞ nπ nπc X u(x, t) = an sin x sin t (2.4.10) ` ` n=1 e si impone la condizione ∞ X an n=1 nπ nπc sin x = g(x) ` ` (2.4.11) 1 [cos(α − β) − cos(α + β)] 2 (2.4.12) Utilizzando la formula trigonometrica sin α sin β = l’equazione 2.4.10 si può riscrivere come Z ∞ ∞ i X X an h nπ nπ an nπ x+ct nπ u(x, t) = cos (x − ct) − cos (x + ct) = zdz = (2.4.13) sin 2 ` ` 2 ` ` x−ct n=1 n=1 Z x+ct X Z x+ct ∞ nπc nπ 1 1 an sin zdz = gp (z)dz = 2c x−ct n=1 ` ` 2c x−ct dove gp è il prolungamento di g, ottenuto nello stesso modo in cui si è ottenuto fp nel caso precedente. Le due soluzioni appena trovate si potevano anche ottenere risolvendo esplicitamente l’equazione u = 0: consideriamo le nuove variabili ξ = x + ct; η = x − ct (2.4.14) allora (a meno di costanti numeriche) l’equazione precedente diventa ∂2u ∂ ∂u = =0 ∂ξ ∂η ∂η∂ξ (2.4.15) ∂u = a(η) ∂η (2.4.16) u = A(η) + B(ξ) (2.4.17) cioè ∂u/∂η è indipendente da ξ, quindi da cui si ottiene e ritornando alle variabili x, t si ottiene infine u(x, t) = A(x − ct) + B(x + ct) dove A, B sono funzioni derivabili due volte. per le condizioni ai limiti si ha: B(x) + A(x) = f (x) cB 0 (x) − cA0 (x) = g(x) (2.4.18) (2.4.19) 2.4. EQUAZIONE DELLE ONDE 47 dove l’apice indica la derivazione rispetto all’argomento; da queste si ottiene Rx 1 B(x) = 12 f (x) + K B(x) + A(x) = f (x) 2 + 2c 0 g(z)dz ; Rx Rx 1 B(x) − A(x) = 1c 0 g(z)dz + K A(x) = 21 f (x) − K 2 − 2c 0 g(z)dz quindi si ottiene 1 1 u(x, t) = [f (x + ct) + f (x − ct)] + 2 2c Z (2.4.20) x+ct g(z)dz (2.4.21) x−ct anche in questo caso si presenta il problema dell’estensione di f, g. Se g = 0 allora per le condizioni al contorno si deve avere 1 [f (ct) + f (−ct)] = 0 2 u(0, t) = (2.4.22) quindi su [−`, `] la funzione è prolungata in modo dispari. Inoltre u(`, t) = 1 [f (` + ct) + f (` − ct)] = 0 2 (2.4.23) quindi f deve essere prolungata in modo dispari rispetto al punto `, cioè viene estesa su [−`, 3`] in modo periodico di periodo 2`, ma allora u(3`, t) = 0 e procedendo per induzione analogamente a quanto già fatto si vede che f si prolunga su R in modo periodico di periodo 2`. Se f = 0 allora Z ct 1 u(0, t) = g(z)dz = 0 (2.4.24) 2c −ct da cui, derivando rispetto a t si ottiene g(ct) + g(−ct) = 0 cioè g deve essere prolungata su [−`, `] in modo dispari. Inoltre Z `+ct 1 u(`, t) = g(z)dz = 0 (2.4.25) 2c `−ct derivando rispetto a t si ottiene quindi g(l + ct) + g(l − ct) = 0 e si procede come per f . 2.4.3 caso uF P P Sia u(x, t) = Xn (x)Tn (t) ed imponiamo che (Xn (x)Tn (t)) = F (x, t); imponendo inoltre 2 2 Xn00 + λXn = 0 con le condizioni al contorno Xn (0) = Xn (`) = 0 si ottiene λ = n`2π e Xn (x) = nπ sin ` x e per t si ha c2 n2 π 2 Tn00 (t) + Tn (t) = c2 Fn (t) (2.4.26) `2 con le condizioni Tn (0) = Tn0 (0) = 0. Applicando il metodo della variazione delle costanti arbitrarie ad una equazione della forma Tn00 + ω 2 T = H con le condizioni al contorno precedente, si cercano delle soluzioni della forma T (t) = A(t) cos ωt + B(t) sin ωt e si è ricondotti al sistema A0 (t) cos ωt + B 0 (t) sin ωt = 0 (2.4.27) −ωA0 (t) sin ωt + ωB 0 (t) cos ωt = H(t) con le condizioni A(0) = 0 (poichè T (0) = 0) e B(0) = 0 (poichè T 0 (0) = 0), quindi si ha 0 R t H(τ ) H(t) A (t) = − ω sin ωt A(t) = − 0 ω sin ωτ dτ 0 B (t) = H(t) ω cos ωt B(t) = Rt H(τ ) ω 0 (2.4.28) cos ωτ dτ da cui si ottiene semplicemente Z T (t) = 0 t H(τ ) sin ω(t − τ )dτ ω (2.4.29) 48 CAPITOLO 2. EQUAZIONI DIFFERENZIALI ALLE DERIVATE PARZIALI nel caso particolare considerato si ottiene quindi Z nπc ` 2 t c Fn (τ ) sin (t − τ )dτ Tn (t) = nπc ` 0 quindi si ha u(x, t) = Z t ∞ X `c nπ nπc sin x Fn (τ ) sin (t − τ )dτ nπ ` ` 0 n=1 (2.4.30) (2.4.31) da cui, usando la formula trigonometrica 1 [cos(α − β) − cos(α + β)] 2 sin α sin β = (2.4.32) si ottiene u(x, t) = Inoltre si ha quindi Z t ∞ h i X `c nπ nπ Fn (τ ) cos (x − ct + cτ ) − cos (x + ct − cτ ) dτ 2πn 0 ` ` n=1 (2.4.33) Z β ` nπ nπ nπ cos α − cos β = sin zdz nπ ` ` ` α (2.4.34) Z x+ct−cτ ∞ Z cX t nπ u(x, t) = Fn (τ ) sin zdz dτ 2 n=1 0 ` x−ct+cτ (2.4.35) e ricordando che ∞ X Fn (τ ) sin n=1 si ottiene infine c u(x, t) = 2 Z t Z nπ z = F (z, τ ) ` (2.4.36) x+ct−cτ Fp (z, τ )dz dτ 0 (2.4.37) x−ct+cτ dove Fp è la funzione F (x, t) prolungata in modo che sia definita per ogni x nel modo ormai usuale: dapprima essa viene prolungate sull’intervallo [−`, `] in modo dispari, quindi su (−∞, +∞) in modo periodico di periodo 2`. Si può ora verificare semplicemente che la u(x, t) come definita in 2.4.37 è effettivamente la soluzione cercata. Per fare ciò è necessario usare la seguente formula: sia H(x, y) tale che ∂H/∂x sia continua q.o. ed H e ∂H/∂x siano integrabili rispetto ad y sugli intervalli limitati (le stesse proprietà che si sono ipotizzate per la F ), allora per ogni x si ha Z x Z x d ∂H H(x, y)dy = H(x, y = x) + (x, y)dy (2.4.38) dx 0 0 ∂x Dimostriamo la relazione precedente: il rapporto incrementele ∆f è Z Z x+∆x x ∆f = H(x + ∆x, y)dy − H(x, y)dy = 0 0 Z x+∆x Z x ∂H = H(x, y) + ∆x (x̄, y) dy − H(x, y)dy ∂x 0 0 (2.4.39) dove si è usato il teorema di Lagrange e x̄ ∈ [x, x + ∆x], quindi ∆f 1 = ∆x ∆x Z Z x+∆x H(x, y)dy + x 0 x+∆x ∂H (x̄, y)dy ∂x (2.4.40) 2.4. EQUAZIONE DELLE ONDE 49 quindi, usando il fatto che l’integrale di una funzione su un insieme di misura nulla è nullo e la continuità dell’integrale di una funzione integrabile nel secondo termine ed il teorema del valor medio nel primo, si ottiene al limite Z x ∂H ∆f lim = H(x, y = x) + (x, y)dy (2.4.41) ∆x→0 ∆x 0 ∂x Utilizzando la formula appena mostrata è immediato verificare che la u definita in 2.4.37 soddisfa 2.4.1. Inoltre si ha per quanto riguarda le condizioni al contorno: u(x, 0) = 0, u(0, t) = 0 poichè F è dispari rispetto a x = 0, u(`, t) = 0 poichè F è dispari rispetto a x = `, ed infine ∂u c (x, t) = ∂t 2 Z t [cF (x + ct − cτ, τ ) + cF (x − ct + cτ, τ )] dτ (2.4.42) 0 quindi ∂u/∂t(x, 0) = 0. 2.4.4 caso ua Si vedrà ora come questo caso può essere ricondotto a quelli precedentemente trattati: ponendo v(x, t) = u(x, t) − a(t) `−x ` si ha v(0, t) = a(t) − a(t) = 0 e v(`, t) = 0 e si vede subito che v soddisfa una equazione del tipo 2.4.1, 2.4.2 (con a(t) = b(t) = 0) dove F, f, g dipendono dalla particolare a(t). Analogamente si tratta il caso ub . Capitolo 3 Spazi di Hilbert ed Operatori lineari 3.1 Geometria degli spazi di Hilbert Definizione 3.1.1. Si indica con `2 l’insieme delle successioni di numeri complessi {xn }n∈N tali P che n∈N |xn |2 < +∞. L’insieme `2 può essere dotato della sruttura di spazio vettoriale definendo, se α ∈ C e {xn }, {yn } ∈ `2 α{xn }n∈N = {αxn }n∈N ; {xn }n∈N + {yn }n∈N = {xn + yn }n∈N (3.1.1) è evidente che se {xn } ∈ `2 allora {αxn } ∈ `2 , inoltre dalla disuguaglianza |xi +yi |2 ≤ 2|xi |2 +2|yi |2 segue che se {xn }, {yn } ∈ `2 allora {xn +yn } ∈ `2 . Lo spazio vettoriale `2 si può dotare del seguente prodotto scalare: X ({xn }n∈N , {yn }n∈N ) = xn yn (3.1.2) n∈N questo prodotto scalare è ben definito a causa della disuguaglianza |xi yi | ≤ 21 (|xi |2 + |yi |2 ). Teorema 3.1.1. Lo spazio `2 dotato del prodotto scalare della definizione 3.1.1 è uno spazio di Hilbert. Dimostrazione. sia {x(n) } una successione di Cauchy in `2 , cioè dato > 0 esiste un N tale che se n, m > N allora si ha √ kx(n) − x(m) k ≤ (3.1.3) cioè ∞ X (n) |xi (m) 2 − xi | < (3.1.4) i=0 √ (n) (m) dalla disequazione precedente segue in particolare che se n, m > N allora |xi −xi | ≤ , quindi n fissato l’indice ”i” la successione {xi }n∈N è di Cauchy in C per ogni i, quindi esiste xi ∈ C tale (n) che limn→∞ xi = xi . Poniamo x = {xi }i∈N ; mostriamo innanzitutto che x ∈ `2 : per ogni M ∈ N si ha (se n, m > N ) M ∞ X X (n) (m) (n) (m) |xi − xi |2 ≤ |xi − xi |2 ≤ (3.1.5) i=0 i=0 inoltre, per come sono definiti xi , si ha per ogni M ∈ N M X i=0 (n) |xi − xi |2 = lim m→∞ 50 M X i=0 (n) |xi (m) 2 − xi | (3.1.6) 3.1. GEOMETRIA DEGLI SPAZI DI HILBERT 51 PM (n) dalle equazioni precedenti si ottiene allora i=0 |xi − xi |2 ≤ per ogni M , quindi si ha P∞ (n) − xi |2 ≤ , quindi x(n) − x ∈ `2 e quindi x ∈ `2 . Si è inoltre visto che se n > N () si ha i=0 |xi kx(n) − xk2 = ∞ X (n) |xi − x i |2 ≤ (3.1.7) i=0 quindi limn→∞ kx(n) − xk`2 = 0, cioè x è il limite in `2 della successione di Cauchy {x(n) }, quindi `2 è completo. Lemma 3.1.1. Una base numerabile ortonormale in `2 è data dalle successioni ei = {0, . . . , 0, 1, 0, . . .} (3.1.8) (dove solo l’i−esimo termine è non nullo e vale 1). Dimostrazione. è immediato vedere che ei ∈ `2 e (ei , ej ) = δij . Per mostrare che gli {ei } formano una base di `2 basta mostrare (poichè `2 è uno spazio di Hilbert) che se v ∈ `2 è tale che (ei , v) = 0 per ogni i allora v = 0. Sia v = {v1 , v2 , . . .}; allora (ei , v) = vi , quindi se (ei , v) = 0 per ogni i si deve avere vi = 0 per ogni i e quindi v = 0. Teorema 3.1.2. Tutti gli spazi di Hilbert di dimensione infinita che ammettono una base numerabile sono isomorfi a `2 tramite un isomorfismo che conserva le norme. Dimostrazione. sia H uno spazio di Hilbert come nell’ipotesi e sia {fi } una base ortonormale numerabile di H. Se x ∈ H definiamo L(x) = {(fi , x)}∞ i=1 . Dalla disuguaglianza di Bessel segue 2 2 che L(x) ∈ ` per ogni x ∈ H. Dal teorema 1.5.7 segue che L è suriettiva: se {xi }∞ i=1 ∈ ` allora P∞ y = i=1 xi fi è un elemento di H poichè la serie a secondo membro è convergente e si ha (per la continuità del prodotto scalare) ∞ L(y) = {(fi , y)}∞ i=1 = {xi }i=1 (3.1.9) Dall’identità di Parsevall segue che kxkH = kL(x)k`2 , quindi L conserva le norme ed è in particolare iniettiva. In alcuni testi si trova la affermazione ”tutti gli spazi di Hilbert sono isomorfi” poichè le caratteristiche di avere dimensione infinita e di ammettere una base numerabile sono inserite nella definizione di spazi di Hilbert. Definizione 3.1.2. Uno spazio normato si dice separabile se esiste un suo sottoinsieme denso al più numerabile. Teorema 3.1.3. Sia H uno spazio di Hilbert, allora esiste una base ortonormale al più numerabile ⇔ H è separabile. Dimostrazione. ⇐) se H è separabile allora esiste un insieme {vi }∞ i=1 denso in H; da esso si può estrarre per induzione un insieme al più numerabile di vettori indipendenti {wn }n∈N , dove N ⊂ N, tale che ogni vi è esprimibile come combinazione lineare finita di elementi di {wn }n∈N , ma allora lo spazio delle combinazioni lineari finite di elementi di {wn }n∈N contiene l’insieme X = {vi |i ∈ N, i > 0}, in particolare è denso, quindi {wn }n∈N è un insieme completo, quindi una base. A questo punto definiamo Pk−1 wk − i=1 (ei , wk )ei w1 ; · · · ; ek = (3.1.10) e1 = Pk−1 kw1 k kwk − i=1 (ei , wk )ei k (metodo di ortonormalizzazione di Gram-Schmidt) è allora semplice vedere che {en }n∈N è un insieme ortonormale (al più numerabile); vediamo che la definizione precedente ha senso: dimostriamo per induzione la seguente affermazione: i denominatori delle espressioni 3.1.10 non si 52 CAPITOLO 3. SPAZI DI HILBERT ED OPERATORI LINEARI annullano e ogni ek può essere espresso come combinazione lineare di w1 , . . . , wk . Poichè i {wn } sono linearmente indipendenti si deve avere w1 6= 0, quindi la affermazione precedente è vera per (i) (i) k = 1. Supponiamola vera per i ≤ n, allora si ha ei = α1 w1 + · · · + αi wi per ogni i ≤ n; a questo punto se il denominatore della formula 3.1.10 con k = n + 1 si annullasse si dovrebbe avere wn+1 − n X (i) (i) (ei , wn+1 )(α1 w1 + · · · + αi wi ) = 0 (3.1.11) i=1 contro l’ipotesi che i {wn } siano indipendenti, quindi usando 3.1.10 è semplice vedere che l’ipotesi induttiva è vera anche per k = n + 1. Dalle formule 3.1.10 è inoltre immediato vedere che ogni wn può essere espresso come combinazione lineare finita di e1 , . . . , en e che quindi l’insieme {en }n∈N è un insieme completo, quindi una base ortonormale al più numerabile. ⇒) supponiamo ora che {ei }i∈N , N ⊂ N sia una base ortonormale per H e mostriamo che H è separabile. Poichè {ei } è completo l’insieme delle combinazioni lineari finite di elementi di {ei } è denso in H. Definiamo l’insieme Xi = {αei |α = q1 + iq2 , q1 , q2 ∈ Q}; poichè il prodotto cartesiano di due insiemi numerabili è numerabile e Q è numerabile, Xi è numerabile per ogni i ∈ N . Poichè il prodotto cartesiano di un insieme finito di insiemi numerabili è numerabile, l’insieme X (n) = +ni=1 Xi è numerabile e poichè l’unione di una famiglia numerabile di insiemi numerabili è numerabile, l’insieme X = ∪n∈N X (n) è numerabile. Sia ora y = c1 e1 + · · · + cn en e mostriamo che fissato > 0 esiste x ∈ X (n) ⊂ X tale che kx − yk ≤ . Poichè Q è denso in R è semplice mostrare che Q + iQ√è denso in C, quindi per ogni ck è possibile determinare q (k) in Q + iQ tale che |q (k) − ck | < / n, allora se x = q (1) e1 + · · · + q (n) en ∈ X (n) si ha q √ kx − yk = |q (1) − c1 |2 + · · · + |q (n) − cn |2 = 2 ≤ (3.1.12) quindi X è un insieme numerabile che è denso nello spazio delle combinazioni lineari finite degli {ei }, che è a sua volta denso in H, quindi è immediato verificare che X è denso in H. Teorema 3.1.4. Se H è uno spazio separabile allora ogni sottoinsieme composto da vettori ortonormali è al più numerabile. √ Dimostrazione. siano e, e0 due vettori ortonormali distinti, allora ke − e0 k = 2. Poichè H è ∞ separabile esiste √ un insieme di vettori {vi }i=1 denso in H, quindi esiste un v in questo insieme tale che ke − vk < 2/2, ma allora √ √ 2 0 0 0 2 = ke − e k = ke − v + v − e k ≤ ke − vk + kv − e k < + kv − e0 k (3.1.13) 2 √ quindi ke0 − vk > 2/2. Sia ora V un insieme composto da vettori√ortonormali ed associamo ad ogni elemento e ∈ V un elemento ve ∈ {vi }∞ 2/2. Per quanto si è appena i=1 tale che ke − ve k < visto questa corrispondenza deve essere iniettiva, quindi V è al più numerabile. Usando il teorema precedente si può vedere che non tutti gli spazi di Hilbert sono separabili: sia V lo spazio delle combinazioni lineari finite di elementi della forma eiαx , dove α ∈ R e se f, g ∈ V sia Z L 1 f (x)g(x)dx (3.1.14) (f, g) = lim 2L L→∞ −L allora è semplice verificare che (f, g) è un prodotto scalare su V e che (eiαx , eiβx ) = δα,β . Sia Ṽ il completamento di V rispetto alla norma indotta dal prodotto scalare. Poichè V è denso in Ṽ e il prodotto scalare è continuo su V è semplice vedere che si può estendere il prodotto scalare per continuità sullo spazio Ṽ , che diventa cosı̀ uno spazio di Hilbert. D’altra parte l’insieme {eiαx |α ∈ R} è un insieme non numerabile costituito da elementi ortonormali, quindi per il teorema precedente Ṽ cosı̀ definito non può essere uno spazio di Hilbert. 3.1. GEOMETRIA DEGLI SPAZI DI HILBERT 53 Un’altro esempio di spazio di Hilbert non separabile, forse più intuitivo, è il seguente, tratto dal testo [4] della bibliografia: sia H lo spazio delle funzioni P f : 2R → R che non si annullano solo su un insieme al più numerabile di punti {xi } e tali che f (xi ) < ∞, allora se f, g ∈ H e f non si annulla su Xf = {xi }i∈N1 e g non si annulla su Xg = {yi }i∈N2 si può definire X (f, g) = f (x)g(x) (3.1.15) x∈Xf ∪Xg Mostriamo che H cosı̀ definito è uno spazio di Hilbert: sia {fn } una successione di Cauchy in H e supponiamo che ogni fn non si annulli su Xn , allora fissato > 0 esiste N tale che se n, m > N (X = ∪Xn ) X |fn (x) − fm (x)|2 ≤ kfn − fm k2 = (fn − fm , fn − fm ) = (3.1.16) x∈X quindi, fissato x ∈ X, la successione {fn (x)} è una successione di Cauchy in R, quindi converge ad un valore yx . Definiamo la funzione f nel seguente modo 0 se x ∈ /X f (x) = (3.1.17) yx se x ∈ X Sia X = {xi }∞ i=1 , allora si ha (a causa di 3.1.16) M X |fn (xi ) − f (xi )|2 = lim m→∞ i=1 M X |fn (xi ) − fm (xi )|2 ≤ (3.1.18) i=1 P∞ per ogni M ∈ N, quindi kf − fn k = i=1 |fn (x) − f (x)|2 ≤ se n > N (), quindi limn→∞ fn = f e H è uno spazio di Hilbert. A questo punto definiamo per ogni a ∈ R la funzione 1 se x = a fa (x) = (3.1.19) 0 se x 6= a Allora è immediato vedere che (fa , fb ) = δa,b , quindi l’insieme {fa |a ∈ R} è un insieme non numerabile di elementi ortonormali, quindi per il teorema precedente H non può essere separabile. Definizione 3.1.3. Un sottospazio vettoriale chiuso di uno spazio di Hilbert si chiama sottospazio di Hilbert A causa del corollario 1.3.1 ogni sottospazio di dimensione finita di uno spazio di Hilbert è un sottospazio di Hilbert. D’altro canto evidentemente non tutti i sottospazi di uno spazio di Hilbert (di dimensione infinita) sono sottospazi di Hilbert: sia H = L2 (−∞, ∞) e V = Cc∞ (−∞, ∞), allora V è un sottospazio di H, V 6= H, V = H, quindi V 6= V , quindi V non è chiuso e quindi non è un sottospazio di Hilbert. Lemma 3.1.2. Sia H uno spazio di Hilbert e sia {ya }a∈A un insieme di vettori di H, dove A è un insieme di indici (non necessariamente finito o numerabile), allora l’insieme V = {x ∈ H|(x, ya ) = 0 ∀a ∈ A} è un sottospazio di Hilbert di H. Dimostrazione. usando le proprietà di linearità del prodotto scalare è immediato verificare che V è un sottospazio vettoriale di H. Mostriamo che V è chiuso: sia {xn } una successione di elementi di V che converge a x, allora si deve vedere che x ∈ V . Per la continuità del prodotto scalare si ha per ogni a ∈ A (x, ya ) = ( lim xn , ya ) = lim (xn , ya ) = 0 (3.1.20) n→∞ n→∞ quindi x ∈ A. Lemma 3.1.3. Sia H uno spazio di Hilbert e sia V ⊂ H un sottospazio vettoriale, allora V è un sottospazio di Hilbert. 54 CAPITOLO 3. SPAZI DI HILBERT ED OPERATORI LINEARI Dimostrazione. l’insieme V è chiuso per costruzione, si deve quindi solo vedere che è un sottospazio vettoriale. Siano x, y ∈ V , allora esistono due successioni {xn }, {yn } di elementi di V tali che xn → x e yn → y, ma allora si ha xn + yn → x + y, quindi x + y ∈ V poichè {xn + yn } è una successione di elementi di V . Analogamente si vede che x ∈ V ⇒ αx ∈ V . Definizione 3.1.4. Sia X un sottoinsieme non vuoto di uno spazio di Hilbert (o più in generale di uno spazio vettoriale); si dice che X è un insieme convesso se per ogni x, y ∈ X l’insieme xy = {tx + (1 − t)y|0 < t < 1} è contenuto in X (l’insieme xy è il segmento che congiunge x e y). Teorema 3.1.5 (Proiezione su un convesso chiuso). Sia H uno spazio di Hilbert, C ⊂ H un insieme convesso chiuso e x ∈ H, allora esiste un unico punto x0 ∈ C che minimizza kx − x0 k; un tale punto x0 è detto proiezione di x sul convesso chiuso C ed è talora indicato con PC (x). Dimostrazione. dimostriamo innanzitutto l’unicità della proiezione: sia ` = inf y∈C kx − yk e supponiamo per assurdo esistano x1 , x2 distinti in C tali che kx − x1 k = kx − x2 k = `; poichè C è convesso l’insieme {tx1 + (1 − t)x2 |0 < t < 1} è contenuto in C; inoltre kx − tx1 − (1 − t)x2 k2 = kx − x2 + t(x2 − x1 )k2 = = kx − x2 k2 + t2 kx2 − x1 k2 + 2t<(x − x2 , x2 − x1 ) = = `2 + t2 kx2 − x1 k2 + tα (3.1.21) dove nell’ultima espressione α può essere semplicemente determinando usando il fatto che l’ultima espressione deve valere `2 quando t = 1, quindi si ottiene kx − tx1 − (1 − t)x2 k2 = `2 + t2 kx2 − x1 k2 − tkx2 − x1 k2 (3.1.22) a questo punto è immediato vedere che, ad esempio per t = 1/2 , si ha kx − tx1 − (1 − t)x2 k < `, contrariamente alla definizione di `. Dimostriamo ora l’esistenza di un punto x0 ∈ C tale che kx − x0 k = `: sia {xn } una successione di elementi di C tali che ` ≤ kx − xn k ≤ ` + 1/n. Mostriamo che {xn } è una successione di Cauchy: usando la identità del parallelogramma ka + bk2 + ka − bk2 = 2kak2 + 2kbk2 con a = x−xn 2 eb= x−xm 2 (3.1.23) si ottiene 2 2 2 2 x − xn + xm + xn − xm = 2 x − xn + 2 x − xm 2 2 2 2 inoltre il primo termine del membro di sinistra è ≥ `2 poichè xn +xm 2 (3.1.24) ∈ C, quindi si ottiene xn − xm 2 ≤ −`2 + 1 (` + 1 )2 + 1 (` + 1 )2 2 2 n 2 m (3.1.25) e poichè il secondo termine tende a zero se n, m → ∞ è immediato vedere che {xn } è una successione di Cauchy in H, quindi esiste un x0 ∈ H tale che xn → x0 , inoltre, poichè C è chiuso e {xn } è una successione di elementi di C, si ha x0 ∈ C. Passando al limite in ` ≤ kx − xn k ≤ ` + n1 si ottiene kx − x0 k = `, quindi x0 è il punto di minimo cercato. NOTA: in seguito al posto di (x, y) = 0 si scriverà x ⊥ y e si dirà che x e y sono perpendicolari o ortogonali. Se A, B sono due insiemi si scriverà A ⊥ B se per ogni x ∈ A, y ∈ B si ha x ⊥ y. Definizione 3.1.5. Sia H uno spazio di Hilbert e V ⊂ H un insieme; si indica con V ⊥ l’insieme costituito dagli elementi ortogonali a V Qualunque insieme sia V , dal lemma 3.1.2 segue che V ⊥ è un sottospazio di Hilbert. 3.2. OPERATORI E FUNZIONALI LINEARI 55 Teorema 3.1.6 (della proiezione ortogonale). Sia H uno spazio di Hilbert e H 0 un sottospazio di Hilbert, allora ogni x ∈ H si scompone in modo unico come x = x0 + x00 dove x0 ∈ H 0 e x00 ⊥ H 0 ; x0 è la proiezione di x su H 0 . Dimostrazione. dimostriamo innanzitutto l’unicità della scomposizione: sia x = x0 + x00 = y 0 + y 00 , dove x0 , y 0 ∈ H 0 e x00 , y 00 ⊥ H 0 , allora si avrebbe x0 − y 0 = y 00 − x00 dove però si ha (x0 − y 0 ) ∈ H 0 e (y 00 − x00 ) ⊥ H 0 , quindi si otterrebbe (x0 − y 0 ) ∈ H 0 ∩ (H 0 )⊥ , quindi (x0 − y 0 , x0 − y 0 ) = 0 e quindi x0 = y 0 , da cui segue anche x00 = y 00 . Dato ora x ∈ H sia x0 la proiezione di x su H 0 (che è evidentemente convesso e chiuso) e definiamo x00 = x − x0 ; allora evidentemente x = x0 + x00 e resta da mostrare che x00 ⊥ H 0 . Sia ora y 0 ∈ H 0 tale che ky 0 k = 1 e sia α ∈ C, allora si ha (per la definizione di proiezione) kx00 k2 = kx − x0 k2 ≤ kx − x0 − αy 0 k2 = kx00 k2 + |α|2 − 2<{α(x − x0 , y 0 )} (3.1.26) a questo punto si può scegliere α = (x − x0 , y 0 ), ottenendo quindi kx00 k2 ≤ kx00 k2 − |α|2 , quindi α = 0, quindi (x00 , y 0 ) = (x − x0 , y 0 ) = 0, cioè x00 è perpendicolare a ogni y 0 ∈ H 0 tale che ky 0 k = 1; è quindi immediato vedere che x00 ⊥ H 0 . Definizione 3.1.6. Sia H uno spazio di Hilbert e H1 , H2 , H3 sottospazi vettoriali. Si dice che H1 è la somma diretta di H2 e H3 e si scrive H1 = H2 ⊕ H3 se H1 = H2 + H3 e H2 ⊥ H3 . Dal teorema della proiezione ortogonale segue che se V è un sottospazio di Hilbert di H allora si ha H = V ⊕ V ⊥ . 3.2 Operatori e funzionali lineari Definizione 3.2.1. Siano V1 , V2 due spazi vettoriali, ∆T ⊂ V1 un sottospazio e T : ∆T → V2 . Si dice che T è un operatore lineare se per ogni α, β ∈ C, x, y ∈ ∆T si ha T (αx + βy) = αT (x) + βT (y) (3.2.1) per ogni operatore lineare si definisce il suo nucleo ker T = {x ∈ ∆T | T (x) = 0}. Per gli operatori lineari è uso comune scrivere T x al posto di T (x) qualora questo non generi equivoci ed anche quı̀ si userà quindi questa convenzione Teorema 3.2.1. Siano (X, k kX ), (Y, k kY ) due spazi normati e sia T : X → Y un operatore lineare, allora sono equivalenti i seguenti fatti: 1. T è continuo 2. T è continuo in 0 3. T (B(0, 1)) è un insieme limitato in Y 4. T è lipschitziano Dimostrazione. 1⇒2) ovvia. 2⇒3) poichè T è continuo in 0, esiste un δ > 0 tale che se x ∈ B(0, δ) ⊂ X allora T x ∈ B(0, 1) ⊂ Y . Sia ora x ∈ X, x 6= 0, allora si ha δ x < δ (3.2.2) 2kxkX X quindi kT (δx/[2kxkX ])kY < 1 e quindi kT xkY < 2δ kxkX . È inoltre evidente che questa disuguaglianza vale anche se x = 0, quindi se kxkX < 1 si ha kT xkY < 2/δ. 56 CAPITOLO 3. SPAZI DI HILBERT ED OPERATORI LINEARI 3⇒4) supponiamo che se kxkX < 1 allora kT xkY < K, allora si ha, per ogni y 6= 0 y <K T 2kykX (3.2.3) quindi per ogni y ∈ X si ha kT ykY < 2KkykX , quindi kT x − T ykY = kT (x − y)kY < 2Kkx − ykY (3.2.4) per ogni x, y ∈ X, quindi T è lipschitziana 4⇒1) discende dal fatto generale che ogni funzione lipschitziana è continua. Definizione 3.2.2. Siano (X, k kX ), (Y, k kY ) spazi normati e sia T : X → Y un operatore lineare, si definisce norma dell’operatore lineare il valore kT k = kT xkY = sup kT xkY x∈X,x6=0 kxkX kxkX =1 sup (3.2.5) un operatore lineare T si dice limitato se kT k < +∞. Lemma 3.2.1. Siano (X, k kX ), (Y, k allora T è continuo ⇔ T è limitato. kY ) spazi normati e sia T : X → Y un operatore lineare, Dimostrazione. ⇒) se T è continuo, per il teorema precedente esso è anche lipschitziano, quindi in particolare esiste K ≥ 0 tale che kT xkY ≤ KkxkX , quindi si vede subito che kT k ≤ K. ⇐) se T è limitato allora kT k ≤ K < +∞ e quindi kT xkY ≤ KkxkX quindi T è lipschitziano e quindi è continuo. Lemma 3.2.2. Sia (X, k kX ) uno spazio normato di dimensione finita, (Y, k normato e T : X → Y un operatore lineare, allora T è limitato. kY ) uno spazio Dimostrazione. sia e1 , · · · , en una base su X e definiamo una nuova norma su X: definiamo kx1 e1 + · · · + xn en k1 = |x1 | + · · · + |x2 |. Poichè la limitatezza è equivalente alla continuità e in dimensione finita tutte le norme sono equivalenti basta ora mostrare che T è limitato tra (X, k k1 ) e (Y, k kY ), ma si ha kT (x1 e1 + · · · + xn en )kY = kx1 T (e1 ) + · · · + xn T (en )kY ≤ ≤ kx1 T (e1 )kY + · · · + kxn T (en )kY = |x1 | kT (e1 )kY + · · · + |xn | kT (en )kY ≤ ≤ K(|x1 | + · · · + |xn |) = Kkx1 e1 + · · · + xn en k1 (3.2.6) dove K = max{kT (e1 )kY , . . . , kT (en )kY }, quindi kT k ≤ K. In dimensione infinita il lemma precedente è falso: consideriamo come X lo spazio delle funzioni limitate con derivata limitata con la norma kf kX = supx∈R |f (x)|; sia Y lo spazio delle funzioni limitate con la norma kf kY = supx∈R |f (x)| e come operatore lineare scegliamo la derivata: T f = f 0 . È semplice vedere che T tra i due spazi (X, k kX ), (Y, k kX ) non è limitato; per mostrarlo vediamo che non è continuo: consideriamo la successione di funzioni fn = n1 sin nx, allora è immediato vedere che fn → 0 in X ma kT fn kY = 1, quindi non si può avere T fn → 0 e T non è quindi continuo. Se su X si introduce invece la norma kf k0 = supx∈R |f (x)| + supx∈R |f 0 (x)| allora kT f kY ≤ kf k0 e quindi T è continuo tra (X, k k0 ) e (Y, k kY ) e si ha kT k ≤ 1. Lemma 3.2.3. Siano (X, k kX ), (Y, k limitato, allora per ogni x ∈ X si ha kY ) spazi normati e sia T : X → Y un operatore lineare kT xkY ≤ kT k kxkX inoltre kT k = inf{K ≥ 0| kT xkY ≤ KkxkX ∀x ∈ X}. (3.2.7) 3.2. OPERATORI E FUNZIONALI LINEARI 57 Dimostrazione. la relazione 3.2.7 segue immediatamente da 3.2.5. Sia ora |T | = inf{K ≥ 0| kT xkY ≤ KkxkX ∀x ∈ X}. Dalla relazione 3.2.7 segue che |T | ≤ kT k. Dalla definizione segue semplicemente che |T | = inf{K ≥ 0| kT xkY ≤ K se kxkX = 1} ed è quindi immediato vedere che |T | ≥ supkxkX =1 kT xkY = kT k. Teorema 3.2.2. Siano (X, k kX ), (Y, k kY ) spazi normati, allora lo spazio L(X, Y ) degli operatori lineari da X in Y è uno spazio normato; se inoltre (Y, k kY ) è uno spazio di Banach allora L(X, Y ) è uno spazio di Banach. Dimostrazione. usando la definizione 3.2.2 è immediato vedere che L(X, Y ) è uno spazio normato. Sia ora {Tn } una successione di Cauchy di operatori lineari continui, allora per ogni > 0 esiste un N () tale che se n, m > N si ha kTn − Tm k < , quindi per ogni x ∈ X si ha kTn (x) − Tm (x)kY ≤ kxkX , quindi per ogni fissato x ∈ X la successione {Tn (x)} è una successione di Cauchy in Y , che è uno spazio di Banach, quindi esiste un yx tale che limn→∞ Tn (x) = yx . Sia T : X → Y l’operatore (che si dovrà vedere essere lineare e continuo) T x = yx , allora si ha T (αx + βy) = lim [Tn (αx + βy)] = α lim Tn (x) + β lim Tn (y) = αT (x) + βT (y) n→∞ n→∞ n→∞ (3.2.8) quindi T è un operatore lineare. Inoltre si ha, se n, m > N che kTn x − Tm xkY ≤ kxkX da cui, passando al limite per m → ∞ si ottiene kTn x − T xkY ≤ kxkX e quindi kTn − T k < , quindi T = limn→∞ T e L(X, Y ) è uno spazio di Banach. Definizione 3.2.3. Sia V uno spazio vettoriale. Si chiama funzionale lineare su V un operatore lineare φ tale che φ : V → C. Se (X, k kX ) è uno spazio normato, lo spazio dei funzionali lineari continui di X si chiama spazio duale di X. In taluni testi lo spazio duale ora definito viene indicato con il nome di duale topologico, per distinguerlo dal duale algebrico, che è lo spazio dei funzionali lineari non necessariamente continui su X. Teorema 3.2.3 (di rappresentazione di Riesz). Sia H uno spazio di Hilbert e φ un funzionale lineare continuo su H, allora esiste un unico x0 ∈ H tale che φ(x) = (x0 , x), inoltre kφk = kx0 k. Dimostrazione. sia H 0 = ker φ, allora, poichè φ è continuo, è semplice mostrare che H 0 è un sottospazio di Hilbert di H. A questo punto si possono presentare due casi 1) H = H 0 , 2) H 6= H 0 . Nel primo caso φ = 0 e quindi il teorema è evidentemente verificato da x0 = 0. Nel secondo caso esiste un x̄ ∈ H tale che x̄ ∈ / H 0 ; per il teorema della proiezione ortogonale si ha x̄ = x0 + x00 , dove 0 0 00 0 x ∈ H e x ⊥ H e, poichè x̄ ∈ / H 0 , si deve avere x00 6= 0. Poniamo y = xφ(x00 ) − x00 φ(x), allora si 0 ha φ(y) = 0, quindi y ∈ H e quindi y ⊥ x00 , cioè 0 = (x00 , xφ(x00 ) − x00 φ(x)) = (x00 , x)φ(x00 ) − kx00 k2 φ(x) (3.2.9) da cui si deduce, poichè x00 6= 0, che φ(x) = x00 φ(x00 ), x kx00 k = (x0 , x) (3.2.10) vediamo ora che x0 è unico: se fosse φ(x) = (x0 , x) = (y0 , x), allora si avrebbe anche (x0 −y0 , x) = 0 per ogni x ∈ H, quindi in particolare (x0 − y0 , x0 − y0 ) = 0 e x0 = y0 . Inoltre per la disuguaglianza di Schwartz si ha |φ(x)| = |(x0 , x)| ≤ kx0 k kxk, quindi kφk ≤ kx0 k, ma si ha anche |φ(x0 )| = kx0 k2 , quindi kφk = kx0 k. Tramite il teorema di Riesz si può mostrare che ogni spazio di Hilbert è riflessivo ( vedi appendice C) Sia H uno spazio di Hilbert e sia T : H → H un operatore lineare continuo, fissato y ∈ H definiamo φTy (x) = (y, T x) (3.2.11) 58 CAPITOLO 3. SPAZI DI HILBERT ED OPERATORI LINEARI è immediato vedere che φTy è un funzionale lineare, inoltre |φTy (x)| ≤ kyk kT xk ≤ kyk kT k kxk, quindi kφTy k ≤ kyk kT k e quindi φTy è un funzionale lineare continuo. Per il teorema precedente esiste allora un unico y ∗ ∈ H tale che φTy (x) = (y ∗ , x), cioè tale che per ogni x ∈ H si abbia (y ∗ , x) = (y, T x) (3.2.12) è inoltre immediato verificare che (αy1 + βy2 )∗ = αy1∗ + βy2∗ , quindi l’operatore T + : H → H tale che T + y = y ∗ è un operatore lineare. Definizione 3.2.4. Sia H uno spazio di Hilbert e T : H → H un operatore lineare continuo, allora si definisce l’operatore aggiunto di T come l’unico operatore lineare T + : H → H tale che (T + y, x) = (y, T x) per ogni x, y ∈ H (un tale T + esiste per la discussione precedente) Lemma 3.2.4. Siano (X, k kX ), (Y, k kY ), (Z, k operatori lineari continui, allora kT Lk ≤ kT k kLk. kZ ) spazi normati e L : X → Y , T : Y → Z Dimostrazione. per ogni x ∈ X si ha k(T L)(x)kZ = kT (L(x))kZ ≤ kT k kL(x)kY ≤ kT k kLk kxkX (3.2.13) da cui la tesi. Lemma 3.2.5. Sia H uno spazio di Hilbert e T : H → H un operatore lineare continuo, allora T + è continuo e si ha kT k = kT + k. Dimostrazione. si ha kT + yk2 = (T + y, T + y) = (y, T T + y) ≤ kyk kT T + yk ≤ kyk kT k kT + yk (3.2.14) quindi kT + yk ≤ kyk kT k per ogni y ∈ H e quindi kT + k ≤ kT k, quindi T + è limitato. Si può allora definire (T + )+ = T ++ ed è semplice vedere che T ++ = T , infatti si deve avere per ogni x, y ∈ H (T ++ y, x) = (y, T + x) = (T + x, y) = (x, T y) = (T y, x) (3.2.15) quindi (T ++ y − T y, x) = 0 per ogni x, y, quindi in particolare (T ++ y − T y, T ++ y − T y) = 0 per ogni y, quindi T ++ y = T y per ogni y e T ++ = T , quindi usando il fatto che kT + k ≤ kT k si ottiene kT k = kT ++ k ≤ kT + k. Lemma 3.2.6. Sia H uno spazio di Hilbert e T : H → H un operatore lineare continuo, allora kT k2 = kT + T k. Dimostrazione. si ha kT + T k ≤ kT + k kT k = kT k2 per i due lemmi precedenti, inoltre per ogni x ∈ H si ha kT xk2 = (T x, T x) = (x, T + T x) ≤ kxk kT + T xk ≤ kxk2 kT + T k (3.2.16) quindi kT k ≤ (kT + T k)1/2 , cioè kT k2 ≤ kT + T k. Se (X, k kX ), (Y, k kY ) sono spazi normati, la norma di un operatore lineare è stata definita fino ad ora solo per operatori T : X → Y ma ovviamente se ∆T è un sottospazio di X e T : ∆T → Y è un operatore lineare si può definire kT k = sup x∈∆T ,x6=0 kT xkY = sup kT xkY = inf{K ≥ 0| kT xkY ≤ KkxkX ∀x ∈ ∆T } (3.2.17) kxkX x∈∆T ,kxk=1 ciò poichè se (X, k kX ) è uno spazio normato e ∆T ⊂ X è un sottospazio di X, allora (∆T , k è anch’esso uno spazio normato. kX ) Teorema 3.2.4. Sia H uno spazio di Hilbert, V un sottospazio vettoriale denso di H e T : V → H un operatore lineare continuo, allora T può essere esteso per continuità in modo unico ad un operatore lineare T̃ : H → H tale che T̃ |V = T e kT k = kT̃ k. 3.3. PROIETTORI 59 Dimostrazione. mostriamo innanzitutto che se {vn } è una successione di elementi di V che converge in H, allora {T vn } è una successione convergente in H: si ha infatti kT vn − T vm k = kT (vn − vm )k ≤ kT k kvn − vm k (3.2.18) quindi {T vn } è una successione di Cauchy (poichè {vn } è una successione di Cauchy) e quindi converge in H. Vediamo ora che se {vn }, {wn } sono due successioni di elementi di V tali che vn → v e wn → v e T vn → x, T wn → y, allora x = y: fissato > 0, se n è abbastanza grande si ha kx − yk = kx − T vn + T vn − T wn + T wn − yk ≤ kx − T vn k + ky − T wn k + 2 +kT vn − T wn k ≤ + kT k kvn − wn k ≤ 3 2 2 + kT k kvn − v + v − wn k ≤ + kT k(kvn − vk + kwn − vk) ≤ 3 3 (3.2.19) per l’arbitrarietà di > 0 si ha allora kx − yk = 0 e x = y. Sia ora x ∈ H, allora, poichè V è denso in H, esiste una successione {vn } di elementi di V tale che {vn → x}; da quanto precede segue che ha senso definire T̃ x = lim T vn (3.2.20) n→∞ siano α, β ∈ C, x, y ∈ H e {vn }, {wn } successioni di elementi di V tali che vn → x e wn → y, allora è immediato vedere che αvn + βwn → αx + βy e si ha quindi T̃ (αx + βy) = lim T (αvn + βwn ) = α lim T vn + β lim T wn = αT̃ (x) + β T̃ (y) n→∞ n→∞ n→∞ (3.2.21) cioè T̃ è un operatore lineare. Se v ∈ V si ha T̃ v = limn→∞ T v = T v quindi T̃ |V = T , quindi si ha kT̃ k = sup x∈H,kxk=1 kT̃ xk ≥ sup x∈V,kxk=1 kT̃ xk = sup kT xk = kT k (3.2.22) x∈V,kxk=1 Inoltre se {vn } è una successione di elementi di V tale che vn → x, per la continuità della norma e per la 3.2.20 si kvn k → kxk e kT vn k → kT xk ma si ha (almeno definitivamente se x 6= 0) kT vn k kvn k ≤ kT k quindi kT̃ xk kT vn k = lim ≤ kT k n→∞ kvn k kxk (3.2.23) quindi kT̃ k ≤ kT k. Il teorema precedente è un caso particolare della seguente affermazione, che si dimostra in modo sostanzialmente identico: siano (X, k kX ), (Y, k kY ) due spazi normati di cui il secondo è completo; sia V ⊂ X un sottoinsieme di X e f : V → Y una funzione uniformemente continua, allora f può essere estesa per continuità in modo unico ad una funzione f˜ uniformemente continua su V tale che f˜|V = f . 3.3 Proiettori Definizione 3.3.1. sia H uno spazio di Hilbert e P : H → H un operatore. Si dice che P è un proiettore se esiste un sottospazio di Hilbert H 0 di H tale che, per ogni x ∈ H, P x è la proiezione di x su H 0 . Teorema 3.3.1. sia P un proiettore, allora si ha 1. P è lineare e limitato 2. P 2 = P 60 CAPITOLO 3. SPAZI DI HILBERT ED OPERATORI LINEARI 3. P + = P Dimostrazione. 1) vediamo innanzitutto che P è lineare: siano x, y ∈ H e siano x = x0 + x00 , y = y 0 + y 00 dove x0 , y 0 ∈ H 0 e x00 , y 00 ∈ H 0⊥ , allora si ha αx0 + βy 0 ∈ H 0 e αx00 + βy 00 ∈ H 0⊥ e poichè la scomposizione αx + βy = z 0 + z 00 , dove z 0 ∈ H 0 e z 00 ∈ H 0⊥ , è unica e αx + βy = (αx0 + βy 0 ) + (αx00 + βy 00 ), si ha z 0 = αx0 + βy 0 e quindi P (αx + βy) = αx0 + βy 0 = αP x + βP y, quindi P è lineare, inoltre kP xk2 = kx0 k2 ≤ kx0 k2 + kx00 k2 = kx0 + x00 k2 = kxk2 (3.3.1) quindi kP k ≤ 1. Inoltre se H 0 6= {0} (o equivalentemente P 6= 0) si ha per ogni x ∈ H 0 che P x = x, quindi kP k = 1 in questo caso; se invece H 0 = {0}, allora P = 0 e kP k = 0. 2) P 2 x = P P x = P x0 = x0 , quindi P 2 = P 3) per ogni x, y ∈ H si ha (y, P x) = (y, x0 ) = (y 0 + y 00 , x0 ) = (y 0 , x0 ) = (P y, x0 ) = (P y, x0 + x00 ) = (P y, x) (3.3.2) quindi (P y, x) = (P + y, x) per ogni x, y ∈ H, quindi (P y − P + y, x) = 0 per ogni x, y, in particolare (P y − P + y, P y − P + y) = 0 per ogni y, quindi P y = P + y per ogni y e P = P + . Per mostrare che P = P + nel precedente teorema si è usato il fatto elementare che se A è un operatore lineare e (Ax, y) = 0 per ogni x, y ∈ H allora A = 0; un risultato analogo a questo che può talvolta risultare utile è il seguente: Lemma 3.3.1. Sia V uno spazio vettoriale con prodotto scalare su C, A : V → V un operatore lineare tale che per ogni x ∈ V si abbia (Ax, x) = 0, allora A = 0. Dimostrazione. siano x, y ∈ V , allora si ha (A(x + y), x + y) = 0 cioè (Ax, y) = −(Ay, x) (3.3.3) Usando la precedente uguaglianza si ottiene per ogni x, y (Ax, iy) = i(Ax, y) = −i(Ay, x) = i(Ay, x) = (iAy, x) = (A(iy), x) (3.3.4) poichè la funzione y → iy è biunivoca su V si ottiene quindi (Ax, y) = (Ay, x) per ogni x, y ∈ V , da cui, usando 3.3.3, si ottiene (Ax, y) = 0 per ogni x, y e quindi A = 0 Nel teorema precedente l’ipotesi che V sia uno spazio vettoriale su C non è eliminabile: sia v ∈ R3 e consideriamo il prodotto scalare euclideo, allora per ogni x ∈ R3 si ha (v × x, x) = 0 ma non è vero che v × x = 0 per ogni x. Daremo ora alcune caratterizzazioni dei proiettori in uno spazio di Hilbert. Teorema 3.3.2. Sia P : H → H un operatore lineare tale che P 2 = P , e (P x, y) = (x, P y) [se si sapesse già che P è limitato si potrebbe dire che P = P + ] allora P è un proiettore. Dimostrazione. mostriamo innanzitutto che P è un operatore limitato: kP xk2 = (P x, P x) = (x, P 2 x) = (x, P x) ≤ kxk kP xk (3.3.5) quindi kP xk ≤ kxk e quindi kP k ≤ 1. Sia ora V = {x ∈ H|P x = x}; poichè P è un operatore lineare V è un sottospazio vettoriale, poichè P è continuo V è quindi un sottospazio di Hilbert di H. Sia PV la proiezione su V e mostriamo che P = PV , che concluderà il teorema. Per costruzione si ha P = PV su V . Se z ∈ H, allora P z ∈ V , infatti P (P z) = P z; sia ora x ∈ V ⊥ , allora PV x = 0 e si ha kP xk2 = (P x, P x) = (x, P 2 x) = (x, P x) (3.3.6) ma P x ∈ V e x ∈ V ⊥ , quindi kP xk = 0 e quindi P x = 0, quindi P = PV anche su V ⊥ . Poichè per il teorema della proiezione ortogonale ogni x ∈ H può essere scritto cone x = x0 + x00 dove x0 ∈ V e x00 ∈ V ⊥ e sia P che PV sono operatori lineari, si ha P = PV su H. 3.3. PROIETTORI 61 Dal teorema precedente segue anche che se P è un proiettore allora lo spazio su cui P ”proietta” è lo spazio {x ∈ H|P x = x}; inoltre questo spazio coincide con P (H) (vedi il successivo lemma 3.3.2). Teorema 3.3.3. Sia P : H → H un operatore lineare limitato tale che P 2 = P e che (x − P x, P x) = 0 per ogni x ∈ H, allora P è un proiettore. Dimostrazione. sia V = {x ∈ H|P x = x}, allora V è un sottospazio di Hilbert e sia PV la proiezione su V . Per costruzione di V si ha P = PV su V . Dato z ∈ H, allora P z ∈ V poichè P (P z) = P z, inoltre da (z − P z, P z) = 0 segue che (P z, P z) = (z, P z); sia ora x ∈ V ⊥ , allora si ha kP xk2 = (P x, P x) = (x, P x) = 0 (3.3.7) quindi P x = 0 e P = PV anche su V ⊥ . Si conclude quindi come nel teorema precedente. Corollario 3.3.1. Sia P : H → H un operatore lineare limitato tale che P 2 = P e che ImP ⊥ ker P , allora P è un proiettore [ ImP = P (H) ]. Dimostrazione. basta mostrare che per ogni x ∈ H si ha (x − P x, P x) = 0, ma P x ∈ ImP e P (x − P x) = P x − P 2 x = P x − P x = 0, quindi x − P x ∈ ker P e l’uguaglianza precedente è soddisfatta. Lemma 3.3.2. Sia T : H → H un operatore (non necessariamente lineare) tale che T = T 2 , allora ImT = {x ∈ H|T x = x}. Dimostrazione. evidentemente {x ∈ H|T x = x} ⊂ ImT . Sia ora y ∈ ImT , allora esiste un x ∈ H tale che y = T x, ma allora T y = T 2 x = T x = y, quindi ImT ⊂ {x ∈ H|T x = x}. Teorema 3.3.4. Sia P : H → H un operatore lineare tale che P 2 = P e kP k ≤ 1 (in effetti da P 2 = P segue P = 0 o kP k ≥ 1, quindi questa ipotesi è equivalente a kP k = 0 o kP k = 1), allora P è un proiettore. Dimostrazione. per il corollario 3.3.1 basta mostrare che ImP ⊥ ker P ; notiamo innanzitutto che a causa della continuità di P e del lemma precedente sia ImP che ker P sono sottospazi di Hilbert di H. Dato x ∈ H, definendo y = P x − x, si ha y ∈ ker P ; se in particolare x ∈ (ker P )⊥ allora P x = x + y con x ⊥ y e quindi kP xk2 = kxk2 + kyk2 , ma kP k ≤ 1, quindi si deve avere kP xk2 ≤ kxk2 , quindi si deve avere y = 0, cioè P x = x, quindi x ∈ ImP , quindi (ker P )⊥ ⊂ ImP . Sia ora z ∈ ImP , quindi z = P z; inoltre z può essere scritto come z = z 0 + z 00 , dove z 0 ∈ ker P 00 e z ∈ (ker P )⊥ , quindi z = P z = P z 0 + P z 00 = P z 00 , ma si è appena visto che (ker P )⊥ ⊂ ImP , quindi P z 00 = z 00 , quindi z = z 00 e quindi z ∈ (ker P )⊥ e ImP ⊂ (ker P )⊥ , che conclude. Si analizzeranno ora le proprietà di stabilità della classe dei proiettori. Teorema 3.3.5. Siano P1 , P2 proiettori, H1 = ImP1 e H2 = ImP2 . Allora P = P1 P2 è un proiettore ⇔ P1 P2 = P2 P1 ed in questo caso si ha ImP = H1 ∩ H2 . Dimostrazione. ⇒) se P è un proiettore si deve avere P = P + per il teorema 3.3.1, quindi si deve avere P = P1 P2 = P + = (P1 P2 )+ = P2+ P1+ = P2 P1 . ⇐) se P1 P2 = P2 P1 allora si ha P + = (P1 P2 )+ = P2+ P1+ = P2 P1 = P1 P2 = P e inoltre P 2 = (P1 P2 )(P1 P2 ) = P1 (P2 P1 )P2 = P1 (P1 P2 )P2 = (P1 P1 )(P2 P2 ) = P12 P22 = P1 P2 = P (3.3.8) inoltre evidentemente P è lineare e limitato, quindi per il teorema 3.3.2 P è un proiettore. Se x ∈ ImP allora si deve avere x = P x = P1 (P2 x) = P2 (P1 x), quindi x ∈ H1 ∩ H2 , inoltre se x ∈ H1 ∩ H2 allora P x = P1 (P2 x) = P1 x = x, quindi x ∈ ImP , che conclude la dimostrazione. Lemma 3.3.3. Siano P1 , P2 , H1 = ImP1 e H2 = ImP2 , allora P1 P2 = 0 ⇔ H1 ⊥ H2 ⇔ P2 P1 = 0. 62 CAPITOLO 3. SPAZI DI HILBERT ED OPERATORI LINEARI Dimostrazione. basta mostrare la prima equivalenza poichè la seconda si ottiene scambiando P1 e P2 e usando la simmetria della relazione ⊥. ⇒) siano x1 ∈ H1 e x2 ∈ H2 , allora si ha (x1 , x2 ) = (P1 x1 , P2 x2 ) = (x1 , P1 P2 x2 ) = (x1 , 0) = 0 (3.3.9) ⇐) siano x, y ∈ H, allora si ha (x, P1 P2 y) = (P1 x, P2 y) = 0 (3.3.10) poichè P1 x ∈ H1 e P2 y ∈ H2 . Dalla generalità di x, y segue P1 P2 = 0. Teorema 3.3.6. Siano P1 , . . . , Pn proiettori aventi per immagine i sottospazi H1 , . . . , Hn , allora P = P1 + · · · + Pn è un proiettore ⇔ Pi Pj = Pi δi,j cioè (per il lemma precedente) se Hi ⊥ Hj quando i 6= j. In questo caso si ha anche ImP = ⊕ni=1 Hi . Dimostrazione. ⇒) supponiamo che P sia un proiettore, allora si ha per ogni x ∈ H ! n X 2 2 2 kxk ≥ kP xk = (P x, P x) = (x, P x) = (x, P x) = x, Pi x = = i=1 n X n n n X X X (x, Pi x) = (x, Pi2 x) = (Pi x, Pi x) = i=1 i=1 i=1 (3.3.11) kPi xk2 i=1 Se in particolare si sceglie x = P1 y si ottiene kP1 yk2 ≥ kP1 P1 yk2 + n X kPi P1 yk2 = kP1 yk2 + i=2 n X kPi P1 yk2 (3.3.12) i=2 quindi Pi P1 = 0 se i 6= 1. In generale se si pone x = Pj y si ottiene Pi Pj = 0 se i 6= j. ⇐) Si ha P + = (P1 + · · · + Pn )+ = P1+ + · · · + Pn+ = P1 + · · · + Pn = P n n n X X X P 2 = (P1 + · · · + Pn )2 = Pi (P1 + · · · + P2 ) = Pi2 = Pi = P i=1 i=1 (3.3.13) (3.3.14) i=1 quindi per il teorema 3.3.2 P è un proiettore. Sia HP = ImP ; se x ∈ H, allora si ha P x = P1 x + · · · + Pn x ∈ H1 + · · · + Hn , quindi HP ⊂ H1 + · · · + Hn . Inoltre se xi ∈ Hi si ha (poichè Hi ⊥ Hj se i 6= j) P (x1 + · · · + xn ) = P (x1 ) + · · · + P (xn ) = (P1 + · · · + Pn )x1 + · · · + (3.3.15) +(P1 + · · · + Pn )xn = P1 x1 + · · · + Pn xn = x1 + · · · + xn quindi H1 + · · · + Hn ⊂ HP e, poichè Hi ⊥ Hj se i 6= j, si ha HP = ⊕ni=1 Hi . Lemma 3.3.4. P è un proiettore ⇔ I − P è un proiettore. Dimostrazione. ⇒ (I − P )+ = I + − P + = I − P e inoltre (I − P )2 = I 2 − 2IP + P 2 = I − 2P + P = I − P (3.3.16) quindi I − P è un proiettore ⇐) P = I − (I − P ), quindo applicando la prima parte si conclude. Teorema 3.3.7. Siano P1 , P2 proiettori e H1 = ImP1 , H2 = ImP2 , allora P = P1 − P2 è un proiettore ⇔ (I − P1 )P2 = 0 e ImP = H1 H2 (definito nella dimostrazione) 3.4. PARTICOLARI CLASSI DI OPERATORI 63 Dimostrazione. per il lemma precedente P è un proiettore se e solo se I − (P1 − P2 ) è un proiettore, ma I − (P1 − P2 ) = (I − P1 ) + P2 e applicando il teorema 3.3.6 si vede che quest’ultimo è un proiettore se e solo se (I − P1 )P2 = 0. Quest’ultima condizione equivale ovviamente a P2 = P1 P2 , da cui segue subito che H2 ⊂ H1 ; inoltre nel caso in cui questa uguaglianza valga si ha anche P2 = P2+ = (P1 P2 )+ = P2 P1 , quindi vale anche P1 P2 = P2 P1 . Sia ora x ∈ H, allora x = ⊥ ⊥ x1 + x⊥ 1 , dove x1 ∈ H1 e x1 ∈ H1 , allora si ha P1 x = x1 e P2 x = P1 P2 x = P2 P1 x = P2 x1 , quindi (P1 − P2 )x = x1 − P2 x1 = (I − P2 )x1 . Se x1 ∈ H1 si può scrivere x1 = x0 + x00 , dove x0 ∈ H1 ∩ H2 e x00 ∈ H1 ∩ H2⊥ quindi (P1 − P2 )x = (I − P2 )x1 = x1 − P2 x1 = x1 − x0 = x00 , quindi Im(P1 − P2 ) ⊂ H1 ∩ H2⊥ . D’altro canto se y ∈ H1 ∩ H2⊥ si ha (P1 − P2 )y = (I − P2 )y = y e quindi H1 ∩ H2⊥ ⊂ ImP . Si definisce complemento ortogonale di H2 rispetto a H1 l’insieme H1 H2 = H1 ∩ H2⊥ . [L’ultima parte della dimostrazione si può svolgere in modo più intuitivo nel seguente modo: si è visto che H2 ⊂ H1 ed inoltre su H1 l’operatore P1 agisce come l’identità, quindi P1 − P2 proietta sul complemento ortogonale di H2 rispetto ad H1 , cioè su H1 H2 ] 3.4 Particolari classi di operatori Definizione 3.4.1. Sia H uno spazio di Hilbert e U : H → H un operatore (non necessariamente lineare) tale che U (H) = H e che per ogni x, y ∈ H si abbia (U x, U y) = (x, y). Si dice allora che U è un operatore unitario. Nel caso di spazi su R gli operatori unitari sono in genere detti operatori ortogonali. Lemma 3.4.1. Sia U un operatore unitario, allora U è lineare. Dimostrazione. si deve mostrare che U (αx) = αU (x) e che U (x + y) = U (x) + U (y). Mostriamo la prima uguaglianza essendo la dimostrazione della seconda analoga. kU (αx) − αU (x)k2 = (U (αx) − αU (x), U (αx) − αU (x)) = = (U (αx), U (αx)) − α(U (αx), U (x)) − α(U (x), U (αx)) + |α|2 (U (x), U (x)) = = (αx, αx) − α(αx, x) − α(x, αx) + |α|2 (x, x) = 2|α|2 (x, x) − 2|α|2 (x, x) = 0 (3.4.1) Nel lemma precedente non si è usato il fatto che U (H) = H, quindi esso vale per una classe più ampia di operatori degli operatori unitari. In effetti in molti testi l’ipotesi U (H) = H non compare nella definizione di operatore unitario Lemma 3.4.2. Se U è un operatore unitario allora U è limitato, biunivoco e U −1 è un operatore unitario. Dimostrazione. da (U x, U y) = (x, y) segue in particolare, ponendo x = y, che kU xk = kxk, quindi kU k = 1 e U è limitato. Inoltre si ha kx − yk2 = (x − y, x − y) = (U (x − y), U (x − y)) = (3.4.2) = (U (x) − U (y), U (x) − U (y)) = kU (x) − U (y)k2 da cui segue che U x = U y ⇔ x = y, quindi U è iniettiva; poichè U è suriettiva per definizione si ottiene che U è biunivoca. Inoltre vale l’uguaglianza (U −1 (x), U −1 (y)) = (U U −1 (x), U U −1 y) = (x, y) (3.4.3) quindi U −1 è anch’esso un operatore unitario. Lemma 3.4.3. Sia H uno spazio di Hilbert e U : H → H un operatore lineare tale che U (H) = H e kU xk = kxk, allora U è un operatore unitario. 64 CAPITOLO 3. SPAZI DI HILBERT ED OPERATORI LINEARI Dimostrazione. ricordiamo la formula di polarizzazione del prodotto scalare: 4(x, y) = kx + yk2 − kx − yk2 + ikx − iyk2 − ikx + iyk2 (3.4.4) allora usando la linearità di U e l’ipotesi kU xk = kxk si ottiene 4(U x, U y) = kU (x + y)k2 − kU (x − y)k2 + ikU (x − iy)k2 − ikU (x + iy)k2 = = kx + yk2 − kx − yk2 + ikx − iyk2 − ikx + iyk2 = 4(x, y) (3.4.5) quindi (U x, U y) = (x, y); usando l’ipotesi U (H) = H si ottiene che U è unitario. Lemma 3.4.4. Sia U un operatore limitato, allora U è unitario ⇔ U (H) = H e U + = U −1 . Dimostrazione. ⇒) si ha per ogni x, y (U + x, y) = (x, U y) = (U −1 x, U −1 U y) = (U −1 x, y) (3.4.6) quindi U −1 = U + . ⇐) Se U + = U −1 allora per ogni x, y si ha (U x, U y) = (x, U + U y) = (x, U −1 U y) = (x, y) (3.4.7) e quindi da U (H) = H segue che H è unitario. Definizione 3.4.2. Siano H1 , H2 spazi di Hilbert, V : H1 → H2 un operatore tale che V (H1 ) = H2 e (V x, V y) = (x, y) (ovviamente il prodotto scalare a sinistra è quello di H2 mentre quello a destra è quello di H1 ), allora V si dice operatore isometrico (o più semplicemente isometria). Per gli operatori isometrici valgono proprietà analoghe a quelle mostrate per gli operatori unitari. Dal teorema 3.1.2 segue quindi che se H è uno spazio di Hilbert separabile allora esiste V : H → `2 operatore isometrico. Definizione 3.4.3. Sia T : H → H un operatore lineare. λ ∈ C si dice autovalore di T se esiste v ∈ H, v 6= 0 tale che T v = λv; se λ è un autovalore di T e v ∈ H è un vettore tale che è soddisfatta l’uguaglianza T v = λv si dice che v è un autovettore di T corrispondente all’autovalore λ. L’insieme degli autovettori corrispondenti all’autovalore λ (che si verifica subito essere uno spazio vettoriale) si chiama autospazio dell’autovalore λ. L’insieme degli autovalori di T si chiama spettro puntuale di T . Definizione 3.4.4. Sia T : H → H un operatore limitato. Si dice che T è autoaggiunto se T = T + ; si dice che T è normale se T T + = T + T . Lemma 3.4.5. Se T è un operatore autoaggiunto allora tutti gli eventuali autovalori sono reali. Dimostrazione. supponiamo esista x 6= 0 tale che T x = λx, allora si ha (x, λx) = (x, T x) = (T x, x) = (λx, x) = (x, λx) (3.4.8) quindi (x, λx) ∈ R, ma (x, λx) = λkxk2 , quindi λ ∈ R. Il lemma precedente si può anche ottenere come corollario del seguente, poichè ogni operatore autoaggiunto è evidentemente normale. Lemma 3.4.6. Sia T un operatore normale, allora da T x = λx segue T + x = λx. Dimostrazione. si ha 0 = kT x − λxk2 = (T x − λx, T x − λx) = ((T − λI)x, (T − λI)x) = = ((T + − λI)(T − λI)x, x) = ((T − λI)(T + − λI)x, x) = = ((T + − λI)x, (T + − λI)x) = kT + x − λxk2 e quindi T + x = λx. (3.4.9) 3.4. PARTICOLARI CLASSI DI OPERATORI 65 Lemma 3.4.7. Se T è un operatore normale autovettori relativi ad autovalori distinti sono perpendicolari. Dimostrazione. supponiamo T x = λx, T y = µy e λ 6= µ, allora si ha λ(y, x) = (y, λx) = (y, T x) = (T + y, x) = (µy, x) = µ(y, x) (3.4.10) e poichè λ 6= µ si ha (y, x) = 0. Definizione 3.4.5. Sia V uno spazio vettoriale, V1 ⊂ V un sottospazio vettoriale e T : V → V un operatore lineare. Si dice che V1 è un sottospazio invariante per T se T (V1 ) ⊂ V1 . Se V1 è un sottospazio invariante ha senso considerare la restrizione T |V1 : V1 → V1 . Quello che segue è il teorema spettrale del corso di Geometria I. Teorema 3.4.1 (Teorema spettrale normale). Sia H uno spazio di Hilbert di dimensione finita e T : H → H un operatore normale, allora esiste una base ortonormale per lo spazio vettoriale H composta da autovettori di T (cioè T è diagonalizzabile). Dimostrazione. in dimensione finita λ è un autovalore se e solo se det(T − λI) = 0, quindi per il teorema fonadamentale dell’algebra esiste almeno un autovalore λ1 . Sia H1 = {x ∈ H|T x = λ1 x} l’autospazio associato a λ1 ; evidentemente H1 è invariante per T ; vediamo ora che H1 è invariante anche per T + : se x ∈ H1 allora T (T + x) = T T + x = T + T x = T + (λx) = λ(T + x) (3.4.11) quindi T + x ∈ H1 . Lemma 3.4.8. Sia H 0 ⊂ H un sottospazio vettoriale, allora H 00 = (H 0 )⊥ è invariante per T ⇔ H 0 è invariante per T + . Dimostrazione. siano x0 ∈ H 0 , x00 ∈ H 00 , allora (T x00 , x0 ) = (x00 , T + x0 ), quindi si ha (T x00 , x0 ) = 0 per ogni x0 ∈ H 0 (cioè H 00 è invariante per T ) ⇔ (x00 , T + x0 ) = 0, cioè T + x0 ∈ H 0 per ogni x0 ∈ H 0 , cioè se H 0 è invariante per T + . dal lemma segue dunque che H2 = H1⊥ è invariante per T . Indicheremo ora con il pedice 0 le restrizioni a H2 ; mostriamo che T0 : H2 → H2 è normale: per fare ciò mostriamo preliminarmente che (T0 )+ = (T + )0 : se x, y ∈ H2 allora ((T0 )+ x, y) = (x, T0 y) = (x, T y) = (T + x, y) = ((T + )0 x, y) (3.4.12) quindi (T0 )+ e (T + )0 coincidono su H2 . Si ha per ipotesi T T + = T + T , quindi restringendosi ad H2 si ha (T T + )0 = (T + T )0 cioè T0 (T + )0 = (T + )0 T0 ed usando quanto appena visto si ha T0 (T0 )+ = (T0 )+ T0 , quindi T0 è normale. A questo punto si può effettuare la dimostrazione per induzione su n = dimH. Se n = 1 allora si ha H = H1 ed il teorema è mostrato. Supponiamo il teorema dimostrato fino a dimH = n e vediamo che è vero anche per dimH = n + 1: poichè per costruzione H1 6= {0}, allora dimH1 ≥ 1 e quindi, poichè per il teorema della proiezione si ha H = H1 ⊕ H2 (si ricordi che in dimensione finita tutti i sottospazi sono sottospazi di Hilbert), si deve avere dimH2 ≤ n, quindi per l’ipotesi induttiva esiste una base ortonormale V2 di H2 composta di autovettori di T ; inoltre ogni base ortonormale di H1 è evidentemente composta di autovettori di T , quindi esiste una base ortonormale V1 di H1 di autovettori di T . Poichè H = H1 ⊕ H2 si vede subito che V1 ∪ V2 è una base ortonormale di H composta di autovettori di T . 66 CAPITOLO 3. SPAZI DI HILBERT ED OPERATORI LINEARI Mentre in dimensione finita esistono sempre autovalori (vedi la dimostrazione del teorema precedente), in dimensione infinita ciò non è vero: consideriamo in `2 l’operatore lineare limitato T (x1 , . . . , xn , . . .) = (0, x1 , . . . , xn , . . .). Sia v ∈ `2 un vettore tale che T v = λv, allora si dovrebbe avere (0, v1 , . . . , vn , . . .) = λ(v1 , . . . , vn , . . .); se λ = 0 allora evidentemente v = 0, quindi 0 non può essere un autovalore. Se λ 6= 0 allora si deve avere vn+1 = λ1 vn e v1 = 0, quindi vn = 0 per ogni n e v = 0. Di conseguenza l’operatore lineare T non ha autovalori. Definizione 3.4.6. Sia V uno spazio vettoriale e T : V → V un operatore lineare; un polinomio p(x) = xn + · · · + a1 x + a0 si dice polinomio minimo di T se è il polinomio di grado più basso tale che l’operatore p(T ) = T n + · · · + a1 T + a0 I è identicamente nullo su V . Per il calcolo effettivo degli autovalori può risultare utile il seguente teorema. Teorema 3.4.2. Sia T un operatore lineare e sia p(x) il suo polinomio minimo, allora λ è autovalore ⇔ p(λ) = 0. Dimostrazione. ⇒) Sia T x = λx con x 6= 0, allora si ha T 2 x = T (T x) = T (λx) = λT x = λ2 x e più in generale T n x = λn x; se p è il polinomio minimo di T allora p(T ) = 0, quindi in particolare p(T )x = 0 (si ricordi che p(T ) è un operatore lineare), ma è immediato vedere che p(T )x = p(λ)x (si noti che P (T ) è un operatore lineare mentre p(λ) è uno scalare), quindi si ha p(λ)x = 0 e poichè x 6= 0 si ha p(λ) = 0. Qk ⇐) sia p(T ) = i=1 (x−λi ) il polinomio minimo; poichè vale (T −λi I)(T −λj I) = (T −λj I)(T − Qk Qk λi I) si ha p(T ) = i=1 (T − λi I). Poichè p è il polinomio minimo, si deve avere i=2 (T − λi I) 6= 0, Qk Qk quindi esiste x tale che i=2 (T − λi I)x = y 6= 0, ma allora si ha (T − λ1 I)y = i=1 (T − λi I)x = p(T )x = 0, quindi T y = λ1 y e quindi λ1 è un autovalore di T . Analogamente si vede che per ogni i il numero λi è un autovalore. Definizione 3.4.7. Sia H uno spazio di Hilbert e T : H → H un operatore lineare. T si dice operatore compatto (in alcuni testi completamente continuo) se per ogni successione limitata {xi }i esiste una sottosuccessione di {T xi }i che converge. Un modo equivalente per esprimere la precedente definizione è dire che un operatore lineare è compatto se per ogni insieme A limitato l’insieme T (A) è un insieme compatto. Lemma 3.4.9. Sia T un operatore compatto, allora T è limitato. Dimostrazione. supponiamo per assurdo che T non sia limitato, allora esiste una successione {xn } tale che kxn k ≤ 1 e limn→∞ kT xn k = +∞, in particolare non esiste nessuna sottosuccessione convergente della successione {T xn }, contraddicendo l’ipotesi che T sia compatto. Lemma 3.4.10. Se A è un operatore compatto e B è un operatore limitato allora AB e BA sono operatori compatti. Dimostrazione. sia {xn } una successione tale che kxn k ≤ M , allora kBxn k ≤ kBkM quindi la successione {Bxn } è una successione limitata, quindi {ABxn } ammette una sottosuccessione convergente poichè A è compatto, quindi AB è compatto. Sia ora {yi } una successione limitata; poichè A è compatto esiste una sottosuccessione yik tale che {Ayik } sia convergente e poichè B è continuo la successione BAyik è ancora convergente, quindi BA è un operatore compatto. Teorema 3.4.3. Un operatore lineare limitato è compatto se e solo se il suo aggiunto è compatto. Dimostrazione. poichè (T + )+ = T basta vedere che da T compatto segue T + compatto. Sia {xn } una successione limitata; per il lemma precedente T T + è compatto, quindi esiste una sottosuccessione {T T + xik } convergente. Mostriamo ora che {T + xik } è una successione di Cauchy, da cui segue che è convergente e che quindi T + è compatto: si ha kT + xik − T + xij k2 = (T + (xik − xij ), T + (xik − xij )) = = (xik − xij , T T + (xik − xij )) ≤ kxik − xij k kT T + (xik − xij )k ≤ 2M kT T + (xik − xij )k = 2M kT T + xik − T T + xij k (3.4.13) 3.4. PARTICOLARI CLASSI DI OPERATORI 67 e poichè {T T + xik } è una successione di Cauchy si conclude. Lemma 3.4.11. Sia T : H → H un operatore lineare limitato tale che dimT (H) < +∞ (si dice che T ha rango finito) allora T è compatto. Dimostrazione. sia {xn } una successione limitata di H, allora {T xn } è una successione limitata di T (H) (poichè kT xn k ≤ kT k kxn k) e poichè T (H) ha dimensione finita in esso vale il teorema di Bolzano-Weierstrass, quindi ogni successione limitata in T (H) ammette una sottosuccessione convergente. In particolare {T xn } ammette una sottosuccessione convergente. Teorema 3.4.4. sia {Tk } una successione di operatori compatti e T un operatore lineare tale che kT − Tk k → 0, allora T è un operatore compatto. Dimostrazione. sia {xi } una successione limitata. Poichè T1 è compatto esiste una sottosuccessione (1) (1) {xi } tale che {T xi } converge. Procedendo per induzione supponiamo di avere una sottosuc(n−1) (n−1) (n−1) cessione {xi } di {xi } tale che {Tn−1 xi } converga, allora si può estrarre da {xi } una (n) (n) sottosuccessione {xi } tale che {Tn xi } converga. In questo modo si ottiene un insieme di suc(n) (n+1) (n) (n) cessioni {xi } tale che si ha {xi } ⊂ {xi } e che per ogni n la successione {Tn xi } converge. (i) (i) Consideriamo ora la successione {xi } e mostriamo che T xi converge: notiamo innanzitutto che (i) (i) per ogni n la successione {Tn xi }i converge poichè se i ≥ n allora {xi } è una sottosuccessione di (n) {xi }i . Inoltre si ha (m) (m) (m) (n) (n) (n) (m) kT x(n) n − T xm k = kT xn − Tk xn + Tk xn − Tk xm + Tk xm − T xm k ≤ (m) (n) (n) ≤ kT − Tk k kxn k + kTk xn − Tk xm k + kT − Tk k kx(m) m k (n) (3.4.14) (m) fissato > 0, se k è abbastanza grande si ha kT − Tk k ≤ ; inoltre kxn k, kxm k ≤ M poichè (i) (n) la successione iniziale {xi } è limitata e, poichè {Tk xi } converge, se n, m > N si ha kTk xn − (n) (m) Tk xm k ≤ quindi l’espressione 3.4.14 è minore di (2M + 1) e quindi T xn è una successione di Cauchy. Rπ Corollario 3.4.1. Sia T : L2 (0, π) → L2 (0, π) definito da (T f )(x) = 0 k(x, y)f (y)dy, dove k ∈ L2 ([0, π] × [0, π]), allora T è un operatore compatto. Dimostrazione. vediamo innanzitutto che T è limitato: sia T f = g, allora per la disuguaglianza di Schwartz si ha Z π Z π Z π |g(x)|2 ≤ |k|2 dy |f |2 dy = kf k2 |k|2 dy (3.4.15) quindi Z 2 kgk = π 0 0 2 2 0 Z π Z π |g| dx ≤ kf k 0 0 |k|2 dxdy = kf k2 kkk2 (3.4.16) 0 quindi si ottiene kT k ≤ kkk. Vediamo ora che l’insieme {sin px sin qy}p,q∈N è completo L2 ([0, π] × [0, π]): sia f (x, y) ∈ 2 L ([0, π] × [0, π]), allora per il teorema di Fubini per quasi ogni y ∈ [0, π] si ha f ∈ L2x (0, π), quindi se (f, sin px sin qy) = 0 per ogni p, q, allora Z πZ π Z π Z π 0= f (x, y) sin px sin qydxdy = f (x, y) sin pxdx sin qydy (3.4.17) 0 0 0 0 Rπ quindi, poichè {sin qy}q∈N è completo in L2y (0, π), la funzione 0 f (x, y) sin pxdx (che è in L2y per la disuguaglianza di Schwarz) è nulla per quasi ogni y ∈ [0, π], quindi, per la completezza di {sin px}p∈N in L2x (0, π), si ottiene che per quasi ogni y e quasi ogni x si ha f (x, y) = 0 e quindi f = 0 in L2 ([0, π] × [0, π]) che conclude la dimostrazione della completezza di {sin px sin qy}p,q∈N . 68 CAPITOLO 3. SPAZI DI HILBERT ED OPERATORI LINEARI Poichè k ∈ L2 ([0, π] × [0, π]) per quanto visto esistono coefficienti apq tali che N X apq sin px sin qy → k(x, y) in L2 (3.4.18) p,q=1 Sia ora Z π (TN f )(x) = 0 N X apq sin px sin qyf (y)dy (3.4.19) p,q=1 a causa della somma su un numero finito di termini questo operatore ha rango finito e quindi (vedi lemma 3.4.11) è un operatore compatto. Verifichiamo ora che kT − TN k → 0, che concluderà la dimostrazione a causa del teorema precedente. Sia f tale che kf k = 1, allora Z [(T − TN )f ](x) = N X π [k(x, y) − 0 apq sin px sin qy]f (y)dy (3.4.20) p,q=1 e quindi (per la disuguaglianza di Schwarz) Z π k(T − TN )f k2 ≤ Z π |k(x, y) − 0 0 N X apq sin px sin qy|2 dxdy = kk(x, y) − p,q=1 N X apq sin px sin qyk2 p,q=1 (3.4.21) quindi si otttiene infine kT − TN k = sup k(T − Tn )f k ≤ kk(x, y) − kf k=1 N X apq sin px sin qyk → 0 (3.4.22) p,q=1 Gli operatori del tipo di quello del corollario precedente sono detti operatori di Hilbert-Schmidt. Lemma 3.4.12. Sia Tk : L2 (0, π) → L2 (0, π) definito da (Tk f )(x) = k ∈ L2 ([0, π] × [0, π]), allora (Tk )+ = Tψ dove ψ(x, y) = k(y, x). Rπ 0 k(x, y)f (y)dy, dove Dimostrazione. per ogni f, g ∈ L2 (0, π) si ha Z π Z πZ π (Tk f, g) = (Tk f )(x)g(x)dx = k(x, y)f (y)g(x)dxdy = 0 0 0 Z πZ π Z π = ψ(y, x)g(x)f (y)dxdy = (Tψ g)(y)f (y)dy = (f, Tψ g) 0 0 (3.4.23) 0 da cui la tesi. Rπ Corollario 3.4.2. Sia T : L2 (0, π) → L2 (0, π) definito da (T f )x = 0 k(x, y)f (y)dy, dove k ∈ L2 ([0, π] × [0, π]) e k(x, y) = k(y, x), allora T è un operatore compatto autoaggiunto. Segue ora una serie di lemmi che serviranno nella dimostrazione del teorema spettrale compatto autoaggiunto nel caso di uno spazio di Hilbert generico. Lemma 3.4.13. Sia T : H → H un operatore limitato, allora kT k = supkxk=kyk=1 |(x, T y)|. Dimostrazione. si ha per la disuguaglianza di Cauchy-Schwarz, se kxk = kyk = 1, |(x, T y)| ≤ kxk kT yk ≤ kT k kyk = kT k (3.4.24) 3.4. PARTICOLARI CLASSI DI OPERATORI 69 quindi supkxk=kyk=1 |(x, T y)| ≤ kT k. D’altra parte se kxk = 1 e T x 6= 0 si ha kT xk2 = (T x, T x) = kT xk( Tx , T x) = kT xk(a, T x) kT xk (3.4.25) dove kak = 1, quindi kT xk ≤ supkak=kxk=1 |(a, T x)|. Lemma 3.4.14. Sia T : H → H un operatore limitato autoaggiunto, allora kT k = sup |(x, T x)| (3.4.26) kxk=1 Dimostrazione. come nel lemma precedente si vede subito che supkxk=1 |(x, T x)| ≤ kT k. Notiamo ora che per ogni x, y si ha (x, T y) = |(x, T y)|eiθ e quindi |(x, T y)| = (x, T (ye−iθ )), quindi si ha in particolare sup |(a, T b)| = sup (x, T y) (3.4.27) kak=kbk=1 kxk=kyk=1,(x,T y)∈R Siano ora x, z tali che kxk = kzk = 1 e (x, T z) ∈ R, allora si ha (x, T z) = (T x, z) = (z, T x) quindi 2(x, T z) = (x, T z) + (z, T x) = ≤ 1 [(x + z, T (x + z)) − (x − z, T (x − z))] ≤ 2 1 [|(x + z, T (x + z))| + |(x − z, T (x − z)|)] ≤ 2 1 ≤ kx + zk2 |(a, T a)| + kx − zk2 |(b, T b)| 2 (3.4.28) x+z x−z dove a = kx+zk e b = kx−zk e quindi kak = kbk = 1. Sia ora S = supkak=1 |(a, T a)|, allora si ha (usando l’identità del parallelogramma) 2(x, T z) ≤ 1 1 S[kx + zk2 + kx − zk2 ] = S[2kxk2 + 2kzk2 ] = 2S 2 2 (3.4.29) quindi (x, T z) ≤ S, quindi usando 3.4.27 ed il lemma precedente si ottiene kT k ≤ S che conclude. Teorema 3.4.5. Sia T : H → H un operatore compatto autoaggiunto, allora esite un autovalore λ tale che |λ| = kT k. Dimostrazione. per il lemma precedente esiste una successione {xn } tale che kxn k = 1 e |(xn , T xn )| → kT k. Notiamo inoltre che per ogni x si ha (x, T x) ∈ R poichè (x, T x) = (T x, x) = (x, T + x) = (x, T x) (3.4.30) quindi da |(xn , T xn )| → kT k segue semplicemente che almeno una delle due seguenti affermazioni è vera: 1. esiste una sottosuccessione {xni } tale che (xni , T xni ) → kT k 2. esiste una sottosuccessione {xni } tale che (xni , T xni ) → −kT k Per semplicità di notazione continueremo a chiamare {xn } una qualunque delle due sottosuccessioni precedenti. Sia quindi {xn } tale che kxn k = 1 e (xn , T xn ) → λ, dove |λ| = kT k, allora si ha kT xn − λxn k2 = kT xn k2 + |λ|2 kxn k2 − 2λ(xn , T xn ) ≤ kT k2 + kT k2 − 2λ(xn , T xn ) (3.4.31) e l’ultimo membro tende a 0, quindi T xn − λxn → 0 (3.4.32) 70 CAPITOLO 3. SPAZI DI HILBERT ED OPERATORI LINEARI Poichè T è compatto esiste una sottosuccessione {zn } di {xn } tale che {T zn } converge, ma allora, per 3.4.32, anche {λzn } quindi anche {zn } converge (a rigore questo è vero solo se λ 6= 0, ma se λ = 0 allora kT k = 0 e quindi T = 0 ed il teorema è ovvio) ad un valore z tale che kzk = limn→∞ kzn k = 1, quindi in particolare z 6= 0. Poichè T è limitato si ha allora lim T zn = T lim zn = T z, ma da 3.4.32 segue che lim T zn = lim λzn (poichè entrambi i limiti esistono), quindi T z = λz e poichè z 6= 0 si ottiene che λ è un autovalore. Lemma 3.4.15. Sia T : H → H un operatore compatto e sia λ 6= 0 un autovalore, allora l’autospazio Hλ relativo all’autovalore λ ha dimensione finita (si dice anche che λ ha degenerazione finita). Dimostrazione. supponiamo per assurdo che Hλ abbia dimensione infinita, allora esiterebbe una successione di vettori ortonormali {ek } in Hλ e quindi si avrebbe kT ei − T ej k2 = kλei − λej k2 = |λ|2 kei − ej k2 = 2|λ|2 δij (3.4.33) quindi nessuna sottosuccessione di {T ei } può essere una successione di Cauchy, in particolare nessuna sottosuccessione di {T ei } può essere convergente, contrariamente all’ipotesi che T sia un operatore compatto. Nel teorema seguente si supporrà che H abbia dimensione infinita in quanto il caso di dimensione finita è già stato trattato nel caso degli operatori normali. Teorema 3.4.6 (Teorema spettrale compatto autoaggiunto). Sia T : H → H un operatore compatto autoaggiunto, allora vale uno dei seguenti enunciati: 1. T ha un numero finito di autovalori distinti non nulli λ1 , . . . , λn , H = ker T ⊕ H1 ⊕ · · · ⊕ Hn dove Hi è l’autospazio relativo a λi , quindi esiste una base ortonormale {ei }N i=1 di P PN (ker T )⊥ composta di autovettori di T e si ha T x = i=1 [λi j eλj i (eλj i , x)] dove eλj i sono gli autovettori relativi a λi 2. T ha una infinità numerabile di autovettori non nulli che possono essere ordinati in modo che ⊥ limi→∞ λi = 0, H = ker T ⊕∞ esiste una ortonormale {ei }∞ i=1 Hi e quindiP i=1 di (ker T ) P base ∞ λi λi composta di autovettori di T e si ha T x = i=1 [λi j ej (ej , x)] Dimostrazione. per il teorema 3.4.5 esiste un autovalore λ1 tale che |λ1 | = kT k; sia H1 il suo autospazio; per il lemma precedente H1 ha dimensione finita e sia quindi {e1 , . . . , en } una base ortonormale di H1 . Sia ora H 0 = H1⊥ e mostriamo che H 0 è un sottospazio invariante per T : se x0 è tale che (x0 , ei ) = 0 per ogni i, allora si ha (T x0 , ei ) = (x0 , T ei ) = (x0 , λei ) = λ(x0 , ei ) = 0 (3.4.34) e quindi anche T x0 ∈ H 0 . Ha quindi senso considerare la restrizione T |H 0 : H 0 → H 0 e chiamiamo T 0 = T |H 0 . È evidente dalla definizione che T 0 è compatto. Inoltre procedendo come nel precedente teorema spettrale si vede che (T 0 )+ = (T + )|H 0 e quindi che T 0 = T |H 0 = (T + )|H 0 = (T 0 )+ e quindi anche T 0 è compatto e autoaggiunto, quindi esiste un secondo autovalore λ2 tale che |λ2 | = kT 0 k ≤ kT k. Procedendo per induzione in modo analogo si ottiene una successione di autovalori {λi } tale che |λ1 | ≥ |λ2 | ≥ · · · ≥ |λn | · · · ed indichiamo con Hi i rispettivi autospazi. A questo punto si presentano due possibilità 1. esiste H 0 = (H1 ⊕ · · · ⊕ Hn )⊥ tale che T |H 0 = 0 2. non esiste H 0 = (H1 ⊕ · · · ⊕ Hn )⊥ tale che T |H 0 = 0 Nel caso (1) si ha allora evidentemente H 0 = ker T e quindi H = ker T ⊕ H1 ⊕ · · · ⊕ Hn . Poichè tutti gli autospazi relativi ad autovettori distinti sono ortogonali, una base per (ker T )⊥ può essere costruita dall’unione delle basi dei diversi autospazi H1 , . . . , Hn ; sia {ei }N i=1 una tale base, allora 3.4. PARTICOLARI CLASSI DI OPERATORI 71 PN per ogni x ∈ H si ha x = x0 + i=1 ei (ei , x), dove x0 ∈ ker T ; applicando T a questa uguaglianza e ricordando che gli ei sono autovettori si ottiene l’uguaglianza della tesi. Nel caso (2) si ottiene una successione infinita {λi } di autovalori non nulli. Vediamo che limn→∞ λn = 0: sia {xn } una successione ortonormale di vettori tali che xn ∈ Hn e supponiamo per assurdo che per ogni n si abbia |λn | ≥ δ > 0, allora la successione { λxnn } sarebbe una successione limitata e si avrebbe 1 1 xn T = T (xn ) = λn xn = xn (3.4.35) λn λn λn ma per costruzione kxn − xm k2 = 2δn,m , quindi non esisterebbe nessuna sottosuccessione convergente di {T (xn /λn )}, contrariamente all’ipotesi che T sia un operatore compatto, quindi si conclude che limn→∞ λn = 0. Sia {e1 , . . . , eN } una base di H1 ⊕ · · · ⊕ Hn e sia xn la proiezione di x ∈ H su (H1 ⊕ · · · ⊕ Hn ), PN cioè xn = x − i=1 ei (ei , x), allora kxn k ≤ kxk e kT xn k = kT 0 xn k ≤ kT 0 k kxn k ≤ |λn+1 | kxn k ≤ |λn+1 | kxk (3.4.36) e l’ultimo membro tende a 0 se n → ∞. Sostituendo xn con il suo valore si ottiene quindi ! N X ei (ei , x) → 0 (3.4.37) Tx − T i=1 A questo punto supponiamo per semplicità di notazione che i λi non indichino più l’insieme degli autovalori distinti, ma l’insieme di tutti gli autovalori ognuno contato con la propria molteplicità (la dimensione dell’autospazio relativo) e supponiamo quindi che T ei = λi ei , allora si ha (ricordando che gli autovalori di un operatore autoaggiunto sono tutti reali) ! N N N X X X ei (ei , x) = (ei , x)T ei = λi ei (ei , x) = (3.4.38) T i=1 = i=1 N X (λi ei , x)ei = i=1 i=1 N X (T ei , x)ei = i=1 N X (ei , T x)ei i=1 quindi il limite 3.4.37 diventa N X (ei , T x)ei → T x (3.4.39) i=1 P∞ ∞ cioè {ei }∞ x − i=1 ei (ei , x), allora i=1 (una base di ⊕i=1 Hi ) è una base per ImT . Sia ora y = P ∞ da quanto precede segue che T y = 0, quindi y ∈ ker T e da x = y + i=1 ei (ei , x) e dal fatto che autovettori relativi ad autovalori distinti sono ortogonali (si noti che ker T è l’autospazio dell’eventuale autovalore 0) segue che H = ker T ⊕∞ T all’identità x = y + i=1 Hi . Applicando P P ∞ ∞ e (e , x) e usando il fatto che gli e sono autovalori si ottiene T x = i i=1 i i i=1 λi ei (ei , x) (questa è l’identità della tesi, solo scritta in un altro modo). Supponiamo ora che λ sia un autovalore di T , allora si deve avere, per quanto visto, Tx = ∞ X λi ei (ei , x) = λx = λy + i=1 ∞ X λei (ei , x) (3.4.40) i=1 da cui si ottengono immediatamente due possibili casi 1. λ = 0 e (ei , x) = 0 per ogni i (cioè x ∈ ker T ) 2. λ = λi , y = 0 e x ∈ Hi Da ciò segue che gli unici possibili autovalori (possibili poichè non è a priori detto che non si abbia ker T = {0}) di T sono 0 ed i vari λi , che conclude la dimostrazione. 72 CAPITOLO 3. SPAZI DI HILBERT ED OPERATORI LINEARI Corollario 3.4.3. Sia T : H → H un operatore compatto autoaggiunto, allora esiste una base ortonormale di H composta da autovettori di T . Dimostrazione. nel teorema precedente si è vista l’esistenza di una base ortonormale al più numerabile di (ker T )⊥ . A questo punto una base ortonormale per H è data dall’unione di una base ortonormale di ker T e di {ei } (ovviamente se H non è separabile questa base non è numerabile, quindi la base di ker T non è numerabile e quindi ker T è uno spazio non separabile, in particolare ha dimensione infinita). Teorema 3.4.7. Siano A, B : H → H due operatori compatti autoaggiunti tali che AB = BA, allora esiste una base ortonormale al più numerabile {ei } di (ker A∩ker B)⊥ composta da autovettori comuni ad A e B. Dimostrazione. per il teorema spettrale A ha al più una infinità numerabile di autovettori {λi } non nulli e se si indicano con Hi i relativi autospazi si ha H = ker A ⊕i Hi ; inoltre per il lemma 3.4.15 ogni Hi ha dimensione finita. Consideriamo l’autospazio Hi e sia x ∈ Hi , cioè Ax = λi x, allora si ha A(Bx) = B(Ax) = B(λi x) = λi Bx (3.4.41) quindi Bx ∈ Hi e quindi B(Hi ) ⊂ Hi , cioè Hi è un sottospazio invariante per B. Sia ora Bi = B|Hi ; procedendo come nel teorema spettrale è semplice vedere che Bi è compatto e autoaggiunto. Per il corollario 3.4.3 esiste allora una base ortonormale di Hi , sia essa Vi , composta di autovettori di B che, poichè sono contenuti in un autospazio di A, sono anche evidentemente autovettori di A. Poichè autospazi relativi ad autovalori differenti sono ortogonali, l’insieme V = ∪Vi è una base ortonormale per ⊕i Hi = (ker A)⊥ e poichè ogni Hi ha dimensione finita V è al più numerabile. Sia ora x ∈ ker A, allora si ha A(Bx) = B(Ax) = 0, quindi Bx ∈ ker A, quindi ker A è uno spazio invariante per B; definendo B0 = B|ker A si vede nuovamente che B0 è compatto e autoaggiunto e quindi applicando il teorema spettrale si ottenene una base ortonormale numerabile W di ker A ∩ (ker B)⊥ composta di autovettori di B, che sono anche autovettori di A relativi all’autovalore 0. Sempre poichè autovettori relativi ad autovalori distinti sono ortogonali si vede quindi che W ∪ V è una base ortonormale al più numerabile per (ker A)⊥ ⊕ [ker A ∩ (ker B)⊥ ] (3.4.42) composta da autovettori comuni di A e B. Vediamo ora che (ker A)⊥ ⊕ [ker A ∩ (ker B)⊥ ] = (ker A ∩ ker B)⊥ . Questo discende dal fatto più generale che se X, Y sono due sottospazi di Hilbert di H si ha (X ∩ Y )⊥ = X ⊥ ⊕ X ∩ Y ⊥ (basta porre X = ker A, Y = ker B). [Un modo sbagliato di dimostrare questa uguaglianza è X ∩ Y ⊕ (X ∩ Y )⊥ = H = X ⊥ ⊕ X = X ⊥ ⊕ X ∩ H = ⊥ ⊥ ⊥ = X ⊕ X ∩ (Y ⊕ Y ) = X ⊕ X ∩ Y ⊕ X ∩ Y (3.4.43) ⊥ dove si è però usato il fatto X ∩ (Y ⊕ Y ⊥ ) = X ∩ Y ⊕ X ∩ Y ⊥ che non è in generale vero: consideriamo in C2 i sottospazi X = span{e1 }, Y = span{e1 − e2 } e Y ⊥ = span{e1 + e2 }, allora si ha X ∩ (Y ⊕ Y ⊥ ) = X 6= {0} mentre X ∩ Y ⊕ X ∩ Y ⊥ = {0}] Per mostrare (X ∩ Y )⊥ = X ⊥ ⊕ X ∩ Y ⊥ si può procedere nel seguente modo: sia v ∈ (X ∩ Y )⊥ , allora v = x0 + x00 , dove x0 ∈ X e x00 ∈ X ⊥ ; poichè v e x00 sono perpendicolari a X ∩ Y , si deve avere anche x0 ∈ (X ∩ Y )⊥ e, poichè x0 ∈ X, è semplice verificare che x0 ∈ X ∩ Y ⊥ , quindi (X ∩ Y )⊥ ⊂ X ⊥ ⊕ X ∩ Y ⊥ ; l’inclusione inversa è immediata da mostrare. Lemma 3.4.16. Siano A, B : H → H due operatori compatti, allora A + B è un operatore compatto. 3.4. PARTICOLARI CLASSI DI OPERATORI 73 Dimostrazione. sia {xn } una successione limitata, allora esiste una sua sottosuccessione {xnk } tale che {Axnk } converga. D’altro canto {xnk } è una successione limitata, quindi esiste una sua sottosuccessione {xnki } tale che {Bxnki } sia una successione convergente; inoltre {xnki } è una sottosuccessione di {xnk }, quindi in particolare si ha anche che {Axnki } è convergente, ma allora {(A + B)xnki } è una successione convergente e quindi A + B è un operatore compatto. Corollario 3.4.4 (Teorema spettrale compatto normale). Sia N : H → H un operatore compatto normale, allora esiste una base ortonormale numerabile di (ker N )⊥ composta da autovettori comuni a N e N + . Dimostrazione. definiamo i due operatori N − N+ N + N+ ;B = (3.4.44) 2 2i per il lemma 3.4.16 A, B sono operatori compatti ed è semplice vedere che sono autoaggiunti: + N + N+ N + + N ++ N + N+ + A = = =A = 2 2 2 + −1 N − N+ −1 + N − N+ = B+ = (N − N + )+ = (N − N ) = =B (3.4.45) 2i 2i 2i 2i A= inoltre usando il fatto che N N + = N + N è immediato vedere che AB = BA, quindi per il teorema 3.4.7 esiste una base ortonormale al più numerabile di (ker A ∩ ker B)⊥ composta da autovettori {ei } comuni ad A e B. Poichè N = A + iB e N + = A − iB, si vede subito che gli {ei }, essendo autovettori di A e B, sono anche autovettori di N e N + . Inoltre usando 3.4.44 e N = A + iB, N + = A − iB è immediato vedere che ker A ∩ ker B = ker N ∩ ker N + . Vediamo infine che ker N = ker N + , che concluderà il teorema. Si ha infatti per ogni x ∈ H kN xk2 = (N x, N x) = (x, N + N x) = (x, N N + x) = (N + x, N + x) = kN + xk2 (3.4.46) e quindi N x = 0 ⇔ N + x = 0. Anche se non lo si è specificato nelle ipotesi mentre nel teorema spettrale compatto autoaggiunto lo spazio H poteva anche essere uno spazio vettoriale su R, poichè gli autovalori di un operatore autoaggiunto sono reali, nel caso del teorema spettrale compatto normale è essenziale che H sia uno spazio vettoriale su C, altrimenti non è detto esistano gli autovalori. Il metodo di dimostrazione del teorema spettrale compatto normale usando il teorema 3.4.7 ed il teorema spettrale compatto autoaggiunto è tratto dal testo [4] della Bibliografia. I risultati qui esposti trovano applicazioni in molti campi: sia Ω ⊂ R2 un aperto limitato per cui esista la funzione di Green del laplaciano (vedi sezione ”Identità di Green e sue conseguenze”) e consideriamo il problema agli autovalori 4u = λu in Ω (3.4.47) u=0 in ∂Ω per le proprietà di unicità del problema di Dirichlet se λ = 0 allora l’unica soluzione di 3.4.47 è u = 0, quindi λ = 0 non è un autovalore, quindi il problema precedente è equivalente a µ4u = u in Ω (3.4.48) u=0 in ∂Ω infatti anche in questo caso se µ = 0 si ha u = 0. Poichè se u è soluzione del problema 3.4.48 allora u è continua in Ω ed ha derivate prime continue è possibile applicare il teorema 2.3.5 e quindi si ha Z µu(x, y) = G(x, y, ξ, η)u(ξ, η)dξdη (3.4.49) Ω 74 CAPITOLO 3. SPAZI DI HILBERT ED OPERATORI LINEARI d’altra parte se u ∈ L2 (Ω) soddisfa l’equazione 3.4.49 con µ 6= 0 allora il secondo membro è continuo, quindi u è continua; inoltre nel secondo membro si può derivare una volta sotto il segno di integrale (vedi dimostrazione del teorema 2.3.5) e si ottiene che u ha derivate prime continue, quindi applicando il teorema 2.3.5 si vede che u soddisfa 3.4.48. Quindi i problemi 3.4.48 e 3.4.49 con µ 6= 0 sono equivalenti. 1 Inoltre G ha la forma G(x, y, ξ, η) = 2π log r + γ(x, y, ξ, η) dove γ è contina su Ω, quindi si vede 2 che G ∈ L (Ω) e se si definisce Z G(x, y, ξ, η)u(ξ, η)dξdη (3.4.50) (T u)(x, y) = Ω poichè G(x, y, ξ, η) = G(ξ, η, x, y) ∈ R si vede analogamente al corollario 3.4.2 che T è un operatore compatto autoaggiunto ed il problema 3.4.48 equivale a µu = T u con µ 6= 0; è quindi possibile applicare il teorema spettrale. Si può inoltre vedere che ogni λn è negativo: sia u una autofunzione di 3.4.47, allora utilizzando l’equazione 2.3.67 con f = g = u si ha Z Z Z Z Z ∂u 2 2 λ u dxdy = (4u)udxdy = udσ − |∇u| dxdy = − |∇u|2 dxdy (3.4.51) Ω Ω ∂Ω ∂n Ω Ω e l’ultimo membro è strettamente negativo, infatti se fosse nullo si avrebbe u = const (sulle componenti connesse) e quindi per le condizioni al bordo u = 0, mentre si deve avere u 6= 0. Quindi si ottiene λ < 0 e quindi gli autovalori del problema 3.4.47 (che esistono per il teorema spettrale) sono tutti negativi. Una altra applicazione si ottiene nel teorema sugli autovalori del problema di Sturm-Liouville: il problema di Sturm-Liouville consiste nel problema ai limiti Ly = (p(x)y 0 )0 + q(x)y = f αy(0) + βy 0 (0) = 0 α2 + β 2 > 0 (3.4.52) 0 γy(π) + δy (π) = 0 γ 2 + δ2 > 0 Sotto opportune ipotesi si dimostra (vedi appendice E) che esiste una funzione G(x, y) : [0, π] × [0, π] → R continua e simmetrica tale che la suoluzione del problema di Sturm-Liouville è data da Z π y(ξ) = G(ξ, η)f (η)dη (3.4.53) 0 quindi anche in questo caso per il problema Ly = λy con le condizioni ai limiti 3.4.52 è applicabile il teorema spettrale compatto autoaggiunto. Per maggiori dettagli vedi l’appendice E. 3.5 Trasformata di Fourier Definizione 3.5.1. Si definisce l’insieme S (detto classe di Schwartz e talora indicato con S) nel modo seguente S = {φ ∈ C ∞ (−∞, +∞)| |xm Dn φ(x)| < An,m ∀x ∈ R ∀n, m ∈ N} (3.5.1) dove Dn = dn /dxn e An,m è una costante dipendente da n, m. Notiamo che S non è vuoto poichè Cc∞ (−∞, +∞) ⊂ S e inoltre si ha S ⊂ L1 (−∞, +∞) e se φ ∈ S allora per ogni n > 0 si ha xn φ ∈ L1 (−∞, +∞). Definizione 3.5.2. Per ogni φ ∈ S si definisce la trasformata di Fourier , indicata con F (φ) o φ̂, come Z +∞ φ̂(ω) = φ(x)eiωx dx (3.5.2) −∞ 3.5. TRASFORMATA DI FOURIER 75 La definizione precedente ha senso poichè si è già osservato che S ⊂ L1 (−∞, +∞). Servirà per il seguito notare che Lemma 3.5.1. S è denso in L2 (−∞, +∞). Dimostrazione. si è già osservato che Cc∞ (−∞, +∞) ⊂ S; inoltre si sà che Cc∞ (−∞, +∞) è denso il L2 (−∞, +∞), quindi S è denso in L2 (−∞, +∞). Teorema 3.5.1. Se φ ∈ S allora φ̂ ∈ S. Dimostrazione. mostriamo che φ̂ è derivabile e che D1 φ̂ = F (ixφ): φ̂(ω + h) − φ̂(ω) − h Z Z +∞ ixφ(x)e iωx ∞ iωx dx = ixφ(x)e −∞ −∞ eihx − 1 − 1 dx ihx (3.5.3) ihx l’integrando del secondo membro puntualmente a 0, inoltre e ihx−1 è limitato per ogni x, ihx tende e −1 quindi se 0 < h < si ha ihx < M e quindi l’integrando del secondo membro di 3.5.3 è maggiorato in modulo da M |xφ(x)| ∈ L1 (−∞, +∞), quindi si può utilizzare il teorema della convergenza dominata di Lebesgue ottenendo Z ∞ 1 1 D F [φ(x)](ω) = D φ̂(ω) = ixφ(x)eiωx dx = F (ixφ)(ω) (3.5.4) −∞ inoltre ixφ(x) ∈ S, quindi si ha ancora D2 φ̂ = D1 (D1 φ̂) = D1 [F (ixφ)] = F [(ix)2 φ] (3.5.5) e più in generale (poichè xn φ ∈ S) si ottiene per induzione Dn φ̂ = F [(ix)n φ], quindi φ̂ ∈ C ∞ (−∞, +∞). Mostriamo ora che |ω n φ̂(ω)| ≤ An : integrando per parti n volte si ottiene Z +∞ φ̂(ω) = eiωx φ(x)dx = −∞ quindi −1 iω Z |φ̂(ω)ω | = n Z +∞ eiωx D1 φ(x)dx = · · · = −∞ +∞ e iωx −∞ Z D φ(x)dx ≤ +∞ n (−1)n (iω)n Z +∞ eiωx Dn φ(x)dx (3.5.6) −∞ |Dn φ(x)|dx = An (φ) (3.5.7) −∞ Vediamo ora che |Dn φ̂(ω)ω m | ≤ An,m : si è visto che Dn φ̂ = F [(ix)n φ(x)], inoltre ψ(x) = (ix)n φ(x) ∈ S, quindi per quanto visto si ha |Dn φ̂(ω)ω m | = |ψ̂ω m | ≤ Am (ψ) che conclude. Teorema 3.5.2. Se φ ∈ S allora si ha 1 φ(x) = 2π Z +∞ φ̂(ω)e−iωx dω (3.5.8) −∞ Dimostrazione. siano φ, ψ ∈ S, allora si ha Z (φ̂(ω), ψ(ω)e iωx Z +∞ )= φ̂(ω)ψ(ω)e −∞ Z Z +∞ = ψ(ω)e −∞ iωx iωx Z ∞ dω = ψ(ω)e −∞ +∞ −iωy φ(y)e −∞ iωx dy dω ! +∞ φ(y)eiωy dy −∞ dω = (3.5.9) 76 CAPITOLO 3. SPAZI DI HILBERT ED OPERATORI LINEARI R +∞ R +∞ poichè −∞ dω −∞ |ψ(ω)| |φ(y)|dy < +∞ per il teorema di Fubini-Tonelli si può invertire l’ordine di integrazione, ottenendo quindi Z +∞ Z +∞ (φ̂(ω), ψ(ω)eiωx ) = φ(y) ψ(ω)eiω(x−y) dω dy = (3.5.10) Z −∞ +∞ Z +∞ φ(y)ψ̂(x − y)dy = = −∞ φ(z + x)ψ̂(−z)dz = (φ(z + x), ψ̂(−z)) −∞ −∞ quindi infine si ha (φ̂(ω), ψ(ω)eiωx ) = (φ(z + x), ψ̂(−z)) (3.5.11) 2 Sia ora a > 0 e poniamo ψ(ω) = e−aω , allora ψ ∈ S e si ha Z +∞ 2 (φ̂(ω), ψ(ω)eiωx ) = φ̂(ω)e−aω eiωx dω (3.5.12) −∞ se ora a → 0, l’integrando tende puntualmente a φ̂(ω)eiωx ed il modulo dell’integrando è maggiorato da |φ̂(ω)| ∈ L1 , quindi applicando il teorema della convergenza dominata di Lebesgue si ottiene Z lim (φ̂(ω), ψ(ω)e iωx a→0 +∞ φ̂(ω)e−iωx dω )= (3.5.13) −∞ Calcoliamo ora ψ̂: integrando per parti si ottiene Z +∞ Z 2 2 2a +∞ 2a ψ̂(ω) = e−ay eiωy dy = 2 iye−ay eiωy dy = − D1 ψ̂(ω) i ω −∞ ω −∞ (3.5.14) ω2 quindi si ottiene ψ̂(ω) = Ae− 4a dove A è una costante da deteminarsi nel seguente modo: r Z +∞ π −ax2 (3.5.15) A = ψ̂(0) = e dx = a −∞ quindi si ha r ψ̂(ω) = π − ω2 e 4a a (3.5.16) Si ha allora Z r ∞ (φ(y + x), ψ̂(−y)) = φ(y + x) −∞ π − y2 e 4a dy = a Z ∞ √ 2 √ φ(x + 2 az)e−z 2 πdz quindi usando nuovamente il teorema di Lebesgue si ottiene Z +∞ 2 √ lim (φ(y + x), ψ̂(−y)) = φ(x)e−z 2 πdz = 2πφ(x) a→0 (3.5.17) −∞ (3.5.18) −∞ quindi da 3.5.11, 3.5.13 e 3.5.17 si ottiene l’enunciato. Corollario 3.5.1. F : S → S è suriettiva. Dimostrazione. per il teorema precedente se φ ∈ S si ha Z +∞ φ(x) = −∞ quindi φ = F φ̂(−ω) 2π φ̂(ω) −iωx e dω = 2π Z +∞ −∞ φ̂(−ω) iωx e dω = F 2π e per il teorema 3.5.1 si ha φ̂(−ω) 2π ∈ S. φ̂(−ω) 2π ! (x) (3.5.19) 3.5. TRASFORMATA DI FOURIER 77 Teorema 3.5.3 (Identità di Parsevall). Se φ, χ ∈ S allora (φ̂, χ̂) = 2π(φ, χ). Dimostrazione. usiamo 3.5.11: se in essa si pone x = 0 e ψ(ω) = χ̂(ω) si ottiene (φ̂(ω), χ̂(ω)) = (φ̂(ω), ψ(ω)) = (φ(y), ψ̂(−y)) = (φ(y), F [χ̂(ω)](−y)) = χ̂(−ω) = (φ(y), F [χ̂(−ω)](y)) = 2π(φ(y), F (y)) = 2π(φ(y), χ(y)) 2π (3.5.20) Corollario 3.5.2. F : S → S è biunivoca. Dimostrazione. dall’identità di Parsevall segue in particolare che kF (φ)k2 = 2πkφk2 , quindi ker F = {0} e quindi F è iniettiva; inoltre si è già visto che F è suriettiva. Definizione 3.5.3. Poichè S è denso in L2 (−∞, +∞) (vedi lemma 3.5.1) e la trasformate di Fourier è un operatore lineare limitato su S (dall’identità di Parsefall segue che kF k2 = 2π), essa può essere estesa per continuità ad un operatore F : L2 (−∞, +∞) → L2 (−∞, +∞) (vedi teorema 3.2.4). Se f ∈ L2 (−∞, +∞) allora F f (o fˆ) si chiama trasformata di Fourier di f . Ovviamente per la trasformata di Fourier di una funzione di L2 (−∞, +∞) non è più valida la formula 3.5.2 poichè f potrebbe non essere integrabile; dalla definizione segue che per calcolare la trasformata di Fourier di f ∈ L2 si dovrebbe procedere nel seguente modo: si trova una successione di funzioni fn ∈ S tali che fn → f in L2 (−∞, +∞), quindi si calcola fˆn tramite la 3.5.2; per il teorema 3.2.4 la successione fˆn converge allora in L2 ad una funzione fˆ. Questa è la trasformata di Fourier di F . Lemma 3.5.2. F : L2 (−∞, +∞) → L2 (−∞, +∞) è suriettivo. Dimostrazione. sia f ∈ L2 (−∞, +∞) e sia φn ∈ S una successione tale che φn → f in L2 , allora si ha per il corollario 3.5.1 " # # " φ̂n (−ω) φ̂n (−ω) f = lim φn = lim F = F lim (3.5.21) n→∞ n→∞ n→∞ 2π 2π Inoltre per definizione fˆ = limn→∞ φ̂n , quindi si ottiene # " # " fˆ(ω) fˆ(−ω) (x) = F (−x) f (x) = F 2π 2π (3.5.22) che conclude. (La formula precedente è la formula di inversione della trasformata di Fourier) Teorema 3.5.4 (Identità di Parsevall). se f, g ∈ L2 (−∞, +∞) allora si ha (fˆ, ĝ) = 2π(f, g). Dimostrazione. siano φn , ψn ∈ S tali che φn → f e ψn → g, allora si ha per definizione fˆ = limn→∞ φ̂n e ĝ = limn→∞ ψ̂n . Allora usando la continuità del prodotto scalare e la prima forma dell’identità di Parsevall si ottiene (fˆ, ĝ) = (lim φ̂n , lim ψ̂k ) = lim(φ̂n , ψ̂k ) = (3.5.23) = 2π lim(φn , ψk ) = 2π(lim φn , lim ψk ) = 2π(f, g) Corollario 3.5.3. F : L2 (−∞, +∞) → L2 (−∞, +∞) è biunivoca. Dimostrazione. si è già visto che F è suriettiva. Inoltre dall’identità di Parsefall segue che kfˆk = √ 2πkf k, quindi F è anche iniettiva. 78 CAPITOLO 3. SPAZI DI HILBERT ED OPERATORI LINEARI Se al posto di 3.5.2 si fosse usata la definizione Z +∞ 1 φ̂(ω) = √ φ(x)eiωx dx 2π −∞ per la definizione della trasformata in S, si sarebbe ottenuto in S Z +∞ 1 φ(x) = √ φ̂(ω)e−iωx dω 2π −∞ (3.5.24) (3.5.25) e l’identità di Parsevall sarebbe diventata (φ̂, ψ̂) = (φ, ψ) ed estendendo in modo analogo a come si è fatto la trasformata ad un operatore lineare F : L2 → L2 l’identità di Parsevall sarebbe diveuta (fˆ, ĝ) = (f, g) e quindi la trasformata di Fourier sarebbe diventata un operatore unitario di L2 (−∞, +∞). Questo risultato è noto come teorema di Plancherel. Teorema 3.5.5. Sia f ∈ L2 (−∞, +∞) e definiamo Z +n gn (ω) = f (x)eiωx dx (3.5.26) −n allora fˆ è il limite in L2 della successione {gn }. Dimostrazione. sia fn = f χ[−n,+n] , allora evidentemente fn → f in L2 e fn ∈ L1 (−∞, +∞); mostriamo che fˆn = gn : siano φn ∈ S con supporto in [−n, n] tali che φn → fn in L2 , allora Z +n Z +n iωx iωx φi e dx − f e dx ≤ (3.5.27) Z Z +n ≤ −n +n |φi − f |dx ≤ −n −n 1/2 √ √ 2n = kφi − fn k 2n |φi − f |2 dx −n R +n quindi −n φi eiωx dx tende uniformemente in ω a gn , cioè φ̂i → gn uniformemente in ω se i → ∞. Inoltre {φ̂i } è una successione di Cauchy (per l’identità di Parsevall) poichè {φn } è una successione di Cauchy, quindi esiste ψ ∈ L2 tale che φ̂i → ψ in L2 , ma allora esiste una sottosuccessione φ̂ik che converge a ψ puntualmente quasi ovunque, ma φ̂i → gn uniformemente, quindi ψ = gn q.o. e quindi ψ = gn in L2 e φ̂i → gn in L2 (−∞, +∞). Ma per definizione si ha fˆn = lim φ̂i in L2 , quindi fˆn = gn . Usando l’identità di Parsevall si ha allora 2πkfn − f k2 = kfˆn − fˆk2 = kgn − fˆk2 (3.5.28) inoltre se n → ∞ si ha fn → f , quindi gn → fˆ che è quanto si doveva mostrare. Utilizzando la relazione 3.5.22 si ottiene dal teorema precedente il seguente enunciato: Teorema 3.5.6. Sia f ∈ L2 (−∞, +∞) e definiamo gn (x) = 1 2π Z +n fˆ(ω)e−iωx dω (3.5.29) −n allora gn → f in L2 (−∞, +∞). Corollario 3.5.4. Sia f ∈ L2 (−∞, +∞) ∩ L1 (−∞, +∞) allora si ha Z fˆ(ω) = +∞ −∞ f (x)eiωx dx (3.5.30) 3.5. TRASFORMATA DI FOURIER 79 Dimostrazione. sia fn = f χ[−n,n] , allora si ha fn → f in L2 e fˆn → fˆ in L2 . Inoltre fˆn = R +n f (x)eiωx dx. Si ha allora −n Z Z +∞ f (x)e iωx +n dx − f (x)e −∞ iωx −n Z dx ≤ |f (x)|dx (3.5.31) |x|>n ed il secondo membro tende a 0 uniformemente in ω. Quindi {fˆn } è di Cauchy in L2 e fˆn (ω) → R +∞ f (x)eiωx dx uniformemente; si conclude analogamente a quanto fatto nel teorema 3.5.5 che −∞ R +∞ fˆn (ω) → f (x)eiωx dx in L2 da cui si ottiene la tesi. −∞ Anche in questo caso si ha un enunciato duale per fˆ: Corollario 3.5.5. Sia f ∈ L2 (−∞, +∞) e sia fˆ ∈ L1 (−∞, +∞), allora si ha Z 1 2π f (x) = +∞ fˆ(ω)e−iωx dω (3.5.32) −∞ Il teorema precedente può essere usato per calcolare alcune trasformate che altrimenti srebbero piuttosto complesse: è ad esempio immediato verificare che Z F (e −|x| +∞ )= eiωx e−|x| dx = −∞ 2 1 + ω2 (3.5.33) allora per il corollario 3.5.5 si ha e−|x| = 1 2π e quindi F Z +∞ 2 1 e−iωx dω = 2 1+ω π −∞ 1 1 + x2 Z +∞ Z +∞ −∞ 1 eiωx dω 1 + ω2 1 eiωx dx = πe−|ω| 1 + x2 = −∞ (3.5.34) (3.5.35) risultato che è difficile da ottenenere direttamente. Definizione 3.5.4. Se f ∈ L1 (−∞, +∞) si definisce Z (F f )(ω) = fˆ(ω) = +∞ f (x)eiωx dx (3.5.36) f (ω)e−iωx dω (3.5.37) −∞ detta trasformata di Fourier e (F −1 1 f )(x) = 2π Z +∞ −∞ datta trasformata di Fourier inversa. Ovviamente non è a priori detto (e in generale neppure vero) che F −1 F = I, infatti se f è integrabile non è detto che fˆ sia anch’essa integrabile, come mostra il seguente esempio f = e−x χ[0,+∞) ; Lemma 3.5.3. Si ha Z +L lim L→+∞ −L fˆ(ω) = 1 1 − iω sin x dx = π x (3.5.38) (3.5.39) 80 CAPITOLO 3. SPAZI DI HILBERT ED OPERATORI LINEARI Dimostrazione. definiamo f (x) = 1 0 se x ∈ (−1, 1) se x ∈ (−1, 1)c (3.5.40) allora si ha f ∈ L2 (−∞, +∞) ∩ L1 (−∞, +∞), quindi Z fˆ(ω) = +1 eiωx dx = −1 1 iω sin ω (e − e−iω ) = 2 iω ω (3.5.41) quindi per l’identità di Parsefall si ha Z kfˆk2 = 4 +∞ −∞ da cui si ottiene Z sin2 x dx = 2πkf k2 = 4π x2 +∞ −∞ sin2 x dx = π x2 (3.5.42) (3.5.43) Integrando per parti si ottiene Z L Z L 1 sin2 x 1 2 L + dx = [− sin x] 2 sin x cos xdx = −L 2 x −L x −L x Z L Z L/2 1 1 1 sin z 2 2 L L = [− sin x]−L + sin 2xdx = [− sin x]−L + dz x x x −L −L/2 z (3.5.44) passando al limite per L → ∞ si ottiene l’enunciato. (x) Teorema 3.5.7. Sia f ∈ L1 (−∞, +∞), continua in x e tale che f (x+z)−f sia integrabile in un z intorno di z = 0, allora si ha Z L 1 f (x) = lim fˆ(ω)e−iωx dω (3.5.45) L→∞ 2π −L RL 1 fˆ(ω)e−iωx dω allora (applicando il teorema della convergenza Dimostrazione. sia IL = 2π −L dominata ed il teorema di Fubini) si ha ! Z +∞ Z L Z L Z +k 1 1 −iωx iωy −iωx iωy IL = e f (y)e dy dω = lim e f (y)e dy dω = k→∞ 2π −L 2π −L −∞ −k Z +k Z 1 1 k ei(y−x)L − e−i(y−x)L sin L(y − x) = lim f (y) dy = lim f (y) dy = k→∞ 2π −k k→∞ π −k i(y − x) (y − x) Z 1 +k sin Lz = lim f (x + z) dz (3.5.46) k→∞ π −k z per il lemma 3.5.3 si ha 1 1 = lim k→∞ π Z +k −k sin z 1 dz = lim k→∞ π z Z +k −k sin Lz dz z (3.5.47) quindi Z 1 +k sin Lz |IL − f (x)| = lim [f (x + z) − f (x)]dz ≤ k→∞ π −k z Z Z Z 1 M 1 −M 1 k ··· + ··· + · · · ] = lim [A1 + A2 + A3 ] ≤ lim [ π −M π −k k→∞ k→∞ π M (3.5.48) 3.5. TRASFORMATA DI FOURIER inoltre si ha 1 A1 ≤ π Z +∞ M 81 Z |f (x + z)| |f (x)| k sin Lz dz + dz M π M z (3.5.49) fissnto > 0 si può scegliere M abbastanza grande da fare in modo che il primo termine sia ≤ . Per il secondo termine si ha Z Z |f (x)| k sin z |f (x)| k sin Lz (3.5.50) lim dz = lim dz k→∞ π LM z k→∞ π M z e per il lemma 3.5.3 se L è abbastanza grande questo termine è ≤ . Per A3 si ragiona analogamente. Per quanto riguarda A2 si ha Z 1 M f (x + z) − f (x) A2 = (3.5.51) sin Lz dz π −M z per ipotesi il termine tra parentesi è integrabile, quindi per il lemma di Riemann-Lebesgue se L è abbastanza grande si ha A2 ≤ . Nel teorema precedente non è a prima vista chiaro dove sia intervenuta la continuità di f . Un primo modo i cui questa ipotesi è intervenuta è stato nel fatto che si è sempre supposto (ad esempio in 3.5.49) che |f (x)| < +∞, ma per questo sarebbe bastato appunto supporre che per ogni x si avesse |f (x)| < +∞. Per chiarire dove sia intervenuta la continuità si può osservare che nel teorema precedente si è in effetti mostrato che se f ∈ L1 (−∞, +∞) e se g : R → C è tale che f (x+z)−g(x) sia integrabile in un intorno di z = 0, allora si ha z 1 g(x) = lim L→∞ 2π Z L fˆ(ω)e−iωx dω (3.5.52) −L si può inoltre osservare che questa g è determinata per ogni x ∈ R da f : supponiamo esistano due numeri α, β tali che f (x̄ + z) − α f (x̄ + z) − β ; ∈ L1z (−, +) (3.5.53) z z allora deve essere integrabile anche f (x̄ + z) − α f (x̄ + z) − β β−α − = z z z (3.5.54) quindi α = β = g(z̄). Si vede inoltre semplicemente che se f è continua allora si deve avere necessariamente g = f ed è qui che interviene la continuità di f . Lemma 3.5.4. Sia f ∈ L1 (−∞, +∞) o f ∈ L2 (−∞, +∞), allora si ha F [f (x − a)](ω) = eiωa F [f (x)](ω). Dimostrazione. per f ∈ L1 la dimostrazione è immediata. Per f ∈ L2 usando il teorema 3.5.5 si ha Z L Z L f (z)eiωz eiωa dz = eiωa F [f (x)](ω) (3.5.55) f (x − a)eiωx dx = lim F [f (x − a)](ω) = lim L→∞ −L L→∞ −L Lemma 3.5.5. Sia f ∈ L1 (−∞, +∞) o f ∈ L2 (−∞, +∞), allora si ha F [f (x)eiax ](ω) = F [f (x)](ω + a). 82 CAPITOLO 3. SPAZI DI HILBERT ED OPERATORI LINEARI Dimostrazione. come nel lemma precedente si ha Z +L F [f (x)eiax ](ω) = lim eix(a+ω) f (x)dx = F [f (x)](ω + a) L→∞ (3.5.56) −L Definizione 3.5.5. Se f, g ∈ L1 (−∞, +∞) si definisce prodotto di convoluzione di f e g l’espressione Z +∞ f (x − y)g(y)dy (3.5.57) (f ∗ g)(x) = −∞ 1 1 Lemma 3.5.6. Se f, g ∈ L allora f ∗ g ∈ L (in particolare |(f ∗ g)(x)| < +∞ per q.o. x). Dimostrazione. si ha Z +∞ Z +∞ Z +∞ |(f ∗ g)(x)|dx = −∞ Z −∞ Z +∞ +∞ = |f (x − y)| |g(y)|dy dx = −∞ 0 0 |f (x )| |g(y )|dy −∞ (3.5.58) 0 dx0 = kf k1 kgk1 ≤ +∞ −∞ Teorema 3.5.8. Se f, g ∈ L1 (−∞, +∞) allora si ha F (f ∗ g) = F (f ) · F (g). Dimostrazione. si ha Z +∞ F (f ∗ g)(ω) = Z +∞ Z −∞ +∞ = −∞ Z eiωx +∞ f (x − y)g(y)dy dx = −∞ Z eiω(x−y) eiωy f (x − y)g(y)dxdy = −∞ Z +∞ = +∞ Z +∞ −∞ −∞ +∞ 0 0 0 (3.5.59) 0 eiωx eiωy f (x0 )g(y 0 )dxdy 0 = Z 0 f (x0 )eiωx dx 0 g(y )eiωy dy 0 = F (f )(ω) · F (g)(ω) −∞ −∞ Definizione 3.5.6. Se f ∈ L1 (−∞, +∞) e g ∈ Lp (−∞, +∞) si definisce il prodotto di convoluzione di f e g come Z +∞ (f ∗ g)(x) = f (x − y)g(y)dy (3.5.60) −∞ 1 Teorema 3.5.9. Se f ∈ L (−∞, +∞) e g ∈ Lp (−∞, +∞) allora f ∗g ∈ Lp e kf ∗gkp ≤ kf k1 kgkp . Dimostrazione. poichè g ∈ Lp si ha g p ∈ L1 , quindi per il lemma 3.5.6 per q.o. x si ha |f (x − 0 0 y)g p (y)| ∈ L1 e quindi |f (x − y)|1/p |g(y)| ∈ Lp . Inoltre |f (x − y)|1/p ∈ Lp (dove p0 è l’esponente coniugato di p). Per la disuguaglianza di Holder si ha allora Z +∞ Z +∞ 0 |f (x − y)| |g(y)|dy = |f (x − y)|1/p |f (x − y)|1/p |g(y)|dy ≤ (3.5.61) −∞ Z −∞ 1/p0 Z +∞ ≤ +∞ |f (x − y)|dy −∞ −∞ 1/p0 Z = kf k1 quindi si ha 1/p |f (x − y)| |g(y)|p dy +∞ = 1/p |f (x − y)| |g(y)|p dy −∞ p/p0 |(f ∗ g)(x)|p ≤ kf k1 (|f | ∗ |g|p )(x) (3.5.62) 3.5. TRASFORMATA DI FOURIER 83 quindi per l’equazione 3.5.58 si ha p/p0 kf ∗ gkpp ≤ kf k1 1+p/p0 kf k1 kg p k1 = kf k1 kgkpp = kf kp1 kgkpp (3.5.63) e quindi kf ∗ gkp ≤ kf k1 kgkp < +∞. Teorema 3.5.10. Se f ∈ L1 e g ∈ L2 allora F (f ∗ g) = F (f ) · F (g) dove F (f ) è la trasformata in L1 e F (g), F (f ∗ g) trasformate in L2 . Dimostrazione. sia gn = gχ[−n,n] , allora gn ∈ L2 ∩ L1 . Sia hn = f ∗ gn , allora per il teorema 3.5.8 si ha F (hn ) = F (f )F (g). Poichè f ∈ L1 si ha Z +∞ Z +∞ iωx |F (f )(ω)| = f (x)e dx ≤ |f (x)|dx = kf k1 (3.5.64) −∞ quindi si ha Z +∞ Z |F (f )F (gn ) − F (f )F (g)|2 = −∞ +∞ −∞ −∞ |F (f )|2 |F (gn ) − F (g)|2 ≤ kf k21 kF (gn ) − F (g)k22 (3.5.65) e poichè kgn − gk2 → 0 si ha allora F (f )F (gn ) → F (f )F (g) in L2 , cioè F (hn ) → F (f )F (g) in L2 . Inoltre per il lemma precedente si ha kf ∗ g − hn k2 = kf ∗ (g − gn )k2 ≤ kf k1 kg − gn k2 → 0 (3.5.66) quindi hn → f ∗ g in L2 , quindi F (hn ) → F (f ∗ g) in L2 e quindi F (f ∗ g) = F (f )F (g). Nella parte restante di questa sezione si vedrà che per certe f ∈ L1 si ha effettivamente F −1 F = I seguendo il testo [8] della biblografia. Lemma 3.5.7. Sia f ∈ L1 (−∞, +∞) e definiamo fy (x) = f (x − y), allora la funzione y → fy è uniformemente continua da R in L1 . Dimostrazione. sia > 0; poichè f ∈ L1 esiste una funzione g ∈ C∞ c tale che kf − gk1 ≤ ; sia g(x) = 0 se x ∈ (−A, A)c ; poichè g è uniformemente continua esiste un δ ∈ (0, A) tale che se |s − t| < δ allora si ha |g(s) − g(t)| ≤ /(3A). Ne segue che Z +∞ kgs − gt k1 = |g(x − s) − g(x − t)|dx ≤ (2A + δ) ≤ (3.5.67) 3A −∞ quindi si ha anche, se |t − s| < δ, kfs − ft k1 ≤ kfs − gs k1 + kgs − gt k1 + kgt − ft k1 ≤ (3.5.68) ≤ k(f − g)s k1 + kgs − gt k1 + k(f − g)t k1 ≤ 3 che conclude la dimostrazione. Sia ora H(t) = e−|t| e per ogni λ > 0 definiamo hλ nel seguente modo: Z +∞ H(λt) itx 1 λ hλ (x) = e dt = (3.5.69) 2 2π π λ + x2 −∞ R +∞ notiamo inoltre che si ha −∞ hλ (x)dx = 1, 0 < H(t) ≤ 1 e che H(λt) tende puntualmente a 1 quando λ → 0. Lemma 3.5.8. Se f ∈ L1 allora si ha Z +∞ (f ∗ hλ )(x) = H(λt) −∞ fˆ(t) −ixt e dx 2π (3.5.70) 84 CAPITOLO 3. SPAZI DI HILBERT ED OPERATORI LINEARI Dimostrazione. usando il teorema di Fubini si ha Z Z +∞ (f ∗ hλ )(x) = f (x − y) H(λt) ity e dt dy = 2π −∞ −∞ Z +∞ Z +∞ H(λt) = f (x − y)eity dy dt = 2π −∞ −∞ Z +∞ Z +∞ H(λt) −itx itz = f (z)e e dz dt = 2π −∞ −∞ Z +∞ H(λt) ˆ −itx f (t)e dt = 2π −∞ +∞ (3.5.71) Lemma 3.5.9. Se f ∈ L1 allora limλ→0 kf ∗ hλ − f k1 = 0. Dimostrazione. si ha Z +∞ (f ∗ hλ )(x) − f (x) = [f (x − y) − f (x)]hλ (y)dy (3.5.72) −∞ quindi si ottiene Z +∞ |(f ∗ hλ )(x) − f (x)| ≤ |f (x − y) − f (x)|hλ (y)dy (3.5.73) −∞ integrando rispetto a x ed applicando il teorema di Fubini si ottiene Z +∞ kf ∗ hλ − f k1 ≤ kfy − f k1 hλ (y)dy = Z +∞ = kfy − f k1 −∞ h1 (y/λ) dy = λ (3.5.74) −∞ Z +∞ kfλx − f k1 h1 (x)dx −∞ se λ → 0 per il lemma 3.5.7 l’integrando tende puntualmente a 0, inoltre l’integrando è maggiorato in modulo da (kfλx k1 + kf k1 )h1 (x) = 2kf k1 h1 (x) ∈ L1 quindi si conclude applicando il teorema della convergenza dominata di Lebesgue. Teorema 3.5.11 (Formula di inversione). Se f ∈ L1 e fˆ ∈ L1 allora per q.o. x ∈ R si ha 1 f (x) = 2π Z +∞ fˆ(t)e−itx dt (3.5.75) −∞ Dimostrazione. per il lemma 3.5.8 si ha Z +∞ (f ∗ hλ )(x) = H(λt) −∞ fˆ(t) −ixt e dx 2π (3.5.76) l’integrale a secondo membro è maggiorato da |fˆ(t)|/(2π) ∈ L1 e H(λt) tende puntualmente a 1 se λ → 0, quindi per il teorema della convergenza dominata si ha Z +∞ lim λ→0 −∞ Z +∞ 1 fˆ(t) −ixt e dx = fˆ(t)e−itx dx H(λt) 2π 2π −∞ (3.5.77) dal lemma 3.5.9 segue inoltre che esiste una successione {λn } tale che λn → 0 e che per quasi ogni x si ha limn→∞ (f ∗ hλn )(x) = f (x), che conclude. Corollario 3.5.6. Se f, g ∈ L1 e fˆ = ĝ allora f e g coincidono q.o. 3.6. OPERATORI CHIUSI E CHIUDIBILI 85 Dimostrazione. si ha F (f − g) = F (f ) − F (g) = 0, quindi dal teorema precedente segue f (x) − g(x) = 0 per q.o. x. Lemma 3.5.10. Se f ∈ L1 allora F −1 (f ) è una funzione continua. Dimostrazione. se tn → t allora si ha |F −1 (f )(tn ) − F −1 1 (f )(t)| ≤ 2π Z +∞ |f (x)| |e−itn x − e−itx |dx (3.5.78) −∞ l’integrando del secondo memebro tende puntalmente a 0 q.o. ed è maggiorato da 2|f (x)|, quindi per il teorema della convergenza domiata si conclude. Corollario 3.5.7. Se f ∈ L1 è continua e fˆ ∈ L1 allora f = F −1 fˆ. Dimostrazione. per il teorema precedente f e F −1 fˆ coincidono q.o. e poichè sono entrambe continue, per il lemma precedente, esse coincidono ovunque. 3.6 Operatori chiusi e chiudibili Definizione 3.6.1. Un operatore lineare T : DT ⊂ H → H (non necessariamente limitato) si dice chiuso se per ogni successione {xn } di DT tale che esistono x, y ∈ H tali che xn → x e T xn → y si ha x ∈ DT e y = T x. Nel seguito le coppie ordinate di elementi, usualmente indicate con (x, y), saranno indicate con {x, y} per non creare confusione con il prodotto scalare. Sia K = H × H = {{x, y}|x ∈ H, y ∈ H} il prodotto cartesiano di H con se stesso. Si può dotare K della struttura di spazio vettoriale definendo {x, y} + {z, t} = {x + z, y + t} e α{x, y} = {αx, αy}. Si può inoltre definire in K il prodotto scalare (semplice verifica) ({x, y}, {a, b})K = (x, a)H + (y, b)H , dove ( , )H indica il prodotto scalare in H; da questo prodotto deriva la norma k{x, y}k2 = kxk2 + kyk2 . Dalla definizione segue subito che data una successione {{xn , yn }}n in K essa è di Cauchy se e solo se le due successioni {xn }n , {yn }n sono di Cauchy in H. Vediamo ora che K costruito in questo modo è uno spazio di Hilbert: sia {{xn , yn }}n una successione di Cauchy in K, allora {xn }n , {yn }n sono successioni di Cauchy in H, quindi esistono x, y ∈ H tali che xn → x e yn → y ma allora si ha k{xn , yn } − {x, y}k2 = k{xn − x, yn − y}k2 = kxn − xk2 + kyn − yk2 → 0 (3.6.1) quindi {x, y} = limn→∞ {xn , yn } in K, che è quindi completo. Definizione 3.6.2. Sia T : DT ⊂ H → H un operatore lineare. Si definisce grafico di T il sottoinsieme GT di K definito da GT = {{x, T x}|x ∈ DT } (3.6.2) Poichè T è lineare evidentemente GT è un sottospazio vettoriale di K. Lemma 3.6.1. GT è un sottospazio chiuso di H ⇔ T è un operatore chiuso. Dimostrazione. ⇐) Sia {{xn , yn }}n una successione di elementi di GT tale che {xn , yn } → {x, y}; ciò equivale ad affermare che xn → x e yn → y, inoltre si ha yn = T xn , quindi si ha xn → x e T xn → y. Poichè T è un operatore chiuso si ha x ∈ DT e y = T x, quindi {x, y} ∈ GT che è quindi chiuso. ⇒) sia {xn }n una successione di DT tale che xn → x e T xn → y, allora si ha {xn , T xn } → {x, y} in K e poichè GT è chiuso si ha {x, y} ∈ GT , cioè x ∈ DT e y = T x, quindi T è un operatore chiuso. 86 CAPITOLO 3. SPAZI DI HILBERT ED OPERATORI LINEARI Lemma 3.6.2. Sia T : H → H un operatore lineare, allora se T è limitato T è anche chiuso. Dimostrazione. se xn → x e T xn → y, allora dalla continuità di T segue y = limn→∞ T xn = T x, quindi T è chiuso. Vale anche l’inverso del teorema precedente anche se la dimostrazione richiede argomenti più sottili (per la dimostrazione vedi l’appendice F). Teorema 3.6.1 (Teorema del grafico chiuso (Banach)). Se T : H → H è un operatore lineare chiuso allora T è limitato. Definizione 3.6.3. Sia T : DT ⊂ H → H un operatore lineare (non necessariamente limitato) tale che DT = H (cioè il dominio di T è denso in H); se dato x ∈ H esiste x∗ ∈ H tale che per ogni y ∈ DT si abbia (x, T y) = (x∗ , y) allora si dice che x ∈ DT + e si pone x∗ = T + x. In generale non è detto che DT + 6= {0}, in particolare non è detto esista (T + )+ ; inoltre se un x∗ , come nella definizione, esiste allora è unico: se esistessero x∗1 , x∗2 tali che (x, T y) = (x∗1 , y) = (x∗2 , y) per ogni y ∈ DT si avrebbe (x∗1 − x∗2 , y) = 0 per ogni y ∈ DT e poichè DT = H si avrebbe anche, per la continuità del prodotto scalare, (x∗1 − x∗2 , y) = 0 per ogni y ∈ H e quindi x∗1 = x∗2 . Lemma 3.6.3. Sia T : DT → H con DT = H, allora T + : DT + → H è un operatore lineare. Dimostrazione. si deve mostrare che se x, z ∈ DT + e α, β ∈ C allora si ha αx + βz ∈ DT + e T + (αx + βz) = αT + x + βT + z. Siano x, z ∈ DT + , allora esistono x∗ , z ∗ come nella definizione 3.6.3 e per ogni y ∈ DT si ha (αx + βz, T y) = α(x, T y) + β(z, T y) = α(x∗ , y) + β(z ∗ , y) = (αx∗ + βz ∗ , y) (3.6.3) quindi αx + βz ∈ DT + e (αx + βz)∗ = αx∗ + βz ∗ , cioè T + (αx + βz) = αT + x + βT + z. Definizione 3.6.4. Sia T : DT → H un operatore lineare tale che DT = H, allora l’operatore lineare T + : DT + → H della definizione 3.6.3 e del lemma 3.6.3 si chiama operatore aggiunto di T. Lemma 3.6.4. Sia T : DT → H un operatore lineare tale che DT = H, allora T + è un operatore chiuso. Dimostrazione. sia {xn }n una successione in DT + tale che xn → x e T + xn → y, allora per ogni z ∈ DT si ha, per la continuità del prodotto scalare, (xn , T z) → (x, T z) e (T + xn , z) → (y, z), quindi dall’identità (xn , T z) = (T + xn , z) (valida per ogni z ∈ DT ) segue (x, T z) = (y, z) per ogni z ∈ DT , quindi x ∈ DT + e y = T + x, quindi T + è chiuso. Esempio 3.6.1. Esiste un operatore lineare T : DT → H tale che DT = H e DT + 6= H, per il quale quindi non esiste (T + )+ . Dimostrazione. sia H uno spazio di Hilbert separabile di dimensione infinita, sia {en }n una base ortonormale numerabile e sia DT l’insieme delle combinazioni lineari finite di vettori di {en }n , di modo che DT = H. Fissato v 6= 0 definiamo per ogni n l’operatore T en = v e si prolunghi T per linearità su DT (ciò è possibile senza ulteriori ipotesi poichè DT è lo spazio delle combinazioni lineari Pn finite P degli {en }n ). Si vede subito che T cosı̀ definito non è limitato: si ha infatto k k=1 ek k2 = n n e kT ( k=1 ek )k2 = knvk2 = n2 kvk2 e quindi Pn kT ( k=1 en )k √ Pn (3.6.4) = nkvk → ∞ k k=1 ek k Sia ora x ∈ DT + , allora esiste x∗ tale che (x, T y) = (x∗ , y) per ogni y ∈ DT , in particolare per PN y = k=1 ak ek si ha (x∗ , N X k=1 ak ek ) = (x, T ( N X k=1 ak ek )) = (x, v N X k=1 ak ) = (x, v) N X k=1 ak (3.6.5) 3.6. OPERATORI CHIUSI E CHIUDIBILI 87 Sia ora V lo spazio delle combinazioni lineari del tipo che V = H: sono contenuti in V i vettori z1 = e1 − e2 ; z2 = e1 + e2 − 2e3 ; PN k=1 ak ek con PN k=1 ak = 0; mostriamo zn = e1 + · · · + en − nen+1 (3.6.6) sia u ∈ H tale che (u, zk ) = 0 per ogni k, allora (u, z1 ) = 0, cioè (u, e1 ) = (u, e2 ); (u, z2 ) = 0, cioè (u, e1 ) + (u, e2 ) = 2(u, e3 ), quindi (u, e1 ) = (u, e2 ) = (u, e3 ) e per induzione è sempice vedere che si deve avere (u, en ) = (u, e1 ); ma per la disuguaglianza di Bessel si deve avere P∞per ogni n 2 k=1 |(u, ek )| < +∞, quindi si deve avere per ogni n che (u, en ) = 0, ma {en } è una base, quindi u = 0, quindi l’unico vettore ortogonale a V è 0, quindi V = H. ∗ Dalla è ortogonale a V , quindi x∗ = 0 per ogni x ∈ DT + . Sia PN fomula 3.6.5 segue che x P N ora k=1 ak ek un vettore tale che k=1 ak 6= 0, allora da 3.6.5 e x∗ = 0 segue x ⊥ v, quindi DT + ⊂ v ⊥ . D’altro canto se x ⊥ v si ha (x, T ( N X ak ek )) = (x, v k=1 N X ak ) = (x, v) k=1 N X ∗ ak = 0 = (x , k=1 N X a k ek ) (3.6.7) k=1 quindi v ⊥ ⊂ DT + e quindi DT + = v ⊥ , da cui segue che DT + non è denso in H, infatti se fosse denso si dovrebbe avere, per la continuità del prodotto scalare, (DT + )⊥ = {0}, mentre si ha v ∈ (DT + )⊥ e v 6= 0. Esempio 3.6.2. Sia H = L2 (−π, π), DT = C([−π, π]) lo spazio delle funzioni continue su [−π, π] e sia T : DT ⊂ H → H definito da T f = f (0), allora T non è chiuso. Dimostrazione. siano fn = e−n|x| , allora si vede subito che fn → 0 in L2 (−π, π) e che per ogni n si ha (T fn )(x) = 1, ma 1 6= T (0), quindi T non è chiuso. Esempio 3.6.3. Sia H = L2 (−∞, +∞), DQ = {f ∈ L2 (−∞, +∞)|xf (x) ∈ L2 (−∞, +∞)} e definiamo Q : DQ ⊂ H → H come (Qf )(x) = xf (x), allora Q non è limitato ed è chiuso. Dimostrazione. vediamo innanzitutto che Q non è limitato: sia fn (x) = x1 χ[1,n+1] , allora si ha Z +∞ 1 2 kQf k = |xfn (x)|2 dx = n; kfn k2 = 1 − (3.6.8) n+1 −∞ da cui segue che kQk2 ≥ kQfn k2 n = → +∞ 1 kfn k2 1 − n+1 (3.6.9) quindi Q non è limitato. Vediamo ora che Q è chiuso: sia {fn } una successione in DQ tale che fn → f e Qfn → g, allora si deve vedere che f ∈ DQ e g = Qf . Notiamo innanzitutto che, fissata a > 0, si ha Z +a Z a 2 2 |f (x) − fn (x)|2 dx ≤ a2 kf − fn k2 (3.6.10) |xf (x) − xfn (x)| dx ≤ a −a −a e quindi si ha (sempre per a fissato) Z +a Z 2 |xf (x) − g(x)| = −a Z +a |xf (x) − xfn (x) + xfn (x) − g(x)|2 dx ≤ −a +a ≤2 Z |xf (x) − xfn (x)|2 + 2 −a ≤ 2a2 kf − +a −a f n k2 (3.6.11) |xfn (x) − g(x)|2 ≤ + 2kQfn − gk2 → 0 quindi xf (x) = g(x) per q.o. x ∈ [−a, a] e per la genericità di a si ottiene xf (x) = g(x) q.o.; inoltre per ipotesi si ha f, g ∈ L2 (−∞, +∞) ma da xf (x) = g(x) q.o. segue allora che xf (x) ∈ L2 (−∞, +∞) e quindi f ∈ DQ e xf (x) = g(x) q.o. implica xf (x) = g(x) in L2 (−∞, +∞), quindi g = Qf e quindi Q è un operatore chiuso. 88 CAPITOLO 3. SPAZI DI HILBERT ED OPERATORI LINEARI Esempio 3.6.4. Sia H = L2 (0, π), DT = {f ∈ H|f 0 (x) esiste per q.o. x e f 0 ∈ H} e definiamo T : DT ⊂ H → H come T f = f 0 , allora T non è chiuso. Dimostrazione. le funzioni semplici (cioè le funzioni ”a gradini”) sono evidentemente contenute in DT , inoltre f (x) = x può essere approssimato uniformemente (e quindi in L2 (0, π)) da funzioni semplici e sia {fn }n una successione di funzioni semplici tali che fn → f in L2 , allora si ha T fn = 0 per ogni n, quindi 0 = limn→∞ T fn ma 0 6= T f = 1, quindi T non è chiuso. Teorema 3.6.2. Sia T : DT ⊂ H → H un operatore lineare tale che se {xn }n è una successione in DT , xn → 0 e T xn → y allora si abbia y = 0. Allora si può estendere T nel seguente modo: se {xn }n è una successione di DT tale che xn → x e T xn → y, si definisce T x = y. Inoltre l’operatore cosı̀ esteso è chiuso. Dimostrazione. affinchè l’estensione dell’ipotesi abbia senso si deve verificare che se {xn }n , {x̂n }n sono successioni di DT tali che xn → x, x̂n → x e T xn → y e T x̂n → ŷ allora y = ŷ. Supponiamo per assurdo y 6= ŷ e poniamo dn = xn − x̂n , allora {dn }n è una successione di DT tale che dn → 0 e T dn → y − ŷ, quindi per ipotesi si deve avere y − ŷ = 0, assurdo. Verifichiamo ora che T è chiuso: notiamo innanzitutto che DT è il sottospazio di H costituito dagli x tali che esistano una successione {xn }n di DT e y ∈ H tali che xn → x e T xn → y. Sia ora {pn }n una successione di DT tale che pn → p e T pn → q. Vediamo innanzitutto che p ∈ DT : per (i) (i) (i) ogni pn esiste una successione {pn }i di DT tale che pn → pn e T pn → T pn e non è quindi difficile (n) (n) (n) mostrare che {pn }n è una successione di elementi di DT tale che pn → p e T pn → q, quindi (n) p ∈ DT . Inoltre per costruzione si ha T p = limn→∞ T pn = q, che mostra che T è chiuso. Corollario 3.6.1. Condizione necessaria e sufficiente affinchè un operatore T : DT ⊂ H → H ammetta una estensione chiusa è che per ogni successione {xn }n di DT tale che xn → 0 e T xn → y si abbia y = 0. Dimostrazione. il teorema precedente mostra che la condizione è sufficiente; vediamo che è anche necessaria: sia T un operatore per cui esiste una successione {xn }n di DT tale che xn → 0 e T xn → y 6= 0 e supponiamo per assurdo che esista una estensione chiusa T : DT ⊂ H → H dell’operatore T , allora per definizione di estensione si deve avere DT ⊂ DT e T |DT = T . Sia ora {xn }n la successione precedentemente citata, allora essa è contenuta in DT e si ha xn → 0 e T xn = T xn → y 6= 0, ma poichè T è chiuso per ipotesi si deve avere y = T 0 = 0, assurdo. Definizione 3.6.5. Sia T : DT ⊂ H → H un operatore lineare; esso si dice chiudibile se ammette una estensione chiusa. Sia T una estensione chiusa di T , essa si chiama estensione minimale di T se soddisfa la relazione GT = GT , cioè il grafico dell’estensione di T è la chiusura del grafico di T. Lemma 3.6.5. Sia T : DT ⊂ H → H un operatore chiudibile, allora esiste sempre una estensione minimale di T . Dimostrazione. per provare il lemma basterà mostrare che l’estensione definita nel teorema 3.6.2 è l’estensione minimale di T . Sia {x, y} ∈ GT , allora per come è stato costruito T deve esistere una successione {xn }n di DT tale che xn → x e T xn → y, cioè {xn , T xn } → {x, y} in K, inoltre {xn , T xn } ∈ GT e quindi GT ⊂ G(T ). Sia ora {x, y} ∈ GT , allora esiste una successione {{xn , T xn }}n tale che {xn , T xn } → {x, y} in K, cioè xn → x e T xn → y, ma allora per definizione si ha x ∈ DT e T x = y, quindi GT ⊂ GT . Se T : DT ⊂ H → H non è chiudibile la non esistenza di una estensione minimale è dovuta al fatto che GT non può essere grafico di nessun operatore, poichè contiene elementi della forma {f, g1 }, {f, g2 }, dove g1 6= g2 . Consideriamo ad esempio l’operatore dell’esempio 3.6.2; è semplice vedere che l’operatore T ivi considerato non è chiudibile usando direttamente la definizione ma quı̀ procederemo in altro modo: se T fosse chiudibile esisterebbe una sua estensione chiusa T̃ ed allora si dovrebbe avere GT ⊂ GT̃ e GT̃ dovrebbe essere chiuso, allora si dovrebbe anche avere GT ⊂ GT̃ . 3.6. OPERATORI CHIUSI E CHIUDIBILI 89 Mostriamo ora che GT non può essere contenuto nel grafico di nessun operatore (chiuso o no), il chè concluderà: consideriamo le funzioni su [−π, 0] su [−π, −1/n) 0 0 0 su [−π, 0] nx su (0, 1/n] f˜n = nx + 1 su (−1/n, 0) fn = f= (3.6.12) 1 su (0, π] 1 su (1/n, 1) 1 su [0, π] allora è semplice vedere che fn → f e f˜n → f , T fn = 0 e T f˜n = 1, quindi GT contiene sia {f, 0} che {f, 1} e quindi non può essere contenuto nel grafico di nessun operatore. Esempio 3.6.5. Sia H = L2 (0, π), DT = C 1 ([0, π]), cioè lo spazio delle funzioni constinue su [0, π] e derivabili con derivata continua in (0, π) che ammette estensione continua a [0, π], e sia T f = f 0 , allora T non è chiuso ma è chiudibile. Dimostrazione. vediamo che T 0 n(x − π2 ) gn = 1 non è chiuso: definiamo su [0, π/2] su (π/2, π/2 + 1/n) su [π/2 + 1/n, π] g= 0 1 su [0, π/2] su (π/2, π] (3.6.13) Rx Rx definiamo ora fn (x) = 0 gn (t)dt e f (x) = 0 g(t)dt, allora si ha fn ∈ DT e f 6∈ DT . Mostriamo che fn → f uniformemente (e quindi in L2 (0, π)): Z Z x x g(t)dt − 0 0 Z gn (t)dt ≤ π/2+1/n |g(t) − gn (t)|dt ≤ 2/n (3.6.14) π/2 quindi si ha fn ∈ DT , fn → f ∈ H, T fn = gn → g ∈ H ma f 6∈ DT , quindi T non è chiuso. Verifichiamo che T è chiudibile: sia {fn } una successione di DT tale che fn → 0 e fn0 → g; mostriamo che g = 0. Sia φ ∈ Cc∞ ([0, π]), allora si ha Z (g, φ) = (lim fn0 , φ) = lim(fn0 , φ) = lim 0 Z π fn0 φ π = − lim fn φ0 = (3.6.15) 0 = − lim(fn , φ0 ) = −(lim fn , φ0 ) = −(0, φ0 ) = 0 quindi g ⊥ Cc∞ ([0, π]) e quindi g = 0. Teorema 3.6.3. Sia T : DT ⊂ H → H un operatore lineare, DT = H (quindi esiste T + ) e DT + = H (quindi esiste T ++ ), allora T è chiudibile e T ++ è una estensione (chiusa per il lemma 3.6.4) di T . Dimostrazione. verifichiamo prima di tutto che T è chiudibile: sia {xn }n una successione di DT tale che xn → 0 e T xn → y e sia z ∈ DT + , allora si ha (y, z) = (lim T xn , z) = lim(T xn , z) = lim(xn , T + z) = (lim xn , T + z) = (0, T + z) = 0 (3.6.16) quindi y ⊥ DT + , ma si ha per ipotesi DT + = H, quindi y ⊥ H e y = 0, quindi T è chiudibile. Verifichiamo ora che T ++ è una estensione di T : se x ∈ DT + e y ∈ DT si ha (x, T y) = (T + x, y), cioè scrivendo T + = A si ha (y, Ax) = (T y, x) cioè y ∈ DA+ e A+ y = T y, cioè y ∈ DT ++ e T ++ y = T y, quindi DT ⊂ DT ++ e T ++ |DT = T , quindi T ++ è una estensione di T . Al teorema seguente premettiamo un semplice lemma: Lemma 3.6.6. Sia V un sottospazio di H e U : H → H un operatore unitario, allora si ha UV = UV . 90 CAPITOLO 3. SPAZI DI HILBERT ED OPERATORI LINEARI Dimostrazione. se x ∈ U V allora esiste una successione {vn }n in V tale che x = lim U vn ; inoltre si ha kvn − vm k = kU vn − U vm k e poichè la successione {U vn }n è convergente (a x) è convergente anche la successione {vn }n , sia vn → z, allora si ha z ∈ V e x = lim U vn = U lim vn = U z, quindi x ∈ U V e quindi U V ⊂ U V . Se invece x ∈ U V allora esiste z ∈ V tale che x = U z, inoltre esiste una successione {vn }n di V tale che vn → z, quindi x = U lim vn = lim U vn ; la successione {U vn }n è una successione di U V , quindi x ∈ U V , quindi infine U V ⊂ U V . Teorema 3.6.4. Sia T : DT ⊂ H → H un operatore lineare chiudibile tale che DT = H, allora si ha anche DT + = H e T ++ = T (dove T indica l’estensione chiusa minimale di T ). Dimostrazione. su K = H × H consideriamo l’operatore lineare U : K → K definito da U {x, y} = {y, −x}, allora si ha DU = ImU = K, inoltre si ha kU {x, y}k2 = k{y, −x}k2 = kyk2 + kxk2 = k{x, y}k2 (3.6.17) quindi U è un operatore unitario (vedi lemma 3.4.3). Inoltre si ha U 2 {x, y} = U {y, −x} = {−x, −y}, quindi U 2 = −I. Servirà inoltre notare che se U : H → H è un operatore unitario allora si ha U (A ⊕ B) = U A ⊕ U B (la verifica è immediata). Siano x ∈ DT + e y ∈ DT , allora si ha (x, T y) − (T + x, y) = 0, cioè ({x, T + x}, {T y, −y}) = 0 quindi ({x, T + x}, U {y, T y}) = 0; inoltre {x, T + x} è un generico elemento di GT + mentre {y, T y} è un generico elemento di GT , quindi si ottiene GT + ⊥ U GT . Per la continuità del prodotto scalare si ha allora anche GT + ⊥ U GT e per il lemma precedente GT + ⊥ U GT e per la definizione di estensione chiusa minimale si ha GT + ⊥ U GT ; inoltre sia GT + che U GT sono chiusi. Sia ora {a, b} ∈ K tale che {a, b} ⊥ U GT , allora per ogni y ∈ DT si ha 0 = ({a, b}, U {y, T y}) = ({a, b}, {T y, −y}) = (a, T y) − (b, y) (3.6.18) in particolare l’equazione precedente vale per ogni y ∈ DT (poichè DT ⊂ DT ) quindi a ∈ DT + e b = T + a, quindi {a, b} ∈ GT + , quindi (U GT )⊥ ⊂ GT + ; inoltre si è visto che GT + ⊥ U GT , cioè GT + ⊂ (U GT )⊥ , quindi si ottiene K = GT + ⊕ U GT (3.6.19) Applicando U alla precedente uguaglianza e ricordando che U 2 = −I, U K = K e che −GT = GT si ottiene K = U GT + ⊕ GT (3.6.20) Quindi, riassumendo, se T è un operatore lineare tale che DT = H allora GT + è il complemento ortogonale di U GT (vedi equazione 3.6.19). Se si suppone che sia anche DT + = H si ottiene allora che GT ++ è il complemento ortogonale di U GT + , ma poichè T + è chiuso si ha T + = T + e quindi GT ++ = (U GT + )⊥ , ma per l’equazione 3.6.20 si ha (U GT + )⊥ = GT e quindi si conclude che GT ++ = GT e quindi infine T ++ = T . Resta quindi solo da dimostrare che DT + = H: sia x ⊥ DT + , allora per ogni z ∈ DT + si ha 0 = (x, z) = (x, z) − (0, T + z) = (0, T + z) − (x, z) = = ({0, x}, {T + z, −z}) = ({0, x}, U {z, T + z}) (3.6.21) quindi {0, x} ∈ (U GT + )⊥ e quindi per 3.6.20 {0, x} ∈ GT , quindi x = T 0 = 0, quindi l’unico vettore ortogonale a DT + è 0, quindi H = DT + . Riportiamo ora alcuni fatti non elementari circa la relazione tra derivazione ed integrazione secondo Lebesgue per le cui dimostrazioni si rimanda all’appendice G. 1 Teorema 3.6.5 R x (Teorema Fondamentale del Calcolo, Lebesgue). 0Sia f ∈ L (a, b) e definiamo F (x) = a f (t)dt, allora F è derivabile per q.o. x e l’uguaglianza F = f vale q.o. 3.6. OPERATORI CHIUSI E CHIUDIBILI 91 Definizione 3.6.6. Sia J ⊂ R un intervallo. Una funzione f : J → C è detta assolutamente continua se per ogni > 0 esiste un δ > 0 tale che per ogni famiglia finita {(ai , bi )}i di intervalli disgiunti contenuti in J tale che n X |bi − ai | < δ (3.6.22) i=1 si abbia n X |f (bi ) − f (ai )| < (3.6.23) i=1 Dalla definizione segue immediatamente che ogni funzione assolutamente continua è anche uniformemente continua (basta prendere un intervallo solo) ma non è vero il viceversa (come si vedrà tra poco). Rx Lemma 3.6.7. sia f ∈ L1 (a, b) e sia F (x) = a f (t)dt, allora F è assolutamente continua. Teorema 3.6.6 (Teorema Fondamentale del Calcolo). Sia f : [a, b] → C una funzione assolutamente continua, allora f è derivabile q.o., f 0 ∈ L1 (a, b) e si ha per ogni a ≤ x ≤ b la relazione Z x f (x) − f (a) = f 0 (t)dt (3.6.24) a Corollario 3.6.2. Una funzione f : [a, b] → C può essere scritta nella forma Z x f (x) = f (a) + φ(t)dt (3.6.25) a per qualche φ ∈ L1 (a, b) se e solo se f è assolutamente continua ed in questo caso si ha φ(t) = f 0 (t) per q.o. t ∈ (a, b). Teorema 3.6.7 (Formula d’integrazione per parti). Se f, g : [a, b] → C sono funzioni assolutamente continue e x, y ∈ [a, b] allora si ha Z y Z y 0 f (t)g(t)dt = f (y)g(y) − f (x)g(x) − f (t)g 0 (t)dt (3.6.26) x x Vediamo ora usando il teorema 3.6.6 come non tutte le funzioni uniformemente continue siano assolutamente continue costruendo la funzione di Cantor-Vitali (esempio tratto dal testo [4] della bibliografia). Definiamo induttivamente una successione di funzioni definite su [0, 1]: 1 x ∈ [0, 1/3] 2 Vk (3x) 1 x ∈ (1/3, 2/3) V0 (x) = x; Vk+1 (x) = (3.6.27) 2 1 + 1 V [3(x − 2/3)] x ∈ [2/3, 1] k 2 2 È immediato verificare per induzione la seguente affermazione: ogni Vk è continua e Vk (0) = 0, Vk (1) = 1. Vediamo ora per induzione che |Vk (x) − Vk−1 (x)| ≤ 22−k . Per k = 1 questa affermazione si vede banalmente essere vera. Supponiamo ora sia vera per k = n e vediamo che è vera anche per k = n + 1: sia ad esempio x ∈ [0, 1/3], allora si ha 1 1 |Vn+1 (x) − Vn (x)| = | Vn (3x) − Vn (x)| = | Vn (y) − Vn (y/3)| = 2 2 1 1 1 1 = | Vn (y) − Vn−1 (y)| = |Vn (y) − Vn−1 (y)| ≤ 22−n = 22−(n+1) 2 2 2 2 (3.6.28) nei casi x ∈ (1/3, 2/3) e x ∈ [2/3, 1] la tesi si dimostra con lo stesso trucco e quindi la tesi è mostrata. Da ciò segue che la successione di funzioni {Vk }k converge uniformemente ad una funzione continua, 92 CAPITOLO 3. SPAZI DI HILBERT ED OPERATORI LINEARI V che essendo continua su un compatto è anche uniformemente continua. Questa è la funzione di Cantor-Vitali. Sia ora C l’insieme di Cantor (che è un insieme chiuso) e sia x ∈ C c , allora dalla definizione 3.6.27 è semplice dedurre l’esistenza di due numeri vx , Nx tali he se k > Nx allora si ha Vk (x) = vx in un intorno di x, quindi in particolare V (x) = vx in un intorno di x, quindi per ogni x ∈ C c la funzione di Cantor-Vitali è derivabile con derivata nulla e poichè C è un insieme trascurabile si ha quindi V 0 (x) = 0 per q.o. x ∈ (0, 1). Inoltre dal fatto che per ogni k si ha Vk (0) = 0 e Vk (1) = 1 segue che V (0) = 0 e V (1) = 1. Supponiamo quindi per assurdo che V sia assolutamente continua, allora si avrebbe Z 1 V (1) − V (0) = V 0 (t)dt = 0 (3.6.29) 0 quindi 1 = V (1) = V (0) = 0, assurdo, quindi V non può essere assolutamente continua. Si è visto nell’esempio 3.6.5 che se H = L2 (0, π), DT = C 1 ([0, π]) e T f = f 0 , allora T non è chiuso ma è chiudibile. Utilizzando il teorema 3.6.4 ed i teoremi enunciati sulle funzioni assolutamente continue si può determinare l’estensione chiusa minimale di T . Esempio 3.6.6. Siano H = L2 (0, π), DT = C 1 ([0, π]) e T f = f 0 , allora l’estensione chiusa minimale T è T : DT ⊂ H → H, dove DT = {f : [0, π] → C|f assolutamente continua } e T f = f 0. Dimostrazione. cerchiamo di determinare T + : se h ∈ DT esiste h∗ ∈ H tale che (h, T f ) = (h∗ , f ) per ogni f ∈ C 1 ([0, π]), cioè Z π (h, f 0 ) = h∗ (x)f (x)dx (3.6.30) Rx ∗ 0 ∗ sia ora H (x) = 0 h (t)dt, allora (vedi lemma 3.6.7) H ∗ è assolutamente continua, quindi (teorema 3.6.7) si può integrare per parti e per il teorema 3.6.5 si ottiene Z π Z π ∗ 0 0 ∗ ∗ (H , f ) = H (x)f (x)dx = H (π)f (π) − h∗ (x)f (x)dx = f (π)(h∗ , 1) − (h∗ , f ) (3.6.31) 0 0 quindi (H ∗ + h, f 0 ) = f (π)(h∗ , 1) (3.6.32) Se si considera ora f (x) = sin nx, quindi f (π) = 0, f 0 (x) = n cos nx, si ottiene che (h+H ∗ , cos nx) = 0 per ogni n > 0 quindi, poichè {cos nx}n∈N è una base ortogonale di L2 (0, π), si ottiene h(x) + H ∗ (x) = cost. La costante può essere determinata ponendo x = 0, ottenendo quindi Z x h(x) − h(0) = (−h∗ (t))t (3.6.33) 0 ∗ 0 quindi per il corollario 3.6.2 si ha h0 (x) = R π−h (x) per0 q.o. x ∈ (0, π), quindi l’equazione (h, f ) = ∗ 0 0 (h , f ) diventa (h, f ) + (h , f ) = 0 cioè 0 (h(x)f (x)) dx = 0 e quindi h(π)f (π) − h(0)f (0) = 0; a questo punto scegliendo ad esempio f (x) = x e f (x) = x − π si ottiene h(π) = h(0) = 0. quindi si ottiene DT + ⊂ {h : [0, π] → C|h assolutamente continua e h(0) = h(π) = 0} (3.6.34) e T + h = −h0 . D’altro canto se h è nell’insieme a destra di 3.6.34 allora si ha, per il teorema 3.6.7, Z π Z π 0 h(x)f (x)dx = − h0 (x)f (x)dx = (−h0 , f ) (3.6.35) (h, T f ) = 0 0 e quindi h ∈ DT + , quindi si ottiene DT + = {h : [0, π] → C|h assolutamente continua e h(0) = h(π) = 0} (3.6.36) 3.6. OPERATORI CHIUSI E CHIUDIBILI 93 e T + h = −h0 . Determiniamo ora T ++ : se p ∈ DT ++Rallora esiste p∗ tale che per ogni h ∈ DT + si x abbia (p, T + h) = (p∗ , h), quindi, definendo P ∗ (x) = 0 p∗ (t)dt, si ottiene, analogamente a 3.6.31, Z (P ∗ , h0 ) = 0 π Z P ∗ (x)h0 (x)dx = − π p∗ (x)h(x)dx = −(p∗ , h) (3.6.37) 0 quindi (p, T + h) = −(p, h0 ) = (p∗ , h) = −(P ∗ , h0 ), quindi (p − P ∗ , h0 ) = 0. Scegliendo h(x) = sin nx (p − P ∗ , cos nx) = 0 per ogni n > 0 e quindi p(x) − P ∗ (x) = cost, da cui p(x) − p(0) = Rsixottiene ∗ p (t)dt, quindi p è assolutamente continua e p∗ = p0 , quindi si ha 0 DT ++ ⊂ {p : [0, π] → C|p assolutamente continua } (3.6.38) e T ++ p = p0 . D’altro canto se p è assolutamente continua e h ∈ DT + si ha Z π d (p∗ , h) − (p, T + h) = (p∗ , h) + (p, h0 ) = (p0 , h) + (p, h0 ) = (ph)dt = [p(x)h(x)]π0 = 0 (3.6.39) 0 dt quindi si ottiene infine DT ++ = {p : [0, π] → C|p assolutamente continua } e T p = T ++ p = p0 . (3.6.40) Appendice A Spazi Lp In questa appendice ci si limiterà a trattare spazi Lp sul campo reale in quanto la maggior parte dei risultati ottenuti si può dimostrare immediatamente anche per il campo complesso separando parte reale e immaginaria. A.1 Definizioni Definizione A.1.1. Sia M ⊂ Rn un insieme misurabile e sia f : M → R una funzione reale; si dice che f appartiene all’insieme Lp (M ) se f p è integrabile su M , 1 ≤ p < ∞; si dice che f ∈ L∞ (M ) se esiste C > 0 tale che |f (x)| ≤ C per q.o. x ∈ M e f è misurabile. Definizione A.1.2. Siano f, g ∈ Lp (M ); si scriverà f ∼ g (f è equivalente a g) se f = g quasi ovunque in M . È immediato verificare il seguente lemma: Lemma A.1.1. La relazione ∼ introdotta nella definizione precedente è una relazione di equivalenza in Lp (M ). Definizione A.1.3. Si indica con Lp (M ) lo spazio quoziente Lp (M )/ ∼. Se a, b ∈ Lp (M ), siano f, g ∈ Lp (M ) tali che a = [f ] e b = [g], definiamo allora a + b = [f + g] λa = [λf ] Si vede semplicemente che le definizioni precedenti sono non ambigue, cioè non dipendono dai particolari rappresentanti f, g delle classi a, b. Dotato di queste operazioni l’insieme Lp diviene uno spazio vettoriale (si dovrebbe vedere che a + b ∈ Lp (M ), vedi la dimostrazione in A.2.2). Definizione A.1.4. Sia a ∈ Lp (M ) e sia f tale che a = [f ], allora si definisce norma di a il valore Z 1/p p kakp = |f (x)| dx M se 1 ≤ p < ∞. Se p = ∞ si definisce kak∞ = inf {C| |f (x)| ≤ C per q.o. x ∈ M } C∈R la norma di a è ben definita, cioè non dipende dal particolare rappresentante di a scelto. Nella prossima sezione si mostrerà come k kLp sia effettivamente una norma su Lp . Nonostante gli spazi Lp siano spazi di classi di equivalenza, è uso comune indicare gli elementi di Lp come fossero funzioni, assumendo implicitamente di identificare funzioni uguali q.o. 94 A.2. PROPRIETÀ FONDAMENTALI A.2 95 Proprietà fondamentali Definizione A.2.1. Sia 1 ≤ p ≤ ∞, si indica con p0 l’esponente coniugato di p, cioè il numero tale che 1 1 + =1 p p0 si assume inoltre che 1 sia l’esponente coniugato di ∞ e viceversa. 0 Teorema A.2.1 (Disuguaglianza di Hölder). Siano f ∈ Lp (M ) e g ∈ Lp (M ), allora f g ∈ L1 (M ) e si ha Z |f (x)g(x)|dx ≤ kf kp kgkp0 (A.2.1) M Dimostrazione. la tesi è ovvia se p = 1 o p = ∞. Dalla concavità della funzione log su (0, ∞) segue che per ogni a > 0, b > 0 si ha ! 0 0 ap bp 1 1 log + 0 ≥ log(ap ) + 0 log(bp ) = log(ab) (A.2.2) p p p p da cui si ottiene la disuguaglianza di Young ab ≤ 1 p 1 0 a + 0 bp p p (A.2.3) che vale per ogni a, b ≥ 0. Applicando la disuguaglianza di Young con a = |f (x)| e b = |g(x)| (ciò 0 ha senso poichè f p e g p sono integrabili su M e quindi |f (x)|, |g(x)| < ∞ q.o. su M ) si ottiene che per q.o. x di M si ha 0 1 1 |f (x)g(x)| ≤ |f (x)|p + 0 |g(x)|p (A.2.4) p p da cui integrando Z |f (x)g(x)|dx ≤ M 0 1 1 kf kpp + 0 kgkpp0 p p (A.2.5) da cui segue che f g è integrabile su M . Sostituendo nella A.2.5 f con λf (λ > 0), si ottiene Z 0 λp−1 1 |f (x)g(x)|dx ≤ kf kpp + 0 kgkpp0 (A.2.6) p pλ M scegliendo p0 /p λ= kgkp0 kf kp (A.2.7) e ricordando la definizione di esponente coniugato si ottiene l’equazione A.2.1. Nella definizione di λ si è supposto che kf kp > 0 in quanto se kf kp = 0 si ha f (x) = 0 q.o. ed il teorema risulta ovvio. Teorema A.2.2 (Disuguaglianza di Minkowski). Se f, g ∈ Lp (M ), 1 ≤ p ≤ ∞ si ha kf + gkp ≤ kf kp + kgkp (A.2.8) Dimostrazione. i casi p = 1, p = ∞ sono ovvi; supponiamo quindi 1 < p < ∞. Se x > 0 e p > 1 vale la disuguaglianza (1 + x)p ≤ 2p−1 (1 + xp ) (A.2.9) (si dimostra studiando la funzione (1 + x)p /(1 + xp ) che, per x > 0 ha massimo in x = 1 in cui vale 2p−1 ) da cui si deduce che se p > 1 e a, b ≥ 0 si ha (a + b)p ≤ 2p−1 (ap + bp ) (A.2.10) APPENDICE A. SPAZI LP 96 (se a = 0 la disuguaglianza è ovvia, se a > 0 si raccoglie a e si ha la disuguaglianza A.2.9 con x = b/a). Sostituendo a = |f (x)|, b = |g(x)| e integrando si vede che f + g ∈ Lp (M ). Inoltre Z Z Z p p−1 p−1 kf + gkp = |f + g| |f + g| ≤ |f + g| |f | + |f + g|p−1 |g| (A.2.11) M M M 0 Ma |f + g|p−1 ∈ Lp (M ) poichè (p − 1)p0 = p e f + g ∈ Lp (M ), quindi applicando la disuguaglianza di Hölder ai due integrali a secondo membro si ottiene: kf + gkpp ≤ kf + gkp−1 (kf kp + kgkp ) p (A.2.12) da cui si ottiene A.2.8 (il caso kf + gkp = 0 è ovvio). Corollario A.2.1. La norma k kp è effettivamente una norma sullo spazio vettoriale Lp . Dimostrazione. l’unica proprietà non banale da mostrare della norma è la disuguaglianza triangolare, che è la disuguaglianza di Minkowski. Teorema A.2.3 (Fischer-Riesz). Lp (M ) è uno spazio di Banach per ogni 1 ≤ p ≤ ∞. Dimostrazione. si devono distinguere i casi p = ∞ e 1 ≤ p < ∞. Caso p = ∞) Sia {fn } una successione di Cauchy in L∞ (M ), cioè fissato k ∈ N, k ≥ 1 esiste un Nk tale che se m, n ≥ Nk si ha kfm − fn k∞ ≤ 1/k, quindi esiste un insieme trascurabile Ek tale che 1 |fm (x) − fn (x)| < se x ∈ Ekc ∩ M, ∀m, n ≥ Nk (A.2.13) k S sia E = k∈N,k>0 Ek , allora E è trascurabile e per ogni x ∈ E c ∩ M la successione {fn (x)} è di Cauchy in R, quindi esiste un numero f (x) tale che limn→∞ fn (x) = f (x). Passando al limite nella disequazione A.2.13 si ottiene |f (x) − fn (x)| ≤ 1 se x ∈ E c ∩ M, ∀n ≥ Nk k (A.2.14) perciò f è misurabile su M in quanto limite puntuale q.o. di funzioni misurabili e f ∈ L∞ (M ); inoltre da A.2.14 si deduce che kf − fn k∞ ≤ 1/k per ogni n ≥ Nk , quindi fn → f in L∞ (M ). Caso 1 ≤ p < ∞) sia {fn } una successione di Cauchy in Lp . Poichè se una successione di Cauchy ammette una sottosuccessione convergente è essa stessa convergente (dimostrazione immediata), basta mostrare che esiste una sottosuccessione {fnk } convergente. Sia {fnk } una sottosuccessione tale che 1 kfnk+1 − fnk kp ≤ k (A.2.15) 2 Per semplicità di notazione si scriverà fk invece di fnk . Sia gn (x) = n X |fk+1 (x) − fk (x)| (A.2.16) k=1 p da A.2.16 segue che kgn kp ≤ 1 (si applica la disuguaglianza di Minkowski). Si ha 0 ≤ gnp ≤ gn+1 q.o. p su M , quindi per il teorema della convergenza monotona di Beppo-Levi, g tende puntualmente n R q.o. su M ad un limite fissato g p tale che g p ≤ 1, cioè gn (x) → g(x) puntualmente q.o. su M e g ∈ Lp (M ). Inoltre se m ≥ n ≥ 2 si ha |fm (x) − fn (x)| ≤ |fm (x) − fm−1 (x)| + · · · + |fn+1 (x) − fn (x)| ≤ g(x) − gn−1 (x) (A.2.17) quindi, poichè gn (x) → g(x) per q.o. x ∈ M , {fn (x)} è una successione di Cauchy in R per q.o. x ∈ M , quindi fn (x) tende ad un limite finito f (x) per quasi ogni x ∈ M . Dalla disequazione A.2.17 segue per m → ∞ che per q.o. x ∈ M si ha (n ≥ 2) |f (x) − fn (x)| < g(x) (A.2.18) A.3. PROPRIETÀ DI DENSITÀ 97 quindi in particolare f ∈ Lp (M ) poichè g, fn ∈ Lp (M ). Poichè infine |fn (x) − f (x)|p → 0 q.o. in M e |fn − f |p ≤ g p ∈ L1 (M ) si conclude grazie al teorema della convergenza dominata di Lebesgue che Z lim |f (x) − fn (x)|p dx = 0 (A.2.19) n→∞ M e quindi kf − fn kp → 0 cioè f è il limite in Lp (M ) di fn . Teorema A.2.4. Sia {fn } una successione in Lp (M ) e sia f ∈ Lp (M ) tale che kf − fn kp → 0, allora esistono una sottosuccessione {fnk } e una funzione h ∈ Lp (M ) tali che 1. fnk (x) → f (x) per q.o. x 2. |fnk (x)| ≤ h(x) per ogni k, per q.o. x ∈ M Dimostrazione. la tesi è ovvia se p = ∞; supponiamo quindi 1 ≤ p < ∞. Poichè {fn } converge, essa è una successione di Cauchy, quindi , come nella dimostrazione del teorema A.2.3, si può estrarre una sottosuccessione (che continueremo per semplicità ad indicare con fk ) che soddisfa A.2.15, in modo che, procedendo come nella dimostrazione precedente, si abbia che fk (x) tende ad un limite finito φ(x) per q.o. x ∈ M (si dovrà mostrare che f = φ) e soddisfi A.2.18, che diventa |φ(x) − fk (x)| ≤ g(x) (A.2.20) per ogni k e per q.o. x ∈ M , con g ∈ Lp (M ). Applicando il teorema della convergenza dominata di Lebesgue si ottiene quindi fk → φ in Lp (M ) e quindi, per l’unicità del limite in uno spazio normato si ha φ = f (uguaglianza da intendere in Lp (M ), cioè valida per q.o. x ∈ M ). Inoltre da A.2.20 segue |fk (x)| ≤ |φ(x)| + g(x) per q.o. x ∈ M . A.3 Proprietà di densità Con χE si indica la funzione caratteristica dell’insieme E, cioè 1 se x ∈ E χE (x) = 0 se x ∈ /E Si chiama funzione semplice una funzione che sia combinazione lineare di funzioni caratteristiche. Teorema A.3.1. Sia f una funzione misurabile positiva. Allora esiste una successione sn crescente di funzioni semplici misurabili che converge puntualmente a f . Dimostrazione. per ogni i = 1, . . . , n2n , n ∈ N poniamo Eni = {x| i−1 i ≤ f (x) < n } n 2 2 Fn = {x|f (x) ≥ n} allora Eni , Fn risultano misurabili (poichè f è misurabile) e la successione cercata è n sn = n2 X i−1 i=1 2n χEni + nχFn che risulta misurabile poichè sono misurabili Eni e Fn . Ricordiamo che si chiama supporto di una funzione la chiusura dell’insieme su cui una funzione è diversa da zero; il supporto di una funzione sarà indicato con ’supp’. Si indica con Cc (E) lo spazio delle funzioni f : E → R continue tali che esiste un insieme compatto K ⊂ E tale che suppf ⊂ K e con Cc∞ (E) il sottospazio di Cc (E) delle funzioni che ammettono derivate parziali di ordine qualsiasi nell’insieme E̊. APPENDICE A. SPAZI LP 98 Teorema A.3.2. Sia f ∈ Lp (Rn ), 1 ≤ p < ∞, allora per ogni > 0 esiste una funzione semplice misurabile a supporto compatto s tale che kf (x) − s(x)kp < . Dimostrazione. si può supporre f positiva, poichè il caso generale seguirà applicando il procedimento usato a f + e f − . Si è visto che assegnata f positiva e misurabile esiste una successione crescente di funzioni semplici misurabili positive sn tali che limn→∞ sn (x) = f (x), cioè |f −sn | tende puntualmente q.o. a 0. Inoltre si ha evidentemente |f − sn |p ≤ f p ∈ L1 (Rn ), quindi applicando il R teorema di Lebesgue − sn (x)|p dx = 0 quindi si può ottenere una funzione R si ottiene limpn→∞ |f (x) p semplice s tale che |f (x) − s(x)| dx < (/2) e s ∈ L1 (Rn ). Sia ora Ii = [−i, i] × · · · × [−i, i] (dove compaiono n fattori) e consideriamo ri = sχIi con i ∈ N; ri è una successione crescente di funzioni semplici misurabili positive a supporto compatto che tende puntualmente a s, quindi applicando il in modo analogo a quanto appena fatto si ottiene che esiste un j tale che R teoremap di Lebesgue |s − rj | dx < (/2)p , da cui si ottiene infine kf (x) − rj (x)kp < + = 2 2 (A.3.1) Lemma A.3.1. Sia F ⊂ Rn chiuso e G ⊂ Rn aperto tale che F ⊂ G, allora esiste una funzione continua φ tale che φ(x) = 1 se x ∈ F , φ(x) = 0 se x ∈ / G e 0 ≤ φ ≤ 1. Dimostrazione. fissiamo in Rn una norma k k (tanto in Rn tutte le norme sono equivalenti). Dato x ∈ Rn e E ⊂ Rn si può definire d(x, E) = inf y∈E kx − yk. Notiamo che, fissato l’insieme E, la funzione x → d(x, E) è continua, infatti se z ∈ E, si ha: kx − zk ≤ kx − yk + ky − zk; ky − zk ≤ ky − xk + kx − zk (A.3.2) da cui kx − zk − kx − yk ≤ ky − zk ≤ ky − xk + kx − zk (A.3.3) quindi d(x, E) − kx − yk ≤ d(y, E) ≤ d(x, E) + kx − yk, e infine |d(x, E) − d(y, E)| ≤ kx − yk (A.3.4) quindi la funzione d(x, E) è lipschitziana. Costruiamo ora la funzione: φ(x) = d(x, Gc ) d(x, Gc ) + d(x, F ) (A.3.5) Poichè F e Gc sono chiusi disgiunti, la funzione è ben definita, in quanto se il denominatore si annullasse per un qualche t ∈ Rn , allora si dovrebbe avere d(t, F ) = d(t, Gc ) = 0 e poichè F e Gc sono chiusi, si verifica semplicemente che si dovrebbe avere t ∈ F e t ∈ Gc , quindi F ∩ G 6= ∅. Inoltre se x ∈ Gc si ha d(x, Gc ) = 0 e quindi φ(x) = 0 mentre se x ∈ F , d(x, F ) = 0 e quindi φ(x) = 1. Inoltre essendo composizione di funzioni continue φ è continua e si ha evidentemente 0 ≤ φ ≤ 1. Lemma A.3.2. Sia E misurabile limitato in Rn , allora, fissato > 0, 1 ≤ p < ∞ esiste una funzione f ∈ Cc (Rn ) tale che kχE − f kp < . Dimostrazione. poichè E è misurabile, esistono F chiuso e G aperto tali che F ⊂ E ⊂ G e µ(G\F ) < p . Sia ora f la funzione φ del lemma precedente, si ha allora Z Z |φ − χE |p dx ≤ χG\F dx < p (A.3.6) inoltre poichè E è limitato, G può essere scelto limitato (esiste un R tale che E ⊂ B(0, R), quindi si può sostituire a G l’insieme limitato G ∩ B(0, R)), quindi supp φ ⊂ Ḡ, ma Ḡ è un chiuso e limitato in Rn , quindi un compatto; il supporto di φ è quindi un sottoinsieme chiuso (per definizione) di un compatto ed è quindi un compatto. A.3. PROPRIETÀ DI DENSITÀ 99 In modo sostanzialmente identico al lemma precedente si mostra il seguente: Teorema A.3.3. Sia s una funzione semplice misurabile a supporto compatto e sia > 0, 1 ≤ p < ∞ allora esiste una funzione f ∈ Cc (Rn ) tale che ks − f kp < . Corollario A.3.1. Sia f ∈ Lp (Rn ), 1 ≤ p < ∞ allora fissato > 0 esiste una funzione φ ∈ Cc (Rn ) tale che kf − φkp < , cioè Cc (Rn ) è un sottoinsieme denso di Lp (Rn ) se 1 ≤ p < ∞. Dimostrazione. dal teorema A.3.2 segue che esiste una funzione s semplice misurabile a supporto compatto tale che kf − skp < /2; dal teorema A.3.3 segue che esiste una φ ∈ Cc (Rn ) tale che ks − φkp < /2, quindi kf − φkp < . Definizione A.3.1. Date due funzioni misurabili f, g si definisce come prodotto di convoluzione di f e g la funzione f ∗ g definita da Z f (x − y)g(y)dy (A.3.7) f ∗ g(x) = Rn Definizione A.3.2. Siano M un sottoinsieme misurabile di Rn e f : M → R; si dice che f ∈ Lploc (M ) se per ogni K ⊂ M compatto si ha gχK ∈ Lp (M ). Lemma A.3.3. Siano f ∈ Cc (Rn ) e g ∈ L1loc (Rn ), allora f ∗ g è ben definito per ogni x ∈ Rn . Dimostrazione. fissato x ∈ Rn , la funzione y → f (x − y)g(y) risulta non nulla solo su un insieme limitato di y ∈ Rn poichè f ha supporto compatto, quindi, poichè g è integrabile sui compatti, l’integrale che compare nella definizione di f ∗ g è finito per ogni x ∈ Rn . Lemma A.3.4. Siano f ∈ L1 (Rn ) e g ∈ Lp (Rn ), allora f ∗ g è definita per quasi ogni x ∈ Rn e si ha kf ∗ gkp ≤ kf k1 kgkp (A.3.8) Dimostrazione. se p = ∞ il teorema è ovvio. Caso p = 1) poniamo F (x, y) = f (x − y)g(y). Poichè per q.o. y ∈ Rn |g(y)| < ∞, si ha Z Z |F (x, y)|dx = |g(y)| |f (x − y)|dx = |g(y)|kf k1 (A.3.9) quindi Z Z dy |F (x, y)|dx = kf k1 kgk1 < ∞ (A.3.10) quindi usando il teorema di Tonelli si vede che F ∈ L1 (Rn × Rn ) e quindi usando il teorema di Fubini si ha Z Z Z Z kf ∗ gk1 = |f ∗ g(x)|dx = dx |f (x − y)g(y)|dy = |F (x, y)|dxdy = kf k1 kgk1 (A.3.11) che è l’equazione A.3.8 nel caso p = 1. Caso p > 1) dal caso precedente si sà che y → |f (x − y)g p (y)| è integrabile in y per q.o. x ∈ Rn , 0 0 cioè |f 1/p (x − y)g(y)| ∈ Lpy (Rn ). Poichè |f (x − y)|1/p ∈ Lpy (Rn ), usando la disuguaglianza di 0 Holder si ottiene (poichè |f (x − y)| = |f (x − y)|1/p |f (x − y)|1/p ) Z |f (x − y)g(y)|dy ≤ p/p0 cioè |f ∗ g(x)|p ≤ kf k1 p = 1 si ottiene infine 1/p0 kf k1 Z 1/p p |f (x − y)||g(y)| dy (A.3.12) (|f | ∗ |g|p )(x) quindi integrando e usando quanto già dimostrato nel caso p/p0 kf ∗ gkpp = kf k1 kf k1 kgkpp = kf kp1 kgkpp (A.3.13) APPENDICE A. SPAZI LP 100 Teorema A.3.4. Sia f ∈ Cc∞ (Rn ) e g ∈ L1loc (Rn ), allora f ∗ g ∈ C ∞ (Rn ). Dimostrazione. Per mostrare f ∗ g che è infinitamente differenziabile, basterà mostrare la seguente uguaglianza (∇ è l’operatore gradiente) ∇(f ∗ g) = (∇f ) ∗ g (A.3.14) Poichè f è differenziabile, se x, y, h ∈ Rn si ha f (x − y + h) − f (x − y) = h · (∇f )(x − y) + khk o(h) (A.3.15) dove o(h) è una funzione tale che limh→0 o(h) = 0. Sia K un compatto abbastanza grande tale che x + B(0, 1) − suppf ⊂ K, allora si ha se khk < 1 f (x − y + h) − f (x − y) = h · (∇f )(x − y) + khk o(h)χK (A.3.16) Moltiplicando l’equazione A.3.16 per g(y) e integrando in y si ottiene f ∗ g(x + h) − f ∗ g(x) = h · [(∇f ) ∗ g(x)] + khk o(h)C dove C = R K (A.3.17) g(y)dy, di conseguenza per la definizione di gradiente si ha l’equazione A.3.14. Lemma A.3.5. Siano f ∈ Cc (Rn ), g ∈ L1loc (Rn ) allora si ha: suppf ∗ g ⊂ suppf + suppg (A.3.18) Dimostrazione. fissato x la funzione y → f (x − y)g(y) è non nulla se y ∈ suppg e x − y ∈ suppf cioè se y ∈ suppg ∩ (x − suppf ) (A.3.19) se x ∈ / suppf + suppg, allora suppg ∩ (x − suppf ) = ∅, cioè f (x − y)g(y) = 0 per ogni y, cioè (f ∗ g)(x) = 0, quindi f ∗ g(x) 6= 0 ⇒ x ∈ supp f + supp g (A.3.20) di conseguenza suppf ∗ g ⊂ suppf + suppg (A.3.21) Definizione A.3.3. Si chiama successione di mollificatori una successione di funzioni ρi : Rn → R tale che 1. ρi ≥ 0 2. ρi ∈ Cc∞ 3. supp ρi ⊂ B(0, 1/i) R 4. ρi dx = 1 Esempio A.3.1. Sia e1/(|x| 0 2 −1) se |x| < 1 (A.3.22) se |x| ≥ 1 R Si vede subito che ρ ≥ 0, ρ ∈ Cc∞ , supp ρ ⊂ B(0, 1) e che ρdx < ∞. Allora si ottiene una successione di mollificatori ponendo Z ρi (x) = in ρ(ix)/ ρdx (A.3.23) ρ(x) = A.3. PROPRIETÀ DI DENSITÀ 101 Teorema A.3.5. Se f è continua e ρi è una successione di mollificatori, allora ρi ∗ f → f uniformemente sui compatti. Dimostrazione. sia K ⊂ Rn un compatto; allora, dato > 0, per il teorema di Heine-Cantor-Borel esiste un δ > 0 tale che |f (x − y) − f (x)| < se x ∈ K , y ∈ B(0, δ) (A.3.24) Si ha inoltre Z ρi ∗ f (x) − f (x) = Z [f (x − y) − f (x)]ρi (y)dy = [f (x − y) − f (x)]ρi (y)dy (A.3.25) B(0,1/i) Se ora si sceglie i > 1/δ e x ∈ K si ottiene quindi Z |ρi ∗ f (x) − f (x)| ≤ ρi dy = (A.3.26) Teorema A.3.6. Sia f ∈ Lp (Rn ) con 1 ≤ p < ∞, allora limn→∞ ρn ∗ f = f in Lp (Rn ). Dimostrazione. dato > 0 esiste una funzione f1 ∈ Cc (Rn ) tale che kf − f1 kp < (corollario A.3.1). Per il teorema precedente si ha ρn ∗ f1 → f1 uniformemente sui compatti, inoltre (vedi lemma A.3.5) si ha suppρn ∗ f1 ⊂ B(0, 1/n) + suppf1 ⊂ B(0, 1) + suppf = K (A.3.27) e si vede subito che K è un compatto. Ne segue che kρn ∗ f1 − f1 kp ≤ sup |ρ ∗ f1 (x) − f1 (x)|µ(K)1/p → 0 (A.3.28) (ρn ∗ f ) − f = [ρn ∗ (f − f1 )] + [(ρn ∗ f1 ) − f1 ] + [f1 − f ] (A.3.29) x∈K Inoltre si ha l’identità quindi se n > N si ha kρn ∗ f − f kp ≤ 2kf − f1 kp + kρn ∗ f1 − f1 k < 3 (A.3.30) quindi limn→∞ kρn ∗ f − f kp = 0. Lemma A.3.6. L1loc (Rn ) ⊂ Lp (Rn ) per ogni 1 ≤ p < ∞ 0 Dimostrazione. sia K ⊂ Rn un insieme compatto, allora µ(K) < ∞, quindi χK ∈ Lp (Rn ) per ogni p0 . Applicando allora la disuguaglianza di Holder si ha Z Z Z |f (x)|dx = K χK (x)f (x)dx ≤ K 1/p0 Z 1/p 1 dx |f (x)|p dx ≤ Ckf kp < ∞ p0 K (A.3.31) K Teorema A.3.7. Sia A ⊂ Rn un insieme aperto, allora Cc∞ (A) è denso in Lp (A) per ogni 1 ≤ p < ∞. APPENDICE A. SPAZI LP 102 Dimostrazione. sia f ∈ Lp (A) e sia f¯ : Rn → R definita da f (x) se x∈A f¯(x) = 0 se x ∈ Ac (A.3.32) in modo che f¯ ∈ Lp (Rn ). Sia inoltre Kn una successioni di insiemi compatti tali che Kn ⊂ Kn+1 , ∪n Kn = A e d(Kn , Ac ) ≥ 2/n, ad esempio si può porre Ki = {x ∈ Rn |kxk < i, d(x, Ac ) ≥ 2/i} poniamo quindi gn = χKn f¯; fn = ρn ∗ gn (A.3.33) (A.3.34) Allora per il lemma A.3.5 si ha suppfn ⊂ B(0, 1/n) + Kn ⊂ A (A.3.35) inoltre per il lemma A.3.6 e per il teorema A.3.4 fn ∈ C ∞ (Rn ), quindi fn ∈ Cc∞ (A). Si hanno inoltre le seguenti disuguaglianze kfn − f kLp (A) = kfn − f¯kLp (Rn ) ≤ ¯ ¯ ≤ kρn ∗ gn − ρn ∗ f kp + kρn ∗ f − f¯kp ≤ kgn − f¯kp + kρn ∗ f¯ − f¯kp (A.3.36) Inoltre kgn − f¯kp → 0 per il teorema della convergenza dominata e kρn ∗ f¯− f¯kp → 0 per il teorema A.3.6, quindi infine kfn − f kLp (A) → 0 (A.3.37) In generale, dato un generico insieme misurabile M , non ha molto senso parlare di Cc∞ (M ) poichè ad esempio si potrebbe avere M̊ = ∅. Vale la seguente estensione del teorema A.3.7, che è sufficientemente generale da coprire tutti i casi che si presenteranno. Corollario A.3.2. Sia M ⊂ Rn un insieme misurabile tale che M̊ 6= ∅ e µ(M \M̊ ) = 0, allora Cc∞ (M ) è denso in Lp (M ) per ogni 1 ≤ p < ∞ Dimostrazione. sia f ∈ Lp (M ), allora f ∈ Lp (M̊ ) e per il teorema precedente per ogni > 0 esiste φ ∈ Cc∞ (M̊ ) tale che kf − φkLp (M̊ ) < . Prolunghiamo ora φ su M ponendo φ(x) = 0 se x ∈ M \M̊ , allora φ ∈ Cc∞ (M ) e si ha kf − φkLp (M ) < . Bibliografia: Si è seguito in particolare [1] paragrafi IV.1, IV.4, [8] capitolo III. Appendice B Convergenza puntuale della serie di Fourier B.1 Criterio di Dirichlet-Jordan Lemma B.1.1. Sia f (x) una funzione crescente definita su [a, b], allora G è continua eccetto per un insieme al più numerabile di x ∈ [a, b]. Dimostrazione. sia S l’insieme dei punti in cui è discontinua, cioè delle x tali che lim f (y) > lim f (y) y→x+ (B.1.1) y→x− allora ad ogni elemento x di S si può associare un razionale qx dell’intervallo non vuoto definito da B.1.1; poichè f è crescente se x, y ∈ S e x 6= y gli intervalli associati a x e a y saranno disgiunti, quindi la corrispondenza x → qx è biunivoca, quindi S è al più numerabile. Teorema B.1.1 (secondo teorema della media). Sia G una funzione crescente definita su [a, b] e sia f continua su [a, b], allora esiste un t0 ∈ [a, b] tale che ! Z t0 Z b Z b G(x)f (x)dx = G(a) f (x)dx + [ lim− G(x)] f (x)dx (B.1.2) a x→b a t0 Dimostrazione. definiamo G(x) = G(a) se x < a e Z t Z s 1 G(r)dr ds Gh (t) = 2 h t−h s−h (B.1.3) allora dal teorema fondamentale del calcolo segue che G0h (t) è una funzione continua e G0h (t) ≥ 0; Rt è inoltre semplice vedere che limh→0 Gh (t) = limy→t− G(y). Sia F (t) = a f (s)ds, allora Z b Z b Gh (t)f (t)dt = [F (t)Gh (t)]ba − F (t)G0h (t)dt (B.1.4) a a sia ora m = minx∈[a,b] F (x) e M = maxx∈[a,b] F (x), allora poichè G0h (t) ≥ 0 si ha Z b Z b Z b 0 0 m Gh (t)dt ≤ F (t)Gh (t)dt ≤ M G0h (t)dt a e quindi (se Rb a a G0h (t)dt 6= 0) (B.1.5) a Rb m≤ a F (t)G0h (t)dt ≤M Rb 0 Gh (t)dt a 103 (B.1.6) 104 APPENDICE B. CONVERGENZA PUNTUALE DELLA SERIE DI FOURIER e quindi per il teorema dei valori intermedi si vede che esiste un th ∈ [a, b] tale che Rb F (t)G0h (t)dt F (th ) = a R b G0h (t)dt a inserendo questa espressione in B.1.4 si ottiene Z Z b b Gh (t)f (t)dt = [F (t)Gh (t)]a − F (th ) a b a G0h (t)dt = (B.1.7) (B.1.8) = F (b)Gh (b) − F (a)Gh (a) − F (th )Gh (b) + F (th )Gh (a) = Z b Z th = Gh (b) f (t)dt + Gh (a) f (t)dt th a Se ora si sceglie una successione hn che tende a 0, a meno di sottosuccessioni si ha (per il teorema di Bolzano-Weierstrass) thn → t0 ∈ [a, b] utilizzando il teorema della convergenza dominata ed il lemma precedente si ottiene Z b Z b Z b lim Ghn (t)f (t)dt = lim Ghn (t)f (t)dt = G(t)f (t)dt = (B.1.9) n→∞ a a n→∞ a ! Z Z t0 = G(a) b f (x)dx + [ lim G(x)] x→b− a f (x)dx t0 Si utilizzeranno ora funzioni a variazione limitata, per cui si rimanda alla definizione G.1.8 ed al teorema G.1.4. Teorema B.1.2 (Criterio di Dirichlet-Jordan). Sia f periodica di periodo 2π e sia f ∈ L1 (−π, π). Supponiamo inoltre che per un certo x esista un δ > 0 tale che f sia a variazione limitata in [x − δ, x + δ], allora lim Sn f (x) = n→∞ f (x+ ) + f (x− ) 2 Dimostrazione. procedendo come si è fatto per dimostrare il criterio di Dini, si ottiene Z π f (x+ ) + f ( x− ) Sn f (x) − = Dn (y)[(f (x + y) − f (x+ )) + (f (x − y) − f (x− ))]dy 2 0 Sia ora δ > 0 come nell’ipotesi, allora per il lemma di Riemann-Lebesgue si ha Z π lim Dn (y)[(f (x + y) − f (x+ )) + (f (x − y) − f (x− ))]dy = 0 n→∞ (B.1.10) (B.1.11) (B.1.12) δ La funzione y → f (x + y) − f (x+ ) + f (x − y) − f (x− ) = h(y) è a variazione limitata se y ∈ [0, δ] per ipotesi e limy→0+ h(y) = 0, quindi per il teorema G.1.4 esistono G, H non decrescenti tali che h = H − G su [0, δ] e si può inoltre supporre (a meno di aggiungere una costante sia a H che a G) che sia limy→0+ G(y) = 0 e analogamente per H. Per concludere basta quindi mostrare che Z δ Z δ lim Dn (y)G(y)dy = lim Dn (y)H(y)dy = 0 (B.1.13) n→∞ n→∞ 0 0 Dimostriamo l’uguaglianza precedente nel caso di G, essendo l’altro caso identico. Sia dato > 0 e sia 0 < δ1 < δ tale che G(δ1 ) < , allora Z δ Z δ Z δ1 Dn (y)G(y)dy = Dn (y)G(y)dy + Dn (y)G(y)dy (B.1.14) 0 δ1 0 B.2. TEOREMA DI FEJER 105 Nuovamente per il lemma di Riemann-Lebesgue il primo integrale tende a 0. Usando il secondo teorema della media per stimare il secondo integale si ottiene Z Z Z δ1 δ1 δ1 − Dn (y)dy ≤ Dn (y)dy (B.1.15) Dn (y)G(y)dy = G(δ1 ) δn 0 δn Serve ora una stima dell’ultimo integrale indipendente da δn . Si ha Dn (z) = quindi 1 e−inz − ei(n+1)z 1 e−i(n+1/2)z − ei(n+1/2)z 1 sin(n + 12 )z = = 2π 1 − eiz 2π 2π sin z2 eiz/2 − eiz/2 (B.1.16) Z Z δ1 δ1 sin(n + 21 )y y D (y)dy = C dt δn n δn sin(y/2) y (B.1.17) inoltre y/ sin(y/2) è limitata su [0, π], quindi basta stimare (cambiando variabile) Z δ1 sin(n + 1 )y Z b sin t 2 dy = dt δn a t y e poichè Z A sin y <∞ lim A→∞ −A y si ha la limitazione cercata, quindi per ogni > 0 f (x+ ) + f ( x− ) lim sup Sn f (x) − ≤ K 2 n→∞ (B.1.18) (B.1.19) (B.1.20) (dove K è indipendente da e n) quindi si ottiene l’enunciato. B.2 Teorema di Fejer Lemma B.2.1. Esiste K > 0 tale che per ogni x ∈ R, n ∈ N si ha n X sin kx ≤K k (B.2.1) k=1 Dimostrazione. per periodicità basterà mostrare la tesi per x ∈ [0, π]. Si ha 1 2π n X k=−n,k6=0 Z x n 1 X sin kx x eikx = = Dn (t)dt − ik π k 2π 0 (B.2.2) k=1 dove Dn (t) è il nucleo di Dirichlet. Per concludere R x basta quindi mostrare che esiste un K > 0 tale che per ogni x ∈ [0, π], n ∈ N si abbia | 0 Dn (t)dt| ≤ K. A questo proposito studiamo Rx Gn (x) = 0 Dn (t)dt: ricordiamo che vale la formula Dn (t) = 1 sin[(n + 1/2)t] 2π sin(t/2) (B.2.3) gli zeri di Dn (t) sono 2kπ/(2n + 1), dove k ∈ N e k < n + 1/2; inoltre la funzione | sin[(n + 1/2)t]| è periodica di periodo 2π/(2n + 1), sin(z/2) è crescente in [0, π] e Dn (t) ≥ 0 su [0, 2π/(2n + 1)] da 106 APPENDICE B. CONVERGENZA PUNTUALE DELLA SERIE DI FOURIER cui segue che Gn (x) ≥ 0 su [0, π] e che il massimo di Gn su [0, π] è assunto nel primo zero di Dn , cioè in 2π/(2n + 1). Quindi si ha Z 2π/(2n+1) sup |Gn (x)| = Gn (2π/(2n + 1)) = x∈[0,π] Z 0 2π/(2n+1) ≤ 0 1 sin[(n + 1/2)t] dt ≤ 2π sin(t/2) (B.2.4) 1 (n + 1/2)t 2π 1 t dt ≤ (n + 1/2) sup ≤ 2π sin(t/2) 2n + 1 2π t∈[0,π] sin(t/2) ≤ 1 t sup = K < +∞ 2 t∈[0,π] sin(t/2) che conclude la dimostrazione poichè K non dipende da n. Teorema B.2.1. Il fatto che f : [−π, π] → C sia una funzione continua di periodo 2π non è condizione sufficiente affinchè la serie di Fourier di f converga puntualmente ad f Dimostrazione. per dimostrare il teorema si costruirà una funzione continua la cui serie di Fourier non converge in 0 seguendo la costruzione di Fejer: per ogni µ, n ∈ N si consideri la funzione: Qn,µ (x) = n X cos[(n + µ − p)x] − cos[(n + µ + p)x] p p=1 (B.2.5) utilizzando le formule di addizione si ottiene: Qn,µ (x) = 2 sin[(n + µ)x] n X sin px p p=1 (B.2.6) si devono ora utilizzare: • una successione di numeri positivi {ak } tale che P∞ k=1 ak < +∞ • una successione {nk } di interi tali che ak log nk non converga a zero • una successione di interi {µk } tale che µk+1 > µk + 2nk poniamo ora Qk (x) = Qnk ,µk (x) (B.2.7) Per il lemma precedente si ha per ogni x ∈ R e ogni n ∈ N | n X sin px p=1 p |<K (B.2.8) P∞ quindi la serie k=1 ak Qk (x) converge totalmente e quindi converge uniformemente ad una funzione continua, sia essa f (x), quindi f (x) = ∞ X ak Qnk ,µk (x) (B.2.9) k=1 poichè ogni Qk è pari e periodica di periodo 2π, anche f (x) sarà una funzione pari e periodica di periodo 2π, quindi il suo sviluppo in serie trigonometrica di Fourier avrà la forma n Sn f (x) = c0 X ck cos(kx) + 2 k=1 (B.2.10) B.2. TEOREMA DI FEJER 107 Per concludere resta da mostrare che Sn f (0) non converge. Poichè f è limite uniforme di una serie di funzioni, si possono calcolare i coefficienti di Fourier integrando termine a termine: 1 cj = π Z π f (t) cos(jt)dt = −π Z ∞ X ak π k=1 π Qk (t) cos(jt)dt (B.2.11) −π Per come sono stati scelti gli interi µk , per ogni j al più un unico termine della serie precedente sarà diverso da 0, quindi non si presentano problemi di convergenza nella definizione di cj . Tramite calcolo diretto, si verifica che se µk ≤ j ≤ µk + nk − 1 l’unico termine che sopravvive in cj è quello per cui µk + nk − p = j, quindi si ottiene: µk +n Xk −1 cj = nk X ak p=1 j=µk p Z nk ≥ ak 1 dt = ak log nk t (B.2.12) da cui si ottiene immediatamente: Sµk +nk −1 f (0) − Sµk −1 f (0) = µk +n Xk −1 cj ≥ ak log nk (B.2.13) j=µk e quindi, per come sono stati scelti gli nk , Sn f (0) non converge. Una scelta delle costanti ak , nk , µk potrebbe essere: ak = 1 ; k2 2 nk = 2 k ; µ k = 2k 2 (B.2.14) e quindi ak log nk = log 2. Definizione B.2.1. sia f una funzione in L1 (−π, π), allora si definisce n-esima somma parziale di Fejer (talvolta di Cesaro) la funzione: n σn f (x) = 1 X Sk f (x) n+1 (B.2.15) k=0 cioè la media aritmetica delle prime n + 1 somme parziali di Fourier Usando le formule trigonometriche di addizione è semplice verificare che 2 sin[y/2] sin[(k + 1/2)y] = cos[ky] − cos[(k + 1)y] (B.2.16) da cui si ottiene: n X n sin[(k + 1/2)y] = k=0 X 1 (cos[ky] − cos[(k + 1)y]) = 2 sin[y/2] (B.2.17) k=0 = 1 − cos[(n + 1)y] 2 sin[y/2] Questo semplice risultato sarà utilizzato nella dimostrazione del seguente lemma, in cui si definisce il nucleo di Fejer analogamente a quanto fatto per il nucleo di Dirichlet. Lemma B.2.2. esiste una unica funzione Fn (y) con la seguente proprietà (1) e si ha: Rπ 1. σn f (x) = −π Fn (x − y)f (y)dy 2. Fn è periodica di periodo 2π Rπ 3. −π Fn (y)dy = 1 108 4. Fn (y) = APPENDICE B. CONVERGENZA PUNTUALE DELLA SERIE DI FOURIER 1−cos[(n+1)y] 4π(n+1) sin2 [y/2] 5. Fn (y) ≥ 0 e se π > |y| ≥ r > 0 allora limn→∞ Fn (y) = 0 Dimostrazione. dalla definizione di σn f (x) segue che: # Z π " n 1 X σn f (x) = Dk (x − y) f (y)dy −π n + 1 (B.2.18) k=0 quindi n Fn (y) = 1 X Dk (y) n+1 (B.2.19) k=0 dalle proprietà di Dn seguono i punti (2) e (3). Esplicitando nella relazione precedente Dn (y) si ottiene: n Fn (y) = X 1 1 sin[(k + 1/2)y] = 2π(n + 1) sin[y/2] (B.2.20) k=0 = 1 1 − cos[(n + 1)y] 1 − cos[(n + 1)y] = 2π(n + 1) sin[y/2] 2 sin[y/2] 4π(n + 1) sin2 [y/2] questo dimostra (4) e la prima parte di (5). Se ora π > |y| ≥ r > 0, allora si ha |Fn (y)| ≤ 2 4π(n + 1) sin2 [r/2] (B.2.21) che dimostra (5). Teorema B.2.2 (Fejer). Sia f : [−π, π] → C una funzione in L1 (−π, π) periodica di periodo 2π. Sia x tale che esistano f (x+) = limy→x+ f (y) e f (x−) = limy→x− f (y), allora si ha: lim σn f (x) = n→∞ f (x+) + f (x−) 2 (B.2.22) se f è anche continua, allora σn f converge uniformemente a f su R Dimostrazione. usando la periodicità di f e Fn si può procedere analogamente a quanto fatto nella dimostrazione del teorema del Dini, ottenendo: Z π σn f (x) = Fn (y)[f (x − y) + f (x + y)]dy = (B.2.23) Z 0π f (x − y) + f (x + y) 2Fn (y) = dy 2 0 Rπ inoltre Fn è pari, quindi 0 2Fn (y)dy = 1, quindi si ha anche: Z π f (x+) + f (x−) f (x+) + f (x−) = 2Fn (y) dy (B.2.24) 2 2 0 quindi σn f (x) − f (x+) + f (x−) = 2 Z π f (x − y) + f (x + y) f (x+) + f (x−) − dy ≤ = 2Fn (y) 2 2 0 Z r Z π ≤ 2Fn (y)dy + 2Fn (y)g(y)dy 0 r (B.2.25) B.2. TEOREMA DI FEJER dove r è scelto abbastanza piccolo da fare in modo che f (x − y) + f (x + y) f (x+) + f (x−) < − 2 2 per ogni 0 < y ≤ r. Quindi usando la stima B.2.21 si ottiene: Z π 1 σn f (x) − f (x+) + f (x−) ≤ + g(y) dy = 2 π(n + 1) sin2 [r/2] r C =+ →0 n+1 109 (B.2.26) (B.2.27) Sia ora f continua: allora f (x+) = f (x−) = f (x) e a causa della periodicità essa sarà anche uniformemente continua, quindi si può scegliere r > 0 tale che la stima B.2.26 valga per ogni x, ottenendo quindi la convergenza uniforme. Bibliografia il controesempio di Fejer è tratto da [4]. Per una dimostrazione del fatto che esistono funzioni continue la cui serie di Fourier non converge su un insieme non numerabile di punti si veda [8] cap. 5 (La dimostrazione fa uso di una conseguenza del lemma di Baire [vedi appendice F] dimostrata poche pagine prima) Appendice C Riflessività Sia (X, k kX ) uno spazio normato; ricordiamo che si chiama duale (topologico) di X lo spazio X 0 delle applicazioni lineari continue di X in C. Se f ∈ X 0 si definisce norma di f il valore (finito perchè una operatore lineare è continuo se e solo se è limitato) kf k0 = |f (x)| = sup |f (x)| x∈X,x6=0 kxkX kxkX =1 sup (C.0.1) inoltre X 0 dotato di questa norma è uno spazio di Banach (vedi teorema 3.2.2) poichè C è uno spazio completo. Analogamente si può definire il biduale (topologico) di X , indicato con X 00 , come lo spazio dei funzionali lineari continui su X 0 , cioè delle applicazioni lineari continue di X 0 in C. Poichè il biduale di X è il duale di X 0 , per ogni φ ∈ X 00 si ha la norma kφk00 = sup f ∈X 0 ,f 6=0 |φ(f )| = sup |φ(f )| kf k0 kf k0 =1,f ∈X 0 (C.0.2) e X 00 dotato di questa norma è uno spazio di Banach. Vediamo ora che esiste una applicazione canonica (cioè indipendente dalla base) di X in X 00 ; sia x ∈ X, allora definiamo φx : X 0 → C nel seguente modo: per ogni f ∈ X 0 sia φx (f ) = f (x) (C.0.3) φx è un operatore lineare, infatti se α, β ∈ C e f, g ∈ X 0 si ha φx (αf + βg) = (αf + βg)(x) = αf (x) + βg(x) = αφx (f ) + βφx (g) (C.0.4) inoltre φx è continuo, infatti si ha |φx (f )| = |f (x)| ≤ kf k0 kxkX (C.0.5) quindi kφx k00 ≤ kxkX e quindi φx ∈ X 00 . A questo punto definiamo J : X → X 00 come J(x) = φx . Vediamo innanzi tutto che J è lineare: per ogni f ∈ X 0 , α, β ∈ C, x, y ∈ X si ha J(αx + βy)(f ) = φαx+βy (f ) = f (αx + βy) = αf (x) + βf (y) = = αφx (f ) + βφy (f ) = [αJ(x) + βJ(y)](f ) (C.0.6) quindi J(αx + βy) = αJ(x) + βJ(y). Inoltre J è continua: per ogni x ∈ X, x 6= 0 si ha kφx k00 kxkX kJxk00 = ≤ =1 kxkX kxkX kxkX dove si è usato il fatto precedentemente visto che kφx k00 ≤ kxkX . 110 (C.0.7) 111 Definizione C.0.2. Uno spazio normato X si dice spazio riflessivo se J(X) = X 00 . Prima di dimostrare il teorema seguente serve fare una osservazione: sia H uno spazio di Hilbert, allora per il teorema di Riesz ad ogni f ∈ H 0 corrisponde un elemento xf ∈ H tale che f (x) = (xf , x). Consideriamo ora la applicazione f → xf : questa non è una applicazione lineare e si ha se f, g ∈ H 0 αf (x) + βg(x) = α(xf , x) + β(xg , x) = (αxf + βxg , x) (C.0.8) xαf +βg = αxf + βxg (C.0.9) quindi si ha Teorema C.0.3. Ogni spazio di Hilbert è uno spazio riflessivo. Dimostrazione. notiamo innanzitutto che se H è uno spazio di Hilbert allora anche H 0 è uno spazio di Hilbert: se f, g ∈ H 0 definiamo (f, g) = (xf , xg ) (C.0.10) verifichiamo che questo è un prodotto scalare e che esso genera la norma k k0 rispetto a cui H 0 è completo: se f, g, p ∈ H 0 si ha (f, g + p) = (xf , xg+p ) = (xf , xg + xp ) = (xf , xg ) + (xf , xp ) = (f, g) + (f, p) (C.0.11) se α ∈ C si ha (f, αg) = (xf , xαg ) = (xf , αxg ) = α(xf , xg ) = α(f, g) (C.0.12) infine per il teorema di Riesz si ha (f, f ) = (xf , xf ) = kxf kX = kxf kX = kf k0 (C.0.13) Avendo verificato che (H 0 , k k0 ) è uno spazio di Hilbert si può applicare il teorema di Riesz in H 0 ottenendo quindi che per ogni ψ ∈ H 00 esiste fψ ∈ H 0 tale che per ogni g ∈ H 0 si ha ψ(g) = (fψ , g). A questo punto si può vedere che ogni spazio di Hilbert è riflessivo: sia ψ ∈ H 00 , allora si deve mostrare che esiste x̃ ∈ H tale che J(x̃) = ψ, cioè per ogni g ∈ H 0 si ha J(x)(g) = ψ(g) cioè ancora, dalla definizione di J, g(x) = ψ(g) per ogni g ∈ H 0 . Sia ora fψ ∈ H 0 il rappresentante di ψ in H 0 , e sia xfψ ∈ H il rappresentante in H di fψ ∈ H 0 . Mostriamo ora che x̃ = xfψ : per ogni g ∈ H 0 si ha ψ(g) = (fψ , g) = (xfψ , xg ) = (xg , xfψ ) = g(xfψ ) (C.0.14) che conclude la dimostrazione. Appendice D Complementi sugli operatori compatti D.1 Teorema dell’alternativa Teorema D.1.1. Sia X uno spazio con prodotto scalare, allora la palla chiusa unitaria è compatta ⇔ X ha dimensione finita. Dimostrazione. ⇐) se X ha dimensione finita allora l’enunciato segue dal teorema di BolzanoWeierstrass (corollario 1.2.2). ⇒) se X ha dimensione infinita, esiste una successione infinita di vettori ortonormali {ei }, ma allora kei − ej k2 = (ei − ej , ei − ej ) = 2(1 − δij ) (D.1.1) quindi non esistono sottosuccessioni di {ei } che siano successioni di Cauchy, quindi non esistono sottosuccessioni convergenti di {ei }, quindi B(0, 1) non è compatto. Corollario D.1.1. Uno spazio vettoriale con prodotto scalare ha dimensione finita se e solo se da ogni successione limitata si può estrarre una sottosuccessione convergente. Lemma D.1.1. Sia K : H → H un operatore compatto e sia T = I + K dove I è l’operatore identità. Se {xn } è una successione limitata e tale che T xn → y ∈ H, allora esiste una sottosuccessione {xnk } tale che xnk → x T x = y (D.1.2) Dimostrazione. poichè {xn } è limitata e K è compatto, esiste una sottosuccessione {xnk } tale che Kxnk converge; sia Kxnk → z, allora xnk = T xnk − Kxnk → y − z. Poniamo x = y − z, allora xnk → x e dalla continuità di T segue che T x = limk→∞ T xnk = limn→∞ T xn = y. Teorema D.1.2 (Teorema dell’alternativa di Fredholm-Riesz). Sia H uno spazio di Hilbert e T = I + K dove K è un operatore compatto. Allora 1. l’immagine R(T ) di T è un insieme chiuso. 2. ker T e ker T ∗ hanno dimensione finita 3. se ker T = {0} allora ker T ∗ = {0} 4. se ker T ∗ = {0} allora ker T = {0} 5. ker T e ker T ∗ hanno la stessa dimensione 6. T è iniettivo se e solo se è surgettivo e in questo caso T −1 è un operatore continuo. 112 D.1. TEOREMA DELL’ALTERNATIVA 113 Dimostrazione. 1) mostriamo che esiste una costante c > 0 tale che kxk ≤ ckT xk ∀x ∈ (ker T )⊥ (D.1.3) Supponiamo che l’equazione precedente non sia soddisfatta, allora per ogni c > 0 esisterebbe un ξc ∈ (ker T )⊥ tale che kξc k > ckT ξc k; dividendo entrambi i membri della precedente uguaglianza per kξc k (che è > 0 per l’uguaglianza precedente) e usando la linearità di T si vede che 1 > ckT ξc0 k ≥ 0 dove kξc0 k = 1, quindi esisterebbe una successione xn = ξn0 tale che kxn k = 1 e kT xn k < n1 cioè kT xn k → 0. Per il lemma D.1.1 esisterebbero allora una sottosuccessione xnk ∈ (ker T )⊥ e x ∈ H tali che xnk → x ,T x = 0 , kxk = 1, ma (ker T )⊥ è un insieme chiuso e quindi x ∈ (ker T )⊥ , cioè x ∈ ker T x ∈ (ker T )⊥ kxk = 1 (D.1.4) poichè (ker T ) ∩ (ker T )⊥ = {0}, non esiste un x ∈ H che soddisfi D.1.4 e quindi la relazione D.1.3 deve essere vera. Sia ora P : H → H la proiezione ortogonale su (ker T )⊥ , {yn } una successione in R(T ) tale che yn → y ∈ H; si vuole vedere che y ∈ R(T ). Sia xn tale che yn = T xn e poniamo zn = P (xn ), allora zn ∈ (ker T )⊥ , T zn = T xn = yn e dalla D.1.3 segue che kzn k ≤ ckyn k; poichè yn → y, la successione zn è limitata e si ha T zn → y, quindi per il lemma D.1.1 esistono una sottosuccessione {znk } e z ∈ H tali che znk → z e T z = y, quindi y ∈ R(T ), che è quindi un insieme chiuso. 2) Sia {xn } una successione limitata di ker T , allora T xn = 0 per ogni n e quindi per il lemma D.1.1 esistono una sottosuccessione {xnk } e un x ∈ H tale che xnk → x e T x = 0, quindi ogni successione limitata di ker T ammette una sottosuccessione convergente in ker T , quindi per il corollario D.1.1 lo spazio ker T ha dimensione finita. In modo identico si vede che ker T ∗ ha dimensione finita. 3) Sia H = H0 e H1 = R(T ); per il punto (1), H1 è un sottospazio chiuso. Analogamente H2 = T (H1 ) è un sottospazio chiuso, inoltre se x ∈ H2 , allora esiste un y ∈ H1 ⊂ H tale che x = T y, quindi H2 ⊂ H1 . Procedendo per induzione si ottiene una successione {Hi } di sottospazi chiusi tali che H0 ⊃ H1 · · · ⊃ Hn ⊃ · · · (D.1.5) Supponiamo ora per assurdo che per ogni n si abbia Hn 6= Hn+1 ; allora esisterebbe una successione ⊥ ⊥ . Se n > m si ha allora T en , T em , en ∈ Hm+1 e em ∈ Hm+1 {en } tale che ken k = 1 e en ∈ Hn ∩Hn+1 Ken − Kem = (en + Ken ) − (em + Kem ) − en + em = zmn + em (D.1.6) dove zmn = (en + Ken ) − (em + Kem ) − en ∈ Hm+1 , quindi si ha kKen − Kem k2 = kznm k2 + kem k2 ≥ 1 (D.1.7) e quindi la successione {Ken } non avrebbe sottosuccessioni convergenti, contrariamente al fatto che {en } è una successione limitata e K è un operatore compatto, quindi esiste un n̄ tale che Hn̄ = Hn̄+1 . Supponiamo ora per assurdo che ker T = {0} e R(T ) = H1 6= H0 ; sia ora n̄ il più piccolo naturale tale che Hn̄ = Hn̄+1 (in particolare si deve quindi avere n̄ > 0), cioè T (Hn̄−1 ) = T (Hn̄ ) e quindi per l’iniettività di T (si ricordi che L operatore lineare è iniettivo se e solo se ker L = {0}) si ha Hn̄−1 = Hn̄ , ma ciò è contrario all’ipotesi che n̄ sia il più piccolo naturale tale che Hn̄ = Hn̄+1 , quindi si deve avere H0 = H1 , cioè R(T ) = H e T è suriettivo. Per la definizione di aggiunto si ha (T x, y) = (x, T ∗ y) (D.1.8) quindi ker T = R(T ∗ )⊥ e ker T ∗ = R(T )⊥ , ma si è visto che R(T ) = H, quindi ker T ∗ = {0}. 4) si applica (3) a S = I + K ∗ (ciò è lecito poichè K compatto ⇒ K ∗ compatto) e si usa il fatto che S ∗ = T 114 APPENDICE D. COMPLEMENTI SUGLI OPERATORI COMPATTI 5) Si deve mostrare che ker T = R(T ∗ )⊥ e ker T ∗ = R(T )⊥ hanno la stessa dimensione. Vediamo innanzitutto che si ha dim ker T ≥ dimR(T )⊥ (D.1.9) Supponiamo per assurdo che sia dim ker T < dimR(T )⊥ , allora esisterebbe un operatore lineare e continuo (poichè tra spazi di dimensione finita per il punto 2) L : ker T → R(T )⊥ iniettivo ma non surgettivo; si potrebbe allora estendere L ad un operatore L : H → R(T )⊥ ponendo Lx = 0 per ogni x ∈ (ker T )⊥ . L’operatore L : H → H cosı̀ costruito avrebbe come immagine R(T )⊥ che per il punto (2) è uno spazio di dimensione finita, quindi L risulta essere un operatore compatto e quindi L + K è un operatore compatto. Inoltre ker(I + L + K) = {0}, infatti da u + Ku + Lu = 0 segue T u = u + Ku = −Lu ∈ R(T )⊥ , quindi T u = Lu = 0, quindi u ∈ ker T e poichè L è iniettivo su ker T , si ha u = 0. Dal punto (3) segue allora che I + L + K è surgettivo, mentre se v ∈ R(T )⊥ , v∈ / R(L) (un tale v esiste poichè L non è surgettivo) l’equazione T u + Lu = u + Ku + Lu = v non ha soluzioni, poichè sia v che Lu sono in R(T )⊥ , quindi si dovrebbe avere v = L(u) mentre v 6∈ R(L), assurdo. Quindi si è dimostrata la relazione D.1.9. Sostituendo K con K ∗ la dimostrazione precedente resta valida e quindi si ottiene dim ker T ∗ ≥ dimR(T ∗ )⊥ (D.1.10) quindi dimR(T )⊥ = dim ker T , cioè dim ker T ∗ = dim ker T . 6) Nella (3) si è visto che ker T = {0} ⇒ R(T ) = H, ciò se T è iniettivo è anche surgettivo. Supponiamo ora che T sia surgettivo, cioè R(T ) = H, ma allora ker T ∗ = R(T )⊥ = {0} e quindi per il punto (4) si ha ker T = {0}, cioè T è iniettivo. Da kxk ≤ ckT xk (equazione D.1.3 con ker T = {0}), sostituendo x con T −1 y si vede che −1 kT yk ≤ ckyk, quindi T −1 è continua. Il punto (6) del teorema precedente, non è in generale vero per gli operatori continui tra spazi di Hilbert che non siano della forma I + K: 1) sia X = `2 e L(x1 , x2 , . . . , xn , . . .) = (0, x1 , x2 , . . .); allora L è un operatore continuo ed è evidentemente iniettivo, ma non è suriettivo, in quanto ad esempio (1, 0, . . . , 0, . . .) non è nella sua immagine. 2) sia X = `2 e sia L(x1 , x2 , . . . , xn , . . .) = (x2 , x3 , . . .), allora L è lineare e continuo. L è surgettivo: se (y1 , y2 , . . . , yn , . . .) ∈ `2 allora si ha L(1, y1 , y2 , . . .) = (y1 , y2 , . . .); ma L non è iniettivo: L(1, y1 , y2 , . . .) = L(0, y1 , y2 , . . .). È invece un fatto generale il fatto che se L è un operatore lineare continuo e biunivoco tra due spazi di Hilbert (più in generale tra due spazi di Banach) allora L−1 è continuo. Per la dimostrazione vedi l’appendice sulle conseguenze del lemma di Baire. D.2 Teoria spettrale Definizione D.2.1. Sia T : H → H un operatore, H spazio di Hilbert. Si chiama spettro di T l’insieme σ(T ) dei numeri complessi λ tali che λI − T non è biunivoco. Si chiama spettro puntuale l’insieme σp (T ) dei numeri complessi tali che λI − T non è iniettivo. Gli elementi dello spettro puntuale si dicono autovalori , gli elementi di ker(λI − T ) si dicono autovettori relativi all’autovalore λ; ker(λI − T ) si chiama autospazio dell’autovalore λ. Se lo spazio di Hilbert H della definizione precedente ha dimensione infinita, in generale σ(T ) 6= σp (T ). Lemma D.2.1. Sia T : H → H un operatore e λ ∈ C, allora λ è un autovalore ⇔ esiste un vettore v 6= 0 tale che T v = λv. Dimostrazione. ⇐) (λI − T )0 = (λI − T )v = 0 e v 6= 0 quindi λI − T non è iniettivo e quindi λ è un autovalore. ⇒) Sia λI − T non iniettivo, allora esistono x, y ∈ H tali che x 6= y e (λI − T )x = (λI − T )y cioè (λI − T )(x − y) = 0; ponendo x − y = v si ha l’enunciato. D.2. TEORIA SPETTRALE 115 Lemma D.2.2. Sia T : H → H un operatore lineare continuo di norma kT k allora se µ ∈ σ(T ), si ha |µ| ≤ kT k. Dimostrazione. sia µ ∈ C tale che |µ| > kT k e dimostriamo che µI − T è bigettivo: consideriamo l’equazione T u − µu = f ; essa è equivalente a u= ma è immediato vedere che la funzione u → 1 (T u − f ) µ 1 µ (T u (D.2.1) − f ) è una contrazione, poichè 1 (T u1 − f ) − 1 (T u2 − f ) = 1 kT (u1 − u2 )k ≤ kT k ku1 − u2 k < ku1 − u2 k |µ| µ µ |µ| (D.2.2) quindi essa ha un unico punto fisso, quindi l’equazione T u − µu = f ha una e una sola soluzione per ogni f ∈ H, cioè T u − µu è biunivoco, quindi µ ∈ / σ(T ) Nella dimostrazione dei seguenti due teoremi si userà un teorema (per la dimostrazione del quale si rimanda alla appendice sulle conseguenze del lemma di Baire) secondo il quale se T è un operatore lineare continuo e biunivoco tra spazi di Banach, allora T −1 è pure continuo. Teorema D.2.1. Sia T : H → H un operatore lineare continuo, allora σ(T ) è un insieme compatto. Dimostrazione. per il lemma precedente σ(T ) è limitato in C, quindi basterà quindi mostrare che è anche chiuso per dedurne che è compatto usando il teorema di Bolzano-Weierstrass. Sia ρ(T ) = [σ(T )]c (ρ(T ) ⊂ C è detto insieme risolvente di T ) e λ0 ∈ ρ(T ) e dato f ∈ H studiamo l’equazione T u − λu = f ; essa può essere riscritta come u = (T − λ0 I)−1 [f + (λ − λ0 )u] (D.2.3) È immediato verificare che il secondo membro di D.2.3 è una contrazione se |λ − λ0 | k(T − λ0 I)−1 k < 1 (D.2.4) e quindi B(λ0 , 1/[2k(T − λ0 I)−1 ]k) ⊂ ρ(T ), quindi ρ(T ) è aperto e quindi σ(T ) è chiuso e quindi compatto. Teorema D.2.2. Sia K : H → H un operatore compatto e H abbia dimensione infinita, allora 0 ∈ σ(T ). Dimostrazione. supponiamo per assurdo che 0 ∈ / σ(K), allora K è biunivoco e, poichè è compatto, continuo; allora per il teorema citato si dovrebbe avere che K −1 è ancora un operatore continuo. Ma allora K ◦ K −1 = I dovrebbe essere un operatore compatto, mentre in dimensione infinita l’identità non è un operatore compatto. Teorema D.2.3. Sia H uno spazio di Hilbert e K un operatore compatto su H, allora valgono le seguenti affermazioni: 1. K ha al più un insieme numerabile di autovalori aventi come unico possibile punto di accumulazione 0. 2. gli autospazi relativi ad autovalori non nulli hanno dimensione finita. 3. σ(K)\{0} = σp (K)\{0} 116 APPENDICE D. COMPLEMENTI SUGLI OPERATORI COMPATTI Dimostrazione. 1) mostriamo innanzitutto che σp (K) non ha punti di accumulazione diversi da 0. Supponiamo per assurdo che esista una successione {λn } di autovalori distinti e non nulli tale che λn → λ 6= 0 e sia un un autovettore (non nullo) di λn . Definiamo quindi µn = 1/λn e ⊥ Vn = span{u1 , . . . , un }. Sia ora v1 ∈ V1 tale che kv1 k = 1 e per n ≥ 2 sia vn ∈ Vn ∩ Vn−1 tale che kvn k = 1; ciò ha senso poichè autovettori non nulli relativi ad autovalori diversi sono linearmente ⊥ indipendenti, quindi un non è in Vn−1 e quindi Vn ∩ Vn−1 è diverso da {0}; esplicitamente si ha (dove Nn è una costante di normalizzazione) " # n−1 X vn = Nn un − (ui , un )ui (D.2.5) i=1 e quindi vn − µn Kvn ∈ Vn−1 . Se n > m si ha allora vn − µn Kvn ∈ Vn−1 , µm Kvm ∈ Vn−1 e ⊥ vn ∈ Vn−1 , quindi K(µn vn − µm vm ) = vn − (vn − µn Kvn + µm Kvm ) = vn − z (D.2.6) ⊥ con vn ∈ Vn−1 e z ∈ Vn−1 , quindi kK(µn vn ) − K(µm vm )k2 = kvn k2 + kzk2 > 1 (D.2.7) quindi dalla successione {K(µn vn )} non si possono esttrarre sottosuccessioni convergenti, contrariamente al fatto che K è un operatore compatto e che {µn vn } è una successione limitata. Si è quindi visto che l’unico possibile punto di accumulazione per σp (K) è 0. Definiamo ora An = σp (K) ∩ B(0, 1/n)c ∩ B(0, kKk) (D.2.8) S∞ si ha evidentemente σp (K)\{0} = n=1 An , quindi per mostrare che σp (K) è al più numerabile basta mostrare che ogni An consiste solo di un numero finito di elmenti. Supponiamo per assurdo che An̄ abbia infiniti elementi, allora per il teorema di Bolzano-Weierstrass (seconda forma), An̄ dovrebbe avere un punto di accumulazione in C, ma un punto di accumulazione y di An̄ sarebbe anche un punto di accumulazione per σp (K), quindi si dovrebbe avere y = 0, ma y = 0 non può essere punto di accumulazione di An per nessun n, quindi ogni An è composto al più da un numero finito di elementi. 2) discende dal punto (2) del teorema dell’alternativa. 3) discende dal punto (6) del teorema dell’alternativa. Bibliografia: quanto precede è con minime variazioni quanto riportato nei paragrafi 3 e 4 del capitolo X di [4]. Tutti i risultati qui riportati possono essere estesi a spazi di Banach (ovviamente con una diversa definizione di aggiunto) vedi [1],[6], [9]. Appendice E Problema di Sturm-Liouville In questa appendice saranno dati per conosciuti alcuni aspetti elementari della teoria delle equazioni differenziali lineari. Si vuole mostrare come i risultati ottenuti per gli operatori compatti autoaggiunti siano applicabili ad una notevole classe di problemi ai limiti, ciò che sarà fatto nel secondo paragrafo. Nel primo si chiarisce il perchè della forma del problema di Sturm-Liouville. E.1 Problemi ai limiti Si chiama problema ai limiti del secondo ordine il problema consistente nella risoluzione dell’equazione a2 (x)y 00 + a1 (x)y 0 + a0 (x)y = h(x) (E.1.1) dove a0 , a1 , a2 , h sono funzioni continue nell’intervallo [a, b] e a2 (x) 6= 0, con le condizioni ai limiti α1 y(a) + α2 y 0 (a) + α3 y(b) + α4 y 0 (b) = γ1 β1 y(a) + β2 y 0 (a) + β3 y(b) + β4 y 0 (b) = γ2 (E.1.2) (E.1.3) È comodo introdurre le seguenti notazioni abbreviate: L : C 2 (a, b) → C(a, b), Bi : C 1 (a, b) → R nel modo seguente: (Ly)(x) = a2 (x)y 00 (x) + a1 (x)y(x) + a0 y(x) B1 y = α1 y(a) + α2 y 0 (a) + α3 y(b) + α4 y 0 (b) (E.1.4) (E.1.5) B2 y = β1 y(a) + β2 y 0 (a) + β3 y(b) + β4 y 0 (b) (E.1.6) quindi il problema ai limiti si può riscrivere come Ly = h; B1 y = γ1 ; B2 y = γ2 (E.1.7) Si chiama problema ai limiti omogeneo quello in cui h = 0, γ1 = γ2 = 0. Il seguente teorema è noto come teorema dell’alternativa per i problemi ai limiti. Teorema E.1.1 (esistenza e unicità). Siano u(x), v(x) due soluzioni indipendenti di Ly = 0. Allora il problema ai limiti E.1.7 ammette una soluzione unica per ogni h continua, γ1 , γ2 ∈ R se e solo se B1 u B1 v det 6= 0 (E.1.8) B2 u B2 v cioè se il problema omogeneo associato ha la sola soluzione nulla. 117 118 APPENDICE E. PROBLEMA DI STURM-LIOUVILLE Dimostrazione. sia w(x) una soluzione particolare di Ly = h, allora la soluzione generale di Ly = h ha la forma y(x) = c1 u(x) + c2 v(x) + w(x). Affinchè la soluzione generale verifichi le condizioni ai limiti E.1.7 si deve avere B 1 u B1 v c1 γ1 − B1 w = (E.1.9) B 2 u B2 v c2 γ2 − B2 w Il sistema precedente ammette soluzione per ogni h(x), γ1 , γ2 se e solo se la condizione E.1.8 è soddisfatta; in questo caso la soluzione è inoltre anche unica. Se in E.1.9 si pone γ1 = γ2 = 0 e w(x) = 0 si ottiene il caso del problema omogeneo e la condizione E.1.8 è equivalente al fatto che in questo caso l’unica soluzione sia c1 = c2 = 0, cioè la soluzione nulla. Lemma E.1.1. Nelle ipotesi del teorema di esistenza la soluzione del problema ai limiti Ly = h, y(a) = 0, y 0 (a) = 0 può essere scritta nella forma Z b y(x) = G0 (x, t)h(t)dt (E.1.10) a dove G0 (x, t) è una funzione continua su [a, b] × [a, b]. Dimostrazione. sia w(x, t) la soluzione (nella variabile x) del problema di Cauchy Ly = 0 y(t) = 0 0 y (t) = 1 (E.1.11) e mostriamo che la soluzione del problema Ly = h, y(a) = 0, y 0 (a) = 0 è Z x h(t) Y (x) = w(x, t) dt (E.1.12) a2 (t) a Rx Si userà la seguente formula di semplice verifica: se z(x) = a f (x, t)dt dove f è derivabile due volte rispetto a x, allora Z x ∂f (x, t) 0 z (x) = f (x, x) + dt (E.1.13) ∂x a Applicando la formula E.1.13 a E.1.12 e ricordando la definizione di w(x, t) si ottiene subito Z x Z x h(x) h(t) h(t) 0 0 + w (x, t) = w0 (x, t) Y (x) = w(x, x) a2 (x) a (t) a 2 2 (t) a Z x Z ax h(t) h(t) h(x) h(x) w00 (x, t) w00 (x, t) Y 00 (x) = w0 (x, x) + = + a2 (x) a (t) a (x) a 2 2 2 (t) a a quindi si ha Y (a) = 0 e Y 0 (a) = 0 e infine Z + a x a2 (x)Y 00 (x) + a1 (x)Y 0 (x) + a0 (x)Y (x) = h(x) + h(t) dt = h(x) [a2 (x)w00 (x, t) + a1 (x)w0 (x, t) + a0 (x)w(x, t)] a2 (t) (E.1.14) quindi E.1.12 è soluzione del problema Ly = 0, y(a) = 0, y 0 (a) = 0. È a questo punto immediato vedere che la E.1.12 può essere scritta nella forma E.1.10 ponendo w(x, t)/a2 (t) se a ≤ t ≤ x ≤ b G0 (x, t) = (E.1.15) 0 se a ≤ x < t ≤ b G0 è continua poichè per costruzione w(x, x) = 0. E.1. PROBLEMI AI LIMITI 119 Teorema E.1.2 (Esistenza della funzione di Green). Nelle ipotesi del teorema di esistenza esiste una unica funzione G(x, t) : [a, b] × [a, b] → R continua tale che la soluzione del problema Ly = h, B1 y = 0, B2 y = 0 è data da Z b y(x) = G(x, t)h(t)dt (E.1.16) a Una tale G(x, t) si chiama funzione di Green o in certi testi nucleo integrante. Dimostrazione. Dimostriamo innanzitutto l’unicità: siano G1 , G2 due funzioni che soddisfano E.1.16, allora per l’unicità della soluzione si ha Z b (G1 (x, t) − G2 (x, t))h(t)dt = 0 (E.1.17) a scegliendo in particolare h(t) = G1 (x, t) − G2 (x, t) si ottiene che G1 (x, t) = G2 (x, t). Dimostriamo ora che una funzione G come nell’enunciato esiste: cerchiamo una funzione della forma G(x, t) = d1 (t)u(x) + d2 (t)v(x) + G0 (x, t) (E.1.18) dove di sono funzioni continue, u, v sono due soluzioni indipendenti di Ly = 0 e G0 è la funzione definita nel lemma E.1.1. È immediato vedere che la E.1.18 inserita all’interno di E.1.16 rende la y soluzione di Ly = h. Resta ora da determinare d1 , d2 in modo tale che B1 y = 0 e B2 y = 0; affinchè una tale condizione sia soddisfatta è sufficiente che B1 G(x, t) = 0 e B2 G(x, t) = 0 per ogni t ∈ [a, b] (gli operatori Bi sono applicati alla variabile x). Imporre questa seconda condizione è equivalente a risolvere il seguente sistema lineare nelle incognite d1 (t), d2 (t): B1 u B1 v d1 (t) B1 G0 (x, t) =− (E.1.19) B2 u B2 v d2 (t) B2 G0 (x, t) e il sistema precedente ha una soluzione a causa di E.1.8. Lemma E.1.2. Siano a2 ∈ C 2 , a1 ∈ C 1 e a0 ∈ C con a2 (x) 6= 0 su [a, b] e sia L l’operatore definito in E.1.4. Definendo L∗ come L∗ z = (a2 (x)z)00 − (a1 (x)z)0 + a0 (x)z (E.1.20) e usando il prodotto scalare ( , ) di L2 si ha la seguente identità per ogni y, z ∈ C 2 (Ly, z) − (y, L∗ z) = {a2 (x)[y 0 (x)z(x) − y(x)z 0 (x)]}ba + [(a1 (x) − a02 (x))y(x)z(x)]ba (E.1.21) L’operatore L∗ è detto operatore aggiunto di L. Dimostrazione. Si ha Z (Ly, z) = b (a2 (x)y 00 (x) + a1 (x)y 0 (x) + a0 (x)y(x))z(x)dx (E.1.22) a inoltre integrando per parti si ha Z b Z a2 y 00 (x)z(x)dx = [y 0 (x)a2 (x)z(x)]ba − a b a = [y 0 (x)a2 (x)z(x)]ba − [y(x)(a2 z)0 (x)]ba + y 0 (x)(a2 z)0 (x)dx = Z b (E.1.23) y(x)(a2 z)00 (x)dx a e analogamente Z b a Z a1 (x)y 0 (x)z(x)dx = [y(x)a1 (x)z(x)]ba − b y(x)(a1 z)0 (x)dx a Inserendo E.1.23 e E.1.24 all’interno di E.1.22 e usando E.1.20 si ottiene E.1.21. (E.1.24) 120 APPENDICE E. PROBLEMA DI STURM-LIOUVILLE Teorema E.1.3. Consideriamo il problema Ly = 0, B1 y = 0, B2 y = 0 e supponiamo che i vettori (α1 , α2 , α3 , α4 ), (β1 , β2 , β3 , β4 ) che definiscono B1 , B2 siano linearmente indipendenti. Allora esistono B1∗ z = γ1 z(a) + γ2 z 0 (a) + γ3 z(b) + γ4 z 0 (b) B2∗ z = δ1 z(a) + δ2 z 0 (a) + δ3 z(b) + δ4 z 0 (b) (E.1.25) (E.1.26) tali che (Ly, z) = (y, L∗ z) per tutte le funzioni y, z ∈ C 2 che soddisfano B1 y = B2 y = 0 e B1∗ z = B2∗ z = 0. I coefficienti γi , δi non sono unici, ma lo spazio delle funzioni z che soddisfano B1∗ z = B2∗ z = 0 è unico. Dimostrazione. il secondo membro di E.1.21 può essere scritto come ~y T C~z dove ~y = (y(a), y 0 (a), y(b), y 0 (b))T , ~z = (z(a), z 0 (a), z(b), z 0 (b))T e −D(a) 0 a1 (x) − a02 (x) −a2 (x) C= ; D(x) = 0 D(b) a2 (x) 0 (E.1.27) Consideriamo una matrice invertibile 4×4, sia essa B, le cui due prime colonne siano i vettori (α1 , α2 , α3 , α4 )T e (β1 , β2 , β3 , β4 )T , allora (B1 y, B2 y, . . .) = ~y T B e quindi si ottiene ~y T C~z = (B1 y, B2 y, . . .)B −1 C~z (E.1.28) Se si denotano con (γ1 , γ2 , γ3 , γ4 ) e (δ1 , δ2 , δ3 , δ4 ) le ultime due righe della matrice B −1 C si vede subito che se y, z ∈ C 2 sono tali che B1 y = B2 y = 0 e B1∗ z = B2∗ z = 0 allora ~y T C~z = 0 e quindi (Ly, z) = (y, L∗ z). I coefficienti γi , δi dipendono evidentemente dalla matrice B scelta. Se B̂ è un’altra matrice invertibile le cui due prime colonne sono uguali a quelle di B, si ha allora che esistono due matrici 2×2 U, V , V invertibile, tali che I U I −U V −1 −1 B̂ = B ; B̂ = B −1 (E.1.29) 0 V 0 V −1 dove I è la matrice identità 2×2. I coefficienti γ̂i , δ̂i corrispondenti alla scelta di B̂ sono allora legati a γi , δi da γ̂1 γ̂2 γ̂3 γ̂4 γ1 γ2 γ3 γ4 = V −1 (E.1.30) δ1 δ2 δ3 δ4 δ̂1 δ̂2 δ̂3 δ̂4 e quindi generano condizioni ai limiti equivalenti alle E.1.25,E.1.26 Definizione E.1.1. Se il problema ai limiti Ly = 0, B1 y = B2 y = 0 soddisfa le ipotesi del teorema E.1.3 allora il problema L∗ y = 0, B1∗ y = B2∗ y = 0 come definiti in E.1.20, E.1.25, E.1.26 si dice problema aggiunto. Un problema si dice autoaggiunto se per ogni y, z ∈ C 2 che soddisfano B1 y = B2 y = 0 e B1∗ z = B2∗ z = 0 si ha (Ly, z) = (y, Lz). L’importanza dei problemi autoaggiunti è data dal seguente: Teorema E.1.4. Supponiamo il problema Ly = 0, B1 y = B2 y = 0 soddisfi le ipotesi del teorema E.1.3, allora esso ammette soluzione unica se e solo se il problema aggiunto L∗ y = 0, B1∗ y = B2∗ y = 0 ammette soluzione unica. In questo caso le funzioni di Green dei due problemi soddisfano la relazione G∗ (x, t) = G(t, x) (E.1.31) in particolare la funzione di Green di un problema autoaggiunto è simmetrica. Dimostrazione. supponiamo che Ly = 0, B1 y = B2 y = 0 possieda una sola soluzione e denotiamo con z una soluzione del problema aggiunto L∗ z = 0, B1∗ z = B2∗ z = 0. Sia Y (x) la soluzione del problema Ly = z, B1 y = B2 y = 0, allora si ha kzk2 = (z, z) = (LY, z) = (Y, L∗ z) = (Y, 0) = 0 (E.1.32) E.2. PROBLEMA DI STURM-LIOUVILLE 121 e quindi z = 0 e il problema aggiunto ha soluzione unica. L’altra implicazione si mostra in modo identico. Per mostrare la relazione E.1.31 consideriamo due funzioni continue f, g e definiamo Z Z b y(x) = G(x, t)f (t)dt; z(x) = a b G∗ (x, t)g(t)dt (E.1.33) a per la definizione di funzione di Green le funzioni y, z soddisfano allora i problemi ai limiti Ly = f , B1 y = B2 y = 0 e L∗ z = g, B1∗ z = B2∗ z = 0. La relazione (Ly, z) = (y, L∗ z) (cioè (f, z) = (y, g)) diventa allora Z bZ b (G∗ (x, t) − G(t, x))f (x)g(t)dtdx = 0 (E.1.34) a a che deve essere verificata per ogni f, g continua, quindi si ottiene G∗ (x, t) = G(t, x). Riassumendo si ottiene quindi che, sotto certe ipotesi, se un problema ai limiti è autoaggiunto l’operatore che associa la funzione continua f alla soluzione del problema Ly = f , B1 y = B2 y = 0 è un operatore compatto autoaggiunto. Lemma E.1.3. Condizione necessaria affinchè il problema Ly = 0, B1 y = B2 y = 0 sia autoaggiunto è che L abbia la forma Ly = (a2 (x)y 0 )0 + a0 (x)y (E.1.35) Dimostrazione. sviluppando l’espressione E.1.20 si ottiene L∗ z = a2 (x)z 00 + (2a02 (x) − a1 (x))z 0 + (a002 (x) − a01 (x) + a0 (x))z (E.1.36) quindi affinchè sia L = L∗ si deve avere a02 (x) = a1 (x), cioè L deve avere la forma E.1.35. Teorema E.1.5. Il problema (a2 (x)y 0 )0 + a0 (x)y = h αy(a) + βy 0 (a) = 0; α2 + β 2 > 0 γy(b) + δy 0 (b) = 0; γ 2 + δ 2 > 0 (E.1.37) (E.1.38) (E.1.39) è un problema autoaggiunto con B1∗ = B1 , B2∗ = B2 e si chiama problema di Sturm-Liouville. Dimostrazione. dal lemma precedente segue che L = L∗ e da E.1.21 si ha (Ly, z) − (y, Lz) = [a2 (x)(y 0 (x)z(x) − y(x)z 0 (x))]ba (E.1.40) Si vede inoltre semplicemente che y 0 (x)z(x) − y(x)z 0 (x) si annulla sia in a che in b: supponendo ad esempio α 6= 0 si ha β β (E.1.41) y 0 (a)z(a) − y(a)z 0 (a) = y 0 (a) − z 0 (a) − − y 0 (a) z 0 (a) = 0 α α E.2 Problema di Sturm-Liouville In questa sezione saranno ridimostrati sotto ipotesi più generali alcuni teoremi della sezione precedente. 122 APPENDICE E. PROBLEMA DI STURM-LIOUVILLE Definizione E.2.1. Si chiama problema di Sturm-Liouville il problema consistente nel risolvere d dy Ly = p(t) + q(t)y = f (t) (E.2.1) dt dt con le condizioni ai limiti α1 y(a) + α2 y 0 (a) = 0 β1 y(b) + β2 y 0 (b) = 0 (E.2.2) (E.2.3) dove p ∈ C 1 , q ∈ C, p(x) > 0 su [a, b] e f ∈ L2 . Si chiamano autovalori del problema di SturmLiouville i λ ∈ C tali che il problema Ly = λy con le condizioni ai limiti E.2.2 e E.2.3 ammette una soluzione non nulla; le soluzioni non nulle corrispondenti ad un determinato autovalore si chiamano autofunzioni. Poichè si è supposto f ∈ L2 una soluzione del problema di Sturm-Liouville deve essere continua, derivabile q.o. e l’uguaglianza in E.2.1 deve essere vera quasi ovunque. Lemma E.2.1. Consideriamo il problema di Sturm-Liouville E.2.1, E.2.2, E.2.3 e supponiamo che 0 non sia un autovalore del problema. Allora se il problema ammette una soluzione essa è unica. Dimostrazione. supponiamo per assurdo che il problema ammetta due soluzioni distinte y1 , y2 , allora y = y1 − y2 soddisfa Ly = 0 e le condizioni ai limiti E.2.2 e E.2.3 e poichè y1 6= y2 si ha y 6= 0, contraddicendo il fatto che 0 non è un autovalore del problema. Teorema E.2.1 (Esistenza della funzione di Green). Consideriamo il problema di SturmLiouville E.2.1, E.2.2, E.2.3 e supponiamo che 0 non sia un autovalore, allora esiste k : [a, b] × [a, b] → R continua e simmetrica tale che l’unica soluzione del problema considerato è data da Z b y(x) = k(x, t)f (t)dt (E.2.4) a k(x, t) si dice funzione di Green del problema di Sturm-Liouville. Dimostrazione. dalla teoria elementare delle equazioni differenziali lineari segue che esiste una unica soluzione u(t) del problema di Cauchy Lu = 0, u(a) = −α2 , u0 (a) = α1 ed un’unica soluzione v(t) del problema di Cauchy Lv = 0, v(b) = −β2 , v 0 (b) = β1 . L’ipotesi che 0 non sia un autovalore del problema mostra che u e v sono linearmente indipendenti, infatti u soddisfa α1 u(a) + α2 u0 (a) = 0 e v soddisfa β1 v(b) + β2 v 0 (b) = 0, quindi se fosse ad esempio u = cost · v, u sarebbe una autofunzione di 0. Poniamo lu(x) se a ≤ x ≤ t k(x, t) = (E.2.5) mv(x) se a ≤ t < x dove l, m sono costanti da determinare. Scegliamo l, m in modo che esse soddisfino mv(t) − lu(t) = 0 p(t)[mv 0 (t) − lu0 (t)] = 1 (E.2.6) (E.2.7) Risolvendo si ottiene l = v(t)/∆; m = u(t)/∆ (E.2.8) dove ∆ = p(t)(v 0 u − u0 v) = p(t)W (u, v) e W (u, v) è il wronskiano di u, v, che è diverso da 0 poichè u, v sono indipendenti. Inoltre d∆ = u(pv 0 )0 + u0 (pv 0 ) − v(pu0 )0 − v 0 (pu0 ) = −quv + vqu = 0 dt (E.2.9) E.2. PROBLEMA DI STURM-LIOUVILLE 123 quindi ∆ è una costante e si ha k(x, t) = u(x)v(t)/∆ se u(t)v(x)/∆ se a≤x≤t a≤t<x (E.2.10) Per completare la dimostrazione basta verificare direttamente che y come definita da E.2.4 è soluzione del problema di Sturm-Liouville. Rb Poichè y 0 (x) = a ∂x k(x, t)f (t)dt e quando x = a si ha x ≤ t su tutto l’intervallo di integrazione, si ha Z Z 1 b 0 1 b 0 u(a)v(t)f (t)dt; y (a) = u (a)v(t)f (t)dt (E.2.11) y(a) = ∆ a ∆ a e quindi α1 y(a) + α2 y 0 (a) = 0 poichè per costruzione si ha α1 u(a) + α2 u0 (a) = 0. Analogamente si vede che è soddisfatta la condizione in b. Si ha inoltre Z b Z x Z a ∆y(x) = ∆ k(x, t)f (t)dt = v(x) u(t)f (t) + u(x) v(t)f (t)dt (E.2.12) a a x quindi (usando il teorema fondamendamentale del calcolo secondo Lebesgue [vedi appendice D] ed identificando funzioni uguali q.o.) si ha Z x (∆y(x))0 = v(x)u(x)f (x) + v 0 (x) u(t)f (t)dt − u(x)v(x)f (x) + (E.2.13) Z +u0 (x) b Z v(t)f (t)dt = v 0 (x) x a x Z u(t)f (t)dt + u0 (x) a b v(t)f (t)dt x e analogamente Z x [p(x)(∆y(x))0 ]0 = (pv 0 )0 Z u(t)f (t)dt + pv 0 uf + (pu0 )0 a Z 0 0 f ∆ + (pv ) b v(t)f (t)dt − pu0 vf = x x Z b 0 0 u(t)f (t)dt + (pu ) a (E.2.14) v(t)f (t)dt x quindi infine Z L(∆y) = (Lv) Z x b u(t)f (t)dt + (Lu) a v(t)f (t)dt + pf (v 0 u − u0 v) = f ∆ (E.2.15) x Definizione E.2.2. Definiamo l’operatore K : L2 → L2 definito da Kf = Rb a k(x, t)f (t)dt. Lemma E.2.2. Sia D l’insieme delle funzioni di L2 che hanno un rappresentante derivabile due volte con derivata seconda in L2 e che soddisfa le condizioni al contorno E.2.2,E.2.3. Allora K è su D l’inverso di L. Dimostrazione. sia y ∈ D tale che Ly = f , allora dal teorema precedente segue che Kf = KLy = y, quindi KL = I. Inoltre dalla dimostrazione del teorema precednte segue che LKf = f , quindi LK = I. Teorema E.2.2. L’operatore K è compatto e autoaggiunto. Dimostrazione. vedi corollario 3.4.2. Teorema E.2.3. Valgono i seguenti: 1. 0 non è autovalore di K. 124 APPENDICE E. PROBLEMA DI STURM-LIOUVILLE 2. λ è autovalore di K se e solo se µ = 1/λ è un autovalore del problema di Sturm-Liouville di cui k è la funzione di Green. Dimostrazione. 1) Se f è diversa da 0, una soluzione di Ly = f con condizioni al bordo E.2.2, E.2.3 è y = Kf , quindi Kf non può essere uguale a zero, poichè zero non è soluzione di Ly = f . 2) Se Kφ = λφ e φ 6= 0, allora per il punto (1) λ 6= 0 e dal lemma E.2.2 segue che φ = λLφ e che φ soddisfa le condizioni ai limiti, quindi 1/λ è autovalore di L. D’altra parte se µ è un autovalore del problema di Sturm-Liouville, allora per ipotesi µ 6= 0 e Lφ = µφ, quindi φ = µKφ, quindi 1/µ è autovalore di K. Applicando quindi il teorema spettrale per gli operatori autoaggiunti all’operatore K si ottiene quindi subito il seguente Teorema E.2.4. Sia dato un problema di Sturm-Liouville che non abbia 0 come autovalore, allora 1. tutti gli autovalori sono reali e formano una successione {µk } tale che limk→∞ |µk | = +∞. 2. esiste una base ortonormale di L2 (a, b) costituita da autofunzioni del problema. 3. gli autospazi hanno dimensione 1. Dimostrazione. i punti (1) e (2) discendono dal teorema spettrale. Per quanto riguarda il terzo, dal teorema spettrale segue solo che gli autospazi hanno dimensione finita. Supponiamo per assurdo che esistano due funzioni indipendenti u, v entrambe soluzioni di Ly = λy e che soddisfano le condizioni ai limiti E.2.2, E.2.3, allora, poichè tutte le soluzioni di Ly = λy hanno la forma y = c1 u + c2 v, seguirebbe che tutte le soluzioni di Ly = λy sono autofunzioni del problema e ciò è assurdo, in quanto si può scegliere una soluzione del problema di Cauchy Ly = λy con y(a) = ξ, y 0 (a) = η con α1 ξ + α2 η 6= 0 che non è evidentemente autofunzione del problema. Nel teorema precedente si è usata in modo fondamentale la assunzione che 0 non sia un autovalore del problema di Sturm-Liouville considerato. Questa è una assunzione piuttosto forte e, come si vedrà subito, non è necessaria. Per dimostrare ciò scriviamo preliminarmente il problema di Sturm-Liouville in una forma più conveniente: z è una autofunzione del problema di Sturm-Liouville con autovalore λ se z 6= 0 e z soddisfa (p(x)z 0 )0 + r(x)z + λz = 0 αz(a) + βz 0 (a) = 0 α2 + β 2 > 0 γz(b) + δz 0 (b) = 0 γ 2 + δ 2 > 0 (E.2.16) (E.2.17) dove p(x) > 0 su [a, b], p ∈ C 2 e r ∈ C. Sia f una funzione derivabile due volte che sarà fissata in seguito ed applichiamo il cambiamento di variabile z(x) = f (x)y(x). L’equazione E.2.16 diventa pf 00 y + 2pf 0 y 0 + pf y 00 + p0 f 0 y + p0 f y 0 + rf y + λf y = 0 (E.2.18) p Scegliendo f (x) = 1/ p(x) i termini sottolineati si annullano e si ottiene un’equazione della forma p(x)y 00 − q(x)y + λy = 0 (E.2.19) dove q(x) è una funzione continua. Tramite la precedente sostituzione, la prima delle condizioni E.2.17 diventa 0 = αz(a) + βz 0 (a) = [αf (a) + βf 0 (a)]y(a) + [βf (a)]y 0 (a) = h1 y(a) + k1 y 0 (a) La trasformazione (α, β) → (h1 , k1 ) ha come matrice rappresentatriva f (a) f 0 (a) T = 0 f (a) (E.2.20) (E.2.21) E.2. PROBLEMA DI STURM-LIOUVILLE 125 quindi det T = f 2 (a) = 1/p(a) 6= 0, quindi la trasformazione è biunivoca e quindi (α, β) = (0, 0) se e solo se (h1 , k1 ) = (0, 0), quindi si ha h21 + k22 > 0. Analogamente si ragiona per la seconda delle E.2.17 ottenendo quindi p(x)y 00 − q(x)y + λy = 0 h1 y(a) + k1 y 0 (a) = 0 h21 + k12 > 0 h2 y(b) + k2 y 0 (b) = 0 h22 + k22 > 0 (E.2.22) (E.2.23) dove p(x) > 0 su [a, b], p ∈ C 2 , q ∈ C. Da quanto appena visto segue Lemma E.2.3. Se λ è un autovalore del problema E.2.16, E.2.17 allora λ è un autovalore del problema E.2.22, E.2.23. Teorema E.2.5. Esiste un numero reale r > 0 tale che se λ ≤ −r allora la unica soluzione di E.2.22, E.2.23 è y = 0. Dimostrazione. la dimostrazione si divide in quattro casi (nel seguito per semplicità si userà la notazione I = [a, b]): caso 1 ) supponiamo k1 k2 6= 0; si può quindi supporre k1 = k2 = −1. Se fosse y(a) = 0 si avrebbe anche y 0 (a) = 0 e quindi il teorema risulterebbe in questo caso dimostrato. Supponiamo per assurdo che y(a) 6= 0; moltiplicando y per una adeguata costante si può quindi supporre che y(a) = 1 e y 0 (a) = h1 . Ponendo per ogni y(x) 6= 0 z = y 0 /y l’equazione E.2.22 diviene z0 = q(x) λ − − z2 p(x) p(x) (E.2.24) Sia ora M = supx∈I |q(x)|, = inf x∈I p(x) > 0 e M 0 = supx∈I p(x) > 0 e supponiamo che λ ≤ −M − M 0 h21 − (E.2.25) q(a) λ q(a) M M0 2 − − h21 ≥ + + h1 + − h21 ≥ >0 p(a) p(a) p(a) p(a) p(a) p(a) p(a) (E.2.26) allora si ha z 0 (a) = e quindi z è strettamente crescente in un intorno destro di a. Si vuole ora mostrare che y(x) 6= 0 in I; z(x) > h1 se x > a (E.2.27) Supponiamo per assurdo che y si annulli in I e sia x1 il più piccolo zero di y (x1 > a poichè y(a) = 1); allora y(x) > 0 se a ≤ x < x1 e quindi y 0 (x1 ) ≤ 0; inoltre non si può avere y 0 (x1 ) = 0 altrimenti si avrebbe y = 0 su tutto I, quindi y 0 (x1 ) < 0. Inoltre si ha q(x) − λ ≥ q(x) + M + M 0 h21 + > 0 (E.2.28) e quindi dall’equazione E.2.22 segue che y 00 (x) > 0 se a ≤ x < x1 (poichè in questo intervallo y(x) > 0), quindi y 0 è crescente per a ≤ x < x1 e quindi y 0 (x) < 0 in questo intervallo; da ciò segue che limx→x− z(x) = −∞. Poichè z è continua su a ≤ x < x1 deve esistere in questo intervallo un 1 minimo x2 tale che z(x2 ) = h1 e z(x) > h1 se a < x < x2 (poichè z(a) = h1 e z 0 (a) > 0), ma questo implica z 0 (x2 ) ≤ 0 mentre si ha z 0 (x2 ) = λ q(x2 ) − − h21 > 0 p(x2 ) p(x2 ) (E.2.29) da questo assurdo segue quindi la relazione E.2.27. Analogamente si mostra che se si ha λ ≤ −M − M 0 h22 − allora z(x) ≤ h2 in I. Sia c = max(|h1 |, |h2 |), si ha allora che se λ ≤ −M − M 0 c2 − < 0 allora |z(x)| ≤ c su I; da E.2.24 si deduce allora z 0 (x) ≥ − λ M − 0 − c2 = µ M (E.2.30) 126 APPENDICE E. PROBLEMA DI STURM-LIOUVILLE quindi usando il teorema del valor medio si ottiene h2 − h1 = z(b) − z(a) ≥ µ(b − a) (E.2.31) Se ora si sceglie |h2 − h1 | M0 0 2 0 M −M c −−M 1+ λ≤− (≤ −M − M 0 c2 − ) b−a si ottiene µ=− M λ |h2 − h1 | − 0 − c2 ≥ 1 + M b−a (E.2.32) (E.2.33) e quindi inserendo E.2.33 all’interno di E.2.31 si ottiene infine h2 − h1 ≥ (b − a) + |h2 − h1 | assurdo, quindi si deve avere y(a) = 0 e y(x) = 0 su I ed il teorema è dimostrato in questo caso. caso 2 ) supponiamo ora k1 = 0 e k2 6= 0 (quindi si può supporre k2 = −1); si deve allora avere y(a) = 0 (poichè deve essere h1 6= 0) e se y 0 (a) = 0 si ha anche y(x) = 0 su I ed il teorema è mostrato. Supponiamo per assurdo che y 0 (a) 6= 0; moltiplicando y per una appropriata costante si può allora supporre y 0 (a) = 1 e quindi si ha limx→a+ z(x) = +∞. Sia ora M 0 = supx∈I p(x) > 0 e supponiamo λ ≤ −M − 2M 0 (E.2.34) Si vuole ora mostrare che y 0 (x) ≥ 1 su I (E.2.35) dall’equazione E.2.22 segue che y 00 (x) > 0 in un intorno destro di a, quindi y 0 (x) > 1 in questo intorno (poichè y 0 (a) = 1). Supponiamo ora che y 0 (x) = 1 per qualche x > a e sia x1 il più piccolo x > a tale che y 0 (x) = 1, allora y 0 (x) ≥ 1 se a < x ≤ x1 e quindi y(x) > 0 in questo intervallo (poichè y(a) = 0) e quindi usando E.2.22 si ha y 00 (x) > 0, mentre per costruzione si dovrebbe avere y 00 (x1 ) ≤ 0, assurdo, quindi si è dimostrato E.2.35. Da ciò segue che y > 0 su a < x ≤ b e quindi z è definita su a < x ≤ b. Mostriamo ora il seguente enunciato: r M λ z(x) > − − 0 −1 (E.2.36) M ciò ha senso poichè se λ è abbastanza negativo si ha − M λ − 0 −1≥0 M (E.2.37) q λ supponiamo ora per assurdo che x2 sia il più piccolo numero tale che z(x2 ) = − M − M0 − 1 0 (x2 > a poichè limx→a+ z(x) = +∞). In x2 si dovrebbe allora avere z (x2 ) ≤ 0 mentre da E.2.24 segue M λ M λ M λ z 0 (x2 ) ≥ − − 0 − z 2 (x2 ) = − − 0+ + 0 +1=1>0 (E.2.38) M M M assurdo, quindi E.2.36 è vera. λ Se ora supponiamo λ abbastanza piccolo (abbastanza negativo) da far sı̀ che h22 < − M − M0 − 1 si trova che la relazione z(b) = h2 , che dovrebbe essere verificata, è impossibile, quindi nuovamente si deve avere y(x) = 0 su I ed il teorema è mostrato anche in questo caso. caso 3 ) se k1 6= 0 e k2 = 0 si procede in modo analogo al caso 2. caso 4 ) supponiamo infine k1 = k2 = 0, allora si ha y(a) = 0 (poichè h1 6= 0) e se fosse y 0 (a) = 0 si avrebbe y(x) = 0 su I. Supponiamo per assurdo y 0 (a) 6= 0, allora si può supporre y 0 (a) = 1 ed usando E.2.35 si ottiene che y è strettamente crescente, contrariamente al fatto che si deve avere y(b) = 0, assurdo, quindi anche in quest’ultimo caso si deve avere y(x) = 0 su I ed il teorema è dimostrato. E.2. PROBLEMA DI STURM-LIOUVILLE 127 Corollario E.2.1. Dato il problema di Sturm-Liouville avente come dati Ly = (p(x)y 0 )0 + q(x)y 0 αy(a) + βy (a) = 0 α2 + β 2 > 0 γy(b) + δy 0 (b) = 0 γ 2 + δ 2 > 0 0 (E.2.39) (E.2.40) esiste un R ∈ R tale che il problema L0 y = (p(x)y 0 )0 + (q(x) − R)y 0 αy(a) + βy 0 (a) = 0 α2 + β 2 > 0 γy(b) + δy 0 (b) = 0 γ 2 + δ 2 > 0 (E.2.41) (E.2.42) non ha 0 come autovalore, inoltre i due problemi hanno le stesse autofunzioni. Dimostrazione. Sia R > r (dove r è quello del teorema precedente) e supponiamo per assurdo che il problema E.2.41, E.2.42 ammetta zero come autovalore, allora dovrebbe esistere y 6= 0 tale che (p(x)y 0 )0 + (q(x) − R)y 0 = 0 (E.2.43) e che soddisfa E.2.42, quindi per il lemma E.2.3 λ = −R dovrebbe essere autovalore del problema E.2.22, E.2.23, quindi per il teorema precedente si deve avere λ > −r (poichè y 6= 0), ma −R < −r, assurdo. La seconda affermazione della tesi segue dal fatto immediato che se Ly = λy allora L0 y = (λ − R)y. Corollario E.2.2. Il teorema E.2.4 vale anche se un problema di Sturm-Liouville ha 0 come autovalore. Esempio E.2.1. {sin nx, cos nx}n∈N è una base di L2 (−π, π). Dimostrazione. le funzioni {sin nx} sono autofunzioni del problema Ly = y 00 , y(0) = 0, y(π) = 0 e quindi formano una base di L2 (0, π). Analogamente {cos nx} sono le autofunzioni del problema Ly = y 00 , y 0 (0) = 0, y 0 (π) = 0 e sono quindi anch’esse una base di L2 (0, π). Mostriamo che {sin nx} 2 2 formano R π una base dello spazio delle funzioni dispari di L (−π, π): sia f dispari e in L (−π, π) tale che −π f (x) sin nx dx = 0 per ogni n, allora si ha Z Z π 0= π f (x) sin nx dx = 2 −π f (x) sin nx dx 0 e poichè {sin nx} è una base di L2 (0, π) si ha f = 0 q.o. su [0, π] e poichè f è dispari f = 0 q.o. su [−π, π]. Analogamente si vede che {cos nx} è una base per le funzioni pari di L2 (−π, π). Sia ora f ∈ L2 (−π, π), allora si ha f (x) = f (x) + f (−x) f (x) − f (−x) + = fp (x) + fd (x) 2 2 dove fp è pari e fd è dipari. Supponiamo ora che f sia ortogonale a {sin nx, cos nx}n∈N , allora Z π Z π 0= f (x) sin nx dx = fd (x) sin nx dx −π −π quindi fd = 0 q.o. su [−π, π]; usando cos nx si vede che fp = 0 q.o. in [−π, π], quindi infine f = 0 q.o su [−π, π], quindi il teorema è mostrato. Bibliografia: la dimostrazione del teorema E.2.5 è tratta, con alcune modifiche, da [3]; la maggior parte del resto dei teoremi è tratta da vari testi sulle equazioni differenziali. Appendice F Conseguenze del lemma di Baire Teorema F.0.6 (Lemma di Baire).TSia (X, k kX ) uno spazio di Banach e sia (An )n∈N una successione di aperti densi, allora G = n∈N An è denso in X. Dimostrazione. sia x ∈ X, > 0 e definiamo ω = B(x, ), si deve dimostrare che G ∩ ω 6= ∅. Scegliamo x0 ∈ ω e r0 > 0 tali che B(x0 , r0 ) ⊂ ω. Scegliamo ora x1 ∈ B(x0 , r0 ) ∩ A1 e r1 > 0 tale che r0 B(x1 , r1 ) ⊂ B(x0 , r0 ) ∩ A1 ; 0 < r1 < (F.0.1) 2 il che è possibile poichè A1 è un aperto denso. Proseguendo in maniera analoga, data B(xn , rn ) si costruisce la successione sfere chiuse rn B(xn+1 , rn+1 ) ⊂ B(xn , rn ) ∩ An+1 ; 0 < rn+1 < (F.0.2) 2 questa è per costruzione una successione di sfere incapsulate con raggio tendente a zero, ne segue semplicemente che la successione {xn } è di Cauchy, quindi ammette limite, sia esso x̄. Poichè xn+k ∈ B(xn , rn ) per ogni n, k ≥ 0 si ha al limite x̄ ∈ B(xn , rn ) (F.0.3) e quindi in particolare x̄ ∈ ω ∩ G. Passando ai complementari e usando le formule di de Morgan si ottiene una formulazione equivalente del lemma di Baire: Teorema F.0.7. Sia (X, k kX ) uno spazio di S Banach e sia {Cn }n∈N una successione di chiusi ∞ aventi parte interna vuota, allora l’insieme F = n=0 Cn ha parte interna vuota. Corollario F.0.3. SiaS(X, k kX ) uno spazio normato completo e sia {Cn }n∈N una successione ∞ di chiusi tale che X = n=0 Cn , allora esiste un k ∈ N tale che Ck ha parte interna non vuota. Teorema F.0.8 (Teorema della applicazione aperta). Siano (X, k kX ), (Y, k kY ) spazi normati completi e sia L : X → Y una trasformazione lineare continua suriettiva, allora esiste un δ > 0 tale che B(0, δ) ⊂ L(B(0, 1)) (F.0.4) Dimostrazione. consideriamo la successione di insiemi Cn = L(B(0, n)) S∞ (F.0.5) poichè L è suriettivo si ha Y = n=0 Cn , quindi per il corollario F.0.3 esiste un k ∈ N tale che L(B(0, k)) ha chiusura con parte interna non vuota, quindi un insieme aperto non vuoto W che è contenuto nella chiusura di L(B(0, k)). Sia y0 ∈ W e sia η > 0 tale che B(y0 , η) ⊂ W , allora se 128 129 kykY < η, sia y0 che y + y0 sono contenuti nella chiusura di L(B(0, k)), quindi esistono successioni {x0i } e {x00i } tali che x0i , x00i ∈ B(0, k) per ogni i ∈ N e lim L(x0i ) = y0 , lim L(x00i ) = y0 + y i→∞ i→∞ (F.0.6) ponendo xi = x00i − x0i si ha quindi kxi kX ≤ kx0i kX + kx00i kX < 2k (F.0.7) e poichè L è lineare e continuo si ha limi→∞ L(xi ) = y. Si conclude quindi che per ogni y ∈ Y tale che kykY < η esiste una successione {xi } in X tale che kxi kX < 2k per ogni i e limi→∞ L(xi ) = y. Sia ora y ∈ Y generico (ma 6= 0) e sia N > 0 tale che 0 < N/2 < kykY < N , allora k yη N kY < η, quindi esiste una successione zn ∈ X tale che kzi kX ≤ 2k e limi→∞ L(zi ) = yη , ma allora per la N linearità limi→∞ L(zi N/η) = y, inoltre kzi N/ηkX ≤ kzi kX N 2kN 4k N < = < δ −1 kykY η η η 2 (F.0.8) dove si è posto δ = η/4k (che è indipendente da y). Si ottiene quindi in particolare che, fissato > 0, ad ogni z ∈ Y corrisponde un x ∈ X tale che kxkX < δ −1 kzkY ; kz − L(x)kY < (F.0.9) Siano ora y ∈ B(0, δ) ⊂ Y e > 0 fissati; per l’equazione F.0.9 esiste un x1 ∈ X tale che kx1 kX < 1 e 1 ky − L(x1 )kY < δ (F.0.10) 2 costruiamo ora per induzione la successione {xi } nel modo seguente: supponiamo dati x1 , . . . , xn ∈ X tali che ky − L(x1 ) − · · · − L(xn )kY < 2−n δ (F.0.11) (la condizione precedente è soddisfatta per costruzione da x1 ), allora si può usare l’equazione F.0.9 con z = y − L(x1 ) − · · · − L(xn ) per ottenere un xn+1 tale che e kxn+1 kX < 2−n (F.0.12) ky − L(x1 ) − · · · − L(xn ) − L(xn+1 )kY < 2−(n+1) δ (F.0.13) Se si pone sn = x1 + · · · + xn , l’equazione F.0.12 mostra che sn è una successione di Cauchy in X e, poichè quest’ultimo è completo, esiste un x ∈ X tale che sn → x; inoltre la disuguaglianza kx1 kX < 1 unita con la F.0.12 mostra che kxkX < 1 + e poichè L è continua si ha L(sn ) → L(x). A causa dell’equazione F.0.11 si ha allora L(x) = y. Si è quindi mostrato che B(0, δ) ⊂ L(B(0, 1 + )) (F.0.14) e quindi per la linearità di L si ha per ogni > 0 δ ⊂ L(B(0, 1)) B 0, 1+ Quindi si ha infine: L(B(0, 1)) ⊃ ∞ [ k=1 δ B 0, 1 + 1/k (F.0.15) = B(0, δ) Il nome del teorema precedente è dovuto al seguente corollario: (F.0.16) 130 APPENDICE F. CONSEGUENZE DEL LEMMA DI BAIRE Corollario F.0.4. Siano (X, k kX ), (Y, k kY ) spazi normati completi e sia L : X → Y una trasformazione lineare continua suriettiva, allora per ogni A ⊂ X aperto L(A) ⊂ Y è aperto. Dimostrazione. sia y ∈ L(A), allora esiste x ∈ A tale che L(x) = y, inoltre poichè A è aperto esiste un > 0 tale che B(x, ) ⊂ A; per linearità si ha L(B(x, )) = L(x + B(0, )) = y + L(B(0, 1)) (F.0.17) ma, per il teorema della applicazione aperta, esiste un δ > 0 tale che B(0, δ) ⊂ L(B(0, 1)) (F.0.18) y + B(0, δ) = B(y, δ) ⊂ L(B(x, )) ⊂ L(A) (F.0.19) quindi quindi L(A) è aperto. Corollario F.0.5. Siano (X, k kX ), (Y, k kY ) spazi normati completi e sia L : X → Y una trasformazione lineare continua biunivoca, allora L−1 è pure continua. Dimostrazione. se L : X → Y è biunivoca e continua, dall’equazione F.0.4 segue che esiste un δ > 0 tale che per ogni x ∈ X tale che kL(x)kY < δ si ha kxkX < 1. Sia ora x ∈ X tale che kL(x)kY = d, allora si ha anche (δ − )kL(x)kY = (δ − )d (F.0.20) da cui δ− kL(x)kY = δ − < δ d quindi per linearità (supponendo < δ) δ − d x < 1 X cioè (F.0.21) (F.0.22) d δ− (F.0.23) 1 1 d = kL(x)kY δ δ (F.0.24) kxkX < e quindi al limite per → 0 si ottiene kxkX ≤ cioè infine kL−1 (y)kX ≤ 1 kykY δ (F.0.25) che mostra che L−1 : Y → X è continua. Corollario F.0.6. Sia X uno spazio vettoriale e siano k k1 , k k2 due norme tali che (X, k k1 ), (X, k k2 ) siano entrambi spazi normati completi. Allora se kxk1 ≤ Ckxk2 le due norme sono equivalenti. Dimostrazione. da kxk1 ≤ Ckxk2 segue che I : (X, k k2 ) → (X, k k1 ) è una applicazione continua. Per il teorema precedente anche la applicazione inversa è continua, ma I −1 = I, quindi I : (X, k k1 ) → (X, k k2 ) è continua, cioè esiste c > 0 (c 6= 0 poichè I 6= 0) tale che kxk2 ≤ ckxk1 , quindi le due norme sono equivalenti. Definizione F.0.3. Siano (X, k kX ), (Y, k kY ) due spazi normati e L : ∆ ⊂ X → Y una applicazione lineare. Si dice che L ha grafico chiuso se il grafico di L è chiuso nello spazio (X × Y, k kX + k kY ). 131 È immediato verificare che se X, Y sono spazi di Banach, anche (X × Y, k kX + k kY ) lo è. Il fatto che il grafico di L sia chiuso in (X × Y, k kX + k kY ) significa che se zn ∈ GL e zn → z allora z ∈ GL , cioè se kzn − zk → 0 allora z ∈ GL dove k k = k kX + k kY , cioè, se z = (x, y), x ∈ X, y ∈ Y , da k[zn ]X − xkX + k[zn ]Y − yk → 0 (F.0.26) segue (x, y) ∈ GL cioè x ∈ ∆ e y = L(x). Ciò può essere espresso nella seguente forma più immediata: se kxn − xkX → 0 e kL(xn ) − ykY → 0, allora x appartiene al dominio di L e si ha y = L(x). Teorema F.0.9 (Teorema del grafico chiuso). Siano (X, k kX ), (Y, k kY ) due spazi di Banach e sia L : X → Y una applicazione lineare avente grafico chiuso, allora L è continua. Dimostrazione. consideriamo su X le due norme kxk1 = kxkX + kLxkY ; kxk2 = kxkX (F.0.27) Per ipotesi (X, k k2 ) è uno spazio di Banach. Mostriamo che anche (X, k k1 ) è uno spazio di Banach: sia {zn } ∈ X una successione di Cauchy per k k1 , allora in particolare {xn } è una successione di Cauchy in (X, k kX ) e {Lxn } è una successione di Cauchy in (Y, k kY ), quindi esistono z ∈ X e t ∈ Y tali che kxn − zkX → 0 e kLxn − tkY → 0, ma poichè L ha grafico chiuso, t = Lz e quindi kzn − zk1 → 0, quindi (X, k k1 ) è completo. Si ha inoltre evidentemente kxk2 ≤ kxk1 e quindi per il corollario precedente le due norme sono equivalenti, quindi esiste c > 0 tale che kxk1 ≤ ckxk2 cioè kxkX + kLxkY ≤ ckxkX (F.0.28) quindi c ≥ 1 e definendo k = c − 1 ≥ 0 si ha kLxkY ≤ kkxkX (F.0.29) e quindi L è continua. Bibliografia: la dimostrazione del teorema della applicazione aperta è tratta dal capitolo 5 di [8](per una dimostrazione meno tecnica e più geometrica si può vedere [1]), quella del teorema del grafico chiuso dal capitolo 2 di [1]. Una altra importante conseguenza del lemma di Baire è il teorema di uniforme limitatezza, tramite il quale si può dimostrare l’esistenza di (molte) funzioni continue aventi serie di Fourier divergente su un insieme non numerabile (vedi [8] cap. 5). Appendice G Il teorema fondamentale del calcolo In questa appendice si dimostreranno i principali teoremi che nella teoria dell’integrazione secondo Lebesgue legano l’integrale indefinito con la derivazione. Nella prima sezione sono dimostrati teoremi che saranno poi utilizzati a più riprese nelle dimostrazioni dei teoremi principali della sezione successiva. G.1 Premesse Definizione G.1.1. Sia a ∈ R e δ > 0. Se f è una funzione reale su (a, a + δ) definiamo limh→a+ f (h) = limh→a+ f (h) = sup { inf f (h)} (G.1.1) inf (G.1.2) a<t<a+δ a<h<t { sup f (h)} a<t<a+δ a<h<t questi due numeri reali estesi si chiamano rispettivamente limite inferiore destro e limite superiore destro. Definizione G.1.2. Sia a ∈ R e δ > 0. Se f è una funzione reale su (a − δ, a) definiamo limh→a− f (h) = limh→a− f (h) = sup { inf f (h)} (G.1.3) inf (G.1.4) a−δ<t<a t<h<a { sup f (h)} a−δ<t<a t<h<a questi due numeri reali estesi si chiamano rispettivamente limite inferiore sinistro e limite superiore sinistro. È evidente una rassomiglianza tra le definizioni precedenti e quelle di limite superiore ed inferiore di una successione, infatti è semplice vedere che limh→a+ f (h) = inf{lim inf f (an )} n→∞ dove l’estremo inferiore è considerato su tutte le successioni {an } tali che an > a e limn→∞ an = a. Analoghi risultati valgono per gli altri limiti. Definizione G.1.3. Sia a ∈ R e δ > 0. Se f è una funzione reale su [a, a + δ) definiamo f (a + h) − f (a) h f (a + h) − f (a) D+ f (a) = limh→0+ h D+ f (a) = limh→0+ 132 (G.1.5) (G.1.6) G.1. PREMESSE 133 D+ (a) e D+ f (a) si chiamano rispettivamente derivata inferiore destra e derivata superiore destra. Definizione G.1.4. Sia a ∈ R e δ > 0. Se f è una funzione reale su (a − δ, a] definiamo f (a + h) − f (a) h f (a + h) − f (a) D− f (a) = limh→0− h D− f (a) = limh→0− (G.1.7) (G.1.8) D− f (a) e D− f (a) si chiamano rispettivamente derivata inferiore sinistra e derivata superiore sinistra. I valori D+ f (a), D+ f (a), D− f (a) e D− f (a) si chiamano talvolta derivate di Dini . Definizione G.1.5. Sia a ∈ R e δ > 0. Se f è una funzione reale definita su (a − δ, a + δ), si dice che ha derivata destra in a se D+ f (a) = D+ f (a) e analogamente si dice che ha derivata sinistra in a se D− f (a) = D− f (a). Si noti che in questa definizione non si escludono i valori +∞ e −∞. Si dice che f è derivabile in a se è ivi derivabile sia da destra che da sinistra e i due valori coincidono; si dirà derivabile con derivata finita se risulta derivabile e la sua derivata un numero reale. Se si usa questa definizione, la derivabilità non implica più la continuità, infatti la funzione 1 se x > 0 0 se x = 0 (G.1.9) f (x) = −1 se x < 0 risulta derivabile in 0 con derivata +∞. Per questo nel seguito si porrà particolare attenzione alle funzioni derivabili con derivata finita. Poichè in C non esiste una struttura d’ordine, si vede immediatamente che le definizioni precedenti non hanno senso per una funzione f : (a − δ, a + δ) → C. Definizione G.1.6. Sia a ∈ R e δ > 0. Se f è una funzione complessa definita su (a − δ, a + δ), definiamo f (a + h) − f (a) h f (a + h) − f (a) 0 f− (a) = lim− h h→0 0 f+ (a) = lim h→0+ (G.1.10) (G.1.11) rispettivamente la derivata destra e sinistra. Nel campo complesso è convenzione definire f derivabile se le derivate destra e sinistra coincidono finite. Si vede semplicemente che f : (a − δ, a + δ) → C è derivabile se e solo se <f e =f sono derivabili con derivata finita e si ha f 0 (a) = (<f )0 (a) + i(=f )0 (a) (G.1.12) Poichè ogni funzione reale è anche complessa, le definizioni precedenti non sono completamente compatibili; ciononostante poichè nel seguito avranno importanza principalmente funzioni con derivata finita, tale incongruenza non creerà problemi di sorta. Teorema G.1.1. Sia (a, b) un intervallo aperto di R e sia f una funzione reale definita su (a, b). 0 0 Allora esistono al più una infinità numerabile di punti x ∈ (a, b) tali che esistano f− (x) e f+ (x) 0 0 (eventualmente infinite) e f− (x) 6= f+ (x). 0 0 0 0 Dimostrazione. sia A = {x ∈ (a, b)|f+ (x) < f− (x)} e B = {x ∈ (a, b)|f+ (x) > f− (x)}. Per ogni 0 0 x ∈ A sia rx un razionale tale che f+ (x) < rx < f− (x) e siano sx e tx razionali a < sx < x < tx < b 134 APPENDICE G. IL TEOREMA FONDAMENTALE DEL CALCOLO tali che f (y) − f (x) > rx se sx < y < x y−x f (y) − f (x) < rx se x < y < tx y−x (G.1.13) (G.1.14) Combinando le due relazioni precedenti si ottiene f (y) − f (x) < rx (y − x) (G.1.15) se y 6= x e sx < y < tx . Sia φ la funzione φ : A → Q3 definita da φ(x) = (rx , sx , tx ); poichè Q3 è numerabile, per mostrare che A è al più numerabile basterà mostrare che φ è iniettiva. Supponiamo esistano x, y ∈ A tali che x 6= y e φ(x) = φ(y); allora si avrebbe per definizione (sy , ty ) = (sx , tx ) e x e y sono entrambi in questo intervallo, quindi dalla relazione G.1.15 seguirebbe f (y) − f (x) < rx (y − x) f (x) − f (y) < ry (x − y) (G.1.16) (G.1.17) e, poichè rx = ry , sommando le due relazioni precedenti si ottiene 0 < 0. Con un ragionamento analogo si mostra che B è al più numerabile. Definizione G.1.7. Sia E ⊂ R; una famiglia V di intervalli chiusi di R si chiama ricoprimento di Vitali di E se per ogni x ∈ E e per ogni > 0 esiste un intervallo I ∈ V tale che x ∈ I e µ(I) < , cioè ogni punto di E è contenuto in intervalli arbitrariamente piccoli di E. Sia E un insieme e V l’insieme di tutti gli intervalli di R. Si verifica immediatamente che V è un ricoprimento di Vitali dell’insieme E. Teorema G.1.2 (Teorema di Vitali del ricoprimento finito). 1 Sia E un insieme di R e sia V un ricoprimento di Vitali di E. Allora esiste una famiglia numerabile {In } di intervalli disgiunti di V tale che µ∗ (E ∩ (∪n In )c ) = 0 (G.1.18) se inoltre µ∗ (E) < +∞, allora per ogni > 0 esiste una famiglia finita {I1 , . . . , Ip } di intervalli disgiunti di V tale che (G.1.19) µ∗ (E ∩ (∪pn=1 In )c ) < Dimostrazione. dimostriamo dapprima il secondo caso: sia µ∗ (E) < +∞, allora esiste un insieme aperto V tale che E ⊂ V e µ(V ) < +∞. Sia V0 = {I ∈ V|I ⊂ V }; allora V0 è un ricoprimento di Vitali di E. Sia I1 ∈ V0 ; se E ⊂ I1 allora la costruzione è completa, altrimenti si procede per induzione: supponiamo che I1 , . . . , In siano intervalli disgiunti di V0 ; se E ⊂ ∪ni=1 Ii la costruzione è completa, altrimenti definiamo An = n [ In Un = V ∩ Acn (G.1.20) k=1 Allora An è chiuso, Un è aperto e, poichè E 6⊂ ∪nk=1 Ik , si ha anche Un ∩ E 6= ∅. Sia δn = sup{µ(I)|I ∈ V0 , I ⊂ Un } (G.1.21) e poichè Un è aperto si ha δn > 0. Sia quindi In+1 ∈ V0 tale che In+1 ⊂ Un e µ(In+1 ) > 21 δn . Se questa costruzione non termina dopo un numero finito di passaggi, nel qual caso il teorema è evidentemente vero, si ottiene una successione {In }∞ n=1 di intervalli disgiunti di V0 ; definiamo A= ∞ [ In (G.1.22) n=1 1 Questo teorema sarà usato per mostrare il teorema G.1.2 ed il teorema G.2.10; per una dimostrazione di questi ultimi che non fà uso del teorema di Vitali vedi l’ultima sezione di questo capitolo. G.1. PREMESSE 135 si vuole mostrare che µ∗ (E ∩ Ac ) = 0; a questo proposito definiamo per ogni n l’intervallo chiuso Jn , avente lo stesso centro di In e tale che µ(Jn ) = 5µ(In ), quindi µ( ∞ [ Jn ) ≤ n=1 ∞ X µ(Jn ) = 5 n=1 ∞ X µ(In ) = 5µ(A) < 5µ(V ) < +∞ (G.1.23) n=1 dalla convergenza della P∞serie a secondo termine segue in particolare che i suoi resti parziali tendono a zero, cioè limp→∞ n=p µ(Jn ) = 0 e poichè ∞ [ µ( ∞ X Jn ) ≤ n=p µ(Jn ) (G.1.24) n=p S∞ si ha anche limn→∞ µ( n=p Jn ) = 0; quindi per mostrare che µ∗ (E ∩ Ac ) = 0 basterà mostrare S ∞ che E ∩ Ac ⊂ n=p Jn per ogni p ∈ N. Fissiamo quindi p ∈ N e sia x ∈ E ∩ Ac , allora si ha c x ∈ E ∩ A ⊂ E ∩ Acp ⊂ Up e quindi esiste I ∈ V0 tale che x ∈ I ⊂ Up . Poichè si ha δn−1 < 2µ(In ) e da G.1.23 si deduce che limn→∞ µ(In ) = 0, esiste un intero n tale che δn < µ(I), quindi per come è definito δn , esiste un intero n tale che I 6⊂ Un ; sia q il più piccolo intero con questa proprietà (evidentemente p < q), allora si ha per costruzione I ∩ Aq−1 = ∅ I ∩ Aq 6= ∅ (G.1.25) ne segue che I ∩ Iq 6= ∅ (G.1.26) µ(I) ≤ δq−1 < 2µ(Iq ) (G.1.27) e poichè I ⊂ Uq−1 (poichè p < q) si ha poichè µ(Jq ) = 5µ(Iq ), le due relazioni precedenti mostrano che ∞ [ I ⊂ Jq ⊂ Jn (G.1.28) n=p S∞ S∞ quindi x ∈ n=p Jn , quindi si ha E ∩ Ac ⊂ n=p Jn e quindi µ∗ (E ∩ Ac ) = 0. Sia ora > 0 e sia p un intero tale che ∞ X µ(In ) < (G.1.29) n=p+1 allora si ha c (E ∩ A ) ∪ ( ∞ [ In ) = E ∩ ( n=p+1 =E∩( ∞ \ Inc ) ∪( n=1 p \ Inc ) ∩ ( n=1 = E ∩ Acp ∩ ( ∞ \ Inc ) ∪ ( In )c ∪ ( n=p+1 quindi infine µ∗ (E ∩ Acp ) ≤ 0 + µ( In ) = n=p+1 n=p+1 ∞ [ ∞ [ ∞ [ In ) = n=p+1 ∞ [ In ) ⊃ E ∩ Acp n=p+1 ∞ [ n=p+1 In ) < (G.1.30) 136 APPENDICE G. IL TEOREMA FONDAMENTALE DEL CALCOLO Supponiamo ora µ∗ (E) = +∞. Per ogni n ∈ Z sia En = E ∩ (n, n + 1) e sia Vn = {I ∈ V|I ⊂ (n, n + 1)}, allora Vn è un ricoprimento di Vitali di En . Applicando quanto dimostrato precedentemente ad ogni En si ottiene una successione numerabile di famiglie distinte Fn ⊂ Vn tali che µ∗ (En ∩ (∪Fn )c ) = 0 per ogni n ∈ Z. Sia +∞ [ F= Fn (G.1.31) n=−∞ allora F è successione numerabile di intervalli disgiunti di V e si mostra analogamente al caso precedente che " ∞ # [ c c E∩F ⊂Z∪ (En ∩ (∪Fn ) ) (G.1.32) n=−∞ quindi infine ∗ c ∞ X ∗ µ (E ∩ F ) ≤ µ (Z) + µ∗ (En ∩ (∪Fn )c ) = 0 (G.1.33) n=−∞ Teorema G.1.3 (Lebesgue). 2 Sia [a, b] un intervallo chiuso in R e sia f una funzione reale monotona su [a, b], allora f è derivabile con derivata limitata quasi ovunque su [a, b]. Dimostrazione. supponiamo che f sia non decrescente (altrimenti si considera −f ). Sia E = {x|a ≤ x < b, D+ f (x) < D+ f (x)}; si vuole mostrare che µ∗ (E) = 0: per ogni coppia di razionali u, v tali che u < v definiamo Eu,v = {x ∈ E|D+ f (x) < u < v < D+ f (x)} (G.1.34) Chiaramente si ha E = ∪{Eu,v |0 < u < v} e poichè l’unione è estesa ad una famiglia numerabile di insiemi basta quindi mostrare che per ogni u, v ∈ Q tali che 0 < u < v si ha µ∗ (Eu,v ) = 0; questa dimostrazione sarà svolta per assurdo: supponiamo esistano due razionali u, v tali che 0 < u < v e µ∗ (Eu,v ) = α > 0. Sia un numero reale tale che 0<< α(v − u) u + 2v (G.1.35) sia U un insieme aperto tale che Eu,v ⊂ U e µ∗ (U ) < α + . Dalla definizione di Eu,v segue che per ogni x ∈ Eu,v esistono numeri positivi h arbitrariamente piccoli tali che [x, x + h] ∈ U ∩ [a, b] e f (x + h) − f (x) < uh (G.1.36) La famiglia V degli intervalli chiusi [x, x + h] è quindi un ricoprimento di Vitali di Eu,v quindi, per il teorema del ricoprimento finito di Vitali, esiste una famiglia finita {[xi , xi + hi ]}m i=1 di intervalli disgiunti di V tale che m [ µ∗ (Eu,v ∩ ( [xi , xi + hi ])c ) < (G.1.37) sia ora V = Sm i=1 (xi , xi i=1 + hi ), allora si ha µ∗ (Eu,v ∩ V c ) < (G.1.38) e poichè si ha per costruzione V ⊂ U si ha m X i=1 2 Vedi anche la nota di pagina 134. hi = µ(V ) ≤ µ(U ) < α + (G.1.39) G.1. PREMESSE 137 quindi dalla disuguaglianza G.1.36 segue allora m X (f (xi + hi ) − f (xi )) < u i=1 m X hi < u(α + ) (G.1.40) i=1 Per ogni y ∈ Eu,v ∩ V esistono numeri positivi k arbitrariamente piccoli tali che [y, y + k] ⊂ V e f (y + k) − f (y) > vk (G.1.41) La famiglia degli intervalli [y, y + k] è quindi un ricoprimento di Vitali di Eu,v ∩ V quindi esiste una famiglia finita {[yj , yj + kj ]}nj=1 di intervalli disgiunti tale che µ∗ (Eu,v ∩ V ∩ ( n [ [yj , yj + kj ] )c ) < j=1 dalla disuguaglianza precedente, unita a G.1.38, si ottiene α = µ∗ (Eu,v ) ≤ µ∗ (Eu,v ∩ V c ) + µ∗ (Eu,v ∩ V ) < n n [ [ < + µ∗ (Eu,v ∩ V ∩ ( [yj , yj + kj ] )c ) + µ∗ (Eu,v ∩ V ∩ ( [yj , yj + kj ])) < j=1 j=1 <++ n X kj = 2 + j=1 n X kj j=1 quindi usando la disuguaglianza precedente e la G.1.41 si ottiene v(α − 2) < v n X kj < j=1 poichè per costruzione S j=1 [yj , yj n X + kj ] ⊂ V ⊂ n X (f (yj + kj ) − f (yj )) Sm i=1 [xi , xi + hi ] (f (yj + kj ) − f (yj )) ≤ j=1 (G.1.42) j=1 m X e poichè f è non decrescente, si ha (f (xi + hi ) − f (xi )) (G.1.43) i=1 quindi combinando questa disequazione con le G.1.42 e G.1.40 si ottiene v(α − 2) < u(α + ) ∗ (G.1.44) 0 f+ (x) che contraddice la scelta fatta per , quindi si ha µ (E) = 0 e quindi esiste q.o. in [a, b]; con 0 un ragionamento analogo si prova che f− (x) esiste q.o. su [a, b], quindi usando il primo teorema di questa sezione si ottiene che f 0 (x) esiste quasi ovunque su [a, b]. Resta da dimostrare che l’insieme F dei punti in cui f 0 (x) = +∞ è trascurabile. Sia β un numero positivo; allora per ogni x ∈ F \{a, b} esistono numeri positivi h arbitrariamente piccoli tali che [x, x + h] ⊂ (a, b) e f (x + h) − f (x) > βh (G.1.45) Per il teorema di Vitali esiste quindi una famiglia numerabile [xi , xi + hi ] di intervalli disgiunti di questo tipo tale che [ (G.1.46) µ∗ (F ∩ ( [xn , xn + hn ])c ) = 0 n da ciò e dalla relazione G.1.45 si ottiene X X (f (xn + hn ) − f (xn )) ≤ f (b) − f (a) hn < βµ∗ (F ) ⊂ β n e quindi βµ∗ (F ) < f (b) − f (a) ∗ per ogni β > 0, quindi µ (F ) = 0. (G.1.47) n (G.1.48) 138 APPENDICE G. IL TEOREMA FONDAMENTALE DEL CALCOLO Definizione G.1.8. Si dice che una funzione f : [a, b] → C è a variazione limitata su [a, b] se n X V (f, [a, b]) = sup{ |f (ti ) − f (ti−1 )|, a = t0 < t1 < . . . < tn−1 < tn = b} < +∞ (G.1.49) i=1 dove l’estremo superiore è preso su tutte le partizioni di [a, b]. È immediato verificare che una funzione complessa f è a variazione limitata se e solo se <f e =f lo sono e che per una funzione monotona si ha V (f, [a, b]) = |f (b) − f (a)|. Teorema G.1.4. Una funzione f : [a, b] → R è a variazione limitata ⇔ f può essere scritta come differenza di due funzioni monotone crescenti limitate. Dimostrazione. ⇒) definiamo H(t) = V (f, [a, t]), allora H è crescente, limitata e si ha f (x) = H(x) − [H(x) − f (x)], resta quindi da provare che H − f è una funzione crescente e limitata: se y > x si ha semplicemente che H(y) = H(x) + V (f, [x, y]) e quindi H(y)−f (y)−H(x)+f (x) = H(y)−H(x)−[f (y)−f (x)] ≥ V (f, [x, y])−|f (y)−f (x)| ≥ 0 (G.1.50) quindi è crescente, inoltre se x ∈ [a, b] si ha |f (x) − f (a)| ≤ V (f, [a, b]), quindi f è limitata, quindi anche H − f è limitata ⇐) supponiamo f = H − G, dove H, G sono funzioni crescenti limitate; è immediato verificare che si ha V (G, [a, b]) = G(b) − G(a) < +∞ e analogamente per H. Inoltre si ha |H(ti ) − G(ti ) − H(ti−1 ) + G(ti−1 )| ≤ |H(ti ) − H(ti−1 )| + |G(ti ) − G(ti−1 )| (G.1.51) quindi si ha anche V (f, [a, b]) ≤ V (G, [a, b]) + V (H, (a, b)) < +∞ Corollario G.1.1. Una funzione f : [a, b] → C a variazione limitata ha derivata finita quasi ovunque. Dimostrazione. si usa il fatto che una funzione del tipo dell’ipotesi può essere scritta nella forma f = (f1 − f2 ) + i(f3 − f4 ) (G.1.52) dove fi sono funzioni crescenti di variabile reale, per cui quindi vale il teorema di Lebesgue appena dimostrato. successione di funzioni reali non decrescenti (o non Teorema G.1.5 (Fubini). Sia {fn }∞ n=1 Puna ∞ crescenti) su un intervallo [a, b] tali che n=1 fn (x) = s(x) esiste finita su [a, b], allora si ha quasi ovunque su (a, b) ∞ X s0 (x) = fn0 (x) (G.1.53) n=1 Dimostrazione. supponiamo ad esempio che le fn siano non decrescenti; inoltre considerando P∞ fn (x) − fn (a) ci si può ridurre al caso fn (x) ≥ 0. Allora s = f è non negativa e non n n=1 decrescente; quindi per il teorema di Lebesgue s0 (x) esiste finita per quasi ogni x ∈ (a, b). Consideriamo le somme parziali sn = f1 + · · · + fn . Ogni fn ha derivata finita q.o., quindi esiste un insieme A ⊂ (a, b) tale che µ∗ ((a, b) ∩ Ac ) = 0 e s0n = f10 (x) + · · · + fn0 (x) < +∞ (G.1.54) per ogni x ∈ A e per ogni n ∈ N e s0 (x) esista finita se x ∈ A. Per ogni x ∈ (a, b) e per ogni h > 0 tale che x + h ∈ (a, b) si ha n X fk (x + h) − fk (x) k=1 h ≤ +∞ X fk (x + h) − fk (x) k=1 h = s(x + h) − s(x) h (G.1.55) G.2. IL TEOREMA FONDAMENTALE DEL CALCOLO 139 e quindi, al limite per h → 0 si ottiene s0n (x) ≤ s0 (x) < +∞ (G.1.56) per ogni x ∈ A e poichè si ha evidentemente s0n (x) ≤ s0n+1 (x) si ha s0n (x) ≤ s0n+1 (x) ≤ s0 (x) (G.1.57) per ogni x ∈ A (e quindi q.o. su (a, b)) e per ogni n ∈ N, quindi si ha che lim s0n (x) = n→∞ ∞ X fj0 (x) (G.1.58) j=1 esiste finito q.o. e quindi resta solo da mostrare che limn→∞ s0n (x) = s0 (x) quasi ovunque; inoltre 0 poichè {s0n (x)}∞ n=1 è una successione non decrescente per ogni x ∈ A, basta mostrare che {sn } 0 ammette una sottosuccessione convergente puntualmente a s quasi ovunque. Poichè si ha per ipotesi limn→∞ sn (b) = s(b), esiste una successione crescente di interi {nk }∞ k=1 tale che ∞ X [s(b) − snk (b)] < +∞ (G.1.59) k=1 Per ogni nk e per ogni x ∈ (a, b) si ha 0 ≤ s(x) − snk (x) ≤ s(b) − snk (b) (G.1.60) il secondo termine di questa disuguaglianza P∞ è quindi maggiorato dai termini di una serie convergente ad elementi positivi, quindi la serie k=1 [s(x) − snk (x)] converge; inoltre i termini di questa serie sono funzioni monotone, che quindi hannoPderivata finita quasi ovunque, quindi lo stesso argomento ∞ appena usato per dimostrare che la serie j=1 fj0 (x) converge quasi ovunque mostra in questo caso P∞ 0 che la serie k=1 [s (x) − s0nk (x)] converge quasi ovunque, ma allora si ha evidentemente per quasi ogni x ∈ (a, b) lim s0nk = s0 (x) (G.1.61) k→∞ G.2 Il teorema fondamentale del calcolo Teorema G.2.1 (Assoluta continuità dell’integrale). Sia f : Rn → C una funzione integrabile, allora per ogni > 0 esiste un δ > 0 tale che se E ⊂ Rn è un insieme misurabile e µ(E) < δ, allora si ha Z f dµ < (G.2.1) E Dimostrazione. poichè Z Z f dµ ≤ |f |dµ E (G.2.2) E è sufficiente mostrare il teorema per funzioni non negative. Sia quindi f non negativa e costruiamo la successione di funzioni fn (x) nel seguente modo: 0 se f (x) > n fn (x) = (G.2.3) f (x) se f (x) ≤ n si verifica immediatamente che fn è misurabile per ogni n ∈ N, che fn ≤ f e che fn (x) ≤ n. Inoltre se f (x) < +∞ si ha limn→∞ fn (x) = f (x) e poichè f è integrabile, f (x) < +∞ quasi ovunque, quindi limn→∞ fn (x) = f (x) quasi ovunque, quindi per il teorema di Beppo Levi si ha Z Z lim fn dµ = f dµ (G.2.4) n→∞ 140 APPENDICE G. IL TEOREMA FONDAMENTALE DEL CALCOLO quindi esiste un intero N tale che Z Z f dµ − scegliamo ora δ= fN dµ < 2 2N (G.2.5) (G.2.6) e sia E misurabile tale che µ(E) < δ, allora si ha Z Z Z fN dµ ≤ [f − fN ]dµ + f dµ = E E E Z ≤ [f − fN ]dµ + N µ(E) < + N = 2 2N Rn Definizione G.2.1. Sia f ∈ L1 ([a, b]) allora si chiama integrale indefinito di f la funzione F : [a, b] → C Z x F (x) = f dµ (G.2.7) a Teorema G.2.2. Sia f ∈ L1 (a, b), allora il suo integrale indefinito è una funzione uniformemente continua ed a variazione limitata. Dimostrazione. l’asserzione sulla uniforme continuità discende immediatamente dal teorema G.2.1. Mostriamo ora che F è a variazione limitata: sia a = x0 < · · · < xn = b una partizione di [a, b], allora si ha n n Z x k X X |F (xk ) − F (xk−1 )| = f dµ ≤ xk−1 k=1 k=1 Z Z n xk b X ≤ |f |dµ = |f |dµ < +∞ k=1 quindi si ha V (f, [a, b]) ≤ Rb mostrare che V (f, [a, b]) = a R xk−1 a |f |dµ e quindi F è a variazione limitata su [a, b] (in effetti si potrebbe b a |f |dµ ma questo nel seguito non sarà utilizzato). Teorema G.2.3. Sia A un sottoinsieme di R, allora si ha: lim+ k→0 µ∗ (A ∩ (x, x + k)) µ∗ (A ∩ (x − h, x)) = lim+ = k h h→0 µ∗ (A ∩ (x − h, x + k)) = lim =1 h+k h,k→0+ per quasi ogni x ∈ A. Se inoltre A è misurabile allora i limiti precedenti sono uguali a zero per quasi ogni x ∈ Ac . Dimostrazione. si può supporre senza perdita di generalità che A sia limitato; esiste quindi una successione di insiemi aperti {Un }∞ n=1 tali che U1 ⊃ U2 ⊃ · · · ⊃ Un ⊃ · · · ⊃ A (G.2.8) e tali che µ∗ (Un ) − 2−n < µ∗ (A); sia a = inf U1 e consideriamo le funzioni φn (x) = µ∗ (Un ∩ (a, x)) ∗ φ(x) = µ (A ∩ (a, x)) (G.2.9) (G.2.10) G.2. IL TEOREMA FONDAMENTALE DEL CALCOLO 141 Per ogni x ∈ Un e per ogni numero positivo sufficientemente piccolo h si ha φn (x + h) − φn (h) φn (x) − φn (x − h) = =1 h h (G.2.11) quindi φ0n (x) esiste per ogni x ∈ Un e si ha φ0n (x) = 1. Si vuole ora applicare il teorema di Fubini della sezione precedente alla serie ∞ X (φn − φ) (G.2.12) i=1 mostriamo quindi che ogni termine della serie è monotono: se x0 > x si ha φn (x0 ) − φ(x0 ) − (φn (x) − φ(x)) = = µ∗ (Un ∩ [x, x0 )) − µ∗ (A ∩ (a, x0 )) + µ∗ (A ∩ (a, x)) ≥ ≥ µ∗ (Un ∩ [x, x0 )) − µ∗ (A ∩ [x, x0 )) ≥ 0 dove si sono utilizzate le seguenti relazioni: µ∗ (Un ∩ (a, x0 )) = µ∗ (Un ∩ (a, x)) + µ∗ (Un ∩ [x, x0 )) µ∗ (A ∩ (a, x0 )) ≤ µ∗ (A ∩ (a, x)) + µ∗ (A ∩ [x, x0 )) A ∩ [x, x0 ) ⊂ Un ∩ [x, x0 ) (G.2.13) (G.2.14) (G.2.15) quindi φn − φ è monotona; sia ora b = sup U1 , allora si ha φn (b) − φ(b) = µ∗ (Un ) − µ∗ (A) < 2−n (G.2.16) e quindi se a ≤ x ≤ b si ha: ∞ X (φn (x) − φ(x)) ≤ n=1 ∞ X (φn (b) − φ(b)) ≤ 1 (G.2.17) n=1 sia ora s(x) = ∞ X (φn (x) − φ(x)) (G.2.18) n=1 allora per i teoremi di Fubini e di Lebesgue della sezione precedente vale la seguente relazione s0 (x) = ∞ X (φ0n (x) − φ0 (x)) < +∞ (G.2.19) n=1 per quasi ogni x ∈ (a, b) e quindi si ha lim φ0n (x) = φ0 (x) (G.2.20) n→∞ quasi ovunque in (a, b) e quindi φ0 (x) = 1 quasi ovunque su Sia ora A misurabile, allora si ha 1= T∞ n=1 Un , quindi in particolare su A. µ∗ (A ∩ (x − h, x + k)) µ∗ (Ac ∩ (x − h, x + k)) + h+k h+k (G.2.21) se x ∈ Ac , se h, k → 0, per la prima parte del teorema, il secondo addendo tende ad 1 quasi ovunque su Ac , quindi il primo addendo tende a zero quasi ovunque su Ac . Teorema G.2.4 (prima forma del TFC). Sia f ∈ L1 (a, b) e sia F il suo integrale indefinito, allora l’uguaglianza F 0 (x) = f (x) (G.2.22) vale per quasi ogni x ∈ (a, b). 142 APPENDICE G. IL TEOREMA FONDAMENTALE DEL CALCOLO Dimostrazione. se f = χA , dove A è un sottoinsieme misurabile di (a, b) allora F (x) = µ[A∩(a, x)] e per il teorema precedente si ha quindi F 0 (x) =PχA (x) per quasi ogni x ∈ (a, b). Conclusione analoga n si ottiene se f è una funzione semplice, f = i=1 αi χAi . Sia ora f una funzione positiva integrabile su [a, b] e {sn }∞ n=1 una successione crescente di funzioni semplici che converge puntualmente ad f . Sia Z x Sn (x) = sn dµ (G.2.23) a per ogni n ∈ N, allora per il teorema di Beppo Levi si ha Z x Z x F (x) = f dµ = lim sn dµ = lim Sn (x) = n→∞ a n→∞ a = S1 (x) + ∞ X [Sn+1 (x) − Sn (x)] n=1 ogni funzione Sn+1 − Sn è l’integrale della funzione positiva sn+1 − sn e quindi è non decrescente, quindi si può applicare il teorema di Fubini, ottenendo F 0 (x) = S10 (x) + ∞ X 0 (x) − Sn0 (x)] = lim Sn0 (x) [Sn+1 n→∞ n=1 (G.2.24) per quasi ogni x ∈ (a, b). Inoltre si è visto che il teorema vale per le funzioni semplici, quindi si ha Sn0 (x) = sn (x) per quasi ogni x ∈ (a, b), quindi si ottiene F 0 (x) = lim sn (x) = f (x) n→∞ (G.2.25) per quasi ogni x ∈ (a, b). Se infine f ∈ L1 (a, b) è una funzione arbitraria, si può scrivere f = (f1 − f2 ) + i(f3 − f4 ) (G.2.26) dove ogni fi è una funzione positiva ed integrabile, ed applicare quanto appena dimostrato. Il teorema precedente può essere notevolmente migliorato, come mostrano i due risultati seguenti. Lemma G.2.1 (Lebesgue). Sia f ∈ L1 (a, b), allora esiste un insieme E ⊂ (a, b) tale che µ∗ (E c ∩ [a, b]) = 0 e lim+ h→0 1 h Z x+h x |f (t) − α|dt = lim+ h→0 1 h Z x |f (t) − α|dt = |f (x) − α| (G.2.27) x−h per ogni α ∈ C e per ogni x ∈ E. Dimostrazione. sia {βn }∞ n=1 un insieme numerabile denso in C (ad esempio Q + iQ) e definiamo le funzioni gn nel seguente modo: gn (t) = |f (t) − βn | (G.2.28) si ha evidentemente gn ∈ L1 (a, b). Per il teorema precedente, esistono insiemi En ⊂ (a, b) tali che µ∗ ([a, b] ∩ Enc ) = 0 e lim+ h→0 1 h Z x+h x gn (t)dt = lim+ h→0 1 h Z x gn (t)dt = gn (x) x−h (G.2.29) G.2. IL TEOREMA FONDAMENTALE DEL CALCOLO 143 T∞ per ogni x ∈ En . Sia E = n=1 En , allora si ha µ∗ ([a, b] ∩ E c ) = 0. Per ogni > 0 e α ∈ C sia n tale che |βn − α| < 3 , allora si ha | |f (t) − α| − |f (t) − βn | | ≤ |βn − α| < ∀t ∈ [a, b] 3 quindi per ogni x ∈ [a, b] e per ogni numero positivo h abbastanza piccolo si ha Z Z 1 x+h 1 Z x+h 1 x+h dt = |f (t) − α|dt − |f (t) − βn |dt ≤ h x h x h x 3 3 (G.2.30) (G.2.31) quindi se x ∈ E e 0 < h < h0 , dove h0 dipende da n e si ha Z 1 x+h |f (t) − α|dt − |f (x) − α| ≤ h x Z Z 1 x+h 1 x+h ≤ |f (t) − α|dt − |f (t) − βn |dt + h x h x Z 1 x+h + gn (t)dt − gn (x) + |βn − α| < 3 h x 3 inoltre n dipende solo da e α, quindi 1 lim h→0+ h Z x+h |f (t) − α|dt = |f (x) − α| (G.2.32) x per ogni x ∈ E, α ∈ C. Con un argomento simile si mostra la seconda uguaglianza. Teorema G.2.5 (Lebesgue). Sia f ∈ L1 (a, b), allora si ha 1 lim h→0+ h Z h |f (x + t) + f (x − t) − 2f (x)|dt = 0 (G.2.33) 0 per quasi ogni x ∈ (a, b). Dimostrazione. per un x ∈ (a, b) fissato si ha ≤ 1 h Z 1 h Z h |f (x + t) + f (x − t) − 2f (x)|dt ≤ 0 x+h |f (t) − f (x)|dt + x 1 h Z x |f (t) − f (x)|dt x−h Applicando il lemma precedente con α = f (x) si ottiene l’enunciato. Definizione G.2.2 (Vitali). Sia f una funzione f : J → C, dove J è un intervallo contenuto in R; f è detta assolutamente continua su J se per ogni > 0 esiste un δ > 0 tale che per ogni famiglia finita {(ck , dk )}nk=1 di intervalli disgiunti di J tali che n X (dk − ck ) < δ (G.2.34) k=1 si abbia n X k=1 |f (dk ) − f (ck )| < (G.2.35) 144 APPENDICE G. IL TEOREMA FONDAMENTALE DEL CALCOLO Teorema G.2.6. Sia f ∈ L1 (a, b) e sia F il suo integrale indefinito, allora F è assolutamente continua su [a, b]. Dimostrazione. discende immediatamente dal teorema che già in precedenza era stato contrassegnato con il nome assoluta continuità dell’integrale G.2.1 È evidente che ogni funzione assolutamente continua su un intervallo è anche uniformemente continua; è inoltre semplice notare come la definizione di assoluta continuità richiami alla mente le funzioni a variazione limitata, sussiste infatti il seguente: Teorema G.2.7. Sia f : [a, b] → C una funzione assolutamente continua, allora essa ha variazione limitata su [a, b]. Dimostrazione. poniamo = 1 e sia δ > 0 come nella definizione di assoluta continuità. Sia n un intero tale che n > b−a e consideriamo una partizione di [a, b] a = x0 < · · · < xn = b tale che δ < δ per ogni 1 < k < n. Dalla scelta di δ segue che V (f, [xk , xk−1 ]) ≤ = 1 per xk − xk−1 = b−a n ogni k, quindi si ha n X V (f, [a, b]) = V (f, [xk , xk−1 ]) ≤ n (G.2.36) k=1 Teorema G.2.8. Ogni funzione f : [a, b] → C assolutamente continua può essere scritta come f = (f1 − f2 ) + i(f3 − f4 ) (G.2.37) dove le fi sono reali, non decrescenti e assolutamente continue su [a, b]. Dimostrazione. poichè è evidente che se f è assolutamente continua anche <f e =f sono assolutamente continue, basta dimostrare il teorema nel caso reale; poichè si è inoltre visto che f è a variazione limitata, rileggendo la dimostrazione del teorema sulla scomposizione delle funzioni a variazione limitata come differenza di funzioni non decrescenti teorema G.1.4, si vede che per concludere basta mostrare che g1 (x) = V (f, [a, x]) è assolutamente continua e usare il fatto che la somma di funzioni assolutamente continue è assolutamente continua. Fissiamo > 0 e sia δ > 0 tale che se {(ck , dk )}nk=1 sono intervalli disgiunti di [a, b] tali che n X (dk − ck ) < δ (G.2.38) k=1 allora si abbia n X |f (dk ) − f (ck )| < k=1 2 (G.2.39) Sia {(ck , dk )}nk=1 un sistema di intervalli disgiunti soddisfacente alla condizione precedente; poichè (k) (k) (k) f ha variazione limitata, per ogni 1 ≤ k ≤ n esiste una partizione ck = a0 < a1 < · · · < alk = dk tale che lX k −1 (k) (k) (G.2.40) V (f, [ck , dk ]) < |f (aj+1 ) − f (aj )| + 2n j=0 allora si ha n X |g1 (dk ) − g1 (ck )| = k=1 < n lX k −1 X k=1 j=0 n X V (f, [ck , dk ]) < k=1 (k) (k) |f (aj+1 ) − f (aj )| + < + = 2 2 2 G.2. IL TEOREMA FONDAMENTALE DEL CALCOLO 145 dove l’ultima disuguaglianza dipende dal fatto che n lX k −1 X (k) (k) (aj+1 − aj ) = k=1 j=0 n X (dk − ck ) < δ (G.2.41) k=1 Teorema G.2.9. Se f : [a, b] → R è una funzione non decrescente, allora f 0 è misurabile e Z b f 0 (x)dx ≤ f (b) − f (a) (G.2.42) a Dimostrazione. definiamo se x > b, f (x) = f (b). Sia fn (x) = f (x + 1/n) − f (x) 1/n (G.2.43) per n naturale positivo e a ≤ x ≤ b. Allora fn è una successione di funzioni positive e misurabili e lim fn (x) = f 0 (x) (G.2.44) n→∞ per quasi ogni x ∈ (a, b), quindi f 0 è misurabile. Usando il lemma di Fatou si ha: Z b Z b Z b f 0 (x)dx = lim fn (x)dx ≤ lim inf fn (x)dx = a n→∞ a Z = lim inf n n→∞ " Z = lim inf n n→∞ " Z ≤ lim inf n n→∞ a b+1/n a [f (x + 1/n) − f (x)] dx = # Z a+1/n f (x)dx − n b f (x)dx ≤ a Z b+1/n b n→∞ b f (b)dx − n a+1/n # f (a)dx = f (b) − f (a) a Corollario G.2.1. Se g : [a, b] → C è una funzione a variazione limitata su [a, b] allora g 0 è integrabile su [a, b]. Dimostrazione. si usa il fatto che si può scrivere g = f1 − f2 + i(f3 − f4 ) (G.2.45) dove le fi sono reali e non decrescenti, quindi soddisfano il teorema precedente. Teorema G.2.10. 3 Sia f : [a, b] → C una funzione assolutamente continua e supponiamo che f 0 (x) = 0 per quasi ogni x ∈ (a, b) allora f è costante. Dimostrazione. si può supporre senza perdita di generalità che f sia reale, in quanto lo stesso argomento si può applicare a =f ed a <f . Sia c ∈ (a, b] e > 0 arbitrario; si vuole mostrare che f (a) = f (c). Sia δ > 0 come nella definizione di assoluta continuità corrispondente a e sia E = {x ∈ (a, c)|f 0 (x) = 0}; per ipotesi si ha µ∗ (E) = c − a. Per ogni x ∈ E esistono numeri positivi arbitrariamente piccoli h tali che x, x + h ∈ (a, c) e |f (x + h) − f (x)| < 3 Vedi anche la nota di pagina 134. h c−a (G.2.46) 146 APPENDICE G. IL TEOREMA FONDAMENTALE DEL CALCOLO La famiglia di questi intervalli [x, x + h] è un ricoprimento di Vitali di E e quindi esiste una sottofamiglia finita {[xk , xk + hk ]}nk=1 di intervalli disgiunti tale che µ∗ (E ∩ ( n [ [xk , xk + hk ])c ) < δ (G.2.47) k=1 quindi µ∗ ((a, c)) = µ∗ (E) < δ + n X hk (G.2.48) k=1 si può inoltre supporre che x1 < x1 < · · · < xn , quindi dalla disuguaglianza precedente segue che la somma delle lunghezze degli intervalli aperti (a, x1 ); (x1 + h, x2 ); . . . ; (xn + hn , c) complementari dell’insieme di δ si ha: |f (a) − f (x1 )| + Sn k=1 [xk , xk n−1 X (G.2.49) + hk ] rispetto ad (a, c) è minore di δ, quindi, per la scelta |f (xk + hk ) − f (xk+1 )| + |f (xn + hn ) − f (c)| < (G.2.50) k=1 Le disuguaglianze G.2.46 e G.2.50 implicano quindi |f (a) − f (c)| ≤ |f (a) − f (x1 )| + n−1 X |f (xk + hk ) − f (xk+1 )| + k=1 n X +|f (xn + hn ) − f (c)| + |f (xk + hk ) − f (xk )| < k=1 <+ n X hn ≤ 2 c−a k=1 e poichè > 0 è arbitrario si conclude che f (a) = f (c) Teorema G.2.11 (TFC seconda forma). continua, allora f 0 ∈ L1 (a, b) e 4 Sia f : [a, b] → C una funzione assolutamente Z x f (x) = f (a) + f 0 (t)dt (G.2.51) a Dimostrazione. poichè si è visto che se f è assolutamente continua allora ha variazione limitata e che una funzione a variazione limitata ha la derivata integrabile, la prima asserzione è dimostrata; Rx sia quindi g(x) = a f 0 (t)dt, allora g è assolutamente continua e sia h = f − g. h è allora assolutamente continua e usando la prima forma del teorema fondamentale del calcolo si ha h0 = 0 quasi ovunque, quindi per il teorema precedente h è una costante, quindi Z x Z a 0 f (x) = h(x) + g(x) = h(a) + f (t)dt = f (a) − f 0 (t)dt + a a Z x Z x + f 0 (t)dt = f (a) + f 0 (t)dt a Riassumendo quanto fin qui dimostrato si ottiene 4 Vedi anche la nota di pagina 134. a G.3. ALTRA DIMOSTRAZIONE 147 Teorema G.2.12. Una funzione f : [a, b] → C ha la forma Z x f (x) = f (a) + φ(t)t (G.2.52) a per qualche φ ∈ L1 (a, b) se e solo se f è assolutamente continua su [a, b]; in questo caso si ha anche φ = f 0 quasi ovunque su (a, b) Corollario G.2.2 (Integrazione per parti 1). Siano f, g funzioni integrabili e definiamo Z x Z x F (x) = α + f (t)dt; G(x) = β + g(t)dt (G.2.53) a Allora si ha Z a Z b b G(t)f (t)dt + a a g(t)F (t)dt = F (x)G(x)|ba (G.2.54) Dimostrazione. poichè G, F sono assolutamente continue su [a, b], in particolare sono limitate, quindi si ha |F (v)G(v) − F (u)G(u)| ≤ [ sup |F (t)| ]|G(v) − G(u)| + [ sup |G(t)| ]|F (v) − F (u)| t∈[a,b] (G.2.55) t∈[a,b] da cui si vede subito che F G è assolutamente continua, quindi è differenziabile quasi ovunque (come G e F ), quindi si ha quasi ovunque (F G)0 = F G0 + F 0 G = F g + f G (G.2.56) e l’enunciato segue dalla seconda forma del teorema fondamentale del calcolo. Corollario G.2.3 (Integrazione per parti 2). Siano f, g funzioni assolutamente continue su [a, b] allora si ha Z b Z b 0 (G.2.57) f (t)g (t)dt + f 0 (t)g(t)dt = f (x)g(x)|ba a a Dimostrazione. identica alla precedente. G.3 Altra dimostrazione Lemma G.3.1 (Riesz). Sia g : [a, b] → R una funzione per cui esistono finiti g(x ± 0) = limh→0± g(x + h) e definiamo la funzione G(x) come G(x) = max{g(x − 0), g(x), g(x + 0)}. I punti x ∈ (a, b) per cui esiste ξ ∈ (x, b], tale che g(ξ) > G(x) formano un insieme aperto Eg ; come ogni insieme aperto di R, l’insieme Eg può essere scritto come unione finita o numerabile di intervalli aperti disgiunti (ak , bk ); per ognuno di questi intervalli si ha g(ak + 0) ≤ G(bk ). Dimostrazione. sia x ∈ Eg , allora esiste ξ > x tale che G(x) < g(ξ), ma per come è definita G è immediato vedere che se y è abbastanza vicino a x si ha anche G(y) < g(ξ) e quindi y ∈ Eg e quindi Eg è un insieme aperto. Sia (ak , bk ) uno degli intervalli disgiunti che compongono Eg e sia x ∈ (ak , bk ); mostriamo che g(x) ≤ G(bk ), da cui al limite per x → a+ k seguirà g(ak + 0) ≤ G(bk ). Sia x1 il più grande numero di [x, bk ] tale che g(x) ≤ G(x1 ) (si vede semplicemente che l’estremo superiore dei punti che hanno questa proprietà è effettivamente un massimo) e mostriamo che x1 = bk . Supponiamo per assurdo che sia x1 < bk (e quindi x1 ∈ Eg ), quindi esiste un ξ1 ∈ [x1 , b] tale che G(x1 ) < g(ξ1 ); se fosse ξ1 ≤ bk si avrebbe g(x) ≤ G(x1 ) < g(ξ1 ) ≤ G(ξ1 ) e x1 < ξ1 ≤ bk contraddicendo la definizione di x1 , quindi si deve avere ξ1 > bk ma allora si avrebbe (poichè bk ∈ / Eg non si può avere G(bk ) < g(ξ1 ), poichè si è supposto x1 < bk non si può avere g(x) ≤ G(bk )) G(x1 ) < g(ξ1 ) ≤ G(bk ) < g(x) ≤ G(x1 ) assurdo. (G.3.1) 148 APPENDICE G. IL TEOREMA FONDAMENTALE DEL CALCOLO Teorema G.3.1 (Lebesgue). Sia f : [a, b] → R una funzione monotona, allora f è derivabile con derivata finita q.o. in [a, b]. Dimostrazione. per dimostrare il teorema si deve dimostrare che si hanno per q.o. x ∈ (a, b) le relazioni D+ f (x) < +∞; D+ f (x) ≤ D− f (x) (G.3.2) infatti applicando la seconda disequazione alla funzione −f (−x) si ottiene che si ha q.o. la relazione D− f (x) ≤ D+ f (x) e quindi D+ f (x) ≤ D− f (x) ≤ D− f (x) ≤ D+ f (x) ≤ D+ f (x) < +∞ (G.3.3) Si può supporre che f sia non decrescente. Verifichiamo la prima disuguaglianza di G.3.2, cioè vediamo che l’insieme E∞ dei punti in cui D+ f (x) = +∞ è trascurabile; sia EC l’insieme dei punti x ∈ (a, b) in cui D+ f (x) > C; dalla relazione D+ f (x) > C segue l’esistenza di un ξ > x tale che f (ξ) − f (x) > C(ξ − x) cioè, definendo g(x) = f (x) − Cx, si ha g(ξ) > g(x), quindi l’insieme EC è contenuto nell’insieme Eg del precedente lemma e si ha g(ak + 0) ≤ G(bk ), da cui (per la continuità di f ) f (ak ) − Cak ≤ f (ak + 0) − Cak ≤ max{f (bk + 0), f (bk ), f (bk − 0)} − Cbk = f (bk ) − Cbk (G.3.4) cioè C(bk − ak ) ≤ f (bk + 0) − f (ak ), quindi si ha X X Cµ(EC ) = C (bk − ak ) ≤ [f (bk + 0) − f (ak )] ≤ f (b) − f (a) = K < +∞ (G.3.5) da cui si ottiene µ(E∞ ) = limn→∞ µ(En ) ≤ limn→∞ K/n = 0. Dimostriamo ora la seconda delle disuguaglianza G.3.2: siano c, C due numeri tali che c < C. Indichiamo con Σ1 l’insieme dei valori x ∈ (a, b) tali che D− f (x) < c, allora, ragionando come fatto prima, si vede che x ∈ Σ1 implica che −x è nell’insieme Eg1 del lemma precedente, considerando g1 (x) = f (−x) + cx; siano (−bk , −ak ) gli intervalli disgiunti di cui è composto l’insieme aperto Eg1 . Analogamente si vede che per x ∈ (ak , bk ) la condizione D+ f (x) > C implica x ∈ Eg2 con g2 (x) = f (x) − Cx; consideriamo g2 ristretta a [ak + 2−|k| , bk − 2−|k| ], dove > 0, e siano (akj , bkj ) gli intervalli disgiunti che compongono l’insieme Egk2 (l’indice k all’esponente ricorda che si sta considerando la restrizione) e chiamiamo Σ2 = Eg2 ∩ Eg1 . Per il lemma precedente si ha allora g1 (−bk + 0) ≤ G1 (−ak ) ⇒ f (bk − 0) − f (ak + 0) ≤ c(bk − ak ) g2 (akj + 0) ≤ G2 (bkj ) ⇒ C(bkj − akj ) ≤ f (bkj + 0) − f (akj + 0) (G.3.6) (G.3.7) da cui si decuce Cµ(Σ2 ) = Cµ(Eg2 ∩ Eg1 ) = C ≤ 8C + C ≤ 8C + X k X kj X µ(Eg2 ∩ (ak , bk )) ≤ C k (akj − bkj ) ≤ 8C + X X {µ(Egk2 ) + 22−|k| } ≤ (G.3.8) k [f (bkj + 0) − f (akj + 0)] ≤ kj [f (bk − 0) − f (ak + 0)] ≤ 8C + c X (bk − ak ) = 8C + cµ(Σ1 ) k e quindi, per l’arbitrarietà di , µ(Σ2 ) ≤ (c/C)µ(Σ1 ). Iterando il procedimento e chiamando Σn l’insieme ottenuto dopo n iterazioni si ottiene analogamente µ(Σk ) ≤ (c/C)µ(Σk−1 ) e quindi per induzione si ha: c n µ(Σ2n ) ≤ µ(Σ1 ) → 0 (G.3.9) C da cui si deduce che l’insieme Ec,C degli x ∈ (a, b) per cui si ha contemporaneamente D+ f (x) > C e D− f (x) < c ha misura nulla. Sia ora {qn } una numerazione dei numeri razionali; poichè il G.3. ALTRA DIMOSTRAZIONE 149 prodotto di due insiemi numerabili è numerabile si ha allora che gli insiemi Eqn ,qm (n, m ∈ N) sono una infinità numerabile e quindi E = ∪n,m∈N Eqn ,qm è un insieme trascurabile. Sia ora x ∈ (a, b) tale che D− (f (x)) < D+ f (x), allora esistono qn e qm tali che D− f (x) ≤ qn < qm ≤ D+ f (x), quindi x ∈ Eqn ,qm ⊂ E, quindi l’insieme degli x tali che D− f (x) < D+ f (x) è un sottoinsieme di E e quindi ha misura nulla. Nella seguente parte di questa appendice si dimostreranno i teoremi G.2.10 e G.2.11 senza usare il teorema del ricoprimento finito. Lemma G.3.2. Sia f : [a, b] → R una funzione assolutamente continua e sia T ⊂ [a, b] un insieme trascurabile, allora f (T ) è un insieme trascurabile. Dimostrazione. siano , δ come nella definizione di assoluta continuità; poichè T è trascurabile esiste un ricoprimento R di T tramite intervalli tale che µ(R) < δ, ma allora µ(f (R)) < e, poichè f (T ) ⊂ f (R), si ottiene µ∗ (f (T )) < e per l’arbitrarietà di > 0 si conclude. Teorema G.3.2. Sia f : [a, b] → R una funzione assolutamente continua e non decrescente tale che f 0 (x) = 0 per q.o x ∈ (a, b), allora f è costante su [a, b]. Dimostrazione. indichiamo con T l’insieme su cui f 0 (x) 6= 0; per il lemma precedente si ha µ(f (T )) = 0. Sia R = [a, b]\T ; poichè f 0 (x) = 0 su R, per ogni x ∈ R esiste ξ ∈ (x, b] tale che f (ξ) − f (x) < (ξ − x), dove > 0, quindi R ⊂ Eg (vedi lemma G.3.1) dove g(x) = x − f (x). Siano (ak , bk ) gli intervalli disgiunti che compongono l’insieme aperto Eg , allora per il lemma G.3.1 si ha g(ak + 0) ≤ G(bk ) e quindi ak − f (ak + 0) ≤ bk − f (bk − 0) da cui si ottiene f (bk − 0) − f (ak + 0) ≤ (bk − ak ) da cui si ottiene µ(f (Eg )) ≤ (b − a) e, per l’arbitrarietà di , µ(f (Eg )) = 0 e quindi µ(f (R)) = 0. Si è cosı̀ giunti alla conclusione che [f (b), f (a)] = f (R) ∪ f (T ) dove µ(f (R)) = µ(f (T )) = 0, quindi µ( [f (b), f (a)] ) = 0, cioè f (a) = f (b) e quindi f è costante. Teorema G.3.3 (TFC seconda forma). Sia f : [a, b] → C una funzione assolutamente continua, allora f 0 ∈ L1 (a, b) e Z x f (x) = f (a) + f 0 (t)dt (G.3.10) a Dimostrazione. dai teoremi G.2.8 e G.2.7 segue che f è una funzione a variazione limitata e quindi è derivabile q.o. con derivata integrabile. Per le proprietà dell’integrale e per il teorema G.2.8 basta mostrare l’equazione G.3.10 nel caso in cui f sia reale e non decrescente. In questo caso definiamo le funzioni F1 e F2 come Z x f 0 (t)dt (G.3.11) F1 (x) = f (x) − f (a); F2 (x) = a allora consideriamo g(x) = F1 (x) − F2 (x); g è assolutamente continua, per la prima formulazione del teorema fondamentale del calcolo si ha g 0 (x) = 0 quasi ovunque, g(a) = 0 e se y > x si ha (vedi equazione G.2.42) Z y Z x 0 g(y) − g(x) = f (y) − f (a) − f (t)dt − f (x) + f (a) + f 0 (t)dt = (G.3.12) a a Z y = f (y) − f (x) − f 0 (t)dt ≥ 0 x quindi g è crescente, quindi per il teorema precedente g(x) = 0 su [a, b] e quindi si ottiene G.3.10. Si ottiene quindi il teorema G.2.12: 150 APPENDICE G. IL TEOREMA FONDAMENTALE DEL CALCOLO Teorema G.3.4. Una funzione f : [a, b] → C ha la forma Z x φ(t)t f (x) = f (a) + (G.3.13) a per qualche φ ∈ L1 (a, b) se e solo se f è assolutamente continua su [a, b]; in questo caso si ha anche φ = f 0 quasi ovunque su (a, b). Corollario G.3.1. Una funzione f : [a, b] → C assolutamente continua è costante se e solo se ha derivata nulla q.o. in [a, b]. Bibliografia: in questa appendice si sono viste due diverse strade per dimostrare i teoremi principali: quella che usa il teorema del ricoprimento finito di Vitali è esposta nel capitolo V di [5], quella che non lo usa è tratta dalle sezioni I,3, I,13 e I,25 del testo [7] o dall’edizione francese del testo [6] edita da MIR (in questo testo e nella corrispondente edizione italiana vi è però un errore nell’enunciato del lemma G.3.1 nel caso di funzioni discontinue: vi si trova infatti erroneamente affermato che vale la disuguaglianza g(ak ) ≤ G(bk ) invece di g(ak + 0) ≤ G(bk )). Per una trattazione più moderna, che però richiede alcune conoscenze di teoria della misura (reperibili nei capitoli precedenti dello stesso testo), si rimanda al capitolo VIII di [8]. Bibliografia [1] H. Brezis. Analisi Funzionale. Liguori Editore. [2] R. Courant, D. Hilbert. Methods of mathematical physics vol. 1. Interscience. [3] J. Dieudonnè. Foundations of Modern Analysis. Accademic Press. [4] M. Giaquinta, G. Modica. ANALISI MATEMATICA 3.Strutture lineari e metriche, continuità. Pitagora Editrice. [5] E. Hewitt, K. Stromberg. Real and abstract analysis. Springer. [6] A. N. Kolmogorov, S. V. Fomin. Elements of the Theory of Functions and Functional Analysis. Dover Publications. [7] F. Riesz, B. von Sz. Nagy. Leçon d’Analyse Fonctionelle. Akad. Kiado. [8] W. Rudin. Analisi reale e complessa. Bollati Boringhieri. [9] K. Yosida. Functional Analysis. Springer. I libri [1], [2], [3], [5], [7], [8], [9] sono reperibili nella biblioteca di Matematica Fisica Informatica, il testo [6] è disponibile edito da una diversa casa editrice; il testo [4] non era reperibile in biblioteca qundo queste note sono state scritte. 151 Indice analitico autospazio, 64, 114 autovalore, 64, 114 autovettori, 114 insieme compatto, 6 insieme completo, 20 insieme convesso, 54 insieme denso, 8 insieme ortonormale, 20 insieme relativamente compatto, 6 insieme risolvente, 115 integrale indefinito di una funzione, 140 integrazione per parti, 91, 147 base, 20 chiusura di un insieme, 6 classe di Schwartz, 74 completamento, 11 contrazione, 15 criterio di Dini, 28 criterio di Dirichlet-Jordan, 104 lemma di Baire, 128 lemma di Green, 41 lemma di Riemann-Lebesgue, 24 limite di una funzione, 1 limite di una successione, 2 derivate di Dini, 133 disuguaglianza di Bessel, 21 disuguaglianza di Cauchy-Schwartz, 16 disuguaglianza di Hölder, 95 disuguaglianza di Minkowski, 95 disuguaglianza di Young, 95 disuguaglianza triangolare, 1 metodo di Gram-Schmidt, 51 norma, 1 norma di un op. lineare, 56 norme equivalenti, 4 nucleo di Dirichlet, 27 nucleo di Fejer, 107 nucleo di Poisson, 34 esponente coniugato, 95 estensione minimale, 88 formula di inversione per T.F., 77, 84 formula di Poisson, 34 formula di polarizzazione, 18 formule di de Morgan, 5 funzionale lineare, 57 funzione a variazione limitata, 138 funzione armonica, 38 funzione assolutamente continua, 91, 143 funzione caratteristica, 13 funzione continua, 2, 3 funzione di Cantor-Vitali, 91 funzione di Green, 32, 37, 42, 119, 122 funzione lipschitziana, 3 funzione semplice, 97 funzione uniformemente continua, 7 operatore operatore operatore operatore operatore operatore operatore operatore operatore operatore aggiunto, 58, 86, 119 autoaggiunto, 64 chiudibile, 88 chiuso, 85 compatto, 66 di Hilbert-Schmidt, 68 isometrico, 64 limitato, 56 normale, 64 unitario, 63 palla aperta, 4 palla chiusa, 4 parte interna, 9 polinomio minimo, 66 polinomio trigonometrico, 25 principio del massimo, 39 problema aggiunto, 120 problema ai limiti, 117 problema ai limiti omogeneo, 117 grafico, 85 identità del parallelogramma, 18 identità di Parsefall, 22, 77 insieme aperto, 4 insieme chiuso, 4 152 INDICE ANALITICO problema autoaggiunto, 120 problema di Dirichlet, 39 problema di Sturm-Liouville, 121, 122 prodotto di convoluzione, 82, 99 prodotto scalare, 16 proiettore, 59 proiezione, 54 ricoprimento di Vitali, 134 serie di Fourier, 22 somma deiretta, 55 sottospazio di Hilbert, 53 sottospazio invariante, 65 spazio `2 , 50 spazio Lp , 14, 94 spazio Lploc , 99 spazio B, 8 spazio C, 11 spazio C ∞ , 13 spazio Cc , 11, 97 spazio Cc∞ , 13, 97 spazio biduale, 110 spazio di Banach, 9 spazio di Hilbert, 20 spazio duale, 57 spazio normato, 1 spazio normato completo, 9 spazio riflessivo, 111 spazio separabile, 51 spettro, 114 spettro puntuale, 64, 114 successione di Cauchy, 9 successione di mollificatori, 100 supporto di una funzione, 97 teorema teorema teorema teorema teorema teorema teorema teorema teorema teorema teorema teorema teorema teorema teorema teorema teorema teorema del grafico chiuso, 86, 131 dell’alternativa, 112, 117 della applicazione aperta, 128 della divergenza, 41 della media, 40, 41 della proiezione, 55 delle contrazioni, 15 di Bolzano-Weierstrass, 8 di Fejer, 108 di Fischer-Riesz, 22, 96 di Fubini, 138 di Heine-Cantor-Borel, 7 di Lebesgue, 90, 136, 142, 143 di Plancherel, 78 di rappresentazione di Riesz, 57 di Vitali del ricoprimento finito, 134 di von Neumann, 18 di Weierstrass, 6, 12 153 teorema fondamentale del calcolo, 91, 141, 146, 149 teorema secondo della media, 103 teorema spettrale, 65, 70, 73 trasformata di Fourier, 74, 77, 79