1. SPAZI LINEARI 1. SPAZI LINEARI, BASI, SOTTOSPAZI Definizione 1. Sia dato un corpo numerico K. Un insieme I di elementi x, y, z, ... di natura arbitraria, costituisce uno spazio lineare R se: 1) Ad ogni coppia di elementi x, y ∈ I è associato un terzo elemento z ∈ I detto somma di x e y che viene indicato da z = x + y. 2) Ad ogni x ∈ I e a ogni numero α ∈ K è associato un elemento z ∈ I detto prodotto di α per x che viene indicato da z = αx. 3) La operazione somma soddisfa le seguenti proprietà: 3i) x + y = y + x (commutatività) 3ii) x + (y + z) = (x + y) + z (associatività) 3iii) l’insieme I contiene l’elemento neutro della somma, indicato con 0 (zero), tale che ∀x ∈ I vale x + 0 = x. Tale elemento è unico. Infatti, se anche x + 00 = x, allora 00 = 00 + 0 = 0 + 00 = 0. 3iv) per ogni x ∈ I esiste l’elemento inverso della somma, tale che x + x0 = 0. Esso è unico. Infatti, se esistesse un altro elemento x00 con x + x00 = 0, allora x00 = x00 + 0 = x00 + x + x0 = 0 + x0 = x0 . 4) L’operazione prodotto soddisfa le seguenti proprietà: 4i) 1 · x = x 4ii) α · (βx) = (αβ) · x 4iii) (α + β) · x = αx + βx 4iv) α · (x + y) = αx + αy . Segue che αx = 0 ⇔ α = 0 o x = 0. Infatti, 0x + x = (0 + 1)x = x e quindi 0x = 0; inoltre α0 + αx = α(0 + x) = αx e quindi α0 = 0. Viceversa, se αx = 0 e α 6= 0, moltiplicando per α−1 si ottiene x = 0. Da 0x = 0 e dalla 4i) segue anche che l’inverso può essere espresso da x0 = −1 · x. Lo indicheremo pertanto con −x e scriveremo x − x = 0. Uno spazio lineare è anche detto spazio vettoriale e i suoi elementi sono anche detti vettori. 1 Osservazione 1. Salvo esplicita indicazione, come corpo numerico K assumeremo sempre quello (commutativo) dei reali o dei complessi. Osservazione 2. L’elemento neutro della somma viene usualmente indicato con il simbolo 0 (zero) in tutti gli spazi lineari. Attenzione perciò a quale zero di volta in volta ci si riferisce. Esempio 1. Lo spazio dei vettori ordinari in tre dimensioni con l’usuale somma del parallelogramma e la moltiplicazione per numeri reali è uno spazio lineare. Viene indicato simbolicamente con R3 . Esempio 2. Siano x e y due N-ple ordinate di numeri reali o complessi: x ≡ (ξ1 , ξ2 , ..., ξN ) e y ≡ (η1 , η2 , ..., ηN ). Definiamo la somma: z ≡ x + y ≡ (ξ1 + η1 , ξ2 + η2 , ..., ξN + ηN ) e il prodotto αx ≡ (αξ1 , αξ2 , ..., αξN ), con α reale se le N-ple sono reali e α reale o complesso se le N-ple sono complesse. L’insieme di tali N-ple costituisce uno spazio lineare, come è facile verificare. Tali spazi si denotano con RN o C N . Esempio 3. Sia x ≡ (ξi ) = (ξ1 , ξ2 , ..., ξn , ...) una successione ordinata di (infiniti) numeri reali o complessi. Con le stesse definizioni dell’esempio precedente per la somma e prodotto, si ottiene lo spazio lineare R∞ o C ∞ . Esempio 4. Sia dato l’insieme delle funzioni reali continue x(t) della variabile reale t nell’intervallo chiuso e limitato [a, b]. Con le usuali definizioni di somma e prodotto per numeri reali, tale insieme costituisce lo spazio lineare C[a,b] . Esempio 5. Le N-ple (r1 , r2 , ..., rN ) di numeri razionali ri costituiscono uno spazio lineare solo sul corpo dei razionali. Invece le N-ple (p1 , p2 , ..., pN ) di numeri reali positivi non costituiscono uno spazio lineare. Esempio 6. L’insieme delle funzioni continue in [0, 1] con x(0) = 0, strutturato nel solito modo, definisce uno spazio lineare. Invece, l’insieme delle funzioni continue nello stesso intervallo con x(0) = 1 non definisce uno spazio lineare. Definizione 2. Dati n vettori (x1 , x2 , ..., xn ) di uno spazio lineare R , questi si dicono linearmente indipendenti se la relazione α1 x1 + α2 x2 + ... + αn xn = 0 è verificata solo per tutti gli αi ≡ 0. Uno spazio lineare si dice a dimensione finita N se esistono N e non più di N vettori linearmente indipendenti. Uno spazio lineare si 2 dice infinito-dimensionale se, comunque preso N, esistono sempre N +1 vettori linearmente indipendenti. Dati n vettori (x1 , x2 , ..., xn ), questi si dicono linearmente Pn dipendenti se esistono n numeri (αi ) non tutti nulli, tali che i=1 αi xi = 0. Definizione 3. Dato uno spazio lineare N-dimensionale RN , ogni N-pla di vettori (x1 , x2 , ..., xN ) linearmente indipendenti, definisce una base in RN . Osservazione 3. Assegnata una base (x1 , x2 , ..., xN ) in uno spazio finito dimensionale RN , ogni vettore x ∈ RN è in corrispondenza biunivoca con N numeri del corpo K. Infatti, essendo lo spazio N-dimensionale, dato α 6= 0, l’equazione −αx+α1 x1 +α2 x2 +...+αN xN = 0 ammette soluzioni αi 6= 0 almeno per qualche i. PN (Notare che per α = 0 si ha la sola soluzione αi = 0, ∀i.) Allora x = i=1 (αi /α)xi e quindi al vettore x corrisponde la N-pla (αi /α). Tale corrispondenza è univoca; PN infatti, se fosse anche x = i=1 βi xi con qualche βi 6= αi /α, sottraendo i due PN sviluppi di x si otterrebbe 0 = i=1 γi xi con qualche γi ≡ βi − αi /α 6= 0 . Ma questo implicherebbe che gli N xi non sono linearmente indipendenti, contrariamente alle ipotesi di costituire una base in RN . Viceversa, a ogni N-pla di numeri (αi ) , i = 1, 2, ..., N , corrisponde univocamente PN il vettore x ≡ i=1 αi xi . Esempio 7. Lo spazio C N dell’esempio 2 è N-dimensionale. Infatti, dopo avere osservato che l’elemento nullo di questo spazio è costituito dalla N-pla di zeri (0, 0, ..., 0), è immediato verificare che gli N vettori e1 ≡ (1, 0, ..., 0) , e2 ≡ (0, 1, ..., 0) , . . . , eN ≡ (0, 0, ..., 1) sono linearmente indipendenti. Ogni altro vettore x ≡ (ξ1 , ξ2 , ..., ξN ) è esprimibile PN in funzione dei versori come x = i=1 ξi ei , come è immediato verificare. Esempio 8. Lo spazio C[a,b] dell’esempio 4 è infinito dimensionale. Infatti, appartengono ad esso tutti i monomi 1, t, t2 , ..., tn , ... e questi sono tra di loro linearmente indipendenti poichè l’equazione α0 + α1 t + α2 t2 + ... + αn tn = 0 ammette come soluzioni n numeri αi non tutti nulli solo per al più n valori di t , e non identicamente per tutti i t ∈ [a, b]. Definizione 4. Due spazi lineari R e R0 sullo stesso corpo numerico si dicono isomorfi se esiste una corrispondenza biunivoca x ←→ x0 per ogni x ∈ R e per 3 ogni x0 ∈ R0 , tale da preservare le operazioni degli spazi lineari, cioè: i) x ←→ x0 comporta αx ←→ αx0 , per ogni α ∈ K , x ∈ R e x0 ∈ R0 ii) x1 ←→ x1 0 e x2 ←→ x2 0 comportano x1 + x2 ←→ x1 0 + x2 0 , per ogni coppia x1 , x2 ∈ R e x01 , x02 ∈ R0 . Una corrispondenza siffatta si dice isomorfismo tra i due spazi lineari R e R0 . Una generica corrispondenza tra R e R0 che conserva le operazioni si dice omomorfismo. Esempio 9. Nell’osservazione 3 abbiamo stabilito una corrispondenza biunivoca tra gli spazi RN e le N-ple (ξi ) di numeri del corpo K , complessi o reali o altro, mediante l’utilizzo di una base in RN . E’ facile convincersi che tale corrispondenza preserva le operazioni degli spazi lineari per cui, in conclusione, tutti gli spazi lineari N-dimensionali sui complessi o sui reali sono isomorfi a C N o a RN e pertanto sono isomorfi tra di loro. Per il modo stesso con il quale è stata istituita la corrispondenza, l’isomorfismo non è unico ma dipende dalle basi scelte nei singoli spazi lineari. Esempio 10. Sia dato lo spazio P N +1 dei polinomi in t di grado al più uguale a N , cioè lo spazio lineare dei vettori x = ξ0 + ξ1 t + ξ2 t2 + ... + ξn tn con n ≤ N . Gli N + 1 vettori 1, t, t2 , ..., tN +1 sono linearmente indipendenti (vedi l’esempio 8), e poichè tutti gli altri vettori sono combinazioni lineari di questi, costituiscono una base. Questa base definisce la corrispondenza x ↔ (ξi ) , tra il PN vettore x ≡ i=0 ξi ti e l’insieme degli N + 1 numeri (ξi ) , e quindi definisce un isomorfismo tra P N +1 e C N +1 (o RN +1 ). Definizione 5. Dato uno spazio lineare R , un suo sottoinsieme A ⊆ R si dice essere un sottospazio di R se, strutturato con le medesime operazioni di R , è esso stesso uno spazio lineare, cioè x ∈ A ⇒ αx ∈ A e anche x, y ∈ A ⇒ x + y ∈ A con somma e prodotto come in R. Se il sottospazio non coincide completamente con R , si dice sottospazio proprio. Osservazione 4. Il sottospazio A deve contenere necessariamente l’elemento nullo di R dato che, se contiene l’elemento x , contiene anche l’elemento x − x. Esempio 11. Con riferimento all’esempio 6, il sottoinsieme di C[a,b] delle 4 funzioni continue x(t) che si annullano in a e in b , cioè tali che x(a) = x(b) = 0 , costituiscono un sottospazio lineare di C[a,b] . Non costituisce invece sottospazio il sottoinsieme delle funzioni con x(a) = x(b) = 1. Esempio 12. C N è un sottospazio di C ∞ . Esempio 13. L’insieme delle N+1-ple ordinate di numeri complessi Sm = {(ξ0 , ..., ξN ) ∈ C N +1 : ξm = 0} costituisce un sottospazio di C N +1 . Esempio 14. I polinomi x ≡ ξ1 t + ξ2 t2 + ... + ξN tN privi del termine di grado zero costituiscono un sottospazio dello spazio P N +1 dei polinoni di grado al più uguale a N (vedi l’esempio 10). Per l’isomorfismo tra questo e C N +1 , il sottospazio in questione è isomorfo al sottospazio Sm=0 dell’esempio 13. Esempio 15. I polinomi di grado al più uguale a N costituiscono un sottospazio di C[a,b] . I polinomi dell’esempio 14, privi cioè del termine noto, costituiscono un sottospazio dello spazio delle funzioni continue in [0, 1] con x(0) = 0. Definizione 6. In uno spazio lineare R consideriamo un sottoinsieme A e la totalità dei sottospazi che lo contengono. La loro intersezione rappresenta il più e piccolo sottospazio di R contenente A e si dice sottospazio inviluppante A. Osservazione 5. Il sottospazio inviluppante Ae è costituito dalla totalità delle combinazioni lineari finite ma di ordine qualsiasi di elementi di A. Infatti, chiamiamo B tale insieme. Cioè sia B costituito da elementi α1 x1 +α2 x2 +...+αn xn con xk ∈ A per ogni k = 1, 2, ..., n e n qualsiasi. B è un sottospazio e contiene A dato che contiene un suo elemento xk arbitrario. Allora Ae ⊆ B . D’altra parte, preso un elemento di B arbitrario α1 x1 +α2 x2 +...+αn xn , questo deve appartenere a un qualsiasi sottospazio contenente A e pertanto anche ad Ae ; da cui B ⊆ Ae . e Quindi, B ≡ A. Teorema 1. Un sottospazio proprio M di uno spazio finito dimensionale RN è finito dimensionale con dimensione M < N . Se M = N il sottospazio coincide con lo spazio intero. Dimostrazione. Se M ≡ (0) , esso ha dimensione M = 0 per definizione. Poichè RN , per ipotesi, contiene almeno un altro elemento , allora N > 0 e il teorema è provato. Sia ora M non banale e consideriamo in esso n vettori 5 linearmente indipendenti. Sarà senz’altro n < N , altrimenti essi costituirebbero una base in RN e la totalità delle combinazioni lineari di essi esaurirebbe RN . Sarebbe cioè RN ⊆ M invece di essere M sottospazio proprio di RN . Quindi M è finito dimensionale e, detta M la sua dimensione, esistono M vettori linearmente indipendenti. Come visto prima, deve valere M < N . Da quanto detto segue automaticamente che se M = N allora M ≡ RN . 2. CLASSI DI EQUIVALENZA Introduciamo il concetto di relazione di equivalenza per insiemi del tutto arbitrari, concetto che tratteremo con maggiore dettaglio nel caso più specifico di spazi lineari. Definizione 7. Sia R è una relazione binaria tra elementi x e y di un insieme X, che indicheremo con xRy. La relazione R si dice relazione di equivalenza su X se gode delle tre seguenti proprietà: i) per ogni x ∈ X si ha xRx (proprietà riflessiva) ii) xRy implica yRx (proprietà simmetrica) iii) xRy e yRz implicano xRz (proprietà transitiva). Definizione 8. Un sottoinsieme di X costituito da tutti gli elementi equivalenti secondo R a un elemento dato x si dice classe di equivalenza e si indica con ξx o con [x]R . L’elemento x si dice generatore della classe; in realtà, un qualunque suo elemento può essere scelto come generatore, essendo tutti equivalenti tra di loro. Osservazione 6. È facile convincersi che l’insieme di sottoinsiemi di X dato dall’insieme delle classi di equivalenza (secondo R) esaurisce senza eccezioni e senza ripetizioni l’insieme X. In altre parole, ogni x ∈ X appartiene a una e a una sola classe di equivalenza di X secondo R. Definizione 9. L’insieme delle classi di equivalenza di X secondo R si dice insieme quoziente e si indica con X/R. La corrispondenza da X su X/R che associa ad ogni x ∈ X l’insieme degli elementi di X equivalenti a x secondo R, si dice corrispondenza canonica di X su X/R. 6 Ritorniamo agli spazi lineari e riprendiamo questi ultimi concetti. Esempio 16. Siano dati uno spazio lineare R e un suo sottospazio M. Due elementi x1 , x2 ∈ R si dicono equivalenti modulo M se x1 − x2 ∈ M, ovvero x1 = x2 + m con m ∈ M. Questa relazione si indica con x1 ≡ x2 (mod M). Valgono le seguenti proprietà: i) x ≡ x(mod M) dato che x − x = 0 ed M contiene necessariamente lo zero essendo un sottospazio. ii) x1 ≡ x2 (mod M) =⇒ x2 ≡ x1 (mod M). Infatti, se x1 − x2 ∈ M, anche −(x1 − x2 ) = x2 − x1 ∈ M. iii) x1 ≡ x2 (mod M) e x2 ≡ x3 (mod M) comportano che x1 ≡ x3 (mod M). Infatti, se x1 − x2 ∈ M e x2 − x3 ∈ M, la loro somma x1 − x3 apparterrà ancora a M essendo questo un sottospazio lineare. La relazione cosı̀ introdotta gode pertanto delle proprietà riflessiva, simmetrica e transitiva e rappresenta quindi un caso particolare di relazione di equivalenza. Consideriamo ora un vettore x ∈ R e l’insieme di tutti i vettori di R equivalenti a x(mod M), tale cioè che x0 − x ∈ M per tutti gli x0 ∈ ξx . Tale insieme è costituito da tutti i vettori del tipo x + m per tutti gli m ∈ M, e individua una classe di equivalenza che indicheremo simbolicamente con ξx ≡ x + M. Ovviamente, lo spazio lineare R può essere decomposto in classi di equivalenza disgiunte, contenenti ognuna tutti e soli i vettori equivalenti tra di loro (mod M). Esempio 17. Come semplice esempio consideriamo l’usuale piano bidimensionale R2 e il sottospazio x2 delle ordinate. Sia inoltre l’elemento x ∈ R2 individuato dal vettore O − P dall’origine al punto P del piano. La classe di equivalenza ξx dei vettori di R2 equivalenti a x(mod x2 ) è data evidentemente da tutti i vettori O − Q con Q giacente sulla parallela a x2 passante per il punto P . L’intero spazio bidimensionale è cosı̀ decomposto nelle classi di equivalenza individuate dalle parallele all’asse x2 . Osservazione 7. Possiamo ora considerare le classi di equivalenza come elementi di un insieme I e definire su di esse le operazioni somma e prodotto: ξx + ξy ≡ ξx+y e αξx ≡ ξαx . Tali operazioni sono genuine operazioni tra le classi di 7 equivalenza in quanto non dipendono dai singoli generatori. Infatti, presi x0 ∈ ξx e y 0 ∈ ξy , essendo x0 = x + m e y 0 = y + n, si ha evidentemente che x0 + y 0 = x + y + l con m, n, l ∈ M. Quindi, ξx+y ≡ ξx0 +y0 . Analogamente, se x0 ≡ x(mod M) anche αx0 ≡ αx(mod M) e quindi αξx = ξαx = ξαx0 = αξx0 . Questo insieme I di insiemi è cosı̀ strutturato con una somma e un prodotto che facilmente si dimostrano soddisfare le proprietà delle operazioni definenti uno spazio lineare. Quale è lo zero di questo spazio? Poichè ξx = x+M, evidentemente ξx + M = ξx e quindi M è lo zero cercato. In conclusione: Definizione 10. Dato uno spazio lineare R e un sottospazio proprio M ⊂ R, lo spazio lineare delle classi di equivalenza (mod M), strutturato con le operazioni definite nell’osservazione 7, si dice spazio quoziente di R rispetto a M e si indica con il simbolo R/M. Lo zero di tale spazio è dato dal sottospazio M. Esempio 18. Come nell’esempio 17, consideriamo l’usuale piano bidimensionale R2 e il sottospazio x2 delle ordinate. Dato x ∈ R2 , la classe di equivalenza ξx è in corrispondenza biunivoca con il vettore xP , proiezione del vettore O − P sull’asse x1 . Considerato lo spazio quoziente R2 /x2 , questo è isomorfo all’intero asse x1 , come è facile verificare. Quest’ultimo esempio suggerisce l’esistenza di un isomorfismo tra uno spazio quoziente e qualche altro sottospazio dello spazio lineare di partenza. Per mostrare la natura generale di tale isomorfismo, è necessario premettere la seguente: Definizione 11. Due sottospazi M e N di uno spazio lineare R si dicono complementari l’uno rispetto all’altro se hanno in comune il solo elemento nullo di R, cioè M ∩ N = (0), e se M + N = R cioè se, dato x ∈ R, esistono m ∈ M e n ∈ N tali che x = m + n. Osservazione 8. La decomposizione di un elemento x ∈ R all’interno di due sottospazi complementari M e N è unica. Infatti, se x = m + n e anche x = m0 + n0 , sottraendo membro a membro si ottiene 0 = m − m0 + n − n0 . Ma m−m0 ∈ M e n−n0 ∈ N e questi hanno in comune il solo elemento nullo. Quindi, m = m0 e n = n0 . Non è invece unico il sottospazio N complementare a un dato sottospazio M ∈ R. 8 Esempio 19. Dato lo spazio lineare R2 e il sottospazio x2 , un sottospazio complementare a x2 rispetto a R è costituito da una qualsiasi retta passante per l’origine non coincidente con x2 . Teorema 2. Dato uno spazio lineare R e due sottospazi complementari M e N , lo spazio quoziente R/M è isomorfo a N . Segue evidentemente che tutti i sottospazi di R complementari a un sottospazio dato sono isomorfi tra di loro. Dimostrazione. Consideriamo la corrispondenza canonica x → ξx . Essa è un omomorfismo, cioè una corrispondenza lineare, da R in R/M. Dimostriamo che questa corrispondenza ristretta a N diventa un isomorfismo tra N e R/M, mostriamo cioè che è una corrispondenza uno a uno dal N in R/M ed è su R/M. Da cui segue l’isomorfismo tra i due spazi lineari. i) Dato n ∈ N esiste una sola classe di equivalenza ξn . Viceversa, dato ξx ∈ R/M supponiamo che esistano due vettori n, n0 ∈ N tali che ξn = ξn0 = ξx ; allora 0 = ξn − ξn0 = ξn−n0 , cioè ξn−n0 = M , e n − n0 ∈ M. Poichè M∩N = (0), si ha che n − n0 = 0 e quindi a ξx corrisponde un solo elemento di N . ii) Dato ξx ∈ R/M possiamo scrivere x = m + n con m ∈ M e n ∈ N . Allora, ξn = ξx−m = ξx − ξm = ξx . Cioè, dato ξx esiste n ∈ N tale che ξx = ξn e quindi la corrispondenza n → ξn è una corrispondenza su R/M. Osservazione 9. Dato uno spazio lineare finito dimensionale RL a dimensione L e un suo sottospazio proprio MM a dimensione M < L, lo spazio quoziente RL /MM ha dimensione N = L − M , essendo N la dimensione del sottospazio N N complementare a MM . Infatti, l’insieme degli M vettori di una base in MM e degli N vettori di una base in N N costituiscono una base in RL , poichè i loro inviluppi non hanno elementi comuni fuorchè lo zero, e la loro somma, ovvero l’inviluppo globale, esaurisce RL . 3. OPERATORI, DOMINI E CODOMINI. Definizione 12. Dati due spazi lineari R e R0 , si considerino in essi due sottoinsiemi DA ⊆ R e RA ⊆ R0 . Una qualsiasi legge che associa ad ogni x ∈ DA uno e un solo elemento x0 ∈ RA definisce un operatore A da R in R0 . Gli insiemi 9 DA e RA si dicono dominio e codominio (o range) di A e la legge si scrive x0 = Ax. Facciamo qui di seguito alcune precisazioni. i) Se R ≡ R0 , allora A si dice operatore in R. ii) Se R0 coincide con un campo numerico (usualmente reali o complessi), allora A si dice funzionale e si indica con A(x) o f (x). Se anche gli x ∈ R sono numeri, allora si parla di funzioni. iii) Si dice che A è uguale a B (A = B) se DA ≡ DB e Ax = Bx per ogni x ∈ DA ≡ DB . iv) L’operatore B è detto estensione di A (A è detto restrizione di B ) se DA ⊂ DB e Ax = Bx per ogni x ∈ DA . In tal caso si scrive A ⊂ B o B ⊃ A. Definizione 13. Consideriamo un operatore A il cui dominio DA sia un sottospazio lineare di R, e siano x, y ∈ DA . Se valgono le due eguaglianze: A(x+y) = Ax+Ay e A(αx) = αAx, allora A è detto operatore lineare. Notare che i membri a sinistra sono comunque definiti essendo per ipotesi DA un sottospazio lineare. Esempio 20. Consideriamo gli usuali C N e la matrice rettangolare N × M con, in generale, N 6= M : a11 a21 A= ... a12 a22 .. . ... ... .. . a1N a2N . .. . aM 1 aM 2 ... aM N Con le solite regole del calcolo matriciale A definisce un operatore lineare da C N in C M . In particolare, le matrici quadrate definiscono operatori in C N . Esempio 21. Consideriamo C[a,b] , lo spazio delle funzioni continue in un intervallo chiuso e limitato, e l’operatore A ≡ d/dt come operatore in C[a,b] , ovvero R ≡ R0 ≡ C[a,b] . In tal caso, il dominio DA non è tutto C[a,b] bensı̀ il sottoinsieme 0 delle funzioni continue con derivata continua, che indicheremo con C[a,b] . Esso è un sottospazio lineare come è facile dimostrare. Con questo dominio di definizione, l’operatore A ≡ d/dt è un operatore lineare. Teorema 3. Sia A un operatore lineare da R in R0 . Allora, il codominio RA ⊂ R0 è un sottospazio lineare. 10 Dimostrazione. Ricordando che DA è uno spazio lineare per definizione (di operatore lineare ), se x, y ∈ DA allora anche x + y ∈ DA e quindi A(x + y) esiste e appartiene a RA . Essendo poi Ax, Ay ∈ RA , dalla linearità di A segue che Ax + Ay = A(x + y) ∈ RA . Analogamente, se x ∈ DA , anche αx ∈ DA e pertanto da Ax ∈ RA segue che anche αAx = A(αx) ∈ RA . Questa somma e prodotto soddisfano le usuali proprietà e quindi RA è uno spazio lineare. Esempio 22. Consideriamo lo spazio lineare C[a,b] e per ogni suo elemento x Rb sia Ax ≡ a x(s) ds. L’operatore A è un funzionale lineare. 2 Rb 0 Sia anche Bx ≡ a dx(s)/ds ds definito in DB ≡ C[a,b] , definito cioè nello spazio delle funzioni continue con derivata continua. L’operatore B è un funzionale ma non è lineare. Esempio 23. Sia x ∈ C[a,b] e Ax ≡ Rt a x(s) ds = X(t) − X(a) con a ≤ t ≤ b e 0 X(t) primitiva di x(t), cioè X (t) = x(t). L’operatore A è lineare con DA ≡ C[a,b] . 0 Il codominio RA è dato invece dal sottospazio di C[a,b] costituito dalle funzioni y(t) continue con derivata continua, tali che y(a) = 0. Esempio 24. Sia R = R0 = C[a,b] . Sia data K(t, s), funzione continua di due Rb variabili nel dominio chiuso e limitato a ≤ t, s ≤ b. E sia Ax ≡ a K(t, s)x(s) ds. Ad ogni x ∈ C[a,b] corrisponde una y = Ax ∈ C[a,b] , per cui A definisce un operatore lineare con DA = C[a,b] . L’operatore A si definisce operatore integrale e la funzione K(t, s) si dice nucleo dell’operatore. Terminiamo il paragrafo con le due seguenti importanti definizioni. Definizione 14. Sia dato un operatore lineare A con DA ≡ R. Il sottospazio M ∈ R si dice invariante rispetto ad A se per ogni x ∈ M vale che anche Ax ∈ M. L’operatore A lascia quindi in M i vettori di M. Definizione 15. Dato uno sottospazio M ∈ R invariante rispetto all’operatore A, definiamo la restrizione AM di A su M, come quell’operatore tale che AM x = Ax per ogni x ∈ M. Evidentemente DAM ≡ M. 11 Esempio 25. Sia dato lo spazio RN e la matrice N × N a 11 ... a k1 A= 0 . . . 0 ... .. . ... ... .. . a1k .. . 0 .. . akk 0 .. . 0 ak+1,k+1 .. . ... .. . ... ... .. . ... 0 aN,k+1 ... 0 .. . 0 . ak+1,N .. . aN N La matrice A lascia invariati sia il sottospazio delle prime k componenti con le altre tutte nulle, sia quello delle ultime N − k con le prime k tutte nulle. Le restrizioni di A ai due sottospazi sono date nel primo caso dal blocco in alto a sinistra e il resto tutti zeri, nel secondo caso dal blocco in basso a destra e il resto tutti zeri. Si trascurano poi tutti gli zeri e si opera in Rk e in RN −k rispettivamente. 4. ALGEBRA DEGLI OPERATORI Introduciamo qui di seguito una serie di definizioni e di proprietà degli operatori in spazi lineari. Salvo esplicita indicazione, si intendono operatori non necessariamente lineari. b ed è definito da R in R0 da a) Operatore nullo. Lo si indica con O o con O Ox = 0 per ogni x ∈ R, e lo zero a destra indica ovviamente il vettore nullo di R0 . Condizione essenziale è che sia DO ≡ R. b) Somma di operatori. Consideriamo due operatori A e B da R in R0 ; se i domini hanno in comune alcuni elementi, se cioè DA ∩ DB 6= 6 O, essendo 6 O l’insieme vuoto, allora si può definire la somma A + B come l’operatore C con DC ≡ DA ∩ DB tale che ∀x ∈ DC , vale Cx = Ax + Bx. La somma tra operatori gode delle proprietà seguenti: i) A + B = B + A (commutatività) ii) A + (B + C) = (A + B) + C b=A iii) A + O (associatività) che derivano tutte dalla linearità di R e da analoghe proprietà dell’unione tra insiemi, cui devono soddisfare i domini degli operatori. 12 c) Prodotto di un numero per un operatore. Dato un numero α del corpo numerico K di R0 , definiamo l’operatore C ≡ αA mediante l’uguaglianza (αA)x = α(Ax) per ogni x ∈ DA . Quindi DαA = DA . Il prodotto cosı̀ definito gode delle seguenti proprietà: i) α(βA) = (αβ)A (in DA ) ii) (α + β)A = αA + βA iii) α(A + B) = αA + αB (in DA ) (in DA ∩ DB ) iv) 1 · A = A (in DA ) v) 0 · A ⊆ O Notare che nella v) non vale solo l’uguale poichè D0·A ≡ DA ⊆ R ≡ DO . d) Spazi lineari di operatori. Se non ci fosse il problema dei domini, si potrebbe introdurre il concetto di spazio lineare di operatori. Questo sarà fatto più avanti quando avremo modo di caratterizzare insiemi di operatori lineari definiti su tutto lo spazio. e) Prodotto di operatori. Dato un operatore B da R in R0 e un operatore A da R0 in R00 con RB ∩ DA 6= 6 O, si può definire l’operatore prodotto C ≡ AB da R in R00 nel modo seguente: per ogni x ∈ DB tale che Bx ∈ DA , deve valere Cx = (AB)x = A(Bx). f) Proprietà del prodotto e della somma. Mostriamo che vale la proprietà distributiva: (A + B)C = AC + BC, ricordando che l’uguaglianza di due operatori A = B comporta che Ax = Bx per ogni x ∈ DA ≡ DB . Dalla definizione del prodotto di operatori segue che il dominio D(A+B)C è costituito dagli x ∈ DC tali che Cx ∈ RC ∩ DA ∩ DB . Analogamente, DAC+BC è costituito da tutti gli x ∈ DC tali che Cx ∈ RC ∩ DA e anche Cx ∈ RC ∩ DB . Cioè da tutti gli x ∈ DC tali che Cx ∈ (RC ∩ DA ) ∩ (RC ∩ DB ) = RC ∩ DA ∩ DB . Quindi, i domini dei due operatori (A + B)C e AC + BC sono uguali. Sia infine RC ∩ DA ∩ DB 6= 6 O e sia x tale da soddisfare le ipotesi precedenti. Allora: (A+B)C x = (A+B)(Cx) = A(Cx)+B(Cx) = (AC)x+(BC)x = (AC +BC)x. 13 Quindi, l’azione dei due operatori sui vettori del dominio è identica e in conclusione i due operatori sono uguali. Tale proprietà, come le precedenti, vale per operatori anche non lineari. g) Se A è un operatore lineare, allora vale anche la legge distributiva a destra: A(B + C) = AB + AC. Come prima, si dimostra l’uguaglianza dei domini DA(B+C) = DAB+AC . Dato poi x ∈ DA(B+C) vale la seguente relazione: A(B + C) x = A (B + C)x = A(Bx + Cx) = ABx + ACx = (AB + AC)x. Da cui segue l’uguaglianza degli operatori. Notare che è il penultimo passaggio ad essere valido solo se l’operatore A è lineare. h) Operatore unità. Definiamo l’operatore unità ER come quell’operatore definito su tutto R, cioè con DER , tale che ER x = x per ogni x ∈ R. Dato A da R in R0 e gli operatori unità nei due spazi, vale ER0 A = AER , come è facile mostrare. i) Potenze di un operatore. Dato un operatore A in R, si possono definire le potenze di esso con le opportune cautele sui domini: A0 ≡ ER , A1 ≡ A, A2 = A · A, . . . , An = A · A · · · A. Si possono anche definire polinomi dell’operatore A: pn (A) = a0 + a1 A + a2 A2 + ... + an An . Il dominio dell’operatore polinomiale si ricava ovviamente dalle definizioni precedenti. Esempio 26. Consideriamo le matrici rettangolari N × M dell’ esempio 20 come operatori lineari da C N in C M e sia N 6= M . Posto A = [aij ] e B = [bij ], con i = 1, 2, ..., M e j = 1, 2, ..., N , la somma tra questi due operatori può essere definita in modo naturale da A + B ≡ [aij + bij ]. Per il prodotto le cose si complicano. Si può ancora definire l’operatore prodotto ma occorre qualche avvertenza su domini e codomini. Se ad esempio M < N , allora RB ⊆ C M e si può intendere questo C M come un sottospazio di C N . In tal caso A, B e AB si possono intendere come operatori in C N . In particolare, DAB ≡ DB ≡ C N e RAB ⊂ C M . Se invece N < M , si può ancora tentare di definire un operatore prodotto pur di considerare un dominio di definizione più ristretto che non tutto C N , definito da tutti quegli x ∈ C N (se ne esistono) tali che anche Bx ∈ C N . Cioè quei vettori x tali che Bx sia della forma (η1 , η2 , ..., ηN , 0, 0, ..., 0). 14 Esempio 27. Se si considerano le matrici quadrate N × N da C N in C N , per queste è sempre possibile definire somme e prodotti nel modo usuale. Esempio 28. Consideriamo lo spazio C[a,b] e l’operatore derivata d/dt. Si possono definire le potenze di questo operatore, con l’ovvia avvertenza che i domini si stringono sempre più. n 00 0 . , . . . , Ddn /dtn = C[a,b] Dd/dt = C[a,b] , Dd2 /dt2 = C[a,b] n Dove C[a,b] indica il sottospazio di C[a,b] delle funzioni continue con tutte le derivate continue sino alla n-esima. Esempio 29. Consideriamo C[a,b] e gli operatori A = d/dt e Bx = Rb a x(s) ds. 0 Per questi sappiamo essere DA = C[a,b] , RA ⊆ C[a,b] , DB = C[a,b] e RB = R (B è un funzionale). E’ quindi senz’altro possibile definire BA. Si può anche definire AB a patto di intendere R ⊆ C[a,b] , a patto cioè di considerare i reali R come il sottospazio di C[a,b] delle funzioni costanti su tutto [a, b]. Naturalmente, AB è il banale operatore nullo. Esempio 30. Siano dati C[a,b] e gli operatori A = d/dt e Rb Bx = a K(t, s)x(s) ds con K(t, s) funzione continua nel quadrato a ≤ t, s ≤ b. E’ sempre possibile definire BA, mentre l’operatore AB è definito solo per quei nuclei integrali K(t, s) tali che anche dK(t, s)/dt sia una funzione continua nel quadrato. Esempio 31. Siano dati due operatori integrali A e B con nuclei integrali A(t, s) e B(t, s) rispettivamente. Si può sempre definire la somma in modo evidente, ottenendo un operatore integrale il cui nucleo è dato dalla somma dei nuclei. Anche il prodotto AB è semplicemente definito da: Rb Rb R b Cx ≡ ABx = a A(t, s0 ) a B(s0 , s)x(s) ds ds0 ≡ a C(t, s)x(s) ds, avendo posto Rb il nucleo integrale C(t, s) ≡ a A(t, s0 )B(s0 , s) ds0 . 5. OPERATORE INVERSO. Definizione 16. Sia dato un operatore A da R in R0 e un operatore B da R0 in R tale che per ogni x ∈ DA si abbia B(Ax) = x. Allora B è detto operatore inverso di A e ha evidentemente dominio di definizione DB ≡ RA . Osservazione 10. Consideriamo un operatore A e il suo inverso B. Per ogni 15 x ∈ DA , si ha che y = Ax ∈ RA ≡ DB . Ma By = B(Ax) = x ∈ RB , per cui RB ≡ D A . Inoltre, dato y = Ax, poichè A(By) = A(BAx) = Ax = y, per definizione l’operatore A è l’inverso di B. Quindi, l’inverso dell’inverso di A è ancora A, e possiamo quindi introdurre la notazione B = A−1 . Vale infatti (A−1 )−1 = A. Inoltre ancora AA−1 ⊆ ER0 in quanto AA−1 x = x per qualsiasi elemento x ∈ DA−1 ⊆ R0 ≡ DER0 . L’operatore AA−1 è quindi una restrizione dell’unità. Analogamente per l’operatore A−1 A. Teorema 4. Sia A un operatore lineare. Se A−1 esiste, allora è anch’esso lineare. Dimostrazione. Siano y1 , y2 ∈ DA−1 ≡ RA , tali cioè che A−1 y1 = x1 e A−1 y2 = x2 . Da quanto visto prima, x1 , x2 ∈ DA e y1 = Ax1 , y2 = Ax2 . Allora A−1 (y1 + y2 ) = A−1 (Ax1 + Ax2 ) = A−1 A(x1 + x2 ) = x1 + x2 = A−1 y1 + A−1 y2 . Si può procedere in modo analogo per il prodotto numerico, per cui A−1 è un operatore lineare. Teorema 5. Dato un operatore lineare A da R in R0 , esiste l’operatore inverso A−1 se e solo se l’equazione Ax = 0 possiede l’unica soluzione x = 0. Dimostrazione. Supponiamo che esista A−1 . Poichè A è lineare, dato x ∈ DA , vale A(x − x) = A0 = Ax − Ax = 00 , con 0 ∈ R e 00 ∈ R0 . Inoltre, dal teorema 3 segue che il suo codominio è un sottospazio lineare e pertanto anche DA−1 (≡ RA ) è un sottospazio lineare e contiene l’elemento 00 . Allora A−1 00 = A−1 (A0) = 0. Quindi, se A−1 esiste, da Ax = 00 segue A−1 (Ax) = A−1 (00 ) = x = 0. Da cui la condizione necessaria del teorema. Viceversa, supponiamo che da Ax = 00 segua x = 0 e sia l’operatore B da R0 in R tale che, dato x ∈ DA e y = Ax, sia By = x. Se a y corrispondono due elementi x1 e x2 , cioè By = x1 e By = x2 con y = Ax1 = Ax2 , allora A(x1 − x2 ) = 00 (per la linearità di A ). Ma, per ipotesi, da Ax = 00 segue x = 0, per cui da A(x1 − x2 ) = 00 segue x1 = x2 . Perciò l’operatore B, già definito per ogni x ∈ DA da B(Ax) = x, è univocamente definito ed è quindi l’operatore inverso di A. 16 Esempio 32. Consideriamo in RN la matrice quadrata N × N a11 a21 A= ... a12 a22 .. . ... ... .. . a1N a2N . .. . aN 1 aN 2 ... aN N La condizione Ax = 0 ⇒ x = 0 è equivalente alla condizione det A 6= 0. Grazie alla regola di Cramer infatti, questa è la condizione che permette la risoluzione univoca dell’equazione Ax = 0, evidentemente soddisfatta da x = 0. Della matrice A esiste quindi l’inverso A−1 . Per la risolubilità dell’equazione Ax = y con y ∈ RN arbitrario, occorre stabilire se DA−1 ≡ RA coincide con l’intero spazio RN . L’applicabilità della regola di Cramer a y qualunque, purchè det A 6= 0, assicura appunto RA ≡ RN . Esempio 33. Consideriamo la matrice rettangolare N × M a11 a21 A= ... a12 a22 .. . ... ... .. . a1N a2N .. . aM 1 aM 2 ... aM N e l’equazione associata Ax = y con x ∈ RN e y ∈ RM . Se N < M , se cioè vi sono più equazioni che incognite, la risolubilità di tale sistema lineare è legata, tramite il teorema di Rouchè e Capelli, alle note condizioni sui determinanti associati al fondamentale, nella costruzione dei quali interviene anche il termine noto y. Questo equivale a restringere il campo non solo degli operatori A che ammettono inverso, ma anche dei vettori y che possono essere scritti come y = Ax, e quindi in sostanza a restringere il codominio RA e il dominio DA−1 . Come semplice esempio, sia l’operatore A da R in R2 definito da una matrice rettangolare 1 × 2 e sia data l’equazione Ax = y con x ∈ R e il termine noto y ∈ R2 : 3 3 a 3x = a A≡ −→ x= =⇒ 4 4 b 4x = b La soluzione esiste solo per particolari valori di a e b e cioè per a/b = 3/4. 17 Dal punto di vista operatoriale, l’equazione Ax = 0 e cioè 3x = 0 e 4x = 0 comportano la sola soluzione x = 0, per cui l’operatore inverso A−1 esiste con dominio uguale ovviamente al codominio di A e cioè: 3c } DA−1 ≡ RA ≡ { 4c con c arbitrario. Su vettori di questo tipo, A−1 è definito ed è espresso da A−1 = 12 13 14 . Infatti: −1 A 1 1 1 3x Ax = =x 2 3 4 4x inoltre, poichè DA ≡ R, si ha che A−1 A = 1 = ER in quanto definito appunto su tutto lo spazio. Viceversa: −1 AA 3 1 1 1 1 1 = = · 2 3 4 2 43 4 3 4 1 . Questa matrice è uguale all’unità ER2 solo sui vettori del dominio di DA−1 (≡ RA ). Quindi AA−1 ⊂ ER2 e il contenimento vale in senso stretto. Esempio 34. Consideriamo ancora matrici rettangolari N × M ma ora con M < N . L’equazione Ax = y è ora equivalente a un sistema lineare con più incognite che equazioni. Possono esistere soluzioni, ma in tal caso sono in numero infinito. Pertanto, non può esistere un operatore inverso A−1 che darebbe origine a una legge uno-molti, anzi uno-infinito e quindi non sarebbe un operatore. Consistentemente, anche l’equazione omogenea Ax = 0 ammette altre (infinite) soluzioni oltre alla nulla. Esempio 35. Sia dato l’operatore integrale: Ax ≡ 0 in C[a,b] , con X (t) = x(t). R x(t) dt = X(t) definito Il codominio RA è costituito dalle primitive di funzioni continue e cioè dalle funzioni X(t) continue a derivata continua con X 0 (t) = x(t). Esse sono definite a meno di una costante arbitraria, e quindi il 0 codominio dell’operatore A è dato da RA ≡ C[a,b] /C, ovvero dallo spazio quoziente 0 di C[a,b] rispetto al sottospazio C delle funzioni costanti. Ricordiamo che tale sot- tospazio C rappresenta lo zero dello spazio quoziente. 18 Consideriamo ora l’equazione Ax = 00 , ove lo zero alla destra dell’uguale sta a indicare l’intero sottospazio C. La funzione di C[a,b] identicamente nulla, cioè il vettore x = 0 è soluzione dell’equazione in quanto l’operatore A è definito a meno di una costante arbitraria, per cui A0 = (cost) ≡ 00 . Inoltre, poichè la derivata di una costante è uguale a zero, tale equazione ammette x = 0 come unica soluzione. Quindi, A ammette inverso e vale evidentemente A−1 = d/dt. 0 Anche l’operatore B ≡ d/dt ristretto a DB = C[a,b] /C ammette inverso perchè dx(t)/dt = 0 ⇐⇒ x = (cost) = 00 . L’operatore B −1 è dato dall’operatore integrale A visto prima. e ≡ d/dt con dominio D ≡ C 0 , allora a dx(t)/dt = 0 Se invece consideriamo B [a,b] e B corrispondono infinite funzioni x(t) = cost e l’operatore inverso non esiste. 19 2. TOPOLOGIE 1. SPAZI TOPOLOGICI La definizione di spazio topologico rappresenta una astrazione di alcune caratteristiche dell’ordinario spazio euclideo monodimensionale. Definizione 1. Un insieme X e una famiglia F di sottoinsiemi A di X sono detti spazio topologico se la famiglia F gode delle seguenti proprietà: a) L’insieme vuoto 6 O e l’intero spazio X appartengono a F. b) L’unione di un numero qualsiasi di membri di F è ancora un membro di F. c) L’intersezione di un numero finito di membri di F è ancora un membro di F. La famiglia F è detta topologia in X e i membri A di F sono detti insiemi aperti di X in questa topologia. Esempio 1. Sia X un qualsiasi insieme non vuoto e sia F una famiglia di sottoinsiemi costituita solo da 6 O e da X. F è evidentemente una topologia in X ed è chiamata topologia grossa. Esempio 2. Sia X un insieme non vuoto e sia F una famiglia costituita da tutti i sottoinsiemi di X (6 O e X inclusi). F è evidentemente una topologia in X ed è chiamata topologia discreta. Esempio 3. Sia dato l’insieme non vuoto X = {a, b, c, d, e} costituito dai cinque elementi a,b,c,d,e. Consideriamo le seguenti famiglie di sottoinsiemi: n o F1 = X, 6 O, {a}, {c, d}, {a, c, d}, {b, c, d, e} n o F2 = X, 6 O, {a}, {c, d}, {a, c, d}, {b, c, d} n o F3 = X, 6 O, {a}, {c, d}, {a, c, d}, {a, b, d, e} . F1 è una topologia in X poichè è facile controllare che i suoi sottoinsiemi soddisfano ai tre assiomi. F2 non è una topologia in X; infatti: {a} ∪ {b, c, d} = {a, b, c, d} ∈ / F2 . F3 non è una topologia in X; infatti: {c, d} ∩ {a, b, d, e} = {d} ∈ / F3 . 20 Esempio 4. Sia X un insieme non vuoto ed F la famiglia di tutti i sottoinsiemi di X il cui complementare è finito (costituito cioè da un numero finito di elementi); inoltre appartenga a F anche l’insieme vuoto 6 O. F è una topologia in X. Anzitutto, se X è finito questa non è altro che la topologia discreta. Sia allora X infinito. L’assioma a) è banalmente soddisfatto. Per quanto riguarda l’assioma b): l’unione di infiniti (anche non numerabili) sottoinsiemi della famiglia contiene insiemi a complementare finito, e quindi è a complementare finito, per cui l’assioma b) è soddisfatto. Infine, l’intersezione di N membri della famiglia i cui complementari sono costituiti da n1 , n2 , ..., nN elementi di X, è un insieme il cui complementare è formato al più da n1 + n2 + ... + nN elementi di X, per cui l’assioma c) è soddisfatto. Questa topologia è detta T1 , e in seguito ne vedremo il motivo. Esempio 5. L’intersezione F1 ∩ F2 di ogni coppia F1 ed F2 di topologie in X è una topologia in X. Infatti, 6 O e X appartengono sia a F1 che a F2 (essendo topologie), per cui 6 O, X ∈ F1 ∩ F2 , e l’assioma a) è soddisfatto. Se Aα ∈ F1 ∩ F2 (essendo α un indice discreto o continuo), allora Aα ∈ F1 e Aα ∈ F2 , ed essendo F1 e F2 topologie in X, è anche ∪α Aα ∈ F1 e ∪α Aα ∈ F2 , per cui ∩α Aα ∈ F1 ∩F2 , e l’assioma b) è soddisfatto. Analogamente è soddisfatto l’assioma c). Esempio 6. L’unione F1 ∪ F2 di due topologie F1 e F2 in X non è necesn o sariamente una topologia in X. Infatti, sia X = {a, b, c} e F1 = X, 6 O, {a} , n o n o F2 = X, 6 O, {b} ; F1 e F2 sono topologie in X ma F1 ∪ F2 = X, 6 O, {a}, {b} non è una topologia in X. Esempio 7. Sia X = R2 il piano ordinario e appartengano a F il vuoto 6 O, o n p l’intero spazio X e tutti i sottoinsiemi An = {x, y} : x2 + y 2 < n1 , n = 1, 2, ... costituiti da tutti i punti del cerchio di raggio 1 n esclusa la circonferenza. La famiglia F soddisfa l’assioma a). ∪∞ n=N An = AN , N = 1, 2, ..., ovvero l’unione di infiniti cerchi An è uguale al cerchio maggiore, quindi F soddisfa l’assioma b). AN ∩ AM = AQ con Q = max(N, M ), quindi F soddisfa anche l’assioma c) ed è una topologia. Notiamo che ∩∞ n=N An = {x = y = 0}, N = 1, 2, ..., cioè l’intersezione di infiniti 21 elementi della famiglia F è l’insieme {O} costituito dalla sola origine del piano e questo insieme non appartiene alla famiglia F. L’assioma c) d’altronde richiede solo che l’intersezione di un numero finito di elementi della famiglia appartenga alla famiglia. Esempio 8. Sia X = R2 , il piano ordinario, e F = {X, 6 O, An } con n o p 1 2 2 An = {x, y} : x + y < 2 − n , n = 1, 2, .... In X, F non è una topologia, n o p 2 + y 2 < 2 . L’unione cioè di infiniti membri della poichè ∪∞ A = {x, y} : x n=1 n famiglia è il cerchio di raggio 2 circonferenza esclusa, e questo insieme non appartiene alla famiglia F. o n p 2 2 Esempio 9. Sia X = {x, y} : x + y ≤ 2 , e F = {X, 6 O, An } con An definito come nell’esempio 8. In tal caso F è una topologia in X. Esempio 10. Sia X = R l’insieme dei reali. Consideriamo i sottoinsiemi A di X tali che a ogni x0 ∈ A corrisponda qualche h > 0 in modo che x ∈ A se |x − x0 | < h. La famiglia F formata da questi sottoinsiemi A più il vuoto (X è già compreso nella definizione), costituisce una topologia in X. L’assioma e = ∪α Aα , con α a) è soddisfatto. Per quanto riguarda l’assioma b): sia x0 ∈ A indice discreto o continuo, allora x0 ∈ Aα̃ , appartiene cioè almeno a un Aα , per e per cui x ∈ A e se cui esiste h > 0 tale che x ∈ Aα̃ se |x − x0 | < h. Ma Aα̃ ⊂ A, e ∈ F, e l’assioma b) è dimostrato. L’assioma c) è soddisfatto |x−x0 | < h e quindi A se Aα ∩ Aβ = 6 O. Altrimenti, se x0 ∈ Aα ∩ Aβ , esistono hα e hβ tali che x ∈ Aα se |x − x0 | < hα e x ∈ Aβ se |x − x0 | < hβ . Sia h = min(hα , hβ ); se |x − x0 | < h, allora x ∈ Aα e x ∈ Aβ , per cui x ∈ Aα ∩ Aβ . L’assioma c) è quindi soddisfatto. Questa topologia è l’usuale topologia sui reali dell’analisi. Un aperto è l’unione di quanti si voglia segmenti aperti, senza cioè gli estremi. Come si diceva è da questa topologia che sono mutuati i concetti fondamentali relativi agli spazi topologici. Esempio 11. Sia X = RN . Consideriamo i sottoinsiemi A di X tali che (i) a ogni x0 = {ξ0 }q∈ A (i = 1, 2, ..., N ), corrisponde qualche h > 0 in modo che PN (i) − ξ (i) )2 < h. Questi insiemi più il vuoto definiscono x = {ξ (i) } ∈ A se 0 i=1 (ξ una topologia, analoga a quella dell’esempio 10. Questa è l’usuale topologia in RN , e gli aperti sono unioni e intersezioni di sfere aperte. 22 Esempio 12. Sia X uno spazio topologico e S ∈ X un sottoinsieme arbitrario di X. Consideriamo ora Fe = S ∩ F, cioè la famiglia costituita dall’intersezione di S con tutti i membri di F, topologia in X. E’ facile controllare che Fe è una topologia in S ed è detta topologia relativa. Notiamo che negli esempi 7)-11) gli insiemi X sono stati dotati di una topologia servendosi di una struttura precedentemente definita sugli insiemi stessi. Essi sono infatti spazi lineari, dotati per di più della (ordinaria) distanza tra coppie di elementi, che li definisce quali spazi metrici; questi verranno trattati nel prossimo capitolo. E’ chiaro però , vedi esempi 1)-6), che nessuna struttura è necessaria per la definizione di una topologia. Definizione 2. Intorno Ix di un punto x è un insieme che contiene un aperto contenente x. Definizione 3. Intorno IS di un sottoinsieme S è un insieme che contiene un aperto contenente S. Definizione 4. Un punto x di un sottoinsieme S ⊂ X è detto punto interno di S se esiste un intorno Ix di x tale che x ∈ Ix ⊂ S. L’insieme di tutti i punti interni di un sottoinsieme S ⊂ X è detto insieme interno di S e si indica con int(S). In base al teorema successivo, esso è il più grande aperto contenuto in S. L’interno del complemento di S è detto insieme esterno e si indica con ext(S). Esempio 13. Sia data la retta R con la topologia usuale dell’esempio 10. Il sottoinsieme Q dei razionali non ha nè punti interni, nè punti esterni. Infatti, in ogni intorno di un razionale esiste un irrazionale, e in ogni intorno di un irrazionale (che appartiene a C(Q)) esiste un razionale. Teorema 1. Un sottoinsieme S di uno spazio topologico X è aperto se e solo se contiene solo punti interni. Dimostrazione. Se S è aperto è sufficiente scegliere Ix = S. Viceversa, se S contiene un intorno Ix di ogni suo punto x, allora S = ∪x∈S Ix ed essendo gli Ix aperti, S è aperto. 23 Osservazione 1. Se in uno spazio X sono definite due topologie F1 e F2 , e ogni aperto in F1 è anche aperto in F2 , cioè vale F1 ⊂ F2 , allora la topologia F1 è detta più debole o più grossa ed è costituita da un minor numero di elementi, mentre la topologia F2 è detta più forte o più fine. La topologia grossa dell’esempio 1 è la topologia più grossa che si può definire su uno spazio X e corrispondentemente la topologia discreta è la più fine. Se vale F1 ⊂ F2 e anche F2 ⊂ F1 , cioè F1 = F2 , ovvero sono costituite dagli stessi insiemi aperti, diremo che le due topologie sono equivalenti. Una condizione necessaria e sufficiente affinchè due topologie siano equivalenti è la seguente: dato un intorno di x arbitrario Ix1 ∈ F1 , esiste un intorno Ix2 ∈ F2 tale che Ix2 ⊂ Ix1 , e viceversa, dato Ix2 ∈ F2 esiste Ix1 ∈ F1 con Ix1 ⊂ Ix2 . La condizione necessaria è ovvia. Per la condizione sufficiente, sia A2x l’unione di tutti gli intorni in F2 contenuti in Ix1 ; esso è ancora un elemento di F2 ma è anche un elemento di F1 , essendo A2x = Ix1 . Infatti, se cosı̀ non fosse esisterebbe un elemento x0 ∈ Ix1 ma con x0 6∈ A2x . Ma gli intorni sono costituiti solo da punti interni, per cui deve esistere un altro intorno di x0 : Ix10 ⊂ Ix1 . Per ipotesi, esiste allora anche un intorno in F2 tale che Ix20 ⊂ Ix10 . Ma allora A2x ⊂ A2x ∪ Ix20 ⊂ Ix1 e quindi A2x non sarebbe il più grande aperto di F2 contenuto in Ix1 . Dunque, ogni aperto di F1 è anche un aperto di F2 , cioè F1 ⊂ F2 . Invertendo le ipotesi si trova anche il risultato opposto F2 ⊂ F1 per cui, in conclusione, F1 = F2 . CVD. Definizione 5. Un sottoinsieme C ⊂ X è detto chiuso se il suo complemento è aperto. In ogni topologia, 6 O e X sono sia aperti che chiusi. Osservazione 2. Dalle proprietà dell’operazione di complementazione: C(∪α Aα ) = ∩α C(Aα ) e C(Aα ∩ Aβ ) = C(Aα ) ∪ C(Aβ ), segue che: b’) l’unione di un numero finito di chiusi è un chiuso, c’) l’intersezione di un numero qualsiasi (anche non numerabile) di chiusi è un chiuso. E’ possibile quindi introdurre una topologia mediante i chiusi sostituendo agli assiomi b) e c) gli assiomi b’) e c’). Esempio 14. Nella topologia discreta (esempio 2), ogni sottoinsieme è con24 temporaneamente aperto e chiuso. Anche nella topologia grossa (esempio 1), questo fatto si verifica banalmente. Ovviamente, non in tutte le topologie gli aperti sono anche chiusi, inoltre vi sono insiemi nè aperti nè chiusi. Esempio 15. Nella topologia F1 dell’esempio 3, il sottoinsieme {a, b, e} è chiuso e non aperto, e il sottoinsieme {b} non è nè aperto nè chiuso. Definizione 6. Se S ⊂ X, l’intersezione di tutti i chiusi di X che contengono S è detta chiusura di S e si indica con S. Chiaramente S è chiuso ed è contenuto in ogni altro chiuso contenente S. Osservazione 3. S = S se e solo se S è chiuso. Definizione 7. Un sottoinsieme A contenuto in un altro sottoinsieme B, A ⊂ B, si dice denso in B se B ⊂ A. In particolare, A si dice denso ovunque se A = X. Il sottoinsieme A si dice in nessun punto denso se l’interno della chiusura di A è vuoto, cioè int(A) = 6 O. Definizione 8. La frontiera F (S) di un insieme S è definita dalla intersezione delle chiusure di S e del suo complementare: F (S) = S ∩ C(S). Osservazione 4. La frontiera è ovviamente un insieme chiuso. Esempio 16. Sia X = R2 topologizzato con la topologia dell’esempio 7. Si vede facilmente che An = X ∀n e quindi F (An ) = An ∩ C(An ) = C(An ) = C(An ), cioè la frontiera di An è data dal suo complementare rispetto a X. Esempio 17. Sia X = R2 con l’usuale topologia (esempio 11). I cerchi centrati nell’origine di raggio 1 n privati della circonferenza esterna sono degli aperti anche in questa topologia. A differenza però che nell’esempio precedente, la frontiera di An è data solo dalla circonferenza esterna. Esempio 18. Sia X = R con la usuale topologia dell’esempio 10. Il sottoinsieme Z degli interi è un insieme chiuso, essendo il complementare dell’unione di tutti i segmenti aperti n < x < n + 1. Esso è in nessun punto denso; infatti Z = Z e non possiede punti interni, cioè int(Z) = int(Z) = 6 O. Invece, il sottoinsieme Q dei razionali non è in nessun punto denso: infatti Q = R e int(Q) = R 6= 6 O. 25 Definizione 9. Un punto x è detto punto di accumulazione per un insieme S se ogni intorno di x contiene un punto di S distinto da x. Diremo inoltre insieme derivato e lo indicheremo con S 0 l’insieme di tutti i punti di accumulazione di S. Esempio 19. Nella topologia grossa ogni punto x è punto di accumulazione per ogni sottoinsieme di X esclusi il vuoto 6 O e il sottoinsieme x costituito dal singolo punto. Esempio 20. Nella topologia discreta, nessun punto è punto di accumulazione per alcun sottoinsieme. Per ogni punto infatti esiste l’intorno costituito dal singolo punto e che pertanto non ne contiene altri. Più in generale, se un singolo punto è aperto in una data topologia, non può essere punto di accumulazione per alcun sottoinsieme. Teorema 2. Un sottoinsieme S ⊂ X è chiuso se e solo se contiene tutti i suoi punti di accumulazione. Dimostrazione. Se S è chiuso, C(S) è aperto, per cui se x ∈ C(S), esiste un intorno Ix di x tale che x ∈ Ix ⊂ C(S) e pertanto Ix ∩ S = 6 O, per cui nessun punto x ∈ C(S) può essere punto di accumulazione per S. Viceversa, se S contiene tutti i suoi punti di accumulazione, dato x ∈ C(S) deve esistere un intorno Ix di x tale che Ix ∩ S = 6 O, altrimenti x ∈ C(S) sarebbe punto di accumulazione per S. Ne segue che Ix è tutto contenuto in C(S), cioè x ∈ Ix ⊂ C(S), per cui C(S) è formato da soli punti interni ed è perciò aperto. Dunque S è chiuso. Teorema 3. Consideriamo S e il suo insieme derivato S 0 . Allora S = S ∪ S 0 , cioè la chiusura di S coincide con l’unione di S e dei suoi punti di accumulazione. Dimostrazione. Anzitutto S ∪ S 0 è chiuso, per il teorema precedente. Infatti, sia x un punto di accumulazione per S ∪ S 0 e Ix un intorno arbitrario di x. Ix contiene o un punto di S (distinto da x) e allora x è punto di accumulazione per S e appartiene a S 0 , oppure Ix contiene un punto x0 ∈ S 0 ed è quindi un intorno di x0 ; essendo x0 punto di accumulazione per S, Ix contiene un punto di S (distinto eventualmente da x0 ) e quindi x o appartiene a S o è punto di accumulazione per S e appartiene quindi a S 0 . Dunque, S ∪ S 0 è chiuso. Inoltre, S ∪ S 0 è contenuto in ogni altro chiuso che contiene S, per cui ne è la chiusura. 26 Esempio 21. Consideriamo l’insieme X e la topologia F1 dell’esempio 3: n o X = {a, b, c, d, e}, F1 = X, 6 O, {a}, {c, d}, {a, c, d}, {b, c, d, e} , e il sottoinsieme S = {a, b, c}. Si vede facilmente che a e c non sono punti di accumulazione per S ({a} e {c, d} sono i due intorni rilevanti), mentre b, d, e sono punti di 0 accumulazione per S. L’insieme derivato di S è dato da S = {b, d, e}, mentre la chiusura di S coincide con X, S = X. Quindi S è denso in X. Esempio 22. Sia X = R con la topologia usuale dei reali (esempio 10), e sia: I) S = {1, 12 , 13 , ..., n1 , ...}. Il punto 0 è l’unico punto di accumulazione per S, per cui S = Se = {1, 1 , 1 , ..., 1 , ..., 0}. Per convincersi che Se è chiuso, basta controllare 2 3 n e = (−∞, 0) ∪∞ ( 1 , 1 ) ∪ (1, ∞), dove (a, b) il suo complementare dato da: C(S) n=1 n+1 n e indica il segmento aperto di estremi a e b. C(S) è evidentemente aperto e quindi Se è chiuso. II) Sia X = Q, l’insieme dei razionali. I numeri reali definiti mediante classi contigue di razionali risultano essere punti di accumulazione per Q. Quindi Q = R e Q è denso ovunque. III) Sia S un insieme infinito e limitato, contenuto cioè in un segmento chiuso [a, b] di R. S ha almeno un punto di accumulazione. Questo è il noto teorema di Bolzano-Weierstrass e sarà dimostrato in appendice. 2. BASI Definizione 10. Dato uno spazio topologico X, Una famiglia B di aperti è detta base nel punto x se x ∈ B per ogni B ∈ B e se a ciascun intorno Ix di x corrisponde qualche B ∈ B tale che x ∈ B ⊂ Ix . Definizione 11. Una famiglia B di aperti è detta base per lo spazio topologico X se per ciascun x ∈ X esiste una sottofamiglia di B che è una base in x. Cioè una famiglia B di aperti è base per X se e solo se per ogni x ∈ X e per ogni intorno Ix di x esiste un elemento della famiglia B ∈ B tale che x ∈ B ⊂ Ix . Le seguenti proprietà sono evidenti. i) Sia B una base in X; allora la sottofamiglia degli intorni Ix appartenenti a B è una base in x. 27 ii) L’unione delle basi in ogni punto x ∈ X è una base in X. iii) Se B è una base per uno spazio topologico, allora: 1) A ciascun x ∈ X corrisponde qualche B ∈ B tale che x ∈ B. 2) Se B1 , B2 ∈ B e x ∈ B1 ∩ B2 , allora esiste B3 tale che x ∈ B3 ⊂ B1 ∩ B2 . Per dimostrare ciò è sufficiente considerare l’intorno Ix = B1 ∩ B2 nella definizione di base in un punto. La successiva affermazione è valida anche in senso inverso è può quindi dare origine a una equivalente definizione di base per uno spazio X. iv) Ogni aperto di una topologia è ottenibile dall’unione di un certo numero (anche di una infinità non numerabile) di elementi di una base in X. Essendo infatti A un intorno di ogni suo punto x, esiste un B tale che x ∈ B ⊂ A, per ogni x ∈ A. Pertanto A ⊂ ∪α Bα . Il contenimento opposto è ovvio e quindi vale l’eguaglianza A = ∪α Bα con Bα ∈ A. Esempio 23. X = {a, b, c, d, e} , F1 = X, 6 O, {a}, {c, d}, {a, c, d}, {b, c, d, e}} n o (esempio 3). Una base in X è data evidentemente da B = {a}, {c, d}, {b, c, d, e} . Esempio 24. Sia X = R2 topologizzato con la topologia dei cerchi aperti dell’esempio 7. E’ facile convincersi che l’unica base per lo spazio X è costituita dall’intera topologia. Esempio 25. Sia X = R con la topologia usuale (esempio 10). Una base in x0 è data dagli intervalli aperti di semiampiezza reale Ixr0 = {x : |x − x0 | < r} con r reale. Ixr0 sono infatti intorni di x0 nella topologia usuale; inoltre, considerato un intorno Ix arbitrario di x, dalla definizione segue che esiste un h > 0 tale che x ∈ Ix se |x − x0 | > h, e scelto r < h si ha x0 ∈ Ixr0 ⊂ Ix . Anche le famiglie m/n formate dai segmenti aperti di semiampiezza razionale: Ix0 1/n = {x : |x − x0 | < con m, n = 1, 2, ..., o dai segmenti aperti Ix0 = {x : |x − x0 | < 1 n m n} con n = 1, 2, ..., costituiscono delle basi in x0 . I segmenti aperti centrati in x0 e di semiampiezza intera non costituiscono invece una base in x0 . m/n Le tre famiglie costituite da tutti gli Ixr , Ix tre differenti basi in X = R. 28 1/n , Ix , per tutti gli x, rappresentano Esempio 26. Sia X topologizzato con la topologia discreta. Il sottoinsieme {x} costituito dal singolo elemento x è una base in x. Una base in X è data evidentemente da B = {x : x ∈ X}, ed è contenuta in ogni altra base possibile per questo spazio topologico. Alcuni concetti definiti precedentemente in termini di intorni arbitrari di un punto x, possono essere definiti in termini dei soli elementi di una base in x. Per esempio il punto di accumulazione della definizione 9, mediante il seguente: Teorema 4. Dato uno spazio topologico X e una base B in x ∈ X, il punto x è punto di accumulazione per il sottoinsieme S se e solo se ogni elemento B della famiglia B contiene un elemento di S distinto da x. Dimostrazione. Sia x punto di accumulazione per S. Essendo B un intorno di x, esso contiene almeno un punto di S distinto da x. Viceversa, se ogni B contiene un elemento di S distinto da x, consideriamo un intorno arbitrario Ix di x: per definizione di base esiste un B tale che x ∈ B ⊂ Ix , per cui Ix contiene punti di S distinti da x che risulta quindi punto di accumulazione per S. Esempio 27. Nella topologia usuale sulla retta reale R, i punti di accumulazione si ottengono considerando la sola base costituita dalla totalità degli Ixr dell’esempio 25. In tutta l’analisi si fa praticamente uso di questa sola base (vedi in seguito i teoremi 6 e 6’ sulla continuità ). Osservazione 5. Consideriamo ora un insieme X inizialmente senza alcuna topologia, e sia B una famiglia di sottoinsiemi di X soddisfacenti le seguenti condizioni: I) A ciascun x ∈ X corrisponde qualche B ∈ B tale che x ∈ B. II) Se B1 , B2 ∈ B e x ∈ B1 ∩ B2 , allora esiste almeno un B3 ∈ B tale che x ∈ B3 ⊂ B1 ∩ B2 . Notiamo anzitutto che le I) e II) sono soddisfatte dagli elementi di una base di uno spazio topologico. Vogliamo mostrare, per cosı̀ dire, l’inverso, mostrare cioè che, mediante una famiglia B soddisfacente le condizioni I) e II), è possibile definire 29 una topologia in X, per il quale B rappresenta una base. Consideriamo infatti i sottoinsiemi S di X tali che se x ∈ S esiste qualche B ⊂ B per cui x ∈ B ⊂ S. La famiglia F dei sottoinsiemi S che godono di questa proprietà (più il vuoto) costituisce una topologia in X. Lo spazio X appartiene a F essendo uno dei sottoinsiemi S (assioma a)). L’unione di un numero qualsiasi di sottoinsiemi S contiene almeno un B, e l’assioma b) è soddisfatto. Infine, se S1 ∩ S2 6= 6 O, allora dato x ∈ S1 ∩ S2 esistono B1 e B2 tali che x ∈ B1 ⊂ S1 , x ∈ B2 ⊂ S2 , da cui segue che x ∈ B1 ∩ B2 ; esiste perciò un elemento B3 tale che x ∈ B3 ⊂ B1 ∩ B2 ⊂ S1 ∩ S2 , e anche l’assioma c) è soddisfatto. Vale ovviamente B ⊂ F, e dunque B rappresenta una base per lo spazio X cosı̀ topologizzato. Queste considerazioni suggeriscono un importante metodo per introdurre una topologia in uno spazio X. Ricordiamo infatti che ogni aperto è ottenibile dall’unione di elementi di una base, secondo la proprietà iv). n o Esempio 28. X = {a, b, c, d, e}, B = {a}, {c, d}, {b, c, d, e} . Questa famiglia soddisfa le condizioni I) e II), per cui da questa è possibile estrarre una topologia, i cui aperti sono l’unione dei B ∈ B, oltre al vuoto 6 O. Segue che n o F = X, 6 O, {a}, {c, d}, {a, c, d}, {b, c, d, e} . n o Esempio 29. X = {a, b, c, d, e}, B = {a}, {c}, {a, c, d}, {b, c, e} . B soddisfa le condizioni I) e II) e da essa si ricava la topologia n o F = X, 6 O, {a}, {c}, {a, c}, {a, c, d}, {b, c, e}, {a, b, c, e} . n o Esempio 30. X = {a, b, c, d, e}, B = {a, b}, {b, c}, {c, d}, {d, e} . B soddisfa la condizione I) ma non la II). E’ possibile tuttavia ottenere una topologia anche da questa famiglia considerando tutte le unioni e tutte le intersezioni possibili. B però non è più una base per questo spazio topologico. La topologia cosı̀ ottenuta è data da: F = {X, 6 O, {b}, {c}, {d}, {a, b}, {b, c}, {b, d}, {c, d}, {d, e}, {a, b, c}, {a, b, d}, {b, c, d}, {b, d, e}, {c, d, e}, {a, b, c, d}, {a, b, d, e}, {b, c, d, e}}. Esempio 31. X = RN ; sia B la famiglia costituita da tutte le sfere aperte (1) (2) (N ) di centro e raggio arbitrari cioè , dati x0 = {ξ0 , ξ0 , ..., ξ0 } e un numero reale PN (i) arbitrario r, B = {x : i=1 (ξ (i) − ξ0 )2 < r2 }. La famiglia B gode delle proprietà I) e II) e definisce la topologia usuale in RN (vedi l’esempio 11). 30 3. FUNZIONI CONTINUE Le due seguenti definizioni sono del tutto analoghe alle 1.11 e 1.15 relative agli operatori in spazi lineari. Definizione 12. Dati due spazi topologici X e Y , una qualsiasi legge che associa a ogni x ∈ X un e un solo elemento y ∈ Y è detta funzione da X in Y e si indica con y = f (x). Gli spazi X e Y si dicono dominio e codominio della funzione. Definizione 13. Sia data una funzione f da X in Y . Se esiste una funzione g (a un sol valore, per definizione) da Y in X tale che g(f (x)) = x per ogni x ∈ X, la funzione g è detta funzione inversa e si indica con f −1 . Dato S ⊂ X, indichiamo inoltre con f (S) l’insieme di tutti gli f (x) ∈ Y per tutti gli x ∈ S. Dato T ⊂ Y , indichiamo anche con f −1 (T ) l’insieme di tutti gli x ∈ X tali che f (x) ∈ T . Notare che questa definizione non implica l’esistenza della funzione inversa come legge a un sol valore. Pertanto, è possibile che dato y ∈ T ⊂ Y esistano x, x0 ∈ X tali che f (x) = f (x0 ) = y. La nostra definizione implica semplicemente che entrambi x, x0 ∈ f −1 (T ). Osservazione 6. A differenza dagli operatori in spazi lineari, abbiamo definito le funzioni in spazi topologici con dominio e codominio coincidenti con gli interi spazi. Se però f fosse solo definita in S ⊂ X con codominio T ⊂ Y , possiamo sempre considerare S e T come spazi topologici con la topologia relativa (vedi l’esempio 12). Situazione analoga a questa si verifica nel caso di operatori lineari (vedi la definizione 1.12 e il teorema 1.3). Definizione 14. Una funzione f è detta continua nel punto x0 ∈ X se a ogni intorno V di f (x0 ) in Y corrisponde un intorno U di x0 tale che f (U ) ⊂ V . La stessa definizione può essere data nel seguente modo: f è detta continua in x0 se per ciascun intorno V di f (x0 ) l’insieme f −1 (V ) contiene un intorno di x0 . Una funzione continua in ogni punto x ∈ X è detta continua in X. Se f è continua in X e f −1 è continua in Y , allora f è detta omeomerfismo di X in Y , e X e Y sono detti omeomorfi. Teorema 5. Siano X e Y due spazi topologici e sia f una funzione con 31 dominio X e codominio Y . Allora f è continua in X se e solo se f −1 (V ) è un insieme aperto in X ogni volta che V è un insieme aperto in Y . Dimostrazione. Sia f −1 (V ) un aperto in X ogni volta che V è un aperto in Y . Sia x0 un punto qualsiasi in X e sia V un intorno di f (x0 ). Per ipotesi f −1 (V ) è un insieme aperto e inoltre contiene x0 ; f −1 (V ) contiene quindi un intorno di x0 (lo è esso stesso), e quindi f è continua secondo la definizione. Viceversa. Sia f continua in X, e sia V un insieme aperto in Y . Allora, se x ∈ f −1 (V ), per l’ipotesi della continuità di f , f −1 (V ) deve contenere con x anche un intorno di x, ed è perciò costituito da soli punti interni (definizione 4). Dunque, f −1 (V ) è un aperto in X (teorema 1). Osservazione 7. Se f ha dominio X e codominio Y , e V ⊂ Y , è facile convincersi che vale la seguente relazione: f −1 (C(V )) = C(f −1 (V )). Infatti, poichè f −1 (V ) contiene tutti gli x ∈ X che trasformati vanno in V , f −1 (C(V )) contiene tutti e solo quelli che non godono di questa proprietà , e cioè il complementare. Inoltre, da quanto testè osservato segue che f è continua in X se e solo se f −1 (V ) è chiuso in X ogni volta che V è chiuso in Y . FX Esempio 32. In X = {a, b, c, d} e Y = {x, y, z, w} siano definite le topologie: n o n o = X, 6 O, {a}, {a, b}, {a, b, c} e FY = Y, 6 O, {x}, {y}, {x, y}, {y, z, w} . Consideriamo due funzioni f e g con dominio X e codominio Y , cosı̀ definite: f (a) = y, f (b) = z, f (c) = w, f (d) = z ; g(a) = x, g(b) = x, g(c) = z, g(d) = w. Dal teorema 5, se f −1 (V ) è aperto in X ogni volta che V è aperto in Y , f è una funzione continua. Ora, f −1 (Y ) = X, f −1 (6 O) = 6 O, f −1 (x) = 6 O, f −1 (y) = {a}, f −1 ({x, y}) = a, f −1 ({y, z, w}) = X. Dunque, f è continua. Invece la funzione g non è continua in X. Infatti, g −1 ({y, z, w}) = {c, d} che non è un aperto in X. La funzione g non è continua nè in c nè in d, mentre è continua in a e in b. Infatti, dalla definizione 14 con c = x0 : g(c) = z ∈ {y, z, w} e g −1 ({y, z, w}) = {c, d} che non è intorno di c e non contiene alcun intorno di c (nella topologia FX ). Analogamente per il punto d. Invece, in a e in b : g(a) = g(b) = x ∈ {x}, {x, y}, X e g −1 (x) = {a, b}, g −1 ({x, y}) = {a, b}, g −1 (X) = Y , e tutti questi insiemi contengono degli intorni (lo sono essi stessi) di a e di b. 32 Esempio 33. Siano X e Y due spazi topologici dotati rispettivamente della topologia discreta e di una topologia qualsiasi F. In tal caso una qualsiasi funzione f da X in Y è continua. Infatti, nella topologia discreta ogni sottoinsieme f −1 (T ) è un aperto e, in particolare, lo è quando T è un aperto in Y . Esempio 34. Siano X e Y due spazi topologici dotati rispettivamente di una topologia arbitraria F e della topologia grossa. Una qualsiasi funzione f con dominio X e codominio Y (o in Y ) è continua. Infatti, 6 O e Y sono gli unici aperti in Y , e f −1 (6 O) = 6 O, f −1 (Y ) = X entrambi aperti. Come avevamo preannunciato, è possibile dare la definizione di continuità servendosi delle sole basi. Questo è dovuto al seguente: Teorema 6. Siano X e Y due spazi topologici, BY una base in Y e f una funzione con dominio X e codominio Y . Allora f è continua se e solo se l’immagine inversa di ogni elemento della base in Y è un aperto in X. Dimostrazione. Se f è continua e BY ∈ BY , f −1 (BY ) è un aperto in X, dato che BY è un aperto in Y . Viceversa, se f −1 (BY ) è un aperto in X, consideriamo un aperto generico A in Y , il quale può essere espresso come unione di elementi di BY (vedi proprietà IV delle basi), cioè A = ∪α BYα ; è facile convincersi che f −1 (A) = f −1 (∪α BYα ) = ∪α f −1 (BYα ); essendo per ipotesi f −1 (BYα ) un aperto, f −1 (A) è un aperto. Osservazione 8. Se anche X è dotato di una base BX , dato un intorno Ix di x, esiste BX ∈ BX tale che x ∈ BX ⊂ Ix . Il teorema può essere pertanto rienunciato nel modo seguente: Teorema 6’. Siano BX e BY basi nei due spazi topologici X e Y , e sia f una funzione con dominio X e codominio Y . Allora f è continua se e solo se esiste BX ∈ BX tale che BX ∈ f −1 (BY ) per ogni BY ∈ BY . Esempio 35. Siano X = Y = R, la retta reale, topologizzati con la topologia usuale. Le funzioni con dominio X e codominio Y sono le usuali funzioni reali di variabile reale dell’analisi. Ricordiamo infatti la definizione usuale di continuità in un punto: f si dice continua in x0 se, fissato , esiste δ tale che |f (x) − f (x0 )| < 33 se |x − x0 | < δ . E’ chiaro che questa definizione di continuità è data mediante la base in y0 = f (x0 ) costituita dai segmenti Iy0 di semiampiezza centrati in y0 , e mediante la analoga base in x0 , B = {Ixδ0 }. 4. INSIEMI COMPATTI Definizione 15. Sia X un insieme, S un sottoinsieme di X e G una famiglia di sottoinsiemi Gα di X tali che S ⊂ ∪α Gα , tali cioè che ogni punto di S appartiene almeno a un Gα . La famiglia G è detta ricoprire S oppure essere una copertura di S. Se X è uno spazio topologico e tutti i membri di G sono degli aperti, G è detta copertura aperta di S. Definizione 16. Un sottoinsieme S di uno spazio topologico X è detto compatto se da ogni copertura aperta G di S si può estrarre una sottocopertura b cioè un numero finito di elementi ricoprenti S. finita G, Se S = X, allora X è detto spazio compatto. L’insieme vuoto è compatto. Analogamente ogni insieme finito. Un altro esempio di insiemi compatti è dato dal seguente famoso teorema di Heine-Borel: Teorema 7. Consideriamo la retta reale topologizzata nel modo usuale. Allora ogni sottoinsieme chiuso e limitato è compatto. (La dimostrazione è riportata in Appendice.) Osservazione 9. Entrambe le condizioni del teorema di Heine-Borel sono essenziali. Consideriamo infatti i due seguenti esempi. Esempio 36. Consideriamo l’intervallo aperto limitato A = (0, 1). La 1 famiglia G = {Gn = ( n+2 , n1 )} con n = 1, 2, ..., costituisce una copertura aperta di A, cioè A ⊂ ∪∞ n=1 Gn . Non è possibile però estrarre da G alcuna sottocopertura finita di A. In questo caso ovviamente, il responsabile di ciò è il fatto di essere A ”aperto a sinistra”. Esempio 37. Sia A = (1, ∞). G = {(0, 2), (1, 3), (2, 4), ...} è una copertura di A, da cui non è possibile estrarre una sottocopertura finita. In questo caso invece è l’essere l’intervallo infinito che impedisce ad A di essere compatto. 34 Teorema 8. Ogni sottoinsieme chiuso di uno spazio compatto è compatto. Dimostrazione. Sia X uno spazio compatto, S un sottoinsieme chiuso di X e GS una copertura aperta di S. Consideriamo ora G 0 = GS ∪ C(S), cioè la famiglia ottenuta dall’unione di tutti gli elementi di GS (aperti) con l’aperto C(S). G 0 è una copertura aperta di X. Dato infatti x ∈ X, se x ∈ S allora esiste GS ∈ GS tale che x ∈ GS , mentre se x ∈ / S, allora x ∈ C(S). Usiamo pertanto una notazione omogenea ponendo GX = G 0 = GS ∪ C(S). Per ipotesi X è compatto, per cui esiste una sottofamiglia finita GbX ⊂ GX che ricopre X. Evidentemente GbX ⊂ GbS ∪ C(S), essendo GbS ⊂ GS una sottofamiglia finita di GS . Mostriamo ora b X ∈ GbX che GbS è una copertura di S. Infatti, se x ∈ S ⊂ X, esiste almeno un G bX = G b S ∪ C(S), essendo G b S ∈ GbS . Quindi x ∈ G b S . Dunque, tale che x ∈ G da una copertura aperta GbS del chiuso S ⊂ X (compatto), abbiamo estratto un sottocopertura finita GbS , ed S è compatto. Teorema 9. Una funzione continua f da X in Y trasforma insiemi compatti in insiemi compatti. Dimostrazione. Sia S ⊂ X un sottoinsieme compatto e GT una copertura aperta di T = f (S) ⊂ Y . Se GT è un aperto di GT , allora f −1 (GT ) è un aperto in X, per definizione di funzione continua. L’insieme di tutti gli aperti f −1 (GT ) per tutti i GT ∈ GT , costituisce una copertura di S, cioè GS = {f −1 (GT ) : GT ∈ GT }. Essendo S un insieme compatto, da GS si può estrarre una sottocopertura finita b T )}. Quindi GbT = {G b T } rappresenta una sottocopertura finita di T . GbS = {f −1 (G Dunque, T = f (S) è compatto ogni volta che S è compatto. CVD. Teorema 10. Detto S un sottoinsieme compatto di uno spazio topologico X, ogni sottoinsieme infinito di S ha un punto di accumulazione in S. Dimostrazione. Sia T un sottoinsieme infinito di S e supponiamo che non abbia punti di accumulazione in S. Per ogni x ∈ S esiste allora un intorno Ix di x che non contiene punti di T , escluso eventualmente x se x ∈ T . La famiglia di tutti gli Ix è una copertura aperta di S, ed essendo S compatto se ne può estrarre una sottocopertura finita I1 , I2 , ..., IN . Vale allora: T ⊂ S ⊂ ∪N i=1 Ii e poichè ogni Ii contiene al più un elemento di T , questo sarebbe finito, in contrasto con l’ipotesi. 35 Osservazione 10. Il teorema di Bolzano-Weierstrass, vedi l’esempio 22, non è altro che un caso particolare del precedente teorema per X = R con la topologia usuale. In questo spazio topologico infatti, ogni intevallo chiuso e limitato è compatto, grazie al teorema 7 di Heine-Borel. 5. SUCCESSIONI CONVERGENTI Consideriamo una successione {xn } = {x1 , x2 , x3 , ...} di elementi di uno spazio topologico X: Definizione 17. Diciamo che {xn } è una successione convergente, oppure che converge all’elemento x ∈ X e indichiamo questo fatto con xn → x, oppure con limn→∞ xn = x se, dato un intorno Ix di x, esiste un intero n̄ tale che per ogni n > n̄, xn ∈ Ix . Ogni intorno di x contiene perciò tutti gli elementi della successione da un certo indice in poi. Esempio 38. Sia X uno spazio dotato della topologia grossa. Allora una qualsiasi successione {xn } di elementi di X converge a un qualsiasi elemento x ∈ X. Infatti, l’unico intorno di x è X il quale contiene tutti gli xn . Esempio 39. Sia X uno spazio dotato della topologia discreta, e sia {xn } una successione in X. Dato un punto qualsiasi x ∈ X esiste l’intorno x costituito dal singolo punto x. Quindi, affinchè xn → x, tutti gli elementi della successione {xn }, da un certo indice in poi, devono essere uguali a x, cioè {xn } = {x1 , x2 , ..., x, x..., x, ...}. Osservazione 11. Il concetto di successione convergente ci permette di evidenziare una peculiarità degli spazi topologici (rispetto agli spazi ove questo concetto ci è più familiare) relativa all’unicità del limite di successioni convergenti. Come è noto, la retta R usuale dell’analisi gode di tale proprietà, che è in realtà una caratteristica generale degli spazi metrici. Negli spazi topologici invece, tale proprietà dipende dalla topologia, come mostrato dagli esempi 38 e 39. L’unicità del limite dipende peraltro dalla più generale capacità di una topologia di distinguere tra punti differenti, e cosa questo voglia dire da un punto di vista topologico è l’argomento del prossimo paragrafo. 36 Notiamo che questa proprietà è rilevante non solo per i limiti di successioni convergenti, ma per tutte le caratteristiche puntuali di uno spazio topologico. Ad esempio, anche nel caso dei punti di accumulazione lo spazio topologico ha caratteristiche diverse a seconda della topologia ivi definita (vedi esempi 19 e 20). 6. ASSIOMI DI SEPARAZIONE Definizione 18. Si dice spazio topologico T1 uno spazio topologico X tale che se x1 , x2 ∈ X e x1 6= x2 , esiste un intorno I1 di x1 che non contiene x2 , e viceversa. Una definizione del tutto equivalente è la seguente: Definizione 18’. Si dice spazio topologico T1 uno spazio topologico X tale che ogni sottoinsieme costituito da un singolo punto è un insieme chiuso. (Inoltre l’unione di un numero finito di chiusi è un chiuso e pertanto si ha uno spazio T1 se e solo se i sottoinsiemi finiti sono chiusi.) Infatti, dati x1 6= x2 se esiste un intorno I1 tale che x1 ∈ I1 e x2 ∈ / I1 , il complementare C(x2 ) contiene solo punti interni e quindi è aperto e x2 è chiuso. Viceversa, se ogni sottoinsieme costituito da un singolo elemento x2 è chiuso, allora C(x2 ) è un aperto e contiene solo punti interni, per cui dato x1 ∈ C(x2 ), esiste un intorno I1 di x1 tale che x1 ∈ I1 ⊂ C(x2 ), e pertanto x2 ∈ / I1 . Definizione 19. Si dice spazio topologico T2 o spazio di Hausdorff uno spazio topologico X in cui se x1 , x2 ∈ X e x1 6= x2 , esistono due intorni disgiunti di x1 e x2 , cioè x1 ∈ I1 e x2 ∈ I2 con I1 ∩ I2 = 6 O. Osservazione 12. Uno spazio topologico T2 è chiaramente anche T1 . Osservazione 13. Se in uno spazio topologico i sottoinsiemi costituiti da un singolo punto sono degli aperti, allora lo spazio topologico è evidentemente T2 . Notare che questa è una condizione solo sufficiente. Esempio 40. La topologia discreta conferisce a uno spazio la struttura di spazio topologico T2 . Infatti i sottoinsiemi costituiti da un singolo punto sono degli aperti. Essendo T2 , è anche T1 e infatti i singoli punti oltre che aperti sono anche chiusi. 37 Esempio 41. Uno spazio X contenente almeno due punti e topologizzato con la topologia grossa non è uno spazio T1 . Il singolo punto infatti non è nè aperto nè chiuso. Esempio 42. La retta reale topologizzata con la topologia usuale (esempio 10) è uno spazio T2 . Infatti, se x1 , x2 ∈ R e x1 6= x2 , allora |x1 − x2 | = h > 0 e, scelto s < h/2, i due intorni I1s = {x : |x − x1 | < s} e I2s = {x : |x − x2 | < s} sono tali per cui x1 ∈ I1s , x2 ∈ I2s e I1s ∩ I2s = 6 O. Esempio 43. Il piano R2 e gli aperti An = n p {x, y} : x2 + y 2 < 1 n o ,n= 1, 2, 3, ... (esempio 7) non costituiscono uno spazio T1 . Infatti, tutti i punti non interni alla circonferenza di raggio 1 sono contenuti nell’unico aperto X. n o Esempio 44. X = {a, b, c, d, e}, F1 = X, 6 O, {a}, {c, d}, {a, c, d}, {b, c, d, e} (esempio 3). Questo spazio topologico non è T2 : l’insieme {b} infatti non è un chiuso. Esempio 45. Sia X un insieme infinito dotato di una topologia i cui aperti sono costituiti dai sottoinsiemi che hanno complemento finito (vedi l’esempio 4). Questo è uno spazio topologico T1 : ogni sottoinsieme finito è infatti un chiuso. La topologia è detta topologia T1 perchè è la più semplice struttura che porta a un T1 . Non definisce però uno spazio T2 . Infatti, dati x1 , x2 ∈ X con x1 6= x2 e due intorni I1 e I2 di x1 e x2 , saranno I1 e I2 costituiti da tutto X privato di n1 e n2 punti rispettivamente, e I1 ∩ I2 sarà tutto X privato al più di n1 + n2 punti. Questo insieme non è vuoto essendo X per ipotesi infinito. Gli spazi topologici T2 godono delle due seguenti importanti proprietà: Teorema 11. In uno spazio X di Hausdorff (T2 ) ogni successione convergente ha un unico limite. Dimostrazione. Sia {xn } una successione di elementi xn ∈ X convergente a due elementi x e y con x 6= y. Essendo X di Hausdorff esistono due intorni Ix e Iy con x ∈ Ix , y ∈ Iy e Ix ∩ Iy = 6 O. Ma xn → x per cui esiste n̄ tale che per n > n̄ xn ∈ Ix . Essendo Ix ∩ Iy = 6 O, l’intorno Iy contiene al più gli elementi x1 , x2 , ..., xn̄ e pertanto {xn } non può convergere a y. 38 Affinchè valga il teorema inverso, occorre fare la ulteriore ipotesi che lo spazio soddisfi il primo assioma di numerabilità, che tratteremo in seguito. Osservazione 14. Il teorema 11 e gli esempi 38 e 39 chiarificano perchè le successioni convergenti nella topologia grossa e nella topologia discreta non hanno e hanno, rispettivamente limite unico (vedi anche l’oss. 11). e disgiunti e compatti in uno spazio di Teorema 12. Dati due insiemi C e C f di C e C e rispettivamente. Hausdorff, esistono intorni disgiunti W e W Dimostrazione. Sia C costituito da un solo punto x (insiemi finiti sono come esistono due intorni disgiunti I di x e Ie di x̃. La famiglia patti). Per ogni x̃ ∈ C e ed essendo C e compatto esiste una di tutti gli Ie costituisce un ricoprimento di C e Siano I1 , I2 , ..., In i corrispondenti intorni sottofamiglia Ie1 , Ie2 , ..., Ien che ricopre C. f = Ie1 ∪ Ie2 ∪ ... ∪ Ien . W e W f sono i di x e consideriamo W = I1 ∩ I2 ∩ ... ∩ In e W due intorni cercati in questo caso particolare. Sia ora C un compatto generico. Da quanto ora provato, per ogni x ∈ C esistono e La famiglia di tutti gli I ricopre C ed essendo due intorni disgiunti I e Ie di x e C. C compatto esiste una sottocopertura finita I1 , I2 , ..., In di C. Siano Ie1 , Ie2 , ..., Ien i e e consideriamo W = I1 ∪I2 ∪...∪In e W f = Ie1 ∩Ie2 ∩...∩Ien . corrispondenti intorni di C f sono i due intorni disgiunti di C e C. e Come prima, W e W Teorema 13. Un sottoinsieme compatto di uno spazio di Hausdorff è chiuso. Dimostrazione. Sia C un insieme compatto e sia x ∈ C ma x ∈ / C. Essendo l’insieme costituito dal singolo punto x un compatto, per il teorema 12 esiste un intorno di x che non contiene punti di C. Ma allora x ∈ / C, contrariamente all’ipotesi. Quindi x ∈ C e C ⊂ C e cioè C = C, per cui C è chiuso. E’ possibile introdurre ulteriori distinzioni tra spazi topologici utilizzando altre proprietà di separazione, ma noi ci limitiamo alle due grandi classi T1 e T2 . Osservazione 15. Oltre all’unicità del limite di successioni convergenti, esiste un’altra importante differenza tra topologie generali e quella usuale sulla retta R. E’ un risultato classico dell’analisi il fatto che un punto x è punto di accumulazione per un sottoinsieme S ⊂ R se e solo se esiste una successione {xn } 39 di elementi distinti di S convergente a x. Dimostreremo nel prossimo paragrafo (teorema 16) che ciò dipende da una caratteristica di numerabilità della topologia, comune a tutte le topologie metriche e quindi anche a quella usuale della retta R. In uno spazio topologico invece, è sempre vero che il limite x di una successione di elementi distinti di S è punto di accumulazione per S: ogni intorno Ix di x contiene infatti almeno un punto di S distinto da x (contiene in realtà tutti gli elementi della successione da un indice in poi). Non è necessariamente vero il contrario, in quanto è possibile che un punto x sia di accumulazione per un sottoinsieme S senza che esista alcuna successione in S convergente a x. Il prossimo esempio illustra come ciò sia possibile. Esempio 46. Sia X = l’intervallo chiuso [0, 1] e consideriamo la famiglia F comprendente il vuoto e tutti i sottoinsiemi ottenuti eliminando dall’intervallo [0, 1] un numero finito o numerabile di punti. F è una topologia. Basta infatti considerare la topologia T1 dell’esempio 4, costituita dagli elementi a complementare finito, e in quella verifica degli assiomi sostituire finito con numerabile. In questo spazio sono convergenti solo le successioni stazionarie, quelle cioè i cui elementi da un certo indice in poi sono uguali tra di loro: xn̄ = xn̄+1 = xn̄+2 = .... Infatti, esistono intorni di x privi di tutti gli elementi xn 6= x, e affinchè la successione sia convergente anche tali intorni devono contenere tutti gli elementi della successione da un indice in poi, che pertanto devono essere tutti uguali a x. Consideriamo ora il sottoinsieme S = (0, 1] ⊂ X aperto a sinistra. Ogni intorno di 0 contiene sicuramente almeno un altro punto di X e pertanto di S (in realtà una infinità non numerabile) e quindi 0 è punto di accumulazione per S. D’altra parte, nessuna successione in S può convergere a 0 visto che non lo contiene. 7. NUMERABILITA’ Definizione 20. Uno spazio topologico è detto soddisfare il primo assioma di numerabilità se in ogni punto ha una base numerabile. Teorema 14. Se B = {Bn }, n = 1, 2, ..., è una base numerabile in x, esiste una catena numerabile di intorni costituenti una base in x, una base cioè definita 40 en : B e1 ⊃ B e2 ⊃ B e3 ⊃ ...}. da: Be = {B en } definiti da: Dimostrazione. Consideriamo la successione di intorni {B e1 = B1 , B e2 = B1 ∩ B2 , ..., B en = B1 ∩ B2 ∩ ... ∩ Bn , .... Evidentemente B e1 ⊃ B e2 ⊃ B e3 ...; inoltre ciascun B en contiene x e, dato un intorno Ix di x, esiste B en̄ ⊂ Bn̄ ⊂ Ix . Quindi, Be è una base in x costituita da una catena n̄ tale che x ∈ B di aperti. Osservazione 16. Se X è uno spazio soddisfacente il primo assioma di numerabilità, dal teorema 14 segue che in ogni punto x ∈ X esiste una base numerabile di aperti in catena. Definizione 21. Uno spazio topologico è detto soddisfare il secondo assioma di numerabilità se possiede una base numerabile. Un tale spazio è detto anche perfettamente separabile. Osservazione 17. Una base che soddisfa il secondo assioma di numerabilità, soddisfa anche il primo. Una base in un punto è infatti un sottoinsieme di una base per l’intero spazio e un sottoinsieme di un insieme numerabile è numerabile. Esempio 47. Sia X dotato della topologia discreta. In ogni punto x, una base è data dal sottoinsieme x costituito dal singolo elemento x (vedi l’esempio 26). Questo spazio soddisfa quindi il primo assioma di numerabilità. Esempio 48. Sia X un insieme non numerabile (ad esempio la retta reale R) dotato della topologia discreta. Ogni base contiene la base costituita dai singoli elementi (vedi l’esempio 26) e quindi non è numerabile. Questo spazio non è perfettamente separabile. I prossimi due teoremi riguardano due importanti conseguenze del primo assioma di numerabilità sulle successioni convergenti. Il primo rappresenta una sorta di teorema inverso del teorema 11, ove era stato dimostrato che in uno spazio di Hausdorff ogni successione convergente ha limite unico. Il secondo stabilisce la preannunciata connessione tra punti di accumulazione e successioni convergenti. 41 Teorema 15. Sia X uno spazio topologico soddisfacente il primo assioma di numerabilità. Allora, se ogni successione convergente ha limite unico, X è uno spazio di Hausdorff. Dimostrazione. Supponiamo che X non sia di Hausdorff. Allora, esistono b, c ∈ X con b 6= c tali che ogni coppia di intorni Ib e Ic di b e di c hanno intersezione non nulla. Poichè X soddisfa il primo assioma di numerabilità , per il teorema 14 esistono due basi numerabili B = {Bn : B1 ⊃ B2 ⊃ B3 ⊃ ...} e C = {Cn : C1 ⊃ C2 ⊃ C3 ⊃ ...} di b e c rispettivamente, tali che, per ipotesi, Bn ∩ Cn 6= 6 O, ∀n. Consideriamo allora la successione {dn : dn ∈ Bn ∩ Cn }. Essendo B1 ∩ C1 ⊃ B2 ∩ C2 ⊃ B3 ∩ C3 ⊃ ..., la successione {dn } è convergente a b e c contemporaneamente, contro l’ipotesi del teorema. Lo spazio X deve essere quindi di Hausdorff. Teorema 16. In uno spazio topologico X soddisfacente il primo assioma di numerabilità, se un punto x è di accumulazione per un sottoinsieme S ⊂ X, allora esiste una successione {xn } di punti distinti di S convergente a x. en } la base Dimostrazione. Sia x punto di accumulazione per S, e sia {B ek contiene almeno numerabile in catena nel punto x (vedi l’osservazione 16). Ogni B un punto xk ∈ S distinto da x, ed è immediato mostrare che la successione {xk } tende a x. Osservazione 18. La condizione necessaria del precedente teorema era stata rilevata nell’osservazione 15 per un arbitrario spazio topologico. Pertanto, in uno spazio topologico soddisfacente il primo assioma di numerabilità, x è punto di accumulazione per un sottoinsieme S ⊂ X se e solo se esiste una successione {xn } di elementi distinti di S convergente a x. D’altra parte un insieme S è chiuso se e solo se contiene tutti i suoi punti di accumulazione (teorema 2). Dunque, in uno spazio topologico soddisfacente il primo assioma di numerabilità un insieme S è chiuso se e solo se contiene tutti i punti limiti di successioni convergenti {xn } formate da elementi distinti di S. Definizione 22. Uno spazio topologico X è detto separabile se contiene un sottoinsieme numerabile e denso in X. 42 Teorema 17. Se X è uno spazio topologico perfettamente separabile, allora è anche separabile. Dimostrazione. Sia B una base numerabile in X e sia S l’insieme ottenuto scegliendo un elemento da ogni membro della base. S è numerabile e inoltre S = X. Se cosı̀ non fosse C(S) sarebbe un aperto non vuoto e pertanto, dato x ∈ C(S) e un intorno di x contenuto in C(S), cioè x ∈ Ix ⊂ C(S), deve esistere un elemento della base B ∈ B tale che x ∈ B ⊂ Ix ⊂ C(S). Ma allora S e a maggior ragione S non conterrebbe punti di B, contrariamente all’ipotesi. Come vedremo, negli spazi metrici è vero anche che uno spazio separabile è perfettamente separabile. Esempio 49. X = R con la topologia usuale è perfettamente separabile, poichè contiene l’insieme dei razionali Q che è numerabile e denso in R, cioè Q = R. Esempio 50. Come avevamo già sottolineato, la topologia usuale sulla retta reale R è derivata da una struttura preesistente alla topologia, è derivata cioè dalla distanza |x1 − x2 | tra due punti. Come vedremo, questa distanza definisce uno spazio metrico e quindi, da quanto detto dopo il teorema 17, la retta reale è anche perfettamente separabile. La base numerabile è costituita dai segmenti aperti di semiampiezza razionale centrati nei razionali. Che questa sia effettivamente una base lo mostreremo in un caso più generale per gli spazi metrici. Esempio 51. Sia X un insieme non numerabile (ad esempio la retta R) dotato della topologia discreta. Ogni sottoinsieme S ⊂ X è sia aperto che chiuso per cui l’unico sottoinsieme denso in X è X stesso, per ipotesi non numerabile. Dunque, X non è separabile. 43 8. SPAZI LINEARI TOPOLOGICI In quest’ultimo paragrafo sulle topologie, introduciamo la vasta classe degli spazi lineari topologici. Appartengono a essa come casi particolari gli spazi normati, gli spazi numerabilmente normati e l’insieme dei funzionali lineari limitati su spazi lineari topologici. Tutte strutture che esamineremo in dettaglio in seguito. Vedremo in particolare che i funzionali lineari limitati non sono in genere strutturabili in altro modo che quali appunto spazi lineari topologici. In questo paragrafo ci limiteremo a considerare alcune caratteristiche principali e a dare qualche semplice esempio tratto da strutture già esaminate. Definizione 23. Un insieme X si dice spazio lineare topologico se sono soddisfatte le seguenti condizioni: i) X è uno spazio lineare sui numeri reali o complessi; ii) X è uno spazio topologico; iii) le operazioni di somma e di moltiplicazione per numeri sono continue rispetto alla topologia di X. Diamo anzitutto qualche semplice definizione: Definizione 23. L’insieme degli elementi x + y per tutti gli y ∈ U si dice insieme traslato dell’insieme U secondo l’elemento x, e si indica con x + U . Gli insiemi degli elementi x + y e x − y per tutti gli x ∈ U e y ∈ V si dicono rispettivamente somma e differenza aritmetica di U e V , e si indicano con U + V e U − V . L’insieme degli elementi αx per tutti gli x ∈ U si dice dilatazione di U secondo il numero α. Notiamo che U + U 6= 2U . Inoltre, non confondere l’elemento zero, elemento neutro della somma, con l’insieme vuoto. Osservazione 19. I primi due assiomi sono già stati trattati nei precedenti capitoli. Consideriamo in dettaglio l’assioma iii), osservando preliminarmente che la funzione f (x) = αx + y è continua, e per α 6= 0 anche la funzione inversa è continua, e pertanto (vedi il paragrafo 3) f trasforma aperti in aperti e chiusi in chiusi. Vale anche f (V ) = f (V ). iii.a) Continuità della somma e sottrazione. Cioè , dato x±y = z e un intorno 44 qualsiasi Iz di z, esistono un intorno Ix di x e un intorno Iy di y, tali che se x0 ∈ Ix e y 0 ∈ Iy , allora x0 ± y 0 ∈ Iz , ovvero, sinteticamente, Ix ± Iy ⊂ Iz . iii.b) Continuità del prodotto per un numero. Ovvero, se αx = y, allora per ogni intorno Iy di y esiste un intorno Ix di x e un numero > 0 tali che, da x0 ∈ Ix e |α0 − α| < segue α0 x0 ∈ Iy . Vediamone ora alcune conseguenze. a1 ) L’insieme di tutti i traslati di tutti gli intorni dello zero definiscono un sistema di aperti in X che è equivalente alla topologia originaria. Abbiamo già osservato che i traslati di aperti sono degli aperti. Vediamo ora che questo sistema di aperti è equivalente alla topologia originaria. Sia dato l’aperto V = x̄ + U0 , essendo U0 un intorno dello zero e sia x ∈ V . Mostriamo che esiste nella topologia originaria un intorno W1 di x tale che W1 ⊂ V . Poichè x ∈ V , allora x − x̄ ∈ U0 e quindi, per l’assioma iii.a, esistono due intorni W1 di x e W2 di x̄ tali che W1 − W2 ⊂ U0 . In particolare, dato che x̄ ∈ W2 , abbiamo W1 − x̄ ⊂ U0 , ovvero x ∈ W1 ⊂ x̄ + U0 = V , che è quanto volevamo. Viceversa, sia V un intorno del punto x̄ e mostriamo che esiste un intorno dello zero U0 tale che x̄ ∈ x̄ + U0 ⊂ V . Poichè x̄ + 0 = x̄, per l’assioma iii.a), possiamo trovare un intorno W di x̄ e un intorno U0 di 0 tali che W + U0 ⊂ V . Poichè x̄ ∈ W , otteniamo infine x̄ ∈ x̄ + U0 ⊂ V , CVD. a2 ) La topologia in X può essere ricostruita o direttamente definita a partire dal sistema di intorni dello zero. Da quanto visto prima, è sufficiente traslare tutti questi intorni in tutti i modi possibili. Questo vuol dire che lo spazio ha le stesse proprietà topologiche locali in ogni punto. Ad esempio, se il primo assioma di numerabilità è soddisfatto in un punto, allora è soddisfatto ovunque. Anche una base può essere traslata, per cui data la base in zero B0 , la famiglia degli insiemi x + B per tutti i B ∈ B0 è una base in x. a3 ) Uno spazio lineare topologico è sempre regolare, ovvero, per ogni x e ogni intorno U di x esiste un intorno V di x contenuto in U insieme alla sua chiusura, cioè x ∈ V ⊂ U . Data l’omogeneità dello spazio lineare topologico in ogni punto, è sufficiente mostrare questa proprietà in x = 0. Possiamo quindi scegliere due 45 intorni V1 e V2 dello zero soddisfacenti a V1 − V2 ⊂ U per continuità della sottrazione, e inoltre scegliere un terzo intorno V di zero contenuto nell’intersezione U ∩ V1 ∩ V2 , per il quale vale ovviamente V − V ⊂ U . Mostriamo che la chiusura V di V è completamente contenuta in U . Sia infatti x̄ un punto di accumulazione per V . Allora, l’intorno W = x̄ + V del punto x̄ contiene qualche punto di V e cosı̀ W ∩ V 6= 6 O. Sia y ∈ W ∩ V che, essendo y ∈ W sarà del tipo y = x̄ + z con z ∈ V . Allora, essendo y ∈ V , sarà x̄ = y − z ∈ V − V ⊂ U , come visto prima. Essendo anche V ⊂ U , l’asserto è dimostrato. a4 ) Se uno spazio lineare topologico è T1 , esso è anche T2 . Infatti, essendo di tipo T1 , dati x1 6= x2 , esiste un intorno I1 di x1 che non contiene x2 (vedi paragrafo 6). Essendo regolare (vedi sopra), esiste un altro intorno V1 di x1 tale che x1 ∈ V 1 ⊂ I1 . Il complementare di V 1 è aperto e contiene x2 e un suo intorno V2 . Evidentemente V1 ∩ V2 = 6 O, e dunque lo spazio è T2 . Tutte queste proprietà sono familiari caratteristiche topologiche dei più accessibili spazi normati che vedremo in seguito, e il cui prototipo come al solito è costituito dalla retta usuale. Esempio 52. La retta reale R con l’usuale topologia dell’esempio 10 è uno spazio lineare topologico. Infatti, fissato l’intorno Izh0 definito da |z0 − z| < h, h/2 h/2 poichè |(x0 ± y0 ) − (x ± y)| ≤ |x0 − x| + |y0 − y|, i due intorni Ix0 e Iy0 soddisfano la condizione iii.a). Inoltre, fissato l’intorno Iz0 di z0 = α0 x0 , poichè vale |α0 x0 − αx| ≤ |α0 − α||x0 | + |x0 − x||α|, scelti = h/(2|x0 |) e k = h/2(|α0 | + ), per |α0 − α| < e x ∈ Ixk0 , si ottiene |α0 x0 − αx| < h e cioè αx ∈ Izh0 , verificando cosı̀ la iii.b). Analogamente, gli spazi RN con la usuale topologia dell’esempio 11 sono spazi lineari topologici. Esempio 53. Lo spazio topologico dell’esempio 9, cioè il cerchio n o p X = {x, y} : x2 + y 2 ≤ 2, con ordinari somma e prodotto non è uno spazio lineare e quindi neppure uno spazio lineare topologico. Esempio 54. Il piano R2 dell’esempio 7, con la topologia F = {X, 6 O, An }, 46 n p con An = {x, y}} : x2 + y 2 < 1 n o , n = 1, 2, ... è uno spazio lineare, ma non è lineare topologico, dato che non esistono aperti traslati. Esplicitamente, controlliamo che non soddisfa la iii.a). Siano ad esempio x0 = {2, 2} e y0 = {−2, −2}; allora, come intorno arbitrario di z0 = x0 + y0 = {0, 0} può essere assunto uno qualsiasi degli An mentre l’unico intorno sia di x0 che di y0 è costituito dall’intero piano R2 ed ovviamente R2 + R2 6⊂ An . Introduciamo ora alcune definizioni che risulteranno utili in seguito. Definizione 24. Due spazi lineari topologici X e Y sono detti topologicamente isomorfi, o linearmente omeomorfi, se esiste un operatore lineare T che definisce una corrispondenza omeomorfica tra X e Y (vedi la definizione 14). Definizione 25. Un sottoinsieme S di uno spazio lineare topologico X si dice equilibrato o bilanciato se ES = ∪α (αS) ⊂ S, essendo E l’insieme dei numeri α con |α| ≤ 1. Notare che se l’insieme T non è vuoto, allora ET è equilibrato. Definizione 26. Un sottoinsieme S di uno spazio lineare topologico X è detto assorbente se, per ogni x ∈ X, esiste > 0 tale che αx ∈ S per 0 < |α| ≤ . Definizione 27. Un sottoinsieme S di uno spazio lineare topologico X è detto insieme limitato se può essere assorbito da un qualsiasi intorno dello zero U0 , ovvero se per ogni intorno U0 dello zero esiste α > 0 tale che αS ⊂ U0 . Definizione 28. Uno spazio lineare topologico è detto localmente limitato se in esso esiste almeno un insieme aperto limitato (non vuoto). L’esempio 52 rientra in questa classe grazie ai segmenti aperti |z0 − z| < h. Il prossimo invece riguarda uno spazio lineare topologico non localmente limitato. Esempio 55. Sia R∞ lo spazio lineare di tutte le successioni possibili x = {x1 , x2 , ...., xn , ...}. Sia U (k1 , k2 , ..., km ; ) il sistema di intorni dello zero individuati dalle m − uple di interi {ki } e da > 0, e costituiti da tutti i punti x ∈ R∞ tali che |xki | < per i = 1, 2..., r. E’ facile mostrare che questi intorni definiscono R∞ quale spazio lineare topologico. E’ altrettanto semplice dimostrare che non è localmente limitato. 47 Introduciamo infine una classe più ristretta di spazi lineari topologici che, pur mantenendo una sufficiente generalità, risultano più vicini agli esempi familiari visti in precedenza; vedremo in seguito che condividono con gli spazi normati una delle caratteristiche salienti di questi. Premettiamo una definizione legata solo alla linearità dello spazio e qui introdotta perchè particolarmente utile nell’ambito degli spazi lineari topologici. Definizione 29. Un insieme A in uno spazio lineare X è detto convesso se, dati due suoi elementi x1 , x2 ∈ A, esso contiene anche tutto il ”segmento” compreso fra entrambi, cioè αx1 + βx2 ∈ A, con α, β ≥ 0 e α + β = 1. Definizione 30. Uno spazio lineare topologico è detto localmente convesso se ogni suo insieme aperto (non vuoto) contiene un sottoinsieme aperto convesso (non vuoto). Osservazione 20. Se lo spazio lineare topologico X è localmente convesso, per ogni x ∈ X e ogni suo intorno Ux esiste un intorno convesso Vx tale che x ∈ Vx ⊂ Ux . E’ sufficiente mostrare la validità di tale affermazione per x = 0. Dato allora U0 , per la continuità della somma esiste V0 tale che V0 − V0 ⊂ U0 . Poichè X è localmente convesso, esiste un aperto convesso non vuoto V00 ⊂ V0 , e sia y ∈ V00 ; allora V00 − y è un intorno convesso dello zero contenuto in U0 . APPENDICE. Riportiamo in questa appendice alcuni classici risultati sulla topologia usuale della retta R (esempio 10). Teorema A sulle proprietà di inclusione degli intervalli chiusi e limitati. Sia {Ii : Ii = [ai , bi ], I1 ⊃ I2 ⊃ ... ⊃ In ⊃ ...} una successione di intervalli chiusi e limitati, ciascuno contenuto nel precedente. Allora esiste almeno un punto comune a ogni intervallo, cioè ∩∞ n=1 Ii 6= 6 O. Dimostrazione. La catena I1 ⊃ I2 ⊃ ... ⊃ In ⊃ ... implica ovviamente a1 ≤ a2 ≤ ... ≤ an ≤ ... ≤ bn ≤ ... ≤ b2 ≤ b1 . Allora ciascun b è un limite superiore 48 per l’insieme {ai } che ammette pertanto estremo superiore x = sup(ai ). * Ma x ≤ bn ∀n, dato che bn è un limite superiore per l’insieme {ai }, e x è il minimo dei limiti superiori di {ai }. Inoltre an ≤ x ∀n, per cui an ≤ x ≤ bn ∀n, cioè x ∈ In = [an , bn ] ∀n, cioè appartiene a ogni intervallo In e dunque ∩∞ i=1 Ii 6= 6 O. Osservazione. Nella proprietà prima enunciata, è fondamentale l’ipotesi di limitatezza e chiusura degli intervalli. Infatti: Esempio A. Sia {Si : Si = (0, 1i ]}, i = 1, 2, ... una successione di intervalli limitati aperti a sinistra e chiusi a destra. Vale evidentemente la catena di contenimento S1 ⊃ S2 ⊃ ... ⊃ Sn ⊃ ..., ma altrettanto evidentemente ∩∞ i=1 Si = 6 O. Esempio B. Sia {Si : Si = [i, ∞)}, i = 1, 2, ... una successione di intervalli chiusi non limitati. Vale S1 ⊃ S2 ⊃ ... ⊃ Sn ⊃ ..., ma ∩∞ i=1 Si = 6 O. Teorema B di Bolzano Weierstrass. Sulla retta reale R con la topologia usuale, ogni insieme infinito limitato S ha almeno un punto di accumulazione. Dimostrazione. S è un sottoinsieme di un intervallo chiuso I1 = [a1 , b1 ]. Dividiamo I1 nei due subintervalli [a1 , 12 (a1 +b1 )] e [ 12 (a1 +b1 ), b1 ], e sia I2 = [a2 , b2 ] quello dei due che contiene infiniti elementi di S. Dividiamo ancora a metà I2 e sia I3 = [a3 , b3 ] la parte che contiene infiniti elementi di S. Continuando il procedimento indicato, otteniamo una successione di intervalli chiusi e limitati contenuti ciascuno nel precedente: I1 ⊃ I2 ⊃ ... ⊃ In ⊃ .... Per il teorema A, esiste un punto x comune a tutti gli intervalli In . Mostriamo che x è punto di accumulazione per S. Sia infatti Ix = (a, b) un intervallo aperto contenente x. Poichè |In | → 0 (|In | = bn − an è la lunghezza dell’intervallo), esiste n̄ tale che |In̄ | < min(x − a, b − x) e pertanto In̄ ⊂ Ix . Ma In̄ contiene infiniti elementi di S per costruzione e cosı̀ anche l’intorno arbitrario Ix di x, che contiene perciò altri punti di S oltre a x. * Per un noto assioma dei numeri reali, se esiste un limite superiore di un insieme S di reali, allora esiste anche l’estremo superiore o sup S, ovvero il più piccolo dei limiti superiori. Notare che l’assioma afferma che il sup S esiste, non che appartiene necessariamente a S. Questo avviene se S è chiuso, dato che sup S è evidentemente un punto di accumulazione per S. 49 Teorema C di Heine-Borel. Sulla retta reale R con la topologia usuale, ogni insieme chiuso e limitato è compatto (e viceversa). Dimostrazione. Sia dato l’intervallo chiuso e limitato I1 = [c1 , d1 ] e sia G = {Ai = (ai , bi )} una sua copertura aperta. Supponiamo per assurdo che I1 non sia compatto, cioè che da G non sia possibile estrarre una sottocopertura finita. Dividiamo I1 in due intervalli chiusi [c1 , 12 (c1 + d1 )] e [ 12 (c1 + d1 ), d1 ], uno almeno dei quali non ha sottocoperture finite per ipotesi e che indichiamo con I2 . Dividiamo I2 in due intervalli e diciamo I3 quello dei due (almeno uno esiste) che non ha sottocoperture finite. Ripetiamo l’operazione su I3 e cosı̀ via, ottenendo una successione infinita di intervalli chiusi e limitati I1 ⊃ I2 ⊃ ... ⊃ In ⊃ ... nessuno dei quali ha una sottocopertura finita. Per il teorema A, vale ∩∞ i=1 Ii = 6 O, per cui esiste almeno un punto x contenuto in tutti gli intervalli Ii e in particolare x ∈ I1 . Poichè G è una copertura di I1 , esiste in G un aperto Ai0 = (ai0 , bi0 ) che contiene x, e quindi ai0 ≤ x ≤ bi0 . Ma |In | → 0, per cui esiste un intero n0 tale che |In0 | < min(x − ai0 , bi0 − x). Allora, In0 ⊂ (ai0 , bi0 ) e sarebbe pertanto ricopribile con il singolo elemento (ai0 , bi0 ) ∈ G, contrariamente alla scelta di In0 . E’ falsa quindi l’ipotesi iniziale secondo la quale sarebbe stato possibile scegliere la successione {Ii } in modo tale che nessun Ii avesse una sottocopertura finita. Abbiamo dimostrato il teorema per un singolo intervallo chiuso e limitato, ma poichè un insieme chiuso è l’unione di un numero finito di intervalli chiusi, anche l’asserto più generale è dimostrato. La condizione necessaria, ovvero che ogni ogni insieme compatto è chiuso e limitato è dimostrata tramite i controesempi 34 e 35. Una dimostrazione diretta di ciò è data nel capitolo sugli spazi metrici. Teorema D di Weierstrass. Una funzione continua x(t) in un insieme chiuso e limitato [a, b] è ivi dotata di estremo superiore e inferiore. Dimostrazione. Per il teorema di Heine-Borel l’insieme chiuso e limitato [a, b] è un insieme compatto. Per il teorema 9, la funzione continua x(t) trasforma compatti in compatti e quindi il trasformato di [a, b] secondo x(t) è chiuso e limitato. Esso è dunque dotato di estremo superiore e inferiore (vedi la nota al teorema A). 50 3. SPAZI METRICI 1. SPAZI METRICI Definizione 1. Sia X un insieme qualsivoglia e indichiamo con {X, X} l’insieme delle coppie ordinate di elementi di X. Una funzione d con dominio {X, X} e codominio nel corpo dei reali si dice metrica o distanza in X se, per qualunque x, y, z ∈ X, soddisfa le seguenti proprietà: I) d(x, y) = d(y, x) II) d(x, z) ≤ d(x, y) + d(y, z) III) d(x, y) = 0 se e solo se x = y. Una proprietà che si deduce dai tre assiomi ponendo in II) z = x è la seguente: IV) 0 ≤ d(x, y). Uno spazio cosı̀ strutturato si dice spazio metrico; d(x, y) è detta distanza tra x e y; la proprietà II) è detta diseguaglianza triangolare. Esempio 1. Sia X = RN , l’insieme delle N-ple ordinate di numeri reali. Dato x ≡ q {ξ1 , ξ2 , ..., ξN } e y ≡ {η1 , η2 , ..., ηN } appartenenti a RN , il numero reale PN N 2 d(x, y) = i=1 (ξi − ηi ) definisce una metrica in R , come è facile verificare. Questa è la distanza usuale sulla retta, sul piano, nello spazio tridimensionale e da questi esempi è tratta la nomenclatura. La proprietà II) nel piano viene solitamente enunciata dicendo che in un triangolo di vertici x,y,z un lato è minore della somma degli altri due. Esempio 2. Sia X ≡ RN e siano x, y ∈ RN come nell’esempio 1. Le due PN funzioni reali d1 (x, y) = maxi=1,N |ξi −ηi | e d2 (x, y) = i=1 |ξi − ηi | definiscono in RN due metriche diverse tra loro e diverse da quella dell’esempio 1. La verifica delle proprietà I) e III) è immediata. Per la II), sia z ≡ {ζ1 , ζ2 , ..., ζN }; poichè |ξi − ζi | = |ξi − ηi + ηi − ζi | ≤ |ξi − ηi | + |ηi − ζi |, allora: maxi=1,N |ξi − ζi | = |ξn̄ − ζn̄ | ≤ |ξn̄ − ηn̄ | + |ηn̄ − ζn̄ | ≤ ≤ maxi=1,N |ξi − ηi | + maxi=1,N |ηi − ζi |; da cui d1 (x, z) ≤ d1 (x, y) + d1 (y, z). Analogamente: 51 d2 (x, z) = PN i=1 |ξi − ζi | ≤ PN i=1 |ξi − ηi | + |ηi − ζi | = d2 (x, y) + d2 (y, z). Esempio 3. Sia X ≡ C[a,b] , lo spazio delle funzioni reali continue di variabile reale t ∈ [a, b]. X è metrico assumendo come distanza tra x(t), y(t) ∈ X : d(x, y) = maxt∈[a,b] |x(t) − y(t)|. Anzitutto, notiamo che questa d(x, y) esiste. Infatti x(t) − y(t) è ancora una funzione continua in un intervallo chiuso e limitato ed è ivi dotata di estremo superiore, per il teorema (2.A.D) di Weierstrass. Le proprietà I) e III) sono immediate. Per la II): |x(t) − z(t)| = |x(t) − y(t) + y(t) − z(t)| ≤ |x(t) − y(t)| + |y(t) − z(t)| e pertanto: maxt∈[a,b] |x(t) − z(t)| ≤ maxt∈[a,b] |x(t) − y(t)| + maxt∈[a,b] |y(t) − z(t)|. Esempio 4. X = C[a,b] diventa uno spazio metrico con la distanza Rb d(x, y) = a |x(t) − y(t)|dt. Per la proprietà triangolare vedi l’esempio 3. qR 2 b x(t) − y(t) dt. Le Esempio 5. X = C[a,b] è metrico con d(x, y) = a proprietà I) e III) sono ovvie. Per la II) si può procedere come segue. Consideriamo la funzione (positiva) del parametro reale λ: 2 Rb Rb Rb Rb 0 ≤ f (λ) = a λx(t) + y(t) dt = λ2 a x(t)2 dt + 2λ a x(t)y(t)dt + a y(t)2 dt. f (λ) è pertanto un trinomio in λ con lo stesso segno del termine di grado massimo. Quindi f (λ) ha radici complesse coniugate e discriminante negativo: R 2 R Rb b b x(t)y(t)dt − a x(t)2 dt · a y(t)2 dt ≤ 0. a Pertanto: 2 Rb Rb Rb Rb x(t) + y(t) dt = a x(t)2 dt + 2 a x(t)y(t)dt + a y(t)2 dt ≤ a qR Rb Rb Rb b 2 ≤ a x(t) dt + 2 a x(t)2 dt · a y(t)2 dt + a y(t)2 dt. Con la sostituzione x(t) → x(t) − y(t) e y(t) → y(t) − z(t), qR qR 2 2 2 2 Rb b b x(t) − z(t) dt ≤ x(t) − y(t) dt + y(t) − z(t) dt a a a ed estraendo la radice quadrata, otteniamo la diseguaglianza triangolare. Esempio 6. Sia X = C ∞ , cioè X ≡ x = {ξ1 , ξ2 , ..., ξn , ...}; |ξm | < Kx ∀m con Kx numero reale positivo dipendente da x, cioè gli insiemi ordinati numerabili 52 di infiniti numeri complessi limitati. Se si assume d(x, y) = supi |ξi − ηi |, lo spazio C ∞ diventa metrico e si indica con l∞ . Esempio 7. Sia X lo spazio delle successioni x ≡ {ξi } di numeri complessi P∞ tali che i=1 |ξi |p < ∞ con p ≥ 1. Questo spazio si indica con lp e diventa uno P∞ p 1/p . spazio metrico definendo la distanza: d(x, y) = i=1 |ξi − ηi | Per mostrare che si tratta effettivamente di una distanza, nel prossimo teorema dimostreremo la diseguaglianza (detta di Minkowski): ∞ X p 1/p |ξi − ηi | ≤ i=1 ∞ X p 1/p |ξi | + i=1 ∞ X |ηi |p 1/p . i=1 Come nell’esempio 5, con la sostituzione x → x − y e y → y − z si ottiene la diseguaglianza triangolare. Nel caso di p = 1, 2 e per spazi N-dimensionali, la diseguaglianza di cui sopra è quella familiare degli RN dell’esempio 1 e della metrica d2 dell’esempio 2. Teorema 1. Per x ∈ lp e y ∈ lq con p > 1, q > 1 e 1/p + 1/q = 1, vale la diseguaglianza di Schwarz-Hölder: ∞ X |ξi ηi | ≤ ∞ X p 1/p |ξi | |ηi |q 1/q . i=1 i=1 i=1 · ∞ X Per x, y ∈ lp con p ≥ 1 vale la diseguaglianza di Minkowski: ∞ X i=1 p 1/p |ξi − ηi | ≤ ∞ X p 1/p |ξi | i=1 + ∞ X |ηi |p 1/p . i=1 Dimostrazione. Per quanto riguarda la prima diseguaglianza, se p e q sono due numeri reali tali che p > 1, q > 1 e 1/p + 1/q = 1, la funzione f (t) = tp /p + t−q /q ha derivata negativa per 0 < t < 1 e positiva per 1 < t, per cui ha minimo in t = 1 e vale f (1) = 1. Si ha cioè 1 ≤ f (t) per 0 < t e, scegliendo t = a1/q b−1/p e ricordando che p/q + 1 = p e q/p + 1 = q, otteniamo ab ≤ ap /p + bq /q per tutti i valori a, b > 0. Pertanto, |ab| ≤ |a||b| ≤ |a|p /p + |b|q /q, per ogni a, b complessi. PN PN Posto allora a = ξk /( i=1 |ξi |p )1/p e b = ηk /( i=1 |ηi |q )1/q , sommando su k da 1 53 a N , e grazie ancora a 1/p + 1/q = 1, otteniamo: N X |ξi ηi | ≤ N X i=1 |ξi |p 1/p N X · i=1 |ηi |q 1/q . i=1 Per ipotesi, esiste il limN →∞ dei due fattori alla destra per cui possiamo passare al limite anche nella somma di sinistra, che è a termini positivi, ottenendo cosı̀ la prima delle due diseguaglianze. La seconda diseguaglianza è vera per p = 1. Per p > 1: N X p |ξi − ηi | ≤ ≤ |ξi − ηi |p−1 |ξi | + |ηi | ≤ i=1 i=1 N X N X q(p−1) 1/q |ξi − ηi | · N X i=1 i=1 p 1/p |ξi | + N X |ηi |p 1/p . i=1 Nell’ultima diseguaglianza abbiamo applicato la diseguaglianza di Schwarz-Hölder ai due addendi separatamente. Dividendo tutto per il primo fattore a destra e tenendo conto che q(p − 1) = p e che p − p/q = 1, otteniamo la diseguaglianza finita di Minkowski. Anche in questo caso possiamo passare al limite per l’ipotesi di convergenza delle due sommatorie di destra, ottenendo cosı̀ la diseguaglianza di Minkowski per gli lp . CVD. Esempio 8. Sia X lo spazio delle successioni x ≡ {ξi } di numeri complessi, senza alcuna ipotesi su di questi. Una distanza in questo spazio è data dalla seguente funzione reale: d(x, y) = ∞ X 1 |ξi − ηi | · . i (1 + |ξ − η |) 2 i i i=1 Questa funzione esiste ∀x, y ∈ X: ogni termine della serie è infatti maggiorato da P∞ 1/2i e i=1 1/2i = 1. Le proprietà I) e III) sono soddisfatte. Per la diseguaglianza triangolare osserviamo che se α e β sono due numeri reali con 0 ≤ α ≤ β, allora α + αβ ≤ β + αβ, da cui α/(1 + α) ≤ β/(1 + β). Posto allora α = |ξi − ζi | e β = |ξi − ηi | + |ηi − ζi | > α, si ha |ξi − ηi | + |ηi − ζi | |ξi − ηi | |ηi − ζi | |ξi − ζi | ≤ ≤ + 1 + |ξi − ζi | 1 + |ξi − ηi | + |ηi − ζi | 1 + |ξi − ηi | 1 + |ηi − ζi | 54 La seconda diseguaglianza è immediata. Da qui si ottiene la diseguaglianza II). Osservazione 1. Gli esempi riportati finora riguardavano metriche su spazi lineari ed erano pertanto esempi di spazi lineari metrici. In realtà, la definizione di distanza non comporta che lo spazio debba essere lineare. Consideriamo infatti il seguente esempio. Esempio 9. Sia X dato da successioni di numeri interi positivi x ≡ {ni }. Si può definire una distanza tra x e y ≡ {mi } ponendo d(x, y) = d({ni }, {mi }) = 1/k, essendo k l’indice dei primi interi nk e mk diversi tra loro e d(x, y) = 0 se ni = mi ∀i. Ad esempio, d({1, 5, 7, 42, 2, ....}, {27, 2, 4, ....}) = 1, mentre d({1, 5, 7, 42, 2, ....}, {1, 5, 7, 3, 2, ....}) = 1/4. Vale la diseguaglianza triangolare. Sia infatti d(x, z) = 1/(n + 1), d(x, y) = 1/(m + 1) e d(y, z) = 1/(l + 1). Se m ≤ n allora 1/(n + 1) ≤ 1/(m + 1) e pertanto la proprietà II) è verificata. Se n ≤ m, con un disegnino ci si convince che allora n = l, e ancora la II) è verificata. 2. CONVERGENZA IN SPAZI METRICI Definizione 2. In uno spazio metrico X una successione {xn } di elementi di X si dice convergente (in metrica) se esiste un elemento x ∈ X tale che d(xn , x) → 0. Scriveremo ciò come xn → x, e diremo x il limite della successione. Teorema 2. Se {xn } è una successione convergente in uno spazio metrico X, il limite è unico. Dimostrazione. Se xn → x e xn → y, allora d(x, y) ≤ d(x, xn ) + d(xn , y) e, per ipotesi, fissato > 0 è possibile determinare n tale che per n > n sia d(x, xn ) < /2 e d(xn , y) < /2; da cui segue d(x, y) < e, dall’arbitrarietà di , d(x, y) = 0 cioè x = y. Osservazione 2. La distanza d(x, y) è una funzione continua di x e y nel senso che per qualsiasi xn → x e yn → y si ha: d(xn , yn ) → d(x, y). Infatti, d(x, y) ≤ d(x, xn ) + d(xn , yn ) + d(yn , y), da cui d(x, y) − d(xn , yn ) ≤ d(xn , x) + d(yn , y). Scambiando x e y con xn e yn si ottiene d(xn , yn ) − d(x, y) ≤ d(xn , x) + d(yn , y) e pertanto |d(x, y) − d(xn , yn )| ≤ d(xn , x) + d(yn , y). Il membro di destra tende a zero per 55 ipotesi se n → ∞, da cui segue l’asserto. Nei seguenti esempi vedremo a quale convergenza abituale corrisponde la convergenza in metrica. N Esempio qP 10. Come nell’esempio 1, sia X = R metrizzato con la distanza N n n n 2 d(x, y) = i=1 (ξi − ηi ) . Definito xn ≡ {ξ1 , ξ2 , ..., ξN } come elemento della PN successione {xn }, la convergenza xn → x comporta i=1 (ξin − ξi )2 → 0. Questo n→∞ porta con sè (ξin − ξi ) −−−→ 0 per ogni i. Pertanto, la convergenza in metrica implica in questo caso l’usuale convergenza delle singole componenti. Essendo le componenti in numero finito, vale anche il viceversa, cioè la convergenza delle componenti implica la convergenza in metrica. Esempio 11. Consideriamo gli spazi lp dell’esempio 7. Come nell’esempio precedente la convergenza in metrica implica la convergenza delle singole componenti. Viceversa, la convergenza delle componenti non implica necessariamente la convergenza in metrica, poichè in questo caso si ha a che fare con somme infinite. Consideriamo infatti la successione {xn } con ξin = δni , cioè la successione di elementi xn con componenti tutte nulle fuorchè la n-sima uguale a 1. E’ chiaro che la successione delle singole componenti tende a zero, cioè ξin → 0 per n → ∞ e ∀i. P∞ n p 1/p D’altra parte d(xn , 0) = = 1 e quindi in metrica xn 6→ 0. i=1 |ξi | Esempio 12. Consideriamo l’esempio 8. La convergenza in metrica xn → x è verificata se ∞ X 1 |ξin − ξi | · → 0. i (1 + |ξ n − ξ |) 2 i i i=1 Questo comporta anche che γin ≡ |ξin − ξi | n→∞ −−−→ 0 ∀i. n (1 + |ξi − ξi |) n→∞ n→∞ Ma |ξin − ξi | = γin /(1 − γin ) e se γin −−−→ 0 ∀i, allora anche |ξin − ξi | −−−→ 0 ∀i. Dunque, la convergenza in metrica comporta la convergenza delle componenti. P∞ n→∞ Viceversa, sia ξin −−−→ ξi ∀i. Si spezzi allora la sommatoria i=1 in una somma PP P∞ finita i=1 e in un resto i=P . Come detto nell’ esempio 8, ciascun termine della sommatoria è maggiorato dal termine 1/2i cosicchè la sommatoria stessa è sempre 56 convergente e, fissato > 0, è possibile determinare P indipendente da n tale che per P > P : ∞ X |ξin − ξi | 1 · < /2. 2i (1 + |ξin − ξi |) i=P Per quanto riguarda la prima somma finita PP i=1 con il P già fissato, per la conver- genza delle singole componenti è possibile determinare un n tale che per n > n anche P X 1 |ξin − ξi | · < /2. 2i (1 + |ξin − ξi |) i=1 Quindi in questo caso la convergenza delle componenti implica anche la convergenza in metrica. Esempio 13. Consideriamo lo spazio C[a,b] dell’esempio 3 con la metrica del max. In questo spazio xn → x se maxt∈[a,b] |xn (t) − x(t)| → 0. Fissato allora > 0 è possibile determinare n tale che per tutti gli n > n valga |xn (t) − x(t)| < qualunque sia t ∈ [a, b]. Pertanto, la convergenza con la metrica del max corrisponde alla convergenza uniforme delle funzioni continue. Esempio 14. Consideriamo X = C[a,b] metrizzato con la distanza qR 2 b d(x, y) = x(t) − y(t) dt dell’esempio 5. Se xn (t) → x(t) uniformemente a cioè con la metrica del max, è chiaro che vale anche la convergenza con la metrica dell’ integrale. Il viceversa non è necessariamente vero, cioè la convergenza con la metrica dell’integrale non comporta la convergenza neppure puntuale. Consideriamo infatti la seguente successione in C[0,1] : ( xn (t) = nt, 0 ≤ t ≤ 1/n 1, 1/n ≤ t ≤ 1 Con la metrica dell’integrale xn (t) → x(t) ≡ 1. Infatti: qR qR p 2 2 1 1/n x (t) − 1 dt = nt − 1 dt = 1/(3n) → 0. d(xn , x) = n 0 0 Puntualmente invece, xn (t) converge alla funzione discontinua x̃(t) = 1 per 0 < t ≤ 1 ma con x̃(0) = 0. Non c’è pertanto convergenza puntuale nè quindi uniforme entro C[0,1] . 57 3. TOPOLOGIE METRICHE. Avevamo già notato nell’osservazione 1 del capitolo 2, che alcuni esempi di topologie sfruttano una preesistente struttura di distanza tra punti. In particolare, la topologia usuale euclidea degli spazi RN , che sono appunto spazi metrici, anzi lineari metrici. Mostreremo ora come in uno spazio metrico sia sempre possibile introdurre una topologia ricavata dalla distanza e, salvo diversa precisazione, uno spazio metrico si intende sempre dotato di tale topologia. Gli spazi metrici topologici godono naturalmente di particolari proprietà, che verranno messe in evidenza in quanto segue. Definizione 3. Dato lo spazio metrico X, consideriamo i sottoinsiemi A di X tali che a ogni x0 ∈ A corrisponda qualche h > 0 in modo che x ∈ A se d(x, x0 ) < h. Tali insiemi si dicono aperti. Osservazione 3. La famiglia F formata dagli insiemi aperti della definizione precedente più il vuoto (X è già compreso nella definizione), costituisce la topologia metrica nello spazio metrico topologico X. La definizione 3 ricalca esattamente quella dell’esempio 2.10 relativo alla topologia usuale sui reali, ove la distanza tra due punti è definita da d(x, y) = |x − y|. Rimandiamo a quell’esempio per la dimostrazione che si tratta effettivamente di una topologia. Definizione 4. Si dice sfera aperta Sxr0 di centro x0 e raggio r > 0, l’insieme di tutti i punti x ∈ X tali che d(x, x0 ) < r. Osservazione 4. La famiglia B = {Sxr : x ∈ X, r ∈ R} di tutte le sfere aperte, costituisce una base nello spazio metrico topologico X. Sono basi nello m/n stesso spazio topologico anche le famiglie B = {Sx 1/n raggio razionale e B = {Sx : x ∈ X, m, n = 1, 2...} di : x ∈ X, n = 1, 2, ...} di raggio 1/n. Come nella definizione precedente, anche questa ricalca quella degli intervalli aperti di semiampiezza reale Ixr dell’esempio 2.25, relativi alla retta R. Rimandiamo a quell’esempio per la dimostrazione che le tre famiglie B dell’osservazione 4 costituiscono effettivamente tre diverse basi in X. 58 Osservazione 5. Gli esempi 2.10 e 2.25 sono stati anticipati nel capitolo delle topologie per l’ovvia importanza degli spazi euclidei, sia in sè, sia in quanto prototipi di spazi topologici metrici e, come vedremo, anche normati e di Hilbert. Data quindi la maggiore struttura degli RN , questi godono evidentemente di proprietà non condivise da un generico spazio metrico. Osservazione 6. Uno spazio metrico è uno spazio di Hausdorff (T2 ). Infatti, se x 6= y e quindi d(x, y) = h > 0, dato r < h/2 le due sfere Sxr e Syr contengono x e y rispettivamente e sono disgiunte. Se cosı̀ non fosse, esisterebbe z ∈ Sxr ∩ Syr e pertanto d(x, y) ≤ d(x, z) + d(z, y) < 2r < h, che è falso. Osservazione 7. Uno spazio metrico soddisfa il primo assioma di numerabilità. Infatti, in ogni punto ha una base numerabile costituita dalle sfere aperte di raggio razionale. Non è detto in generale che uno spazio metrico sia anche perfettamente separabile, che abbia cioè una base numerabile. D’altra parte abbiamo già visto nel teorema 2.17 che uno spazio topologico perfettamente separabile è separabile. Negli spazi metrici vale anche il seguente teorema inverso. Teorema 3. Uno spazio metrico separabile è anche perfettamente separabile. Ovvero, se X contiene un sottoinsieme numerabile e denso in sè, allora possiede una base numerabile. Dimostrazione. Sia {xi } un sottoinsieme numerabile e denso in X e consideriamo la famiglia m B = {Sxni : i, m, n = 1, 2, ...} delle sfere aperte di centro xi e raggio razionale. Dimostriamo che è una base in X, utilizzando la definizione 2.10. Grazie all’osservazione 4 essa è sicuramente una base in ogni punto xi . Sia allora x ∈ / {xi }, e Ix un suo intorno. Per definizione di intorno, esiste h > 0 tale che x0 ∈ X se d(x, x0 ) < h. D’altra parte, essendo {xi } denso in X, x è punto di accumulazione per {xi } e pertanto, dato un razionale q = m n < h/2, esiste almeno un n̄ tale che d(x, xn̄ ) < q < h/2. La sfera Sxqn̄ contiene quindi il punto x, e sia y 59 un punto arbitrario della sfera stessa per il quale perciò vale d(xn̄ , y) < q. Allora d(x, y) ≤ d(x, xn̄ ) + d(xn̄ , y) < 2q < h e quindi anche y ∈ Ix . In conclusione, dato x ∈ X e fissato un suo intorno Ix , abbiamo determinato un razionale q tale per cui x ∈ Sxqn̄ ⊂ Ix . Dunque, la famiglia B delle sfere aperte di raggio razionale e centro nei punti dell’insieme {xi } denso in X, sono una base in X, ed essendo questa base ovviamente numerabile, lo spazio topologico X risulta essere perfettamente separabile. Definizione 5. In uno spazio metrico un insieme si dice limitato se è contenuto in qualche sfera aperta. Teorema 4. In uno spazio metrico un insieme compatto è chiuso e limitato. Dimostrazione. Uno spazio metrico è di Hausdorff (vedi osservazione 6) e in uno spazio di Hausdorff un insieme compatto è chiuso (vedi teorema 2.13). Ci rimane quindi da dimostrare che in uno spazio metrico un insieme compatto è limitato. Sia allora S compatto e sia G = {Sxn : x ∈ S, n = 1, 2, ...} la famiglia delle sfere aperte di centro x ∈ S e raggio n. G è una copertura aperta di S (lo è di tutto lo spazio), ed essendo S compatto se ne può estrarre una sottocopertura finita, per cui esiste N tale che S ⊂ SxN . Dunque S è limitato. Osservazione 8. Nella retta reale R, e più in generale in RN , è valido anche il teorema inverso ovvero il teorema A.C di Heine-Borel. Questo non è però valido in uno spazio metrico qualsiasi. Osservazione 9. In uno spazio metrico ogni insieme finito è chiuso. Questa infatti è una proprietà degli spazi T1 , e tali sono gli spazi metrici, essendo essi T2 . Osservazione 10. Avevamo dimostrato nel teorema 2 che in uno spazio metrico una successione convergente ha limite unico. Questa è in effetti una proprietà degli spazi di Hausdorff (vedi teorema 2.11) e quindi, come tali, degli spazi metrici. Osservazione 11. In uno spazio metrico X un punto x è di accumulazione per un sottoinsieme S ⊂ X se e solo se esiste una successione {xn } di punti distinti di S convergente a x. Questa è una proprietà degli spazi topologici soddisfacenti il primo assioma di numerabilità (vedi osservazione 2.15 e teorema 2.16). Come tale, uno spazio metrico gode di tale proprietà . 60 Osservazione 12. In uno spazio metrico X, un insieme S ⊂ X è chiuso se e solo se contiene tutti i punti limiti di successioni convergenti {xn } formate da elementi distinti di S. Confronta l’osservazione 2.18. Notiamo anche che la definizione di funzione continua tra due spazi metrici ricalca quella dell’analisi. Ovvero, f è continua in x se, fissato > 0, è possibile determinare δ tale che d(f (x0 ), f (x)) < se d(x0 , x) < δ . E’ facile cosı̀ dimostrare che la funzione f è continua se e solo se da xn → x segue f (xn ) → f (x), dove le convergenze sono ciascuna nella metrica del proprio spazio. Infine, per molti scopi è utile la proprietà dei sottoinsiemi compatti di uno spazio metrico stabilita dal seguente teorema. Teorema 5. Un sottoinsieme S di uno spazio metrico è compatto se e solo se da ogni successione in S si può estrarre una sottosuccessione convergente in S. Dimostrazione. Abbiamo già dimostrato che un sottoinsieme infinito T di un sottoinsieme compatto S di uno spazio topologico X dotato di una topologia arbitraria T ⊂ S ⊂ X, contiene almeno un punto di accumulazione (vedi teorema 2.10). Quindi, la successione {xn } ⊂ S compatto ha un punto di accumulazione e, se X è metrico (vedi l’osservazione 11) si può estrarre da {xn } una sottosuccessione convergente. La condizione sufficiente è dimostrata in A.E.Taylor a pg.71. 4. COMPLETEZZA IN SPAZI METRICI Definizione 6. Una successione {xn } in uno spazio metrico X è detta successione fondamentale o successione di Cauchy se, fissato > 0, esiste n tale che d(xn , xm ) < per ogni n, m > n . Osservazione 13. Ogni successione {xn } in X convergente a x ∈ X è una successione di Cauchy. Infatti d(xn , xm ) ≤ d(xn , x) + d(x, xm ) e poichè xn → x, fissato si può determinare n in modo tale che per n, m > n valgano entrambe le diseguaglianze d(xn , x) < /2 e d(x, xm ) < /2. Da cui segue l’asserto. Viceversa, non è detto in generale che una successione di Cauchy sia convergente. Definizione 7. Se uno spazio metrico X gode della proprietà che ogni successione di Cauchy ammette limite in X, esso è detto spazio completo. 61 Come visto nei paragrafi precedenti, si può dotare un insieme X di metriche diverse, ottenendo cosı̀ spazi metrici differenti anche riguardo le caratteristiche di completezza. Dato uno spazio metrico non completo, vedremo come sia sempre possibile completarlo in un senso che verrà precisato da un successivo teorema. Esempio 15. La retta reale R con d(x, y) = |x − y| è uno spazio completo. Infatti, condizione necessaria e sufficiente affinchè una successione di numeri reali {xn } sia convergente è che sia di Cauchy cioè che |xn − xm | → 0,qper n, m → ∞. PN 2 Esempio 16. Lo spazio RN con la metrica usuale d(x, y) = i=1 (ξi − ηi ) è completo. Infatti, data la successione {xn } con xn ≡ {ξin : i = 1, N }, la condizione d(xn , ym ) → 0 per n, m → ∞ comporta |ξin − ξim | → 0 per n, m → ∞ e ∀i n→∞ (vedi l’esempio 10). Dall’esempio precedente segue che esiste il limite ξin −−−→ ξi ∀i perchè R è completo. Ciascuna componente ammette limite e pertanto anche la successione {xn } ammette limite x = {ξi }. Esempio 17. Lo spazio C[a,b] con la distanza del max è uno spazio metrico completo. Sia infatti {xn } una successione di Cauchy. Fissato è possibile determinare n tale che per n > n , |xn (t) − xm (t)| < , ∀t ∈ [a, b]. Nell’analisi elementare questo è noto come il criterio di Cauchy necessario e sufficiente per la convergenza uniforme della successione di funzioni {xn (t)}; essendo inoltre {xn } una successione uniformemente convergente di funzioni continue, un’altro teorema dell’analisi elementare assicura che anche il limite x(t) è una funzione continua. Esempio 18. Lo spazio C[a,b] con la metrica dell’integrale non è completo. Consideriamo infatti una piccola modifica dell’esempio 14. In X = C[−1,1] sia: (0 xn (t) = con d(x, y) = qR 1 −1 nt 1 −1 ≤ t ≤ 0 0 ≤ t ≤ 1/n 1/n ≤ t ≤ 1. 2 x(t) − y(t) dt. E’ immediato provare che gli xn (t) individu- ano una successione di Cauchy. Infatti, sia per esempio m < n. Allora 2 R1 R 1/n R 1/m xn (t) − xm (t) dt = 0 (n − m)2 t2 dt + 1/n (1 − mt)2 dt = −1 = (n − m)2 /(3mn2 ) < 1/3m e quindi può essere reso piccolo a piacere. La successione {xn } tende puntualmente 62 alla funzione discontinua x(t) = 0 per −1 ≤ t ≤ 0 e x(t) = 1 per 0 < t ≤ 1. A tale funzione converge anche con la metrica dell’integrale come a tutte le altre funzioni uguale a questa salvo che nell’origine. Non esiste comunque nessuna funzione continua cui converga in metrica la successione di Cauchy ora esaminata. Esempio 19. Lo spazio P[a,b] dei polinomi pn (t) di grado n qualsiasi con a ≤ t ≤ b è uno spazio metrico se si assume la metrica del max, cioè d(pn , qm ) = maxt∈[a,b] |pn (t) − qm (t)|. Essendo infatti P[a,b] ∈ C[a,b] questa è una distanza anche nello spazio dei polinomi. Lo spazio P non è completo. Basta Pn infatti considerare la successione {pn } cosı̀ definita: pn (t) = i=0 ti /i!. Poichè abbiamo già visto che la convergenza del max e quella uniforme coincidono nei C[a,b] , e poichè pn (t) → et uniformemente, segue che lo stesso limite vale con la metrica del max in C[a,b] . Poichè però et 6∈ P, la successione considerata non ha limite in P, che pertanto risulta non completo. Esempio 20. Lo spazio lp è completo. Dall’esempio 11 segue che se {xn } è una successione di Cauchy, sono di Cauchy anche le successioni costituite dalle componenti di indice fissato. Posto cioè xn = (ξ1n , ξ2n , ..., ξkn , ...), sono di Cauchy anche le successioni {ξi1 , ξi2 , ..., ξin , ...} per ogni i. Ora, lo spazio C dei complessi è completo, per cui le singole componenti sono convergenti. Essendo lo spazio ∞-dimensionale, dalla convergenza delle componenti non segue direttamente quella dei vettori, che deve essere pertanto dimostrata in modo esplicito. Dimostriamo cioè che il vettore x = (ξi : ξi ≡ limn→∞ ξin ) appartiene a lp ed è il limite della successione di Cauchy {xn } secondo la metrica di lp . Infatti, dati xn e xm , P∞ n m p p fissato > 0, ∃N tale che i=1 |ξi − ξi | < per n, m > N . A fortiori, PN n m p p i |ξi − ξi | < , ∀N , per n, m > N . Posso considerare ora il limite m → ∞ e invertire il limite con la somma; la maggiorazione si mantiene anche al limite (che PN esiste) e si ottiene: i=1 |ξin − ξi |p < p . La maggiorazione vale per ogni N finito e P∞ n p p pertanto anche per la somma infinita: i=1 |ξi − ξi | < . La convergenza della sommatoria comporta la appartenenza del vettore x − xn a lp , da cui segue che x ∈ lp . Inoltre, la maggiorazione di cui sopra si può riesprimere come d(x, xn ) < e quindi, per l’arbitrarietà di , xn → x per n → ∞. Da ciò segue che lp è completo. 63 5. COMPLETAMENTO Osservazione 14. Gli esempi 17 e 18 su C[a,b] indicano chiaramente come sia possibile avere uno spazio completo o non completo a seconda della metrica che viene in esso definita. E’ molto importante però il fatto che uno spazio metrico non completo è sempre pensabile come un sottospazio denso di un opportuno spazio completo, che cioè è sempre possibile completare uno spazio metrico non completo. Questo fatto verrà illustrato nel prossimo teorema cui però premetteremo alcune piccole osservazioni e definizioni. Definizione 8. Due spazi metrici X e Y si dicono isometrici se esiste una funzione f con dominio X e codominio Y tale che esista la funzione inversa f −1 (se esiste cioè una corrispondenza biunivoca fra gli elementi di X e quelli di Y) e tale che d(x1 , x2 ) = d(f (x1 ), f (x2 )) per ogni coppia di punti x1 , x2 ∈ X. La funzione f è detta isometria fra X e Y. Definizione 9. Due successioni di Cauchy {xn } e {x0n } di elementi di uno spazio metrico X si dicono equivalenti se d(xn , x0n ) → 0. Osservazione 15. Se {xn } è convergente a x ∈ X, {x0n } è equivalente a {xn } se e solo se x0n → x. Infatti, se x0n → x allora d(xn , x0n ) ≤ d(xn , x) + d(x, x0n ) → 0 per n → ∞ . Viceversa, se {xn } e {x0n } sono equivalenti, allora d(x0n , x) ≤ d(x0n , xn ) + d(xn , x) → 0 Osservazione 16. Se {xn } è convergente a x ∈ X, la successione stazionaria {x, x, x, ..., x, ...} è equivalente ad essa ed è l’unica successione stazionaria di questa classe. Osservazione 17. È evidente che {xn } è equivalente a se stessa, che se {xn } è equivalente a {x0n } , anche {x0n } è equivalente a {xn } e che se {xn } è equivalente a {x0n } e {x0n } è equivalente a {x00n } allora {xn } è equivalente a {x00n }. È possibile quindi dividere tutte le successioni di Cauchy in classi di equivalenza. Con [{xn }] intenderemo la classe di equivalenza di tutte le succesioni di Cauchy equivalenti alla {xn }. Osservazione 18. Nell’esempio 15 avevamo visto che l’insieme dei reali R con la distanza usuale è uno spazio completo. Vogliamo esaminare più in dettaglio 64 questo esempio perchè è di grande utilità nel comprendere il successivo teorema sul completamento funzionale. Lo spazio R contiene il sottoinsieme Q dei razionali che sappiamo essere denso in R. Ogni successione di Cauchy di razionali è convergente in R perchè R è completo; inoltre ogni numero reale è limite di una successione di Cauchy di numeri razionali essendo Q denso in R. Un numero reale si può quindi identificare con tutte le successioni di Cauchy di razionali ad esso convergenti. Ad esempio il √ numero reale 2 può venire individuato dalla successione di Cauchy di razionali {1., 1.4, 1.41, 1.414, 1.4142, .....} e da tutte quelle ad essa equivalenti. Anche un razionale può essere identificato da una successione stazionaria di razionali, ad esempio 3/5 ≡ {3/5, 3/5, 3/5, ...., 3/5, ...}. Dati i reali x e = [{xn }] e ye = [{yn }] , con {xn } e {yn } successioni di Cauchy di razionali, si mostra facilmente che {dn = |xn − yn |} individua a sua volta una successione di Cauchy. Una distanza tra x e e ye può allora essere definita da d(e x, ye) ≡ [{dn ≡ |xn − yn |}], cioè da una classe di equivalenza di successioni di Cauchy di razionali e cioè ancora da un reale. Per esempio, se √ 3 = [{1., 1.7, 1.73, 1.732, 1.7320, ...}], allora √ √ d( 3, 2) = [{dn }] = [{0.0, 0.3, 0.32, 0.318, 0.3178, ...}]. Supponiamo ora di procedere in senso inverso, di conoscere cioè solo i numeri razionali Q. Con la distanza usuale non sono uno spazio completo. Per introdurre i reali R potremmo procedere nel modo tradizionale con le sezioni nel campo razionale, ma è chiaro dalla discussione precedente come possiamo anche procedere. Definiamo lo spazio dei reali R come lo spazio delle classi di equivalenza di successioni di Cauchy di razionali. Definiremo in R alcune operazioni come somma e prodotto utilizzando le operazioni definite in Q. Ad esempio se x e = [{xn }], ye = [{yn }] definiamo il prodotto e la somma x e · ye = [{xn · yn }], x e + ye = [{xn + yn }] e si può dimostrare che tali definizioni non dipendono dalle particolari successioni considerate e che portano a successioni di Cauchy di razionali. Possiamo definire un ordinamento tra reali dicendo che x e ≤ ye se esiste N tale che per n ≥ N , xn ≤ yn . Possiamo anche definire la distanza cui abbiamo già accennato. Essa non 65 dipende dalla successione considerata, è una quantità reale e soddisfa agli assiomi e 0 delle successioni convergenti di razionali della distanza. R contiene lo spazio Q e 0 esiste evidentemente una cioè equivalenti a successioni stazionarie. Tra Q e Q e 0 mediante le successioni corrispondenza biunivoca e se valutiamo le distanze in Q e 0 sono isometrici. Infine, si dimostra stazionarie, si vede immediatamente che Q e Q e 0 è denso in R. che R è completo e che Q Partendo quindi dallo spazio non completo dei razionali Q abbiamo costruito e 0 , è un lo spazio completo dei reali R di cui Q, a meno della isometria con Q sottospazio denso. La costruzione dei reali cosı̀ fatta ricalca passo per passo la dimostrazione costruttiva del seguente importante teorema sul completamento. Teorema 6. Dato uno spazio metrico X, esiste uno spazio metrico completo e e un sottoinsieme X e0 denso in X, e tale che X e0 e X sono isometrici. X Dimostrazione. Consideriamo in X tutte le successioni di Cauchy; esse pose l’insieme di queste sono essere divise in classi di equivalenza. Indichiamo con X classi di equivalenza, cioè se {xn } è una successione di Cauchy in X, indichiamo e la totalità delle successioni di Cauchy equivalenti a {xn }. Introduciacon x e∈X e la definizione d(e e e {xn }, {yn } mo in X x, ye) = limn→∞ d(xn , yn ), essendo x e, ye ∈ X due successioni di Cauchy delle classi x e e ye rispettivamente. Prima di tutto tale numero esiste, poichè {dn } ≡ {d(xn , yn )} costituisce una successione di Cauchy di numeri reali della quale pertanto esiste il limite. Infatti d(xn , yn ) ≤ d(xn , xm ) + d(xm , ym ) + d(ym , yn ), da cui d(xn , yn ) − d(xm , ym ) ≤ d(xn , xm ) + d(ym , yn ). Scambiando m con n, il membro a sinistra cambia segno per cui la diseguaglianza vale in realtà in modulo, cioè |dn − dm | ≤ d(xn , xm ) + d(ym , yn ) → 0 per n, m → ∞, essendo per ipotesi {xn } e {yn } successioni di Cauchy. (Come si è visto nella osservazione precedente, se si vuole utilizzare questo teorema per dimostrare la completezza dei reali, occorre sostituire il lim dn con l’intera successione {dn }.) Inoltre tale numero d(e x, ye) non dipende dalla particolare scelta delle successioni {xn } e {yn } entro la propria classe, essendo tutte equivalenti tra di loro. Infatti, 66 considerate le successioni {x0n } ∈ x e e {yn0 } ∈ ye, vale la diseguaglianza d(xn , yn ) ≤ d(xn , x0n ) + d(x0n , yn0 ) + d(yn0 , yn ), da cui limn→∞ d(xn , yn ) ≤ limn→∞ d(x0n , yn0 ). Scambiando tra di loro le successioni equivalenti si inverte la diseguaglianza, da cui segue che in realtà vale l’eguaglianza dei due limiti. Infine, tale numero soddisfa gli assiomi della distanza. E’ infatti simmetrico nei due membri; è positivo ed è uguale a zero se e solo se le due successioni {xn } e {yn } sono equivalenti ed individuano perciò lo stesso elemento x e = ye. Per quanto e riguarda la diseguaglianza triangolare, considerati x e, ye, ze ∈ X, d(e x, ze) = limn→∞ d(xn , zn ) ≤ limn→∞ d(xn , yn ) + d(yn , zn ) = d(e x, ye) + d(e y , ze). e0 delle classi di equivalenza di successioni di Consideriamo ora il sottospazio X Cauchy convergenti in X e individuate pertanto da successioni stazionarie. Se {x, x, ..., x, ...} e {y, y, ..., y, ...} appartengono a x e0 e ye0 rispettivamente, si ha e0 sono isometrici. Mostriamo evidentemente che d(e x0 , ye0 ) = d(x, y) per cui X e X e0 è denso in X. e Sia infatti x e e sia {xn } una delle successioni inoltre che che X e∈X della classe x e; fissato , esiste N tale che per n, N > N si ha che d(xn , xN ) < . e0 cui appartiene la successione stazionaria Consideriamo ora l’elemento x e0,N ∈ X {xN , xN , ..., xN , ...}: si ha d(e x, x e0,N ) = limn→∞ d(xn , xN ) < . In ogni intorno di e cadono cosı̀ punti di X e0 , che risulta quindi denso in X. e x e∈X e Sia {e Dobbiamo infine dimostrare la completezza di X. xn } una successione di e e per ogni x e0 tale che d(e Cauchy in X en scegliamo un x e0,n ∈ X xn , x e0,n ) < 1/n; e0 è denso in X. e Allora, questo è possibile poichè X d(e x0,n , x e0,m ) ≤ d(e x0,n , x en ) + d(e xn , x em ) + d(e xm , x e0,m ) < 1/n + 1/m + d(e xn , x em ). Se {xn , xn , ..., xn , ...} è la successione stazionaria appartenente a x e0,n , per la isomee0 segue che anche d(xn , xm ) < 1/n + 1/m + d(e tria tra X e X xn , x em ) −→ 0 per n, m → ∞ e cioè che {xn } è una successione di Cauchy in X e appartiene pertanto e Mostriamo infine che x a un elemento x e ∈ X. en → x e. Infatti d(e xn , x e) ≤ d(e xn , x e0,n ) + d(e x0,n , x e) < 1/n + d(e x0,n , x e) e poichè d(e x0,n , x e) = limm→∞ d(xn , xm ) < per n opportunamente grande, segue che x en → x e per n → ∞. 67 (Per semplicità si può pensare x e definito dalla successione di Cauchy {x11 , x22 , ..., xnn , ...}, ove il primo elemento x11 è il primo elemento di x e1 , il secondo x22 è il secondo elemento di x e2 , e cosı̀ via.) Con questa dimostrazione della completezza di X, il teorema del completamento è provato. E’ evidente l’importanza di questo teorema, ulteriormente rafforzato dal teorema che mostreremo tra poco. Introduciamo intanto la seguente: Definizione 10. Dato uno spazio metrico X, uno spazio metrico completo Ye contenente un sottospazio Ye0 denso in Ye e isometrico a X è detto completamento di X. Teorema 7. Dato uno spazio metrico X, due suoi completamenti qualsiasi Ye e Ye 0 sono isometrici. Dimostrazione. Cominceremo a dimostrare l’isometria tra un completamento arbitrario Ye e quello ottenuto con la tecnica del teorema del completamento e e essendo l’isometria una proprietà transitiva ( come si che indicheremo con X; controlla facilmente ), ne seguirà l’isometria di tutti i completamenti Ye . Per semplicità di linguaggio supponiamo che X sia un sottospazio di Ye , senza passare cioè dal sottospazio Ye0 denso in Ye e isometrico a X. Mostriamo che esiste una e e Ye . Se consideriamo ye ∈ Ye , essendo X denso corrispondenza biunivoca fra X in Ye esiste in X una successione {xn } convergente a ye e quindi di Cauchy; a ye convergono inoltre tutte le successioni di Cauchy equivalenti a {xn } e quindi e come f (e e possiamo definire la funzione f : Ye → X y ) = [{xn }] ∈ X. e essendo {xn } di Cauchy e Ye completo, esiste ed Viceversa, se x e = [{xn }] ∈ X, è unico il limite limn→∞ xn ≡ ye ∈ Ye . E quindi f −1 ([{xn }]) = ye. Consideriamo e cioè x infine ye, ye0 ∈ Y e gli elementi corrispondenti in X, e = [{xn }] e x e0n = [{x0n }]. Allora: d f (e y ), f (e y 0 ) = d([{xn }], [{x0n }]) = limn→∞ d(xn , x0n ) = = d(limn→∞ xn , limn→∞ x0n ) = d(e y , ye0 ). (Per il penultimo passaggio vedi l’osservazione 2 sulla continuità della distanza.) e e Ye . Pertanto f è un’isometria tra X 68 Esempio 21. Consideriamo lo spazio m2 delle successioni finite di reali (o complessi) x ≡ (ξ1 , ξ2 , ..., ξN ). Dato y ≡ (η1 , η2 , ..., ηM ) con M ≥ N , possiamo PM PN definire la distanza d2 (x, y) = i=1 |ξi − ηi |2 + i=M +1 |ξi |2 . Evidentemente m2 non è completo. Infatti, se consideriamo la successione x1 ≡ (1), x2 ≡ (1, 1/2), x3 ≡ (1, 1/2, 1/4), ..., xn ≡ (1, 1/2, 1/4, ..., 1/2n−1 ), .... Pn−1 Ogni xi ∈ m2 e la successione è di Cauchy. Infatti d2 (xn , xm ) = i=m 1/22i −→ 0 per n, m → ∞ essendo convergente la serie dei 1/2i . La successione {xn } converge però al vettore x ≡ (1, 1/2, 1/4, ..., 1/2n , ...) e siccome x 6∈ m2 , lo spazio metrico m2 risulta non completo. D’altra parte x ∈ l2 e m2 è denso in l2 . Infatti, dato x ∈ l2 e dato > 0, si può sempre costruire un vettore x ∈ m2 definito da P∞ x ≡ (ξ1 , ξ2 , ..., ξn ) tale che d2 (x, x ) = i=n +1 |ξi |2 < 2 , dato che l’intera serie è convergente. Allora, l2 è completo e contiene m2 in modo denso. Quindi, per quanto visto in precedenza e a meno di una isometria, l2 è il completamento di m2 . Esempio 22. Con riferimento agli esempi 17 e 19, ricordiamo che P[a,b] e C[a,b] con la distanza del max sono rispettivemente non-completo e completo, e che il primo è sottospazio del secondo. Ricordiamo anche un classico risultato di Weierstrass secondo il quale ogni funzione continua in un intervallo chiuso e limitato è approssimabile uniformemente con polinomi; quindi P[a,b] è denso in C[a,b] con la distanza del max che abbiamo già visto dare origine alla convergenza uniforme. In conclusione, C[a,b] è il completamento funzionale di P[a,b] con la metrica del max. Esempio 23. Con riferimento all’esempio 18, lo spazio C[a,b] con la distanza dell’integrale non è uno spazio completo. Esiste ovviamente il completamento funzionale dato dal teorema del completamento ma occorre studiarne una realizzazione pratica che sarà possibile fare nei capitoli successivi dopo un’introduzione alla Teoria della misura. 69 6. TEOREMI DELLE SFERE INCLUSE E DI BAIRE Terminiamo il capitolo con due teoremi. Il primo rappresenta l’estensione agli spazi metrici completi del teorema A.A sulle proprietà di inclusione degli intervalli chiusi e limitati, e riveste una notevole rilevanza applicativa. Teorema 8. Condizione necessaria e sufficiente affinchè uno spazio metrico X sia completo, è che in esso ogni successione di sfere chiuse, incluse le une nelle altre e i cui raggi tendono a zero, abbia intersezione non vuota. Dimostrazione. Sia X uno spazio metrico completo e sia {Bn ≡ S̄xrnn } una successione di sfere chiuse di centro xn e raggio rn → 0, contenute le une nelle altre: B1 ⊃ B2 ⊃ ... ⊃ Bn ⊃ .... In particolare, per m > n si ha Bm ⊂ Bn e xn , xm ∈ Bn e quindi d(xn , xm ) < rn . Quindi {xn } individua una successione fondamentale che ha limite, diciamo x, essendo X completo. Inoltre, ogni Bn contiene tutti i punti della successione {xn } esclusi eventualmente i primi x1 , x2 , ..., xn−1 , ed essendo Bn un insieme chiuso per ipotesi, contiene anche il punto limite x. Dunque, x ∈ ∩n Bn , e la condizione necessaria è provata Viceversa, sia data la successione {xn } fondamentale e dimostriamo che essa ha limite in X. Essendo fondamentale, esiste xn1 tale che d(xn , xn1 ) ≤ 1/2 per ogni n > n1 . Diciamo B1 la sfera chiusa di centro xn1 e raggio 1. Troviamo ora un punto xn2 con n2 > n1 , tale che d(xn , xn2 ) ≤ 1/22 per tutti gli n > n2 . Diciamo B2 la sfera chiusa di centro xn2 e raggio 1/2. Cosı̀ procedendo, dalla successione {xn } possiamo estrarre una sottosuccessione {xnk } tale che d(xn , xnk ) ≤ 1/2k per tutti gli n > nk , e in corrispondenza a questi possiamo individuare una successione di sfere chiuse Bk di centro xnk e raggio 1/2k . Per ipotesi (condizione sufficiente), una tale successione di sfere ha un punto comune, diciamo x, che risulta evidentemente limite della sottosuccessione {xnk }. Ma se la successione fondamentale {xn } contiene una sottosuccessione convergente, è essa stessa convergente al medesimo limite. Dunque, lo spazio X è completo. Il secondo e ultimo teorema riveste una fondamentale importanza nella teoria generale degli spazi metrici completi, ed è noto come teorema di Baire. 70 Teorema 9. Se uno spazio metrico completo è l’unione numerabile di sottoinsiemi chiusi, almeno uno di questi contiene un insieme aperto non vuoto. Dimostrazione. Sia ∪n Bn = X e supponiamo per assurdo che nessuno degli insiemi chiusi Bn contenga un aperto non vuoto, ovvero abbia punti interni. Allora, B1 6= X e sia x1 6∈ B1 . A sua volta, C(B1 ) è un aperto che contiene la sfera S1 = Sx11 con 0 < < 1/2 (vedi l’osservazione 4). Per ipotesi, B2 non contiene la /2 /2 sfera aperta Sx11 , e quindi l’insieme aperto C(B2 ) ∩ Sx11 è non vuoto e contiene un punto, diciamo x2 e tutta la sfera S2 = Sx22 con 0 < 2 < 1/22 . Procedendo oltre, si ottiene una successione di sfere {Sn } = {Sxnn } con le seguenti proprietà : 0 < n < 1 2n , /2 Sn+1 ⊆ Sxnn , Sn ∩ Bn = 6 O, n = 1, 2, .... E, per ogni m > n si ha: d(xn , xm ) ≤ d(xn , xn+1 ) + d(xn+1 , xn+2 ) + ... + d(xm−1 , xm ) < < 1 2n+1 + 1 2n+2 + ... + 1 2m < 1 2n . Pertanto la successione {xn } dei centri forma una successione fondamentale che converge a x ∈ X, essendo X per ipotesi completo. Da ciò segue che: d(xn , x) ≤ d(xn , xm ) + d(xm , x) < n 2 + d(xm , x) → n 2 , per m → ∞. Quindi x ∈ Sn per ogni n, e pertanto non è contenuto in alcun Bn nè ovviemente nella loro unione. Ma questo contraddice l’ipotesi del teorema che ∪n Bn = X, e il teorema è dimostrato. Un altro enunciato del tutto equivalente del teorema di Baire è il seguente: Teorema 9’. Uno spazio metrico completo R non può essere rappresentato come unione numerabile di insiemi in nessun punto densi. (Vedi la definizione 2.7). Osservazione 19. Ogni spazio metrico completo senza punti isolati è non numerabile. Infatti, ogni insieme con un solo elemento è in nessun punto denso. Esempio 24. La retta R soddisfa il teorema di Baire mentre l’insieme dei razionali Q (spazio metrico non completo) è l’unione numerabile degli insiemi {q} costituiti dai suoi singoli punti, in nessun punto densi. Definizione 11. Gli spazi topologici per cui è possibile la copertura numerabile con insiemi in nessun punto densi sono detti di prima categoria. Quelli per cui non è possibile si dicono di seconda categoria. 71 4. SPAZI NORMATI 1. SPAZI NORMATI Definizione 1. Uno spazio lineare N si dice normato se ad ogni elemento x ∈ N è associato un numero reale non negativo che si indica con kxk tale che: I) kxk ≥ 0 e kxk = 0 ⇐⇒ x = 0. II) kx + yk ≤ kxk + kyk. (Diseguaglianza triangolare.) III) kαxk = |α|kxk per ogni α reale o complesso. E’ chiaro che il concetto di norma non è altro che una assiomatizzazione del concetto di lunghezza di un vettore negli ordinari spazi euclidei RN . Osservazione 1. Uno spazio normato è pure uno spazio metrico se si assume la distanza ricavata dalla norma: d(x, y) = kx − yk. Le proprietà I)-II) si riflettono immediatamente nelle analoghe proprietà della metrica. Il viceversa non è sempre vero; ad esempio uno spazio metrico non è necessariamente lineare. Tuttavia, avendo nel capitolo precedente trattato molti esempi di spazi lineari metrici con distanze invarianti per traslazione, cioè con d(x, y) = d(x−y, 0), la introduzione in questi del numero reale positivo kxk ≡ d(x, 0) li definisce come spazi normati pur di provare per tale numero l’unica proprietà III). Le altre due sono automaticamente soddisfatte da analoghe proprietà della distanza. La I) è ovvia. Per la II), poichè d(x, z) ≡ kx − zk ≡ d(x − z, 0), e d(x, −y) ≤ d(x, 0) + d(0, −y) = d(x, 0) + d(y, 0), allora kx + yk ≡ kx − (−y)k ≤ kxk + kyk. La nozione di convergenza in uno spazio normato si esprime ora dicendo che xn → x se kxn − xk → 0. Definizione 2. Uno spazio normato si dice completo se ogni successione di Cauchy (definita ovviamente con la distanza della norma) ammette limite in N . Uno spazio normato e completo si dice Spazio di Banach e lo si indicherà qP con B. N 2 Esempio 1. RN è normato e completo con la definizione kxk = i=1 |ξi | . Questa è l’usuale lunghezza dei vettori e da qui si ricava la distanza più volte esaminata e che abbiamo già dimostrato dare origine a uno spazio completo. 72 Esempio 2. Lo spazio lp è uno spazio normato con la definizione: P∞ p 1/p . Tale numero esiste dato che lp contiene per definizione elekxk = i=1 |ξi | menti x per i quali sia convergente la sommatoria precedente. Inoltre le proprietà I)-III) seguono facendo riferimento a lp quale spazio metrico (vedi l’esempio 3.7). E’ anche completo, per cui lp è uno spazio di Banach. Esempio 3. Lo spazio C[a,b] è normato se si assume kxk = maxt∈[a,b] |x(t)|. Tale spazio è anche completo (vedi l’esempio 3.17). qR E’ quindi uno spazio di Banach. b Esempio 4. Lo spazio C[a,b] con kxk = |x|2 dt. Tale spazio è normato a ma non completo come abbiamo già visto per lo spazio metrizzato con la distanza ricavata da questa norma (esempio 3.18). Esempio 5. Lo spazio metrico dell’esempio 3.8 con la definizione: kxk = ∞ X |ξi | 1 · i 2 1 + |ξi | i=1 non è uno spazio normato. Infatti kαxk = 6 |α|kxk. Osservazione 2. Riportiamo alcune semplici proprietà della norma e delle convergenze in spazi normati. Siano x, y, xn , yn ∈ N , spazio normato. Segue che: i) k(x + y) − (xn + yn )k ≤ kx − xn k + ky − yn k. Pertanto, xn → x e yn → y, =⇒ xn + yn → x + y. ii) kαx − αxn k = |α|kx − xn k. Pertanto, xn → x =⇒ αxn → αx. iii) kλn x − λxk = k(λn − λ)xk = |λn − λ|kxk. Pertanto, λn → λ =⇒ λn x → λx. iv) kxk = ky + (x − y)k ≤ kyk + kx − yk e quindi kxk − kyk ≤ kx − yk. Con la sostituzione x ↔ y si ottiene kyk−kxk ≤ kx−yk, e pertanto kxk−kyk ≤ kx−yk. Cioè, la differenza delle norme (in modulo) è minore della norma della differenza. Da quest’ultima segue anche che v) kxk − kxn k ≤ kx − xn k e quindi xn → x =⇒ kxn k → kxk. Notare che non vale il viceversa. Osservazione 3. Tutti i concetti sulle topologie metriche del paragrafo 3.3, si possono trasferire negli spazi normati introducendo una distanza desunta dalla norma, definendoli cosı̀ quali spazi normati topologici. In particolare, dalla conti73 nuità della norma rispetto a somma e prodotto, segue che uno spazio normato è anche uno spazio lineare topologico. Definizione 3. Due spazi normati N e M si dicono congruenti se esiste un operatore lineare A da N in M e il suo inverso A−1 , con ||Ax||M = ||x||N per ogni x ∈ N . Tali spazi sono isomorfi (def. 1.4) e isometrici (def. 3.8). Esistono coppie di spazi normati topologicamente isomorfi (def. 2.24), ma non congruenti. 2. OPERATORI LIMITATI Definizione 4. Dati due spazi normati N e N 0 e un operatore A che trasforma N in N 0 , A si dice operatore limitato se esiste un numero reale positivo K tale che ∀x ∈ DA si ha kAxk ≤ Kkxk. Osservazione 4. L’operatore limitato A trasforma insiemi limitati (kxk ≤ C) in insiemi limitati (kAxk ≤ CK). Esempio 6. Consideriamo in C[a,b] normato con la norma del max l’operatore Rb integrale A definito da A x(t) = x0 (s) ≡ a K(s, t)x(t) dt, con K(s, t) funzione continua nel quadrato s, t ∈ [a, b]. L’operatore A è limitato. Infatti, posto il massimo modulo di K(s, t) per s, t ∈ [a, b] uguale a K/(b − a): R b Rb kAx(t)k = maxs∈[a,b] a K(s, t)x(t) dt ≤ maxt,s∈[a,b] K(t, s) a x(t) dt ≤ ≤ K/(b − a) · (b − a) · maxt∈[a,b] x(t) = Kkxk. Esempio 7. Consideriamo lo spazio C[a,b] con la norma del max e l’operatore A ≡ d/dt. A non è un operatore limitato. Sia infatti xn (t) = sin[nπ(b − t)/(b − a)], per ogni n. Questo definisce un insieme limitato poichè kxn (t)k = 1, ∀n. Ma kAxn (t)k = maxt∈[a,b] [nπ/(b − a)] cos[nπ(b − t)/(b − a)] = nπ/(b − a). Evidentemente non esiste nessun numero K > 0 che maggiori questa norma per tutti gli n e cioè per tutti gli elementi dell’insieme limitato {xn (t)}. Definizione 5. Un operatore A da N in N 0 si dice continuo in x ∈ DA se per ogni successione {xn } convergente a x con xn ∈ DA ∀n, da xn → x (cioè kxn − xk → 0 per n → ∞) si può dedurre che Axn → Ax (cioè kAxn − Axk → 0 nello stesso limite). 74 Osservazione 5. Quanto detto finora in questo paragrafo non riguarda solamente il caso particolare degli operatori lineari. Per questi invece è possibile stabilire una connessione tra continuità e limitatezza con il seguente: Teorema 1. Condizione necessaria e sufficiente affinchè un operatore lineare sia limitato è che sia continuo in x = 0. Dimostrazione. Sia A continuo in x = 0 e mostriamo che deve essere limitato. Se fosse A illimitato, esisterebbero x1 , x2 , ..., xn , ... ∈ DA con kxn k < C tali che kAx1 k > kx1 k, kAx2 k > 2kx2 k,...,kAxn k > nkxn k, ... Dato allora yn ≡ xn /(nkxn k), si ha evidentemente yn → 0 per n → ∞, mentre kAyn k = kAxn k/(nkxn k) > 1. L’operatore A quindi non sarebbe continuo in x = 0, contrariamente alle ipotesi. Viceversa, se l’operatore A lineare è anche limitato, allora è continuo ovunque ∀x ∈ DA e quindi è continuo anche in x = 0 che senz’altro appartiene al dominio di A per la linearità di questo. Infatti, kAxn − Axk = kA(xn − x)k ≤ Kkxn − xk, da cui segue l’asserto. Introduciamo ora l’importante concetto di norma di un operatore: Definizione 6. Si definisce norma dell’operatore A il seguente numero, ove questo esista finito: kAk ≡ sup x∈DA kAxk = sup kAxk kxk kxk≤1 . Osservazione 6. Per un operatore A limitato, la norma è sempre definita. Infatti, da kAxk ≤ Kkxk segue che kAxk ≤ K per tutti gli x ∈ DA con kxk ≤ 1. L’insieme numerico kAxk è cioè limitato e di questo pertanto esiste l’estremo superiore. (Vedi la nota al teorema 2.A.) Osservazione 7. Quanto appena detto a proposito della norma vale anche per operatori non lineari. Nel caso però di operatori lineari e limitati è possibile introdurre il seguente concetto di estensione: Teorema 2. Sia dato un operatore lineare e limitato A da N in N 0 , spazi normati, definito densamente in N e con N 0 completo. Allora è possibile definire 75 una estensione B a tutto N 0 tale che kBk = kAk per tutti gli x ∈ DA . Tale estensione è unica. Dimostrazione. Essendo DA denso in N , dato x ∈ N si può sempre trovare una successione {xn } con xn ∈ DA e tale che xn → x. Allora kAxn − Axm k = kA(xn − xm )k ≤ kAkkxn − xm k −→ 0, per n, m → ∞. Segue che {Axn } è una successione di Cauchy, ed essendo N 0 uno spazio completo, esiste y = lim Axn e risulta indipendente dalla scelta della particolare successione {xn } in N ; essendo infatti kxn − x0n k ≤ kxn − xk + kx − x0n k, se anche x0n → x, allora (xn − x0n ) → 0 . Ma essendo A limitato e perciò continuo (vedi teorema 1), Axn − Ax0n = A(xn − x0n ) −→ A0; per la linearità di A, A0 = 0 e quindi lim Axn = lim Ax0n . Abbiamo cosı̀ determinato l’operatore B definito da Bx = y. Se x ∈ DA allora si sceglie evidentemente xn ≡ x ∀n, per cui B risulta definito su tutto N e rappresenta pertanto una estensione di A. Mostriamo ora che B è lineare e limitato e ne valutiamo la norma. Siano x, y ∈ N e sia xn → x e yn → y e quindi anche xn + yn → x + y. Vale allora B(x + y) = lim A(xn + yn ) = lim(Axn + Ayn ) = lim Axn + lim Ayn = Bx + By grazie alle proprietà di continuità di A. Analogamente si dimostra la validità di B(αx) = αBx, e quindi B è un operatore lineare. Per mostrare la limitatezza, scelti x ∈ N e xn ∈ DA convergente a x, kAxn k ≤ kAkkxn k e quindi, ricordando che il limite della norma è uguale alla norma del limite: kBxk ≤ kAkkxk. Pertanto B è un operatore limitato con kBk ≤ kAk. Ma essendo B una estensione di A, cioè con DA ⊂ DB , vale necessariamente kAk ≤ kBk e quindi in conclusione le due norme sono uguali, kAk = kBk. Per ultimo, dobbiamo mostrare che B è l’unica estensione di A. Infatti sia C un’altra estensione di A con kCk = kAk. Allora Cx = lim Cxn = lim Axn = Bx per ogni x ∈ N , e quindi C = B. Il teorema è cosı̀ completo. Osservazione 8. Grazie al risultato precedente, nel riferirci a operatori lineari e limitati con dominio denso in uno spazio normato e codominio in uno spazio di Banach, noi li intenderemo sempre definiti su tutto lo spazio. 76 3. SPAZI LINEARI DI OPERATORI Osservazione 9. Consideriamo l’insieme B(A) di tutti gli operatori lineari e limitati da N in N 0 con DA denso in N . L’insieme B(A) è uno spazio vettoriale. Si può definire infatti un operatore somma A+B e un operatore prodotto per un numero αA nel modo usuale, senza alcun problema con i domini. Si ottengono ancora operatori lineari e limitati, poichè : k(A+B)xk = kAx+Bxk ≤ kAxk+kBxk ≤ kAk+kBk kxk e kαAxk ≤ |α|kAkkxk. Tutte le proprietà cui devono soddisfare la somma e il prodotto per potere definire uno spazio vettoriale sono facilmente verificabili. Osservazione 10. Mostriamo ora che B(A) è anche uno spazio normato se assumiamo come norma quella già introdotta nella definizione 6. Mostriamo cioè che tale numero soddisfa agli assiomi della norma nello spazio lineare B(A), giustificando cosı̀ la scelta del nome. I) A = 0 ⇐⇒ kAk = 0. Infatti, A = 0 vuol dire Ax = 0 per ogni x. Quindi supx kAxk = 0. Viceversa, se kAk = supx kAxk = 0 allora kAxk = 0, ∀x, cioè Ax = 0, ∀x e quindi A = 0. II) kαAk = supx kαAxk = |α| supx kAxk = |α|kAk. III) kA + Bk = supx k(A + B)xk ≤ supx (kAxk + kBxk) = kAk + kBk. Osservazione 11. Essendo B(A) uno spazio normato è anche uno spazio metrico nel quale è definita la naturale convergenza An → A se kAn − Ak → 0. Definizione 7. La convergenza An → A se kAn − Ak → 0 si definisce uniforme in contrapposizione alla convergenza puntuale di An ad A definita in N 0 dal limite An x → Ax, cioè da kAn x − Axk → 0, per ogni x ∈ N . Osservazione 12. Chiaramente, la convergenza uniforme comporta la convergenza puntuale. Infatti kAn x − Axk ≤ kAn − Akkxk. Il viceversa non è vero, come mostrato dal seguente: Esempio 8. Sia data la successione di funzionali lineari da l2 in R (o C) definiti da An x ≡ ξn , essendo x = (ξ1 , ξ2 , ..., ξn , ...) ∈ l2 . Sono funzionali limitati P∞ dato che kξi k = |ξi | ≤ kxk ∀i. Inoltre, poichè x ∈ l2 e quindi i=1 |ξi |2 < ∞, si ha necessariamente che |ξn | → 0 per n → ∞. Pertanto, kAn xk = |ξn | → 0 per ogni 77 x ∈ l2 e quindi An → 0 puntualmente in l2 . D’altra parte, ∀x ∈ l2 con kxk ≤ 1 si ha che kAn k = supx kAn xk = sup |ξn | = 1, dato che esistono in l2 vettori del tipo {0, 0, ..., 0, 1, 0, ...}. Quindi An 6→ 0 in modo uniforme. Rimane da esplorare se lo spazio normato B(A) è anche completo, cioè è uno spazio di Banach. A ciò risponde in modo affermativo il seguente: Teorema 3. L’insieme degli operatori lineari limitati da uno spazio normato N in un altro spazio normato e completo N 0 , costituisce a sua volta uno spazio normato e completo. Dimostrazione. Che B(A) sia uno spazio lineare normato è già stato provato. Dimostrariamo quindi che è anche completo se N 0 è completo. Consideriamo in B(A) una successione di Cauchy {An }, tale cioè che kAn − Am k → 0 per n, m → ∞; anche kAn x − Am xk ≤ kAn − Am kkxk −→ 0 nello stesso limite. Pertanto, anche {An x} è una successione di Cauchy che ammette limite, essendo N 0 completo. Dato allora x0 ≡ lim An x per n → ∞, definiamo l’operatore A: Ax ≡ x0 . Evidentemente A è un operatore da N in N 0 . Dimostriamo che A : a) è lineare; b) è limitato; c) è il limite uniforme di {An }. a) A(x + y) = lim An (x + y) = lim An x + lim An y = Ax + Ay, grazie all’esistenza dei singoli limiti e delle proprietà di continuità della norma. Quindi A è lineare. b) Essendo {An } una successione di Cauchy, costituisce anche un insieme limitato. Infatti, kAn k ≤ k(An − Am ) + Am k ≤ kAn − Am k + kAm k, e per n e m̄ abbastanza grandi, n qualsiasi e m̄ fissato, si ha kAn k < H = K + 1 con K = maxl=1,m̄ kAl k. Ora, la norma è continua nel senso che kxn k → kxk se xn → x e pertanto, kAxk = k lim An xk = lim kAn xk < Hkxk. Quindi, A è un operatore limitato. c) Scelto > 0, esiste N tale che per ogni n, m > N , vale kAn x − Am xk ≤ kAn − Am kkxk ≤ kxk. Per la continuità della norma, possiamo passare al limite m → ∞, ottenendo per ogni n, k(An −A)xk = kAn x−Axk ≤ kxk. Si ha cioè kAn − Ak < e quindi An → A uniformemente in B(A). Q.E.D. Definizione 8. In particolare, lo spazio dei funzionali F (x) lineari e limitati in uno spazio normato N , con l’usuale norma kF k = supkxk≤1 |F (x)| costituisce 78 uno spazio normato e completo B(F ) ed è detto spazio coniugato N ∗ di N . Affronteremo ora due importanti questioni legate alla risoluzione di una vasta classe di equazioni. La prima riguarda la risolubilità del problema Ax = x, La seconda riguarda le condizioni sotto le quali esiste l’operatore inverso A−1 di un operatore assegnato A, problema connesso tra l’altro alla soluzione del problema x = Bx + f , con f assegnato. 4. EQUAZIONE DEL PUNTO FISSO Definizione 9. La soluzione dell’equazione Ax = x si definisce punto fisso (o punto unito) dell’operatore A. L’equazione stessa è detta del punto fisso. Dimostriamo ora un teorema che fornisce una risposta positiva e costruttiva al problema della risolubilità del problema del punto fisso per l’operatore A. Come si vedrà, la dimostrazione sfrutta solo le proprietà metriche degli spazi normati e pertanto vale più in generale per spazi metrici. Teorema 4. Dato un operatore A definito su tutto uno spazio normato e completo N (o su tutto un suo sottoinsieme chiuso I ∈ N ), sia A tale da trasformare N in N (oppure I in I). Supponiamo che esista una costante reale 0 < α < 1 tale che kAx1 − Ax2 k ≤ αkx1 − x2 k, per ogni coppia x1 , x2 ∈ DA . In tal caso esiste una e una sola soluzione del problema Ax = x. Dimostrazione. Dato un elemento qualsiasi x0 ∈ DA , consideriamo la successione: {x0 , x1 = Ax0 , x2 = Ax1 , ..., xn+1 = Axn , ...}. Vale evidentemente kxn+1 − xn k = kA(xn − xn−1 )k ≤ αkA(xn−1 − xn−2 )k ≤ ... ≤ αn kx1 − x0 k, e anche (sia n < m): kxm − xn k ≤ (αm−1 + αm−2 + ... + αn )kx1 − x0 k ≤ P∞ ≤ αn i=0 αi kx1 − x0 k = αn /(1 − α) kx1 − x0 k. Segue che, per n, m → ∞, kxm − xn k → 0, per cui {xn } è una successione di Cauchy; per ipotesi N è completo (I è chiuso) e quindi esiste il limite x̄ = lim xn . Mostriamo ora che x̄ è un punto fisso di A . Poichè kAyn − Ayk ≤ αkyn − yk, 79 se yn → y anche Ayn → Ay, cioè A è un operatore continuo e si può invertire l’operatore con il segno di limn→∞ : Ax̄ = lim Axn = lim xn+1 = x̄ . Quindi x̄ = lim xn = lim An x0 , è soluzione del problema del punto fisso. Mostriamo che tale soluzione è unica. Supponiamo che esistano due soluzioni: x̄ e x̄0 . Allora kx̄ − x̄0 k = kAx̄ − Ax̄0 k ≤ αkx̄ − x̄0 k. Questa diseguaglianza ha soluzione solo per kx̄ − x̄0 k = 0 e cioè per x̄ = x̄0 . CVD. Osservazione 13. Dalla maggiorazione kxm − xn k ≤ αn /(1 − α) kx1 − x0 k, passando al limite per m → ∞ con n fissato, si ottiene kxn −x̄k ≤ αn /(1−α) kx1 −x0 k, che fornisce una stima dell’errore che si commette troncando il procedimento a n. Da qui si deduce anche che la approssimazione è tanto migliore quanto migliore è la scelta del vettore iniziale x0 . Osservazione 14. Per dimostrare il precedente teorema in uno spazio metrico completo bisogna ovviamente sostituire l’ipotesi fondamentale con la: d(Ax1 , Ax2 ) ≤ αd(x1 , x2 ), con 0 < α < 1. Definizione 10. Un operatore A in uno spazio metrico soddisfacente a d(Ax1 , Ax2 ) ≤ αd(x1 , x2 ), con 0 < α < 1, si dice operatore di contrazione. Osservazione 15. L’equazione disomogenea x = Ax + f con f dato, diventa una equazione al punto fisso per l’operatore B : Bx = Ax + f . Poichè kBx1 − Bx2 k = kAx1 − Ax2 k, se A è di contrazione, lo è anche B e pertanto esiste la soluzione iterativa data nella dimostrazione costruttiva del teorema 4. Se f ∈ DA e valgono le stesse ipotesi del teorema, la soluzione è data da n x̄ = lim xn = lim B f = n→∞ n→∞ ∞ X Ai f, A0 = I. i=0 Ci si convince facilmente dell’eguaglianza tra limite e sommatoria sviluppando i primi termini. Studiamo ora tre importanti applicazioni del procedimento iterativo sopra descritto. Ai sistemi lineari. Al problema di Cauchy per le equazioni differenziali del primo ordine tramite equazioni integrali a limiti variabili o equazioni di Volterra. Alle equazioni integrali a limiti fissi o equazioni di Fredholm. 80 4.1 SISTEMI LINEARI Sia dato il sistema lineare di N equazioni in N incognite: PN i=1 aki ξi = bk , con k = 1, 2, ..., N . In termini operatoriali riscriviamo tale sistema nella forma Ax = b, ove evidentemente A rappresenta un operatore matriciale N × N da RN in RN , x ≡ (ξ1 , ξ2 , ..., ξN ) è il vettore incognito e b ≡ (b1 , b2 , ..., bN ) è un vettore dato. Se N è molto grande, la formula risolutiva di Cramer espressa tramite i determinanti dei coefficienti e dei termini noti non è più conveniente da un punto di vista pratico per l’elevato numero di determinanti (N 2 ) da calcolarsi per ogni incognita. Risultano più efficaci alcune tecniche risolutive approssimate tra cui, importante, è appunto quella iterativa, nel caso che l’operatore A sia di contrazione. PN Il sistema si può porre infatti nella forma: ξk = i=1 cki ξi + bk , pur di definire cki = −aki + δki , o in forma operatoriale: x = Cx + b, con C ≡ −A + I. Definiamo allora l’operatore D da RN in RN tramite la sua azione su ogni x ∈ RN : Dx = Cx + b. Il nostro sistema lineare viene cosı̀ riespresso come un problema del punto fisso per l’operatore D : x = Dx. Ora, kDx − Dyk = kCx + b − (Cy + b)k = kCx − Cyk ≤ kCkkx − yk. Pertanto, se kCk = k − A + Ik < 1, l’operatore D è un operatore di contrazione e il problema è risolubile per approssimazioni successive: xn+1 = Dxn = Cxn +b = −Axn +xn +b. Notiamo che l’operatore D può essere o meno un operatore di contrazione a seconda della norma che si sceglie in RN ; ovvero, se esiste una norma rispetto alla quale D è un’operatore di contrazione, allora il sistema è risolubile per via iterativa. Naturalmente, la velocità di convergenza, e anche la bontà delle soluzioni approssimate, dipende dalla norma rispetto alla quale tale tecnica è applicabile. Consideriamo dapprima in RN l’usuale norma Euclidea. Per stimare la kCk utilizziamo la diseguaglianza di Schwartz (teorema 3.1), applicata al prodotto scalare yk · x tra il vettore yk ≡ (ck1 , ck2 , ..., ckN ) e il vettore x: PN PN 2 PN PN 2 2 · = i=1 (cki )2 kxk2 . ≤ i=1 cki ξi i=1 (cki ) i=1 (ξi ) 2 PN PN PN E pertanto: kCxk2 = k=1 c ξ ≤ k,i=1 (cki )2 kxk2 . ki i i=1 qP N 2 Da cui si deduce che kCk ≤ k,i=1 (cki ) . Tornando al nostro sistema lineare 81 di partenza, concludiamo che questo è risolubile per approssimazioni successive se PN 2 k,i=1 (−aki + δki ) < 1. In RN consideriamo anche la norma kxk = maxi=1,N |ξi |. In tal caso P P kCx − Cyk ≡ maxk | i cki (ξi − ηi )| ≤ maxk i |cki ||ξi − ηi | ≤ P P ≤ maxk i |cki | · maxi |ξi − ηi | = maxk i |cki | ·kx − yk. P Pertanto, se vale la maggiorazione: maxk i |cki | ≤ α < 1, l’operatore D risulta essere di contrazione e quindi il nostro sistema lineare è risolubile per iterazioni successive. Nel senso che l’iterazione n-esima converge nella norma del max alla soluzione del problema. 4.2 PROBLEMA DI CAUCHY ED EQUAZIONE DI VOLTERRA Consideriamo l’usuale problema di Cauchy per la equazione differenziale di primo grado x0 (t) = f (t, x(t)) con la condizione iniziale x(t0 ) = x0 . Supponiamo che in un intorno |t − t0 | ≤ e |x − x0 | ≤ η la funzione f (t, x) sia continua e perciò limitata, cioè |f (t, x)| ≤ M con M > 0. La soluzione di tale problema coincide con la soluzione dell’equazione integrale, detta equazione di Volterra: Z t f s, x(s) ds + x0 . x(t) = t0 Per tale funzione vale infatti x0 (t) = f (t, x(t)) con x(t0 ) = x0 . Introduciamo quindi l’operatore Z t B : Bx ≡ f s, x(s) ds + x0 . t0 Se questo operatore trasforma un certo intorno di C[a,b] in se stesso e risulta essere un operatore di contrazione in qualche norma, allora il problema di Cauchy ha localmente una e una sola soluzione ottenibile per approssimazioni successive a partire, ad esempio, da x0 stesso. Rt Rt x1 (t) = t0 f (s, x0 ) ds + x0 , . . . , xn+1 (t) = t0 f (s, xn (s)) ds + x0 . 82 Esaminiamo sotto quale ipotesi è possibile procedere in tal modo. Consideriamo in C[t0 −,t0 +] l’insieme delle funzioni continue nell’intorno chiuso It0 di centro t0 e raggio |t − t0 | ≤ , costituito dalla sfera Sxη0 (vedi la definizione 3.4) di centro x0 e raggio kx − x0 k ≤ η. Introduciamo la norma del max per essere sicuri di ottenere limiti continui e vediamo come B trasforma la nostra sfera chiusa. i) g(t) = [Bx](t) è senz’altro una funzione continua date le ipotesi sulla f (t, x(t)). Z ii) kBx − x0 k = max | t∈It 0 |t − t0 | · ≤ max t∈It 0 t f s, x(s) ds| ≤ t0 max t∈It ,x∈Sxη 0 |f (t, x)| ≤ M. 0 Da qui segue che ed η non possono essere scelti in modo indipendente. Infatti, solo se ≤ η/M l’operatore B trasforma la sfera Sxη0 in se stessa. iii) Con l’opportuna scelta di come in ii), per ogni coppia x, y ∈ Sxη0 si ha che Rt kBx − Byk ≤ maxt∈It t0 |f s, x(s) − f s, y(s) | ds. 0 Se la funzione f (t, x) oltre a essere continua e perciò limitata soddisfa anche la condizione di Lipschitz rispetto alla variabile x nella sfera Sxη0 , uniformemente per ogni t ∈ It0 , e cioè |f (t, x) − f (t, y)| ≤ K|x − y|, allora per ogni t ∈ It0 e per ogni coppia x, y ∈ Sxη0 , vale la diseguaglianza: Z kBx − Byk ≤ K max t∈It 0 t x(s) − y(s) ds ≤ Kkx − yk. t0 Quindi, se oltre a ≤ η/M vale anche la maggiorazione ≤ 1/K, l’operatore B è di contrazione e il problema di Cauchy ha una e una sola soluzione nell’intervallo ridotto It0 con ≤ min(η/M, 1/K). La soluzione inoltre può essere ottenuta per via iterativa dall’equazione di Volterra precedentemente introdotta. 4.3 EQUAZIONE DI FREDHOLM Nella precedente applicazione delle tecniche iterative alla risoluzione del problema del punto fisso, abbiamo trattato le equazioni integrali a limiti variabili, o 83 di Volterra. Consideriamo ora le equazioni integrali a limiti fissi, o equazione di Fredholm, per le quali tale tecnica risulta più vantaggiosa potendosi trattare le iterazioni mediante il calcolatore elettronico. Consideriamo anzitutto la forma generale (non lineare) di tali equazioni: Z b x(t) = λ K t, s, x(s) ds a e studiamo le condizioni sotto le quali esiste la soluzione iterativa. Sia K(t, s, x) una funzione continua nel cubo a ≤ {t, s} ≤ b e |x| ≤ η, ivi limitata da M > 0. Consideriamo in C|a,b] la sfera S0η di centro x = 0 e raggio η, ove l’operatore integrale è senz’altro definito. Qui: kAxk ≤ max λ b Z t∈[a,b] K t, s, x(s) ds ≤ |λ|M (b − a). a Pertanto, se |λ| ≤ η/ M (b − a) , allora kAxk ≤ η e l’operatore A trasforma la sfera chiusa in se stessa. Inoltre, kAx − Ayk = max λ t∈[a,b] K t, s, x(s) − K t, s, y(s) ds ≤ a Z ≤ |λ| max t∈[a,b] Z b b K t, s, x(s) − K t, s, y(s) ds. a Se facciamo l’ulteriore ipotesi che la funzione K(t, s, x) sia Lipschitziana rispetto a x, uniformemente nel quadrato a ≤ {t, s} ≤ b con costante K, allora: kAx − Ayk ≤ |λ|(b − a)K max x(s) − y(s) ≤ |λ|(b − a)Kkx − yk. s∈[a,b] Quindi, se |λ|(b − a)K < 1, l’operatore A è di contrazione ed esiste ed è unica la soluzione della nostra equazione integrale di Fredholm non lineare. Essa è otteni Rb bile dallo schema iterativo: xn+1 (t) = a K t, s, xn (s) ds, dove potremo scegliere per x0 (t) una qualsiasi funzione continua in [a, b] soddisfacente a max |x0 (t)| ≤ η. Per riassumere, lo schema iterativo è applicabile per |λ|(b − a) ≤ min η/M , 1/K . 84 Consideriamo ora l’equazione di Fredholm lineare. Sia data l’equazione b Z x(t) = λ K(t, s)x(s) ds + f (t), a con λ parametro reale, f (t) funzione continua in [a, b] e K(t, s) continua nel quadrato a ≤ {s, t} ≤ b. Definiamo in C[a,b] con la norma del max l’operatore Z b B : Bx = λ K(t, s)x(s) ds + f (t). a Essendo K(t, s) continua in un intervallo chiuso e limitato, è anche limitata, cioè |K(t, s)| ≤ M . Pertanto, kBx − Byk = max λ b Z t∈[a,b] K(t, s) x(s) − y(s) ds ≤ a ≤ |λ|M (b − a) max x(s) − y(s) = |λ|M (b − a)kx − yk. s∈[a,b] Quindi, per |λ| < 1/[M (b − a)] l’operatore B è un operatore di contrazione ed esiste il limite uniforme (cioè con la norma del max) del processo iterativo: Rb xn+1 (t) = λ a K(t, s)xn (s) ds + f (t). Una possibile scelta del dato iniziale è data da x0 (t) = f (t). Esempio 9. Consideriamo in C[0,1] l’equazione di Fredholm: Z 1 ts · x(s) ds + αt x(t) = λ 0 essendo α un qualsiasi parametro reale. Poichè maxt,s∈[0,1] K(t, s) = 1 e b − a = 1, per |λ| < 1/ M (b − a) = 1, l’operatore in questione è un operatore di contrazione e si può risolvere il problema per approssimazioni successive: x0 = αt ≡ α0 t R1 x1 = λ 0 ts · (α0 s) ds + αt = (α + α0 λ/3)t ≡ α1 t . xn+1 = λ R1 0 ts · (αn s) ds = (α + αn λ/3)t ≡ αn+1 t. Per |λ| < 1 esiste il limite x = limn→∞ xn e quindi esiste anche il limite 85 β = limn→∞ αn , per cui possiamo passare al limite nell’ultima eguaglianza: α+λβ/3 = β, da cui si ottiene β = 3α/(3−λ) e, in conclusione x(t) = 3α/(3−λ)t. Abbiamo ottenuto questa soluzione nell’ipotesi |λ| < 1, ma si può facilmente vedere che il limite di αn per n → ∞, esiste anche per altri valori di λ, come per altro suggerito dal valore stesso del limite. Infatti: αn+1 = α + αn λ/3 =. . . = α 1 + λ/3 + (λ/3)2 +. . . +(λ/3)n+1 . Quindi αn (t) → 3α/(3 − λ) per |λ| < 3. La condizione |λ| < 1 è una condizione sufficiente per la convergenza del processo iterativo che, come appena visto, ha un più ampio dominio di convergenza. Ancora più in generale, la funzione x(t) trovata è in realtà soluzione del problema di partenza per ogni λ 6= 3. Ma queste ovviamente sono condizioni a posteriori. 5. OPERATORE INVERSO Affrontiamo l’ultimo importante argomento del capitolo dedicato agli spazi normati: studiamo sotto quali condizioni esiste l’inverso di un operatore assegnato. Come abbiamo già visto in alcuni esempi, l’esistenza dell’operatore inverso è legata alla risolubilità di ben noti problemi: uno per tutti, la risolubilità dei sistemi lineari è legata all’esistenza dell’inverso della matrice dei coefficienti. Osservazione 16. Nel capitolo sugli spazi lineari, abbiamo già affrontato i problemi connessi al dominio e codominio di un operatore A e del suo inverso A−1 , ove questo esiste. Abbiamo visto anche che per operatori lineari in spazi lineari: i) Se A−1 esiste, anche A−1 è lineare. ii) A−1 esiste se e solo se Ax = 0 ammette come unica soluzione x = 0. Negli spazi normati possiamo enunciare il seguente teorema di esistenza: Teorema 5. Dato un operatore lineare A da uno spazio normato N in un altro spazio normato N 0 , condizione necessaria e sufficiente affinchè A−1 esista con DA−1 = RA e sia limitato, è che esista una costante C > 0 tale che, per ogni x ∈ DA , valga la diseguaglianza kAxk ≥ Ckxk. In tal caso si avrà anche kA−1 k ≤ 1/C. 86 Dimostrazione. La condizione è necessaria. Infatti, se A−1 esiste (lineare) ed è limitato con kA−1 k ≤ 1/C , si consideri ∀y ∈ RA il suo trasformato secondo A−1 : x = A−1 y. Segue che kxk ≤ kA−1 kkyk e quindi kAxk = kyk ≥ (1/kA−1 k)kxk ≥ Ckxk. La condizione è sufficiente. Sia kAxk ≥ Ckxk. Allora, se Ax̄ = 0 , si ottiene 0 = k0k = kAx̄k ≥ Ckx̄k che è verificata solo per kx̄k = 0 e cioè per x̄ = 0 . Quindi A−1 esiste (lineare) e posto y = Ax, si ottiene kyk ≥ CkA−1 yk e quindi kA−1 k ≤ 1/C. Studiamo ora una importante applicazione di quanto detto sull’operatore inverso al problema disomogeneo x = Ax + f . 5.1 OPERATORE RISOLVENTE In uno spazio di Banach B (normato e completo) supponiamo di volere risolvere l’equazione x = Ax + f riducendola a una equazione al punto fisso per l’operatore D : Dx = Ax + f (vedi l’osservazione 15). Abbiamo già visto che la soluzione di tale equazione esiste ed è unica se l’operatore A è di contrazione. In termini più generali, l’equazione x = Ax + f può essere risolta formalmente da x = (I − A)−1 f e pertanto la sua soluzione è legata all’esistenza e al dominio dell’operatore inverso (I − A)−1 . Dimostriamo pertanto il seguente: Teorema 6. Sia A un operatore lineare e limitato definito su tutto B e con kAk ≤ q < 1. Allora l’operatore (I − A)−1 esiste lineare e limitato con k(I − A)−1 k ≤ 1/(1 − q). Inoltre, D(I−A)−1 = R(I−A) = B. Dimostrazione. Cominciamo a dimostrare l’esistenza di (I − A)−1 quale operatore limitato. i) kAxk ≤ kAkkxk ≤ qkxk; ii) k(I − A)xk = kx − Axk ≥ kxk − kAxk, come segue dalla osservazione 2.iv; iii) k(I − A)xk ≥ kxk − qkxk = (1 − q)kxk, come segue dalle i) e ii). Dal teorema precedente segue allora che (I − A)−1 esiste (lineare), è limitato e 87 vale k(I − A)−1 k ≤ 1/(1 − q). Per dimostrare che il codominio dell’operatore (e il dominio dell’inverso) coincide con tutto B, occorre dimostrare che per ogni f ∈ B esiste un x̄ ∈ B tale che (I − A)x̄ = f , ovvero x̄ = Ax̄ + f . In altri termini, definito l’operatore B : Bx = Ax + f , deve esistere la soluzione al problema del punto fisso per B, cioè x = Bx, qualunque sia f . Ora, kBz − B z̃k = kAz − Az̃k ≤ qkz − z̃k con q < 1, per cui B è un operatore di contrazione, e pertanto l’equazione disomogenea x = Ax + f ha una e una sola soluzione qualunque sia f ∈ B. Osservazione 17. Quanto detto sopra si riferiva solo all’esistenza dell’operatore (I − A)−1 e quindi all’esistenza della soluzione del problema x = Ax + f . L’esistenza è assicurata per ogni f ∈ B grazie alla proprietà sopra dimostrata: D(I−A)−1 = R(I−A) = B. Per la costruzione esplicita di tale soluzione, avendo supposto A essere un operatore di contrazione, si può procedere come già visto per approssimazioni successive: x0 = f ; x1 = Af + f ; x2 = Ax1 + f = A2 f + Af + f ; . . . ; P∞ x̄ = i=0 Ai f , (A0 ≡ I). P∞ Nel prossimo teorema vedremo che la serie a valori operatoriali i=0 Ai , detta serie di Neumann, fornisce un limite all’operatore (I − A)−1 , non solo in senso puntuale, ma anche in senso uniforme. Introduciamo però prima la seguente: Definizione 11. L’operatore Rλ = (I − λA)−1 , ove esista, si definisce operatore risolvente di A. Una notazione alternativa è data da Rµ = (µI − A)−1 . Teorema 7. Sia |λ|kAk ≤ q < 1. Allora, l’operatore risolvente (I − λA)−1 è P∞ dato da Rλ = i=0 λi Ai , dove la serie esiste come limite uniforme in B(A). Dimostrazione. Abbiamo visto in precedenza che l’equazione x − λAx = f possiede una e una sola soluzione se vale la maggiorazione |λ|kAk ≤ q < 1, nel qual P∞ caso la serie x = i=0 λi Ai f esiste e fornisce la soluzione cercata. Poichè abbiamo mostrato che tale soluzione esiste per ogni f ∈ B, possiamo anche affermare che Pn l’operatore Sn = i=0 λi Ai converge puntualmente all’operatore risolvente Rλ . 88 Mostriamo che la convergenza Sn → Rλ per n → ∞ vale in realtà uniformemente nello spazio di Banach B(A) degli operatori lineari e limitati definiti su tutto B. Infatti, poichè kABxk ≤ kAkkBxk ≤ kAkkBkkxk, allora kAn k ≤ kAkn . Pertanto, kSn+p − Sn k = kλn+1 An+1 + λn+2 An+2 + . . . +λn+p An+p k ≤ ≤ |λ|n+1 kAkn+1 + |λ|n+2 kAkn+2 + . . . +|λ|n+p kAkn+p ≤ ≤ (q n+1 + q n+2 + . . . +q n+p ). Quest’ultima quantità tende a zero per n → ∞ ∀ p , poichè la serie P∞ i=0 q i è convergente e quindi anche di Cauchy. Ma allora è di Cauchy anche la successione {Sn } di operatori; poichè lo spazio B(A) è uno spazio completo, la successione P∞ {Sn } è convergente. Quindi, l’operatore i=0 λi Ai esiste come limite uniforme in B(A). Poichè esiste anche come limite puntuale per ogni f ∈ B e la sua azione P∞ coincide con quella dell’operatore Rλ , ne segue che la eguaglianza i=0 λi Ai = Rλ = 1/(I − λA) vale in senso operatoriale, cioè secondo la convergenza uniforme della serie. Esempio 10. Consideriamo l’equazione di Fredholm lineare: Rb x(t) = λ a K(t, s)x(s) ds + f (t) = λAx + f con K(t, s) continua nel quadrato a ≤ {t, s} ≤ b e f (t) continua in [a, b]. Poichè |K(t, s)| ≤ M e kAk ≤ |λ|M (b − a) ≡ q , per quei valori di λ per i quali q < 1, lo sviluppo in serie del risolvente converge uniformemente. Converge cioè uniformemente la serie degli operatori: Rb Rb A1 ≡ A = a K1 (t, s)(∗) ds ; A2 = a K2 (t, s)(∗) ds ; . . . ; Rb An = a Kn (t, s)(∗) ds ; . . . con: Rb K1 (t, s) = K(t, s) , K2 (t, s) = a K(t, u)K(u, s) du ; . . . ; Rb Kn (t, s) = a Kn−1 (t, u)K(u, s) du. Conseguentemente, si ha anche la convergenza debole della serie P∞ i R b i=1 λ a Ki (t, s)f (s) ds . Inoltre, possiamo dimostrare che la serie dei nuclei integrali converge uniformemente. Infatti, per ogni termine vale la maggiorazione |λi Ki (t, s)| ≤ |λ|i M i (b − a)i ≤ q i , per ogni t ed s compresi tra a e b, e la serie dei q i è convergente essendo per ipotesi q < 1. Quindi, P∞ i i=1 λ Ki (t, s) = K(t, s; λ). La funzione K(t, s; λ) , detta nucleo risolvente è 89 una funzione continua nel quadrato a ≤ {t, s} ≤ b in quanto limite uniforme di Rb funzioni continue. Da qui segue: x(t) = f (t) + a K(t, s; λ)f (s) ds . Per quanto detto prima, anche il limite uniforme potrà essere espresso con lo stesso operatore e quindi Rλ = 1/(I − λA) = I + Kλ ove ovviamente Kλ è l’operatore integrale Rb di nucleo K(t, s; λ) e cioè Kλ ≡ a ds K(t, s; λ)(∗) . Esempio 11. Consideriamo l’equazione integrale R π/2 x(t) = sin t − t/4 + 1/4 0 ts · x(s) ds. Il nucleo integrale K(t, s) = ts soddisfa la diseguaglianza |K(t, s)| ≤ π 2 /4. Inoltre b − a = π/2 e λ = 1/4 < 1/ M (b − a) = 8/π 3 . Possiamo pertanto applicare gli sviluppi in serie studiati nel precedente esempio. Il nucleo risolvente è dato dallo sviluppo: K(t, s; λ) = λK(t, s) + λ2 K2 (t, s) + λ3 K3 (t, s) + ... , dove R π/2 R π/2 K1 (t, s) = ts , K2 (t, s) = 0 tuus du = αts (con α ≡ 0 u2 du = π 3 /24) , R π/2 R π/2 K3 (t, s) = 0 K2 (t, u)K1 (u, s) du = α 0 tuus du = α2 ts , ... Kn (t, s) = αn−1 ts. Valutiamo ora la serie dei nuclei data da: K(t, s; λ) = λ ts + λαts + (λα)2 ts + ... = λ ts/(1 − λα) , poichè λα = π 3 /(4 · 24) < 1 . La soluzione del nostro problema è quindi data da: R π/2 x(t) = sin t − t/4 + 1/4 0 1/(1 − α/4) · ts(sin s − s/4) ds = R π/2 = sin t − t/4 + 1/4 · 1/(1 − α/4) · t 0 (s sin s − s2 /4) ds. R π/2 R π/2 π/2 π/2 Poichè 0 s sin s = −s cos s|0 + 0 cos s ds = sin s|0 = 1, otteniamo infine: x(t) = sin t − t/4 + t/(4 − α) · (1 − α/4) = sin t − t/4 + t/4 = sin t . Nel paragrafo 4.2 abbiamo studiato l’equazione generale di Volterra. Riprendiamo ora l’argomento nel caso lineare, da confrontarsi con l’esempio 10 sulla equazione di Fredholm lineare. Esempio 12. Consideriamo in C[a,b] l’equazione lineare di Volterra: Rt x(t) = λ a K(t, s)x(s) ds + f (t) = λAx + f , con le solite ipotesi di continuità e di limitatezza per K(t, s) e per f (t). E sia max{t,s}∈[a,b] |K(t, s)| = M e maxt∈[a,b] |f (t)| = F . Rispetto all’ esempio 10, qui l’integrale non si estende su tutto [a, b] ma solo fino a t che diventa a sua volta variabile di integrazione nella 90 iterazione successiva. Poichè di solito le integrazioni rendono più lisce le funzioni, ci attendiamo di ottenere condizioni più favorevoli sui valori di λ per i quali è lecita la soluzione iterativa. Consideriamo pertanto la soluzione P∞ P∞ x(t) = i=0 λi Ai f = i=0 λi φi , che senz’altro esiste almeno per quei valori di λ trovati per l’equazione di Fredholm lineare. Valgono le seguenti stime: Rt |φ1 (t)| ≤ a |K(t, s)f (s)| ds ≤ M F (t − a) , Rt Rt |φ2 (t)| ≤ a |K(t, s)φ1 (s)| ds ≤ M 2 F a (s − a) ds = M 2 F (t − a)2 /2 , ... |φn | ≤ M n F (t − a)n /n!. P∞ Ne segue che la serie di funzioni i=0 λi φi è maggiorata in modulo dalla serie: P∞ F · i=0 |λ|i M i (t − a)i /i! = F e|λ|M (t−a) , convergente per ogni valore di λ. La funzione x(t) pertanto esiste continua ed è soluzione dell’equazione di Volterra per ogni λ. Osservazione 18. Nel caso dell’equazione di Fredholm dell’esempio 10 e per |λ| ≤ 1/ M (b − a) , esiste una e una sola soluzione per ogni termine noto Rb f (t). Pertanto, anche l’equazione omogenea associata x(t) = λ a K(t, s)x(s) ds ammette, per gli stessi valori di λ, la unica soluzione x(t) ≡ 0. Per gli altri valori di λ per i quali non è garantita la unicità della soluzione, l’equazione omogenea può avere anche soluzioni diverse da quella banale identicamente nulla. Questo fatto è noto come alternativa di Fredholm. Per le equazioni lineari di Volterra questo fenomeno non si verifica in quanto, come abbiamo visto, la soluzione esiste ed è unica per ogni valore di λ. Per cui Rt l’equazione omogenea x(t) = λ a K(t, s)x(s) ds ammette la sola soluzione nulla. Esempio 13. Vediamo in un caso concreto come l’equazione di Fredholm lineare omogenea ammetta soluzioni diverse dalla nulla. Data l’equazione: R1 x(t) = λ 0 (t + s) x(s) ds , introduciamo le costanti c1 e c2 date da: R1 R1 x(t) = λt 0 x(s) ds + λ 0 sx(s) ds ≡ λtc1 + λc2 . Inserendo questa forma della x(t) nell’equazione di partenza si ottiene: R1 λtc1 + λc2 = λ 0 (t + s)(λsc1 + λc2 ) ds = λ2 c1 t/2 + c2 t + c1 /3 + c2 /2 . Eguagliando i coefficienti dei termini simili ricaviamo: c1 = λc1 /2 + λc2 ; c2 = λc1 /3 + λc2 /2. 91 √ Le due equazioni sono compatibili per λ = 6 ± 4 3 e il sistema ammette infinite soluzioni (essendo omogeneo) date da: c1 = α·2λ/(2−λ) , c2 = α con α parametro arbitrario. La soluzione non banale della nostra equazione è quindi data da: x(t) = λ 2λt/(2 − λ) + 1 , a meno di un fattore di proporzionalità arbitrario. √ Ovviamente, |λ| = 6 ± 4 3 > 1/2 , valore al di sotto del quale si avrebbe unicità della soluzione. Osservazione 19. Negli esempi trattati si è sempre utilizzata la norma del max , per essere sicuri di non uscire dallo spazio delle funzioni continue. Anche le stime per ricavare esistenza e unicità delle soluzioni sono state fatte ovviamente con la stessa norma. Questo non esclude che esistano anche soluzioni non continue che noi abbiamo escluso a priori. Vediamo infatti, per concludere, il seguente esempio. Esempio 14. Consideriamo l’equazione omogenea di Volterra: Rt x(t) = 0 st−s x(s) ds , per 0 ≤ t ≤ 1. Il nucleo K(t, s) = st−s è continuo nel dominio di integrazione per s ≤ t e pertanto l’equazione di Volterra omogenea ammette la unica soluzione continua x ≡ 0. Esistono però infinite soluzioni non appartenenti a C[a,b] date da x(t) = αtt−1 con α costante arbitraria. Infatti, x(t) → ∞ per t → 0 e: t R t t−s s−1 Rt s s ds = 0 st−1 ds = st /t0 = tt−1 . 0 Come già visto più volte in altri esempi, un problema può avere soluzioni diverse a seconda dello spazio entro il quale il problema viene ambientato. 92 6. FUNZIONALI LINEARI LIMITATI Tutto quanto è stato detto a proposito degli operatori lineari limitati vale ovviamente per i funzionali lineari limitati. In particolare, grazie al teorema 1, i funzionali lineari in uno spazio normato N sono limitati se e solo se sono continui nell’intorno dello zero. Grazie alla continuità delle traslazioni, grazie cioè al fatto che uno spazio normato è uno spazio lineare topologico, la continuità in zero comporta la continuità in ogni punto di N . Per questo parleremo indifferentemente di funzionali limitati o continui. Ricordiamo anche che nella definizione 8 si era introdotto il concetto di spazio coniugato N ∗ di uno spazio normato N quale spazio di Banach dei funzionali lineari limitati su N . La norma introdotta in N ∗ è data da ||F || = sup||x||≤1 |F (x)| e dipende quindi dalla norma dello spazio N su cui sono definiti i funzionali. Esempio 15. Sia dato lo spazio di Banach RN dell’esempio 1 con la norma qP N 2 kxk = i=1 |ξi | . Esso diventa l’ordinario spazio euclideo N -dimensionale con PN l’introduzione del prodotto scalare (y, x) = i=1 ηi ξi . Questa espressione, a y fissato, definisce un funzionale ovviamente lineare, e limitato. Grazie infatti alla diseguaglianza di Schwarz (vedi il teorema 3.1), si ha: |Fy (x)| = |(y, x)| ≤ ||y||||x||. Da qui si ricava che ||Fy || = sup||x||≤1 |Fy (x)| ≤ ||y||, e valutando il funzionale in x = y si ottiene ||Fy || = ||y||. Il prodotto scalare è in realtà il più generale funzionale lineare limitato in RN , nel senso che ad ogni funzionale F corrisponde un vettore yF ∈ RN tale che (yF , x) = F (x) per ogni x ∈ RN . Qui infatti il funzionale F è assegnato se è assegnato sui vettori della base usuale (ei ) dell’esempio 1.7, definiti da ei = (δik ). Dati PN PN F (ei ) = ηi e x = (ξi ) = i=1 ξi ei , dalla linearità di F si ottiene F (x) = i=1 ξi ηi e posto yF = (ηi ), si ottiene infine F (x) = (yF , x). Esempio 16. Analoghe proprietà si ottengono nel caso complesso dei C N , con PN la differenza che in questo caso si definisce il prodotto scalare (y, x) = i=1 ηi∗ ξi che risulta pertanto lineare nel secondo membro ma antilineare nel primo, ovvero ∗ (αy, x) = α∗ (y, x). Questo comporta che lo spazio coniugato CN generato da questo prodotto scalare è uno spazio antilineare di funzionali lineari, ovvero invertendo il 93 ruolo dei due fattori, uno spazio lineare di funzionali antilineari. Osservazione 20. Considerazioni simili a quelle dell’esempio 15 a proposito delle basi, possono essere ripetute in generale per uno spazio N -dimensionale reale o complesso. Data infatti una qualsiasi base (ei ) e assegnato su di questa un PN funzionale lineare F , questo risulta definito su tutti gli elementi x = i=1 ξi ei dalla PN relazione F (x) = i=1 F (ei )ξi . Se inoltre consideriamo i funzionali Gi definiti da Gi (ej ) = δij , essi risultano in modo ovvio linearmente indipendenti e tali che Gi (x) = ξi . Quindi, l’azione del generico funzionale F può essere riscritta come PN PN F (x) = i=1 F (ei )Gi (x) e cioè F = i=1 F (ei )Gi . I funzionali (Gi ) sono detti la base coniugata a (ei ) nello spazio coniugato C ∗ e i numeri F (ei ) le componenti di F in questa base. Esempio 17. Sia N = C[a,b] con la norma del max. L’integrale Rb F (x) = a x(t) dt definisce un funzionale lineare limitato con norma ||F || = b − a. Rb Infatti |F (x)| = | a x(t) dt| ≤ (b − a) maxt∈[a,b] |x(t)| = (b − a)||x||, e per x uguale alla funzione costante vale il segno di uguale. Esempio 18. In C[a,b] con la norma del max sia data la funzione y(t). Rb L’integrale Fy (x) = a x(t)y(t) dt definisce un funzionale lineare e limitato. Rb Rb Infatti: |F (x)| = | a x(t)y(t) dt ≤ ||x|| a |y(t)|dt . Poichè per x(t) uguale alla Rb funzione costante e y ≥ 0 vale il segno di uguale, si ha: ||F || = a |y(t)|dt. Esempio 19. Consideriamo in C[a,b] con la norma del max la delta di Dirac, ovvero il funzionale definito da: δt0 (x) = x(t0 ). Esso rappresenta la generalizzazione continua della delta di Kronecker δik (vedi l’esempio 8). E’ lineare e limitato. Vale infatti ||δt0 || = |x(t0 )| ≤ ||x||, e poichè per x costante vale il segno di uguale, si ha ||δt0 || = 1. Esempio 20. Consideriamo ancora C[−a,a] ma questa volta con la norma dell’integrale come nell’esempio 4, e il funzionale δ0 . Questo funzionale è lineare ma non è limitato. Sia data infatti la successione di funzioni gaussiane: r 2 2 n xn (t) = √ e−n x /2 . π Per queste vale R∞ −∞ |xn (t)|2 dt = 1, ed è trascurabile l’integrale per |t| > a se 94 na 1. Pertanto ||xn || → 1 per n → ∞. Ma δ0 (xn ) = q √n π e quindi non esiste nessuna costante K tale che |δ0 (xn )| ≤ K||xn || per tutti gli elementi della successione {xn }. Questo controesempio non si applica all’esempio 19 in quanto con la norma del q max si avrebbe ||xn || = √nπ che non rimane affatto limitata per n → ∞. Esempio 21. Consideriamo lo spazio lp delle successioni x ≡ (ξi ) di numeri P∞ complessi tali che i=1 |ξi |p < ∞ con p > 1 (vedi l’esempio 2). Mostriamo che il più generale funzionale lineare e limitato su lp è generato dagli elementi y di lq con q > 1 e 1/p + 1/q = 1 e ha norma ||Fy || = ||y||q . Quindi, lp∗ e lq sono congruenti (vedi la definizione 3). Dato infatti y = (ηi ) ∈ lq , il funzionale Fy (x) = P∞ i=1 ηi∗ ξi è lineare e risulta definito per ogni x ∈ lp grazie alla diseguaglianza di Schwarz-Hölder: ∞ X |ξi ηi | ≤ i=1 ∞ X p 1/p |ξi | i=1 ∞ X |ηi |q 1/q . i=1 Si ha inoltre |Fy (x)| ≤ ||x||p ||y||q e pertanto Fy è un funzionale lineare limitato con ||F || ≤ ||y||q . Esiste però un x ∈ lp per il quale vale il segno di uguale. Infatti, sia x di componenti ξi = ηi |ηi |q/p−1 . Poichè |ξi |p = |ηi |q , allora x ∈ lp . Inoltre: F (x) = ∞ X i=1 ηi∗ ξi = ∞ X i=1 |ηi |q/p+1 = ∞ X |ηi |q = i=1 ∞ X |ηi |q ∞ 1/p X i=1 |ηi |q 1/q . i=1 Abbiamo qui sfruttato il fatto che q/p+1 = q e 1/p+1/q = 1. Nella diseguaglianza di Schwarz-Hölder vale quindi l’uguale e dunque ||F || = ||y||q . Viceversa, mostriamo che ogni funzionale lineare limitato definito su lp è della P∞ ∗ forma Fy (x) = i=1 ηi ξi con y = (ηi ) ∈ lq e ||F || = ||y||q essendo q definito come prima. Possiamo ripetere qui il procedimento applicato al caso finito dimensionale dell’esempio 15, introducendo la base usuale ei = (δik ), tramite la quale il funzionale F , lineare limitato, può essere definito in tutto lo spazio. Infatti, P∞ P∞ ∗ dati F (ei ) = ηi∗ si ottiene F (x) = F ( i=1 ξi ei ) = i=1 ηi ξi , convergente per l’ipotesi di limitatezza del funzionale. Consideriamo ora i vettori xn = (ξn;i ) con le componenti definite da: ξn;i = ηi |ηi |q/p−1 per i = 1, 2, .., n e ξn;i = 0 per i > n. 95 Allora: ||xn ||p = P |F (xn )| = n i=1 n X q |ηi | 1/p , da cui segue che n X 1/p |ηi |q ≤ ||F || ||xn ||p = ||F || , |ηi |q i=1 i=1 e quindi, per ogni n: n X |ηi |q 1/q ≤ ||F ||. i=1 Essendo per ipotesi F limitato, esiste il limite della sommatoria di sinistra e pertanto y = (ηi ) ∈ lq . E in tal caso abbiamo visto prima essere ||F || = ||y||q . Esempio 22. Con riferimento all’esempio precedente, mostriamo che il più generale funzionale lineare limitato definito su l1 è definito da elementi di y ∈ l∞ , cioè da successioni (ηi ) limitate con ||y||∞ = supi |ηi | (vedi l’esempio 3.6). Anche in questo caso: ||Fy || = ||y||∞ , e quindi l1∗ e l∞ sono congruenti. P∞ ∗ Sia dato inizialmente y = (ηi ) ∈ l∞ . Allora Fy (x) = i=1 ηi ξi definisce un funzionale lineare limitato su tutti gli x ∈ l1 , con ||Fy || ≤ ||y||∞ . Infatti P∞ |Fy (x)| ≤ supi |ηi | i=1 |ξi | = ||y||∞ ||x||1 . Viceversa, sia definito il funzionale lineare limitato F ∈ l1∗ da F (ei ) = ηi∗ , ovvero P∞ F (x) = i=1 ηi∗ ξi . Mostriamo che la successione ηi deve essere limitata. A tal scopo, scegliamo i vettori xn definiti dalle componenti ξin = ηi /|ηi | per i = n e ξin = 0 per i 6= n. Vale ||xn ||1 = 1 e F (xn ) = |ηn |, e poichè deve valere anche |F (xn )| = |ηn | ≤ ||F ||||xn ||1 = ||F ||, segue che (ηi ) è una successione limitata e definisce un vettore y ∈ l∞ con ||y||∞ ≤ ||F ||. Dal confronto con la relazione precedente, segue che ||F || = ||y||∞ . Osservazione 21. Si può dimostrare che non vale il reciproco dell’esempio ∗ 22, ovvero l∞ non è congruente a l1 . Lo spazio l1 è congruente allo spazio coniugato delle successioni (ξi ) convergenti a zero e con ||x|| = supi |ξi |. (Vedi A.E.Taylor, paragrafo 4.32). 96 6.1 TEOREMI DI HAHN-BANACH Analogamente a quanto visto nel teorema 2 sugli operatori, un funzionale lineare limitato definito densamente in uno spazio normato può essere esteso a tutto lo spazio mantenendo la propria norma. La possibilità di estensioni più generali, ad esempio da sottospazi propri mantenendo determinate caratteristiche quali continuità o altro, dipende dai dettagli del problema. Nel caso di funzionali lineari limitati le condizioni sono stabilite dal seguente teorema di Hahn-Banach, che ha vaste applicazioni in tutta la teoria degli spazi coniugati di spazi lineari topologici. Teorema 8. Sia dato uno spazio normato complesso N e un funzionale lineare limitato F0 ∈ N0∗ definito cioè nel sottospazio N0 . Allora esiste un prolungamento lineare limitato F definito su tutto N , con norma invariata, ovvero: F (x) = F0 (x) per x ∈ N0 e ||F || = ||F0 ||. Ritroveremo il teorema 8 e la sua dimostrazione alla fine del paragrafo, mentre ora ne anticipiamo alcune semplici conseguenze, relative alle proprietà separanti dei funzionali, cioè alla capacità di distinguere tra diversi elementi di uno spazio N. Teorema 9. Se N è uno spazio lineare normato e x0 ∈ N con x0 6= 0, allora esiste un funzionale F ∈ N ∗ tale che ||F || = 1 e F (x0 ) = ||x0 ||. Da cui segue anche che sup||F ||=1 |F (x)| = ||x||, per ogni x ∈ N . Dimostrazione. Sia N0 il sottospazio di N generato da x0 . Posto x = α x0 , definiamo F0 (x) = α ||x0 ||. Chiaramente, F0 è un funzionale lineare limitato in N0 , cioè F0 ∈ N0∗ , e vale ||F0 || = 1. Per il teorema 8 esiste allora l’estensione F a tutto N , con le caratteristiche richieste. Teorema 10. Sia x ∈ N normato tale che F (x) = 0 per ogni F ∈ N ∗ . Allora x = 0. Dimostrazione. Dal teorema precedente, in particolare dalla proprietà sup||F ||=1 |F (x)| = ||x|| ∀x ∈ N , segue l’asserto. Teorema 11. Siano N e N0 uno spazio normato e un suo sottospazio proprio. 97 Sia x e ∈ N − N0 a un distanza positiva h da N0 . Allora esiste F ∈ N ∗ con ||F || = 1 tale che F (e x) = h e F (x) = 0 per ogni x ∈ N0 . e il sottospazio generato da x e Dimostrazione. Sia N e e da N0 , cioè ogni y ∈ N è dato da y = α x e + x con α e x ∈ N0 univocamente determinati da y essendo e ∗ e ||Fe|| = 1. Infatti, x e 6∈ N0 . Definiamo Fe(y) = α h e mostriamo che Fe ∈ N se α 6= 0 abbiamo che ||y|| = ||α x e + x|| = || − α(−α−1 x − x e)|| ≥ α h, poichè −α−1 x ∈ N0 e x e dista h da N0 . Pertanto |Fe(y)| = |α|h ≤ ||y||. Diseguaglianza che vale ovviamente anche per α = 0. Quindi Fe, lineare, è limitato con ||Fe|| ≤ 1. Ma, dato > 0 esiste x ∈ N0 tale che ||x − x e|| < h + . Posto allora x−x e y= , ||x − x e|| e , ||y|| = 1, si ha che y ∈ N |Fe(y)| = h h > ||x − x e|| h+ e ||Fe|| > h . h+ Poichè h 6= 0 e ciò è vero per ogni > 0, si conclude che ||Fe|| ≥ 1. Dalla maggiorazione opposta vista precedentemente, segue che ||Fe|| = 1. Grazie al teorema 8, Fe può essere esteso a tutto N . Poichè Fe(e x) = h e Fe(x) = 0 per ogni x ∈ N0 la dimostrazione del teorema è completa. Torniamo ora alla dimostrazione del teorema di Hahn-Banach, per la quale è necessario anteporre le più generale versioni in spazi lineari sui reali e sui complessi. Preliminarmente consideriamo uno spazio lineare reale, cioè sul corpo dei reali e introduciamo nuove classi di funzionali, più generali di quelli lineari. Definizione 12. Sia R uno spazio lineare reale. Un funzionale reale p definito in R si dice convesso se p(α x+(1−α)y) ≤ αp(x)+(1−α)p(y), per tutti gli x, y ∈ R e 0 ≤ α ≤ 1. Ricordando la definizione 2.28 di insieme convesso, segue che un funzionale convesso trasforma insiemi convessi in insiemi convessi. Definizione 13. Un funzionale reale p is dice omogeneo positivo se, per ogni x ∈ R e per ogni α > 0, p(α x) = αp(x). 98 Osservazione 22. Riportiamo alcune proprietà dei funzionali omogenei positivi convessi. a) Vale la relazione p(x + y) ≤ p(x) + p(y). Infatti y x p(x + y) = 2p( x+y 2 ) ≤ 2 p( 2 ) + p( 2 ) = p(x) + p(y). b) Dalla definizione di omogeneità ponendo x = 0, segue che p(0) = 0. c) Dalla b) e dalla a) si ottiene che 0 = p x + (−x) ≤ p(x) + p(−x), per tutti gli x ∈ R. In particolare, se p(x) < 0 allora p(−x) > 0 e pertanto un funzionale omogeneo positivo convesso non nullo non può essere ovunque negativo. d) Per ogni α, vale p(α x) ≥ αp(x). Per α > 0 questo segue dalla omogeneità. Per α = 0 segue dalla b). Per α < 0, dalla c) segue che: 0 ≤ p(α x) + p(|α|x) = p(α x) + |α|p(x), e quindi p(α x) ≥ −|α|p(x) = αp(x). Esempio 23. Ogni funzionale lineare è ovviamente omogeneo positivo convesso. Data la funzione lineare f (x), il funzionale pf (x) = |f (x)| non è lineare, ma è omogeneo positivo convesso. La norma ||x|| in uno spazio lineare reale non è lineare ma definisce un funzionale positivo convesso. Definizione 14. Sia R uno spazio lineare reale e sia R0 un suo sottospazio. Sia inoltre F0 un funzionale lineare definito in R0 . Il funzionale lineare F è detto prolungamento del funzionale F0 se è definito in tutto R e se F (x) = F0 (x) per tutti gli x ∈ R0 . Siamo ora in grado di dimostrare il teorema di Hahn-Banach in spazi reali. Teorema 8’. Siano dati lo spazio lineare reale R, un suo sottospazio proprio R0 , il funzionale F0 lineare in R0 e il funzionale p omogeneo positivo convesso in R. Se F0 è maggiorato da p, ovvero F0 (x) ≤ p(x) per ogni x ∈ R0 , allora esiste un prolungamento lineare F di F0 definito in tutto R e maggiorato da p. Dimostrazione. Cominciamo a dimostrare che è possibile prolungare il funzionale F0 da R0 a uno spazio un poco più grande. e il sottospazio generato da ye e da R0 . Se z ∈ R, e Sia ye ∈ R ma ye 6∈ R0 , e sia R esso è della forma z = α ye + x con x ∈ R0 . Mostriamo che è possibile prolungare e mediante le definizioni: Fe(e il funzionale F0 a un funzionale lineare Fe in R y) = c e 99 Fe(α ye+x) = α c+F0 (x) con una scelta del numero c tale che valga la maggiorazione e Vogliamo cioè che, per ogni x ∈ R0 e ogni α reale, Fe(z) ≤ p(z) per ogni z ∈ R. sia verificata la diseguaglianza α c + F0 (x) ≤ p(α ye + x), che può essere separata nelle due seguenti: c ≤ p(e y + x/α) − F0 (x/α) c ≥ −p(−e y − x/α) − F0 (x/α) per α > 0, per α < 0. Mostriamo quindi che è possibile scegliere un valore c per il quale sono soddisfatte entrambe. Infatti, dati due elementi qualsiasi x0 , x00 ∈ R0 vale F0 (x00 ) − F0 (x0 ) ≤ p(x00 − x0 ) = P (x00 + ye) − (x0 + ye) ≤ p(x00 + ye) + p(−x0 − ye). Da cui si ricava: −F0 (x0 ) − p(−x0 − ye) ≤ −F0 (x00 ) + p(x00 + ye). Possiamo pertanto scegliere c in modo tale che sia 00 00 sup −F0 (x0 ) − p(−x0 − ye) ≤ c ≤ inf −F (x ) + p(x + y e ) . 0 00 x x0 Allora c soddisfa le due precedenti diseguaglianze e quindi il funzionale e Fe(α ye + x) ≡ α c + F0 (x) soddisfa la diseguaglianza Fe(z) ≤ p(z) per ogni z ∈ R. e ⊃ R0 Dunque, abbiamo prolungato il funzionale lineare F0 da R0 allo spazio R e mantenendo la maggiorazione Fe(z) ≤ p(z) per ogni z ∈ R. Se lo spazio complementare di R0 è finito dimensionale possiamo procedere iterativamente. Indicata con {xn } una base in questo spazio, consideriamo la successione crescente di sottospazi R(k+1) = {R(k) , xk+1 }, ove {R(k) , xk+1 } indica il sottospazio lineare minimale di R contenente R(k) e xk+1 , e R(0) = R0 . Con un numero finito di passi si esaurisce il procedimento e dunque il funzionale F0 può essere definito su ogni elemento di R. Per spazi generali, si può ugualmente terminare la dimostrazione facendo ricorso al Lemma di Zorn grazie al quale si può dimostrare l’esistenza di un elemento massimale nell’insieme di tutti i prolungamenti possibili del funzionale F0 soddisfacenti la condizione F (x) ≤ p(x). Per questa parte della dimostrazione e per il Lemma di Zorn, rimandiamo ad esempio a A.N.Kolmogorov e S.V.Fomin. Il teorema è cosı̀ completato. 100 Diamo ora la versione complessa del teorema di Hahn-Banach. A tal scopo premettiamo l’importante concetto di seminorma che verrà ripreso più estesamente nel prossimo capitolo. Definizione 15. Un funzionale reale p definito in uno spazio lineare complesso C si definisce seminorma, se soddisfa alle seguenti proprietà : I) p(α x) = |α|p(x), per ogni α reale o complesso, II) p(x + y) ≤ p(x) + p(y). Da I) segue che p(0) = 0. Da ciò e da II) segue che 0 = p(x − x) ≤ 2p(x) e quindi che p(x) ≥ 0. Da II) infine si ricava anche facilmente che |p(x) − p(y)| ≤ p(x − y). Se da p(x) = 0 segue che x = 0, allora il funzionale p definisce una norma. Teorema 8”. Siano dati lo spazio lineare complesso C, un suo sottospazio proprio C0 , la seminorma p in C, e F0 lineare in C0 . Se F0 è maggiorato da p, ovvero |F0 (x)| ≤ p(x) per ogni x ∈ C0 , allora esiste un prolungamento lineare F di F0 definito in tutto C e maggiorato da p. Dimostrazione. Dato un qualsiasi funzionale lineare complesso G, scomponendo il numero complesso G(x) in parte reale e parte immaginaria, possiamo scrivere G = GR + iGI , entrambi funzionali reali. Dalla linearità di G dal- tronde segue che G(ix) = iG(x) = iGR (x) − GI (x), per cui GR (x) = GI (ix) e G(x) = GR (x) − iGR (ix). Quindi, in sostanza, per estendere F0 è sufficiente estendere la sua parte reale. A tal scopo, definiamo C R e C0R gli insiemi di tutti gli elementi di C e di C0 strutturati però sui soli numeri reali. La seminorma p è def ovviamente un funzionale omogeneo positivo convesso in C R , e F0R (x) = Re F0 (x) è un funzionale lineare reale in C0R soddisfacente la condizione |F0R (x)| ≤ p(x); quindi anche F0R (x) ≤ p(x) per tutti gli x ∈ C0R . Grazie al teorema 8’, esiste il prolungamento lineare reale F R con: F R (x) ≤ p(x) per tutti gli x ∈ C R ≡ C F R (x) = F0R (x) per tutti gli x ∈ C0R ≡ C0 . Poichè inoltre −F R (x) = F R (−x) ≤ p(−x) = p(x), la maggiorazione vale per il modulo, ovvero: |F R (x)| ≤ p(x) per tutti gli x ∈ C R ≡ C. 101 def Introduciamo ora il funzionale F (x) = F R (x)−iF R (ix), definito in tutto C(≡ C R ) ed ovviamente lineare complesso con: F (x) = F0 (x) per ogni x ∈ C0 . Il funzionale F è perciò un’estensione di F0 e, per completare il teorema, dobbiamo dimostrare ancora che F è maggiorato da p cioè che vale |F (x)| ≤ p(x) per tutti gli x ∈ C. Per assurdo, sia |F (x̄)| ≥ p(x̄) per un certo x̄ ∈ C. Posto F (x̄) = ρeiφ e ȳ = e−iφ x̄, abbiamo F R (ȳ) = Re F (ȳ) = Re [e−iφ F (x̄)] = ρ = |F (x̄)| ≥ p(x̄) = p(ȳ). Ciò contraddice la precedente diseguaglianza su F R , e il teorema è dimostrato. Siamo cosı̀ in grado di dimostrare il teorema di Hahn-Banach in spazi normati, già enunciato all’inizio del paragrafo. Teorema di Hahn-Banach. Sia dato uno spazio normato complesso N e un funzionale lineare limitato F0 definito nel sottospazio N0 . Allora esiste un prolungamento lineare limitato F definito su tutto N , con norma invariata, ovvero: F (x) = F0 (x) per x ∈ N0 e ||F || = ||F0 ||. Dimostrazione. Posto ||F0 || = supx∈N0 |F0 (x)| = K, consideriamo il funzionale K|| ∗ ||, seminorma definita in tutto lo spazio complesso N ; vale inoltre |F0 (x)| ≤ K||x|| per tutti gli x ∈ N0 . Si può allora applicare il teorema 8” identificando la seminorma p con il funzionale K|| ∗ ||. Si conclude allora che esiste il prolungamento F a tutto N0 tale da mantenere la maggiorazione F (x) ≤ K||x|| per tutti gli x ∈ N . Essendo K la norma di F nel sottospazio N0 , per qualche x vale il segno di uguale e pertanto ||F || = ||F0 ||. CVD. 102 7. OPERATORI CHIUSI In questo paragrafo verranno introdotte due classi di operatori tra spazi normati, più generali di quelli lineari limitati trattati in precedenza, introdurremo cioè gli operatori chiusi e gli operatori compatti o completamente continui. I secondi sono definiti esclusivamente tra spazi normati, mentre i primi trovano un loro analogo nelle funzioni chiuse in spazi topologici. Peraltro, in questi spazi molto generali, anche il concetto di operatore limitato ha analogie con quello di funzione continua. In questi peraltro, non vengono ovviamente definiti gli operatori limitati, ma esiste per le funzioni il concetto di continuità già affrontato nel paragrafo 2.3. Tratteremo quindi i nuovi operatori anche in ambito strettamente topologico, e lo faremo qui per studiarli unitamente ai casi metrici e normati. Pertanto, riprendiamo alcuni concetti topologici. In questo capitolo sugli spazi normati abbiamo trattato diffusamente il caso degli operatori e dei funzionali limitati, e della relazione esistente tra questi e gli operatori continui nel caso di operatori lineari; avevamo infatti dimostrato nel teorema 1 che un operatore lineare è limitato se e solo se è continuo in x = 0, ricordando che un operatore tra spazi normati è continuo per definizione se trasforma successioni convergenti in successioni convergenti. Osservazione 23. Precedentemente, nel capitolo 2 sulle topologie avevamo anche trattato diversi argomenti relativi alle funzioni continue, caratterizzate dal trasformare gli aperti, e solo questi, in aperti (teorema 2.5), oppure dal trasformare insiemi compatti in insiemi compatti (teorema 2.9). Daltra parte, per operatori lineari tra spazi normati la prima proprietà è equivalente a richiederere che per ogni > 0 esista un δ > 0 tale che se ||x0 − x00 || < δ per x0 , x00 ∈ DA allora ||Ax0 − Ax00 || < . E quindi un operatore continuo trasforma limitati in limitati. Questa proprietà e quella relativa agli insiemi compatti comporta anche quella che è stata assunta come definizione di operatore continuo tra spazi normati. Ovvero: un operatore lineare continuo o limitato tra spazi normati trasforma successioni convergenti in successioni convergenti. 103 Possiamo infine enunciare l’importante teorema della applicazione aperta, rimandando la dimostrazione a, per esempio, K.Yoshida. Teorema 12. Un operatore lineare continuo da uno spazio di Banach B a uno spazio di Banach B 0 trasforma insiemi aperti in insiemi aperti. Vogliamo ora introdurre funzioni e operatori più generali, ma pure dotati di alcune proprietà che in qualche modo compensano le caratteristiche legate alla continuità che abbiamo sopra richiamato. In alcuni casi saranno concetti puramente topologici, che trattiamo solo ora per poterne discutere unitamente ai casi legati agli spazi metrici e agli spazi normati. Definizione 16. Siano X e Y due spazi topologici e sia X ⊗ Y il prodotto Cartesiano o prodotto diretto dei due spazi, ovvero l’insieme di tutte le coppie ordinate (x, y) con x ∈ X e y ∈ Y . Se gli spazi X e Y sono topologici, la topologia usuale su X ⊗ Y è definita dagli insiemi S ⊗ T con gli insiemi S ⊂ X e T ⊂ Y aperti nelle rispettive topologie. Cioè , Nello spazio prodotto diretto gli aperti sono costituiti dall’insieme delle coppie ordinate (x, y) per tutti gli x dell’aperto S e tutti gli y dell’aperto T . Definizione 17. Siano X e Y due spazi topologici e sia f una funzione con dominio Df ⊂ X e codominio Rf ⊂ Y . L’insieme {(x, f (x)) : x ∈ Df } è contenuto nello spazio prodotto diretto X ⊗ Y ed è detto il grafo di f e si indica con G(A). Se tale grafo è un insieme chiuso nella topologia usuale della definizione 16, allora f è detta funzione chiusa. Osservazione 24. Se X e Y sono spazi metrici, il prodotto diretto può essere metrizzato in diversi modi: posto p1 = (x1 , y1 ) e p2 = (x2 , y2 ) con x1 , x2 ∈ X e y1 , y2 ∈ Y possiamo definire d = dx + dy oppure d = sup(dx , dy ) oppure ancora d = (d2x + d2y )1/2 , con d = d(p1 , p2 ), dx = dx (x1 , x2 ) e dy = dy (y1 , y2 ). Tutte e tre danno origine alla stessa topologia, uguale peraltro a quella della definizione 16. Osservazione 25. Dalla osservazione precedente e dalla osservazione 2.12, segue che una funzione f , con dominio Df ⊂ X e codominio Rf ⊂ Y entrambi metrici, è una funzione chiusa se e solo se la coppia (Df , Rf ) contiene tutti i punti 104 limiti di successioni convergenti, ovvero se e solo se la situazione xn Df , xn → x e f (xn ) → y comporta x ∈ Df , y ∈ Rf e y = Ax. Osservazione 26. Per riassumere la situazione nel caso di operatori lineari in spazi normati, dalle osservazioni 25 e 23 segue che un operatore continuo, o limitato, trasforma successioni convergenti in successioni convergenti, mentre un operatore chiuso assicura che se la trasformata di una successione convergente è convergente, allora il suo limite appartiene al dominio dell’operatore ed è uguale al trasformato del limite. Definizione 18. Un operatore lineare A tra due spazi topologici X e Y è detto chiudibile, se la chiusura in X ⊗ Y del suo grafo G(A) è il grafo di un operatore lineare B con DB ⊂ X. Teorema 13. Se X e Y sono spazi normati, un operatore lineare A è chiudibile se e solo se per ogni successione {xn } ⊂ DA convergente a zero e con Axn → y si ha y = 0. Dimostrazione. Se A è chiudibile, la chiusura in X ⊗ Y del grafo G(A) è il grafo di un operatore lineare e pertanto y = B 0̇ = 0. Viceversa, ammessa la condizione sufficiente, definiamo l’operatore lineare B nel modo seguente: x ∈ DB se e solo se esiste una successione {xn } ⊂ DA tale che xn → x ed esiste il limite y = limn→∞ Axn ; per la condizione sufficiente, il limite è unico e possiamo quindi porre Bx = y. Ovviamente, Bx = Ax per ogni x ∈ DA . Mostriamo che l’operatore B è chiuso. Data la successione {wn } ⊂ DB con wn → w e Bwn → z, per (n) definizione di B esiste per ogni n una successione xi wn e (n) limi→∞ Axi (n) ∈ DA tale che limi→∞ xi = = Bwn , cosicchè esiste un elemento, diciamo xn , tale che ||wn −xn || < 1/n e ||Bwn −Axn || < 1/n; ma allora, limn→∞ xn = limn→∞ wn = w, limn→∞ Axn = limn→∞ Bwn = z e cosı̀ z ∈ DB e Bw = z. Dunque, B è chiuso. Consideriamo il seguente operatore, non continuo ma chiuso. Esempio 24. Come negli esempi 3 e 1.20, consideriamo l’operatore derivata A = d/dt definito nello spazio X = C[0,1] con la norma del max. E’ un operatore 0 lineare con dominio DA = C[0,1] delle funzioni continue con derivata continua. Se 105 xn = tn con la usuale norma del max si ha ||xn || = 1 ma ||Axn || = n||tn−1 || = n per cui sup||x||=1 ||Axn || = ∞, cioè l’operatore A trasforma un insieme limitato in un insieme illimitato e quindi non è un operatore continuo. Tuttavia è chiuso. Infatti, se xn → x con xn ∈ DA allora la funzione x è il limite uniforme di funzioni continue con derivata continua, e quindi è essa stessa continua con derivata continua, cioè x ∈ DA , x0 ∈ Ra e vale Axn = x0n → x0 . Introduciamo una interessante proprietà dell’inverso di un operatore chiuso. Teorema 14. Dato un operatore A lineare chiuso tra spazi topologici, se esiste l’inverso A−1 , questo è un operatore lineare chiuso. Dimostrazione. Se A−1 esiste, il suo grafo è dato dall’insieme {(Ax, x) : x ∈ DA }, nello spazio prodotto diretto Y ⊗ X. E’ chiaro daltra parte che T ⊗ S è chiuso in Y ⊗ X ogni qual volta S ⊗ T è chiuso in X ⊗ Y . Quindi, se A è chiuso, anche A−1 è chiuso (se esiste). E infine a riguardo degli operatori chiusi dimostriamo l’importante teorema detto del grafo chiuso. Teorema 15. Un operatore lineare chiuso da uno spazio di Banach B a uno spazio di Banach B 0 , è un operatore continuo. Dimostrazione. Lo spazio B ⊗ B 0 è uno spazio di Banach e il grafo G(A) dell’operatore lineare chiuso A è un suo sottoinsieme chiuso, e quindi completo. Pertanto G(A) è uno spazio di Banach. L’operatore B da tutto G(A) in B definito da B(x, Ax) = x è un operatore lineare continuo e uno a uno, ovvero invertibile. Allora, grazie al teorema 12 della applicazione lineare aperta, l’inverso B −1 è un operatore continuo. Similmente, anche l’operatore C da G(A) su R(A) definito da C(x, Ax) = Ax è continuo. Dunque, B = CA−1 è continuo da B in B 0 . 106 8. OPERATORI COMPATTI Negli spazi infinito dimensionali, spesso non è neppure sufficiente la caratteristica di limitatezza per una esauriente descrizione degli operatori lineari. Ciò che per certi versi maggiormente avvicina questi agli operatori lineari negli spazi finito dimensionali viene introdotto con la seguente definizione. Definizione 19 Sia A un operatore lineare tra i due spazi normati N e N 0 . A si dice compatto o completamente continuo se per ogni successione limitata {xn } in N dalla successione trasformata {Axn } è possibile estrarre una sottosuccessione convergente a qualche limite in N 0 . L’operatore compatto trasforma cosı̀ insiemi limitati in insiemi precompatti, tali cioè che la loro chiusura è compatta. Osservazione 27. Un operatore compatto è limitato. Se cosı̀ non fosse esisterebbe una successione {xn } con ||xn || ≤ 1 tale che ||Axn || → ∞ contrariamente all’ipotesi di compattezza. Per mostrare che il viceversa non è vero premettiamo il seguente lemma. Lemma. Siano x1 , x2 , ... vettori linearmente indipendenti in uno spazio normato N , e sia Nn il sottospazio generato dai primi n xi . Esiste allora una successione di vettori {yn } ∈ Nn con norma ||yn || = 1 e δ(yn , Nn−1 ) > 1/2, essendo δ(x, S) la distanza del punto x dall’insieme S, ovvero δ(yn , Nn−1 ) = inf x∈Nn−1 ||yn − x||. Dimostrazione. Essendo tutti i vettori xi linearmente indipendenti, xn 6∈ Nn−1 e δ(xn , Nn−1 ) = α > 0. Sia ξ ∈ Nn−1 tale che ||xn − ξ|| < 2α. Allora, poichè α = δ(xn , Nn−1 ) = δ(xn − ξ, Nn−1 ), il vettore yn = (xn − ξ)/||xn − ξ|| soddisfa le condizioni del lemma. Esempio 25. Dal lemma precedente segue facilmente che l’operatore identità , benchè evidentemente limitato, non è un operatore compatto. Infatti, possiamo selezionare una successione {yn } di vettori unitari tali che ||yn − yn−1 || > 1/2. Da questi evidentemente non è possibile estrarre una sottosuccessione convergente. Esempio 26. In uno spazio finito dimensionale ogni operatore lineare è compatto. Infatti, esso è limitato e trasforma quindi insiemi limitati in insiemi limitati. Ma un insieme limitato in uno spazio finito dimensionale è precompatto. 107 Esempio 27. Sia l’operatore A lineare limitato da uno spazio di Banach B in un suo sottospazio a dimensione finita. Esso è compatto perche trasforma ogni sottoinsieme limitato di B in un sottoinsieme limitato di uno spazio finito dimensionale, cioè in un insieme precompatto. Esempio 28. Dato x = (ξn ) ∈ l2 sia Ax = (1/2n ξn ). Questo operatore è compatto. Gli insiemi limitati sono contenuti nelle sfere e poichè l’operatore è lineare possiamo vedere in che cosa viene trasformata la sfera unitaria. Diamo ora dimostrazione di tre importanti proprietà degli operatori compatti. Teorema 16. Sia {An } una successione di operatori compatti in uno spazio di Banach B convergente a un operatore A. Allora A è compatto. Dimostrazione. E’ sufficiente dimostrare che data una successione limitata {xi } ∈ B, dalla successione {Axi } è possibile estrarre una sottosuccessione convergente. Questo è sicuramente possibile, per l’ipotesi di compattezza, nel caso (1) (1) degli operatori An . Sia dunque {xi } la sottosuccessione di {xi } tale che A1 xi (1) (2) sia convergente per i → ∞. Da {xi } estraiamo la successione {xi } tale che (2) sia convergente A2 xi (n−1) tosuccessione di {xi (n) per i → ∞, e cosı̀ via. Indichiamo cioè con {xi } la sot(n) } tale che An xi sia convergente per i → ∞. Se ora (i) estraiamo da tutte queste la successione diagonale {xi }, è chiaro che la trasfor(i) mata {An xi } è convergente per i → ∞ e per ogni n. Se mostriamo che anche (i) Axi è convergente, abbiamo mostrato la compattezza di A; poichè per ipotesi (i) B è completo, è sufficiente dimostrare che Axi è una successione fondamentale. Allora: (i) (j) (i) (i) (i) (j) (j) (j) ||Axi − Axj || ≤ ||Axi − An xi || + ||An xi − An xj || + ||An xj − Axj ||. Supponiamo ||xi || ≤ C e, fissato > 0, scegliamo un N tale che per n > N e per (i) (j) i, j > N siano ||A − An || < /(3C) e ||An xi − An xj || < , cosa sempre possibile (i) essendo An → A e {An xi } convergente e dunque fondamentale. Da tutto ciò (i) (j) segue che ||Axi − Axj || < . Dunque A è compatto. CVD. Teorema 17. In uno spazio normato N , se A è compatto e B è limitato, allora AB e BA sono compatti. 108 Dimostrazione. Se S ⊂ N è limitato, anche B(S) è limitato e quindi AB(S) è precompatto. Viceversa, se S ⊂ N è limitato allora A(S) è precompatto e BA(S) è anche precompatto per la continuità di B (vedi il teorema 2.9). Corollario. In uno spazio normato N a dimensione infinita, un operatore compatto non può avere inverso limitato. Se cosı̀ non fosse, l’unità I = AA1 sarebbe un operatore compatto, contrariamente a quanto visto nell’esempio 25. Il successivo teorema è di fondamentale importanza nello studio dei problemi agli autovalori. Teorema 18. Dato un operatore compatto A su uno spazio di Banach B e un numero arbitrario ρ > 0, esiste solo un numero finito di autovettori linearmente indipendenti con autovalori maggiori in modulo di ρ. Dimostrazione. Dato l’operatore compatto A in uno spazio di Banach B (ovviamente infinito dimensionale), supponiamo per assurdo che esista una successione {αi } di suoi autovalori, distinti o ripetuti, tutti con o |αi | > ρ, e a cui corrisponda una successione di autovettori {xi } tutti linearmente indipendenti. Diciamo Bn lo spazio di Banach generato dai primi n autovettori x1 , x2 , ..., xn . Grazie al Lemma che precede l’esempio 25, possiamo costruire una successione {yn } ⊂ Bn con ||yn || = 1 e δ(yn , Bn−1 = inf x∈Bn−1 ||yn − x|| > 1/2. Poichè |αi | > ρ per ogni i, la successione {yn /αn } è limitata e, se dimostreremo che dalla successione dei trasformati {Ayn /αn } non è possibile estrarre una sottosuccessione Pn convergente, avremo dimostrato il teorema. Ora, se yn = k=1 ck xk , allora n−1 yn X ck αk A = xk + cn xn = yn + zn , αn αn k=1 con zn = n−1 X k=1 ck αk − 1 xk ∈ Bn−1 . αn Da ciò segue che per ogni m, l con l < m: y l ym A −A = ||yl + zl − (ym + zm )|| = αl αm = ||yl − (ym + zm − zl )|| > 1/2, 109 dato che ym + zm − zl ∈ Bl−1 . Quindi non è possibile estrarre una sottosuccessione convergente, contrariamente all’ipotesi di compattezza dell’operatore A. Corollario. Dal teorema 18 segue immediatamente che gli autovettori linearmente indipendenti corrispondenti a un autovalore α 6= 0 di un operatore compatto sono in numero finito. E anche che gli autovalori αn di un operatore compatto con αn > ρ > 0 sono in numero finito. 110