1. SPAZI LINEARI
1. SPAZI LINEARI, BASI, SOTTOSPAZI
Definizione 1. Sia dato un corpo numerico K. Un insieme I di elementi
x, y, z, ... di natura arbitraria, costituisce uno spazio lineare R se:
1) Ad ogni coppia di elementi x, y ∈ I è associato un terzo elemento z ∈ I detto
somma di x e y che viene indicato da z = x + y.
2) Ad ogni x ∈ I e a ogni numero α ∈ K è associato un elemento z ∈ I detto
prodotto di α per x che viene indicato da z = αx.
3) La operazione somma soddisfa le seguenti proprietà:
3i) x + y = y + x (commutatività)
3ii) x + (y + z) = (x + y) + z
(associatività)
3iii) l’insieme I contiene l’elemento neutro della somma, indicato con 0 (zero),
tale che ∀x ∈ I vale x + 0 = x. Tale elemento è unico. Infatti, se anche x + 00 = x,
allora 00 = 00 + 0 = 0 + 00 = 0.
3iv) per ogni x ∈ I esiste l’elemento inverso della somma, tale che x + x0 = 0.
Esso è unico. Infatti, se esistesse un altro elemento x00 con x + x00 = 0, allora
x00 = x00 + 0 = x00 + x + x0 = 0 + x0 = x0 .
4) L’operazione prodotto soddisfa le seguenti proprietà:
4i) 1 · x = x
4ii) α · (βx) = (αβ) · x
4iii) (α + β) · x = αx + βx
4iv) α · (x + y) = αx + αy .
Segue che αx = 0 ⇔ α = 0 o x = 0. Infatti, 0x + x = (0 + 1)x = x e quindi 0x = 0;
inoltre α0 + αx = α(0 + x) = αx e quindi α0 = 0. Viceversa, se αx = 0 e α 6= 0,
moltiplicando per α−1 si ottiene x = 0.
Da 0x = 0 e dalla 4i) segue anche che l’inverso può essere espresso da x0 = −1 · x.
Lo indicheremo pertanto con −x e scriveremo x − x = 0.
Uno spazio lineare è anche detto spazio vettoriale e i suoi elementi sono anche detti
vettori.
1
Osservazione 1. Salvo esplicita indicazione, come corpo numerico K assumeremo sempre quello (commutativo) dei reali o dei complessi.
Osservazione 2. L’elemento neutro della somma viene usualmente indicato
con il simbolo 0 (zero) in tutti gli spazi lineari. Attenzione perciò a quale zero di
volta in volta ci si riferisce.
Esempio 1. Lo spazio dei vettori ordinari in tre dimensioni con l’usuale
somma del parallelogramma e la moltiplicazione per numeri reali è uno spazio
lineare. Viene indicato simbolicamente con R3 .
Esempio 2. Siano x e y due N-ple ordinate di numeri reali o complessi:
x ≡ (ξ1 , ξ2 , ..., ξN ) e y ≡ (η1 , η2 , ..., ηN ). Definiamo la somma:
z ≡ x + y ≡ (ξ1 + η1 , ξ2 + η2 , ..., ξN + ηN ) e il prodotto αx ≡ (αξ1 , αξ2 , ..., αξN ),
con α reale se le N-ple sono reali e α reale o complesso se le N-ple sono complesse.
L’insieme di tali N-ple costituisce uno spazio lineare, come è facile verificare. Tali
spazi si denotano con RN o C N .
Esempio 3. Sia x ≡ (ξi ) = (ξ1 , ξ2 , ..., ξn , ...) una successione ordinata di
(infiniti) numeri reali o complessi. Con le stesse definizioni dell’esempio precedente
per la somma e prodotto, si ottiene lo spazio lineare R∞ o C ∞ .
Esempio 4. Sia dato l’insieme delle funzioni reali continue x(t) della variabile
reale t nell’intervallo chiuso e limitato [a, b]. Con le usuali definizioni di somma e
prodotto per numeri reali, tale insieme costituisce lo spazio lineare C[a,b] .
Esempio 5. Le N-ple (r1 , r2 , ..., rN ) di numeri razionali ri costituiscono uno
spazio lineare solo sul corpo dei razionali. Invece le N-ple (p1 , p2 , ..., pN ) di numeri
reali positivi non costituiscono uno spazio lineare.
Esempio 6. L’insieme delle funzioni continue in [0, 1] con x(0) = 0, strutturato nel solito modo, definisce uno spazio lineare. Invece, l’insieme delle funzioni
continue nello stesso intervallo con x(0) = 1 non definisce uno spazio lineare.
Definizione 2. Dati n vettori (x1 , x2 , ..., xn ) di uno spazio lineare R , questi
si dicono linearmente indipendenti se la relazione α1 x1 + α2 x2 + ... + αn xn = 0 è
verificata solo per tutti gli αi ≡ 0. Uno spazio lineare si dice a dimensione finita N
se esistono N e non più di N vettori linearmente indipendenti. Uno spazio lineare si
2
dice infinito-dimensionale se, comunque preso N, esistono sempre N +1 vettori linearmente indipendenti. Dati n vettori (x1 , x2 , ..., xn ), questi si dicono linearmente
Pn
dipendenti se esistono n numeri (αi ) non tutti nulli, tali che i=1 αi xi = 0.
Definizione 3. Dato uno spazio lineare N-dimensionale RN , ogni N-pla di
vettori (x1 , x2 , ..., xN ) linearmente indipendenti, definisce una base in RN .
Osservazione 3. Assegnata una base (x1 , x2 , ..., xN ) in uno spazio finito dimensionale RN , ogni vettore x ∈ RN è in corrispondenza biunivoca con N numeri
del corpo K. Infatti, essendo lo spazio N-dimensionale, dato α 6= 0, l’equazione
−αx+α1 x1 +α2 x2 +...+αN xN = 0 ammette soluzioni αi 6= 0 almeno per qualche i.
PN
(Notare che per α = 0 si ha la sola soluzione αi = 0, ∀i.) Allora x = i=1 (αi /α)xi
e quindi al vettore x corrisponde la N-pla (αi /α). Tale corrispondenza è univoca;
PN
infatti, se fosse anche x =
i=1 βi xi con qualche βi 6= αi /α, sottraendo i due
PN
sviluppi di x si otterrebbe 0 = i=1 γi xi con qualche γi ≡ βi − αi /α 6= 0 . Ma
questo implicherebbe che gli N xi non sono linearmente indipendenti, contrariamente alle ipotesi di costituire una base in RN .
Viceversa, a ogni N-pla di numeri (αi ) , i = 1, 2, ..., N , corrisponde univocamente
PN
il vettore x ≡ i=1 αi xi .
Esempio 7. Lo spazio C N dell’esempio 2 è N-dimensionale. Infatti, dopo
avere osservato che l’elemento nullo di questo spazio è costituito dalla N-pla di zeri
(0, 0, ..., 0), è immediato verificare che gli N vettori
e1 ≡ (1, 0, ..., 0) , e2 ≡ (0, 1, ..., 0) , . . . , eN ≡ (0, 0, ..., 1)
sono linearmente indipendenti. Ogni altro vettore x ≡ (ξ1 , ξ2 , ..., ξN ) è esprimibile
PN
in funzione dei versori come x = i=1 ξi ei , come è immediato verificare.
Esempio 8. Lo spazio C[a,b] dell’esempio 4 è infinito dimensionale. Infatti,
appartengono ad esso tutti i monomi 1, t, t2 , ..., tn , ... e questi sono tra di loro
linearmente indipendenti poichè l’equazione α0 + α1 t + α2 t2 + ... + αn tn = 0
ammette come soluzioni n numeri αi non tutti nulli solo per al più n valori di t ,
e non identicamente per tutti i t ∈ [a, b].
Definizione 4. Due spazi lineari R e R0 sullo stesso corpo numerico si dicono
isomorfi se esiste una corrispondenza biunivoca x ←→ x0 per ogni x ∈ R e per
3
ogni x0 ∈ R0 , tale da preservare le operazioni degli spazi lineari, cioè:
i) x ←→ x0 comporta αx ←→ αx0 , per ogni α ∈ K , x ∈ R e x0 ∈ R0
ii) x1 ←→ x1 0 e x2 ←→ x2 0 comportano x1 + x2 ←→ x1 0 + x2 0 , per ogni coppia
x1 , x2 ∈ R e x01 , x02 ∈ R0 .
Una corrispondenza siffatta si dice isomorfismo tra i due spazi lineari R e R0 .
Una generica corrispondenza tra R e R0 che conserva le operazioni si dice omomorfismo.
Esempio 9. Nell’osservazione 3 abbiamo stabilito una corrispondenza biunivoca tra gli spazi RN e le N-ple (ξi ) di numeri del corpo K , complessi o reali
o altro, mediante l’utilizzo di una base in RN . E’ facile convincersi che tale corrispondenza preserva le operazioni degli spazi lineari per cui, in conclusione, tutti
gli spazi lineari N-dimensionali sui complessi o sui reali sono isomorfi a C N o a
RN e pertanto sono isomorfi tra di loro. Per il modo stesso con il quale è stata
istituita la corrispondenza, l’isomorfismo non è unico ma dipende dalle basi scelte
nei singoli spazi lineari.
Esempio 10. Sia dato lo spazio P N +1 dei polinomi in t di grado al più
uguale a N , cioè lo spazio lineare dei vettori x = ξ0 + ξ1 t + ξ2 t2 + ... + ξn tn con
n ≤ N . Gli N + 1 vettori 1, t, t2 , ..., tN +1 sono linearmente indipendenti (vedi
l’esempio 8), e poichè tutti gli altri vettori sono combinazioni lineari di questi,
costituiscono una base. Questa base definisce la corrispondenza x ↔ (ξi ) , tra il
PN
vettore x ≡ i=0 ξi ti e l’insieme degli N + 1 numeri (ξi ) , e quindi definisce un
isomorfismo tra P N +1 e C N +1 (o RN +1 ).
Definizione 5. Dato uno spazio lineare R , un suo sottoinsieme A ⊆ R si
dice essere un sottospazio di R se, strutturato con le medesime operazioni di R , è
esso stesso uno spazio lineare, cioè x ∈ A ⇒ αx ∈ A e anche x, y ∈ A ⇒ x + y ∈ A
con somma e prodotto come in R. Se il sottospazio non coincide completamente
con R , si dice sottospazio proprio.
Osservazione 4. Il sottospazio A deve contenere necessariamente l’elemento
nullo di R dato che, se contiene l’elemento x , contiene anche l’elemento x − x.
Esempio 11. Con riferimento all’esempio 6, il sottoinsieme di C[a,b] delle
4
funzioni continue x(t) che si annullano in a e in b , cioè tali che x(a) = x(b) = 0 ,
costituiscono un sottospazio lineare di C[a,b] . Non costituisce invece sottospazio il
sottoinsieme delle funzioni con x(a) = x(b) = 1.
Esempio 12. C N è un sottospazio di C ∞ .
Esempio 13. L’insieme delle N+1-ple ordinate di numeri complessi
Sm = {(ξ0 , ..., ξN ) ∈ C N +1 : ξm = 0} costituisce un sottospazio di C N +1 .
Esempio 14. I polinomi x ≡ ξ1 t + ξ2 t2 + ... + ξN tN privi del termine di
grado zero costituiscono un sottospazio dello spazio P N +1 dei polinoni di grado
al più uguale a N (vedi l’esempio 10). Per l’isomorfismo tra questo e C N +1 , il
sottospazio in questione è isomorfo al sottospazio Sm=0 dell’esempio 13.
Esempio 15. I polinomi di grado al più uguale a N costituiscono un sottospazio di C[a,b] . I polinomi dell’esempio 14, privi cioè del termine noto, costituiscono un sottospazio dello spazio delle funzioni continue in [0, 1] con x(0) = 0.
Definizione 6. In uno spazio lineare R consideriamo un sottoinsieme A e la
totalità dei sottospazi che lo contengono. La loro intersezione rappresenta il più
e
piccolo sottospazio di R contenente A e si dice sottospazio inviluppante A.
Osservazione 5. Il sottospazio inviluppante Ae è costituito dalla totalità
delle combinazioni lineari finite ma di ordine qualsiasi di elementi di A. Infatti,
chiamiamo B tale insieme. Cioè sia B costituito da elementi α1 x1 +α2 x2 +...+αn xn
con xk ∈ A per ogni k = 1, 2, ..., n e n qualsiasi. B è un sottospazio e contiene A
dato che contiene un suo elemento xk arbitrario. Allora Ae ⊆ B . D’altra parte,
preso un elemento di B arbitrario α1 x1 +α2 x2 +...+αn xn , questo deve appartenere
a un qualsiasi sottospazio contenente A e pertanto anche ad Ae ; da cui B ⊆ Ae .
e
Quindi, B ≡ A.
Teorema 1. Un sottospazio proprio M di uno spazio finito dimensionale RN
è finito dimensionale con dimensione M < N . Se M = N il sottospazio coincide
con lo spazio intero.
Dimostrazione. Se M ≡ (0) , esso ha dimensione M = 0 per definizione.
Poichè RN , per ipotesi, contiene almeno un altro elemento , allora N > 0 e
il teorema è provato. Sia ora M non banale e consideriamo in esso n vettori
5
linearmente indipendenti. Sarà senz’altro n < N , altrimenti essi costituirebbero
una base in RN e la totalità delle combinazioni lineari di essi esaurirebbe RN .
Sarebbe cioè RN ⊆ M invece di essere M sottospazio proprio di RN . Quindi M
è finito dimensionale e, detta M la sua dimensione, esistono M vettori linearmente
indipendenti. Come visto prima, deve valere M < N .
Da quanto detto segue automaticamente che se M = N allora M ≡ RN .
2. CLASSI DI EQUIVALENZA
Introduciamo il concetto di relazione di equivalenza per insiemi del tutto arbitrari, concetto che tratteremo con maggiore dettaglio nel caso più specifico di
spazi lineari.
Definizione 7. Sia R è una relazione binaria tra elementi x e y di un insieme
X, che indicheremo con xRy. La relazione R si dice relazione di equivalenza su X
se gode delle tre seguenti proprietà:
i) per ogni x ∈ X si ha xRx (proprietà riflessiva)
ii) xRy implica yRx (proprietà simmetrica)
iii) xRy e yRz implicano xRz (proprietà transitiva).
Definizione 8. Un sottoinsieme di X costituito da tutti gli elementi equivalenti secondo R a un elemento dato x si dice classe di equivalenza e si indica con
ξx o con [x]R . L’elemento x si dice generatore della classe; in realtà, un qualunque
suo elemento può essere scelto come generatore, essendo tutti equivalenti tra di
loro.
Osservazione 6. È facile convincersi che l’insieme di sottoinsiemi di X dato
dall’insieme delle classi di equivalenza (secondo R) esaurisce senza eccezioni e senza
ripetizioni l’insieme X. In altre parole, ogni x ∈ X appartiene a una e a una sola
classe di equivalenza di X secondo R.
Definizione 9. L’insieme delle classi di equivalenza di X secondo R si dice
insieme quoziente e si indica con X/R. La corrispondenza da X su X/R che
associa ad ogni x ∈ X l’insieme degli elementi di X equivalenti a x secondo R, si
dice corrispondenza canonica di X su X/R.
6
Ritorniamo agli spazi lineari e riprendiamo questi ultimi concetti.
Esempio 16. Siano dati uno spazio lineare R e un suo sottospazio M. Due
elementi x1 , x2 ∈ R si dicono equivalenti modulo M se x1 − x2 ∈ M, ovvero
x1 = x2 + m con m ∈ M. Questa relazione si indica con x1 ≡ x2 (mod M).
Valgono le seguenti proprietà:
i) x ≡ x(mod M) dato che x − x = 0 ed M contiene necessariamente lo zero
essendo un sottospazio.
ii) x1 ≡ x2 (mod M) =⇒ x2 ≡ x1 (mod M). Infatti, se x1 − x2 ∈ M, anche
−(x1 − x2 ) = x2 − x1 ∈ M.
iii) x1 ≡ x2 (mod M) e x2 ≡ x3 (mod M) comportano che x1 ≡ x3 (mod M).
Infatti, se x1 − x2 ∈ M e x2 − x3 ∈ M, la loro somma x1 − x3 apparterrà ancora
a M essendo questo un sottospazio lineare.
La relazione cosı̀ introdotta gode pertanto delle proprietà riflessiva, simmetrica e
transitiva e rappresenta quindi un caso particolare di relazione di equivalenza.
Consideriamo ora un vettore x ∈ R e l’insieme di tutti i vettori di R equivalenti a
x(mod M), tale cioè che x0 − x ∈ M per tutti gli x0 ∈ ξx . Tale insieme è costituito
da tutti i vettori del tipo x + m per tutti gli m ∈ M, e individua una classe di
equivalenza che indicheremo simbolicamente con ξx ≡ x + M.
Ovviamente, lo spazio lineare R può essere decomposto in classi di equivalenza
disgiunte, contenenti ognuna tutti e soli i vettori equivalenti tra di loro (mod M).
Esempio 17. Come semplice esempio consideriamo l’usuale piano bidimensionale R2 e il sottospazio x2 delle ordinate. Sia inoltre l’elemento x ∈ R2 individuato dal vettore O − P dall’origine al punto P del piano. La classe di equivalenza
ξx dei vettori di R2 equivalenti a x(mod x2 ) è data evidentemente da tutti i vettori O − Q con Q giacente sulla parallela a x2 passante per il punto P . L’intero
spazio bidimensionale è cosı̀ decomposto nelle classi di equivalenza individuate
dalle parallele all’asse x2 .
Osservazione 7. Possiamo ora considerare le classi di equivalenza come
elementi di un insieme I e definire su di esse le operazioni somma e prodotto:
ξx + ξy ≡ ξx+y e αξx ≡ ξαx . Tali operazioni sono genuine operazioni tra le classi di
7
equivalenza in quanto non dipendono dai singoli generatori. Infatti, presi x0 ∈ ξx e
y 0 ∈ ξy , essendo x0 = x + m e y 0 = y + n, si ha evidentemente che x0 + y 0 = x + y + l
con m, n, l ∈ M. Quindi, ξx+y ≡ ξx0 +y0 . Analogamente, se x0 ≡ x(mod M) anche
αx0 ≡ αx(mod M) e quindi αξx = ξαx = ξαx0 = αξx0 .
Questo insieme I di insiemi è cosı̀ strutturato con una somma e un prodotto
che facilmente si dimostrano soddisfare le proprietà delle operazioni definenti uno
spazio lineare. Quale è lo zero di questo spazio? Poichè ξx = x+M, evidentemente
ξx + M = ξx e quindi M è lo zero cercato. In conclusione:
Definizione 10. Dato uno spazio lineare R e un sottospazio proprio M ⊂ R,
lo spazio lineare delle classi di equivalenza (mod M), strutturato con le operazioni
definite nell’osservazione 7, si dice spazio quoziente di R rispetto a M e si indica
con il simbolo R/M. Lo zero di tale spazio è dato dal sottospazio M.
Esempio 18. Come nell’esempio 17, consideriamo l’usuale piano bidimensionale R2 e il sottospazio x2 delle ordinate. Dato x ∈ R2 , la classe di equivalenza
ξx è in corrispondenza biunivoca con il vettore xP , proiezione del vettore O − P
sull’asse x1 . Considerato lo spazio quoziente R2 /x2 , questo è isomorfo all’intero
asse x1 , come è facile verificare.
Quest’ultimo esempio suggerisce l’esistenza di un isomorfismo tra uno spazio
quoziente e qualche altro sottospazio dello spazio lineare di partenza. Per mostrare
la natura generale di tale isomorfismo, è necessario premettere la seguente:
Definizione 11. Due sottospazi M e N di uno spazio lineare R si dicono
complementari l’uno rispetto all’altro se hanno in comune il solo elemento nullo di
R, cioè M ∩ N = (0), e se M + N = R cioè se, dato x ∈ R, esistono m ∈ M e
n ∈ N tali che x = m + n.
Osservazione 8. La decomposizione di un elemento x ∈ R all’interno di
due sottospazi complementari M e N è unica. Infatti, se x = m + n e anche
x = m0 + n0 , sottraendo membro a membro si ottiene 0 = m − m0 + n − n0 . Ma
m−m0 ∈ M e n−n0 ∈ N e questi hanno in comune il solo elemento nullo. Quindi,
m = m0 e n = n0 .
Non è invece unico il sottospazio N complementare a un dato sottospazio M ∈ R.
8
Esempio 19. Dato lo spazio lineare R2 e il sottospazio x2 , un sottospazio
complementare a x2 rispetto a R è costituito da una qualsiasi retta passante per
l’origine non coincidente con x2 .
Teorema 2. Dato uno spazio lineare R e due sottospazi complementari M
e N , lo spazio quoziente R/M è isomorfo a N . Segue evidentemente che tutti i
sottospazi di R complementari a un sottospazio dato sono isomorfi tra di loro.
Dimostrazione. Consideriamo la corrispondenza canonica x → ξx . Essa è
un omomorfismo, cioè una corrispondenza lineare, da R in R/M. Dimostriamo
che questa corrispondenza ristretta a N diventa un isomorfismo tra N e R/M,
mostriamo cioè che è una corrispondenza uno a uno dal N in R/M ed è su R/M.
Da cui segue l’isomorfismo tra i due spazi lineari.
i) Dato n ∈ N esiste una sola classe di equivalenza ξn . Viceversa, dato ξx ∈ R/M
supponiamo che esistano due vettori n, n0 ∈ N tali che ξn = ξn0 = ξx ; allora
0 = ξn − ξn0 = ξn−n0 , cioè ξn−n0 = M , e n − n0 ∈ M. Poichè M∩N = (0), si ha
che n − n0 = 0 e quindi a ξx corrisponde un solo elemento di N .
ii) Dato ξx ∈ R/M possiamo scrivere x = m + n con m ∈ M e n ∈ N . Allora,
ξn = ξx−m = ξx − ξm = ξx . Cioè, dato ξx esiste n ∈ N tale che ξx = ξn e quindi
la corrispondenza n → ξn è una corrispondenza su R/M.
Osservazione 9. Dato uno spazio lineare finito dimensionale RL a dimensione L e un suo sottospazio proprio MM a dimensione M < L, lo spazio quoziente
RL /MM ha dimensione N = L − M , essendo N la dimensione del sottospazio N N
complementare a MM . Infatti, l’insieme degli M vettori di una base in MM e
degli N vettori di una base in N N costituiscono una base in RL , poichè i loro
inviluppi non hanno elementi comuni fuorchè lo zero, e la loro somma, ovvero
l’inviluppo globale, esaurisce RL .
3. OPERATORI, DOMINI E CODOMINI.
Definizione 12. Dati due spazi lineari R e R0 , si considerino in essi due
sottoinsiemi DA ⊆ R e RA ⊆ R0 . Una qualsiasi legge che associa ad ogni x ∈ DA
uno e un solo elemento x0 ∈ RA definisce un operatore A da R in R0 . Gli insiemi
9
DA e RA si dicono dominio e codominio (o range) di A e la legge si scrive x0 = Ax.
Facciamo qui di seguito alcune precisazioni.
i) Se R ≡ R0 , allora A si dice operatore in R.
ii) Se R0 coincide con un campo numerico (usualmente reali o complessi), allora
A si dice funzionale e si indica con A(x) o f (x). Se anche gli x ∈ R sono numeri,
allora si parla di funzioni.
iii) Si dice che A è uguale a B (A = B) se DA ≡ DB e Ax = Bx per ogni
x ∈ DA ≡ DB .
iv) L’operatore B è detto estensione di A (A è detto restrizione di B ) se DA ⊂ DB
e Ax = Bx per ogni x ∈ DA . In tal caso si scrive A ⊂ B o B ⊃ A.
Definizione 13. Consideriamo un operatore A il cui dominio DA sia un
sottospazio lineare di R, e siano x, y ∈ DA . Se valgono le due eguaglianze:
A(x+y) = Ax+Ay e A(αx) = αAx, allora A è detto operatore lineare. Notare che
i membri a sinistra sono comunque definiti essendo per ipotesi DA un sottospazio
lineare.
Esempio 20. Consideriamo gli usuali C N e la matrice rettangolare N × M
con, in generale, N 6= M :
a11
 a21
A=
 ...
a12
a22
..
.
...
...
..
.

a1N
a2N 
.
.. 
. 
aM 1
aM 2
...
aM N

Con le solite regole del calcolo matriciale A definisce un operatore lineare da C N
in C M . In particolare, le matrici quadrate definiscono operatori in C N .
Esempio 21. Consideriamo C[a,b] , lo spazio delle funzioni continue in un
intervallo chiuso e limitato, e l’operatore A ≡ d/dt come operatore in C[a,b] , ovvero
R ≡ R0 ≡ C[a,b] . In tal caso, il dominio DA non è tutto C[a,b] bensı̀ il sottoinsieme
0
delle funzioni continue con derivata continua, che indicheremo con C[a,b]
. Esso è un
sottospazio lineare come è facile dimostrare. Con questo dominio di definizione,
l’operatore A ≡ d/dt è un operatore lineare.
Teorema 3. Sia A un operatore lineare da R in R0 . Allora, il codominio
RA ⊂ R0 è un sottospazio lineare.
10
Dimostrazione. Ricordando che DA è uno spazio lineare per definizione (di
operatore lineare ), se x, y ∈ DA allora anche x + y ∈ DA e quindi A(x + y) esiste
e appartiene a RA . Essendo poi Ax, Ay ∈ RA , dalla linearità di A segue che
Ax + Ay = A(x + y) ∈ RA . Analogamente, se x ∈ DA , anche αx ∈ DA e pertanto
da Ax ∈ RA segue che anche αAx = A(αx) ∈ RA . Questa somma e prodotto
soddisfano le usuali proprietà e quindi RA è uno spazio lineare.
Esempio 22. Consideriamo lo spazio lineare C[a,b] e per ogni suo elemento x
Rb
sia Ax ≡ a x(s) ds. L’operatore A è un funzionale lineare.
2
Rb
0
Sia anche Bx ≡ a dx(s)/ds ds definito in DB ≡ C[a,b]
, definito cioè nello spazio
delle funzioni continue con derivata continua. L’operatore B è un funzionale ma
non è lineare.
Esempio 23. Sia x ∈ C[a,b] e Ax ≡
Rt
a
x(s) ds = X(t) − X(a) con a ≤ t ≤ b e
0
X(t) primitiva di x(t), cioè X (t) = x(t). L’operatore A è lineare con DA ≡ C[a,b] .
0
Il codominio RA è dato invece dal sottospazio di C[a,b]
costituito dalle funzioni y(t)
continue con derivata continua, tali che y(a) = 0.
Esempio 24. Sia R = R0 = C[a,b] . Sia data K(t, s), funzione continua di due
Rb
variabili nel dominio chiuso e limitato a ≤ t, s ≤ b. E sia Ax ≡ a K(t, s)x(s) ds.
Ad ogni x ∈ C[a,b] corrisponde una y = Ax ∈ C[a,b] , per cui A definisce un operatore
lineare con DA = C[a,b] . L’operatore A si definisce operatore integrale e la funzione
K(t, s) si dice nucleo dell’operatore.
Terminiamo il paragrafo con le due seguenti importanti definizioni.
Definizione 14. Sia dato un operatore lineare A con DA ≡ R. Il sottospazio
M ∈ R si dice invariante rispetto ad A se per ogni x ∈ M vale che anche Ax ∈ M.
L’operatore A lascia quindi in M i vettori di M.
Definizione 15. Dato uno sottospazio M ∈ R invariante rispetto all’operatore A, definiamo la restrizione AM di A su M, come quell’operatore tale che
AM x = Ax per ogni x ∈ M. Evidentemente DAM ≡ M.
11
Esempio 25. Sia dato lo spazio RN e la matrice N × N
a
11
 ...

a
 k1
A=
 0
 .
 .
.
0
...
..
.
...
...
..
.
a1k
..
.
0
..
.
akk
0
..
.
0
ak+1,k+1
..
.
...
..
.
...
...
..
.
...
0
aN,k+1
...
0
..
.



0 

.
ak+1,N 


..

.
aN N
La matrice A lascia invariati sia il sottospazio delle prime k componenti con
le altre tutte nulle, sia quello delle ultime N − k con le prime k tutte nulle. Le
restrizioni di A ai due sottospazi sono date nel primo caso dal blocco in alto a
sinistra e il resto tutti zeri, nel secondo caso dal blocco in basso a destra e il resto
tutti zeri. Si trascurano poi tutti gli zeri e si opera in Rk e in RN −k rispettivamente.
4. ALGEBRA DEGLI OPERATORI
Introduciamo qui di seguito una serie di definizioni e di proprietà degli operatori in spazi lineari. Salvo esplicita indicazione, si intendono operatori non necessariamente lineari.
b ed è definito da R in R0 da
a) Operatore nullo. Lo si indica con O o con O
Ox = 0 per ogni x ∈ R, e lo zero a destra indica ovviamente il vettore nullo di R0 .
Condizione essenziale è che sia DO ≡ R.
b) Somma di operatori. Consideriamo due operatori A e B da R in R0 ;
se i domini hanno in comune alcuni elementi, se cioè DA ∩ DB 6= 6 O, essendo 6 O
l’insieme vuoto, allora si può definire la somma A + B come l’operatore C con
DC ≡ DA ∩ DB tale che ∀x ∈ DC , vale Cx = Ax + Bx. La somma tra operatori
gode delle proprietà seguenti:
i) A + B = B + A (commutatività)
ii) A + (B + C) = (A + B) + C
b=A
iii) A + O
(associatività)
che derivano tutte dalla linearità di R e da analoghe proprietà dell’unione tra
insiemi, cui devono soddisfare i domini degli operatori.
12
c) Prodotto di un numero per un operatore. Dato un numero α del corpo
numerico K di R0 , definiamo l’operatore C ≡ αA mediante l’uguaglianza (αA)x =
α(Ax) per ogni x ∈ DA . Quindi DαA = DA . Il prodotto cosı̀ definito gode delle
seguenti proprietà:
i) α(βA) = (αβ)A (in DA )
ii) (α + β)A = αA + βA
iii) α(A + B) = αA + αB
(in DA )
(in DA ∩ DB )
iv) 1 · A = A (in DA )
v) 0 · A ⊆ O
Notare che nella v) non vale solo l’uguale poichè D0·A ≡ DA ⊆ R ≡ DO .
d) Spazi lineari di operatori. Se non ci fosse il problema dei domini, si potrebbe
introdurre il concetto di spazio lineare di operatori. Questo sarà fatto più avanti
quando avremo modo di caratterizzare insiemi di operatori lineari definiti su tutto
lo spazio.
e) Prodotto di operatori. Dato un operatore B da R in R0 e un operatore A
da R0 in R00 con RB ∩ DA 6= 6 O, si può definire l’operatore prodotto C ≡ AB da
R in R00 nel modo seguente: per ogni x ∈ DB tale che Bx ∈ DA , deve valere
Cx = (AB)x = A(Bx).
f) Proprietà del prodotto e della somma. Mostriamo che vale la proprietà
distributiva: (A + B)C = AC + BC, ricordando che l’uguaglianza di due operatori
A = B comporta che Ax = Bx per ogni x ∈ DA ≡ DB .
Dalla definizione del prodotto di operatori segue che il dominio D(A+B)C è costituito dagli x ∈ DC tali che Cx ∈ RC ∩ DA ∩ DB .
Analogamente, DAC+BC è costituito da tutti gli x ∈ DC tali che Cx ∈ RC ∩ DA
e anche Cx ∈ RC ∩ DB . Cioè da tutti gli x ∈ DC tali che
Cx ∈ (RC ∩ DA ) ∩ (RC ∩ DB ) = RC ∩ DA ∩ DB .
Quindi, i domini dei due operatori (A + B)C e AC + BC sono uguali.
Sia infine RC ∩ DA ∩ DB 6= 6 O e sia x tale da soddisfare le ipotesi precedenti.
Allora:
(A+B)C x = (A+B)(Cx) = A(Cx)+B(Cx) = (AC)x+(BC)x = (AC +BC)x.
13
Quindi, l’azione dei due operatori sui vettori del dominio è identica e in conclusione
i due operatori sono uguali.
Tale proprietà, come le precedenti, vale per operatori anche non lineari.
g) Se A è un operatore lineare, allora vale anche la legge distributiva a destra:
A(B + C) = AB + AC.
Come prima, si dimostra l’uguaglianza dei domini
DA(B+C) = DAB+AC . Dato poi x ∈ DA(B+C) vale la seguente relazione:
A(B + C) x = A (B + C)x = A(Bx + Cx) = ABx + ACx = (AB + AC)x.
Da cui segue l’uguaglianza degli operatori. Notare che è il penultimo passaggio ad
essere valido solo se l’operatore A è lineare.
h) Operatore unità. Definiamo l’operatore unità ER come quell’operatore
definito su tutto R, cioè con DER , tale che ER x = x per ogni x ∈ R.
Dato A da R in R0 e gli operatori unità nei due spazi, vale ER0 A = AER , come è
facile mostrare.
i) Potenze di un operatore. Dato un operatore A in R, si possono definire le
potenze di esso con le opportune cautele sui domini:
A0 ≡ ER , A1 ≡ A, A2 = A · A, . . . , An = A · A · · · A. Si possono anche definire
polinomi dell’operatore A: pn (A) = a0 + a1 A + a2 A2 + ... + an An . Il dominio
dell’operatore polinomiale si ricava ovviamente dalle definizioni precedenti.
Esempio 26. Consideriamo le matrici rettangolari N × M dell’ esempio 20
come operatori lineari da C N in C M e sia N 6= M . Posto A = [aij ] e B = [bij ],
con i = 1, 2, ..., M e j = 1, 2, ..., N , la somma tra questi due operatori può essere
definita in modo naturale da A + B ≡ [aij + bij ]. Per il prodotto le cose si complicano. Si può ancora definire l’operatore prodotto ma occorre qualche avvertenza
su domini e codomini. Se ad esempio M < N , allora RB ⊆ C M e si può intendere
questo C M come un sottospazio di C N . In tal caso A, B e AB si possono intendere
come operatori in C N . In particolare, DAB ≡ DB ≡ C N e RAB ⊂ C M .
Se invece N < M , si può ancora tentare di definire un operatore prodotto pur di
considerare un dominio di definizione più ristretto che non tutto C N , definito da
tutti quegli x ∈ C N (se ne esistono) tali che anche Bx ∈ C N . Cioè quei vettori x
tali che Bx sia della forma (η1 , η2 , ..., ηN , 0, 0, ..., 0).
14
Esempio 27. Se si considerano le matrici quadrate N × N da C N in C N ,
per queste è sempre possibile definire somme e prodotti nel modo usuale.
Esempio 28. Consideriamo lo spazio C[a,b] e l’operatore derivata d/dt. Si
possono definire le potenze di questo operatore, con l’ovvia avvertenza che i domini
si stringono sempre più.
n
00
0
.
, . . . , Ddn /dtn = C[a,b]
Dd/dt = C[a,b]
, Dd2 /dt2 = C[a,b]
n
Dove C[a,b]
indica il sottospazio di C[a,b] delle funzioni continue con tutte le derivate
continue sino alla n-esima.
Esempio 29. Consideriamo C[a,b] e gli operatori A = d/dt e Bx =
Rb
a
x(s) ds.
0
Per questi sappiamo essere DA = C[a,b]
, RA ⊆ C[a,b] , DB = C[a,b] e RB = R (B è
un funzionale). E’ quindi senz’altro possibile definire BA. Si può anche definire
AB a patto di intendere R ⊆ C[a,b] , a patto cioè di considerare i reali R come il
sottospazio di C[a,b] delle funzioni costanti su tutto [a, b]. Naturalmente, AB è il
banale operatore nullo.
Esempio 30. Siano dati C[a,b] e gli operatori A = d/dt e
Rb
Bx = a K(t, s)x(s) ds con K(t, s) funzione continua nel quadrato a ≤ t, s ≤ b. E’
sempre possibile definire BA, mentre l’operatore AB è definito solo per quei nuclei
integrali K(t, s) tali che anche dK(t, s)/dt sia una funzione continua nel quadrato.
Esempio 31. Siano dati due operatori integrali A e B con nuclei integrali
A(t, s) e B(t, s) rispettivamente. Si può sempre definire la somma in modo evidente, ottenendo un operatore integrale il cui nucleo è dato dalla somma dei nuclei.
Anche il prodotto AB è semplicemente definito da:
Rb
Rb
R b
Cx ≡ ABx = a A(t, s0 ) a B(s0 , s)x(s) ds ds0 ≡ a C(t, s)x(s) ds, avendo posto
Rb
il nucleo integrale C(t, s) ≡ a A(t, s0 )B(s0 , s) ds0 .
5. OPERATORE INVERSO.
Definizione 16. Sia dato un operatore A da R in R0 e un operatore B da
R0 in R tale che per ogni x ∈ DA si abbia B(Ax) = x. Allora B è detto operatore
inverso di A e ha evidentemente dominio di definizione DB ≡ RA .
Osservazione 10. Consideriamo un operatore A e il suo inverso B. Per ogni
15
x ∈ DA , si ha che y = Ax ∈ RA ≡ DB . Ma By = B(Ax) = x ∈ RB , per cui
RB ≡ D A .
Inoltre, dato y = Ax, poichè A(By) = A(BAx) = Ax = y, per definizione
l’operatore A è l’inverso di B. Quindi, l’inverso dell’inverso di A è ancora A,
e possiamo quindi introdurre la notazione B = A−1 . Vale infatti (A−1 )−1 = A.
Inoltre ancora AA−1 ⊆ ER0 in quanto AA−1 x = x per qualsiasi elemento
x ∈ DA−1 ⊆ R0 ≡ DER0 . L’operatore AA−1 è quindi una restrizione dell’unità.
Analogamente per l’operatore A−1 A.
Teorema 4. Sia A un operatore lineare. Se A−1 esiste, allora è anch’esso
lineare.
Dimostrazione. Siano y1 , y2 ∈ DA−1 ≡ RA , tali cioè che A−1 y1 = x1 e
A−1 y2 = x2 . Da quanto visto prima, x1 , x2 ∈ DA e y1 = Ax1 , y2 = Ax2 . Allora
A−1 (y1 + y2 ) = A−1 (Ax1 + Ax2 ) = A−1 A(x1 + x2 ) = x1 + x2 = A−1 y1 + A−1 y2 .
Si può procedere in modo analogo per il prodotto numerico, per cui A−1 è un
operatore lineare.
Teorema 5. Dato un operatore lineare A da R in R0 , esiste l’operatore
inverso A−1 se e solo se l’equazione Ax = 0 possiede l’unica soluzione x = 0.
Dimostrazione. Supponiamo che esista A−1 . Poichè A è lineare, dato x ∈ DA ,
vale A(x − x) = A0 = Ax − Ax = 00 , con 0 ∈ R e 00 ∈ R0 . Inoltre, dal teorema 3
segue che il suo codominio è un sottospazio lineare e pertanto anche DA−1 (≡ RA )
è un sottospazio lineare e contiene l’elemento 00 . Allora A−1 00 = A−1 (A0) = 0.
Quindi, se A−1 esiste, da Ax = 00 segue A−1 (Ax) = A−1 (00 ) = x = 0. Da cui la
condizione necessaria del teorema.
Viceversa, supponiamo che da Ax = 00 segua x = 0 e sia l’operatore B da R0 in R
tale che, dato x ∈ DA e y = Ax, sia By = x. Se a y corrispondono due elementi
x1 e x2 , cioè By = x1 e By = x2 con y = Ax1 = Ax2 , allora A(x1 − x2 ) = 00
(per la linearità di A ). Ma, per ipotesi, da Ax = 00 segue x = 0, per cui da
A(x1 − x2 ) = 00 segue x1 = x2 . Perciò l’operatore B, già definito per ogni x ∈ DA
da B(Ax) = x, è univocamente definito ed è quindi l’operatore inverso di A.
16
Esempio 32. Consideriamo in RN la matrice quadrata N × N
a11
 a21
A=
 ...
a12
a22
..
.
...
...
..
.

a1N
a2N 
.
.. 
. 
aN 1
aN 2
...
aN N

La condizione Ax = 0 ⇒ x = 0 è equivalente alla condizione det A 6= 0. Grazie
alla regola di Cramer infatti, questa è la condizione che permette la risoluzione
univoca dell’equazione Ax = 0, evidentemente soddisfatta da x = 0. Della matrice
A esiste quindi l’inverso A−1 .
Per la risolubilità dell’equazione Ax = y con y ∈ RN arbitrario, occorre stabilire
se DA−1 ≡ RA coincide con l’intero spazio RN . L’applicabilità della regola di
Cramer a y qualunque, purchè det A 6= 0, assicura appunto RA ≡ RN .
Esempio 33. Consideriamo la matrice rettangolare N × M
a11
 a21
A=
 ...
a12
a22
..
.
...
...
..
.

a1N
a2N 
.. 
. 
aM 1
aM 2
...
aM N

e l’equazione associata Ax = y con x ∈ RN e y ∈ RM . Se N < M , se cioè vi sono
più equazioni che incognite, la risolubilità di tale sistema lineare è legata, tramite
il teorema di Rouchè e Capelli, alle note condizioni sui determinanti associati
al fondamentale, nella costruzione dei quali interviene anche il termine noto y.
Questo equivale a restringere il campo non solo degli operatori A che ammettono
inverso, ma anche dei vettori y che possono essere scritti come y = Ax, e quindi
in sostanza a restringere il codominio RA e il dominio DA−1 .
Come semplice esempio, sia l’operatore A da R in R2 definito da una matrice
rettangolare 1 × 2 e sia data l’equazione Ax = y con x ∈ R e il termine noto
y ∈ R2 :
3
3
a
3x = a
A≡
−→
x=
=⇒
4
4
b
4x = b
La soluzione esiste solo per particolari valori di a e b e cioè per a/b = 3/4.
17
Dal punto di vista operatoriale, l’equazione Ax = 0 e cioè 3x = 0 e 4x = 0
comportano la sola soluzione x = 0, per cui l’operatore inverso A−1 esiste con
dominio uguale ovviamente al codominio di A e cioè:
3c
}
DA−1 ≡ RA ≡ {
4c
con c arbitrario. Su vettori di questo tipo, A−1 è definito ed è espresso da
A−1 = 12 13 14 . Infatti:
−1
A
1 1 1 3x
Ax =
=x
2 3 4 4x
inoltre, poichè DA ≡ R, si ha che A−1 A = 1 = ER in quanto definito appunto su
tutto lo spazio. Viceversa:
−1
AA
3
1 1 1 1 1
=
=
·
2 3 4
2 43
4
3
4
1
.
Questa matrice è uguale all’unità ER2 solo sui vettori del dominio di DA−1 (≡ RA ).
Quindi AA−1 ⊂ ER2 e il contenimento vale in senso stretto.
Esempio 34. Consideriamo ancora matrici rettangolari N × M ma ora con
M < N . L’equazione Ax = y è ora equivalente a un sistema lineare con più
incognite che equazioni. Possono esistere soluzioni, ma in tal caso sono in numero
infinito. Pertanto, non può esistere un operatore inverso A−1 che darebbe origine a una legge uno-molti, anzi uno-infinito e quindi non sarebbe un operatore.
Consistentemente, anche l’equazione omogenea Ax = 0 ammette altre (infinite)
soluzioni oltre alla nulla.
Esempio 35. Sia dato l’operatore integrale: Ax ≡
0
in C[a,b] , con X (t) = x(t).
R
x(t) dt = X(t) definito
Il codominio RA è costituito dalle primitive di
funzioni continue e cioè dalle funzioni X(t) continue a derivata continua con
X 0 (t) = x(t). Esse sono definite a meno di una costante arbitraria, e quindi il
0
codominio dell’operatore A è dato da RA ≡ C[a,b]
/C, ovvero dallo spazio quoziente
0
di C[a,b]
rispetto al sottospazio C delle funzioni costanti. Ricordiamo che tale sot-
tospazio C rappresenta lo zero dello spazio quoziente.
18
Consideriamo ora l’equazione Ax = 00 , ove lo zero alla destra dell’uguale sta a
indicare l’intero sottospazio C. La funzione di C[a,b] identicamente nulla, cioè il
vettore x = 0 è soluzione dell’equazione in quanto l’operatore A è definito a meno
di una costante arbitraria, per cui A0 = (cost) ≡ 00 . Inoltre, poichè la derivata di
una costante è uguale a zero, tale equazione ammette x = 0 come unica soluzione.
Quindi, A ammette inverso e vale evidentemente A−1 = d/dt.
0
Anche l’operatore B ≡ d/dt ristretto a DB = C[a,b]
/C ammette inverso perchè
dx(t)/dt = 0 ⇐⇒ x = (cost) = 00 . L’operatore B −1 è dato dall’operatore integrale
A visto prima.
e ≡ d/dt con dominio D ≡ C 0 , allora a dx(t)/dt = 0
Se invece consideriamo B
[a,b]
e
B
corrispondono infinite funzioni x(t) = cost e l’operatore inverso non esiste.
19
2. TOPOLOGIE
1. SPAZI TOPOLOGICI
La definizione di spazio topologico rappresenta una astrazione di alcune caratteristiche dell’ordinario spazio euclideo monodimensionale.
Definizione 1. Un insieme X e una famiglia F di sottoinsiemi A di X sono
detti spazio topologico se la famiglia F gode delle seguenti proprietà:
a) L’insieme vuoto 6 O e l’intero spazio X appartengono a F.
b) L’unione di un numero qualsiasi di membri di F è ancora un membro di F.
c) L’intersezione di un numero finito di membri di F è ancora un membro di F.
La famiglia F è detta topologia in X e i membri A di F sono detti insiemi aperti
di X in questa topologia.
Esempio 1. Sia X un qualsiasi insieme non vuoto e sia F una famiglia di
sottoinsiemi costituita solo da 6 O e da X. F è evidentemente una topologia in X
ed è chiamata topologia grossa.
Esempio 2. Sia X un insieme non vuoto e sia F una famiglia costituita da
tutti i sottoinsiemi di X (6 O e X inclusi). F è evidentemente una topologia in X
ed è chiamata topologia discreta.
Esempio 3. Sia dato l’insieme non vuoto X = {a, b, c, d, e} costituito dai
cinque elementi a,b,c,d,e. Consideriamo le seguenti famiglie di sottoinsiemi:
n
o
F1 = X, 6 O, {a}, {c, d}, {a, c, d}, {b, c, d, e}
n
o
F2 = X, 6 O, {a}, {c, d}, {a, c, d}, {b, c, d}
n
o
F3 = X, 6 O, {a}, {c, d}, {a, c, d}, {a, b, d, e} .
F1 è una topologia in X poichè è facile controllare che i suoi sottoinsiemi soddisfano
ai tre assiomi.
F2 non è una topologia in X; infatti: {a} ∪ {b, c, d} = {a, b, c, d} ∈
/ F2 .
F3 non è una topologia in X; infatti: {c, d} ∩ {a, b, d, e} = {d} ∈
/ F3 .
20
Esempio 4. Sia X un insieme non vuoto ed F la famiglia di tutti i sottoinsiemi di X il cui complementare è finito (costituito cioè da un numero finito di
elementi); inoltre appartenga a F anche l’insieme vuoto 6 O. F è una topologia
in X. Anzitutto, se X è finito questa non è altro che la topologia discreta. Sia
allora X infinito. L’assioma a) è banalmente soddisfatto. Per quanto riguarda
l’assioma b): l’unione di infiniti (anche non numerabili) sottoinsiemi della famiglia
contiene insiemi a complementare finito, e quindi è a complementare finito, per
cui l’assioma b) è soddisfatto. Infine, l’intersezione di N membri della famiglia i
cui complementari sono costituiti da n1 , n2 , ..., nN elementi di X, è un insieme il
cui complementare è formato al più da n1 + n2 + ... + nN elementi di X, per cui
l’assioma c) è soddisfatto.
Questa topologia è detta T1 , e in seguito ne vedremo il motivo.
Esempio 5. L’intersezione F1 ∩ F2 di ogni coppia F1 ed F2 di topologie in
X è una topologia in X. Infatti, 6 O e X appartengono sia a F1 che a F2 (essendo
topologie), per cui 6 O, X ∈ F1 ∩ F2 , e l’assioma a) è soddisfatto. Se Aα ∈ F1 ∩ F2
(essendo α un indice discreto o continuo), allora Aα ∈ F1 e Aα ∈ F2 , ed essendo
F1 e F2 topologie in X, è anche ∪α Aα ∈ F1 e ∪α Aα ∈ F2 , per cui ∩α Aα ∈ F1 ∩F2 ,
e l’assioma b) è soddisfatto. Analogamente è soddisfatto l’assioma c).
Esempio 6. L’unione F1 ∪ F2 di due topologie F1 e F2 in X non è necesn
o
sariamente una topologia in X. Infatti, sia X = {a, b, c} e F1 = X, 6 O, {a} ,
n
o
n
o
F2 = X, 6 O, {b} ; F1 e F2 sono topologie in X ma F1 ∪ F2 = X, 6 O, {a}, {b}
non è una topologia in X.
Esempio 7. Sia X = R2 il piano ordinario e appartengano a F il vuoto 6 O,
o
n
p
l’intero spazio X e tutti i sottoinsiemi An = {x, y} : x2 + y 2 < n1 , n = 1, 2, ...
costituiti da tutti i punti del cerchio di raggio
1
n
esclusa la circonferenza. La
famiglia F soddisfa l’assioma a). ∪∞
n=N An = AN , N = 1, 2, ..., ovvero l’unione
di infiniti cerchi An è uguale al cerchio maggiore, quindi F soddisfa l’assioma b).
AN ∩ AM = AQ con Q = max(N, M ), quindi F soddisfa anche l’assioma c) ed è
una topologia.
Notiamo che ∩∞
n=N An = {x = y = 0}, N = 1, 2, ..., cioè l’intersezione di infiniti
21
elementi della famiglia F è l’insieme {O} costituito dalla sola origine del piano e
questo insieme non appartiene alla famiglia F. L’assioma c) d’altronde richiede
solo che l’intersezione di un numero finito di elementi della famiglia appartenga
alla famiglia.
Esempio 8. Sia X = R2 , il piano ordinario, e F = {X, 6 O, An } con
n
o
p
1
2
2
An = {x, y} : x + y < 2 − n , n = 1, 2, .... In X, F non è una topologia,
n
o
p
2 + y 2 < 2 . L’unione cioè di infiniti membri della
poichè ∪∞
A
=
{x,
y}
:
x
n=1 n
famiglia è il cerchio di raggio 2 circonferenza esclusa, e questo insieme non appartiene alla famiglia F.
o
n
p
2
2
Esempio 9. Sia X = {x, y} :
x + y ≤ 2 , e F = {X, 6 O, An } con An
definito come nell’esempio 8. In tal caso F è una topologia in X.
Esempio 10. Sia X = R l’insieme dei reali. Consideriamo i sottoinsiemi
A di X tali che a ogni x0 ∈ A corrisponda qualche h > 0 in modo che x ∈ A
se |x − x0 | < h. La famiglia F formata da questi sottoinsiemi A più il vuoto
(X è già compreso nella definizione), costituisce una topologia in X. L’assioma
e = ∪α Aα , con α
a) è soddisfatto. Per quanto riguarda l’assioma b): sia x0 ∈ A
indice discreto o continuo, allora x0 ∈ Aα̃ , appartiene cioè almeno a un Aα , per
e per cui x ∈ A
e se
cui esiste h > 0 tale che x ∈ Aα̃ se |x − x0 | < h. Ma Aα̃ ⊂ A,
e ∈ F, e l’assioma b) è dimostrato. L’assioma c) è soddisfatto
|x−x0 | < h e quindi A
se Aα ∩ Aβ = 6 O. Altrimenti, se x0 ∈ Aα ∩ Aβ , esistono hα e hβ tali che x ∈ Aα
se |x − x0 | < hα e x ∈ Aβ se |x − x0 | < hβ . Sia h = min(hα , hβ ); se |x − x0 | < h,
allora x ∈ Aα e x ∈ Aβ , per cui x ∈ Aα ∩ Aβ . L’assioma c) è quindi soddisfatto.
Questa topologia è l’usuale topologia sui reali dell’analisi. Un aperto è l’unione di
quanti si voglia segmenti aperti, senza cioè gli estremi. Come si diceva è da questa
topologia che sono mutuati i concetti fondamentali relativi agli spazi topologici.
Esempio 11. Sia X = RN . Consideriamo i sottoinsiemi A di X tali che
(i)
a ogni x0 = {ξ0 }q∈ A (i = 1, 2, ..., N ), corrisponde qualche h > 0 in modo che
PN
(i) − ξ (i) )2 < h. Questi insiemi più il vuoto definiscono
x = {ξ (i) } ∈ A se
0
i=1 (ξ
una topologia, analoga a quella dell’esempio 10. Questa è l’usuale topologia in
RN , e gli aperti sono unioni e intersezioni di sfere aperte.
22
Esempio 12. Sia X uno spazio topologico e S ∈ X un sottoinsieme arbitrario
di X. Consideriamo ora Fe = S ∩ F, cioè la famiglia costituita dall’intersezione
di S con tutti i membri di F, topologia in X. E’ facile controllare che Fe è una
topologia in S ed è detta topologia relativa.
Notiamo che negli esempi 7)-11) gli insiemi X sono stati dotati di una topologia servendosi di una struttura precedentemente definita sugli insiemi stessi. Essi
sono infatti spazi lineari, dotati per di più della (ordinaria) distanza tra coppie di
elementi, che li definisce quali spazi metrici; questi verranno trattati nel prossimo
capitolo. E’ chiaro però , vedi esempi 1)-6), che nessuna struttura è necessaria per
la definizione di una topologia.
Definizione 2. Intorno Ix di un punto x è un insieme che contiene un aperto
contenente x.
Definizione 3. Intorno IS di un sottoinsieme S è un insieme che contiene
un aperto contenente S.
Definizione 4. Un punto x di un sottoinsieme S ⊂ X è detto punto interno
di S se esiste un intorno Ix di x tale che x ∈ Ix ⊂ S.
L’insieme di tutti i punti interni di un sottoinsieme S ⊂ X è detto insieme interno
di S e si indica con int(S). In base al teorema successivo, esso è il più grande
aperto contenuto in S.
L’interno del complemento di S è detto insieme esterno e si indica con ext(S).
Esempio 13. Sia data la retta R con la topologia usuale dell’esempio 10. Il
sottoinsieme Q dei razionali non ha nè punti interni, nè punti esterni. Infatti, in
ogni intorno di un razionale esiste un irrazionale, e in ogni intorno di un irrazionale
(che appartiene a C(Q)) esiste un razionale.
Teorema 1. Un sottoinsieme S di uno spazio topologico X è aperto se e solo
se contiene solo punti interni.
Dimostrazione. Se S è aperto è sufficiente scegliere Ix = S. Viceversa, se S
contiene un intorno Ix di ogni suo punto x, allora S = ∪x∈S Ix ed essendo gli Ix
aperti, S è aperto.
23
Osservazione 1. Se in uno spazio X sono definite due topologie F1 e F2 , e
ogni aperto in F1 è anche aperto in F2 , cioè vale F1 ⊂ F2 , allora la topologia F1 è
detta più debole o più grossa ed è costituita da un minor numero di elementi, mentre la topologia F2 è detta più forte o più fine. La topologia grossa dell’esempio 1
è la topologia più grossa che si può definire su uno spazio X e corrispondentemente
la topologia discreta è la più fine.
Se vale F1 ⊂ F2 e anche F2 ⊂ F1 , cioè F1 = F2 , ovvero sono costituite dagli stessi
insiemi aperti, diremo che le due topologie sono equivalenti.
Una condizione necessaria e sufficiente affinchè due topologie siano equivalenti è
la seguente: dato un intorno di x arbitrario Ix1 ∈ F1 , esiste un intorno Ix2 ∈ F2
tale che Ix2 ⊂ Ix1 , e viceversa, dato Ix2 ∈ F2 esiste Ix1 ∈ F1 con Ix1 ⊂ Ix2 .
La condizione necessaria è ovvia. Per la condizione sufficiente, sia A2x l’unione
di tutti gli intorni in F2 contenuti in Ix1 ; esso è ancora un elemento di F2 ma è
anche un elemento di F1 , essendo A2x = Ix1 . Infatti, se cosı̀ non fosse esisterebbe
un elemento x0 ∈ Ix1 ma con x0 6∈ A2x . Ma gli intorni sono costituiti solo da punti
interni, per cui deve esistere un altro intorno di x0 : Ix10 ⊂ Ix1 . Per ipotesi, esiste
allora anche un intorno in F2 tale che Ix20 ⊂ Ix10 . Ma allora A2x ⊂ A2x ∪ Ix20 ⊂ Ix1 e
quindi A2x non sarebbe il più grande aperto di F2 contenuto in Ix1 . Dunque, ogni
aperto di F1 è anche un aperto di F2 , cioè F1 ⊂ F2 . Invertendo le ipotesi si trova
anche il risultato opposto F2 ⊂ F1 per cui, in conclusione, F1 = F2 . CVD.
Definizione 5. Un sottoinsieme C ⊂ X è detto chiuso se il suo complemento
è aperto. In ogni topologia, 6 O e X sono sia aperti che chiusi.
Osservazione 2. Dalle proprietà dell’operazione di complementazione:
C(∪α Aα ) = ∩α C(Aα ) e C(Aα ∩ Aβ ) = C(Aα ) ∪ C(Aβ ), segue che:
b’) l’unione di un numero finito di chiusi è un chiuso,
c’) l’intersezione di un numero qualsiasi (anche non numerabile) di chiusi è un
chiuso.
E’ possibile quindi introdurre una topologia mediante i chiusi sostituendo agli
assiomi b) e c) gli assiomi b’) e c’).
Esempio 14. Nella topologia discreta (esempio 2), ogni sottoinsieme è con24
temporaneamente aperto e chiuso. Anche nella topologia grossa (esempio 1),
questo fatto si verifica banalmente.
Ovviamente, non in tutte le topologie gli aperti sono anche chiusi, inoltre vi
sono insiemi nè aperti nè chiusi.
Esempio 15. Nella topologia F1 dell’esempio 3, il sottoinsieme {a, b, e} è
chiuso e non aperto, e il sottoinsieme {b} non è nè aperto nè chiuso.
Definizione 6. Se S ⊂ X, l’intersezione di tutti i chiusi di X che contengono
S è detta chiusura di S e si indica con S. Chiaramente S è chiuso ed è contenuto
in ogni altro chiuso contenente S.
Osservazione 3. S = S se e solo se S è chiuso.
Definizione 7. Un sottoinsieme A contenuto in un altro sottoinsieme B,
A ⊂ B, si dice denso in B se B ⊂ A. In particolare, A si dice denso ovunque se
A = X. Il sottoinsieme A si dice in nessun punto denso se l’interno della chiusura
di A è vuoto, cioè int(A) = 6 O.
Definizione 8. La frontiera F (S) di un insieme S è definita dalla intersezione
delle chiusure di S e del suo complementare: F (S) = S ∩ C(S).
Osservazione 4. La frontiera è ovviamente un insieme chiuso.
Esempio 16. Sia X = R2 topologizzato con la topologia dell’esempio 7. Si
vede facilmente che An = X ∀n e quindi F (An ) = An ∩ C(An ) = C(An ) = C(An ),
cioè la frontiera di An è data dal suo complementare rispetto a X.
Esempio 17. Sia X = R2 con l’usuale topologia (esempio 11). I cerchi centrati nell’origine di raggio
1
n
privati della circonferenza esterna sono degli aperti
anche in questa topologia. A differenza però che nell’esempio precedente, la frontiera di An è data solo dalla circonferenza esterna.
Esempio 18. Sia X = R con la usuale topologia dell’esempio 10. Il sottoinsieme Z degli interi è un insieme chiuso, essendo il complementare dell’unione di
tutti i segmenti aperti n < x < n + 1. Esso è in nessun punto denso; infatti Z = Z
e non possiede punti interni, cioè int(Z) = int(Z) = 6 O. Invece, il sottoinsieme Q
dei razionali non è in nessun punto denso: infatti Q = R e int(Q) = R 6= 6 O.
25
Definizione 9. Un punto x è detto punto di accumulazione per un insieme S
se ogni intorno di x contiene un punto di S distinto da x. Diremo inoltre insieme
derivato e lo indicheremo con S 0 l’insieme di tutti i punti di accumulazione di S.
Esempio 19. Nella topologia grossa ogni punto x è punto di accumulazione
per ogni sottoinsieme di X esclusi il vuoto 6 O e il sottoinsieme x costituito dal
singolo punto.
Esempio 20. Nella topologia discreta, nessun punto è punto di accumulazione per alcun sottoinsieme. Per ogni punto infatti esiste l’intorno costituito
dal singolo punto e che pertanto non ne contiene altri.
Più in generale, se un singolo punto è aperto in una data topologia, non può
essere punto di accumulazione per alcun sottoinsieme.
Teorema 2. Un sottoinsieme S ⊂ X è chiuso se e solo se contiene tutti i suoi
punti di accumulazione.
Dimostrazione. Se S è chiuso, C(S) è aperto, per cui se x ∈ C(S), esiste un
intorno Ix di x tale che x ∈ Ix ⊂ C(S) e pertanto Ix ∩ S = 6 O, per cui nessun
punto x ∈ C(S) può essere punto di accumulazione per S. Viceversa, se S contiene
tutti i suoi punti di accumulazione, dato x ∈ C(S) deve esistere un intorno Ix di
x tale che Ix ∩ S = 6 O, altrimenti x ∈ C(S) sarebbe punto di accumulazione per
S. Ne segue che Ix è tutto contenuto in C(S), cioè x ∈ Ix ⊂ C(S), per cui C(S)
è formato da soli punti interni ed è perciò aperto. Dunque S è chiuso.
Teorema 3. Consideriamo S e il suo insieme derivato S 0 . Allora S = S ∪ S 0 ,
cioè la chiusura di S coincide con l’unione di S e dei suoi punti di accumulazione.
Dimostrazione. Anzitutto S ∪ S 0 è chiuso, per il teorema precedente. Infatti,
sia x un punto di accumulazione per S ∪ S 0 e Ix un intorno arbitrario di x. Ix
contiene o un punto di S (distinto da x) e allora x è punto di accumulazione per S
e appartiene a S 0 , oppure Ix contiene un punto x0 ∈ S 0 ed è quindi un intorno di
x0 ; essendo x0 punto di accumulazione per S, Ix contiene un punto di S (distinto
eventualmente da x0 ) e quindi x o appartiene a S o è punto di accumulazione per
S e appartiene quindi a S 0 . Dunque, S ∪ S 0 è chiuso. Inoltre, S ∪ S 0 è contenuto
in ogni altro chiuso che contiene S, per cui ne è la chiusura.
26
Esempio 21. Consideriamo l’insieme X e la topologia F1 dell’esempio 3:
n
o
X = {a, b, c, d, e}, F1 = X, 6 O, {a}, {c, d}, {a, c, d}, {b, c, d, e} , e il sottoinsieme
S = {a, b, c}. Si vede facilmente che a e c non sono punti di accumulazione
per S ({a} e {c, d} sono i due intorni rilevanti), mentre b, d, e
sono punti di
0
accumulazione per S. L’insieme derivato di S è dato da S = {b, d, e}, mentre la
chiusura di S coincide con X, S = X. Quindi S è denso in X.
Esempio 22. Sia X = R con la topologia usuale dei reali (esempio 10), e sia:
I) S = {1, 12 , 13 , ..., n1 , ...}. Il punto 0 è l’unico punto di accumulazione per S, per
cui S = Se = {1, 1 , 1 , ..., 1 , ..., 0}. Per convincersi che Se è chiuso, basta controllare
2 3
n
e = (−∞, 0) ∪∞ ( 1 , 1 ) ∪ (1, ∞), dove (a, b)
il suo complementare dato da: C(S)
n=1 n+1 n
e
indica il segmento aperto di estremi a e b. C(S) è evidentemente aperto e quindi
Se è chiuso.
II) Sia X = Q, l’insieme dei razionali. I numeri reali definiti mediante classi
contigue di razionali risultano essere punti di accumulazione per Q. Quindi Q = R
e Q è denso ovunque.
III) Sia S un insieme infinito e limitato, contenuto cioè in un segmento chiuso
[a, b] di R. S ha almeno un punto di accumulazione. Questo è il noto teorema di
Bolzano-Weierstrass e sarà dimostrato in appendice.
2. BASI
Definizione 10. Dato uno spazio topologico X, Una famiglia B di aperti è
detta base nel punto x se x ∈ B per ogni B ∈ B e se a ciascun intorno Ix di x
corrisponde qualche B ∈ B tale che x ∈ B ⊂ Ix .
Definizione 11. Una famiglia B di aperti è detta base per lo spazio topologico
X se per ciascun x ∈ X esiste una sottofamiglia di B che è una base in x. Cioè una
famiglia B di aperti è base per X se e solo se per ogni x ∈ X e per ogni intorno
Ix di x esiste un elemento della famiglia B ∈ B tale che x ∈ B ⊂ Ix .
Le seguenti proprietà sono evidenti.
i) Sia B una base in X; allora la sottofamiglia degli intorni Ix appartenenti a B è
una base in x.
27
ii) L’unione delle basi in ogni punto x ∈ X è una base in X.
iii) Se B è una base per uno spazio topologico, allora:
1) A ciascun x ∈ X corrisponde qualche B ∈ B tale che x ∈ B.
2) Se B1 , B2 ∈ B e x ∈ B1 ∩ B2 , allora esiste B3 tale che x ∈ B3 ⊂ B1 ∩ B2 .
Per dimostrare ciò è sufficiente considerare l’intorno Ix = B1 ∩ B2 nella definizione
di base in un punto.
La successiva affermazione è valida anche in senso inverso è può quindi dare
origine a una equivalente definizione di base per uno spazio X.
iv) Ogni aperto di una topologia è ottenibile dall’unione di un certo numero (anche
di una infinità non numerabile) di elementi di una base in X. Essendo infatti A
un intorno di ogni suo punto x, esiste un B tale che x ∈ B ⊂ A, per ogni x ∈ A.
Pertanto A ⊂ ∪α Bα . Il contenimento opposto è ovvio e quindi vale l’eguaglianza
A = ∪α Bα con Bα ∈ A.
Esempio 23. X = {a, b, c, d, e} , F1 = X, 6 O, {a}, {c, d}, {a, c, d}, {b, c, d, e}}
n
o
(esempio 3). Una base in X è data evidentemente da B = {a}, {c, d}, {b, c, d, e} .
Esempio 24. Sia X = R2 topologizzato con la topologia dei cerchi aperti
dell’esempio 7. E’ facile convincersi che l’unica base per lo spazio X è costituita
dall’intera topologia.
Esempio 25. Sia X = R con la topologia usuale (esempio 10). Una base in
x0 è data dagli intervalli aperti di semiampiezza reale Ixr0 = {x : |x − x0 | < r} con
r reale. Ixr0 sono infatti intorni di x0 nella topologia usuale; inoltre, considerato
un intorno Ix arbitrario di x, dalla definizione segue che esiste un h > 0 tale che
x ∈ Ix se |x − x0 | > h, e scelto r < h si ha x0 ∈ Ixr0 ⊂ Ix . Anche le famiglie
m/n
formate dai segmenti aperti di semiampiezza razionale: Ix0
1/n
= {x : |x − x0 | <
con m, n = 1, 2, ..., o dai segmenti aperti Ix0 = {x : |x − x0 | <
1
n
m
n}
con n = 1, 2, ...,
costituiscono delle basi in x0 .
I segmenti aperti centrati in x0 e di semiampiezza intera non costituiscono invece
una base in x0 .
m/n
Le tre famiglie costituite da tutti gli Ixr , Ix
tre differenti basi in X = R.
28
1/n
, Ix , per tutti gli x, rappresentano
Esempio 26. Sia X topologizzato con la topologia discreta. Il sottoinsieme
{x} costituito dal singolo elemento x è una base in x. Una base in X è data
evidentemente da B = {x : x ∈ X}, ed è contenuta in ogni altra base possibile per
questo spazio topologico.
Alcuni concetti definiti precedentemente in termini di intorni arbitrari di un
punto x, possono essere definiti in termini dei soli elementi di una base in x. Per
esempio il punto di accumulazione della definizione 9, mediante il seguente:
Teorema 4. Dato uno spazio topologico X e una base B in x ∈ X, il punto x
è punto di accumulazione per il sottoinsieme S se e solo se ogni elemento B della
famiglia B contiene un elemento di S distinto da x.
Dimostrazione. Sia x punto di accumulazione per S. Essendo B un intorno di
x, esso contiene almeno un punto di S distinto da x. Viceversa, se ogni B contiene
un elemento di S distinto da x, consideriamo un intorno arbitrario Ix di x: per
definizione di base esiste un B tale che x ∈ B ⊂ Ix , per cui Ix contiene punti di S
distinti da x che risulta quindi punto di accumulazione per S.
Esempio 27. Nella topologia usuale sulla retta reale R, i punti di accumulazione si ottengono considerando la sola base costituita dalla totalità degli Ixr
dell’esempio 25. In tutta l’analisi si fa praticamente uso di questa sola base (vedi
in seguito i teoremi 6 e 6’ sulla continuità ).
Osservazione 5. Consideriamo ora un insieme X inizialmente senza alcuna
topologia, e sia B una famiglia di sottoinsiemi di X soddisfacenti le seguenti condizioni:
I) A ciascun x ∈ X corrisponde qualche B ∈ B tale che x ∈ B.
II) Se B1 , B2 ∈ B e x ∈ B1 ∩ B2 , allora esiste almeno un B3 ∈ B tale che
x ∈ B3 ⊂ B1 ∩ B2 .
Notiamo anzitutto che le I) e II) sono soddisfatte dagli elementi di una base di uno
spazio topologico. Vogliamo mostrare, per cosı̀ dire, l’inverso, mostrare cioè che,
mediante una famiglia B soddisfacente le condizioni I) e II), è possibile definire
29
una topologia in X, per il quale B rappresenta una base.
Consideriamo infatti i sottoinsiemi S di X tali che se x ∈ S esiste qualche B ⊂ B
per cui x ∈ B ⊂ S. La famiglia F dei sottoinsiemi S che godono di questa
proprietà (più il vuoto) costituisce una topologia in X. Lo spazio X appartiene a
F essendo uno dei sottoinsiemi S (assioma a)). L’unione di un numero qualsiasi
di sottoinsiemi S contiene almeno un B, e l’assioma b) è soddisfatto. Infine, se
S1 ∩ S2 6= 6 O, allora dato x ∈ S1 ∩ S2 esistono B1 e B2 tali che x ∈ B1 ⊂ S1 ,
x ∈ B2 ⊂ S2 , da cui segue che x ∈ B1 ∩ B2 ; esiste perciò un elemento B3 tale che
x ∈ B3 ⊂ B1 ∩ B2 ⊂ S1 ∩ S2 , e anche l’assioma c) è soddisfatto. Vale ovviamente
B ⊂ F, e dunque B rappresenta una base per lo spazio X cosı̀ topologizzato.
Queste considerazioni suggeriscono un importante metodo per introdurre una
topologia in uno spazio X. Ricordiamo infatti che ogni aperto è ottenibile dall’unione di elementi di una base, secondo la proprietà iv).
n
o
Esempio 28. X = {a, b, c, d, e}, B = {a}, {c, d}, {b, c, d, e} . Questa
famiglia soddisfa le condizioni I) e II), per cui da questa è possibile estrarre una
topologia, i cui aperti sono l’unione dei B ∈ B, oltre al vuoto 6 O. Segue che
n
o
F = X, 6 O, {a}, {c, d}, {a, c, d}, {b, c, d, e} .
n
o
Esempio 29. X = {a, b, c, d, e}, B = {a}, {c}, {a, c, d}, {b, c, e} . B soddisfa le condizioni I) e II) e da essa si ricava la topologia
n
o
F = X, 6 O, {a}, {c}, {a, c}, {a, c, d}, {b, c, e}, {a, b, c, e} .
n
o
Esempio 30. X = {a, b, c, d, e}, B = {a, b}, {b, c}, {c, d}, {d, e} . B soddisfa la condizione I) ma non la II). E’ possibile tuttavia ottenere una topologia anche da questa famiglia considerando tutte le unioni e tutte le intersezioni possibili.
B però non è più una base per questo spazio topologico. La topologia cosı̀ ottenuta
è data da: F = {X, 6 O, {b}, {c}, {d}, {a, b}, {b, c}, {b, d}, {c, d}, {d, e}, {a, b, c},
{a, b, d}, {b, c, d}, {b, d, e}, {c, d, e}, {a, b, c, d}, {a, b, d, e}, {b, c, d, e}}.
Esempio 31. X = RN ; sia B la famiglia costituita da tutte le sfere aperte
(1)
(2)
(N )
di centro e raggio arbitrari cioè , dati x0 = {ξ0 , ξ0 , ..., ξ0 } e un numero reale
PN
(i)
arbitrario r, B = {x : i=1 (ξ (i) − ξ0 )2 < r2 }. La famiglia B gode delle proprietà
I) e II) e definisce la topologia usuale in RN (vedi l’esempio 11).
30
3. FUNZIONI CONTINUE
Le due seguenti definizioni sono del tutto analoghe alle 1.11 e 1.15 relative
agli operatori in spazi lineari.
Definizione 12. Dati due spazi topologici X e Y , una qualsiasi legge che
associa a ogni x ∈ X un e un solo elemento y ∈ Y è detta funzione da X in Y
e si indica con y = f (x). Gli spazi X e Y si dicono dominio e codominio della
funzione.
Definizione 13. Sia data una funzione f da X in Y . Se esiste una funzione
g (a un sol valore, per definizione) da Y in X tale che g(f (x)) = x per ogni x ∈ X,
la funzione g è detta funzione inversa e si indica con f −1 .
Dato S ⊂ X, indichiamo inoltre con f (S) l’insieme di tutti gli f (x) ∈ Y per
tutti gli x ∈ S. Dato T ⊂ Y , indichiamo anche con f −1 (T ) l’insieme di tutti gli
x ∈ X tali che f (x) ∈ T . Notare che questa definizione non implica l’esistenza
della funzione inversa come legge a un sol valore. Pertanto, è possibile che dato
y ∈ T ⊂ Y esistano x, x0 ∈ X tali che f (x) = f (x0 ) = y. La nostra definizione
implica semplicemente che entrambi x, x0 ∈ f −1 (T ).
Osservazione 6.
A differenza dagli operatori in spazi lineari, abbiamo
definito le funzioni in spazi topologici con dominio e codominio coincidenti con
gli interi spazi. Se però f fosse solo definita in S ⊂ X con codominio T ⊂ Y ,
possiamo sempre considerare S e T come spazi topologici con la topologia relativa
(vedi l’esempio 12). Situazione analoga a questa si verifica nel caso di operatori
lineari (vedi la definizione 1.12 e il teorema 1.3).
Definizione 14. Una funzione f è detta continua nel punto x0 ∈ X se a ogni
intorno V di f (x0 ) in Y corrisponde un intorno U di x0 tale che f (U ) ⊂ V .
La stessa definizione può essere data nel seguente modo: f è detta continua in x0
se per ciascun intorno V di f (x0 ) l’insieme f −1 (V ) contiene un intorno di x0 .
Una funzione continua in ogni punto x ∈ X è detta continua in X.
Se f è continua in X e f −1 è continua in Y , allora f è detta omeomerfismo di X
in Y , e X e Y sono detti omeomorfi.
Teorema 5. Siano X e Y due spazi topologici e sia f una funzione con
31
dominio X e codominio Y . Allora f è continua in X se e solo se f −1 (V ) è un
insieme aperto in X ogni volta che V è un insieme aperto in Y .
Dimostrazione. Sia f −1 (V ) un aperto in X ogni volta che V è un aperto in
Y . Sia x0 un punto qualsiasi in X e sia V un intorno di f (x0 ). Per ipotesi f −1 (V )
è un insieme aperto e inoltre contiene x0 ; f −1 (V ) contiene quindi un intorno di x0
(lo è esso stesso), e quindi f è continua secondo la definizione.
Viceversa. Sia f continua in X, e sia V un insieme aperto in Y . Allora, se
x ∈ f −1 (V ), per l’ipotesi della continuità di f , f −1 (V ) deve contenere con x anche
un intorno di x, ed è perciò costituito da soli punti interni (definizione 4). Dunque,
f −1 (V ) è un aperto in X (teorema 1).
Osservazione 7. Se f ha dominio X e codominio Y , e V ⊂ Y , è facile convincersi che vale la seguente relazione: f −1 (C(V )) = C(f −1 (V )). Infatti, poichè
f −1 (V ) contiene tutti gli x ∈ X che trasformati vanno in V , f −1 (C(V )) contiene
tutti e solo quelli che non godono di questa proprietà , e cioè il complementare.
Inoltre, da quanto testè osservato segue che f è continua in X se e solo se f −1 (V )
è chiuso in X ogni volta che V è chiuso in Y .
FX
Esempio 32. In X = {a, b, c, d} e Y = {x, y, z, w} siano definite le topologie:
n
o
n
o
= X, 6 O, {a}, {a, b}, {a, b, c} e FY = Y, 6 O, {x}, {y}, {x, y}, {y, z, w} .
Consideriamo due funzioni f e g con dominio X e codominio Y , cosı̀ definite:
f (a) = y, f (b) = z, f (c) = w, f (d) = z ; g(a) = x, g(b) = x, g(c) = z, g(d) = w.
Dal teorema 5, se f −1 (V ) è aperto in X ogni volta che V è aperto in Y , f è una
funzione continua. Ora, f −1 (Y ) = X, f −1 (6 O) = 6 O, f −1 (x) = 6 O, f −1 (y) = {a},
f −1 ({x, y}) = a, f −1 ({y, z, w}) = X. Dunque, f è continua. Invece la funzione g
non è continua in X. Infatti, g −1 ({y, z, w}) = {c, d} che non è un aperto in X. La
funzione g non è continua nè in c nè in d, mentre è continua in a e in b. Infatti,
dalla definizione 14 con c = x0 : g(c) = z ∈ {y, z, w} e g −1 ({y, z, w}) = {c, d}
che non è intorno di c e non contiene alcun intorno di c (nella topologia FX ).
Analogamente per il punto d. Invece, in a e in b : g(a) = g(b) = x ∈ {x}, {x, y}, X
e g −1 (x) = {a, b}, g −1 ({x, y}) = {a, b}, g −1 (X) = Y , e tutti questi insiemi
contengono degli intorni (lo sono essi stessi) di a e di b.
32
Esempio 33. Siano X e Y due spazi topologici dotati rispettivamente della
topologia discreta e di una topologia qualsiasi F. In tal caso una qualsiasi funzione
f da X in Y è continua. Infatti, nella topologia discreta ogni sottoinsieme f −1 (T )
è un aperto e, in particolare, lo è quando T è un aperto in Y .
Esempio 34. Siano X e Y due spazi topologici dotati rispettivamente di
una topologia arbitraria F e della topologia grossa. Una qualsiasi funzione f con
dominio X e codominio Y (o in Y ) è continua. Infatti, 6 O e Y sono gli unici aperti
in Y , e f −1 (6 O) = 6 O, f −1 (Y ) = X entrambi aperti.
Come avevamo preannunciato, è possibile dare la definizione di continuità
servendosi delle sole basi. Questo è dovuto al seguente:
Teorema 6. Siano X e Y due spazi topologici, BY una base in Y e f una
funzione con dominio X e codominio Y . Allora f è continua se e solo se l’immagine
inversa di ogni elemento della base in Y è un aperto in X.
Dimostrazione. Se f è continua e BY ∈ BY , f −1 (BY ) è un aperto in X, dato
che BY è un aperto in Y . Viceversa, se f −1 (BY ) è un aperto in X, consideriamo
un aperto generico A in Y , il quale può essere espresso come unione di elementi
di BY (vedi proprietà IV delle basi), cioè A = ∪α BYα ; è facile convincersi che
f −1 (A) = f −1 (∪α BYα ) = ∪α f −1 (BYα ); essendo per ipotesi f −1 (BYα ) un aperto,
f −1 (A) è un aperto.
Osservazione 8. Se anche X è dotato di una base BX , dato un intorno Ix
di x, esiste BX ∈ BX tale che x ∈ BX ⊂ Ix . Il teorema può essere pertanto
rienunciato nel modo seguente:
Teorema 6’. Siano BX e BY basi nei due spazi topologici X e Y , e sia f
una funzione con dominio X e codominio Y . Allora f è continua se e solo se esiste
BX ∈ BX tale che BX ∈ f −1 (BY ) per ogni BY ∈ BY .
Esempio 35. Siano X = Y = R, la retta reale, topologizzati con la topologia
usuale. Le funzioni con dominio X e codominio Y sono le usuali funzioni reali di
variabile reale dell’analisi. Ricordiamo infatti la definizione usuale di continuità in
un punto: f si dice continua in x0 se, fissato , esiste δ tale che |f (x) − f (x0 )| < 33
se |x − x0 | < δ . E’ chiaro che questa definizione di continuità è data mediante la
base in y0 = f (x0 ) costituita dai segmenti Iy0 di semiampiezza centrati in y0 , e
mediante la analoga base in x0 , B = {Ixδ0 }.
4. INSIEMI COMPATTI
Definizione 15. Sia X un insieme, S un sottoinsieme di X e G una famiglia
di sottoinsiemi Gα di X tali che S ⊂ ∪α Gα , tali cioè che ogni punto di S appartiene
almeno a un Gα . La famiglia G è detta ricoprire S oppure essere una copertura di
S. Se X è uno spazio topologico e tutti i membri di G sono degli aperti, G è detta
copertura aperta di S.
Definizione 16. Un sottoinsieme S di uno spazio topologico X è detto
compatto se da ogni copertura aperta G di S si può estrarre una sottocopertura
b cioè un numero finito di elementi ricoprenti S.
finita G,
Se S = X, allora X è detto spazio compatto.
L’insieme vuoto è compatto. Analogamente ogni insieme finito.
Un altro esempio di insiemi compatti è dato dal seguente famoso teorema di
Heine-Borel:
Teorema 7. Consideriamo la retta reale topologizzata nel modo usuale. Allora ogni sottoinsieme chiuso e limitato è compatto. (La dimostrazione è riportata
in Appendice.)
Osservazione 9. Entrambe le condizioni del teorema di Heine-Borel sono
essenziali. Consideriamo infatti i due seguenti esempi.
Esempio 36.
Consideriamo l’intervallo aperto limitato A = (0, 1).
La
1
famiglia G = {Gn = ( n+2
, n1 )} con n = 1, 2, ..., costituisce una copertura aperta
di A, cioè A ⊂ ∪∞
n=1 Gn . Non è possibile però estrarre da G alcuna sottocopertura
finita di A. In questo caso ovviamente, il responsabile di ciò è il fatto di essere A
”aperto a sinistra”.
Esempio 37. Sia A = (1, ∞). G = {(0, 2), (1, 3), (2, 4), ...} è una copertura di
A, da cui non è possibile estrarre una sottocopertura finita. In questo caso invece
è l’essere l’intervallo infinito che impedisce ad A di essere compatto.
34
Teorema 8. Ogni sottoinsieme chiuso di uno spazio compatto è compatto.
Dimostrazione. Sia X uno spazio compatto, S un sottoinsieme chiuso di X e
GS una copertura aperta di S. Consideriamo ora G 0 = GS ∪ C(S), cioè la famiglia
ottenuta dall’unione di tutti gli elementi di GS (aperti) con l’aperto C(S). G 0 è
una copertura aperta di X. Dato infatti x ∈ X, se x ∈ S allora esiste GS ∈ GS
tale che x ∈ GS , mentre se x ∈
/ S, allora x ∈ C(S). Usiamo pertanto una
notazione omogenea ponendo GX = G 0 = GS ∪ C(S). Per ipotesi X è compatto,
per cui esiste una sottofamiglia finita GbX ⊂ GX che ricopre X. Evidentemente
GbX ⊂ GbS ∪ C(S), essendo GbS ⊂ GS una sottofamiglia finita di GS . Mostriamo ora
b X ∈ GbX
che GbS è una copertura di S. Infatti, se x ∈ S ⊂ X, esiste almeno un G
bX = G
b S ∪ C(S), essendo G
b S ∈ GbS . Quindi x ∈ G
b S . Dunque,
tale che x ∈ G
da una copertura aperta GbS del chiuso S ⊂ X (compatto), abbiamo estratto un
sottocopertura finita GbS , ed S è compatto.
Teorema 9. Una funzione continua f da X in Y trasforma insiemi compatti
in insiemi compatti.
Dimostrazione. Sia S ⊂ X un sottoinsieme compatto e GT una copertura
aperta di T = f (S) ⊂ Y . Se GT è un aperto di GT , allora f −1 (GT ) è un aperto in
X, per definizione di funzione continua. L’insieme di tutti gli aperti f −1 (GT ) per
tutti i GT ∈ GT , costituisce una copertura di S, cioè GS = {f −1 (GT ) : GT ∈ GT }.
Essendo S un insieme compatto, da GS si può estrarre una sottocopertura finita
b T )}. Quindi GbT = {G
b T } rappresenta una sottocopertura finita di T .
GbS = {f −1 (G
Dunque, T = f (S) è compatto ogni volta che S è compatto. CVD.
Teorema 10. Detto S un sottoinsieme compatto di uno spazio topologico
X, ogni sottoinsieme infinito di S ha un punto di accumulazione in S.
Dimostrazione. Sia T un sottoinsieme infinito di S e supponiamo che non
abbia punti di accumulazione in S. Per ogni x ∈ S esiste allora un intorno Ix di x
che non contiene punti di T , escluso eventualmente x se x ∈ T . La famiglia di tutti
gli Ix è una copertura aperta di S, ed essendo S compatto se ne può estrarre una
sottocopertura finita I1 , I2 , ..., IN . Vale allora: T ⊂ S ⊂ ∪N
i=1 Ii e poichè ogni Ii
contiene al più un elemento di T , questo sarebbe finito, in contrasto con l’ipotesi.
35
Osservazione 10. Il teorema di Bolzano-Weierstrass, vedi l’esempio 22, non
è altro che un caso particolare del precedente teorema per X = R con la topologia usuale. In questo spazio topologico infatti, ogni intevallo chiuso e limitato è
compatto, grazie al teorema 7 di Heine-Borel.
5. SUCCESSIONI CONVERGENTI
Consideriamo una successione {xn } = {x1 , x2 , x3 , ...} di elementi di uno spazio
topologico X:
Definizione 17. Diciamo che {xn } è una successione convergente, oppure
che converge all’elemento x ∈ X e indichiamo questo fatto con xn → x, oppure
con limn→∞ xn = x se, dato un intorno Ix di x, esiste un intero n̄ tale che per
ogni n > n̄, xn ∈ Ix . Ogni intorno di x contiene perciò tutti gli elementi della
successione da un certo indice in poi.
Esempio 38. Sia X uno spazio dotato della topologia grossa. Allora una
qualsiasi successione {xn } di elementi di X converge a un qualsiasi elemento x ∈ X.
Infatti, l’unico intorno di x è X il quale contiene tutti gli xn .
Esempio 39. Sia X uno spazio dotato della topologia discreta, e sia {xn }
una successione in X. Dato un punto qualsiasi x ∈ X esiste l’intorno x costituito
dal singolo punto x. Quindi, affinchè xn → x, tutti gli elementi della successione
{xn }, da un certo indice in poi, devono essere uguali a x, cioè
{xn } = {x1 , x2 , ..., x, x..., x, ...}.
Osservazione 11. Il concetto di successione convergente ci permette di evidenziare una peculiarità degli spazi topologici (rispetto agli spazi ove questo concetto ci è più familiare) relativa all’unicità del limite di successioni convergenti.
Come è noto, la retta R usuale dell’analisi gode di tale proprietà, che è in realtà una
caratteristica generale degli spazi metrici. Negli spazi topologici invece, tale proprietà dipende dalla topologia, come mostrato dagli esempi 38 e 39. L’unicità del
limite dipende peraltro dalla più generale capacità di una topologia di distinguere
tra punti differenti, e cosa questo voglia dire da un punto di vista topologico è
l’argomento del prossimo paragrafo.
36
Notiamo che questa proprietà è rilevante non solo per i limiti di successioni convergenti, ma per tutte le caratteristiche puntuali di uno spazio topologico. Ad
esempio, anche nel caso dei punti di accumulazione lo spazio topologico ha caratteristiche diverse a seconda della topologia ivi definita (vedi esempi 19 e 20).
6. ASSIOMI DI SEPARAZIONE
Definizione 18. Si dice spazio topologico T1 uno spazio topologico X tale
che se x1 , x2 ∈ X e x1 6= x2 , esiste un intorno I1 di x1 che non contiene x2 , e
viceversa.
Una definizione del tutto equivalente è la seguente:
Definizione 18’. Si dice spazio topologico T1 uno spazio topologico X tale
che ogni sottoinsieme costituito da un singolo punto è un insieme chiuso. (Inoltre
l’unione di un numero finito di chiusi è un chiuso e pertanto si ha uno spazio T1
se e solo se i sottoinsiemi finiti sono chiusi.)
Infatti, dati x1 6= x2 se esiste un intorno I1 tale che x1 ∈ I1 e x2 ∈
/ I1 , il complementare C(x2 ) contiene solo punti interni e quindi è aperto e x2 è chiuso.
Viceversa, se ogni sottoinsieme costituito da un singolo elemento x2 è chiuso, allora C(x2 ) è un aperto e contiene solo punti interni, per cui dato x1 ∈ C(x2 ),
esiste un intorno I1 di x1 tale che x1 ∈ I1 ⊂ C(x2 ), e pertanto x2 ∈
/ I1 .
Definizione 19. Si dice spazio topologico T2 o spazio di Hausdorff uno spazio
topologico X in cui se x1 , x2 ∈ X e x1 6= x2 , esistono due intorni disgiunti di x1 e
x2 , cioè x1 ∈ I1 e x2 ∈ I2 con I1 ∩ I2 = 6 O.
Osservazione 12. Uno spazio topologico T2 è chiaramente anche T1 .
Osservazione 13. Se in uno spazio topologico i sottoinsiemi costituiti da un
singolo punto sono degli aperti, allora lo spazio topologico è evidentemente T2 .
Notare che questa è una condizione solo sufficiente.
Esempio 40. La topologia discreta conferisce a uno spazio la struttura di
spazio topologico T2 . Infatti i sottoinsiemi costituiti da un singolo punto sono
degli aperti. Essendo T2 , è anche T1 e infatti i singoli punti oltre che aperti sono
anche chiusi.
37
Esempio 41. Uno spazio X contenente almeno due punti e topologizzato con
la topologia grossa non è uno spazio T1 . Il singolo punto infatti non è nè aperto
nè chiuso.
Esempio 42. La retta reale topologizzata con la topologia usuale (esempio
10) è uno spazio T2 . Infatti, se x1 , x2 ∈ R e x1 6= x2 , allora |x1 − x2 | = h > 0 e,
scelto s < h/2, i due intorni I1s = {x : |x − x1 | < s} e I2s = {x : |x − x2 | < s} sono
tali per cui x1 ∈ I1s , x2 ∈ I2s e I1s ∩ I2s = 6 O.
Esempio 43. Il piano R2 e gli aperti An =
n
p
{x, y} : x2 + y 2 <
1
n
o
,n=
1, 2, 3, ... (esempio 7) non costituiscono uno spazio T1 . Infatti, tutti i punti non
interni alla circonferenza di raggio 1 sono contenuti nell’unico aperto X.
n
o
Esempio 44. X = {a, b, c, d, e}, F1 = X, 6 O, {a}, {c, d}, {a, c, d}, {b, c, d, e}
(esempio 3). Questo spazio topologico non è T2 : l’insieme {b} infatti non è un
chiuso.
Esempio 45. Sia X un insieme infinito dotato di una topologia i cui aperti
sono costituiti dai sottoinsiemi che hanno complemento finito (vedi l’esempio 4).
Questo è uno spazio topologico T1 : ogni sottoinsieme finito è infatti un chiuso. La
topologia è detta topologia T1 perchè è la più semplice struttura che porta a un
T1 . Non definisce però uno spazio T2 . Infatti, dati x1 , x2 ∈ X con x1 6= x2 e due
intorni I1 e I2 di x1 e x2 , saranno I1 e I2 costituiti da tutto X privato di n1 e
n2 punti rispettivamente, e I1 ∩ I2 sarà tutto X privato al più di n1 + n2 punti.
Questo insieme non è vuoto essendo X per ipotesi infinito.
Gli spazi topologici T2 godono delle due seguenti importanti proprietà:
Teorema 11. In uno spazio X di Hausdorff (T2 ) ogni successione convergente
ha un unico limite.
Dimostrazione. Sia {xn } una successione di elementi xn ∈ X convergente a
due elementi x e y con x 6= y. Essendo X di Hausdorff esistono due intorni Ix e
Iy con x ∈ Ix , y ∈ Iy e Ix ∩ Iy = 6 O. Ma xn → x per cui esiste n̄ tale che per
n > n̄ xn ∈ Ix . Essendo Ix ∩ Iy = 6 O, l’intorno Iy contiene al più gli elementi
x1 , x2 , ..., xn̄ e pertanto {xn } non può convergere a y.
38
Affinchè valga il teorema inverso, occorre fare la ulteriore ipotesi che lo spazio
soddisfi il primo assioma di numerabilità, che tratteremo in seguito.
Osservazione 14. Il teorema 11 e gli esempi 38 e 39 chiarificano perchè le
successioni convergenti nella topologia grossa e nella topologia discreta non hanno
e hanno, rispettivamente limite unico (vedi anche l’oss. 11).
e disgiunti e compatti in uno spazio di
Teorema 12. Dati due insiemi C e C
f di C e C
e rispettivamente.
Hausdorff, esistono intorni disgiunti W e W
Dimostrazione. Sia C costituito da un solo punto x (insiemi finiti sono come esistono due intorni disgiunti I di x e Ie di x̃. La famiglia
patti). Per ogni x̃ ∈ C
e ed essendo C
e compatto esiste una
di tutti gli Ie costituisce un ricoprimento di C
e Siano I1 , I2 , ..., In i corrispondenti intorni
sottofamiglia Ie1 , Ie2 , ..., Ien che ricopre C.
f = Ie1 ∪ Ie2 ∪ ... ∪ Ien . W e W
f sono i
di x e consideriamo W = I1 ∩ I2 ∩ ... ∩ In e W
due intorni cercati in questo caso particolare.
Sia ora C un compatto generico. Da quanto ora provato, per ogni x ∈ C esistono
e La famiglia di tutti gli I ricopre C ed essendo
due intorni disgiunti I e Ie di x e C.
C compatto esiste una sottocopertura finita I1 , I2 , ..., In di C. Siano Ie1 , Ie2 , ..., Ien i
e e consideriamo W = I1 ∪I2 ∪...∪In e W
f = Ie1 ∩Ie2 ∩...∩Ien .
corrispondenti intorni di C
f sono i due intorni disgiunti di C e C.
e
Come prima, W e W
Teorema 13. Un sottoinsieme compatto di uno spazio di Hausdorff è chiuso.
Dimostrazione. Sia C un insieme compatto e sia x ∈ C ma x ∈
/ C. Essendo
l’insieme costituito dal singolo punto x un compatto, per il teorema 12 esiste
un intorno di x che non contiene punti di C. Ma allora x ∈
/ C, contrariamente
all’ipotesi. Quindi x ∈ C e C ⊂ C e cioè C = C, per cui C è chiuso.
E’ possibile introdurre ulteriori distinzioni tra spazi topologici utilizzando
altre proprietà di separazione, ma noi ci limitiamo alle due grandi classi T1 e T2 .
Osservazione 15. Oltre all’unicità del limite di successioni convergenti,
esiste un’altra importante differenza tra topologie generali e quella usuale sulla
retta R. E’ un risultato classico dell’analisi il fatto che un punto x è punto di
accumulazione per un sottoinsieme S ⊂ R se e solo se esiste una successione {xn }
39
di elementi distinti di S convergente a x. Dimostreremo nel prossimo paragrafo
(teorema 16) che ciò dipende da una caratteristica di numerabilità della topologia,
comune a tutte le topologie metriche e quindi anche a quella usuale della retta R.
In uno spazio topologico invece, è sempre vero che il limite x di una successione di
elementi distinti di S è punto di accumulazione per S: ogni intorno Ix di x contiene
infatti almeno un punto di S distinto da x (contiene in realtà tutti gli elementi
della successione da un indice in poi). Non è necessariamente vero il contrario,
in quanto è possibile che un punto x sia di accumulazione per un sottoinsieme
S senza che esista alcuna successione in S convergente a x. Il prossimo esempio
illustra come ciò sia possibile.
Esempio 46. Sia X = l’intervallo chiuso [0, 1] e consideriamo la famiglia
F comprendente il vuoto e tutti i sottoinsiemi ottenuti eliminando dall’intervallo
[0, 1] un numero finito o numerabile di punti. F è una topologia. Basta infatti considerare la topologia T1 dell’esempio 4, costituita dagli elementi a complementare
finito, e in quella verifica degli assiomi sostituire finito con numerabile. In questo
spazio sono convergenti solo le successioni stazionarie, quelle cioè i cui elementi da
un certo indice in poi sono uguali tra di loro: xn̄ = xn̄+1 = xn̄+2 = .... Infatti,
esistono intorni di x privi di tutti gli elementi xn 6= x, e affinchè la successione sia
convergente anche tali intorni devono contenere tutti gli elementi della successione
da un indice in poi, che pertanto devono essere tutti uguali a x. Consideriamo
ora il sottoinsieme S = (0, 1] ⊂ X aperto a sinistra. Ogni intorno di 0 contiene
sicuramente almeno un altro punto di X e pertanto di S (in realtà una infinità non
numerabile) e quindi 0 è punto di accumulazione per S. D’altra parte, nessuna
successione in S può convergere a 0 visto che non lo contiene.
7. NUMERABILITA’
Definizione 20. Uno spazio topologico è detto soddisfare il primo assioma
di numerabilità se in ogni punto ha una base numerabile.
Teorema 14. Se B = {Bn }, n = 1, 2, ..., è una base numerabile in x, esiste
una catena numerabile di intorni costituenti una base in x, una base cioè definita
40
en : B
e1 ⊃ B
e2 ⊃ B
e3 ⊃ ...}.
da: Be = {B
en } definiti da:
Dimostrazione. Consideriamo la successione di intorni {B
e1 = B1 , B
e2 = B1 ∩ B2 , ..., B
en = B1 ∩ B2 ∩ ... ∩ Bn , .... Evidentemente
B
e1 ⊃ B
e2 ⊃ B
e3 ...; inoltre ciascun B
en contiene x e, dato un intorno Ix di x, esiste
B
en̄ ⊂ Bn̄ ⊂ Ix . Quindi, Be è una base in x costituita da una catena
n̄ tale che x ∈ B
di aperti.
Osservazione 16. Se X è uno spazio soddisfacente il primo assioma di
numerabilità, dal teorema 14 segue che in ogni punto x ∈ X esiste una base
numerabile di aperti in catena.
Definizione 21. Uno spazio topologico è detto soddisfare il secondo assioma
di numerabilità se possiede una base numerabile. Un tale spazio è detto anche
perfettamente separabile.
Osservazione 17. Una base che soddisfa il secondo assioma di numerabilità,
soddisfa anche il primo. Una base in un punto è infatti un sottoinsieme di una
base per l’intero spazio e un sottoinsieme di un insieme numerabile è numerabile.
Esempio 47. Sia X dotato della topologia discreta. In ogni punto x, una
base è data dal sottoinsieme x costituito dal singolo elemento x (vedi l’esempio
26). Questo spazio soddisfa quindi il primo assioma di numerabilità.
Esempio 48. Sia X un insieme non numerabile (ad esempio la retta reale R)
dotato della topologia discreta. Ogni base contiene la base costituita dai singoli
elementi (vedi l’esempio 26) e quindi non è numerabile. Questo spazio non è
perfettamente separabile.
I prossimi due teoremi riguardano due importanti conseguenze del primo assioma di numerabilità sulle successioni convergenti. Il primo rappresenta una sorta
di teorema inverso del teorema 11, ove era stato dimostrato che in uno spazio di
Hausdorff ogni successione convergente ha limite unico. Il secondo stabilisce la
preannunciata connessione tra punti di accumulazione e successioni convergenti.
41
Teorema 15. Sia X uno spazio topologico soddisfacente il primo assioma
di numerabilità. Allora, se ogni successione convergente ha limite unico, X è uno
spazio di Hausdorff.
Dimostrazione. Supponiamo che X non sia di Hausdorff. Allora, esistono
b, c ∈ X con b 6= c tali che ogni coppia di intorni Ib e Ic di b e di c hanno
intersezione non nulla. Poichè X soddisfa il primo assioma di numerabilità , per
il teorema 14 esistono due basi numerabili B = {Bn : B1 ⊃ B2 ⊃ B3 ⊃ ...} e
C = {Cn : C1 ⊃ C2 ⊃ C3 ⊃ ...} di b e c rispettivamente, tali che, per ipotesi,
Bn ∩ Cn 6= 6 O, ∀n. Consideriamo allora la successione {dn : dn ∈ Bn ∩ Cn }.
Essendo B1 ∩ C1 ⊃ B2 ∩ C2 ⊃ B3 ∩ C3 ⊃ ..., la successione {dn } è convergente a
b e c contemporaneamente, contro l’ipotesi del teorema. Lo spazio X deve essere
quindi di Hausdorff.
Teorema 16. In uno spazio topologico X soddisfacente il primo assioma di
numerabilità, se un punto x è di accumulazione per un sottoinsieme S ⊂ X, allora
esiste una successione {xn } di punti distinti di S convergente a x.
en } la base
Dimostrazione. Sia x punto di accumulazione per S, e sia {B
ek contiene almeno
numerabile in catena nel punto x (vedi l’osservazione 16). Ogni B
un punto xk ∈ S distinto da x, ed è immediato mostrare che la successione {xk }
tende a x.
Osservazione 18. La condizione necessaria del precedente teorema era stata
rilevata nell’osservazione 15 per un arbitrario spazio topologico. Pertanto, in uno
spazio topologico soddisfacente il primo assioma di numerabilità, x è punto di
accumulazione per un sottoinsieme S ⊂ X se e solo se esiste una successione {xn }
di elementi distinti di S convergente a x. D’altra parte un insieme S è chiuso se
e solo se contiene tutti i suoi punti di accumulazione (teorema 2). Dunque, in
uno spazio topologico soddisfacente il primo assioma di numerabilità un insieme
S è chiuso se e solo se contiene tutti i punti limiti di successioni convergenti {xn }
formate da elementi distinti di S.
Definizione 22. Uno spazio topologico X è detto separabile se contiene un
sottoinsieme numerabile e denso in X.
42
Teorema 17. Se X è uno spazio topologico perfettamente separabile, allora
è anche separabile.
Dimostrazione. Sia B una base numerabile in X e sia S l’insieme ottenuto
scegliendo un elemento da ogni membro della base. S è numerabile e inoltre S = X.
Se cosı̀ non fosse C(S) sarebbe un aperto non vuoto e pertanto, dato x ∈ C(S) e
un intorno di x contenuto in C(S), cioè x ∈ Ix ⊂ C(S), deve esistere un elemento
della base B ∈ B tale che x ∈ B ⊂ Ix ⊂ C(S). Ma allora S e a maggior ragione S
non conterrebbe punti di B, contrariamente all’ipotesi.
Come vedremo, negli spazi metrici è vero anche che uno spazio separabile è
perfettamente separabile.
Esempio 49. X = R con la topologia usuale è perfettamente separabile,
poichè contiene l’insieme dei razionali Q che è numerabile e denso in R, cioè
Q = R.
Esempio 50. Come avevamo già sottolineato, la topologia usuale sulla retta
reale R è derivata da una struttura preesistente alla topologia, è derivata cioè dalla
distanza |x1 − x2 | tra due punti. Come vedremo, questa distanza definisce uno
spazio metrico e quindi, da quanto detto dopo il teorema 17, la retta reale è anche
perfettamente separabile. La base numerabile è costituita dai segmenti aperti di
semiampiezza razionale centrati nei razionali. Che questa sia effettivamente una
base lo mostreremo in un caso più generale per gli spazi metrici.
Esempio 51. Sia X un insieme non numerabile (ad esempio la retta R)
dotato della topologia discreta. Ogni sottoinsieme S ⊂ X è sia aperto che chiuso
per cui l’unico sottoinsieme denso in X è X stesso, per ipotesi non numerabile.
Dunque, X non è separabile.
43
8. SPAZI LINEARI TOPOLOGICI
In quest’ultimo paragrafo sulle topologie, introduciamo la vasta classe degli
spazi lineari topologici. Appartengono a essa come casi particolari gli spazi normati, gli spazi numerabilmente normati e l’insieme dei funzionali lineari limitati
su spazi lineari topologici. Tutte strutture che esamineremo in dettaglio in seguito. Vedremo in particolare che i funzionali lineari limitati non sono in genere
strutturabili in altro modo che quali appunto spazi lineari topologici. In questo
paragrafo ci limiteremo a considerare alcune caratteristiche principali e a dare
qualche semplice esempio tratto da strutture già esaminate.
Definizione 23. Un insieme X si dice spazio lineare topologico se sono soddisfatte le seguenti condizioni:
i) X è uno spazio lineare sui numeri reali o complessi;
ii) X è uno spazio topologico;
iii) le operazioni di somma e di moltiplicazione per numeri sono continue rispetto
alla topologia di X.
Diamo anzitutto qualche semplice definizione:
Definizione 23. L’insieme degli elementi x + y per tutti gli y ∈ U si dice
insieme traslato dell’insieme U secondo l’elemento x, e si indica con x + U .
Gli insiemi degli elementi x + y e x − y per tutti gli x ∈ U e y ∈ V si dicono
rispettivamente somma e differenza aritmetica di U e V , e si indicano con U + V
e U − V . L’insieme degli elementi αx per tutti gli x ∈ U si dice dilatazione di U
secondo il numero α.
Notiamo che U + U 6= 2U . Inoltre, non confondere l’elemento zero, elemento
neutro della somma, con l’insieme vuoto.
Osservazione 19. I primi due assiomi sono già stati trattati nei precedenti
capitoli. Consideriamo in dettaglio l’assioma iii), osservando preliminarmente che
la funzione f (x) = αx + y è continua, e per α 6= 0 anche la funzione inversa è
continua, e pertanto (vedi il paragrafo 3) f trasforma aperti in aperti e chiusi in
chiusi. Vale anche f (V ) = f (V ).
iii.a) Continuità della somma e sottrazione. Cioè , dato x±y = z e un intorno
44
qualsiasi Iz di z, esistono un intorno Ix di x e un intorno Iy di y, tali che se x0 ∈ Ix
e y 0 ∈ Iy , allora x0 ± y 0 ∈ Iz , ovvero, sinteticamente, Ix ± Iy ⊂ Iz .
iii.b) Continuità del prodotto per un numero. Ovvero, se αx = y, allora per
ogni intorno Iy di y esiste un intorno Ix di x e un numero > 0 tali che, da x0 ∈ Ix
e |α0 − α| < segue α0 x0 ∈ Iy .
Vediamone ora alcune conseguenze.
a1 ) L’insieme di tutti i traslati di tutti gli intorni dello zero definiscono un
sistema di aperti in X che è equivalente alla topologia originaria.
Abbiamo già osservato che i traslati di aperti sono degli aperti. Vediamo ora che
questo sistema di aperti è equivalente alla topologia originaria. Sia dato l’aperto
V = x̄ + U0 , essendo U0 un intorno dello zero e sia x ∈ V . Mostriamo che esiste
nella topologia originaria un intorno W1 di x tale che W1 ⊂ V . Poichè x ∈ V ,
allora x − x̄ ∈ U0 e quindi, per l’assioma iii.a, esistono due intorni W1 di x e W2 di
x̄ tali che W1 − W2 ⊂ U0 . In particolare, dato che x̄ ∈ W2 , abbiamo W1 − x̄ ⊂ U0 ,
ovvero x ∈ W1 ⊂ x̄ + U0 = V , che è quanto volevamo.
Viceversa, sia V un intorno del punto x̄ e mostriamo che esiste un intorno dello
zero U0 tale che x̄ ∈ x̄ + U0 ⊂ V . Poichè x̄ + 0 = x̄, per l’assioma iii.a), possiamo
trovare un intorno W di x̄ e un intorno U0 di 0 tali che W + U0 ⊂ V . Poichè
x̄ ∈ W , otteniamo infine x̄ ∈ x̄ + U0 ⊂ V , CVD.
a2 ) La topologia in X può essere ricostruita o direttamente definita a partire
dal sistema di intorni dello zero. Da quanto visto prima, è sufficiente traslare tutti
questi intorni in tutti i modi possibili. Questo vuol dire che lo spazio ha le stesse
proprietà topologiche locali in ogni punto. Ad esempio, se il primo assioma di
numerabilità è soddisfatto in un punto, allora è soddisfatto ovunque.
Anche una base può essere traslata, per cui data la base in zero B0 , la famiglia
degli insiemi x + B per tutti i B ∈ B0 è una base in x.
a3 ) Uno spazio lineare topologico è sempre regolare, ovvero, per ogni x e ogni
intorno U di x esiste un intorno V di x contenuto in U insieme alla sua chiusura,
cioè x ∈ V ⊂ U . Data l’omogeneità dello spazio lineare topologico in ogni punto,
è sufficiente mostrare questa proprietà in x = 0. Possiamo quindi scegliere due
45
intorni V1 e V2 dello zero soddisfacenti a V1 − V2 ⊂ U per continuità della sottrazione, e inoltre scegliere un terzo intorno V di zero contenuto nell’intersezione
U ∩ V1 ∩ V2 , per il quale vale ovviamente V − V ⊂ U . Mostriamo che la chiusura
V di V è completamente contenuta in U . Sia infatti x̄ un punto di accumulazione
per V . Allora, l’intorno W = x̄ + V del punto x̄ contiene qualche punto di V e
cosı̀ W ∩ V 6= 6 O. Sia y ∈ W ∩ V che, essendo y ∈ W sarà del tipo y = x̄ + z con
z ∈ V . Allora, essendo y ∈ V , sarà x̄ = y − z ∈ V − V ⊂ U , come visto prima.
Essendo anche V ⊂ U , l’asserto è dimostrato.
a4 ) Se uno spazio lineare topologico è T1 , esso è anche T2 . Infatti, essendo
di tipo T1 , dati x1 6= x2 , esiste un intorno I1 di x1 che non contiene x2 (vedi
paragrafo 6). Essendo regolare (vedi sopra), esiste un altro intorno V1 di x1 tale
che x1 ∈ V 1 ⊂ I1 . Il complementare di V 1 è aperto e contiene x2 e un suo intorno
V2 . Evidentemente V1 ∩ V2 = 6 O, e dunque lo spazio è T2 .
Tutte queste proprietà sono familiari caratteristiche topologiche dei più accessibili spazi normati che vedremo in seguito, e il cui prototipo come al solito è
costituito dalla retta usuale.
Esempio 52. La retta reale R con l’usuale topologia dell’esempio 10 è uno
spazio lineare topologico. Infatti, fissato l’intorno Izh0 definito da |z0 − z| < h,
h/2
h/2
poichè |(x0 ± y0 ) − (x ± y)| ≤ |x0 − x| + |y0 − y|, i due intorni Ix0 e Iy0 soddisfano
la condizione iii.a). Inoltre, fissato l’intorno Iz0 di z0 = α0 x0 , poichè vale
|α0 x0 − αx| ≤ |α0 − α||x0 | + |x0 − x||α|, scelti = h/(2|x0 |) e k = h/2(|α0 | + ),
per |α0 − α| < e x ∈ Ixk0 , si ottiene |α0 x0 − αx| < h e cioè αx ∈ Izh0 , verificando
cosı̀ la iii.b).
Analogamente, gli spazi RN con la usuale topologia dell’esempio 11 sono spazi
lineari topologici.
Esempio 53. Lo spazio topologico dell’esempio 9, cioè il cerchio
n
o p
X = {x, y} : x2 + y 2 ≤ 2, con ordinari somma e prodotto non è uno spazio
lineare e quindi neppure uno spazio lineare topologico.
Esempio 54. Il piano R2 dell’esempio 7, con la topologia F = {X, 6 O, An },
46
n
p
con An = {x, y}} : x2 + y 2 <
1
n
o
, n = 1, 2, ... è uno spazio lineare, ma non è
lineare topologico, dato che non esistono aperti traslati. Esplicitamente, controlliamo che non soddisfa la iii.a). Siano ad esempio x0 = {2, 2} e y0 = {−2, −2};
allora, come intorno arbitrario di z0 = x0 + y0 = {0, 0} può essere assunto uno
qualsiasi degli An mentre l’unico intorno sia di x0 che di y0 è costituito dall’intero
piano R2 ed ovviamente R2 + R2 6⊂ An .
Introduciamo ora alcune definizioni che risulteranno utili in seguito.
Definizione 24. Due spazi lineari topologici X e Y sono detti topologicamente isomorfi, o linearmente omeomorfi, se esiste un operatore lineare T che
definisce una corrispondenza omeomorfica tra X e Y (vedi la definizione 14).
Definizione 25. Un sottoinsieme S di uno spazio lineare topologico X si
dice equilibrato o bilanciato se ES = ∪α (αS) ⊂ S, essendo E l’insieme dei numeri
α con |α| ≤ 1. Notare che se l’insieme T non è vuoto, allora ET è equilibrato.
Definizione 26. Un sottoinsieme S di uno spazio lineare topologico X è
detto assorbente se, per ogni x ∈ X, esiste > 0 tale che αx ∈ S per 0 < |α| ≤ .
Definizione 27. Un sottoinsieme S di uno spazio lineare topologico X è
detto insieme limitato se può essere assorbito da un qualsiasi intorno dello zero
U0 , ovvero se per ogni intorno U0 dello zero esiste α > 0 tale che αS ⊂ U0 .
Definizione 28. Uno spazio lineare topologico è detto localmente limitato se
in esso esiste almeno un insieme aperto limitato (non vuoto).
L’esempio 52 rientra in questa classe grazie ai segmenti aperti |z0 − z| < h. Il
prossimo invece riguarda uno spazio lineare topologico non localmente limitato.
Esempio 55. Sia R∞ lo spazio lineare di tutte le successioni possibili
x = {x1 , x2 , ...., xn , ...}. Sia U (k1 , k2 , ..., km ; ) il sistema di intorni dello zero
individuati dalle m − uple di interi {ki } e da > 0, e costituiti da tutti i punti
x ∈ R∞ tali che |xki | < per i = 1, 2..., r. E’ facile mostrare che questi intorni
definiscono R∞ quale spazio lineare topologico. E’ altrettanto semplice dimostrare
che non è localmente limitato.
47
Introduciamo infine una classe più ristretta di spazi lineari topologici che, pur
mantenendo una sufficiente generalità, risultano più vicini agli esempi familiari
visti in precedenza; vedremo in seguito che condividono con gli spazi normati una
delle caratteristiche salienti di questi. Premettiamo una definizione legata solo
alla linearità dello spazio e qui introdotta perchè particolarmente utile nell’ambito
degli spazi lineari topologici.
Definizione 29. Un insieme A in uno spazio lineare X è detto convesso
se, dati due suoi elementi x1 , x2 ∈ A, esso contiene anche tutto il ”segmento”
compreso fra entrambi, cioè αx1 + βx2 ∈ A, con α, β ≥ 0 e α + β = 1.
Definizione 30. Uno spazio lineare topologico è detto localmente convesso
se ogni suo insieme aperto (non vuoto) contiene un sottoinsieme aperto convesso
(non vuoto).
Osservazione 20. Se lo spazio lineare topologico X è localmente convesso,
per ogni x ∈ X e ogni suo intorno Ux esiste un intorno convesso Vx tale che
x ∈ Vx ⊂ Ux . E’ sufficiente mostrare la validità di tale affermazione per x = 0.
Dato allora U0 , per la continuità della somma esiste V0 tale che V0 − V0 ⊂ U0 .
Poichè X è localmente convesso, esiste un aperto convesso non vuoto V00 ⊂ V0 , e
sia y ∈ V00 ; allora V00 − y è un intorno convesso dello zero contenuto in U0 .
APPENDICE.
Riportiamo in questa appendice alcuni classici risultati sulla topologia usuale
della retta R (esempio 10).
Teorema A sulle proprietà di inclusione degli intervalli chiusi e limitati. Sia
{Ii : Ii = [ai , bi ], I1 ⊃ I2 ⊃ ... ⊃ In ⊃ ...} una successione di intervalli chiusi e
limitati, ciascuno contenuto nel precedente. Allora esiste almeno un punto comune
a ogni intervallo, cioè ∩∞
n=1 Ii 6= 6 O.
Dimostrazione. La catena I1 ⊃ I2 ⊃ ... ⊃ In ⊃ ... implica ovviamente
a1 ≤ a2 ≤ ... ≤ an ≤ ... ≤ bn ≤ ... ≤ b2 ≤ b1 . Allora ciascun b è un limite superiore
48
per l’insieme {ai } che ammette pertanto estremo superiore x = sup(ai ). * Ma
x ≤ bn ∀n, dato che bn è un limite superiore per l’insieme {ai }, e x è il minimo
dei limiti superiori di {ai }. Inoltre an ≤ x ∀n, per cui an ≤ x ≤ bn ∀n, cioè
x ∈ In = [an , bn ] ∀n, cioè appartiene a ogni intervallo In e dunque ∩∞
i=1 Ii 6= 6 O.
Osservazione. Nella proprietà prima enunciata, è fondamentale l’ipotesi di
limitatezza e chiusura degli intervalli. Infatti:
Esempio A. Sia {Si : Si = (0, 1i ]}, i = 1, 2, ... una successione di intervalli limitati aperti a sinistra e chiusi a destra. Vale evidentemente la catena di
contenimento S1 ⊃ S2 ⊃ ... ⊃ Sn ⊃ ..., ma altrettanto evidentemente ∩∞
i=1 Si = 6 O.
Esempio B. Sia {Si : Si = [i, ∞)}, i = 1, 2, ... una successione di intervalli
chiusi non limitati. Vale S1 ⊃ S2 ⊃ ... ⊃ Sn ⊃ ..., ma ∩∞
i=1 Si = 6 O.
Teorema B di Bolzano Weierstrass. Sulla retta reale R con la topologia
usuale, ogni insieme infinito limitato S ha almeno un punto di accumulazione.
Dimostrazione. S è un sottoinsieme di un intervallo chiuso I1 = [a1 , b1 ].
Dividiamo I1 nei due subintervalli [a1 , 12 (a1 +b1 )] e [ 12 (a1 +b1 ), b1 ], e sia I2 = [a2 , b2 ]
quello dei due che contiene infiniti elementi di S. Dividiamo ancora a metà I2
e sia I3 = [a3 , b3 ] la parte che contiene infiniti elementi di S. Continuando il
procedimento indicato, otteniamo una successione di intervalli chiusi e limitati
contenuti ciascuno nel precedente: I1 ⊃ I2 ⊃ ... ⊃ In ⊃ .... Per il teorema A,
esiste un punto x comune a tutti gli intervalli In . Mostriamo che x è punto di
accumulazione per S. Sia infatti Ix = (a, b) un intervallo aperto contenente x.
Poichè |In | → 0 (|In | = bn − an è la lunghezza dell’intervallo), esiste n̄ tale che
|In̄ | < min(x − a, b − x) e pertanto In̄ ⊂ Ix . Ma In̄ contiene infiniti elementi di S
per costruzione e cosı̀ anche l’intorno arbitrario Ix di x, che contiene perciò altri
punti di S oltre a x.
* Per un noto assioma dei numeri reali, se esiste un limite superiore di un
insieme S di reali, allora esiste anche l’estremo superiore o sup S, ovvero il più
piccolo dei limiti superiori. Notare che l’assioma afferma che il sup S esiste, non
che appartiene necessariamente a S. Questo avviene se S è chiuso, dato che sup S
è evidentemente un punto di accumulazione per S.
49
Teorema C di Heine-Borel. Sulla retta reale R con la topologia usuale, ogni
insieme chiuso e limitato è compatto (e viceversa).
Dimostrazione.
Sia dato l’intervallo chiuso e limitato I1 = [c1 , d1 ] e sia
G = {Ai = (ai , bi )} una sua copertura aperta. Supponiamo per assurdo che
I1 non sia compatto, cioè che da G non sia possibile estrarre una sottocopertura
finita. Dividiamo I1 in due intervalli chiusi [c1 , 12 (c1 + d1 )] e [ 12 (c1 + d1 ), d1 ], uno
almeno dei quali non ha sottocoperture finite per ipotesi e che indichiamo con I2 .
Dividiamo I2 in due intervalli e diciamo I3 quello dei due (almeno uno esiste) che
non ha sottocoperture finite. Ripetiamo l’operazione su I3 e cosı̀ via, ottenendo
una successione infinita di intervalli chiusi e limitati I1 ⊃ I2 ⊃ ... ⊃ In ⊃ ... nessuno dei quali ha una sottocopertura finita. Per il teorema A, vale ∩∞
i=1 Ii = 6 O,
per cui esiste almeno un punto x contenuto in tutti gli intervalli Ii e in particolare
x ∈ I1 . Poichè G è una copertura di I1 , esiste in G un aperto Ai0 = (ai0 , bi0 )
che contiene x, e quindi ai0 ≤ x ≤ bi0 . Ma |In | → 0, per cui esiste un intero n0
tale che |In0 | < min(x − ai0 , bi0 − x). Allora, In0 ⊂ (ai0 , bi0 ) e sarebbe pertanto
ricopribile con il singolo elemento (ai0 , bi0 ) ∈ G, contrariamente alla scelta di In0 .
E’ falsa quindi l’ipotesi iniziale secondo la quale sarebbe stato possibile scegliere
la successione {Ii } in modo tale che nessun Ii avesse una sottocopertura finita.
Abbiamo dimostrato il teorema per un singolo intervallo chiuso e limitato, ma
poichè un insieme chiuso è l’unione di un numero finito di intervalli chiusi, anche
l’asserto più generale è dimostrato.
La condizione necessaria, ovvero che ogni ogni insieme compatto è chiuso e limitato
è dimostrata tramite i controesempi 34 e 35. Una dimostrazione diretta di ciò è
data nel capitolo sugli spazi metrici.
Teorema D di Weierstrass. Una funzione continua x(t) in un insieme chiuso
e limitato [a, b] è ivi dotata di estremo superiore e inferiore.
Dimostrazione. Per il teorema di Heine-Borel l’insieme chiuso e limitato [a, b]
è un insieme compatto. Per il teorema 9, la funzione continua x(t) trasforma compatti in compatti e quindi il trasformato di [a, b] secondo x(t) è chiuso e limitato.
Esso è dunque dotato di estremo superiore e inferiore (vedi la nota al teorema A).
50
3. SPAZI METRICI
1. SPAZI METRICI
Definizione 1. Sia X un insieme qualsivoglia e indichiamo con {X, X}
l’insieme delle coppie ordinate di elementi di X. Una funzione d con dominio
{X, X} e codominio nel corpo dei reali si dice metrica o distanza in X se, per
qualunque x, y, z ∈ X, soddisfa le seguenti proprietà:
I) d(x, y) = d(y, x)
II) d(x, z) ≤ d(x, y) + d(y, z)
III) d(x, y) = 0 se e solo se x = y.
Una proprietà che si deduce dai tre assiomi ponendo in II) z = x è la seguente:
IV) 0 ≤ d(x, y).
Uno spazio cosı̀ strutturato si dice spazio metrico; d(x, y) è detta distanza tra
x e y; la proprietà II) è detta diseguaglianza triangolare.
Esempio 1. Sia X = RN , l’insieme delle N-ple ordinate di numeri reali.
Dato x ≡ q
{ξ1 , ξ2 , ..., ξN } e y ≡ {η1 , η2 , ..., ηN } appartenenti a RN , il numero reale
PN
N
2
d(x, y) =
i=1 (ξi − ηi ) definisce una metrica in R , come è facile verificare.
Questa è la distanza usuale sulla retta, sul piano, nello spazio tridimensionale
e da questi esempi è tratta la nomenclatura. La proprietà II) nel piano viene
solitamente enunciata dicendo che in un triangolo di vertici x,y,z un lato è minore
della somma degli altri due.
Esempio 2. Sia X ≡ RN e siano x, y ∈ RN come nell’esempio 1. Le due
PN
funzioni reali d1 (x, y) = maxi=1,N |ξi −ηi | e d2 (x, y) = i=1 |ξi − ηi | definiscono
in RN due metriche diverse tra loro e diverse da quella dell’esempio 1. La verifica
delle proprietà I) e III) è immediata. Per la II), sia z ≡ {ζ1 , ζ2 , ..., ζN }; poichè
|ξi − ζi | = |ξi − ηi + ηi − ζi | ≤ |ξi − ηi | + |ηi − ζi |, allora:
maxi=1,N |ξi − ζi | = |ξn̄ − ζn̄ | ≤ |ξn̄ − ηn̄ | + |ηn̄ − ζn̄ | ≤
≤ maxi=1,N |ξi − ηi | + maxi=1,N |ηi − ζi |;
da cui d1 (x, z) ≤ d1 (x, y) + d1 (y, z). Analogamente:
51
d2 (x, z) =
PN
i=1
|ξi − ζi | ≤
PN
i=1
|ξi − ηi | + |ηi − ζi | = d2 (x, y) + d2 (y, z).
Esempio 3. Sia X ≡ C[a,b] , lo spazio delle funzioni reali continue di variabile
reale t ∈ [a, b]. X è metrico assumendo come distanza tra x(t), y(t) ∈ X :
d(x, y) = maxt∈[a,b] |x(t) − y(t)|. Anzitutto, notiamo che questa d(x, y) esiste.
Infatti x(t) − y(t) è ancora una funzione continua in un intervallo chiuso e limitato
ed è ivi dotata di estremo superiore, per il teorema (2.A.D) di Weierstrass. Le
proprietà I) e III) sono immediate. Per la II):
|x(t) − z(t)| = |x(t) − y(t) + y(t) − z(t)| ≤ |x(t) − y(t)| + |y(t) − z(t)|
e pertanto:
maxt∈[a,b] |x(t) − z(t)| ≤ maxt∈[a,b] |x(t) − y(t)| + maxt∈[a,b] |y(t) − z(t)|.
Esempio 4. X = C[a,b] diventa uno spazio metrico con la distanza
Rb
d(x, y) = a |x(t) − y(t)|dt. Per la proprietà triangolare vedi l’esempio 3.
qR
2
b
x(t) − y(t) dt. Le
Esempio 5. X = C[a,b] è metrico con d(x, y) =
a
proprietà I) e III) sono ovvie. Per la II) si può procedere come segue. Consideriamo
la funzione (positiva) del parametro reale λ:
2
Rb
Rb
Rb
Rb
0 ≤ f (λ) = a λx(t) + y(t) dt = λ2 a x(t)2 dt + 2λ a x(t)y(t)dt + a y(t)2 dt.
f (λ) è pertanto un trinomio in λ con lo stesso segno del termine di grado massimo.
Quindi f (λ) ha radici complesse coniugate e discriminante negativo:
R
2 R
Rb
b
b
x(t)y(t)dt
− a x(t)2 dt · a y(t)2 dt ≤ 0.
a
Pertanto:
2
Rb
Rb
Rb
Rb
x(t) + y(t) dt = a x(t)2 dt + 2 a x(t)y(t)dt + a y(t)2 dt ≤
a
qR
Rb
Rb
Rb
b
2
≤ a x(t) dt + 2 a x(t)2 dt · a y(t)2 dt + a y(t)2 dt.
Con la sostituzione x(t) → x(t) − y(t) e y(t) → y(t) − z(t),
qR
qR
2
2
2 2
Rb
b
b
x(t)
−
z(t)
dt
≤
x(t)
−
y(t)
dt
+
y(t)
−
z(t)
dt
a
a
a
ed estraendo la radice quadrata, otteniamo la diseguaglianza triangolare.
Esempio 6. Sia X = C ∞ , cioè X ≡ x = {ξ1 , ξ2 , ..., ξn , ...}; |ξm | < Kx ∀m
con Kx numero reale positivo dipendente da x, cioè gli insiemi ordinati numerabili
52
di infiniti numeri complessi limitati. Se si assume d(x, y) = supi |ξi − ηi |, lo spazio
C ∞ diventa metrico e si indica con l∞ .
Esempio 7. Sia X lo spazio delle successioni x ≡ {ξi } di numeri complessi
P∞
tali che i=1 |ξi |p < ∞ con p ≥ 1. Questo spazio si indica con lp e diventa uno
P∞
p 1/p
.
spazio metrico definendo la distanza: d(x, y) =
i=1 |ξi − ηi |
Per mostrare che si tratta effettivamente di una distanza, nel prossimo teorema
dimostreremo la diseguaglianza (detta di Minkowski):
∞
X
p 1/p
|ξi − ηi |
≤
i=1
∞
X
p 1/p
|ξi |
+
i=1
∞
X
|ηi |p
1/p
.
i=1
Come nell’esempio 5, con la sostituzione x → x − y e y → y − z si ottiene la
diseguaglianza triangolare.
Nel caso di p = 1, 2 e per spazi N-dimensionali, la diseguaglianza di cui sopra è
quella familiare degli RN dell’esempio 1 e della metrica d2 dell’esempio 2.
Teorema 1. Per x ∈ lp e y ∈ lq con p > 1, q > 1 e 1/p + 1/q = 1, vale la
diseguaglianza di Schwarz-Hölder:
∞
X
|ξi ηi | ≤
∞
X
p 1/p
|ξi |
|ηi |q
1/q
.
i=1
i=1
i=1
·
∞
X
Per x, y ∈ lp con p ≥ 1 vale la diseguaglianza di Minkowski:
∞
X
i=1
p 1/p
|ξi − ηi |
≤
∞
X
p 1/p
|ξi |
i=1
+
∞
X
|ηi |p
1/p
.
i=1
Dimostrazione. Per quanto riguarda la prima diseguaglianza, se p e q sono due
numeri reali tali che p > 1, q > 1 e 1/p + 1/q = 1, la funzione f (t) = tp /p + t−q /q
ha derivata negativa per 0 < t < 1 e positiva per 1 < t, per cui ha minimo in
t = 1 e vale f (1) = 1. Si ha cioè 1 ≤ f (t) per 0 < t e, scegliendo t = a1/q b−1/p e
ricordando che p/q + 1 = p e q/p + 1 = q, otteniamo ab ≤ ap /p + bq /q per tutti
i valori a, b > 0. Pertanto, |ab| ≤ |a||b| ≤ |a|p /p + |b|q /q, per ogni a, b complessi.
PN
PN
Posto allora a = ξk /( i=1 |ξi |p )1/p e b = ηk /( i=1 |ηi |q )1/q , sommando su k da 1
53
a N , e grazie ancora a 1/p + 1/q = 1, otteniamo:
N
X
|ξi ηi | ≤
N
X
i=1
|ξi |p
1/p
N
X
·
i=1
|ηi |q
1/q
.
i=1
Per ipotesi, esiste il limN →∞ dei due fattori alla destra per cui possiamo passare
al limite anche nella somma di sinistra, che è a termini positivi, ottenendo cosı̀ la
prima delle due diseguaglianze.
La seconda diseguaglianza è vera per p = 1. Per p > 1:
N
X
p
|ξi − ηi | ≤
≤
|ξi − ηi |p−1 |ξi | + |ηi | ≤
i=1
i=1
N
X
N
X
q(p−1) 1/q
|ξi − ηi |
·
N
X
i=1
i=1
p 1/p
|ξi |
+
N
X
|ηi |p
1/p .
i=1
Nell’ultima diseguaglianza abbiamo applicato la diseguaglianza di Schwarz-Hölder
ai due addendi separatamente. Dividendo tutto per il primo fattore a destra e
tenendo conto che q(p − 1) = p e che p − p/q = 1, otteniamo la diseguaglianza
finita di Minkowski. Anche in questo caso possiamo passare al limite per l’ipotesi
di convergenza delle due sommatorie di destra, ottenendo cosı̀ la diseguaglianza di
Minkowski per gli lp . CVD.
Esempio 8. Sia X lo spazio delle successioni x ≡ {ξi } di numeri complessi,
senza alcuna ipotesi su di questi. Una distanza in questo spazio è data dalla
seguente funzione reale:
d(x, y) =
∞
X
1
|ξi − ηi |
·
.
i (1 + |ξ − η |)
2
i
i
i=1
Questa funzione esiste ∀x, y ∈ X: ogni termine della serie è infatti maggiorato da
P∞
1/2i e i=1 1/2i = 1. Le proprietà I) e III) sono soddisfatte. Per la diseguaglianza
triangolare osserviamo che se α e β sono due numeri reali con 0 ≤ α ≤ β, allora
α + αβ ≤ β + αβ, da cui α/(1 + α) ≤ β/(1 + β). Posto allora α = |ξi − ζi | e
β = |ξi − ηi | + |ηi − ζi | > α, si ha
|ξi − ηi | + |ηi − ζi |
|ξi − ηi |
|ηi − ζi |
|ξi − ζi |
≤
≤
+
1 + |ξi − ζi |
1 + |ξi − ηi | + |ηi − ζi |
1 + |ξi − ηi | 1 + |ηi − ζi |
54
La seconda diseguaglianza è immediata. Da qui si ottiene la diseguaglianza II).
Osservazione 1. Gli esempi riportati finora riguardavano metriche su spazi
lineari ed erano pertanto esempi di spazi lineari metrici. In realtà, la definizione
di distanza non comporta che lo spazio debba essere lineare. Consideriamo infatti
il seguente esempio.
Esempio 9. Sia X dato da successioni di numeri interi positivi x ≡ {ni }. Si
può definire una distanza tra x e y ≡ {mi } ponendo d(x, y) = d({ni }, {mi }) = 1/k,
essendo k l’indice dei primi interi nk e mk diversi tra loro e d(x, y) = 0 se ni = mi
∀i. Ad esempio, d({1, 5, 7, 42, 2, ....}, {27, 2, 4, ....}) = 1, mentre
d({1, 5, 7, 42, 2, ....}, {1, 5, 7, 3, 2, ....}) = 1/4. Vale la diseguaglianza triangolare.
Sia infatti d(x, z) = 1/(n + 1), d(x, y) = 1/(m + 1) e d(y, z) = 1/(l + 1). Se
m ≤ n allora 1/(n + 1) ≤ 1/(m + 1) e pertanto la proprietà II) è verificata. Se
n ≤ m, con un disegnino ci si convince che allora n = l, e ancora la II) è verificata.
2. CONVERGENZA IN SPAZI METRICI
Definizione 2. In uno spazio metrico X una successione {xn } di elementi di X
si dice convergente (in metrica) se esiste un elemento x ∈ X tale che d(xn , x) → 0.
Scriveremo ciò come xn → x, e diremo x il limite della successione.
Teorema 2. Se {xn } è una successione convergente in uno spazio metrico X,
il limite è unico.
Dimostrazione. Se xn → x e xn → y, allora d(x, y) ≤ d(x, xn ) + d(xn , y)
e, per ipotesi, fissato > 0 è possibile determinare n tale che per n > n sia
d(x, xn ) < /2 e d(xn , y) < /2; da cui segue d(x, y) < e, dall’arbitrarietà di ,
d(x, y) = 0 cioè x = y.
Osservazione 2. La distanza d(x, y) è una funzione continua di x e y nel
senso che per qualsiasi xn → x e yn → y si ha: d(xn , yn ) → d(x, y). Infatti,
d(x, y) ≤ d(x, xn ) + d(xn , yn ) + d(yn , y), da cui
d(x, y) − d(xn , yn ) ≤ d(xn , x) + d(yn , y). Scambiando x e y con xn e yn si ottiene
d(xn , yn ) − d(x, y) ≤ d(xn , x) + d(yn , y)
e pertanto
|d(x, y) − d(xn , yn )| ≤ d(xn , x) + d(yn , y). Il membro di destra tende a zero per
55
ipotesi se n → ∞, da cui segue l’asserto.
Nei seguenti esempi vedremo a quale convergenza abituale corrisponde la convergenza in metrica.
N
Esempio
qP 10. Come nell’esempio 1, sia X = R metrizzato con la distanza
N
n n
n
2
d(x, y) =
i=1 (ξi − ηi ) . Definito xn ≡ {ξ1 , ξ2 , ..., ξN } come elemento della
PN
successione {xn }, la convergenza xn → x comporta i=1 (ξin − ξi )2 → 0. Questo
n→∞
porta con sè (ξin − ξi ) −−−→ 0 per ogni i. Pertanto, la convergenza in metrica
implica in questo caso l’usuale convergenza delle singole componenti. Essendo
le componenti in numero finito, vale anche il viceversa, cioè la convergenza delle
componenti implica la convergenza in metrica.
Esempio 11. Consideriamo gli spazi lp dell’esempio 7. Come nell’esempio
precedente la convergenza in metrica implica la convergenza delle singole componenti. Viceversa, la convergenza delle componenti non implica necessariamente la
convergenza in metrica, poichè in questo caso si ha a che fare con somme infinite.
Consideriamo infatti la successione {xn } con ξin = δni , cioè la successione di elementi xn con componenti tutte nulle fuorchè la n-sima uguale a 1. E’ chiaro che
la successione delle singole componenti tende a zero, cioè ξin → 0 per n → ∞ e ∀i.
P∞ n p 1/p
D’altra parte d(xn , 0) =
= 1 e quindi in metrica xn 6→ 0.
i=1 |ξi |
Esempio 12. Consideriamo l’esempio 8. La convergenza in metrica xn → x
è verificata se
∞
X
1
|ξin − ξi |
·
→ 0.
i (1 + |ξ n − ξ |)
2
i
i
i=1
Questo comporta anche che
γin ≡
|ξin − ξi |
n→∞
−−−→ 0 ∀i.
n
(1 + |ξi − ξi |)
n→∞
n→∞
Ma |ξin − ξi | = γin /(1 − γin ) e se γin −−−→ 0 ∀i, allora anche |ξin − ξi | −−−→ 0 ∀i.
Dunque, la convergenza in metrica comporta la convergenza delle componenti.
P∞
n→∞
Viceversa, sia ξin −−−→ ξi ∀i. Si spezzi allora la sommatoria i=1 in una somma
PP
P∞
finita i=1 e in un resto i=P . Come detto nell’ esempio 8, ciascun termine della
sommatoria è maggiorato dal termine 1/2i cosicchè la sommatoria stessa è sempre
56
convergente e, fissato > 0, è possibile determinare P indipendente da n tale che
per P > P :
∞
X
|ξin − ξi |
1
·
< /2.
2i (1 + |ξin − ξi |)
i=P
Per quanto riguarda la prima somma finita
PP
i=1
con il P già fissato, per la conver-
genza delle singole componenti è possibile determinare un n tale che per n > n
anche
P
X
1
|ξin − ξi |
·
< /2.
2i (1 + |ξin − ξi |)
i=1
Quindi in questo caso la convergenza delle componenti implica anche la convergenza in metrica.
Esempio 13. Consideriamo lo spazio C[a,b] dell’esempio 3 con la metrica del
max. In questo spazio xn → x se maxt∈[a,b] |xn (t) − x(t)| → 0. Fissato allora > 0
è possibile determinare n tale che per tutti gli n > n valga
|xn (t) − x(t)| < qualunque sia t ∈ [a, b]. Pertanto, la convergenza con la metrica
del max corrisponde alla convergenza uniforme delle funzioni continue.
Esempio 14. Consideriamo X = C[a,b] metrizzato con la distanza
qR
2
b
d(x, y) =
x(t)
−
y(t)
dt dell’esempio 5. Se xn (t) → x(t) uniformemente
a
cioè con la metrica del max, è chiaro che vale anche la convergenza con la metrica
dell’ integrale. Il viceversa non è necessariamente vero, cioè la convergenza con la
metrica dell’integrale non comporta la convergenza neppure puntuale. Consideriamo infatti la seguente successione in C[0,1] :
(
xn (t) =
nt, 0 ≤ t ≤ 1/n
1, 1/n ≤ t ≤ 1
Con la metrica dell’integrale xn (t) → x(t) ≡ 1. Infatti:
qR
qR
p
2
2
1
1/n
x
(t)
−
1
dt
=
nt
−
1
dt
=
1/(3n) → 0.
d(xn , x) =
n
0
0
Puntualmente invece, xn (t) converge alla funzione discontinua
x̃(t) = 1 per 0 < t ≤ 1 ma con x̃(0) = 0. Non c’è pertanto convergenza puntuale
nè quindi uniforme entro C[0,1] .
57
3. TOPOLOGIE METRICHE.
Avevamo già notato nell’osservazione 1 del capitolo 2, che alcuni esempi di
topologie sfruttano una preesistente struttura di distanza tra punti. In particolare,
la topologia usuale euclidea degli spazi RN , che sono appunto spazi metrici, anzi
lineari metrici.
Mostreremo ora come in uno spazio metrico sia sempre possibile introdurre una
topologia ricavata dalla distanza e, salvo diversa precisazione, uno spazio metrico
si intende sempre dotato di tale topologia.
Gli spazi metrici topologici godono naturalmente di particolari proprietà, che verranno messe in evidenza in quanto segue.
Definizione 3. Dato lo spazio metrico X, consideriamo i sottoinsiemi A
di X tali che a ogni x0 ∈ A corrisponda qualche h > 0 in modo che x ∈ A se
d(x, x0 ) < h. Tali insiemi si dicono aperti.
Osservazione 3. La famiglia F formata dagli insiemi aperti della definizione
precedente più il vuoto (X è già compreso nella definizione), costituisce la topologia
metrica nello spazio metrico topologico X.
La definizione 3 ricalca esattamente quella dell’esempio 2.10 relativo alla topologia
usuale sui reali, ove la distanza tra due punti è definita da d(x, y) = |x − y|.
Rimandiamo a quell’esempio per la dimostrazione che si tratta effettivamente di
una topologia.
Definizione 4. Si dice sfera aperta Sxr0 di centro x0 e raggio r > 0, l’insieme
di tutti i punti x ∈ X tali che d(x, x0 ) < r.
Osservazione 4. La famiglia B = {Sxr : x ∈ X, r ∈ R} di tutte le sfere
aperte, costituisce una base nello spazio metrico topologico X. Sono basi nello
m/n
stesso spazio topologico anche le famiglie B = {Sx
1/n
raggio razionale e B = {Sx
: x ∈ X, m, n = 1, 2...} di
: x ∈ X, n = 1, 2, ...} di raggio 1/n.
Come nella definizione precedente, anche questa ricalca quella degli intervalli
aperti di semiampiezza reale Ixr dell’esempio 2.25, relativi alla retta R. Rimandiamo a quell’esempio per la dimostrazione che le tre famiglie B dell’osservazione 4
costituiscono effettivamente tre diverse basi in X.
58
Osservazione 5. Gli esempi 2.10 e 2.25 sono stati anticipati nel capitolo
delle topologie per l’ovvia importanza degli spazi euclidei, sia in sè, sia in quanto
prototipi di spazi topologici metrici e, come vedremo, anche normati e di Hilbert.
Data quindi la maggiore struttura degli RN , questi godono evidentemente di proprietà non condivise da un generico spazio metrico.
Osservazione 6. Uno spazio metrico è uno spazio di Hausdorff (T2 ).
Infatti, se x 6= y e quindi d(x, y) = h > 0, dato r < h/2 le due sfere Sxr e Syr
contengono x e y rispettivamente e sono disgiunte. Se cosı̀ non fosse, esisterebbe
z ∈ Sxr ∩ Syr e pertanto d(x, y) ≤ d(x, z) + d(z, y) < 2r < h, che è falso.
Osservazione 7. Uno spazio metrico soddisfa il primo assioma di numerabilità. Infatti, in ogni punto ha una base numerabile costituita dalle sfere aperte di
raggio razionale.
Non è detto in generale che uno spazio metrico sia anche perfettamente separabile, che abbia cioè una base numerabile. D’altra parte abbiamo già visto
nel teorema 2.17 che uno spazio topologico perfettamente separabile è separabile.
Negli spazi metrici vale anche il seguente teorema inverso.
Teorema 3. Uno spazio metrico separabile è anche perfettamente separabile.
Ovvero, se X contiene un sottoinsieme numerabile e denso in sè, allora possiede
una base numerabile.
Dimostrazione. Sia {xi } un sottoinsieme numerabile e denso in X e consideriamo la famiglia
m
B = {Sxni : i, m, n = 1, 2, ...}
delle sfere aperte di centro xi e raggio razionale. Dimostriamo che è una base in
X, utilizzando la definizione 2.10.
Grazie all’osservazione 4 essa è sicuramente una base in ogni punto xi . Sia allora
x ∈
/ {xi }, e Ix un suo intorno. Per definizione di intorno, esiste h > 0 tale che
x0 ∈ X se d(x, x0 ) < h. D’altra parte, essendo {xi } denso in X, x è punto di
accumulazione per {xi } e pertanto, dato un razionale q =
m
n
< h/2, esiste almeno
un n̄ tale che d(x, xn̄ ) < q < h/2. La sfera Sxqn̄ contiene quindi il punto x, e sia y
59
un punto arbitrario della sfera stessa per il quale perciò vale d(xn̄ , y) < q. Allora
d(x, y) ≤ d(x, xn̄ ) + d(xn̄ , y) < 2q < h e quindi anche y ∈ Ix . In conclusione, dato
x ∈ X e fissato un suo intorno Ix , abbiamo determinato un razionale q tale per cui
x ∈ Sxqn̄ ⊂ Ix . Dunque, la famiglia B delle sfere aperte di raggio razionale e centro
nei punti dell’insieme {xi } denso in X, sono una base in X, ed essendo questa
base ovviamente numerabile, lo spazio topologico X risulta essere perfettamente
separabile.
Definizione 5. In uno spazio metrico un insieme si dice limitato se è contenuto in qualche sfera aperta.
Teorema 4. In uno spazio metrico un insieme compatto è chiuso e limitato.
Dimostrazione. Uno spazio metrico è di Hausdorff (vedi osservazione 6) e in
uno spazio di Hausdorff un insieme compatto è chiuso (vedi teorema 2.13). Ci
rimane quindi da dimostrare che in uno spazio metrico un insieme compatto è
limitato. Sia allora S compatto e sia G = {Sxn : x ∈ S, n = 1, 2, ...} la famiglia
delle sfere aperte di centro x ∈ S e raggio n. G è una copertura aperta di S (lo è
di tutto lo spazio), ed essendo S compatto se ne può estrarre una sottocopertura
finita, per cui esiste N tale che S ⊂ SxN . Dunque S è limitato.
Osservazione 8. Nella retta reale R, e più in generale in RN , è valido anche
il teorema inverso ovvero il teorema A.C di Heine-Borel. Questo non è però valido
in uno spazio metrico qualsiasi.
Osservazione 9. In uno spazio metrico ogni insieme finito è chiuso. Questa
infatti è una proprietà degli spazi T1 , e tali sono gli spazi metrici, essendo essi T2 .
Osservazione 10. Avevamo dimostrato nel teorema 2 che in uno spazio metrico una successione convergente ha limite unico. Questa è in effetti una proprietà
degli spazi di Hausdorff (vedi teorema 2.11) e quindi, come tali, degli spazi metrici.
Osservazione 11. In uno spazio metrico X un punto x è di accumulazione
per un sottoinsieme S ⊂ X se e solo se esiste una successione {xn } di punti distinti
di S convergente a x. Questa è una proprietà degli spazi topologici soddisfacenti
il primo assioma di numerabilità (vedi osservazione 2.15 e teorema 2.16). Come
tale, uno spazio metrico gode di tale proprietà .
60
Osservazione 12. In uno spazio metrico X, un insieme S ⊂ X è chiuso se
e solo se contiene tutti i punti limiti di successioni convergenti {xn } formate da
elementi distinti di S. Confronta l’osservazione 2.18.
Notiamo anche che la definizione di funzione continua tra due spazi metrici
ricalca quella dell’analisi. Ovvero, f è continua in x se, fissato > 0, è possibile
determinare δ tale che d(f (x0 ), f (x)) < se d(x0 , x) < δ . E’ facile cosı̀ dimostrare
che la funzione f è continua se e solo se da xn → x segue f (xn ) → f (x), dove le
convergenze sono ciascuna nella metrica del proprio spazio.
Infine, per molti scopi è utile la proprietà dei sottoinsiemi compatti di uno
spazio metrico stabilita dal seguente teorema.
Teorema 5. Un sottoinsieme S di uno spazio metrico è compatto se e solo
se da ogni successione in S si può estrarre una sottosuccessione convergente in S.
Dimostrazione. Abbiamo già dimostrato che un sottoinsieme infinito T di
un sottoinsieme compatto S di uno spazio topologico X dotato di una topologia
arbitraria T ⊂ S ⊂ X, contiene almeno un punto di accumulazione (vedi teorema
2.10). Quindi, la successione {xn } ⊂ S compatto ha un punto di accumulazione e,
se X è metrico (vedi l’osservazione 11) si può estrarre da {xn } una sottosuccessione
convergente. La condizione sufficiente è dimostrata in A.E.Taylor a pg.71.
4. COMPLETEZZA IN SPAZI METRICI
Definizione 6. Una successione {xn } in uno spazio metrico X è detta successione fondamentale o successione di Cauchy se, fissato > 0, esiste n tale che
d(xn , xm ) < per ogni n, m > n .
Osservazione 13. Ogni successione {xn } in X convergente a x ∈ X è una
successione di Cauchy. Infatti d(xn , xm ) ≤ d(xn , x) + d(x, xm ) e poichè xn → x,
fissato si può determinare n in modo tale che per n, m > n valgano entrambe
le diseguaglianze d(xn , x) < /2 e d(x, xm ) < /2. Da cui segue l’asserto.
Viceversa, non è detto in generale che una successione di Cauchy sia convergente.
Definizione 7. Se uno spazio metrico X gode della proprietà che ogni successione di Cauchy ammette limite in X, esso è detto spazio completo.
61
Come visto nei paragrafi precedenti, si può dotare un insieme X di metriche
diverse, ottenendo cosı̀ spazi metrici differenti anche riguardo le caratteristiche di
completezza. Dato uno spazio metrico non completo, vedremo come sia sempre
possibile completarlo in un senso che verrà precisato da un successivo teorema.
Esempio 15. La retta reale R con d(x, y) = |x − y| è uno spazio completo.
Infatti, condizione necessaria e sufficiente affinchè una successione di numeri reali
{xn } sia convergente è che sia di Cauchy cioè che |xn − xm | → 0,qper n, m → ∞.
PN
2
Esempio 16. Lo spazio RN con la metrica usuale d(x, y) =
i=1 (ξi − ηi )
è completo. Infatti, data la successione {xn } con xn ≡ {ξin : i = 1, N }, la condizione d(xn , ym ) → 0 per n, m → ∞ comporta |ξin − ξim | → 0 per n, m → ∞ e ∀i
n→∞
(vedi l’esempio 10). Dall’esempio precedente segue che esiste il limite ξin −−−→ ξi
∀i perchè R è completo. Ciascuna componente ammette limite e pertanto anche
la successione {xn } ammette limite x = {ξi }.
Esempio 17. Lo spazio C[a,b] con la distanza del max è uno spazio metrico completo. Sia infatti {xn } una successione di Cauchy. Fissato è possibile
determinare n tale che per n > n , |xn (t) − xm (t)| < , ∀t ∈ [a, b]. Nell’analisi
elementare questo è noto come il criterio di Cauchy necessario e sufficiente per la
convergenza uniforme della successione di funzioni {xn (t)}; essendo inoltre {xn }
una successione uniformemente convergente di funzioni continue, un’altro teorema
dell’analisi elementare assicura che anche il limite x(t) è una funzione continua.
Esempio 18. Lo spazio C[a,b] con la metrica dell’integrale non è completo.
Consideriamo infatti una piccola modifica dell’esempio 14. In X = C[−1,1] sia:
(0
xn (t) =
con d(x, y) =
qR
1
−1
nt
1
−1 ≤ t ≤ 0
0 ≤ t ≤ 1/n
1/n ≤ t ≤ 1.
2
x(t) − y(t) dt. E’ immediato provare che gli xn (t) individu-
ano una successione di Cauchy. Infatti, sia per esempio m < n. Allora
2
R1
R 1/n
R 1/m
xn (t) − xm (t) dt = 0 (n − m)2 t2 dt + 1/n (1 − mt)2 dt =
−1
= (n − m)2 /(3mn2 ) < 1/3m
e quindi può essere reso piccolo a piacere. La successione {xn } tende puntualmente
62
alla funzione discontinua x(t) = 0 per −1 ≤ t ≤ 0 e x(t) = 1 per 0 < t ≤ 1. A tale
funzione converge anche con la metrica dell’integrale come a tutte le altre funzioni
uguale a questa salvo che nell’origine. Non esiste comunque nessuna funzione
continua cui converga in metrica la successione di Cauchy ora esaminata.
Esempio 19. Lo spazio P[a,b] dei polinomi pn (t) di grado n qualsiasi con
a ≤ t ≤ b è uno spazio metrico se si assume la metrica del max, cioè
d(pn , qm ) = maxt∈[a,b] |pn (t) − qm (t)|. Essendo infatti P[a,b] ∈ C[a,b] questa è una
distanza anche nello spazio dei polinomi. Lo spazio P non è completo. Basta
Pn
infatti considerare la successione {pn } cosı̀ definita: pn (t) = i=0 ti /i!. Poichè
abbiamo già visto che la convergenza del max e quella uniforme coincidono nei
C[a,b] , e poichè pn (t) → et uniformemente, segue che lo stesso limite vale con la
metrica del max in C[a,b] . Poichè però et 6∈ P, la successione considerata non ha
limite in P, che pertanto risulta non completo.
Esempio 20. Lo spazio lp è completo. Dall’esempio 11 segue che se {xn }
è una successione di Cauchy, sono di Cauchy anche le successioni costituite dalle
componenti di indice fissato. Posto cioè xn = (ξ1n , ξ2n , ..., ξkn , ...), sono di Cauchy
anche le successioni {ξi1 , ξi2 , ..., ξin , ...} per ogni i. Ora, lo spazio C dei complessi è
completo, per cui le singole componenti sono convergenti. Essendo lo spazio
∞-dimensionale, dalla convergenza delle componenti non segue direttamente quella
dei vettori, che deve essere pertanto dimostrata in modo esplicito. Dimostriamo
cioè che il vettore x = (ξi : ξi ≡ limn→∞ ξin ) appartiene a lp ed è il limite della
successione di Cauchy {xn } secondo la metrica di lp . Infatti, dati xn e xm ,
P∞ n
m p
p
fissato > 0, ∃N tale che
i=1 |ξi − ξi | < per n, m > N . A fortiori,
PN n
m p
p
i |ξi − ξi | < , ∀N , per n, m > N . Posso considerare ora il limite m → ∞ e
invertire il limite con la somma; la maggiorazione si mantiene anche al limite (che
PN
esiste) e si ottiene: i=1 |ξin − ξi |p < p . La maggiorazione vale per ogni N finito e
P∞ n
p
p
pertanto anche per la somma infinita:
i=1 |ξi − ξi | < . La convergenza della
sommatoria comporta la appartenenza del vettore x − xn a lp , da cui segue che
x ∈ lp . Inoltre, la maggiorazione di cui sopra si può riesprimere come d(x, xn ) < e
quindi, per l’arbitrarietà di , xn → x per n → ∞. Da ciò segue che lp è completo.
63
5. COMPLETAMENTO
Osservazione 14. Gli esempi 17 e 18 su C[a,b] indicano chiaramente come sia
possibile avere uno spazio completo o non completo a seconda della metrica che
viene in esso definita. E’ molto importante però il fatto che uno spazio metrico non
completo è sempre pensabile come un sottospazio denso di un opportuno spazio
completo, che cioè è sempre possibile completare uno spazio metrico non completo.
Questo fatto verrà illustrato nel prossimo teorema cui però premetteremo alcune
piccole osservazioni e definizioni.
Definizione 8. Due spazi metrici X e Y si dicono isometrici se esiste una
funzione f con dominio X e codominio Y tale che esista la funzione inversa f −1 (se
esiste cioè una corrispondenza biunivoca fra gli elementi di X e quelli di Y) e tale
che d(x1 , x2 ) = d(f (x1 ), f (x2 )) per ogni coppia di punti x1 , x2 ∈ X. La funzione f
è detta isometria fra X e Y.
Definizione 9. Due successioni di Cauchy {xn } e {x0n } di elementi di uno
spazio metrico X si dicono equivalenti se d(xn , x0n ) → 0.
Osservazione 15. Se {xn } è convergente a x ∈ X, {x0n } è equivalente a {xn }
se e solo se x0n → x. Infatti, se x0n → x allora d(xn , x0n ) ≤ d(xn , x) + d(x, x0n ) → 0
per n → ∞ . Viceversa, se {xn } e {x0n } sono equivalenti, allora
d(x0n , x) ≤ d(x0n , xn ) + d(xn , x) → 0
Osservazione 16. Se {xn } è convergente a x ∈ X, la successione stazionaria
{x, x, x, ..., x, ...} è equivalente ad essa ed è l’unica successione stazionaria di questa
classe.
Osservazione 17. È evidente che {xn } è equivalente a se stessa, che se {xn }
è equivalente a {x0n } , anche {x0n } è equivalente a {xn } e che se {xn } è equivalente
a {x0n } e {x0n } è equivalente a {x00n } allora {xn } è equivalente a {x00n }. È possibile
quindi dividere tutte le successioni di Cauchy in classi di equivalenza. Con [{xn }]
intenderemo la classe di equivalenza di tutte le succesioni di Cauchy equivalenti
alla {xn }.
Osservazione 18. Nell’esempio 15 avevamo visto che l’insieme dei reali R
con la distanza usuale è uno spazio completo. Vogliamo esaminare più in dettaglio
64
questo esempio perchè è di grande utilità nel comprendere il successivo teorema
sul completamento funzionale.
Lo spazio R contiene il sottoinsieme Q dei razionali che sappiamo essere denso
in R. Ogni successione di Cauchy di razionali è convergente in R perchè R è
completo; inoltre ogni numero reale è limite di una successione di Cauchy di numeri
razionali essendo Q denso in R. Un numero reale si può quindi identificare con
tutte le successioni di Cauchy di razionali ad esso convergenti. Ad esempio il
√
numero reale 2 può venire individuato dalla successione di Cauchy di razionali
{1., 1.4, 1.41, 1.414, 1.4142, .....} e da tutte quelle ad essa equivalenti. Anche un
razionale può essere identificato da una successione stazionaria di razionali, ad
esempio 3/5 ≡ {3/5, 3/5, 3/5, ...., 3/5, ...}.
Dati i reali x
e = [{xn }] e ye = [{yn }] , con {xn } e {yn } successioni di Cauchy
di razionali, si mostra facilmente che {dn = |xn − yn |} individua a sua volta
una successione di Cauchy. Una distanza tra x
e e ye può allora essere definita da
d(e
x, ye) ≡ [{dn ≡ |xn − yn |}], cioè da una classe di equivalenza di successioni di
Cauchy di razionali e cioè ancora da un reale. Per esempio, se
√
3 = [{1., 1.7, 1.73, 1.732, 1.7320, ...}], allora
√ √
d( 3, 2) = [{dn }] = [{0.0, 0.3, 0.32, 0.318, 0.3178, ...}].
Supponiamo ora di procedere in senso inverso, di conoscere cioè solo i numeri
razionali Q. Con la distanza usuale non sono uno spazio completo. Per introdurre
i reali R potremmo procedere nel modo tradizionale con le sezioni nel campo
razionale, ma è chiaro dalla discussione precedente come possiamo anche procedere.
Definiamo lo spazio dei reali R come lo spazio delle classi di equivalenza di
successioni di Cauchy di razionali. Definiremo in R alcune operazioni come somma
e prodotto utilizzando le operazioni definite in Q. Ad esempio se x
e = [{xn }],
ye = [{yn }] definiamo il prodotto e la somma x
e · ye = [{xn · yn }], x
e + ye = [{xn + yn }]
e si può dimostrare che tali definizioni non dipendono dalle particolari successioni
considerate e che portano a successioni di Cauchy di razionali. Possiamo definire
un ordinamento tra reali dicendo che x
e ≤ ye se esiste N tale che per n ≥ N ,
xn ≤ yn . Possiamo anche definire la distanza cui abbiamo già accennato. Essa non
65
dipende dalla successione considerata, è una quantità reale e soddisfa agli assiomi
e 0 delle successioni convergenti di razionali
della distanza. R contiene lo spazio Q
e 0 esiste evidentemente una
cioè equivalenti a successioni stazionarie. Tra Q e Q
e 0 mediante le successioni
corrispondenza biunivoca e se valutiamo le distanze in Q
e 0 sono isometrici. Infine, si dimostra
stazionarie, si vede immediatamente che Q e Q
e 0 è denso in R.
che R è completo e che Q
Partendo quindi dallo spazio non completo dei razionali Q abbiamo costruito
e 0 , è un
lo spazio completo dei reali R di cui Q, a meno della isometria con Q
sottospazio denso.
La costruzione dei reali cosı̀ fatta ricalca passo per passo la dimostrazione
costruttiva del seguente importante teorema sul completamento.
Teorema 6. Dato uno spazio metrico X, esiste uno spazio metrico completo
e e un sottoinsieme X
e0 denso in X,
e tale che X
e0 e X sono isometrici.
X
Dimostrazione. Consideriamo in X tutte le successioni di Cauchy; esse pose l’insieme di queste
sono essere divise in classi di equivalenza. Indichiamo con X
classi di equivalenza, cioè se {xn } è una successione di Cauchy in X, indichiamo
e la totalità delle successioni di Cauchy equivalenti a {xn }. Introduciacon x
e∈X
e la definizione d(e
e e {xn }, {yn }
mo in X
x, ye) = limn→∞ d(xn , yn ), essendo x
e, ye ∈ X
due successioni di Cauchy delle classi x
e e ye rispettivamente. Prima di tutto tale
numero esiste, poichè {dn } ≡ {d(xn , yn )} costituisce una successione di Cauchy di
numeri reali della quale pertanto esiste il limite. Infatti
d(xn , yn ) ≤ d(xn , xm ) + d(xm , ym ) + d(ym , yn ), da cui
d(xn , yn ) − d(xm , ym ) ≤ d(xn , xm ) + d(ym , yn ). Scambiando m con n, il membro a
sinistra cambia segno per cui la diseguaglianza vale in realtà in modulo, cioè
|dn − dm | ≤ d(xn , xm ) + d(ym , yn ) → 0 per n, m → ∞, essendo per ipotesi {xn }
e {yn } successioni di Cauchy. (Come si è visto nella osservazione precedente, se
si vuole utilizzare questo teorema per dimostrare la completezza dei reali, occorre
sostituire il lim dn con l’intera successione {dn }.)
Inoltre tale numero d(e
x, ye) non dipende dalla particolare scelta delle successioni
{xn } e {yn } entro la propria classe, essendo tutte equivalenti tra di loro. Infatti,
66
considerate le successioni {x0n } ∈ x
e e {yn0 } ∈ ye, vale la diseguaglianza
d(xn , yn ) ≤ d(xn , x0n ) + d(x0n , yn0 ) + d(yn0 , yn ), da cui
limn→∞ d(xn , yn ) ≤ limn→∞ d(x0n , yn0 ).
Scambiando tra di loro le successioni
equivalenti si inverte la diseguaglianza, da cui segue che in realtà vale l’eguaglianza
dei due limiti.
Infine, tale numero soddisfa gli assiomi della distanza. E’ infatti simmetrico nei
due membri; è positivo ed è uguale a zero se e solo se le due successioni {xn } e
{yn } sono equivalenti ed individuano perciò lo stesso elemento x
e = ye. Per quanto
e
riguarda la diseguaglianza triangolare, considerati x
e, ye, ze ∈ X,
d(e
x, ze) = limn→∞ d(xn , zn ) ≤ limn→∞ d(xn , yn ) + d(yn , zn ) = d(e
x, ye) + d(e
y , ze).
e0 delle classi di equivalenza di successioni di
Consideriamo ora il sottospazio X
Cauchy convergenti in X e individuate pertanto da successioni stazionarie.
Se {x, x, ..., x, ...} e {y, y, ..., y, ...} appartengono a x
e0 e ye0 rispettivamente, si ha
e0 sono isometrici. Mostriamo
evidentemente che d(e
x0 , ye0 ) = d(x, y) per cui X e X
e0 è denso in X.
e Sia infatti x
e e sia {xn } una delle successioni
inoltre che che X
e∈X
della classe x
e; fissato , esiste N tale che per n, N > N si ha che d(xn , xN ) < .
e0 cui appartiene la successione stazionaria
Consideriamo ora l’elemento x
e0,N ∈ X
{xN , xN , ..., xN , ...}: si ha d(e
x, x
e0,N ) = limn→∞ d(xn , xN ) < . In ogni intorno di
e cadono cosı̀ punti di X
e0 , che risulta quindi denso in X.
e
x
e∈X
e Sia {e
Dobbiamo infine dimostrare la completezza di X.
xn } una successione di
e e per ogni x
e0 tale che d(e
Cauchy in X
en scegliamo un x
e0,n ∈ X
xn , x
e0,n ) < 1/n;
e0 è denso in X.
e Allora,
questo è possibile poichè X
d(e
x0,n , x
e0,m ) ≤ d(e
x0,n , x
en ) + d(e
xn , x
em ) + d(e
xm , x
e0,m ) < 1/n + 1/m + d(e
xn , x
em ).
Se {xn , xn , ..., xn , ...} è la successione stazionaria appartenente a x
e0,n , per la isomee0 segue che anche d(xn , xm ) < 1/n + 1/m + d(e
tria tra X e X
xn , x
em ) −→ 0 per
n, m → ∞ e cioè che {xn } è una successione di Cauchy in X e appartiene pertanto
e Mostriamo infine che x
a un elemento x
e ∈ X.
en → x
e. Infatti
d(e
xn , x
e) ≤ d(e
xn , x
e0,n ) + d(e
x0,n , x
e) < 1/n + d(e
x0,n , x
e) e poichè
d(e
x0,n , x
e) = limm→∞ d(xn , xm ) < per n opportunamente grande, segue che
x
en → x
e per n → ∞.
67
(Per semplicità si può pensare x
e definito dalla successione di Cauchy
{x11 , x22 , ..., xnn , ...}, ove il primo elemento x11 è il primo elemento di x
e1 , il secondo
x22 è il secondo elemento di x
e2 , e cosı̀ via.)
Con questa dimostrazione della completezza di X, il teorema del completamento è provato.
E’ evidente l’importanza di questo teorema, ulteriormente rafforzato dal teorema che mostreremo tra poco. Introduciamo intanto la seguente:
Definizione 10. Dato uno spazio metrico X, uno spazio metrico completo Ye
contenente un sottospazio Ye0 denso in Ye e isometrico a X è detto completamento
di X.
Teorema 7. Dato uno spazio metrico X, due suoi completamenti qualsiasi
Ye e Ye 0 sono isometrici.
Dimostrazione. Cominceremo a dimostrare l’isometria tra un completamento
arbitrario Ye e quello ottenuto con la tecnica del teorema del completamento e
e essendo l’isometria una proprietà transitiva ( come si
che indicheremo con X;
controlla facilmente ), ne seguirà l’isometria di tutti i completamenti Ye . Per
semplicità di linguaggio supponiamo che X sia un sottospazio di Ye , senza passare
cioè dal sottospazio Ye0 denso in Ye e isometrico a X. Mostriamo che esiste una
e e Ye . Se consideriamo ye ∈ Ye , essendo X denso
corrispondenza biunivoca fra X
in Ye esiste in X una successione {xn } convergente a ye e quindi di Cauchy; a
ye convergono inoltre tutte le successioni di Cauchy equivalenti a {xn } e quindi
e come f (e
e
possiamo definire la funzione f : Ye → X
y ) = [{xn }] ∈ X.
e essendo {xn } di Cauchy e Ye completo, esiste ed
Viceversa, se x
e = [{xn }] ∈ X,
è unico il limite limn→∞ xn ≡ ye ∈ Ye . E quindi f −1 ([{xn }]) = ye. Consideriamo
e cioè x
infine ye, ye0 ∈ Y e gli elementi corrispondenti in X,
e = [{xn }] e x
e0n = [{x0n }].
Allora:
d f (e
y ), f (e
y 0 ) = d([{xn }], [{x0n }]) = limn→∞ d(xn , x0n ) =
= d(limn→∞ xn , limn→∞ x0n ) = d(e
y , ye0 ).
(Per il penultimo passaggio vedi l’osservazione 2 sulla continuità della distanza.)
e e Ye .
Pertanto f è un’isometria tra X
68
Esempio 21. Consideriamo lo spazio m2 delle successioni finite di reali (o
complessi) x ≡ (ξ1 , ξ2 , ..., ξN ). Dato y ≡ (η1 , η2 , ..., ηM ) con M ≥ N , possiamo
PM
PN
definire la distanza d2 (x, y) = i=1 |ξi − ηi |2 + i=M +1 |ξi |2 . Evidentemente m2
non è completo. Infatti, se consideriamo la successione
x1 ≡ (1), x2 ≡ (1, 1/2), x3 ≡ (1, 1/2, 1/4), ..., xn ≡ (1, 1/2, 1/4, ..., 1/2n−1 ), ....
Pn−1
Ogni xi ∈ m2 e la successione è di Cauchy. Infatti d2 (xn , xm ) = i=m 1/22i −→ 0
per n, m → ∞ essendo convergente la serie dei 1/2i . La successione {xn } converge
però al vettore x ≡ (1, 1/2, 1/4, ..., 1/2n , ...) e siccome x 6∈ m2 , lo spazio metrico
m2 risulta non completo. D’altra parte x ∈ l2 e m2 è denso in l2 . Infatti, dato
x ∈ l2 e dato > 0, si può sempre costruire un vettore x ∈ m2 definito da
P∞
x ≡ (ξ1 , ξ2 , ..., ξn ) tale che d2 (x, x ) = i=n +1 |ξi |2 < 2 , dato che l’intera serie
è convergente.
Allora, l2 è completo e contiene m2 in modo denso. Quindi, per quanto visto in
precedenza e a meno di una isometria, l2 è il completamento di m2 .
Esempio 22. Con riferimento agli esempi 17 e 19, ricordiamo che P[a,b] e
C[a,b] con la distanza del max sono rispettivemente non-completo e completo, e
che il primo è sottospazio del secondo. Ricordiamo anche un classico risultato
di Weierstrass secondo il quale ogni funzione continua in un intervallo chiuso e
limitato è approssimabile uniformemente con polinomi; quindi P[a,b] è denso in
C[a,b] con la distanza del max che abbiamo già visto dare origine alla convergenza
uniforme. In conclusione, C[a,b] è il completamento funzionale di P[a,b] con la
metrica del max.
Esempio 23. Con riferimento all’esempio 18, lo spazio C[a,b] con la distanza
dell’integrale non è uno spazio completo. Esiste ovviamente il completamento
funzionale dato dal teorema del completamento ma occorre studiarne una realizzazione pratica che sarà possibile fare nei capitoli successivi dopo un’introduzione
alla Teoria della misura.
69
6. TEOREMI DELLE SFERE INCLUSE E DI BAIRE
Terminiamo il capitolo con due teoremi. Il primo rappresenta l’estensione agli
spazi metrici completi del teorema A.A sulle proprietà di inclusione degli intervalli
chiusi e limitati, e riveste una notevole rilevanza applicativa.
Teorema 8. Condizione necessaria e sufficiente affinchè uno spazio metrico
X sia completo, è che in esso ogni successione di sfere chiuse, incluse le une nelle
altre e i cui raggi tendono a zero, abbia intersezione non vuota.
Dimostrazione. Sia X uno spazio metrico completo e sia {Bn ≡ S̄xrnn } una
successione di sfere chiuse di centro xn e raggio rn → 0, contenute le une nelle altre:
B1 ⊃ B2 ⊃ ... ⊃ Bn ⊃ .... In particolare, per m > n si ha Bm ⊂ Bn e xn , xm ∈ Bn
e quindi d(xn , xm ) < rn . Quindi {xn } individua una successione fondamentale che
ha limite, diciamo x, essendo X completo. Inoltre, ogni Bn contiene tutti i punti
della successione {xn } esclusi eventualmente i primi x1 , x2 , ..., xn−1 , ed essendo Bn
un insieme chiuso per ipotesi, contiene anche il punto limite x. Dunque, x ∈ ∩n Bn ,
e la condizione necessaria è provata
Viceversa, sia data la successione {xn } fondamentale e dimostriamo che essa ha
limite in X. Essendo fondamentale, esiste xn1 tale che d(xn , xn1 ) ≤ 1/2 per ogni
n > n1 . Diciamo B1 la sfera chiusa di centro xn1 e raggio 1. Troviamo ora un
punto xn2 con n2 > n1 , tale che d(xn , xn2 ) ≤ 1/22 per tutti gli n > n2 . Diciamo
B2 la sfera chiusa di centro xn2 e raggio 1/2. Cosı̀ procedendo, dalla successione
{xn } possiamo estrarre una sottosuccessione {xnk } tale che d(xn , xnk ) ≤ 1/2k per
tutti gli n > nk , e in corrispondenza a questi possiamo individuare una successione
di sfere chiuse Bk di centro xnk e raggio 1/2k . Per ipotesi (condizione sufficiente),
una tale successione di sfere ha un punto comune, diciamo x, che risulta evidentemente limite della sottosuccessione {xnk }. Ma se la successione fondamentale {xn }
contiene una sottosuccessione convergente, è essa stessa convergente al medesimo
limite. Dunque, lo spazio X è completo.
Il secondo e ultimo teorema riveste una fondamentale importanza nella teoria
generale degli spazi metrici completi, ed è noto come teorema di Baire.
70
Teorema 9. Se uno spazio metrico completo è l’unione numerabile di sottoinsiemi chiusi, almeno uno di questi contiene un insieme aperto non vuoto.
Dimostrazione. Sia ∪n Bn = X e supponiamo per assurdo che nessuno degli
insiemi chiusi Bn contenga un aperto non vuoto, ovvero abbia punti interni. Allora,
B1 6= X e sia x1 6∈ B1 . A sua volta, C(B1 ) è un aperto che contiene la sfera
S1 = Sx11 con 0 < < 1/2 (vedi l’osservazione 4). Per ipotesi, B2 non contiene la
/2
/2
sfera aperta Sx11 , e quindi l’insieme aperto C(B2 ) ∩ Sx11
è non vuoto e contiene
un punto, diciamo x2 e tutta la sfera S2 = Sx22 con 0 < 2 < 1/22 . Procedendo
oltre, si ottiene una successione di sfere {Sn } = {Sxnn } con le seguenti proprietà :
0 < n <
1
2n ,
/2
Sn+1 ⊆ Sxnn ,
Sn ∩ Bn = 6 O,
n = 1, 2, ....
E, per ogni m > n si ha:
d(xn , xm ) ≤ d(xn , xn+1 ) + d(xn+1 , xn+2 ) + ... + d(xm−1 , xm ) <
<
1
2n+1
+
1
2n+2
+ ... +
1
2m
<
1
2n .
Pertanto la successione {xn } dei centri forma una successione fondamentale che
converge a x ∈ X, essendo X per ipotesi completo. Da ciò segue che:
d(xn , x) ≤ d(xn , xm ) + d(xm , x) <
n
2
+ d(xm , x) →
n
2 ,
per m → ∞. Quindi x ∈ Sn per ogni n, e pertanto non è contenuto in alcun Bn
nè ovviemente nella loro unione. Ma questo contraddice l’ipotesi del teorema che
∪n Bn = X, e il teorema è dimostrato.
Un altro enunciato del tutto equivalente del teorema di Baire è il seguente:
Teorema 9’. Uno spazio metrico completo R non può essere rappresentato
come unione numerabile di insiemi in nessun punto densi. (Vedi la definizione 2.7).
Osservazione 19. Ogni spazio metrico completo senza punti isolati è non
numerabile. Infatti, ogni insieme con un solo elemento è in nessun punto denso.
Esempio 24. La retta R soddisfa il teorema di Baire mentre l’insieme dei
razionali Q (spazio metrico non completo) è l’unione numerabile degli insiemi {q}
costituiti dai suoi singoli punti, in nessun punto densi.
Definizione 11. Gli spazi topologici per cui è possibile la copertura numerabile con insiemi in nessun punto densi sono detti di prima categoria. Quelli per
cui non è possibile si dicono di seconda categoria.
71
4. SPAZI NORMATI
1. SPAZI NORMATI
Definizione 1. Uno spazio lineare N si dice normato se ad ogni elemento
x ∈ N è associato un numero reale non negativo che si indica con kxk tale che:
I) kxk ≥ 0 e kxk = 0 ⇐⇒ x = 0.
II) kx + yk ≤ kxk + kyk. (Diseguaglianza triangolare.)
III) kαxk = |α|kxk per ogni α reale o complesso.
E’ chiaro che il concetto di norma non è altro che una assiomatizzazione del
concetto di lunghezza di un vettore negli ordinari spazi euclidei RN .
Osservazione 1. Uno spazio normato è pure uno spazio metrico se si assume
la distanza ricavata dalla norma: d(x, y) = kx − yk. Le proprietà I)-II) si riflettono
immediatamente nelle analoghe proprietà della metrica. Il viceversa non è sempre
vero; ad esempio uno spazio metrico non è necessariamente lineare. Tuttavia,
avendo nel capitolo precedente trattato molti esempi di spazi lineari metrici con
distanze invarianti per traslazione, cioè con d(x, y) = d(x−y, 0), la introduzione in
questi del numero reale positivo kxk ≡ d(x, 0) li definisce come spazi normati pur di
provare per tale numero l’unica proprietà III). Le altre due sono automaticamente
soddisfatte da analoghe proprietà della distanza. La I) è ovvia. Per la II), poichè
d(x, z) ≡ kx − zk ≡ d(x − z, 0), e
d(x, −y) ≤ d(x, 0) + d(0, −y) = d(x, 0) + d(y, 0), allora
kx + yk ≡ kx − (−y)k ≤ kxk + kyk.
La nozione di convergenza in uno spazio normato si esprime ora dicendo che
xn → x se kxn − xk → 0.
Definizione 2. Uno spazio normato si dice completo se ogni successione di
Cauchy (definita ovviamente con la distanza della norma) ammette limite in N .
Uno spazio normato e completo si dice Spazio di Banach e lo si indicherà
qP con B.
N
2
Esempio 1. RN è normato e completo con la definizione kxk =
i=1 |ξi | .
Questa è l’usuale lunghezza dei vettori e da qui si ricava la distanza più volte
esaminata e che abbiamo già dimostrato dare origine a uno spazio completo.
72
Esempio 2. Lo spazio lp è uno spazio normato con la definizione:
P∞
p 1/p
. Tale numero esiste dato che lp contiene per definizione elekxk =
i=1 |ξi |
menti x per i quali sia convergente la sommatoria precedente. Inoltre le proprietà
I)-III) seguono facendo riferimento a lp quale spazio metrico (vedi l’esempio 3.7).
E’ anche completo, per cui lp è uno spazio di Banach.
Esempio 3. Lo spazio C[a,b] è normato se si assume kxk = maxt∈[a,b] |x(t)|.
Tale spazio è anche completo (vedi l’esempio 3.17).
qR E’ quindi uno spazio di Banach.
b
Esempio 4. Lo spazio C[a,b] con kxk =
|x|2 dt. Tale spazio è normato
a
ma non completo come abbiamo già visto per lo spazio metrizzato con la distanza
ricavata da questa norma (esempio 3.18).
Esempio 5. Lo spazio metrico dell’esempio 3.8 con la definizione:
kxk =
∞
X
|ξi |
1
·
i
2 1 + |ξi |
i=1
non è uno spazio normato. Infatti kαxk =
6 |α|kxk.
Osservazione 2. Riportiamo alcune semplici proprietà della norma e delle
convergenze in spazi normati. Siano x, y, xn , yn ∈ N , spazio normato. Segue che:
i) k(x + y) − (xn + yn )k ≤ kx − xn k + ky − yn k. Pertanto,
xn → x e yn → y, =⇒ xn + yn → x + y.
ii) kαx − αxn k = |α|kx − xn k. Pertanto, xn → x =⇒ αxn → αx.
iii) kλn x − λxk = k(λn − λ)xk = |λn − λ|kxk. Pertanto, λn → λ =⇒ λn x → λx.
iv) kxk = ky + (x − y)k ≤ kyk + kx − yk e quindi kxk − kyk ≤ kx − yk. Con la
sostituzione x ↔ y si ottiene kyk−kxk ≤ kx−yk, e pertanto kxk−kyk ≤ kx−yk.
Cioè, la differenza delle norme (in modulo) è minore della norma della differenza.
Da quest’ultima segue anche che
v) kxk − kxn k ≤ kx − xn k e quindi xn → x =⇒ kxn k → kxk. Notare che non
vale il viceversa.
Osservazione 3. Tutti i concetti sulle topologie metriche del paragrafo 3.3,
si possono trasferire negli spazi normati introducendo una distanza desunta dalla
norma, definendoli cosı̀ quali spazi normati topologici. In particolare, dalla conti73
nuità della norma rispetto a somma e prodotto, segue che uno spazio normato è
anche uno spazio lineare topologico.
Definizione 3. Due spazi normati N e M si dicono congruenti se esiste un
operatore lineare A da N in M e il suo inverso A−1 , con ||Ax||M = ||x||N per
ogni x ∈ N .
Tali spazi sono isomorfi (def. 1.4) e isometrici (def. 3.8). Esistono coppie di
spazi normati topologicamente isomorfi (def. 2.24), ma non congruenti.
2. OPERATORI LIMITATI
Definizione 4.
Dati due spazi normati N e N 0 e un operatore A che
trasforma N in N 0 , A si dice operatore limitato se esiste un numero reale positivo
K tale che ∀x ∈ DA si ha kAxk ≤ Kkxk.
Osservazione 4. L’operatore limitato A trasforma insiemi limitati
(kxk ≤ C) in insiemi limitati (kAxk ≤ CK).
Esempio 6. Consideriamo in C[a,b] normato con la norma del max l’operatore
Rb
integrale A definito da A x(t) = x0 (s) ≡ a K(s, t)x(t) dt, con K(s, t) funzione
continua nel quadrato s, t ∈ [a, b]. L’operatore A è limitato. Infatti, posto il
massimo modulo di K(s, t) per s, t ∈ [a, b] uguale a K/(b − a):
R b
Rb
kAx(t)k = maxs∈[a,b] a K(s, t)x(t) dt ≤ maxt,s∈[a,b] K(t, s) a x(t) dt ≤
≤ K/(b − a) · (b − a) · maxt∈[a,b] x(t) = Kkxk.
Esempio 7. Consideriamo lo spazio C[a,b] con la norma del max e l’operatore
A ≡ d/dt. A non è un operatore limitato. Sia infatti xn (t) = sin[nπ(b − t)/(b − a)],
per ogni n. Questo definisce un insieme limitato poichè kxn (t)k = 1, ∀n. Ma
kAxn (t)k = maxt∈[a,b] [nπ/(b − a)] cos[nπ(b − t)/(b − a)] = nπ/(b − a).
Evidentemente non esiste nessun numero K > 0 che maggiori questa norma per
tutti gli n e cioè per tutti gli elementi dell’insieme limitato {xn (t)}.
Definizione 5. Un operatore A da N in N 0 si dice continuo in x ∈ DA se
per ogni successione {xn } convergente a x con xn ∈ DA ∀n, da xn → x (cioè
kxn − xk → 0 per n → ∞) si può dedurre che Axn → Ax (cioè kAxn − Axk → 0
nello stesso limite).
74
Osservazione 5. Quanto detto finora in questo paragrafo non riguarda solamente il caso particolare degli operatori lineari. Per questi invece è possibile
stabilire una connessione tra continuità e limitatezza con il seguente:
Teorema 1. Condizione necessaria e sufficiente affinchè un operatore lineare
sia limitato è che sia continuo in x = 0.
Dimostrazione. Sia A continuo in x = 0 e mostriamo che deve essere limitato.
Se fosse A illimitato, esisterebbero x1 , x2 , ..., xn , ... ∈ DA con kxn k < C tali che
kAx1 k > kx1 k, kAx2 k > 2kx2 k,...,kAxn k > nkxn k, ... Dato allora
yn ≡ xn /(nkxn k), si ha evidentemente yn → 0 per n → ∞, mentre
kAyn k = kAxn k/(nkxn k) > 1. L’operatore A quindi non sarebbe continuo in
x = 0, contrariamente alle ipotesi.
Viceversa, se l’operatore A lineare è anche limitato, allora è continuo ovunque
∀x ∈ DA e quindi è continuo anche in x = 0 che senz’altro appartiene al dominio
di A per la linearità di questo. Infatti,
kAxn − Axk = kA(xn − x)k ≤ Kkxn − xk, da cui segue l’asserto.
Introduciamo ora l’importante concetto di norma di un operatore:
Definizione 6. Si definisce norma dell’operatore A il seguente numero, ove
questo esista finito:
kAk ≡ sup
x∈DA
kAxk
= sup kAxk
kxk
kxk≤1
.
Osservazione 6. Per un operatore A limitato, la norma è sempre definita.
Infatti, da kAxk ≤ Kkxk segue che kAxk ≤ K per tutti gli x ∈ DA con kxk ≤ 1.
L’insieme numerico kAxk è cioè limitato e di questo pertanto esiste l’estremo
superiore. (Vedi la nota al teorema 2.A.)
Osservazione 7. Quanto appena detto a proposito della norma vale anche
per operatori non lineari. Nel caso però di operatori lineari e limitati è possibile
introdurre il seguente concetto di estensione:
Teorema 2. Sia dato un operatore lineare e limitato A da N in N 0 , spazi
normati, definito densamente in N e con N 0 completo. Allora è possibile definire
75
una estensione B a tutto N 0 tale che kBk = kAk per tutti gli x ∈ DA . Tale
estensione è unica.
Dimostrazione. Essendo DA denso in N , dato x ∈ N si può sempre trovare
una successione {xn } con xn ∈ DA e tale che xn → x. Allora
kAxn − Axm k = kA(xn − xm )k ≤ kAkkxn − xm k −→ 0, per n, m → ∞. Segue
che {Axn } è una successione di Cauchy, ed essendo N 0 uno spazio completo, esiste
y = lim Axn e risulta indipendente dalla scelta della particolare successione {xn }
in N ; essendo infatti kxn − x0n k ≤ kxn − xk + kx − x0n k, se anche x0n → x, allora
(xn − x0n ) → 0 . Ma essendo A limitato e perciò continuo (vedi teorema 1),
Axn − Ax0n = A(xn − x0n ) −→ A0; per la linearità di A, A0 = 0 e quindi
lim Axn = lim Ax0n .
Abbiamo cosı̀ determinato l’operatore B definito da Bx = y. Se x ∈ DA allora si sceglie evidentemente xn ≡ x ∀n, per cui B risulta definito su tutto N e
rappresenta pertanto una estensione di A.
Mostriamo ora che B è lineare e limitato e ne valutiamo la norma.
Siano x, y ∈ N e sia xn → x e yn → y e quindi anche xn + yn → x + y. Vale allora
B(x + y) = lim A(xn + yn ) = lim(Axn + Ayn ) = lim Axn + lim Ayn = Bx + By
grazie alle proprietà di continuità di A. Analogamente si dimostra la validità di
B(αx) = αBx, e quindi B è un operatore lineare.
Per mostrare la limitatezza, scelti x ∈ N e xn ∈ DA convergente a x,
kAxn k ≤ kAkkxn k e quindi, ricordando che il limite della norma è uguale alla
norma del limite: kBxk ≤ kAkkxk. Pertanto B è un operatore limitato con
kBk ≤ kAk. Ma essendo B una estensione di A, cioè con DA ⊂ DB , vale necessariamente kAk ≤ kBk e quindi in conclusione le due norme sono uguali, kAk = kBk.
Per ultimo, dobbiamo mostrare che B è l’unica estensione di A. Infatti sia C
un’altra estensione di A con kCk = kAk. Allora Cx = lim Cxn = lim Axn = Bx
per ogni x ∈ N , e quindi C = B. Il teorema è cosı̀ completo.
Osservazione 8. Grazie al risultato precedente, nel riferirci a operatori
lineari e limitati con dominio denso in uno spazio normato e codominio in uno
spazio di Banach, noi li intenderemo sempre definiti su tutto lo spazio.
76
3. SPAZI LINEARI DI OPERATORI
Osservazione 9. Consideriamo l’insieme B(A) di tutti gli operatori lineari e
limitati da N in N 0 con DA denso in N . L’insieme B(A) è uno spazio vettoriale.
Si può definire infatti un operatore somma A+B e un operatore prodotto per un
numero αA nel modo usuale, senza alcun problema con i domini. Si ottengono
ancora operatori lineari e limitati, poichè :
k(A+B)xk = kAx+Bxk ≤ kAxk+kBxk ≤ kAk+kBk kxk e kαAxk ≤ |α|kAkkxk.
Tutte le proprietà cui devono soddisfare la somma e il prodotto per potere definire
uno spazio vettoriale sono facilmente verificabili.
Osservazione 10. Mostriamo ora che B(A) è anche uno spazio normato
se assumiamo come norma quella già introdotta nella definizione 6. Mostriamo
cioè che tale numero soddisfa agli assiomi della norma nello spazio lineare B(A),
giustificando cosı̀ la scelta del nome.
I) A = 0 ⇐⇒ kAk = 0. Infatti, A = 0 vuol dire Ax = 0 per ogni x. Quindi
supx kAxk = 0. Viceversa, se kAk = supx kAxk = 0 allora kAxk = 0, ∀x, cioè
Ax = 0, ∀x e quindi A = 0.
II) kαAk = supx kαAxk = |α| supx kAxk = |α|kAk.
III) kA + Bk = supx k(A + B)xk ≤ supx (kAxk + kBxk) = kAk + kBk.
Osservazione 11. Essendo B(A) uno spazio normato è anche uno spazio
metrico nel quale è definita la naturale convergenza An → A se kAn − Ak → 0.
Definizione 7. La convergenza An → A se kAn − Ak → 0 si definisce
uniforme in contrapposizione alla convergenza puntuale di An ad A definita in N 0
dal limite An x → Ax, cioè da kAn x − Axk → 0, per ogni x ∈ N .
Osservazione 12. Chiaramente, la convergenza uniforme comporta la convergenza puntuale. Infatti kAn x − Axk ≤ kAn − Akkxk.
Il viceversa non è vero, come mostrato dal seguente:
Esempio 8. Sia data la successione di funzionali lineari da l2 in R (o C)
definiti da An x ≡ ξn , essendo x = (ξ1 , ξ2 , ..., ξn , ...) ∈ l2 . Sono funzionali limitati
P∞
dato che kξi k = |ξi | ≤ kxk ∀i. Inoltre, poichè x ∈ l2 e quindi i=1 |ξi |2 < ∞, si ha
necessariamente che |ξn | → 0 per n → ∞. Pertanto, kAn xk = |ξn | → 0 per ogni
77
x ∈ l2 e quindi An → 0 puntualmente in l2 . D’altra parte, ∀x ∈ l2 con kxk ≤ 1 si
ha che kAn k = supx kAn xk = sup |ξn | = 1, dato che esistono in l2 vettori del tipo
{0, 0, ..., 0, 1, 0, ...}. Quindi An 6→ 0 in modo uniforme.
Rimane da esplorare se lo spazio normato B(A) è anche completo, cioè è uno
spazio di Banach. A ciò risponde in modo affermativo il seguente:
Teorema 3. L’insieme degli operatori lineari limitati da uno spazio normato
N in un altro spazio normato e completo N 0 , costituisce a sua volta uno spazio
normato e completo.
Dimostrazione. Che B(A) sia uno spazio lineare normato è già stato provato.
Dimostrariamo quindi che è anche completo se N 0 è completo.
Consideriamo in B(A) una successione di Cauchy {An }, tale cioè che
kAn − Am k → 0 per n, m → ∞; anche kAn x − Am xk ≤ kAn − Am kkxk −→ 0 nello
stesso limite. Pertanto, anche {An x} è una successione di Cauchy che ammette
limite, essendo N 0 completo. Dato allora x0 ≡ lim An x per n → ∞, definiamo
l’operatore A: Ax ≡ x0 . Evidentemente A è un operatore da N in N 0 . Dimostriamo
che A : a) è lineare; b) è limitato; c) è il limite uniforme di {An }.
a) A(x + y) = lim An (x + y) = lim An x + lim An y = Ax + Ay, grazie all’esistenza
dei singoli limiti e delle proprietà di continuità della norma. Quindi A è lineare.
b) Essendo {An } una successione di Cauchy, costituisce anche un insieme limitato.
Infatti, kAn k ≤ k(An − Am ) + Am k ≤ kAn − Am k + kAm k, e per n e m̄ abbastanza
grandi, n qualsiasi e m̄ fissato, si ha kAn k < H = K + 1 con K = maxl=1,m̄ kAl k.
Ora, la norma è continua nel senso che kxn k → kxk se xn → x e pertanto,
kAxk = k lim An xk = lim kAn xk < Hkxk. Quindi, A è un operatore limitato.
c) Scelto > 0, esiste N tale che per ogni n, m > N , vale
kAn x − Am xk ≤ kAn − Am kkxk ≤ kxk. Per la continuità della norma, possiamo
passare al limite m → ∞, ottenendo per ogni n, k(An −A)xk = kAn x−Axk ≤ kxk.
Si ha cioè kAn − Ak < e quindi An → A uniformemente in B(A). Q.E.D.
Definizione 8. In particolare, lo spazio dei funzionali F (x) lineari e limitati
in uno spazio normato N , con l’usuale norma kF k = supkxk≤1 |F (x)| costituisce
78
uno spazio normato e completo B(F ) ed è detto spazio coniugato N ∗ di N .
Affronteremo ora due importanti questioni legate alla risoluzione di una vasta
classe di equazioni. La prima riguarda la risolubilità del problema Ax = x, La
seconda riguarda le condizioni sotto le quali esiste l’operatore inverso A−1 di un
operatore assegnato A, problema connesso tra l’altro alla soluzione del problema
x = Bx + f , con f assegnato.
4. EQUAZIONE DEL PUNTO FISSO
Definizione 9. La soluzione dell’equazione Ax = x si definisce punto fisso
(o punto unito) dell’operatore A. L’equazione stessa è detta del punto fisso.
Dimostriamo ora un teorema che fornisce una risposta positiva e costruttiva
al problema della risolubilità del problema del punto fisso per l’operatore A. Come
si vedrà, la dimostrazione sfrutta solo le proprietà metriche degli spazi normati e
pertanto vale più in generale per spazi metrici.
Teorema 4. Dato un operatore A definito su tutto uno spazio normato
e completo N (o su tutto un suo sottoinsieme chiuso I ∈ N ), sia A tale da
trasformare N in N (oppure I in I). Supponiamo che esista una costante reale
0 < α < 1 tale che kAx1 − Ax2 k ≤ αkx1 − x2 k, per ogni coppia x1 , x2 ∈ DA . In
tal caso esiste una e una sola soluzione del problema Ax = x.
Dimostrazione. Dato un elemento qualsiasi x0 ∈ DA , consideriamo la successione: {x0 , x1 = Ax0 , x2 = Ax1 , ..., xn+1 = Axn , ...}. Vale evidentemente
kxn+1 − xn k = kA(xn − xn−1 )k ≤ αkA(xn−1 − xn−2 )k ≤ ... ≤ αn kx1 − x0 k,
e anche (sia n < m):
kxm − xn k ≤ (αm−1 + αm−2 + ... + αn )kx1 − x0 k ≤
P∞
≤ αn i=0 αi kx1 − x0 k = αn /(1 − α) kx1 − x0 k.
Segue che, per n, m → ∞, kxm − xn k → 0, per cui {xn } è una successione di
Cauchy; per ipotesi N è completo (I è chiuso) e quindi esiste il limite x̄ = lim xn .
Mostriamo ora che x̄ è un punto fisso di A . Poichè kAyn − Ayk ≤ αkyn − yk,
79
se yn → y anche Ayn → Ay, cioè A è un operatore continuo e si può invertire
l’operatore con il segno di limn→∞ :
Ax̄ = lim Axn = lim xn+1 = x̄ . Quindi
x̄ = lim xn = lim An x0 , è soluzione del problema del punto fisso.
Mostriamo che tale soluzione è unica. Supponiamo che esistano due soluzioni: x̄ e
x̄0 . Allora kx̄ − x̄0 k = kAx̄ − Ax̄0 k ≤ αkx̄ − x̄0 k. Questa diseguaglianza ha soluzione
solo per kx̄ − x̄0 k = 0 e cioè per x̄ = x̄0 . CVD.
Osservazione 13. Dalla maggiorazione kxm − xn k ≤ αn /(1 − α) kx1 − x0 k,
passando al limite per m → ∞ con n fissato, si ottiene
kxn −x̄k ≤ αn /(1−α) kx1 −x0 k, che fornisce una stima dell’errore che si commette
troncando il procedimento a n. Da qui si deduce anche che la approssimazione è
tanto migliore quanto migliore è la scelta del vettore iniziale x0 .
Osservazione 14. Per dimostrare il precedente teorema in uno spazio metrico completo bisogna ovviamente sostituire l’ipotesi fondamentale con la:
d(Ax1 , Ax2 ) ≤ αd(x1 , x2 ), con 0 < α < 1.
Definizione 10. Un operatore A in uno spazio metrico soddisfacente a
d(Ax1 , Ax2 ) ≤ αd(x1 , x2 ), con 0 < α < 1, si dice operatore di contrazione.
Osservazione 15. L’equazione disomogenea x = Ax + f con f dato, diventa
una equazione al punto fisso per l’operatore B : Bx = Ax + f . Poichè
kBx1 − Bx2 k = kAx1 − Ax2 k, se A è di contrazione, lo è anche B e pertanto
esiste la soluzione iterativa data nella dimostrazione costruttiva del teorema 4. Se
f ∈ DA e valgono le stesse ipotesi del teorema, la soluzione è data da
n
x̄ = lim xn = lim B f =
n→∞
n→∞
∞
X
Ai f,
A0 = I.
i=0
Ci si convince facilmente dell’eguaglianza tra limite e sommatoria sviluppando i
primi termini.
Studiamo ora tre importanti applicazioni del procedimento iterativo sopra descritto. Ai sistemi lineari. Al problema di Cauchy per le equazioni differenziali del
primo ordine tramite equazioni integrali a limiti variabili o equazioni di Volterra.
Alle equazioni integrali a limiti fissi o equazioni di Fredholm.
80
4.1 SISTEMI LINEARI
Sia dato il sistema lineare di N equazioni in N incognite:
PN
i=1
aki ξi = bk , con
k = 1, 2, ..., N . In termini operatoriali riscriviamo tale sistema nella forma Ax = b,
ove evidentemente A rappresenta un operatore matriciale N × N da RN in RN ,
x ≡ (ξ1 , ξ2 , ..., ξN ) è il vettore incognito e b ≡ (b1 , b2 , ..., bN ) è un vettore dato. Se
N è molto grande, la formula risolutiva di Cramer espressa tramite i determinanti
dei coefficienti e dei termini noti non è più conveniente da un punto di vista
pratico per l’elevato numero di determinanti (N 2 ) da calcolarsi per ogni incognita.
Risultano più efficaci alcune tecniche risolutive approssimate tra cui, importante,
è appunto quella iterativa, nel caso che l’operatore A sia di contrazione.
PN
Il sistema si può porre infatti nella forma: ξk = i=1 cki ξi + bk , pur di definire
cki = −aki + δki , o in forma operatoriale: x = Cx + b, con C ≡ −A + I.
Definiamo allora l’operatore D da RN in RN tramite la sua azione su ogni
x ∈ RN : Dx = Cx + b. Il nostro sistema lineare viene cosı̀ riespresso come un
problema del punto fisso per l’operatore D : x = Dx. Ora,
kDx − Dyk = kCx + b − (Cy + b)k = kCx − Cyk ≤ kCkkx − yk. Pertanto, se
kCk = k − A + Ik < 1, l’operatore D è un operatore di contrazione e il problema è
risolubile per approssimazioni successive: xn+1 = Dxn = Cxn +b = −Axn +xn +b.
Notiamo che l’operatore D può essere o meno un operatore di contrazione a seconda della norma che si sceglie in RN ; ovvero, se esiste una norma rispetto
alla quale D è un’operatore di contrazione, allora il sistema è risolubile per via
iterativa. Naturalmente, la velocità di convergenza, e anche la bontà delle soluzioni
approssimate, dipende dalla norma rispetto alla quale tale tecnica è applicabile.
Consideriamo dapprima in RN l’usuale norma Euclidea. Per stimare la kCk
utilizziamo la diseguaglianza di Schwartz (teorema 3.1), applicata al prodotto
scalare yk · x tra il vettore yk ≡ (ck1 , ck2 , ..., ckN ) e il vettore x:
PN
PN
2
PN
PN
2
2
·
= i=1 (cki )2 kxk2 .
≤
i=1 cki ξi
i=1 (cki )
i=1 (ξi )
2 PN
PN PN
E pertanto: kCxk2 = k=1
c
ξ
≤ k,i=1 (cki )2 kxk2 .
ki
i
i=1
qP
N
2
Da cui si deduce che kCk ≤
k,i=1 (cki ) . Tornando al nostro sistema lineare
81
di partenza, concludiamo che questo è risolubile per approssimazioni successive se
PN
2
k,i=1 (−aki + δki ) < 1.
In RN consideriamo anche la norma kxk = maxi=1,N |ξi |. In tal caso
P
P
kCx − Cyk ≡ maxk | i cki (ξi − ηi )| ≤ maxk
i |cki ||ξi − ηi | ≤
P
P
≤ maxk
i |cki | · maxi |ξi − ηi | = maxk
i |cki | ·kx − yk.
P
Pertanto, se vale la maggiorazione: maxk
i |cki | ≤ α < 1, l’operatore D risulta
essere di contrazione e quindi il nostro sistema lineare è risolubile per iterazioni
successive. Nel senso che l’iterazione n-esima converge nella norma del max alla
soluzione del problema.
4.2 PROBLEMA DI CAUCHY ED EQUAZIONE DI VOLTERRA
Consideriamo l’usuale problema di Cauchy per la equazione differenziale di
primo grado x0 (t) = f (t, x(t)) con la condizione iniziale x(t0 ) = x0 . Supponiamo
che in un intorno |t − t0 | ≤ e |x − x0 | ≤ η la funzione f (t, x) sia continua e perciò
limitata, cioè |f (t, x)| ≤ M con M > 0. La soluzione di tale problema coincide
con la soluzione dell’equazione integrale, detta equazione di Volterra:
Z
t
f s, x(s) ds + x0 .
x(t) =
t0
Per tale funzione vale infatti x0 (t) = f (t, x(t)) con x(t0 ) = x0 .
Introduciamo quindi l’operatore
Z
t
B : Bx ≡
f s, x(s) ds + x0 .
t0
Se questo operatore trasforma un certo intorno di C[a,b] in se stesso e risulta essere
un operatore di contrazione in qualche norma, allora il problema di Cauchy ha
localmente una e una sola soluzione ottenibile per approssimazioni successive a
partire, ad esempio, da x0 stesso.
Rt
Rt
x1 (t) = t0 f (s, x0 ) ds + x0 , . . . , xn+1 (t) = t0 f (s, xn (s)) ds + x0 .
82
Esaminiamo sotto quale ipotesi è possibile procedere in tal modo. Consideriamo
in C[t0 −,t0 +] l’insieme delle funzioni continue nell’intorno chiuso It0 di centro t0 e
raggio |t − t0 | ≤ , costituito dalla sfera Sxη0 (vedi la definizione 3.4) di centro x0 e
raggio kx − x0 k ≤ η. Introduciamo la norma del max per essere sicuri di ottenere
limiti continui e vediamo come B trasforma la nostra sfera chiusa.
i) g(t) = [Bx](t) è senz’altro una funzione continua date le ipotesi sulla f (t, x(t)).
Z
ii)
kBx − x0 k = max
|
t∈It
0
|t − t0 | ·
≤ max
t∈It
0
t
f s, x(s) ds| ≤
t0
max
t∈It ,x∈Sxη
0
|f (t, x)| ≤ M.
0
Da qui segue che ed η non possono essere scelti in modo indipendente. Infatti,
solo se ≤ η/M l’operatore B trasforma la sfera Sxη0 in se stessa.
iii) Con l’opportuna scelta di come in ii), per ogni coppia x, y ∈ Sxη0 si ha che
Rt
kBx − Byk ≤ maxt∈It t0 |f s, x(s) − f s, y(s) | ds.
0
Se la funzione f (t, x) oltre a essere continua e perciò limitata soddisfa anche la
condizione di Lipschitz rispetto alla variabile x nella sfera Sxη0 , uniformemente per
ogni t ∈ It0 , e cioè |f (t, x) − f (t, y)| ≤ K|x − y|, allora per ogni t ∈ It0 e per ogni
coppia x, y ∈ Sxη0 , vale la diseguaglianza:
Z
kBx − Byk ≤ K max
t∈It
0
t
x(s) − y(s) ds ≤ Kkx − yk.
t0
Quindi, se oltre a ≤ η/M vale anche la maggiorazione ≤ 1/K, l’operatore B è
di contrazione e il problema di Cauchy ha una e una sola soluzione nell’intervallo
ridotto It0 con ≤ min(η/M, 1/K).
La soluzione inoltre può essere ottenuta per via iterativa dall’equazione di Volterra
precedentemente introdotta.
4.3 EQUAZIONE DI FREDHOLM
Nella precedente applicazione delle tecniche iterative alla risoluzione del problema del punto fisso, abbiamo trattato le equazioni integrali a limiti variabili, o
83
di Volterra. Consideriamo ora le equazioni integrali a limiti fissi, o equazione di
Fredholm, per le quali tale tecnica risulta più vantaggiosa potendosi trattare le
iterazioni mediante il calcolatore elettronico.
Consideriamo anzitutto la forma generale (non lineare) di tali equazioni:
Z
b
x(t) = λ
K t, s, x(s) ds
a
e studiamo le condizioni sotto le quali esiste la soluzione iterativa. Sia K(t, s, x)
una funzione continua nel cubo a ≤ {t, s} ≤ b e |x| ≤ η, ivi limitata da M > 0.
Consideriamo in C|a,b] la sfera S0η di centro x = 0 e raggio η, ove l’operatore
integrale è senz’altro definito. Qui:
kAxk ≤ max λ
b
Z
t∈[a,b]
K t, s, x(s) ds ≤ |λ|M (b − a).
a
Pertanto, se |λ| ≤ η/ M (b − a) , allora kAxk ≤ η e l’operatore A trasforma la
sfera chiusa in se stessa. Inoltre,
kAx − Ayk = max λ
t∈[a,b]
K t, s, x(s) − K t, s, y(s) ds ≤
a
Z
≤ |λ| max
t∈[a,b]
Z b
b
K t, s, x(s) − K t, s, y(s) ds.
a
Se facciamo l’ulteriore ipotesi che la funzione K(t, s, x) sia Lipschitziana rispetto
a x, uniformemente nel quadrato a ≤ {t, s} ≤ b con costante K, allora:
kAx − Ayk ≤ |λ|(b − a)K max x(s) − y(s) ≤ |λ|(b − a)Kkx − yk.
s∈[a,b]
Quindi, se |λ|(b − a)K < 1, l’operatore A è di contrazione ed esiste ed è unica la
soluzione della nostra equazione integrale di Fredholm non lineare. Essa è otteni
Rb
bile dallo schema iterativo: xn+1 (t) = a K t, s, xn (s) ds, dove potremo scegliere
per x0 (t) una qualsiasi funzione continua in [a, b] soddisfacente a max |x0 (t)| ≤ η.
Per riassumere, lo schema iterativo è applicabile per |λ|(b − a) ≤ min η/M , 1/K .
84
Consideriamo ora l’equazione di Fredholm lineare. Sia data l’equazione
b
Z
x(t) = λ
K(t, s)x(s) ds + f (t),
a
con λ parametro reale, f (t) funzione continua in [a, b] e K(t, s) continua nel
quadrato a ≤ {s, t} ≤ b. Definiamo in C[a,b] con la norma del max l’operatore
Z
b
B : Bx = λ
K(t, s)x(s) ds + f (t).
a
Essendo K(t, s) continua in un intervallo chiuso e limitato, è anche limitata, cioè
|K(t, s)| ≤ M . Pertanto,
kBx − Byk = max λ
b
Z
t∈[a,b]
K(t, s) x(s) − y(s) ds ≤
a
≤ |λ|M (b − a) max x(s) − y(s) = |λ|M (b − a)kx − yk.
s∈[a,b]
Quindi, per |λ| < 1/[M (b − a)] l’operatore B è un operatore di contrazione ed
esiste il limite uniforme (cioè con la norma del max) del processo iterativo:
Rb
xn+1 (t) = λ a K(t, s)xn (s) ds + f (t). Una possibile scelta del dato iniziale è data
da x0 (t) = f (t).
Esempio 9. Consideriamo in C[0,1] l’equazione di Fredholm:
Z
1
ts · x(s) ds + αt
x(t) = λ
0
essendo α un qualsiasi parametro reale. Poichè maxt,s∈[0,1] K(t, s) = 1 e b − a = 1,
per |λ| < 1/ M (b − a) = 1, l’operatore in questione è un operatore di contrazione
e si può risolvere il problema per approssimazioni successive:
x0 = αt ≡ α0 t
R1
x1 = λ 0 ts · (α0 s) ds + αt = (α + α0 λ/3)t ≡ α1 t
.
xn+1 = λ
R1
0
ts · (αn s) ds = (α + αn λ/3)t ≡ αn+1 t.
Per |λ| < 1 esiste il limite x = limn→∞ xn e quindi esiste anche il limite
85
β = limn→∞ αn , per cui possiamo passare al limite nell’ultima eguaglianza:
α+λβ/3 = β, da cui si ottiene β = 3α/(3−λ) e, in conclusione x(t) = 3α/(3−λ)t.
Abbiamo ottenuto questa soluzione nell’ipotesi |λ| < 1, ma si può facilmente vedere
che il limite di αn per n → ∞, esiste anche per altri valori di λ, come per altro
suggerito dal valore stesso del limite. Infatti:
αn+1 = α + αn λ/3 =. . . = α 1 + λ/3 + (λ/3)2 +. . . +(λ/3)n+1 .
Quindi αn (t) → 3α/(3 − λ) per |λ| < 3. La condizione |λ| < 1 è una condizione
sufficiente per la convergenza del processo iterativo che, come appena visto, ha
un più ampio dominio di convergenza. Ancora più in generale, la funzione x(t)
trovata è in realtà soluzione del problema di partenza per ogni λ 6= 3. Ma queste
ovviamente sono condizioni a posteriori.
5. OPERATORE INVERSO
Affrontiamo l’ultimo importante argomento del capitolo dedicato agli spazi
normati: studiamo sotto quali condizioni esiste l’inverso di un operatore assegnato.
Come abbiamo già visto in alcuni esempi, l’esistenza dell’operatore inverso è legata
alla risolubilità di ben noti problemi: uno per tutti, la risolubilità dei sistemi lineari
è legata all’esistenza dell’inverso della matrice dei coefficienti.
Osservazione 16. Nel capitolo sugli spazi lineari, abbiamo già affrontato i
problemi connessi al dominio e codominio di un operatore A e del suo inverso A−1 ,
ove questo esiste. Abbiamo visto anche che per operatori lineari in spazi lineari:
i) Se A−1 esiste, anche A−1 è lineare.
ii) A−1 esiste se e solo se Ax = 0 ammette come unica soluzione x = 0.
Negli spazi normati possiamo enunciare il seguente teorema di esistenza:
Teorema 5. Dato un operatore lineare A da uno spazio normato N in un
altro spazio normato N 0 , condizione necessaria e sufficiente affinchè A−1 esista
con DA−1 = RA e sia limitato, è che esista una costante C > 0 tale che, per
ogni x ∈ DA , valga la diseguaglianza kAxk ≥ Ckxk. In tal caso si avrà anche
kA−1 k ≤ 1/C.
86
Dimostrazione. La condizione è necessaria. Infatti, se A−1 esiste (lineare) ed
è limitato con kA−1 k ≤ 1/C , si consideri ∀y ∈ RA il suo trasformato secondo
A−1 : x = A−1 y. Segue che kxk ≤ kA−1 kkyk e quindi
kAxk = kyk ≥ (1/kA−1 k)kxk ≥ Ckxk.
La condizione è sufficiente. Sia kAxk ≥ Ckxk. Allora, se Ax̄ = 0 , si ottiene
0 = k0k = kAx̄k ≥ Ckx̄k che è verificata solo per kx̄k = 0 e cioè per x̄ = 0 .
Quindi A−1 esiste (lineare) e posto y = Ax, si ottiene kyk ≥ CkA−1 yk e quindi
kA−1 k ≤ 1/C.
Studiamo ora una importante applicazione di quanto detto sull’operatore inverso al problema disomogeneo x = Ax + f .
5.1 OPERATORE RISOLVENTE
In uno spazio di Banach B (normato e completo) supponiamo di volere risolvere l’equazione x = Ax + f riducendola a una equazione al punto fisso per
l’operatore D : Dx = Ax + f (vedi l’osservazione 15). Abbiamo già visto che la
soluzione di tale equazione esiste ed è unica se l’operatore A è di contrazione.
In termini più generali, l’equazione x = Ax + f può essere risolta formalmente
da x = (I − A)−1 f e pertanto la sua soluzione è legata all’esistenza e al dominio
dell’operatore inverso (I − A)−1 .
Dimostriamo pertanto il seguente:
Teorema 6. Sia A un operatore lineare e limitato definito su tutto B e
con kAk ≤ q < 1. Allora l’operatore (I − A)−1 esiste lineare e limitato con
k(I − A)−1 k ≤ 1/(1 − q). Inoltre, D(I−A)−1 = R(I−A) = B.
Dimostrazione. Cominciamo a dimostrare l’esistenza di (I − A)−1 quale
operatore limitato.
i) kAxk ≤ kAkkxk ≤ qkxk;
ii) k(I − A)xk = kx − Axk ≥ kxk − kAxk, come segue dalla osservazione 2.iv;
iii) k(I − A)xk ≥ kxk − qkxk = (1 − q)kxk, come segue dalle i) e ii).
Dal teorema precedente segue allora che (I − A)−1 esiste (lineare), è limitato e
87
vale k(I − A)−1 k ≤ 1/(1 − q).
Per dimostrare che il codominio dell’operatore (e il dominio dell’inverso) coincide
con tutto B, occorre dimostrare che per ogni f ∈ B esiste un x̄ ∈ B tale che
(I − A)x̄ = f , ovvero x̄ = Ax̄ + f . In altri termini, definito l’operatore
B : Bx = Ax + f , deve esistere la soluzione al problema del punto fisso per B,
cioè x = Bx, qualunque sia f . Ora, kBz − B z̃k = kAz − Az̃k ≤ qkz − z̃k con
q < 1, per cui B è un operatore di contrazione, e pertanto l’equazione disomogenea
x = Ax + f ha una e una sola soluzione qualunque sia f ∈ B.
Osservazione 17. Quanto detto sopra si riferiva solo all’esistenza dell’operatore (I − A)−1 e quindi all’esistenza della soluzione del problema x = Ax + f .
L’esistenza è assicurata per ogni f ∈ B grazie alla proprietà sopra dimostrata:
D(I−A)−1 = R(I−A) = B.
Per la costruzione esplicita di tale soluzione, avendo supposto A essere un operatore
di contrazione, si può procedere come già visto per approssimazioni successive:
x0 = f ; x1 = Af + f ; x2 = Ax1 + f = A2 f + Af + f ; . . . ;
P∞
x̄ = i=0 Ai f , (A0 ≡ I).
P∞
Nel prossimo teorema vedremo che la serie a valori operatoriali i=0 Ai , detta
serie di Neumann, fornisce un limite all’operatore (I − A)−1 , non solo in senso
puntuale, ma anche in senso uniforme.
Introduciamo però prima la seguente:
Definizione 11. L’operatore Rλ = (I − λA)−1 , ove esista, si definisce operatore risolvente di A. Una notazione alternativa è data da Rµ = (µI − A)−1 .
Teorema 7. Sia |λ|kAk ≤ q < 1. Allora, l’operatore risolvente (I − λA)−1 è
P∞
dato da Rλ = i=0 λi Ai , dove la serie esiste come limite uniforme in B(A).
Dimostrazione. Abbiamo visto in precedenza che l’equazione x − λAx = f
possiede una e una sola soluzione se vale la maggiorazione |λ|kAk ≤ q < 1, nel qual
P∞
caso la serie x = i=0 λi Ai f esiste e fornisce la soluzione cercata. Poichè abbiamo
mostrato che tale soluzione esiste per ogni f ∈ B, possiamo anche affermare che
Pn
l’operatore Sn = i=0 λi Ai converge puntualmente all’operatore risolvente Rλ .
88
Mostriamo che la convergenza Sn → Rλ per n → ∞ vale in realtà uniformemente
nello spazio di Banach B(A) degli operatori lineari e limitati definiti su tutto B.
Infatti, poichè kABxk ≤ kAkkBxk ≤ kAkkBkkxk, allora kAn k ≤ kAkn . Pertanto,
kSn+p − Sn k = kλn+1 An+1 + λn+2 An+2 + . . . +λn+p An+p k ≤
≤ |λ|n+1 kAkn+1 + |λ|n+2 kAkn+2 + . . . +|λ|n+p kAkn+p ≤
≤ (q n+1 + q n+2 + . . . +q n+p ).
Quest’ultima quantità tende a zero per n → ∞ ∀ p , poichè la serie
P∞
i=0
q i è
convergente e quindi anche di Cauchy. Ma allora è di Cauchy anche la successione
{Sn } di operatori; poichè lo spazio B(A) è uno spazio completo, la successione
P∞
{Sn } è convergente. Quindi, l’operatore i=0 λi Ai esiste come limite uniforme in
B(A). Poichè esiste anche come limite puntuale per ogni f ∈ B e la sua azione
P∞
coincide con quella dell’operatore Rλ , ne segue che la eguaglianza i=0 λi Ai =
Rλ = 1/(I − λA) vale in senso operatoriale, cioè secondo la convergenza uniforme
della serie.
Esempio 10. Consideriamo l’equazione di Fredholm lineare:
Rb
x(t) = λ a K(t, s)x(s) ds + f (t) = λAx + f con K(t, s) continua nel quadrato
a ≤ {t, s} ≤ b e f (t) continua in [a, b]. Poichè |K(t, s)| ≤ M e
kAk ≤ |λ|M (b − a) ≡ q , per quei valori di λ per i quali q < 1, lo sviluppo in serie
del risolvente converge uniformemente. Converge cioè uniformemente la serie degli
operatori:
Rb
Rb
A1 ≡ A = a K1 (t, s)(∗) ds ; A2 = a K2 (t, s)(∗) ds ; . . . ;
Rb
An = a Kn (t, s)(∗) ds ; . . . con:
Rb
K1 (t, s) = K(t, s) , K2 (t, s) = a K(t, u)K(u, s) du ; . . . ;
Rb
Kn (t, s) = a Kn−1 (t, u)K(u, s) du.
Conseguentemente, si ha anche la convergenza debole della serie
P∞ i R b
i=1 λ a Ki (t, s)f (s) ds . Inoltre, possiamo dimostrare che la serie dei nuclei
integrali converge uniformemente. Infatti, per ogni termine vale la maggiorazione
|λi Ki (t, s)| ≤ |λ|i M i (b − a)i ≤ q i , per ogni t ed s compresi tra a e b, e la serie dei
q i è convergente essendo per ipotesi q < 1. Quindi,
P∞ i
i=1 λ Ki (t, s) = K(t, s; λ). La funzione K(t, s; λ) , detta nucleo risolvente è
89
una funzione continua nel quadrato a ≤ {t, s} ≤ b in quanto limite uniforme di
Rb
funzioni continue. Da qui segue: x(t) = f (t) + a K(t, s; λ)f (s) ds . Per quanto
detto prima, anche il limite uniforme potrà essere espresso con lo stesso operatore
e quindi Rλ = 1/(I − λA) = I + Kλ ove ovviamente Kλ è l’operatore integrale
Rb
di nucleo K(t, s; λ) e cioè Kλ ≡ a ds K(t, s; λ)(∗) .
Esempio 11. Consideriamo l’equazione integrale
R π/2
x(t) = sin t − t/4 + 1/4 0 ts · x(s) ds. Il nucleo integrale K(t, s) = ts soddisfa la
diseguaglianza |K(t, s)| ≤ π 2 /4. Inoltre b − a = π/2 e
λ = 1/4 < 1/ M (b − a) = 8/π 3 . Possiamo pertanto applicare gli sviluppi in serie
studiati nel precedente esempio. Il nucleo risolvente è dato dallo sviluppo:
K(t, s; λ) = λK(t, s) + λ2 K2 (t, s) + λ3 K3 (t, s) + ... , dove
R π/2
R π/2
K1 (t, s) = ts , K2 (t, s) = 0 tuus du = αts (con α ≡ 0 u2 du = π 3 /24) ,
R π/2
R π/2
K3 (t, s) = 0 K2 (t, u)K1 (u, s) du = α 0 tuus du = α2 ts , ...
Kn (t, s) = αn−1 ts.
Valutiamo ora la serie dei nuclei data da:
K(t, s; λ) = λ ts + λαts + (λα)2 ts + ... = λ ts/(1 − λα) , poichè
λα = π 3 /(4 · 24) < 1 . La soluzione del nostro problema è quindi data da:
R π/2
x(t) = sin t − t/4 + 1/4 0 1/(1 − α/4) · ts(sin s − s/4) ds =
R π/2
= sin t − t/4 + 1/4 · 1/(1 − α/4) · t 0 (s sin s − s2 /4) ds.
R π/2
R π/2
π/2
π/2
Poichè 0 s sin s = −s cos s|0 + 0 cos s ds = sin s|0 = 1, otteniamo infine:
x(t) = sin t − t/4 + t/(4 − α) · (1 − α/4) = sin t − t/4 + t/4 = sin t .
Nel paragrafo 4.2 abbiamo studiato l’equazione generale di Volterra. Riprendiamo ora l’argomento nel caso lineare, da confrontarsi con l’esempio 10 sulla
equazione di Fredholm lineare.
Esempio 12. Consideriamo in C[a,b] l’equazione lineare di Volterra:
Rt
x(t) = λ a K(t, s)x(s) ds + f (t) = λAx + f , con le solite ipotesi di continuità e di limitatezza per K(t, s) e per f (t). E sia max{t,s}∈[a,b] |K(t, s)| = M
e maxt∈[a,b] |f (t)| = F . Rispetto all’ esempio 10, qui l’integrale non si estende su
tutto [a, b] ma solo fino a t che diventa a sua volta variabile di integrazione nella
90
iterazione successiva. Poichè di solito le integrazioni rendono più lisce le funzioni,
ci attendiamo di ottenere condizioni più favorevoli sui valori di λ per i quali è
lecita la soluzione iterativa. Consideriamo pertanto la soluzione
P∞
P∞
x(t) = i=0 λi Ai f = i=0 λi φi , che senz’altro esiste almeno per quei valori di λ
trovati per l’equazione di Fredholm lineare. Valgono le seguenti stime:
Rt
|φ1 (t)| ≤ a |K(t, s)f (s)| ds ≤ M F (t − a) ,
Rt
Rt
|φ2 (t)| ≤ a |K(t, s)φ1 (s)| ds ≤ M 2 F a (s − a) ds = M 2 F (t − a)2 /2 , ...
|φn | ≤ M n F (t − a)n /n!.
P∞
Ne segue che la serie di funzioni i=0 λi φi è maggiorata in modulo dalla serie:
P∞
F · i=0 |λ|i M i (t − a)i /i! = F e|λ|M (t−a) , convergente per ogni valore di λ. La
funzione x(t) pertanto esiste continua ed è soluzione dell’equazione di Volterra per
ogni λ.
Osservazione 18. Nel caso dell’equazione di Fredholm dell’esempio 10 e
per |λ| ≤ 1/ M (b − a) , esiste una e una sola soluzione per ogni termine noto
Rb
f (t). Pertanto, anche l’equazione omogenea associata x(t) = λ a K(t, s)x(s) ds
ammette, per gli stessi valori di λ, la unica soluzione x(t) ≡ 0. Per gli altri valori
di λ per i quali non è garantita la unicità della soluzione, l’equazione omogenea
può avere anche soluzioni diverse da quella banale identicamente nulla. Questo
fatto è noto come alternativa di Fredholm.
Per le equazioni lineari di Volterra questo fenomeno non si verifica in quanto,
come abbiamo visto, la soluzione esiste ed è unica per ogni valore di λ. Per cui
Rt
l’equazione omogenea x(t) = λ a K(t, s)x(s) ds ammette la sola soluzione nulla.
Esempio 13. Vediamo in un caso concreto come l’equazione di Fredholm
lineare omogenea ammetta soluzioni diverse dalla nulla. Data l’equazione:
R1
x(t) = λ 0 (t + s) x(s) ds , introduciamo le costanti c1 e c2 date da:
R1
R1
x(t) = λt 0 x(s) ds + λ 0 sx(s) ds ≡ λtc1 + λc2 . Inserendo questa forma della
x(t) nell’equazione di partenza si ottiene:
R1
λtc1 + λc2 = λ 0 (t + s)(λsc1 + λc2 ) ds = λ2 c1 t/2 + c2 t + c1 /3 + c2 /2 .
Eguagliando i coefficienti dei termini simili ricaviamo:
c1 = λc1 /2 + λc2 ; c2 = λc1 /3 + λc2 /2.
91
√
Le due equazioni sono compatibili per λ = 6 ± 4 3 e il sistema ammette infinite
soluzioni (essendo omogeneo) date da: c1 = α·2λ/(2−λ) , c2 = α con α parametro
arbitrario. La soluzione non banale della nostra equazione è quindi data da:
x(t) = λ 2λt/(2 − λ) + 1 , a meno di un fattore di proporzionalità arbitrario.
√ Ovviamente, |λ| = 6 ± 4 3 > 1/2 , valore al di sotto del quale si avrebbe unicità
della soluzione.
Osservazione 19. Negli esempi trattati si è sempre utilizzata la norma del
max , per essere sicuri di non uscire dallo spazio delle funzioni continue. Anche le
stime per ricavare esistenza e unicità delle soluzioni sono state fatte ovviamente
con la stessa norma. Questo non esclude che esistano anche soluzioni non continue
che noi abbiamo escluso a priori. Vediamo infatti, per concludere, il seguente
esempio.
Esempio 14. Consideriamo l’equazione omogenea di Volterra:
Rt
x(t) = 0 st−s x(s) ds , per 0 ≤ t ≤ 1. Il nucleo K(t, s) = st−s è continuo nel
dominio di integrazione per s ≤ t e pertanto l’equazione di Volterra omogenea
ammette la unica soluzione continua x ≡ 0. Esistono però infinite soluzioni non
appartenenti a C[a,b] date da x(t) = αtt−1 con α costante arbitraria. Infatti,
x(t) → ∞ per t → 0 e:
t
R t t−s s−1
Rt
s s
ds = 0 st−1 ds = st /t0 = tt−1 .
0
Come già visto più volte in altri esempi, un problema può avere soluzioni
diverse a seconda dello spazio entro il quale il problema viene ambientato.
92
6. FUNZIONALI LINEARI LIMITATI
Tutto quanto è stato detto a proposito degli operatori lineari limitati vale
ovviamente per i funzionali lineari limitati. In particolare, grazie al teorema 1, i
funzionali lineari in uno spazio normato N sono limitati se e solo se sono continui
nell’intorno dello zero. Grazie alla continuità delle traslazioni, grazie cioè al fatto
che uno spazio normato è uno spazio lineare topologico, la continuità in zero
comporta la continuità in ogni punto di N . Per questo parleremo indifferentemente
di funzionali limitati o continui.
Ricordiamo anche che nella definizione 8 si era introdotto il concetto di spazio
coniugato N ∗ di uno spazio normato N quale spazio di Banach dei funzionali
lineari limitati su N . La norma introdotta in N ∗ è data da ||F || = sup||x||≤1 |F (x)|
e dipende quindi dalla norma dello spazio N su cui sono definiti i funzionali.
Esempio
15. Sia dato lo spazio di Banach RN dell’esempio 1 con la norma
qP
N
2
kxk =
i=1 |ξi | . Esso diventa l’ordinario spazio euclideo N -dimensionale con
PN
l’introduzione del prodotto scalare (y, x) =
i=1 ηi ξi . Questa espressione, a y
fissato, definisce un funzionale ovviamente lineare, e limitato. Grazie infatti alla
diseguaglianza di Schwarz (vedi il teorema 3.1), si ha: |Fy (x)| = |(y, x)| ≤ ||y||||x||.
Da qui si ricava che ||Fy || = sup||x||≤1 |Fy (x)| ≤ ||y||, e valutando il funzionale in
x = y si ottiene ||Fy || = ||y||.
Il prodotto scalare è in realtà il più generale funzionale lineare limitato in RN , nel
senso che ad ogni funzionale F corrisponde un vettore yF ∈ RN tale che (yF , x) =
F (x) per ogni x ∈ RN . Qui infatti il funzionale F è assegnato se è assegnato
sui vettori della base usuale (ei ) dell’esempio 1.7, definiti da ei = (δik ). Dati
PN
PN
F (ei ) = ηi e x = (ξi ) = i=1 ξi ei , dalla linearità di F si ottiene F (x) = i=1 ξi ηi
e posto yF = (ηi ), si ottiene infine F (x) = (yF , x).
Esempio 16. Analoghe proprietà si ottengono nel caso complesso dei C N , con
PN
la differenza che in questo caso si definisce il prodotto scalare (y, x) = i=1 ηi∗ ξi
che risulta pertanto lineare nel secondo membro ma antilineare nel primo, ovvero
∗
(αy, x) = α∗ (y, x). Questo comporta che lo spazio coniugato CN
generato da questo
prodotto scalare è uno spazio antilineare di funzionali lineari, ovvero invertendo il
93
ruolo dei due fattori, uno spazio lineare di funzionali antilineari.
Osservazione 20. Considerazioni simili a quelle dell’esempio 15 a proposito
delle basi, possono essere ripetute in generale per uno spazio N -dimensionale reale
o complesso. Data infatti una qualsiasi base (ei ) e assegnato su di questa un
PN
funzionale lineare F , questo risulta definito su tutti gli elementi x = i=1 ξi ei dalla
PN
relazione F (x) = i=1 F (ei )ξi . Se inoltre consideriamo i funzionali Gi definiti da
Gi (ej ) = δij , essi risultano in modo ovvio linearmente indipendenti e tali che
Gi (x) = ξi . Quindi, l’azione del generico funzionale F può essere riscritta come
PN
PN
F (x) = i=1 F (ei )Gi (x) e cioè F = i=1 F (ei )Gi . I funzionali (Gi ) sono detti la
base coniugata a (ei ) nello spazio coniugato C ∗ e i numeri F (ei ) le componenti di
F in questa base.
Esempio 17. Sia N = C[a,b] con la norma del max. L’integrale
Rb
F (x) = a x(t) dt definisce un funzionale lineare limitato con norma ||F || = b − a.
Rb
Infatti |F (x)| = | a x(t) dt| ≤ (b − a) maxt∈[a,b] |x(t)| = (b − a)||x||, e per x uguale
alla funzione costante vale il segno di uguale.
Esempio 18. In C[a,b] con la norma del max sia data la funzione y(t).
Rb
L’integrale Fy (x) = a x(t)y(t) dt definisce un funzionale lineare e limitato.
Rb
Rb
Infatti: |F (x)| = | a x(t)y(t) dt ≤ ||x|| a |y(t)|dt . Poichè per x(t) uguale alla
Rb
funzione costante e y ≥ 0 vale il segno di uguale, si ha: ||F || = a |y(t)|dt.
Esempio 19. Consideriamo in C[a,b] con la norma del max la delta di Dirac,
ovvero il funzionale definito da: δt0 (x) = x(t0 ). Esso rappresenta la generalizzazione continua della delta di Kronecker δik (vedi l’esempio 8). E’ lineare e
limitato. Vale infatti ||δt0 || = |x(t0 )| ≤ ||x||, e poichè per x costante vale il segno
di uguale, si ha ||δt0 || = 1.
Esempio 20. Consideriamo ancora C[−a,a] ma questa volta con la norma
dell’integrale come nell’esempio 4, e il funzionale δ0 . Questo funzionale è lineare
ma non è limitato. Sia data infatti la successione di funzioni gaussiane:
r
2 2
n
xn (t) = √ e−n x /2 .
π
Per queste vale
R∞
−∞
|xn (t)|2 dt = 1, ed è trascurabile l’integrale per |t| > a se
94
na 1. Pertanto ||xn || → 1 per n → ∞. Ma δ0 (xn ) =
q
√n
π
e quindi non
esiste nessuna costante K tale che |δ0 (xn )| ≤ K||xn || per tutti gli elementi della
successione {xn }.
Questo controesempio non si applica all’esempio 19 in quanto con la norma del
q
max si avrebbe ||xn || = √nπ che non rimane affatto limitata per n → ∞.
Esempio 21. Consideriamo lo spazio lp delle successioni x ≡ (ξi ) di numeri
P∞
complessi tali che i=1 |ξi |p < ∞ con p > 1 (vedi l’esempio 2). Mostriamo che il
più generale funzionale lineare e limitato su lp è generato dagli elementi y di lq con
q > 1 e 1/p + 1/q = 1 e ha norma ||Fy || = ||y||q . Quindi, lp∗ e lq sono congruenti
(vedi la definizione 3).
Dato infatti y = (ηi ) ∈ lq , il funzionale Fy (x) =
P∞
i=1
ηi∗ ξi è lineare e risulta
definito per ogni x ∈ lp grazie alla diseguaglianza di Schwarz-Hölder:
∞
X
|ξi ηi | ≤
i=1
∞
X
p 1/p
|ξi |
i=1
∞
X
|ηi |q
1/q
.
i=1
Si ha inoltre |Fy (x)| ≤ ||x||p ||y||q e pertanto Fy è un funzionale lineare limitato
con ||F || ≤ ||y||q . Esiste però un x ∈ lp per il quale vale il segno di uguale. Infatti,
sia x di componenti ξi = ηi |ηi |q/p−1 . Poichè |ξi |p = |ηi |q , allora x ∈ lp . Inoltre:
F (x) =
∞
X
i=1
ηi∗ ξi =
∞
X
i=1
|ηi |q/p+1 =
∞
X
|ηi |q =
i=1
∞
X
|ηi |q
∞
1/p X
i=1
|ηi |q
1/q
.
i=1
Abbiamo qui sfruttato il fatto che q/p+1 = q e 1/p+1/q = 1. Nella diseguaglianza
di Schwarz-Hölder vale quindi l’uguale e dunque ||F || = ||y||q .
Viceversa, mostriamo che ogni funzionale lineare limitato definito su lp è della
P∞ ∗
forma Fy (x) =
i=1 ηi ξi con y = (ηi ) ∈ lq e ||F || = ||y||q essendo q definito
come prima. Possiamo ripetere qui il procedimento applicato al caso finito dimensionale dell’esempio 15, introducendo la base usuale ei = (δik ), tramite la quale
il funzionale F , lineare limitato, può essere definito in tutto lo spazio. Infatti,
P∞
P∞ ∗
dati F (ei ) = ηi∗ si ottiene F (x) = F ( i=1 ξi ei ) =
i=1 ηi ξi , convergente per
l’ipotesi di limitatezza del funzionale. Consideriamo ora i vettori xn = (ξn;i ) con
le componenti definite da: ξn;i = ηi |ηi |q/p−1 per i = 1, 2, .., n e ξn;i = 0 per i > n.
95
Allora: ||xn ||p =
P
|F (xn )| =
n
i=1
n
X
q
|ηi |
1/p
, da cui segue che
n
X
1/p
|ηi |q ≤ ||F || ||xn ||p = ||F ||
,
|ηi |q
i=1
i=1
e quindi, per ogni n:
n
X
|ηi |q
1/q
≤ ||F ||.
i=1
Essendo per ipotesi F limitato, esiste il limite della sommatoria di sinistra e pertanto y = (ηi ) ∈ lq . E in tal caso abbiamo visto prima essere ||F || = ||y||q .
Esempio 22. Con riferimento all’esempio precedente, mostriamo che il più
generale funzionale lineare limitato definito su l1 è definito da elementi di y ∈ l∞ ,
cioè da successioni (ηi ) limitate con ||y||∞ = supi |ηi | (vedi l’esempio 3.6). Anche
in questo caso: ||Fy || = ||y||∞ , e quindi l1∗ e l∞ sono congruenti.
P∞ ∗
Sia dato inizialmente y = (ηi ) ∈ l∞ . Allora Fy (x) =
i=1 ηi ξi definisce un
funzionale lineare limitato su tutti gli x ∈ l1 , con ||Fy || ≤ ||y||∞ . Infatti
P∞
|Fy (x)| ≤ supi |ηi | i=1 |ξi | = ||y||∞ ||x||1 .
Viceversa, sia definito il funzionale lineare limitato F ∈ l1∗ da F (ei ) = ηi∗ , ovvero
P∞
F (x) = i=1 ηi∗ ξi . Mostriamo che la successione ηi deve essere limitata. A tal
scopo, scegliamo i vettori xn definiti dalle componenti ξin = ηi /|ηi | per i = n e
ξin = 0 per i 6= n. Vale ||xn ||1 = 1 e F (xn ) = |ηn |, e poichè deve valere anche
|F (xn )| = |ηn | ≤ ||F ||||xn ||1 = ||F ||, segue che (ηi ) è una successione limitata
e definisce un vettore y ∈ l∞ con ||y||∞ ≤ ||F ||. Dal confronto con la relazione
precedente, segue che ||F || = ||y||∞ .
Osservazione 21. Si può dimostrare che non vale il reciproco dell’esempio
∗
22, ovvero l∞
non è congruente a l1 . Lo spazio l1 è congruente allo spazio coniugato
delle successioni (ξi ) convergenti a zero e con ||x|| = supi |ξi |. (Vedi A.E.Taylor,
paragrafo 4.32).
96
6.1 TEOREMI DI HAHN-BANACH
Analogamente a quanto visto nel teorema 2 sugli operatori, un funzionale
lineare limitato definito densamente in uno spazio normato può essere esteso a
tutto lo spazio mantenendo la propria norma. La possibilità di estensioni più
generali, ad esempio da sottospazi propri mantenendo determinate caratteristiche
quali continuità o altro, dipende dai dettagli del problema. Nel caso di funzionali
lineari limitati le condizioni sono stabilite dal seguente teorema di Hahn-Banach,
che ha vaste applicazioni in tutta la teoria degli spazi coniugati di spazi lineari
topologici.
Teorema 8. Sia dato uno spazio normato complesso N e un funzionale lineare
limitato F0 ∈ N0∗ definito cioè nel sottospazio N0 . Allora esiste un prolungamento
lineare limitato F definito su tutto N , con norma invariata, ovvero: F (x) = F0 (x)
per x ∈ N0
e ||F || = ||F0 ||.
Ritroveremo il teorema 8 e la sua dimostrazione alla fine del paragrafo, mentre
ora ne anticipiamo alcune semplici conseguenze, relative alle proprietà separanti
dei funzionali, cioè alla capacità di distinguere tra diversi elementi di uno spazio
N.
Teorema 9. Se N è uno spazio lineare normato e x0 ∈ N con x0 6= 0, allora
esiste un funzionale F ∈ N ∗ tale che ||F || = 1 e F (x0 ) = ||x0 ||. Da cui segue
anche che sup||F ||=1 |F (x)| = ||x||, per ogni x ∈ N .
Dimostrazione. Sia N0 il sottospazio di N generato da x0 . Posto x = α x0 ,
definiamo F0 (x) = α ||x0 ||. Chiaramente, F0 è un funzionale lineare limitato in
N0 , cioè F0 ∈ N0∗ , e vale ||F0 || = 1. Per il teorema 8 esiste allora l’estensione F a
tutto N , con le caratteristiche richieste.
Teorema 10. Sia x ∈ N normato tale che F (x) = 0 per ogni F ∈ N ∗ . Allora
x = 0.
Dimostrazione. Dal teorema precedente, in particolare dalla proprietà
sup||F ||=1 |F (x)| = ||x|| ∀x ∈ N , segue l’asserto.
Teorema 11. Siano N e N0 uno spazio normato e un suo sottospazio proprio.
97
Sia x
e ∈ N − N0 a un distanza positiva h da N0 . Allora esiste F ∈ N ∗ con ||F || = 1
tale che F (e
x) = h e F (x) = 0 per ogni x ∈ N0 .
e il sottospazio generato da x
e
Dimostrazione. Sia N
e e da N0 , cioè ogni y ∈ N
è dato da y = α x
e + x con α e x ∈ N0 univocamente determinati da y essendo
e ∗ e ||Fe|| = 1. Infatti,
x
e 6∈ N0 . Definiamo Fe(y) = α h e mostriamo che Fe ∈ N
se α 6= 0 abbiamo che ||y|| = ||α x
e + x|| = || − α(−α−1 x − x
e)|| ≥ α h, poichè
−α−1 x ∈ N0 e x
e dista h da N0 . Pertanto |Fe(y)| = |α|h ≤ ||y||. Diseguaglianza
che vale ovviamente anche per α = 0. Quindi Fe, lineare, è limitato con ||Fe|| ≤ 1.
Ma, dato > 0 esiste x ∈ N0 tale che ||x − x
e|| < h + . Posto allora
x−x
e
y=
,
||x − x
e||
e , ||y|| = 1,
si ha che y ∈ N
|Fe(y)| =
h
h
>
||x − x
e||
h+
e ||Fe|| >
h
.
h+
Poichè h 6= 0 e ciò è vero per ogni > 0, si conclude che ||Fe|| ≥ 1. Dalla
maggiorazione opposta vista precedentemente, segue che ||Fe|| = 1. Grazie al
teorema 8, Fe può essere esteso a tutto N . Poichè Fe(e
x) = h e Fe(x) = 0 per ogni
x ∈ N0 la dimostrazione del teorema è completa.
Torniamo ora alla dimostrazione del teorema di Hahn-Banach, per la quale è
necessario anteporre le più generale versioni in spazi lineari sui reali e sui complessi.
Preliminarmente consideriamo uno spazio lineare reale, cioè sul corpo dei reali e
introduciamo nuove classi di funzionali, più generali di quelli lineari.
Definizione 12. Sia R uno spazio lineare reale. Un funzionale reale p definito
in R si dice convesso se p(α x+(1−α)y) ≤ αp(x)+(1−α)p(y), per tutti gli x, y ∈ R
e 0 ≤ α ≤ 1.
Ricordando la definizione 2.28 di insieme convesso, segue che un funzionale
convesso trasforma insiemi convessi in insiemi convessi.
Definizione 13. Un funzionale reale p is dice omogeneo positivo se, per ogni
x ∈ R e per ogni α > 0, p(α x) = αp(x).
98
Osservazione 22. Riportiamo alcune proprietà dei funzionali omogenei positivi convessi.
a) Vale la relazione p(x + y) ≤ p(x) + p(y). Infatti
y
x
p(x + y) = 2p( x+y
2 ) ≤ 2 p( 2 ) + p( 2 ) = p(x) + p(y).
b) Dalla definizione di omogeneità ponendo x = 0, segue che p(0) = 0.
c) Dalla b) e dalla a) si ottiene che 0 = p x + (−x) ≤ p(x) + p(−x), per tutti
gli x ∈ R. In particolare, se p(x) < 0 allora p(−x) > 0 e pertanto un funzionale
omogeneo positivo convesso non nullo non può essere ovunque negativo.
d) Per ogni α, vale p(α x) ≥ αp(x). Per α > 0 questo segue dalla omogeneità. Per
α = 0 segue dalla b). Per α < 0, dalla c) segue che:
0 ≤ p(α x) + p(|α|x) = p(α x) + |α|p(x), e quindi p(α x) ≥ −|α|p(x) = αp(x).
Esempio 23. Ogni funzionale lineare è ovviamente omogeneo positivo convesso. Data la funzione lineare f (x), il funzionale pf (x) = |f (x)| non è lineare,
ma è omogeneo positivo convesso. La norma ||x|| in uno spazio lineare reale non
è lineare ma definisce un funzionale positivo convesso.
Definizione 14. Sia R uno spazio lineare reale e sia R0 un suo sottospazio.
Sia inoltre F0 un funzionale lineare definito in R0 . Il funzionale lineare F è detto
prolungamento del funzionale F0 se è definito in tutto R e se F (x) = F0 (x) per
tutti gli x ∈ R0 .
Siamo ora in grado di dimostrare il teorema di Hahn-Banach in spazi reali.
Teorema 8’. Siano dati lo spazio lineare reale R, un suo sottospazio proprio
R0 , il funzionale F0 lineare in R0 e il funzionale p omogeneo positivo convesso in
R. Se F0 è maggiorato da p, ovvero F0 (x) ≤ p(x) per ogni x ∈ R0 , allora esiste
un prolungamento lineare F di F0 definito in tutto R e maggiorato da p.
Dimostrazione. Cominciamo a dimostrare che è possibile prolungare il funzionale F0 da R0 a uno spazio un poco più grande.
e il sottospazio generato da ye e da R0 . Se z ∈ R,
e
Sia ye ∈ R ma ye 6∈ R0 , e sia R
esso è della forma z = α ye + x con x ∈ R0 . Mostriamo che è possibile prolungare
e mediante le definizioni: Fe(e
il funzionale F0 a un funzionale lineare Fe in R
y) = c e
99
Fe(α ye+x) = α c+F0 (x) con una scelta del numero c tale che valga la maggiorazione
e Vogliamo cioè che, per ogni x ∈ R0 e ogni α reale,
Fe(z) ≤ p(z) per ogni z ∈ R.
sia verificata la diseguaglianza α c + F0 (x) ≤ p(α ye + x), che può essere separata
nelle due seguenti:
c ≤ p(e
y + x/α) − F0 (x/α)
c ≥ −p(−e
y − x/α) − F0 (x/α)
per α > 0,
per α < 0.
Mostriamo quindi che è possibile scegliere un valore c per il quale sono soddisfatte
entrambe. Infatti, dati due elementi qualsiasi x0 , x00 ∈ R0 vale
F0 (x00 ) − F0 (x0 ) ≤ p(x00 − x0 ) = P (x00 + ye) − (x0 + ye) ≤ p(x00 + ye) + p(−x0 − ye).
Da cui si ricava:
−F0 (x0 ) − p(−x0 − ye) ≤ −F0 (x00 ) + p(x00 + ye).
Possiamo pertanto scegliere c in modo tale che sia
00
00
sup −F0 (x0 ) − p(−x0 − ye) ≤ c ≤ inf
−F
(x
)
+
p(x
+
y
e
)
.
0
00
x
x0
Allora c soddisfa le due precedenti diseguaglianze e quindi il funzionale
e
Fe(α ye + x) ≡ α c + F0 (x) soddisfa la diseguaglianza Fe(z) ≤ p(z) per ogni z ∈ R.
e ⊃ R0
Dunque, abbiamo prolungato il funzionale lineare F0 da R0 allo spazio R
e
mantenendo la maggiorazione Fe(z) ≤ p(z) per ogni z ∈ R.
Se lo spazio complementare di R0 è finito dimensionale possiamo procedere iterativamente. Indicata con {xn } una base in questo spazio, consideriamo la successione crescente di sottospazi R(k+1) = {R(k) , xk+1 }, ove {R(k) , xk+1 } indica il
sottospazio lineare minimale di R contenente R(k) e xk+1 , e R(0) = R0 . Con un
numero finito di passi si esaurisce il procedimento e dunque il funzionale F0 può
essere definito su ogni elemento di R.
Per spazi generali, si può ugualmente terminare la dimostrazione facendo ricorso al
Lemma di Zorn grazie al quale si può dimostrare l’esistenza di un elemento massimale nell’insieme di tutti i prolungamenti possibili del funzionale F0 soddisfacenti
la condizione F (x) ≤ p(x). Per questa parte della dimostrazione e per il Lemma
di Zorn, rimandiamo ad esempio a A.N.Kolmogorov e S.V.Fomin.
Il teorema è cosı̀ completato.
100
Diamo ora la versione complessa del teorema di Hahn-Banach. A tal scopo
premettiamo l’importante concetto di seminorma che verrà ripreso più estesamente
nel prossimo capitolo.
Definizione 15. Un funzionale reale p definito in uno spazio lineare complesso C si definisce seminorma, se soddisfa alle seguenti proprietà :
I) p(α x) = |α|p(x),
per ogni α reale o complesso,
II) p(x + y) ≤ p(x) + p(y).
Da I) segue che p(0) = 0. Da ciò e da II) segue che 0 = p(x − x) ≤ 2p(x) e quindi
che p(x) ≥ 0. Da II) infine si ricava anche facilmente che |p(x) − p(y)| ≤ p(x − y).
Se da p(x) = 0 segue che x = 0, allora il funzionale p definisce una norma.
Teorema 8”. Siano dati lo spazio lineare complesso C, un suo sottospazio
proprio C0 , la seminorma p in C, e F0 lineare in C0 . Se F0 è maggiorato da p,
ovvero |F0 (x)| ≤ p(x) per ogni x ∈ C0 , allora esiste un prolungamento lineare F
di F0 definito in tutto C e maggiorato da p.
Dimostrazione. Dato un qualsiasi funzionale lineare complesso G, scomponendo il numero complesso G(x) in parte reale e parte immaginaria, possiamo
scrivere G = GR + iGI , entrambi funzionali reali.
Dalla linearità di G dal-
tronde segue che G(ix) = iG(x) = iGR (x) − GI (x), per cui GR (x) = GI (ix) e
G(x) = GR (x) − iGR (ix). Quindi, in sostanza, per estendere F0 è sufficiente
estendere la sua parte reale. A tal scopo, definiamo C R e C0R gli insiemi di tutti
gli elementi di C e di C0 strutturati però sui soli numeri reali. La seminorma p è
def
ovviamente un funzionale omogeneo positivo convesso in C R , e F0R (x) = Re F0 (x)
è un funzionale lineare reale in C0R soddisfacente la condizione |F0R (x)| ≤ p(x);
quindi anche F0R (x) ≤ p(x) per tutti gli x ∈ C0R . Grazie al teorema 8’, esiste il
prolungamento lineare reale F R con:
F R (x) ≤ p(x) per tutti gli x ∈ C R ≡ C
F R (x) = F0R (x) per tutti gli x ∈ C0R ≡ C0 .
Poichè inoltre −F R (x) = F R (−x) ≤ p(−x) = p(x), la maggiorazione vale per il
modulo, ovvero: |F R (x)| ≤ p(x) per tutti gli x ∈ C R ≡ C.
101
def
Introduciamo ora il funzionale F (x) = F R (x)−iF R (ix), definito in tutto C(≡ C R )
ed ovviamente lineare complesso con: F (x) = F0 (x) per ogni x ∈ C0 .
Il funzionale F è perciò un’estensione di F0 e, per completare il teorema, dobbiamo
dimostrare ancora che F è maggiorato da p cioè che vale |F (x)| ≤ p(x) per tutti
gli x ∈ C. Per assurdo, sia |F (x̄)| ≥ p(x̄) per un certo x̄ ∈ C. Posto F (x̄) = ρeiφ e
ȳ = e−iφ x̄, abbiamo
F R (ȳ) = Re F (ȳ) = Re [e−iφ F (x̄)] = ρ = |F (x̄)| ≥ p(x̄) = p(ȳ).
Ciò contraddice la precedente diseguaglianza su F R , e il teorema è dimostrato.
Siamo cosı̀ in grado di dimostrare il teorema di Hahn-Banach in spazi normati,
già enunciato all’inizio del paragrafo.
Teorema di Hahn-Banach. Sia dato uno spazio normato complesso N
e un funzionale lineare limitato F0 definito nel sottospazio N0 . Allora esiste un
prolungamento lineare limitato F definito su tutto N , con norma invariata, ovvero:
F (x) = F0 (x)
per x ∈ N0
e ||F || = ||F0 ||.
Dimostrazione. Posto ||F0 || = supx∈N0 |F0 (x)| = K, consideriamo il funzionale K|| ∗ ||, seminorma definita in tutto lo spazio complesso N ; vale inoltre
|F0 (x)| ≤ K||x|| per tutti gli x ∈ N0 . Si può allora applicare il teorema 8” identificando la seminorma p con il funzionale K|| ∗ ||. Si conclude allora che esiste il
prolungamento F a tutto N0 tale da mantenere la maggiorazione F (x) ≤ K||x||
per tutti gli x ∈ N . Essendo K la norma di F nel sottospazio N0 , per qualche x
vale il segno di uguale e pertanto ||F || = ||F0 ||. CVD.
102
7. OPERATORI CHIUSI
In questo paragrafo verranno introdotte due classi di operatori tra spazi normati, più generali di quelli lineari limitati trattati in precedenza, introdurremo
cioè gli operatori chiusi e gli operatori compatti o completamente continui. I secondi sono definiti esclusivamente tra spazi normati, mentre i primi trovano un
loro analogo nelle funzioni chiuse in spazi topologici.
Peraltro, in questi spazi molto generali, anche il concetto di operatore limitato
ha analogie con quello di funzione continua. In questi peraltro, non vengono
ovviamente definiti gli operatori limitati, ma esiste per le funzioni il concetto di
continuità già affrontato nel paragrafo 2.3. Tratteremo quindi i nuovi operatori
anche in ambito strettamente topologico, e lo faremo qui per studiarli unitamente
ai casi metrici e normati. Pertanto, riprendiamo alcuni concetti topologici.
In questo capitolo sugli spazi normati abbiamo trattato diffusamente il caso
degli operatori e dei funzionali limitati, e della relazione esistente tra questi e
gli operatori continui nel caso di operatori lineari; avevamo infatti dimostrato
nel teorema 1 che un operatore lineare è limitato se e solo se è continuo in x =
0, ricordando che un operatore tra spazi normati è continuo per definizione se
trasforma successioni convergenti in successioni convergenti.
Osservazione 23. Precedentemente, nel capitolo 2 sulle topologie avevamo
anche trattato diversi argomenti relativi alle funzioni continue, caratterizzate dal
trasformare gli aperti, e solo questi, in aperti (teorema 2.5), oppure dal trasformare
insiemi compatti in insiemi compatti (teorema 2.9). Daltra parte, per operatori
lineari tra spazi normati la prima proprietà è equivalente a richiederere che per
ogni > 0 esista un δ > 0 tale che se ||x0 − x00 || < δ per x0 , x00 ∈ DA allora
||Ax0 − Ax00 || < . E quindi un operatore continuo trasforma limitati in limitati.
Questa proprietà e quella relativa agli insiemi compatti comporta anche quella che
è stata assunta come definizione di operatore continuo tra spazi normati. Ovvero:
un operatore lineare continuo o limitato tra spazi normati trasforma successioni
convergenti in successioni convergenti.
103
Possiamo infine enunciare l’importante teorema della applicazione aperta, rimandando la dimostrazione a, per esempio, K.Yoshida.
Teorema 12. Un operatore lineare continuo da uno spazio di Banach B a
uno spazio di Banach B 0 trasforma insiemi aperti in insiemi aperti.
Vogliamo ora introdurre funzioni e operatori più generali, ma pure dotati di
alcune proprietà che in qualche modo compensano le caratteristiche legate alla
continuità che abbiamo sopra richiamato. In alcuni casi saranno concetti puramente topologici, che trattiamo solo ora per poterne discutere unitamente ai casi
legati agli spazi metrici e agli spazi normati.
Definizione 16. Siano X e Y due spazi topologici e sia X ⊗ Y il prodotto
Cartesiano o prodotto diretto dei due spazi, ovvero l’insieme di tutte le coppie
ordinate (x, y) con x ∈ X e y ∈ Y . Se gli spazi X e Y sono topologici, la topologia
usuale su X ⊗ Y è definita dagli insiemi S ⊗ T con gli insiemi S ⊂ X e T ⊂ Y
aperti nelle rispettive topologie. Cioè , Nello spazio prodotto diretto gli aperti
sono costituiti dall’insieme delle coppie ordinate (x, y) per tutti gli x dell’aperto
S e tutti gli y dell’aperto T .
Definizione 17. Siano X e Y due spazi topologici e sia f una funzione con
dominio Df ⊂ X e codominio Rf ⊂ Y . L’insieme {(x, f (x)) : x ∈ Df } è contenuto
nello spazio prodotto diretto X ⊗ Y ed è detto il grafo di f e si indica con G(A).
Se tale grafo è un insieme chiuso nella topologia usuale della definizione 16, allora
f è detta funzione chiusa.
Osservazione 24. Se X e Y sono spazi metrici, il prodotto diretto può essere
metrizzato in diversi modi: posto p1 = (x1 , y1 ) e p2 = (x2 , y2 ) con x1 , x2 ∈ X e
y1 , y2 ∈ Y possiamo definire d = dx + dy oppure d = sup(dx , dy ) oppure ancora
d = (d2x + d2y )1/2 , con d = d(p1 , p2 ), dx = dx (x1 , x2 ) e dy = dy (y1 , y2 ). Tutte e tre
danno origine alla stessa topologia, uguale peraltro a quella della definizione 16.
Osservazione 25. Dalla osservazione precedente e dalla osservazione 2.12,
segue che una funzione f , con dominio Df ⊂ X e codominio Rf ⊂ Y entrambi
metrici, è una funzione chiusa se e solo se la coppia (Df , Rf ) contiene tutti i punti
104
limiti di successioni convergenti, ovvero se e solo se la situazione xn Df , xn → x e
f (xn ) → y comporta x ∈ Df , y ∈ Rf e y = Ax.
Osservazione 26. Per riassumere la situazione nel caso di operatori lineari
in spazi normati, dalle osservazioni 25 e 23 segue che un operatore continuo, o
limitato, trasforma successioni convergenti in successioni convergenti, mentre un
operatore chiuso assicura che se la trasformata di una successione convergente è
convergente, allora il suo limite appartiene al dominio dell’operatore ed è uguale
al trasformato del limite.
Definizione 18. Un operatore lineare A tra due spazi topologici X e Y
è detto chiudibile, se la chiusura in X ⊗ Y del suo grafo G(A) è il grafo di un
operatore lineare B con DB ⊂ X.
Teorema 13. Se X e Y sono spazi normati, un operatore lineare A è chiudibile se e solo se per ogni successione {xn } ⊂ DA convergente a zero e con Axn → y
si ha y = 0.
Dimostrazione. Se A è chiudibile, la chiusura in X ⊗ Y del grafo G(A) è
il grafo di un operatore lineare e pertanto y = B 0̇ = 0. Viceversa, ammessa la
condizione sufficiente, definiamo l’operatore lineare B nel modo seguente: x ∈ DB
se e solo se esiste una successione {xn } ⊂ DA tale che xn → x ed esiste il limite
y = limn→∞ Axn ; per la condizione sufficiente, il limite è unico e possiamo quindi
porre Bx = y. Ovviamente, Bx = Ax per ogni x ∈ DA . Mostriamo che l’operatore
B è chiuso. Data la successione {wn } ⊂ DB con wn → w e Bwn → z, per
(n)
definizione di B esiste per ogni n una successione xi
wn e
(n)
limi→∞ Axi
(n)
∈ DA tale che limi→∞ xi
=
= Bwn , cosicchè esiste un elemento, diciamo xn , tale che
||wn −xn || < 1/n e ||Bwn −Axn || < 1/n; ma allora, limn→∞ xn = limn→∞ wn = w,
limn→∞ Axn = limn→∞ Bwn = z e cosı̀ z ∈ DB e Bw = z. Dunque, B è chiuso.
Consideriamo il seguente operatore, non continuo ma chiuso.
Esempio 24. Come negli esempi 3 e 1.20, consideriamo l’operatore derivata
A = d/dt definito nello spazio X = C[0,1] con la norma del max. E’ un operatore
0
lineare con dominio DA = C[0,1]
delle funzioni continue con derivata continua. Se
105
xn = tn con la usuale norma del max si ha ||xn || = 1 ma ||Axn || = n||tn−1 || = n per
cui sup||x||=1 ||Axn || = ∞, cioè l’operatore A trasforma un insieme limitato in un
insieme illimitato e quindi non è un operatore continuo. Tuttavia è chiuso. Infatti,
se xn → x con xn ∈ DA allora la funzione x è il limite uniforme di funzioni continue
con derivata continua, e quindi è essa stessa continua con derivata continua, cioè
x ∈ DA , x0 ∈ Ra e vale Axn = x0n → x0 .
Introduciamo una interessante proprietà dell’inverso di un operatore chiuso.
Teorema 14. Dato un operatore A lineare chiuso tra spazi topologici, se
esiste l’inverso A−1 , questo è un operatore lineare chiuso.
Dimostrazione. Se A−1 esiste, il suo grafo è dato dall’insieme {(Ax, x) : x ∈
DA }, nello spazio prodotto diretto Y ⊗ X. E’ chiaro daltra parte che T ⊗ S è
chiuso in Y ⊗ X ogni qual volta S ⊗ T è chiuso in X ⊗ Y . Quindi, se A è chiuso,
anche A−1 è chiuso (se esiste).
E infine a riguardo degli operatori chiusi dimostriamo l’importante teorema
detto del grafo chiuso.
Teorema 15. Un operatore lineare chiuso da uno spazio di Banach B a uno
spazio di Banach B 0 , è un operatore continuo.
Dimostrazione. Lo spazio B ⊗ B 0 è uno spazio di Banach e il grafo G(A)
dell’operatore lineare chiuso A è un suo sottoinsieme chiuso, e quindi completo.
Pertanto G(A) è uno spazio di Banach. L’operatore B da tutto G(A) in B definito
da B(x, Ax) = x è un operatore lineare continuo e uno a uno, ovvero invertibile.
Allora, grazie al teorema 12 della applicazione lineare aperta, l’inverso B −1 è un
operatore continuo. Similmente, anche l’operatore C da G(A) su R(A) definito da
C(x, Ax) = Ax è continuo. Dunque, B = CA−1 è continuo da B in B 0 .
106
8. OPERATORI COMPATTI
Negli spazi infinito dimensionali, spesso non è neppure sufficiente la caratteristica di limitatezza per una esauriente descrizione degli operatori lineari. Ciò che
per certi versi maggiormente avvicina questi agli operatori lineari negli spazi finito
dimensionali viene introdotto con la seguente definizione.
Definizione 19 Sia A un operatore lineare tra i due spazi normati N e N 0 . A
si dice compatto o completamente continuo se per ogni successione limitata {xn }
in N dalla successione trasformata {Axn } è possibile estrarre una sottosuccessione
convergente a qualche limite in N 0 . L’operatore compatto trasforma cosı̀ insiemi
limitati in insiemi precompatti, tali cioè che la loro chiusura è compatta.
Osservazione 27. Un operatore compatto è limitato. Se cosı̀ non fosse esisterebbe una successione {xn } con ||xn || ≤ 1 tale che ||Axn || → ∞ contrariamente
all’ipotesi di compattezza.
Per mostrare che il viceversa non è vero premettiamo il seguente lemma.
Lemma. Siano x1 , x2 , ... vettori linearmente indipendenti in uno spazio normato N , e sia Nn il sottospazio generato dai primi n xi . Esiste allora una successione di vettori {yn } ∈ Nn con norma ||yn || = 1 e δ(yn , Nn−1 ) > 1/2, essendo
δ(x, S) la distanza del punto x dall’insieme S, ovvero
δ(yn , Nn−1 ) =
inf
x∈Nn−1
||yn − x||.
Dimostrazione. Essendo tutti i vettori xi linearmente indipendenti, xn 6∈
Nn−1 e δ(xn , Nn−1 ) = α > 0. Sia ξ ∈ Nn−1 tale che ||xn − ξ|| < 2α. Allora,
poichè α = δ(xn , Nn−1 ) = δ(xn − ξ, Nn−1 ), il vettore yn = (xn − ξ)/||xn − ξ||
soddisfa le condizioni del lemma.
Esempio 25. Dal lemma precedente segue facilmente che l’operatore identità
, benchè evidentemente limitato, non è un operatore compatto. Infatti, possiamo
selezionare una successione {yn } di vettori unitari tali che ||yn − yn−1 || > 1/2. Da
questi evidentemente non è possibile estrarre una sottosuccessione convergente.
Esempio 26. In uno spazio finito dimensionale ogni operatore lineare è
compatto. Infatti, esso è limitato e trasforma quindi insiemi limitati in insiemi
limitati. Ma un insieme limitato in uno spazio finito dimensionale è precompatto.
107
Esempio 27. Sia l’operatore A lineare limitato da uno spazio di Banach
B in un suo sottospazio a dimensione finita. Esso è compatto perche trasforma
ogni sottoinsieme limitato di B in un sottoinsieme limitato di uno spazio finito
dimensionale, cioè in un insieme precompatto.
Esempio 28. Dato x = (ξn ) ∈ l2 sia Ax = (1/2n ξn ). Questo operatore
è compatto. Gli insiemi limitati sono contenuti nelle sfere e poichè l’operatore è
lineare possiamo vedere in che cosa viene trasformata la sfera unitaria.
Diamo ora dimostrazione di tre importanti proprietà degli operatori compatti.
Teorema 16. Sia {An } una successione di operatori compatti in uno spazio
di Banach B convergente a un operatore A. Allora A è compatto.
Dimostrazione. E’ sufficiente dimostrare che data una successione limitata
{xi } ∈ B, dalla successione {Axi } è possibile estrarre una sottosuccessione convergente. Questo è sicuramente possibile, per l’ipotesi di compattezza, nel caso
(1)
(1)
degli operatori An . Sia dunque {xi } la sottosuccessione di {xi } tale che A1 xi
(1)
(2)
sia convergente per i → ∞. Da {xi } estraiamo la successione {xi } tale che
(2)
sia convergente A2 xi
(n−1)
tosuccessione di {xi
(n)
per i → ∞, e cosı̀ via. Indichiamo cioè con {xi } la sot(n)
} tale che An xi
sia convergente per i → ∞. Se ora
(i)
estraiamo da tutte queste la successione diagonale {xi }, è chiaro che la trasfor(i)
mata {An xi } è convergente per i → ∞ e per ogni n. Se mostriamo che anche
(i)
Axi
è convergente, abbiamo mostrato la compattezza di A; poichè per ipotesi
(i)
B è completo, è sufficiente dimostrare che Axi
è una successione fondamentale.
Allora:
(i)
(j)
(i)
(i)
(i)
(j)
(j)
(j)
||Axi − Axj || ≤ ||Axi − An xi || + ||An xi − An xj || + ||An xj − Axj ||.
Supponiamo ||xi || ≤ C e, fissato > 0, scegliamo un N tale che per n > N e per
(i)
(j)
i, j > N siano ||A − An || < /(3C) e ||An xi − An xj || < , cosa sempre possibile
(i)
essendo An → A e {An xi } convergente e dunque fondamentale. Da tutto ciò
(i)
(j)
segue che ||Axi − Axj || < . Dunque A è compatto. CVD.
Teorema 17. In uno spazio normato N , se A è compatto e B è limitato,
allora AB e BA sono compatti.
108
Dimostrazione. Se S ⊂ N è limitato, anche B(S) è limitato e quindi AB(S) è
precompatto. Viceversa, se S ⊂ N è limitato allora A(S) è precompatto e BA(S)
è anche precompatto per la continuità di B (vedi il teorema 2.9).
Corollario. In uno spazio normato N a dimensione infinita, un operatore
compatto non può avere inverso limitato. Se cosı̀ non fosse, l’unità I = AA1
sarebbe un operatore compatto, contrariamente a quanto visto nell’esempio 25.
Il successivo teorema è di fondamentale importanza nello studio dei problemi
agli autovalori.
Teorema 18. Dato un operatore compatto A su uno spazio di Banach B e
un numero arbitrario ρ > 0, esiste solo un numero finito di autovettori linearmente
indipendenti con autovalori maggiori in modulo di ρ.
Dimostrazione. Dato l’operatore compatto A in uno spazio di Banach B
(ovviamente infinito dimensionale), supponiamo per assurdo che esista una successione {αi } di suoi autovalori, distinti o ripetuti, tutti con o |αi | > ρ, e a cui
corrisponda una successione di autovettori {xi } tutti linearmente indipendenti.
Diciamo Bn lo spazio di Banach generato dai primi n autovettori x1 , x2 , ..., xn .
Grazie al Lemma che precede l’esempio 25, possiamo costruire una successione
{yn } ⊂ Bn con ||yn || = 1 e δ(yn , Bn−1 = inf x∈Bn−1 ||yn − x|| > 1/2. Poichè
|αi | > ρ per ogni i, la successione {yn /αn } è limitata e, se dimostreremo che dalla
successione dei trasformati {Ayn /αn } non è possibile estrarre una sottosuccessione
Pn
convergente, avremo dimostrato il teorema. Ora, se yn = k=1 ck xk , allora
n−1
yn X ck αk
A
=
xk + cn xn = yn + zn ,
αn
αn
k=1
con
zn =
n−1
X
k=1
ck
αk
− 1 xk ∈ Bn−1 .
αn
Da ciò segue che per ogni m, l con l < m:
y l ym A
−A
= ||yl + zl − (ym + zm )|| =
αl
αm
= ||yl − (ym + zm − zl )|| > 1/2,
109
dato che ym + zm − zl ∈ Bl−1 . Quindi non è possibile estrarre una sottosuccessione
convergente, contrariamente all’ipotesi di compattezza dell’operatore A.
Corollario. Dal teorema 18 segue immediatamente che gli autovettori linearmente indipendenti corrispondenti a un autovalore α 6= 0 di un operatore compatto
sono in numero finito. E anche che gli autovalori αn di un operatore compatto con
αn > ρ > 0 sono in numero finito.
110