Analisi Matematica
Paolo Maurizio Soardi
Indice
Prefazione
xi
1 Numeri reali
1.1 Introduzione . . . . . . . . . . . . . . . . . . . . . .
1.2 Rappresentazione decimale dei numeri razionali . .
1.3 Numeri reali e ordinamento . . . . . . . . . . . . .
1.4 Partizioni di Q e di R . . . . . . . . . . . . . . . .
1.5 Operazioni tra numeri reali . . . . . . . . . . . . .
1.6 Una diseguaglianza fondamentale . . . . . . . . . .
1.7 Radici, potenze, logaritmi . . . . . . . . . . . . . .
1.8 Spazi euclidei . . . . . . . . . . . . . . . . . . . . .
1.9 Appendice . . . . . . . . . . . . . . . . . . . . . . .
1.9.1 Proprietà degli estremi superiore e inferiore
1.9.2 Proprietà delle operazioni in R . . . . . . .
1.9.3 Radici e potenze . . . . . . . . . . . . . . .
1.9.4 Logaritmi . . . . . . . . . . . . . . . . . . .
2 Funzioni
2.1 Introduzione . . . . . . . . . . . . . . . .
2.2 Immagini e controimmagini . . . . . . .
2.3 Restrizione, funzione inversa, composta.
2.4 Successioni. Indici . . . . . . . . . . . .
2.5 Potenza di un insieme . . . . . . . . . .
2.6 Potenza del numerabile . . . . . . . . .
2.7 Potenza del continuo . . . . . . . . . . .
2.8 Appendice . . . . . . . . . . . . . . . . .
2.8.1 Le funzioni come sottoinsiemi del
2.8.2 Proprietà degli insiemi infiniti . .
2.8.3 Potenza dell’insieme delle parti .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
1
3
10
11
14
14
16
20
20
21
26
27
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
prodotto cartesiano
. . . . . . . . . . . .
. . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
29
29
29
32
35
37
38
40
42
42
42
44
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3 Spazi Metrici
47
3.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.2 Definizione ed esempi . . . . . . . . . . . . . . . . . . . . . . . . 47
3.3 Intorni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
v
vi
Indice
3.4
3.5
3.6
3.7
3.8
3.9
3.10
Classificazione dei punti . . . . . . .
Insiemi aperti, chiusi, limitati . . . .
Compattezza . . . . . . . . . . . . .
Il Teorema di Heine–Borel . . . . . .
Connessione . . . . . . . . . . . . . .
R come spazio metrico . . . . . . . .
Appendice . . . . . . . . . . . . . . .
3.10.1 Compattezza in Rn . . . . . .
3.10.2 Norme e distanze . . . . . . .
3.10.3 Proprietà dello spazio metrico
.
.
.
.
.
.
.
.
.¡
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . .¢ .
R, d∗
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
54
58
64
69
69
71
73
73
76
77
4 Successioni
4.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Successioni convergenti . . . . . . . . . . . . . . . . . .
4.3 Sottosuccessioni e punti di accumulazione . . . . . . .
4.4 Successioni a valori reali . . . . . . . . . . . . . . . . .
4.5 Permanenza del segno. Confronto . . . . . . . . . . . .
4.6 Successioni monotone . . . . . . . . . . . . . . . . . .
4.7 Calcolo dei limiti . . . . . . . . . . . . . . . . . . . . .
4.7.1 Calcolo dei limiti in R . . . . . . . . . . . . . .
4.7.2 Calcolo dei limiti in R . . . . . . . . . . . . . .
4.8 Il numero e . . . . . . . . . . . . . . . . . . . . . . . .
4.9 Infiniti e infinitesimi . . . . . . . . . . . . . . . . . . .
4.10 o piccolo e asintotico . . . . . . . . . . . . . . . . . . .
4.11 Successioni in Rk . . . . . . . . . . . . . . . . . . . . .
4.12 Classe limite . . . . . . . . . . . . . . . . . . . . . . .
4.13 La condizione di Cauchy . . . . . . . . . . . . . . . . .
4.14 Appendice . . . . . . . . . . . . . . . . . . . . . . . . .
4.14.1 Dimostrazione del Teorema 4.7.2 . . . . . . . .
4.14.2 Dimostrazione dei Teoremi 4.7.4 e 4.7.6 . . . .
4.14.3 Dimostrazione del Teorema 4.7.8 . . . . . . . .
4.14.4 Dimostrazione dei Teoremi 4.7.9, 4.7.10, 4.7.12,
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
4.7.13
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
79
79
80
83
85
87
90
91
92
92
98
103
107
109
111
114
116
116
118
118
118
5 Serie
5.1 Introduzione . . . . . . . . . . . . . . . .
5.2 Definizioni ed esempi . . . . . . . . . . .
5.3 La condizione di Cauchy per le serie . .
5.4 Serie a termini non negativi . . . . . . .
5.5 Criteri della radice e del rapporto . . . .
5.6 Criterio di condensazione . . . . . . . .
5.7 Criterio di Leibniz . . . . . . . . . . . .
5.8 Convergenza incondizionata . . . . . . .
5.9 Appendice . . . . . . . . . . . . . . . . .
5.9.1 Somma di serie . . . . . . . . . .
5.9.2 Prodotto di serie . . . . . . . . .
5.9.3 Proprietà associativa per le serie
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
121
121
121
124
127
129
131
134
135
137
137
138
140
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Indice
vii
5.9.4
5.9.5
Permutazione dei termini di una serie . . . . . . . . . . . 141
Rappresentazione dei numeri reali come serie . . . . . . . 143
6 Limiti di funzioni
6.1 Introduzione . . . . . . . . . . . . . . . .
6.2 Limiti in spazi metrici . . . . . . . . . .
6.3 Limiti infiniti e limiti all’infinito . . . .
6.4 Limiti di funzioni reali di variabile reale
6.5 Segno, confronto. . . . . . . . . . . . . .
6.6 Limiti di successioni e limiti di funzioni
6.7 Calcolo dei limiti . . . . . . . . . . . . .
6.8 Infiniti, infinitesimi, o piccolo, asintotico
6.9 Appendice . . . . . . . . . . . . . . . . .
6.9.1 Classe limite di una funzione . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
145
145
146
150
156
160
163
165
167
171
171
7 Continuità
7.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.2 Continuità in spazi metrici . . . . . . . . . . . . . . . . . . . . .
7.3 Continuità globale . . . . . . . . . . . . . . . . . . . . . . . . .
7.4 Continuità delle funzioni a valori reali . . . . . . . . . . . . . .
7.5 Il Teorema di Weierstrass . . . . . . . . . . . . . . . . . . . . .
7.6 Il Teorema di Darboux . . . . . . . . . . . . . . . . . . . . . . .
7.7 Uniforme continuità . . . . . . . . . . . . . . . . . . . . . . . .
7.8 Punti di discontinuità . . . . . . . . . . . . . . . . . . . . . . .
7.8.1 Discontinuità di prima specie . . . . . . . . . . . . . . .
7.8.2 Discontinuità di seconda specie . . . . . . . . . . . . . .
7.8.3 Discontinuità eliminabili . . . . . . . . . . . . . . . . . .
7.9 Funzioni monotone . . . . . . . . . . . . . . . . . . . . . . . . .
7.10 Continuità della funzione inversa . . . . . . . . . . . . . . . . .
7.11 Appendice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.11.1 Continuità della funzione inversa in spazi metrici . . . .
7.11.2 Uniforme continuità. Funzioni lipschitziane e hölderiane.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
175
175
175
177
178
183
184
186
188
188
189
190
192
196
197
197
198
8 Calcolo differenziale
8.1 Introduzione . . . . . . . . . . . . . . . . . . .
8.2 Derivata e differenziale . . . . . . . . . . . . .
8.3 Tangente verticale, punti angolosi, cuspidi . .
8.4 Regole di derivazione . . . . . . . . . . . . . .
8.5 Derivate delle funzioni elementari . . . . . . .
8.5.1 Potenze e radici . . . . . . . . . . . . .
8.5.2 Esponenziali e funzioni iperboliche . .
8.5.3 Logaritmi . . . . . . . . . . . . . . . .
8.5.4 Funzioni trigonometriche . . . . . . .
8.5.5 Inverse delle funzioni trigonometriche
8.5.6 Derivate di funzioni composte . . . . .
8.6 Massimi e minimi relativi . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
201
201
202
205
208
211
211
213
214
214
215
216
218
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
viii
8.7
8.8
8.9
8.10
8.11
8.12
8.13
8.14
8.15
Indice
Teoremi di Rolle, Cauchy, Lagrange
Crescere e decrescere . . . . . . . . .
Teorema di De l’Hospital . . . . . .
Derivate di ordine superiore . . . . .
Formula di Taylor . . . . . . . . . .
Esempi sulla formula di Taylor . . .
Convessità, concavità, flessi. . . . . .
Asintoti obliqui . . . . . . . . . . . .
Appendice . . . . . . . . . . . . . . .
8.15.1 Dimostrazione del Teorema di
8.15.2 Convessità . . . . . . . . . . .
8.15.3 Estremanti e punti di flesso .
8.15.4 Serie di Taylor . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
222
226
229
231
234
238
242
249
251
251
253
255
256
9 Primitive
9.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . .
9.2 Regole di integrazione indefinita . . . . . . . . . . . . .
9.3 Primitive delle funzioni razionali fratte . . . . . . . . . .
9.3.1 Caso in cui il grado del denominatore è 1 o 2 . .
9.3.2 Casi fondamentali . . . . . . . . . . . . . . . . .
9.3.3 Caso generale . . . . . . . . . . . . . . . . . . . .
9.4 Primitive di funzioni razionali fratte in un argomento . .
9.5 Primitive di funzioni razionali fratte in più argomenti .
9.5.1 Primitive di R(cos t, sin t) . . . . . . . . . . . . .
9.5.2 Primitive di R(cos2 t, sin2 t, tan t) . . . . . . . . .
q√
q√
1
9.5.3 Primitive di R (x,
xp1 , . . . , n xpn ) . . . . . .´ .
³
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
259
259
260
265
266
268
269
271
272
273
273
274
´p
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
l’Hospital
. . . . . .
. . . . . .
. . . . . .
q`
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
´p
n
1
. . . , qn ax+b
Primitive di R x, q1 ax+b
cx+d
cx+d
¡ p
¢
9.5.5 Primitive di R x, ±x2 + px + q . . . . . . . .
Integrali binomi . . . . . . . . . . . . . . . . . . . . . . .
Appendice . . . . . . . . . . . . . . . . . . . . . . . . . .
9.7.1 Decomposizione di una funzione razionale fratta
9.5.4
9.6
9.7
q`
. .
. .
. .
. .
. .
. .
. .
. .
. .
De
. .
. .
. .
10 Integrale di Riemann
10.1 Introduzione . . . . . . . . . . . . . . . . . . .
10.2 Somme superiori e inferiori . . . . . . . . . .
10.3 L’integrale di Riemann . . . . . . . . . . . . .
10.4 Proprietà dell’integrale . . . . . . . . . . . . .
10.5 Classi di funzioni integrabili . . . . . . . . . .
10.6 Integrale esteso a un intervallo orientato . . .
10.7 Il Teorema fondamentale del calcolo integrale
10.8 Integrali impropri . . . . . . . . . . . . . . . .
10.8.1 Integrali impropri di prima specie . . .
10.8.2 Integrali impropri di seconda specie .
10.8.3 Criteri del confronto . . . . . . . . . .
10.8.4 Integrali impropri di terza specie . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. . . . . 274
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
276
279
280
280
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
283
283
283
286
288
293
296
298
302
302
305
306
309
Indice
10.9 Appendice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.9.1 Estensione del Teorema fondamentale del calcolo integrale
10.9.2 Formula di Taylor con resto integrale . . . . . . . . . . . .
10.9.3 Confronto e esistenza degli integrali impropri . . . . . . .
10.9.4 Formula di Wallis . . . . . . . . . . . . . . . . . . . . . . .
10.9.5 Somme e integrali. Formula di Eulero . . . . . . . . . . .
10.9.6 Formula di Stirling . . . . . . . . . . . . . . . . . . . . . .
ix
313
313
314
315
317
319
320
Prefazione
Questo libro è destinato agli studenti del primo anno dei corsi di laurea in
Matematica e in Fisica ed è basato sull’esperienza da me maturata in molti
anni di insegnamento. Può anche essere utilizzato da studenti di altri corsi
di laurea di carattere scientifico, che vogliano approfondire la loro conoscenza
dell’Analisi matematica.
Vengono esposti in modo rigoroso gli argomenti che fanno parte tradizionalmente dei corsi di Analisi matematica I: numeri reali, successioni e serie,
limiti, continuità, calcolo differenziale in una variabile e calcolo integrale secondo
Riemann in una variabile. Le nozioni di limite e continuità sono ambientate negli
spazi metrici, di cui viene presentata una trattazione elementare ma precisa.
I concetti astratti sono ogni volta interpretati e discussi nel caso di funzioni
reali di variabile reale. In questo modo lo studente dovrebbe acquisire sia una
padronanza degli strumenti classici, che una impostazione unitaria in vista dei
successivi sviluppi dell’Analisi in dimensione superiore.
Tutti i risultati enunciati nel libro (tranne due) vengono dimostrati, o nel
corso dell’esposizione, o nelle appendici dei vari capitoli. Tuttavia, questo testo
non vuole essere un’opera puramente teorica. Ho trattato in modo dettagliato
argomenti che spesso sono demandati alle esercitazioni: il calcolo dei limiti per
funzioni a valori reali o vettoriali, il calcolo delle derivate, i metodi più comuni
di integrazione. Tutti gli argomenti esposti sono corredati da numerosi esempi
e figure.
Desidero ringraziare la dottoressa Margherita Mauri, che ha letto tutto il manoscritto e mi ha dato preziosi consigli. Ringrazio anche i miei studenti, che mi
hanno segnalato refusi di varia natura in una precedente versione sperimentale
di questo testo.
xi
Capitolo 1
Numeri reali
1.1
Introduzione
I numeri reali nascono con la scoperta dell’esistenza di grandezze incommensurabili, quali le lunghezze del lato e della diagonale di un quadrato. I numeri interi
e i loro rapporti non sono quindi in grado di descrivere fondamentali relazioni
della geometria. Malgrado ciò, lo studio dei numeri reali cominciò ad imporsi
solo dopo la scoperta del calcolo infinitesimale, dovuta a Newton e Leibniz. Tra
le molte costruzioni equivalenti del campo reale, adotteremo quella forse per noi
più intuitiva, cioè la costruzione dei numeri reali mediante allineamenti decimali
infiniti.
1.2
Rappresentazione decimale dei numeri razionali
Come è noto, ogni numero razionale si può rappresentare come allineamento
decimale periodico, nel modo che ora descriveremo rapidamente. Indichiamo
con Q l’insieme dei numeri razionali, dotato delle consuete operazioni di somma
e prodotto e della relazione naturale di diseguaglianza. Sia r = p/q ∈ Q un
numero razionale positivo, con p > 0, q > 0 interi. Si ha, mediante divisioni
successive,
p
p0
= c0 +
q
q
ove 0 ≤ p0 < q e c0 è un intero non negativo,
p0
c1
p1
=
+
q
10 10q
ove 0 ≤ p1 < q e c1 è un intero tra 0 e 9,
c2
p2
p1
=
+
q
10 10q
ove 0 ≤ p2 < q e c2 è un intero tra 0 e 9.
Si ottiene quindi
r = c0 +
c1
c2
p2
+
+ 2 .
10 102
10 q
1
2
1. Numeri reali
In tal modo abbiamo ottenuto le prime tre cifre dell’allineamento decimale di r.
Eseguendo poi le divisioni p2 /q, p3 /q, . . . , pn−1 /q, . . ., si ottengono tutte le cifre
successive. Al passo n si ha
r = c0 +
c1
c2
c3
cn
pn
+ 2 + 3 + ··· + n + n .
10 10
10
10
10 q
(1.2.1)
L’allineamento, o rappresentazione decimale, di r è dunque dato da
r = c0 , c1 c2 c3 . . . cn . . .
(1.2.2)
Si può esprimere il numero r anche mediante la scrittura, per ora puramente
formale,
c2
c1
c3
cn
r = c0 +
+ 2 + 3 + ··· + n + ···
10 10
10
10
Questa scrittura sarà precisata nel capitolo sulle serie numeriche.
Poiché i resti possibili p1 , p2 , p3 . . . sono compresi tra 0 e q − 1, dopo al più
q passi nella divisione si ripresenta uno dei resti precedenti. Da qui segue la
periodicità dell’allineamento. Ad esempio,
1
= 0, 3,
3
7
= 0, 1590.
44
Se il periodo è 0, cioé r = c0 , c1 c2 . . . cn 000 . . ., si scrive semplicemente
r = c0 , c1 c2 . . . cn .
In tal caso l’allineamento decimale si dice finito, altrimenti si dice infinito.
L’algoritmo di divisione descritto sopra non produce mai allineamenti decimali con periodo 9. Dimostriamo questa asserzione per i numeri periodici puri,
cioé privi di antiperiodo. Si noti che questa non è una restrizione, poiché, se r
ha un antiperiodo di k cifre, allora 10k r è periodico puro.
Supponiamo per assurdo r = c0 , 9. Poiché 0 ≤ pn < q, dalla (1.2.1) si deduce
che per ogni n
c0 +
9
9
9
9
9
9
1
+
+ · · · + n ≤ r < c0 +
+
+ ··· + n + n.
10 102
10
10 102
10
10
Poiché 9/10 + 9/102 + · · · + 9/10n + 1/10n = 1, le diseguaglianze precedenti
diventano
1
∀n
1 − n < r − c0 < 1,
10
o anche
1
∀n
0 < c0 + 1 − r < n ,
10
il che è assurdo.
L’impossibilità di ottenere allineamenti con periodo 9 dipende dall’algoritmo
da noi prescelto. Altri algoritmi danno luogo ad allineamenti con periodo 9, ma
escludono il periodo 0, cioè gli allineamenti finiti. Ad esempio: 1 = 0, 9.
1.3. Numeri reali e ordinamento
3
D 0 ora innanzi escluderemo dalle nostre considerazioni gli allineamenti decimali con periodo 9. Il termine ‘allineamento decimale’ avrà il significato di
allineamento in cui non compare il periodo 9.
Un allineamento decimale periodico è sempre la rappresentazione decimale
di un numero razionale. Per vedere ciò possiamo, come prima, supporre che
l’allineamento sia periodico puro, cioé del tipo c0 , c1 c2 . . . cs . Il numero
µ
¶
³c
c2
cs ´
10s
1
+
+ ··· + s
(1.2.3)
r = c0 +
10 102
10
10s − 1
è il numero cercato. Infatti, la rappresentazione decimale di 10s /(10s − 1) è
10s
1
1
1
= 1 + s + 2s + · · · + ks + · · ·
10s − 1
10
10
10
Sostituendo questa espressione in (1.2.3) si ha l’asserto. Quindi esiste una corrispondenza biunivoca tra i numeri razionali positivi e gli allineamenti decimali
che non hanno periodo 9.
Benché le operazioni di somma e prodotto tra allineamenti periodici siano
generalmente complicate, la rappresentazione decimale permette di decidere facilmente quale tra due dati numeri razionali sia il maggiore. Infatti, sia r 6= r0 ,
e supponiamo che sia k il primo indice per cui ck 6= c0k . Risulta ck > c0k se e solo
se r > r0 .
Il concetto di rappresentazione decimale si estende ai numeri razionali negativi, semplicemente anteponendo il segno − all’allineamento. In altri termini, se
il numero r ha la rappresentazione (1.2.2), diciamo che il numero −r ha la rappresentazione −r = −c0 c1 c2 c3 . . . cn . . .. L’allineamento 0, 000 . . . rappresenta
il numero 0.
1.3
Numeri reali e ordinamento
Gli allineamenti decimali periodici non costituiscono la totalità dei possibili
allineamenti. Ad esempio, l’allineamento
1, 1 0 1 0 0 1 0 0 0 1 0 0 0 0 1 . . .
(1.3.1)
in cui ogni 1 è seguito da uno 0 in più del precedente 1, è chiaramente non
periodico. D’altra parte, gli allineamenti non periodici si presentano in modo
naturale quando si cerca di risolvere equazioni del tipo x2 = 2, prive di soluzioni
nel campo razionale.
2
Teorema 1.3.2 Non esiste alcun numero razionale p/q tale che (p/q) = 2.
Dimostrazione. Supponiamo per assurdo che esistano due interi positivi p e q
tali che p2 = 2q 2 . Eseguendo le semplificazioni, possiamo supporre che p e q non
abbiano fattori comuni. Poiché p2 è pari, anche p deve essere pari. Esiste quindi
4
1. Numeri reali
un intero positivo m tale che p = 2m. Ne segue 2m2 = q 2 . Perciò anche q 2 e q
sono pari. Questo contraddice l’ipotesi che p e q non abbiano fattori comuni.
√
Quindi 2 non è razionale. Il noto algoritmo per il calcolo della radice
quadrata fornisce successivamente i valori approssimati:
1 1, 4
1, 41 1, 414
1, 4142 1, 41421 . . .
√
Questo procedimento conduce a esprimere 2 mediante un allineamento decimale, necessariamente non periodico:
√
2 = 1, 414213562 . . .
Definizione 1.3.3 Definiamo numero reale un allineamento decimale con segno, ±c0 , c1 c2 . . . cn . . .. Se l’allineamento è periodico il numero è razionale. Se
l’allineamento non è periodico il numero si dice irrazionale.
Ricordiamo che sono esclusi gli allineamenti periodici con periodo 9. In
questo capitolo indicheremo generalmente un numero reale con una lettera greca:
ad esempio α = a0 , a1 a2 . . . an . . . In questa scrittura il numero a0 è un intero
maggiore o eguale a 0 chiamato parte intera. I numeri dopo la virgola sono
interi tra 0 e 9, chiamati cifre decimali.
Sia α 6= 0. Se l’allineamento è preceduto dal segno + diremo che α è positivo, mentre se è preceduto dal segno − diremo che α è negativo. Denoteremo
l’insieme dei numeri reali con R, l’insieme dei reali positivi con R+ , l’insieme
dei reali negativi con R− . Si noti che, per definizione, Q ⊂ R. I simboli Q+ e
Q− indicheranno rispettivamente i numeri razionali positivi e quelli negativi.
Il valore assoluto |α| di un numero reale α è definito nel modo seguente: se
α è positivo o nullo si pone |α| = α. Se invece α è negativo, si pone |α| = −α.
Introduciamo ora l’ordinamento in R.
Definizione 1.3.4 Siano α = a0 , a1 a2 . . . an . . . e β = b0 , b1 b2 . . . bn . . . due
numeri reali non negativi diversi tra loro. Siano an e bn le prime cifre diverse,
ovvero sia
a0 = b0 , a1 = b1 , . . . , an−1 = bn−1 , an 6= bn .
Poniamo
α<β
se an < bn .
Se α e β sono negativi e diversi tra loro, poniamo α < β se |β| < |α|. Infine,
se α è negativo e β è positivo o nullo, poniamo α < β.
Evidentemente questa definizione estende da Q a R la relazione d’ordine per
i numeri razionali. L’insieme dei reali risulta cosı̀ totalmente ordinato, nel senso
precisato dalla seguente Teorema.
Teorema 1.3.5 L’ordinamento su R ha le seguenti proprietà:
1. ∀α, β ∈ R vale una e una sola delle seguenti relazioni
α = β, oppure α < β, oppure β < α.
1.3. Numeri reali e ordinamento
5
2. ∀α, β, γ ∈ R
se α < β e β < γ
allora α < γ.
Dimostrazione. La prima proprietà è ovvia dalla definizione. Per dimostrare
la seconda possiamo limitarci al caso in cui α, β, γ siano positivi, poiché gli altri
casi seguono immediatamente da questo. Sia dunque α = a0 , a1 a2 . . . an . . .
β = b0 , b1 b2 . . . bn . . . γ = c0 , c1 c2 . . . cn . . . . Sia n il primo indice per cui
an 6= bn e m il primo indice per cui bm 6= cm . Se n < m si ha
a0 = b0 = c0 ,
a1 = b1 = c1 , . . . . . . , an−1 = bn−1 = cn−1 ,
an < bn = cn
da cui α < γ. Se invece m ≤ n si ha
a0 = b0 = c0 ,
a1 = b1 = c1 , . . . . . . , am−1 = bm−1 = cm−1 ,
am ≤ bm < cm
da cui nuovamente α < γ.
Come usuale, la scrittura α > β equivale a β < α e la scrittura α ≤ β
significa che non è β < α.
Siano α e β numeri reali, α < β. Definiamo gli intervalli di estremi α e β
ponendo:
[α, β] = {x ∈ R :
(α, β) = {x ∈ R :
(α, β] = {x ∈ R :
[α, β) = {x ∈ R :
α ≤ x ≤ β}
α < x < β}
α < x ≤ β}
α ≤ x < β}
intervallo
intervallo
intervallo
intervallo
chiuso.
aperto.
(1.3.6)
semiaperto a sinistra.
semiaperto a destra.
Si hanno altresı̀ gli intervalli illimitati di estremo α:
[α, +∞) = {x ∈ R : α ≤ x} , (α, +∞) = {x ∈ R : α < x} .
(−∞, α] = {x ∈ R : x ≤ α} , (−∞, α) = {x ∈ R : x < α} .
(1.3.7)
(1.3.8)
Anche questi intervalli si diranno chiusi o aperti, a seconda che l’estremo α
appartenga o meno all’insieme. I simboli ±∞ che appaiono nelle definizioni
precedenti sono puramente formali.
Teorema 1.3.9 (di densità) Tra due numeri reali esistono infiniti numeri razionali e infiniti numeri irrazionali.
Dimostrazione. Siano α = a0 , a1 a2 . . . an . . . e β = b0 , b1 b2 . . . bn . . . due
qualsiasi numeri positivi, con α < β. Basterà dimostrare che tra α e β esistono
un razionale r e un irrazionale i, poiché il procedimento può essere ripetuto
negli intervalli (α, r) e (α, i).
Sia dunque n il primo indice per cui an < bn . Esiste un indice k > n tale
che ak < 9. Definiamo
r = a0 , a1 . . . an an+1 . . . ak−1 9
6
1. Numeri reali
Chiaramente α < r. Si ha anche r < β, poiché a0 = b0 , a1 = b1 , . . . , an−1 =
bn−1 , e an < bn .
Si ponga ora
i = a0 , a1 . . . an an+1 . . . ak−1 9101001000100001 . . .
Le cifre dopo la k-esima sono definite con la stessa legge che in (1.3.1): ogni 1 è
seguito da uno 0 in più del precedente 1. Quindi i è irrazionale e, come prima,
α < i < β.
Se α e β hanno segno qualsiasi, la costruzione precedente si adatta immediatamente.
La proprietà enunciata nel Teorema si esprime dicendo che sia l’insieme dei
numeri razionali, che l’insieme dei numeri irrazionali, è denso in R.
Definizione 1.3.10 Un sottoinsieme non vuoto A ⊆ R si dice limitato superiormente se esiste β ∈ R tale che
∀α ∈ A
α ≤ β.
Un tale β si dice maggiorante di A. Analogamente, un sottoinsieme non vuoto
A ⊆ R si dice limitato inferiormente se esiste γ ∈ R tale che
∀α ∈ A
γ ≤ α.
Un tale γ si dice minorante di A. Infine, A si dice limitato se è limitato sia
superiormente che inferiormente.
Esempi 1.3.11
1. L’insieme degli interi negativi è limitato superiormente, ma non inferiormente. In questo caso l’insieme dei maggioranti è l’intervallo [−1, +∞).
Cosı̀ pure, l’insieme degli interi positivi è limitato inferiormente ma non
superiormente.
2. Gli intervalli definiti in (1.3.6) sono limitati. Per tutti questi intervalli l’insieme dei maggioranti è [β, +∞), mentre l’insieme dei minoranti è
(−∞, α].
3. Gli intervalli in (1.3.7) sono illimitati superiormente, ma limitati inferiormente. Gli intervalli in (1.3.8) sono illimitati inferiormente, ma limitati
superiormente. L’insieme dei minoranti per i due intervalli in (1.3.7) è
(−∞, α], mentre l’insieme dei maggioranti per i due intervalli in (1.3.8) è
[α, +∞).
Definizione 1.3.12 Un numero reale M si dice massimo di un sottoinsieme
A ⊆ R se M ∈ A e α ≤ M per ogni α ∈ A. Un numero reale m si dice minimo
di un sottoinsieme A ⊆ R se m ∈ A e m ≤ α per ogni α ∈ A.
1.3. Numeri reali e ordinamento
7
Il massimo e il minimo di un insieme, se esistono, sono necessariamente unici.
Chiaramente, il massimo di A è un maggiorante, e il minimo è un minorante.
Tuttavia, un insieme limitato superiormente non ha necessariamente massimo,
e un insieme limitato inferiormente non ha necessariamente minimo.
Esempi 1.3.13
1. Un intervallo chiuso e limitato [α, β] ha come minimo α e come massimo
β. L’intervallo aperto (α, β) non ha né massimo né minimo. L’intervallo
[α, +∞) ha come minimo α, mentre (α, +∞) non ha minimo.
2. L’insieme limitato {1, 1/2, 1/3, . . . , 1/n, . . .} ha come massimo 1, ma non
ha minimo (si noti che 0 non appartiene all’insieme).
3. L’insieme
A = {r ∈ Q+ : r2 < 2}
(1.3.14)
è non vuoto (1 ∈ A) ed è limitato superiormente (3 è un maggiorante).
L’insieme A non ha massimo. Infatti, per ogni r ∈ A, poniamo:
s=r+
r+1
2 − r2
=2
.
2+r
r+2
(1.3.15)
Un semplice calcolo mostra che s2 < 2 e perciò s ∈ A. D’altra parte,
r < s, e quindi r non può essere il massimo di A. Analogamente
B = {r ∈ Q+ : r2 > 2}
(1.3.16)
è limitato inferiormente ma non ha minimo. In questo caso infatti, il
numero s definito in (1.3.15) soddisfa s2 > 2, e quindi appartiene a B, ma
s < r.
Il massimo e il minimo di un insieme A vengono indicati rispettivamente con i
simboli
max A,
min A.
L’insieme ordinato dei numeri reali è completo, nel senso precisato dal seguente
teorema.
Teorema 1.3.17 (di completezza) Se A è un insieme limitato superiormente, l’insieme dei maggioranti di A ha minimo. Se A è un insieme limitato
inferiormente, l’insieme dei minoranti di A ha massimo.
Dimostrazione. Ci limitiamo a dimostrare la prima affermazione, poiché la
seconda si dimostra in modo del tutto analogo.
Sia A limitato superiormente e denotiamo con B l’insieme dei maggioranti
di A. Supponiamo dapprima che nessun elemento di B sia negativo. In tal
caso l’insieme delle parti intere degli elementi di B ha minimo non negativo.
Denotiamo con c0 questo minimo e poniamo
B0 = {β ∈ B : la parte intera di β è c0 } .
8
1. Numeri reali
Poiché vi sono solo 10 scelte possibili per ogni cifra decimale, l’insieme delle
prime cifre decimali degli elementi di B0 ha minimo: sia esso c1 . Poniamo
B1 = {β ∈ B0 : la prima cifra decimale di β è c1 } .
Analogamente, detto c2 il minimo delle seconde cifre decimali degli elementi di
B1 , poniamo
B2 = {β ∈ B1 : la seconda cifra decimale di β è c2 } .
In questo modo definiamo per ricorrenza l’insieme Bk : detto ck minimo delle
cifre decimali di Bk−1 , poniamo
Bk = {β ∈ Bk−1 : la k-esima cifra decimale di β è ck } .
Ovviamente, per ogni k si ha Bk 6= ∅, e Bk−1 ⊇ Bk . Ogni elemento di β ∈ Bk
ha la forma
β = c0 , c1 c2 . . . ck bk+1 bk+2 . . .
(1.3.18)
Poniamo
γ = c0 , c1 c2 . . . ck . . .
(1.3.19)
L’allineamento in (1.3.19) non ha periodo 9. Infatti, ck è il minimo delle k-esime
cifre decimali di Bk−1 . Se ck = 9 tutti gli elementi di Bk hanno k-esima cifra
decimale 9. Quindi Bk−1 = Bk . Se da un certo k in poi tutti i ck fossero 9, si
avrebbe Bk−1 = Bk = Bk+1 = · · · . Allora tutti gli elementi di Bk−1 avrebbero
periodo 9, il che è assurdo, poiché abbiamo escluso tali periodi dalla definizione
di numero reale.
Se, per assurdo, γ non è un maggiorante di A, esiste α = a0 , a1 a2 . . . an . . .
in A tale che α > γ. Detto k il primo indice per cui ak 6= ck , deve essere ak > ck
e quindi, per (1.3.18), risulta anche α > β per ogni β ∈ Bk , assurdo. Quindi γ
è un maggiorante. Dimostriamo che è il minimo dei maggioranti.
Dato un qualsiasi β = b0 , b1 b2 . . . bn . . . ∈ B, o esso appartiene a tutti i
Bk , e in tal caso deve coincidere con γ, oppure esiste un primo Bk a cui non
appartiene. Quindi cn = bn per n < k, e ck < bk . In ogni caso γ ≤ β.
Se B contiene dei numeri negativi, allora A ⊂ R− . Si ragiona su A come
si è fatto su B nel caso precedente. Per ottenere il numero γ bisogna anche in
questo caso scegliere ogni volta il minimo delle cifre decimali
Definizione 1.3.20 Se è A limitato superiormente, definiamo estremo superiore di A il minimo dei maggioranti di A. Se è A limitato inferiormente,
definiamo estremo inferiore di A il massimo dei minoranti di A. Per l’estremo
superiore e inferiore si usano le notazioni
sup A,
inf A.
Se A non è limitato superiormente, si pone convenzionalmente
sup A = +∞.
Se A non è limitato inferiormente, si pone convenzionalmente
inf A = −∞.
1.3. Numeri reali e ordinamento
9
Se A ammette massimo M , allora sup A = M . Tuttavia, come abbiamo visto, un insieme limitato superiormente può non avere massimo, mentre l’estremo
superiore esiste sempre. Analoga cosiderazione vale per il minimo.
Si noti che l’estremo superiore è unico, poiché il minimo di un insieme (in
questo caso i maggioranti) è unico. Analogamente, l’estremo inferiore è unico.
Esempi 1.3.21
1. Sia A l’intervallo aperto (α, β). Si ha inf A = α e sup A = β, ma essi non
sono minimo e massimo. Se A = [α, β), allora α = inf A = min A. Si ha
ancora sup A = β, ma β non è massimo.
2. Sia A = {1, 1/2, 1/3, . . . , 1/n, . . .}. In questo caso si ha 1 = max A =
sup A. Il numero 0 non è minimo, perché non appartiene ad A. Si ha però
0 = inf A.
3. Sia A = Q+ . L’insieme non è limitato superiormente, per cui sup A = +∞.
Invece è limitato inferiormente e 0 = inf A.
4. Sia
½
A=
1 2 3
n−1
, , ,...,
,...
2 3 4
n
¾
In questo caso sup A = 1, ma tale valore non è massimo. Invece inf A =
min A = 1/2.
Osservazione. Sia L l’estremo superiore di un insieme A limitato superiormente. L è caratterizzato dalle due seguenti proprietà:
1. ∀α ∈ A
α ≤ L.
2. ∀β < L ∃α ∈ A
β < α ≤ L.
La proprietà 1 esprime il fatto che L è un maggiorante di A. La 2 esprime
il fatto che L è il minimo dei maggioranti.
Per l’estremo inferiore ` di un insieme A limitato inferiormente si ha analogamente
1. ∀α ∈ A
α ≥ `.
2. ∀β > ` ∃α ∈ A
β > α ≥ `.
Un’altra notazione comunemente usata per gli estremi superiore e inferiore
di A è
sup x,
inf x.
x∈A
x∈A
Se A = {xi }i∈I è un insieme di numeri dipendenti da un indice i, di qualunque
natura, si usa anche la notazione
sup xi ,
i
inf xi .
i
10
1. Numeri reali
I simboli +∞ e −∞, introdotti nella definizione di estremo superiore e inferiore,
sono di uso comune in Analisi Matematica. Aggiungendo all’insieme ordinato
dei numeri reali questi simboli, si ottiene un insieme a cui è possibile estendere
in modo naturale l’ordinamento definito in R.
Definizione 1.3.22 Poniamo
R = R ∪ {−∞, +∞}.
Per ogni α reale poniamo
−∞ < α < +∞.
(1.3.23)
L’insieme R viene chiamato R esteso.
È immediato verificare che R, con la relazione < definita in (1.3.23), risulta
un insieme totalmente ordinato, ossia valgono in R le proprietà 1 e 2 del Teorema
1.3.5. I concetti di maggiorante, minorante etc. si estendono in modo ovvio a
R.
1.4
Partizioni di Q e di R
L’insieme ordinato dei numeri razionali non è completo. Infatti, sia
A = {r ∈ Q+ : r2 < 2} ∪ Q− ∪ {0},
B = {r ∈ Q+ : r2 > 2}.
B costituisce l’insieme dei maggioranti razionali di A, e A costituisce l’insieme
dei minoranti razionali di B. Poiché B non ha minimo e A non ha massimo, in
Q non vale il Teorema di completezza.
I due insiemi A e B sono separati, cioè per ogni a ∈ A e per ogni b ∈ B si
ha a < b; inoltre, Q = A ∪ B. Si dice che due insiemi non vuoti che godono di
queste due proprietà costituiscono una partizione di Q.
Sia γ1 ∈ R l’estremo superiore di A, e γ2 ∈ R l’estremo inferiore di B. Si ha
necessariamente γ1 = γ2 , altrimenti, per il Teorema di densità, esisterebbe un
razionale s tale che γ1 < s < γ2 . Il numero s non può appartenere ad A, poiché
è maggiore di sup A, né a B, poiché è minore di inf B, assurdo.
Denotiamo con γ il comune valore di γ1 e γ2 . Si ha
∀a ∈ A ∀b ∈ B
a < γ < b.
(1.4.1)
Il numero irrazionale γ si chiama elemento separatore ed è unico.
Abbiamo cosı̀ costruito una partizione di Q mediante due insiemi, di cui il
primo non ha massimo e il secondo non ha minimo. Questo non può accadere
per una partizione di R.
Teorema 1.4.2 Siano A e B due insiemi non vuoti e separati di numeri reali
tali che A ∪ B = R. Allora esiste un unico numero reale γ tale che
∀α ∈ A ∀β ∈ B
α ≤ γ ≤ β.
Inoltre, o γ è il massimo di A, o γ è il minimo di B.
1.5. Operazioni tra numeri reali
11
Dimostrazione. L’insieme A è limitato superiormente, poiché ogni elemento
di B è un maggiorante di A, e B è limitato inferiormente, poiché ogni elemento
di A è minorante di B. Si ha sup A = inf B. Altrimenti, come nel ragionamento
precedente, un numero α tale che sup A < α < inf B non potrebbe appartenere
né ad A né a B, il che è assurdo. Posto γ = sup A = inf B, o γ ∈ A, nel qual
caso è anche massimo di A, oppure γ ∈ B, nel qual caso è anche minimo di B.
Intuitivamente, Q possiede dei ‘buchi’, che invece sono assenti nel campo
reale. I numeri irrazionali provvedono a completare le lacune di Q.
1.5
Operazioni tra numeri reali
Sia α = a0 , a1 a2 . . . an . . . un numero reale non negativo. Poniamo
α(n) = a0 , a1 a2 . . . an .
(n)
Il numero razionale
si chiama il troncamento o troncata n-esima di α. Se,
√ α
ad esempio, α = 2 = 1, 41421 . . ., i valori di α(n) sono successivamente 1, 1, 4,
1, 41, 1, 414,. . .
Lemma 1.5.1 Sia α ≥ 0. Per ogni n ≥ 0 valgono le diseguaglianze
α(n) ≤ α < α(n) + 10−n .
(1.5.2)
La successione dei numeri α(n) è non decrescente, cioè
α(0) ≤ α(1) ≤ α(2) ≤ . . . ≤ α(n) ≤ . . .
e la successione dei numeri α(n) + 10−n è non crescente, cioè
α(0) + 1 ≥ α(1) + 10−1 ≥ α(2) + 10−2 ≥ . . . ≥ α(n) + 10−n ≥ . . .
Si ha inoltre
³
´
sup α(n) = α = inf α(n) + 10−n .
n
n
(1.5.3)
Omettiamo la dimostrazione di questo Lemma, di per sé intuitivo, poiché
esso è un caso particolare del Lemma 1.9.4 dimostrato in Appendice. Basti
solo osservare che la non decrescenza di α(n) è ovvia e che la non crescenza di
α(n) + 10−n , si verifica immediatamente, poiché
´
³
α(n) + 10−n − α(n+1) + 10−n−1 = 10−n − (an+1 + 1) 10−n−1 ≥ 0,
Siano α = a0 , a1 a2 . . . an . . . e β = b0 , b1 b2 . . . bn . . . non negativi. Siano
α(n) e β (n) i troncamenti n-esimi di α e β. L’insieme delle somme α(n) + β (n) è
limitato superiormente, poiché α(n) + β (n) < (a0 + 1) + (b0 + 1).
12
1. Numeri reali
Definizione 1.5.4 Per ogni α ≥ 0 e β ≥ 0 poniamo:
α + β = sup(α(n) + β (n) ).
n
(1.5.5)
Poniamo inoltre
α + (−β) = sup(α(n) − β (n) − 1/10n ).
n
Infine, poniamo
(−α) + (−β) = sup(−α(n) − β (n) − 2/10n ).
n
L’eguaglianza (1.5.5) è una eguaglianza definitoria. Il simbolo + a sinistra
denota la somma di due numeri reali, che viene definita per mezzo della usuale
somma tra due numeri razionali che compare a destra.
Siano α e β non negativi. L’insieme dei prodotti α(n) β (n) è limitato superiormente, poiché α(n) β (n) ≤ (a0 + 1)(b0 + 1) per ogni n.
Definizione 1.5.6 Per ogni α ≥ 0 e β ≥ 0 poniamo
αβ = sup α(n) β (n) .
n
(1.5.7)
Se uno dei duei numeri è negativo, poniamo
αβ = − |α| |β| .
Se ambedue i numeri sono negativi poniamo
αβ = |α| |β| .
Come nel caso della somma, l’eguaglianza in (1.5.7) è definitoria. Il prodotto
di numeri reali a sinistra in (1.5.7) viene definito per mezzo del prodotto di
numeri razionali che compare a destra.
Definizione 1.5.8 Sia α > 0. Definiamo il reciproco di α come:
α−1 =
1
1
= sup (n)
α
+ 10−n
n α
Per i numeri negativi si pone
−1
(−α)
= −α−1
In generale, α(n) +β (n) non è la troncata n-esima di α+β. Basta considerare
l’esempio dei due numeri razionali α = 1, 91 e β = 0, 29. Questi numeri mostrano
anche che in generale α(n) β (n) non è la troncata n-esima di αβ.
L’operazione di somma in R gode delle seguenti proprietà:
1.5. Operazioni tra numeri reali
1. ∀α, β α + β = β + α
13
proprietà commutativa della somma.
2. ∀α, β, γ (α + β) + γ = α + (β + γ)
3. ∀α α + 0 = α
proprietà associativa della somma.
esistenza dell’elemento neutro.
4. ∀α α + (−α) = 0
esistenza dell’opposto.
Come di consueto, scriveremo x − y anziché x + (−y). Per il prodotto si ha:
5. ∀α, β αβ = βα
proprietà commutativa del prodotto.
6. ∀α, β, γ (αβ) γ = α (βγ)
7. ∀α α1 = α
proprietà associativa del prodotto.
esistenza dell’elemento neutro del prodotto.
8. ∀α 6= 0 αα−1 = 1
esistenza del reciproco.
Si ha inoltre
9. ∀α, β, γ (α + β) γ = αγ + βγ
proprietà distributiva.
L’ordinamento è legato alle operazioni di somma e prodotto dalle seguenti
proprietà
10. ∀α, β, γ
se α < β
allora α + γ < β + γ.
11. ∀α, β e ∀γ > 0 se α < β allora αγ < βγ.
Queste proprietà saranno dimostrate nell’Appendice.
Abbiamo già osservato che la relazione d’ordine in R estende quella in Q.
Ciò vale anche per le operazioni di somma e prodotto. Qualora i numeri α e
β che compaiono nelle precedenti definizioni siano razionali, la loro somma e
prodotto come numeri reali coincidono con le operazioni di somma e prodotto
definite tra numeri razionali. Dimostreremo questo fatto nell’Appendice.
Un insieme dotato di due operazioni interne, chiamate somma e prodotto,
che soddisfano le proprietà da 1 a 9, viene detto campo numerico. Se poi nell’insieme è definito un ordinamento totale per cui valgono 10 e 11, il campo si
dice ordinato. Quindi Q e R, dotati delle operazioni di somma e prodotto e
dell’ordinamento in essi definito, sono campi ordinati, chiamati rispettivamente
campo razionale e campo reale. Si dice anche che Q è un sottocampo ordinato
di R. Tuttavia, come abbiamo osservato in precedenza, il campo razionale non
è completo.
Il campo reale, al pari del campo razionale, è archimedeo, vale cioè la seguente
proprietà.
Teorema 1.5.9 Per ogni α e β positivi esiste un intero n > 0 tale che
nα > β.
Dimostrazione. La proprietà vale chiaramente per i numeri razionali. Siano
quindi r, s ∈ Q+ tali che 0 < r < α < β < s. Sia n > 0 un intero tale che
nr > s. Per la proprietà 11 precedente si ha nα > nr > s > β.
Teorema 1.5.10 Il campo reale è un campo ordinato, archimedeo e completo.
14
1.6
1. Numeri reali
Una diseguaglianza fondamentale
Lemma 1.6.1 Assegnati un intero n ≥ 2 e un numero reale ε > −1, ε 6= 0, si
ha
n
(1 + ε) > 1 + nε.
(1.6.2)
Dimostrazione. La dimostrazione è per induzione. Se n = 2 si ha
n
(1 + ε) = 1 + 2ε + ε2 > 1 + 2ε.
Supponiamo valida la (1.6.2) per n. Si ha allora
n+1
(1 + ε)
n
= (1 + ε) (1 + ε) > (1 + nε) (1 + ε) = 1 + (n + 1)ε + nε2
> 1 + (n + 1)ε.
La diseguaglianza (1.6.2) verrà utilizzata ripetutamente in questo libro. Ad
esempio nella dimostrazione dell’esistenza delle radici n–esime, dell’esistenza
dei logaritmi, in varie dimostrazioni riguardanti il calcolo dei limiti e in varie
dimostrazioni del capitolo 4 riguardanti il numero e.
1.7
Radici, potenze, logaritmi
In questo paragrafo definiamo i concetti di radice, di potenza a base ed esponente
reale e di logaritmo. Le dimostrazioni dei teoremi sono svolte nell’Appendice.
Teorema 1.7.1 Fissato un intero n ≥ 1 e un numero reale α > 0, esiste uno
ed un solo numero reale β > 0 tale che
β n = α.
(1.7.2)
Definizione 1.7.3 Il numero β > 0 che soddisfa (1.7.2) si chiama radice n–
esima di α e si indica con il simbolo
√
β = n α.
Il numero α si chiama radicando e n si chiama indice della radice. Si usa anche
la notazione
β = α1/n .
√
√ m
Osserviamo ora che, per la definizione di radice n–esima, si ha ( n α) = n αm .
Questa eguaglianza ci permette di definire le potenze a esponente razionale in
modo che godano delle consuete proprietà.
Definizione 1.7.4 Sia m è un intero relativo, sia n ≥ 1 un intero e sia α > 0.
Si pone
¡ √ ¢m
αm/n = n α .
1.7. Radici, potenze, logaritmi
15
Se n = 2k è pari,
l’equazione (1.7.2) ha anche la soluzione −β. Noi riservere√
n
mo
la
scrittura
α
all’unica
soluzione positiva di (1.7.2). Cosı̀, non scriveremo
p
(−2)2 = −2, bensı̀
p
(−2)2 = 2.
Per un generico α ∈ R vale
√
α2 = |α| .
Esaminamo ora le radici dei numeri reali negativi. Sia −α ∈ R− e n ≥ 1
un intero. Innanzi tutto è chiaro che, se n = 2k è pari, non può esistere alcun
¡ ¢k
β ∈ R tale che β 2k = β 2 = −α. Quindi non esistono in R le radici di indice
pari dei numeri negativi.
Sia α > 0. Supponiamo n = 2k + 1 dispari e sia β > 0 tale che β 2k+1 = α.
Allora
2k+1
(−β)
= −α.
Il numero −β viene ancora chiamato radice n-esima di −α e viene indicato con
il simbolo
√
n
−α.
√
√
Per ciò che si è detto, se n è dispari vale n −α = − n α.
Dopo avere definito le potenze a esponente razionale αm/n , possiamo definire
le potenze a esponente reale αβ , per ogni α > 0 e β ∈ R.
Anzitutto notiamo che, supposto α ≥ 1, β > 0 e β ≥ m/n, l’insieme delle potenze αm/n è limitato superiormente al variare di m/n. Infatti dato un
qualsiasi intero p > β, si ha p > m/n, da cui αp > αm/n .
Definizione 1.7.5 Sia α ≥ 1 e β > 0. Poniamo
n
o
m
αβ = sup αm/n :
≤β .
n
Se 0 < α < 1 e β > 0 poniamo
αβ =
1
.
(1/α)β
Se α > 0 e β > 0 poniamo
α−β =
1
.
αβ
Infine poniamo α0 = 1. In tal modo la potenza αβ risulta definita per ogni α > 0
e β reale.
Anche le potenze a esponente reale godono delle usuali proprietà delle potenze (si veda l’Appendice). Definiamo ora i logaritmi.
Teorema 1.7.6 Sia γ > 0 e α > 0, α 6= 1. Esiste uno e un solo numero reale
x tale che
αx = γ.
(1.7.7)
16
1. Numeri reali
Definizione 1.7.8 Il numero x in 1.7.7 si chiama logaritmo di γ in base α e
si scrive
x = logα γ.
Il Teorema 1.7.6 è dimostrato nell’appendice, dove sono anche presentate le
principali proprietà dei logaritmi
1.8
Spazi euclidei
Definizione 1.8.1 Sia n un intero positivo. Indichiamo con Rn l’insieme di
tutte le n-uple ordinate di numeri reali
x = (x1 , x2 , . . . , xn ) ,
La n-upla x viene chiamata punto o vettore n-dimensionale. Il numero x1 viene
chiamato prima coordinata di x, il numero x2 seconda coordinata di x, . . . ,il
numero xn viene chiamato n-esima coordinata di x.
In altri termini, Rn non è altro che il prodotto cartesiano di R con se stesso
n volte. R1 , R2 e R3 rappresentano rispettivamente la retta, il piano e lo
spazio euclideo, in cui si sia fissato un riferimento cartesiano. Possiamo quindi
considerare Rn come la generalizzazione alla dimensione n della retta, del piano
e dello spazio cartesiano.
Y
Z
_
x
y
z
_
x
y
Y
x
x
punto in R2
X
X
punto in R3
Si noti che nella definizione 1.8.1 le n-uple sono ordinate; cosı̀, ad esempio,
(1, 3, −2) 6= (3, 1, −2). Definiamo ora tre operazioni.
Definizione 1.8.2 Siano x = (x1 , x2 , . . . , xn ) e y = (y1 , y2 , . . . , yn ) due vettori
in Rn . Si dice somma di x e y il vettore
x + y = (x1 + y1 , x2 + y2 , . . . , xn + yn ) .
(1.8.3)
1.8. Spazi euclidei
17
Ad esempio, in R4
(1, 1/2,
√
√
2, 0) + (−1, 1/2, − 2, 1) = (0, 1, 0, 1).
Se n = 1, l’operazione definita coincide con la usuale somma di numeri reali.
Definizione 1.8.4 Sia α ∈ R e x = (x1 , x2 , . . . , xn ) ∈ Rn . Chiamiamo prodotto del vettore x per lo scalare α il vettore
αx = (αx1 , αx2 , . . . , αxn ) .
Ad esempio, in R3
√ ³ √ ´ ³√
√ ´
2 1, 2, 3 =
2, 2, 3 2
Definizione 1.8.5 Siano x = (x1 , x2 , . . . , xn ) e y = (y1 , y2 , . . . , yn ) due vettori
in Rn . Si dice prodotto interno dei due vettori il numero reale
¡
n
X
¢
x, y = x1 y1 + x2 y2 + · · · xn yn =
xj yj .
j=1
Ad esempio in R3 , se x = (3, 1, 4) e y = (1/3, 10, 2), si ha
¡
¢
1
x, y = 3 · + 1 · 10 + 4 · 2 = 19.
3
La somma è un’operazione interna, cioè associa a due vettori di Rn un terzo vettore di Rn . Il prodotto per uno scalare e il prodotto interno non sono
operazioni interne a Rn . Il prodotto per uno scalare è definito per una coppia
costituita da un numero e un vettore, mentre il prodotto interno ha come risultato un numero. Nel caso n = 1, sia il prodotto per uno scalare che il prodotto
interno coincidono con il consueto prodotto in R.
Definizione 1.8.6 Rn , dotato delle tre operazioni ora definite, si chiama spazio
euclideo n-dimensionale.
Indichiamo con 0 il vettore (0, 0, . . . , 0), ‘l’origine degli assi’, e con −x il
vettore (−x1 , −x2 , . . . , −xn ). Le operazioni di somma, prodotto per uno scalare
e prodotto interno, hanno le seguenti proprietà.
18
1. Numeri reali
Proprietà della somma
1. ∀x, y
x+y =y+x
¡
¢ ¡
¢
x+ y+z = x+y +z
2. ∀x, y, z
3. ∀x
x+0=x
4. ∀x
x + (−x) = 0
Proprietà del prodotto per uno scalare
5. ∀α, β ∀x
α (βx) = β (αx) = (αβ) x
Proprietà del prodotto interno
¡
¢ ¡
¢
6. ∀x, y
x, y = y, x .
Proprietà distributive
¡
¢
7. ∀x, y ∀α
α x + y = αx + αy
¡
¢ ¡
¢ ¡ ¢
8. ∀x, y, z
x + z, y = x, y + z, y
¡
¢ ¡
¢
9. ∀x, y, z
x, y + z = x, y + (x, z)
¡
¢ ¡
¢ ¡
¢
10. ∀x, y ∀α α x, y = αx, y = x, αy
La dimostrazione di queste proprietà è immediata.
Definizione 1.8.7 Sia x = (x1 , x2 , . . . , xn ) ∈ Rn . Si chiama norma di x il
numero reale non negativo
q
p
kxk = (x, x) = x21 + x22 + · · · + x2n .
La norma di x in dimensione 1 coincide con il valore assoluto, in dimensione
2 e 3 con la lunghezza del segmento che unisce il punto x all’origine degli assi.
Quindi la norma costituisce una generalizzazione del concetto di distanza di un
punto dall’origine.
in dimensione 2, k(3, 4)k = 5. In dimensione 4, posto x =
√ ¢
¡ Ad√ esempio,
5, 2, 2, 5 , si ha kxk = 6.
Proprietà della norma
1. ∀x
kxk ≥ 0.
2. ∀x
kxk = 0 se e solo se x = 0.
3. ∀x ∀α
kαxk = |α| kxk
omogeneità della norma.
1.8. Spazi euclidei
4. ∀x, y
5. ∀x, y
6. ∀x, y
19
¯
¯
¯(x, y)¯ ≤ kxk ||y||
diseguaglianza di Cauchy.
||x + y|| ≤ kxk + ||y|| diseguaglianza triangolare.
¯
¯
¯kxk − ||y||¯ ≤ ||x + y||.
Le proprietà 1 e 2 sono ovvie. Per la 3 si ha
q
q
kαxk = α2 x21 + α2 x22 + · · · + α2 x2n = α2 (x21 + x22 + · · · + x2n )
√ q
= α2 x21 + x22 + · · · + x2n = |α| kxk .
Per dimostrare la diseguaglianza di Cauchy, si consideri il vettore tx + y per
ogni t ∈ R. Possiamo supporre x 6= 0, altrimenti la 4 è ovvia. Per la 1 si ha
¢
¡
tx + y, tx + y = ||tx + y||2 ≥ 0.
D’altra parte, applicando successivamente le proprietà distributive e la commutatività del prodotto interno, si ha
¡
¢ ¡
¢ ¡
¢
tx + y, tx + y = tx, tx + y + y, tx + y
¡
¢ ¡ ¢
= (tx, tx) + 2 tx, y + y, y
(1.8.8)
¡
¢
2
2
2
= t kxk + 2t x, y + ||y|| .
Poiché questo trinomio in t non può essere negativo, il suo discriminante non
può essere positivo. Quindi
¡
¢2
2
x, y ≤ kxk ||y||2 .
Passando alle radici quadrate si ottiene la 4.
x
_ +y
_
Y
y
_
x
_
X
0
Somma di vettori e diseguaglianza triangolare
20
1. Numeri reali
Dimostriamo ora la diseguaglianza triangolare. Si ha, ragionando come in
(1.8.8) con t = 1,
¡
¢
||x + y||2 = x + y, x + y
¡
¢
2
= kxk + 2 x, y + ||y||2 .
¡
¢
Per la diseguaglianza di Cauchy x, y ≤ kxk ||y||, e quindi
¢2
¡
||x + y||2 ≤ kxk + ||y|| .
¢
¡
La 6 discende immediatamente dalla 5. Si ha infatti x = x + y − y, e || − y|| =
||y|| per l’omogeneità della norma. Quindi
kxk ≤ ||x + y|| + ||y||,
da cui
kxk − ||y|| ≤ ||x + y||.
(1.8.9)
Scambiando i ruoli di x e y si ha anche
||y|| − kxk ≤ ||x + y||.
(1.8.10)
¯
¯
Uno dei due numeri a sinistra in (1.8.9) o in (1.8.10) coincide con ¯kxk − ||y||¯.
Il nome ‘diseguaglianza triangolare’ è dovuto al fatto che, nel piano o nello
spazio, dati due punti x e y, i numeri kxk, ||y|| e ||x + y|| rappresentano le
lunghezze dei lati del triangolo di vertici 0, x e x + y. La somma delle lunghezze
di due lati non è mai minore della lunghezza del terzo. Analoga interpretazione
vale per la 6. È possibile dimostrare che in 5 e in 6 vale il segno = se e solo se
esiste un numero reale α tale che x = αy.
1.9
1.9.1
Appendice
Proprietà degli estremi superiore e inferiore
Elenchiamo alcune notevoli proprietà degli estremi superiore e inferiore. Alcune
di esse presuppogono le proprietà di campo che verranno dimostrate nel sottoparagrafo successivo. Supporremo A e B limitati superiormente o inferiormente, a
seconda dei casi. Indichiamo con α il generico elemento di A e con β il generico
elemento di B. Si ha
1. sup(α + β) = sup α + sup β,
2. sup(αβ) = sup α sup β,
3. sup(−α) = − inf α
4. sup (1/α) = 1/ inf α,
5. Se A ⊆ B
inf(α + β) = inf α + inf β.
inf(αβ) = inf α inf β
se α e β sono positivi.
inf(−α) = − sup α.
inf(1/α) = 1/ sup(α) se ogni α > 0 e inf α > 0.
inf B ≤ inf A ≤ sup A ≤ sup B.
1.9. Appendice
21
6. Se ∀α ∈ A ∃β ∈ B tale che α ≤ β, allora sup α ≤ sup β.
7. Se ∀α ∈ A ∃β ∈ B tale che α ≥ β, allora inf α ≥ inf β.
Queste formule sono valide anche per insiemi illimitati, una volta che vengano
aritmetizzati i simboli ±∞. Ad esempio, se sup α = +∞ allora sup(α + β) =
+∞. Se α > 0 si ha sup α = +∞ se e solo se inf(1/α) = 0.
La dimostrazione delle precedenti relazioni è piuttosto semplice e viene lasciata come esercizio. Ad esempio, dimostriamo la prima eguaglianza in 1.
Si ha α ≤ sup α e β ≤ sup β per ogni α ∈ A e β ∈ B. Quindi l’insieme delle
somme α + β ammette sup α + sup β come maggiorante, da cui
sup(α + β) ≤ sup α + sup β.
Non può valere il segno <, altrimenti esisterebbero α e β tali che α + β > α + β
per ogni α e β, assurdo.
1.9.2
Proprietà delle operazioni in R
Se r e s sono due numeri razionali, il risultato della loro somma e prodotto
come numeri reali coincide con quello della loro somma e prodotto nel campo
razionale. Dimostriamo questa asserzione nel caso in cui ambedue i numeri
siano positivi; con ovvie modificazioni, la dimostrazione vale anche negli altri
casi. Sia quindi
r = r0 , r1 r2 . . . rn . . .
e
s = s 0 , s 1 s 2 . . . sn . . .
ove i due allineamenti sono periodici. Siano r(n) e s(n) le loro troncate n-esime.
Si ha per la (1.5.2)
r(n) ≤ r < r(n) + 10−n
da cui
e s(n) ≤ s < s(n) + 10−n
r + s − 2 · 10−n < r(n) + s(n) ≤ r + s.
(1.9.1)
Si osservi che tutte le somme precedenti¡ sono nel campo
razionale. Da (1.9.1)
¢
segue immediatamente che r + s = supn r(n) + s(n) . Per il prodotto si ragiona
nella stessa maniera, osservando che al posto della (1.9.1) vale
rs − (r + s)10−n − 10−2n < r(n) s(n) ≤ rs.
Per una migliore comprensione delle operazioni in R introduciamo il concetto
di successione che si stabilizza.
Definizione 1.9.2 Sia γ1, γ2, . . . , γn . . . una successione di numeri reali positivi
con allineamenti
γ1 = c10 , c11 c12 . . . c1k . . .
γ2 = c20 , c21 c22 . . . c2k . . .
.........
γ2 = cn0 , cn1 cn2 . . . cnk . . .
.........
22
1. Numeri reali
Diciamo che la successione si stabilizza se, per ogni indice k esiste n0 (dipendente in generale da k), tale che per ogni n > n0 la k-esima cifra decimale cnk
di γn ha sempre lo stesso valore.
Ad esempio, la sucessione
γ1
γ2
γ3
γ4
= 0, 3311143 . . .
= 0, 3234134 . . .
= 0, 3235215 . . .
= 0, 3235216 . . .
.........
si stabilizza. Anche la successione 0, 9, 0, 99, 0, 999,
benché l’allineamento finale abbia periodo 9.
0, 9999,. . . si stabilizza,
Teorema 1.9.3 Se γ1, γ2, . . . , γn . . .è una successione di numeri reali positivi non decrescente e limitata superiormente, oppure non crescente, allora la
successione si stabilizza.
Dimostrazione. Supponiamo la successione non decrescente e limitata superiormente. Allora, la parte intera assumerà per un certo indice n0 il suo massimo
valore, sia esso d0 . Per i valori di n successivi a n0 si avrà sempre cn0 = d0 , poiché γn è non decrescente. Esisterà n1 , che possiamo supporre maggiore di n0 ,
tale che la prima cifra decimale assumerà il suo valore massimo, sia esso d1 . Per
i valori di n successivi a n1 si avrà cn0 = d0 e cn1 = d1 , poiché la successione γn
è non decrescente.Cosı̀ proseguendo, al passo k esisterà nk > nk−1 > . . . > n0
tale che la k-esima cifra decimale assumerà il suo valore massimo, sia esso dk .
Per n ≥ nk si avrà
cn0 = d0 , cn1 = d1 , cn2 = d2 , . . . , cnk = dk
Dunque la successione si stabilizza.
Se la successione è non crescente, la dimostrazione è la stessa, sostituendo
ai massimi i minimi.
Supponiamo che la successione dei γn sia non decrescente. Se l’allineamento
d0 , d1 d2 . . . dn . . . non ha periodo 9, il numero δ = d0 , d1 d2 . . . dn . . . è l’estremo
superiore della successione. Se l’allineamento è del tipo d0 , d1 d2 . . . dm 99999 . . .,
con dm < 9, l’estremo superiore è il numero razionale δ = d0 , d1 d2 . . . (dm + 1).
Se la successione è non crescente, la costruzione del teorema mostra che
l’allineamento d0 , d1 d2 . . . dn . . .non può avere periodo 9. Quindi, l’allineamento
d0 , d1 d2 . . . dn . . . rappresenta sempre l’estremo inferiore della successione.
Chiaramente il Teorema 1.9.3 si applica alla somma e al prodotto di numeri
reali. Nella definizione di somma di due numeri reali positivi α e β, la successione
γn = α(n) + β (n) è non decrescente, e quindi le cifre decimali di tale successione
si stabilizzano a quelle di α + β, salvo il caso del periodo 9 notato dianzi. Ad
esempio, 0, 18 + 0, 81 = 1, ma α(n) + β (n) = 0, 999 . . . 9 per ogni n > 0.
1.9. Appendice
23
Lemma 1.9.4 Sia x1 ≤ x2 ≤ . . . xn ≤ . . . una successione non decrescente di
razionali e y1 ≥ y2 ≥ . . . yn ≥ . . .una successione non crescente di razionali.
Supponiamo che
C
∃C > 0 ∀n xn ≤ yn ≤ xn + n .
10
Allora
sup xn = inf yn .
n
n
Dimostrazione. Si fissi n e sia m > n. Allora xn ≤ xm ≤ ym e quindi
xn ≤ inf m ym . Poiché inf m ym è un maggiorante dell’insieme degli xn ,
sup xn ≤ inf yn .
n
n
Se fosse supn xn < inf n yn , esisterebbero due razionali r e s tali che
∀n
sup xn < r < s < inf yn .
n
n
Per ogni n varrebbe allora
0 < s − r < yn − xn ≤
C
,
10n
il che è assurdo, poiché contraddice la proprietà archimedea del campo razionale.
Corollario 1.9.5 Per ogni α ≥ 0 e β ≥ 0 si ha
α + β = inf (α(n) + β (n) + 2 · 10−n )
n
³
´³
´
αβ = inf α(n) + 10−n β (n) + 10−n
n
1
1
= inf (n)
n
α
α
Dimostrazione. Si applica il Lemma 1.9.4. Nel caso della somma si pone xn =
α(n) + β (n) e yn = α(n) + β (n) + 2 · 10−n = xn +¡ 2 · 10−n . ¢ ¡
¢
Per il prodotto si pone xn = α(n) β (n) e yn = α(n) + 10n β (n) + 10−n . La
successione yn è non crescente e
yn ≤ xn + (α + β) 10−n + 10−2n .
¡
¢−1
Per il reciproco si pone xn = α(n) + 10−n
e yn = 1/α(n) . Se k è il primo
(k)
intero per cui α 6= 0, si ha
´−2
³
yn ≤ xn + α(k)
10−n .
24
1. Numeri reali
Nel caso della somma, le cifre di yn si stabilizzano, a quelle di α + β, nel
caso del prodotto a quelle di αβ.
Dimostriamo ora che R è un campo ordinato, ovvero dimostramo le proprietà
da 1 a 11 del paragrafo 1.4.
Proprietà 1. Siano α e β non negativi. Si ha
α(n) + β (n) = β (n) + α(n) , α(n) β (n) = β (n) α(n) ,
e l’eguaglianza si mantiene passando all’estremo superiore. Se uno o ambedue i
numeri sono negativi, la dimostrazione si adatta facilmente.
Proprietà 2. Supponiamo α, β, e γ non negativi. Per il Corollario 1.9.5
(n)
(α + β)
Ne segue
≤ (α + β) ≤ α(n) + β (n) + 2 · 10−n .
(α + β)(n) + γ (n) < α(n) + β (n) + γ (n) + 3 · 10−n .
(n)
Poiché α(n) + β (n) ≤ (α + β)
, possiamo applicare il Lemma 1.9.4 con
xn = (α + β)(n) + γ (n) ,
yn = α(n) + β (n) + γ (n) + 3 · 10−n .
Si conclude che
³
´
inf α(n) + β (n) + γ (n) + 3 · 10−n = sup(α + β)(n) + γ (n) = (α + β) + γ.
n
n
Allo stesso modo si ha
³
´
inf α(n) + β (n) + γ (n) + 3 · 10−n = α + (β + γ) ,
n
da cui la proprietà 2 se tutti i numeri sono non negativi. La dimostrazione si
adatta agli altri casi. Per dimostrare ad esempio che
(α − β) + γ = α + (−β + γ)
si ragiona come sopra, sostituendo alla successione β (n) la successione −β (n) −
10−n .
Proprietà 3 e 4. La 3 è evidente poiché 0(n) = 0. La 4 è pure immediata,
poiché per ogni α > 0 si ha α + (−α) = sup(α(n) − α(n) − 10−n ) = 0.
Proprietà 5. Si dimostra sulla falsariga della 1.
Proprietà 6. Se i tre numeri sono non negativi, si ragiona come nella
dimostrazione della proprietà 2. Si ha
´
´³
´³
³
(n)
(αβ) γ (n) < α(n) + 10−n β (n) + 10−n γ (n) + 10−n .
1.9. Appendice
25
¡
¢¡
¢¡
¢
(n)
Posto xn = (αβ) γ (n) e yn = α(n) + 10−n β (n) + 10−n γ (n) + 10−n , si
ha
yn < xn + (αβ + αγ + βγ)10−n + (α + β + γ)10−2n + 10−3n .
(n)
Poiché α(n) β (n) ≤ (αβ) , possiamo applicare il Lemma 1.9.4 per concludere
che
³
´³
´³
´
(αβ) γ = inf α(n) + 10−n β (n) + 10−n γ (n) + 10−n .
n
Allo stesso modo si vede che
³
´³
´³
´
α (βγ) = inf α(n) + 10−n β (n) + 10−n γ (n) + 10−n .
n
Se uno o più numeri sono negativi, si passa ai valori assoluti, tenendo conto che,
per due numeri reali positivi ρ e σ, si ha, per definizione di prodotto,
−(ρσ) = (−ρ)σ = ρ(−σ).
Proprietà 7 e 8. La 7 è evidente. Dimostriamo la 8. Possiamo limitarci al
caso α > 0. Per n abbastanza grande si ha α(n) > 0. Poiché
³ 1 ´(n)
α
si ha
1
<
α(n) + 10−n
≤
µ³ ´
1 (n)
α
1
1
≤ (n) ,
α
α
¶
+ 10−n
≤
1
+ 10−n .
α(n)
Quindi
¶
¶ ³
³
´ µ³ 1 ´(n)
´µ 1
−n
1 < α(n) + 10−n
+
10
.
+ 10−n ≤ α(n) + 10−n
α
α(n)
Passando all’estremo inferiore si ottiene αα−1 = 1.
Proprietà 9. Supponiamo α, β, e γ non negativi. Si pone
³
´³
´
yn = α(n) + β (n) + 2 · 10−n γ (n) + 10−n
(n)
xn = (α + β)
γ (n) .
Si osserva che yn < xn + (α + β + 2γ) 10−n + 2 · 10−2n e si applica il Lemma
1.9.4. Si ottiene
´
´³
³
(α + β) γ = inf α(n) + β (n) + 2 · 10−n γ (n) + 10−n .
n
In modo analogo si valuta αγ + βγ, arrivando cosı̀ alla tesi.
Se uno o più numeri sono negativi, a seconda dei casi si passa ai moduli o si
sostituisce, ad esempio α(n) , con −α(n) − 10−n .
26
1. Numeri reali
Proprietà 10. Sia 0 ≤ α < β. Si ha α(n) ≤ α < β < β (n) + 2 · 10−n , da cui
α(n) + γ (n) < β (n) + γ (n) + 2 · 10−n .
Per il Corollario 1.9.5,
α + γ ≤ β + γ.
(1.9.6)
Se valesse l’eguaglianza in (1.9.6), sommando ad ambo i membri −γ e usando
la proprietà 2 otterremmo α = β.
Se uno o più i numeri sono negativi, la dimostrazione è la stessa, ad esempio
sostituendo α(n) con −α(n) − 10−n .
Proprietà 11. Si dimostra in maniera del tutto analoga alla proprietà 10.
1.9.3
Radici e potenze
Sia α > 0 e sia n > 1 intero. Dimostriamo che esiste uno e un solo β > 0 tale
che β n = α.
L’unicità è banale, poiché, se ci fossero due radici distinte, β1 < β2 , si
avrebbe anche α = β1n < β2n = α, assurdo.
Dimostriamo l’esistenza. L’insieme
A = {x ∈ R+ : xn < α}
non è vuoto, poiché il numero α(1 + α)−1 è minore di 1 e di α, per cui
¶n
µ
α
α
<
< α.
1+α
1+α
Inoltre A è limitato superiormente. Infatti 1 + α è un maggiorante, poiché
n
(1 + α) > 1 + α > α.
Poniamo
β = sup A.
n
Sia, per assurdo, β > α. Possiamo trovare δ tale che
µ
¶
β
α
0<δ<
1 − n < β.
n
β
Per il Lemma 1.6.1 e la scelta di δ, si ha
µ
¶n
µ
¶
δ
δ
n
(β − δ) = β n 1 −
> βn 1 − n
> α.
β
β
Abbiamo quindi trovato un maggiorante di A minore di β, assurdo.
Sia ora, per assurdo, β n < α. Sia δ tale che
µ
¶
1
βn
1
0<δ<
1−
< .
nβ
α
β
1.9. Appendice
27
µ
Ragionando come nel caso precedente, si ha
βn <
1
−δ
β
¶n
>
1
, ossia
α
βn
n < α,
(1 − βδ)
β
è un elemento di A maggiore di β, assurdo. Questo conclude
(1 − βδ)
la dimostrazione.
Quindi
Per le potenze a esponente reale valgono le consuete proprietà.
y
x
αx αy = αx+y , (αx ) = αxy , (αβ) = αx β x
0 < α < β e x > 0 implica αx < β x
0 < x < y e α > 1 implica αx < αy
etc. . . . . . . . .
Come esempio, dimostriamo brevemente la prima. Siano dapprima x e y razionali, x = m/n e y = r/s. Per la definizione di potenza a esponente frazionario
si ha
³
´ns
αm/n αr/s
= αms+rn
e quindi αm/n αr/s = α(ms+rn)/ns . Passando agli estremi superiori si ha l’asserto
per ogni x e y positivi.
1.9.4
Logaritmi
Dimostriamo il Teorema 1.7.6. Sia γ > 0 e α > 1 e dimostriamo che l’equazione
αx = γ
ha una e una sola soluzione nel campo reale. L’unicità è evidente poiché, se ci
fossero due soluzioni x1 < x2 , si avrebbe
γ = αx1 < αx2 < γ,
il che è assurdo.
Sia
A = {y ∈ R : αy ≤ γ} .
L’insieme A non è vuoto. Infatti, poniamo α = (1 + ε), ove ε > 0. Sia n ≥ 2
tale che 1 + nε > γ −1 . Per il Lemma 1.6.1 si ha allora
−n
γ > (1 + ε)
e quindi −n ∈ A. Inoltre, A è limitato superiormente. Infatti, sia n ≥ 2 tale
che 1 + nε > γ. Allora, sempre per il Lemma 1.6.1, si ha
n
γ < (1 + ε)
28
1. Numeri reali
e quindi n è un maggiorante di A.
Poniamo x = sup A. Sia per assurdo αx > γ. Poniamo
δ=
αx
− 1 > 0.
γ
Sia n > 1 un intero tale che 1 + nδ > α. Si ha allora, per il Lemma 1.6.1,
αx−1/n > αx (1 + nδ)
−1/n
−1
> αx (1 + δ)
= γ.
Quindi x − 1/n è un maggiorante minore di x, assurdo.
Se, per assurdo, αx < γ, si pone
δ=
γ
−1>0
αx
e si sceglie n in modo tale che 1 + nδ > α. Come prima si ottiene
1/n
αx+1/n < αx (1 + nδ)
< αx (1 + δ) = γ.
Quindi αx+1/n ∈ A e x non può essere un maggiorante, assurdo.
Se α < 1 la dimostrazione è del tutto analoga.
I logaritmi hanno le seguenti ben note proprietà:
1. logα 1 = 0.
2. logα γ β = β log γ; in particolare, logα (1/γ) = − logα γ.
3. logα (βγ) = logα β + logα γ.
4. Sia α > 1. Si ha logα γ > 0 se γ > 1, logα γ < 0 se γ < 1. Se α < 1, il
segno del logaritmo è invertito.
¡
¢−1
5. logα γ = logγ α
se γ 6= 1.
La seguente formula permette il cambiamento di base dei logaritmi:
logα γ = logβ γ logα β.
(1.9.7)
I sistemi di logaritmi generalmente adottati sono quelli che hanno come base
il numero e di Nepero (logaritmi naturali), oppure quelli in base 10 (logaritmi
decimali). La (1.9.7) fornisce la seguente relazione tra i due sistemi:
loge γ = (2, 30258 . . .) log10 γ,
poiché loge 10 = 2, 30258 . . ..
Capitolo 2
Funzioni
2.1
Introduzione
Benché la nozione di funzione si possa definire mediante quella di sottoinsieme
di un prodotto cartesiano (si veda l’Appendice), per semplicità espositiva assumeremo il concetto di funzione come primitivo. A titolo illustrativo possiamo
descrivere il concetto di funzione nel seguente modo.
Siano X e Y due insiemi non vuoti. Una funzione f , definita in X e a valori
in Y , è una legge che associa ad ogni elemento x ∈ X uno e un solo elemento
y ∈Y.
I termini applicazione e mappa vengono usati come sinonimi di funzione.
In questo capitolo presentiamo i concetti e le proprietà generali delle applicazioni tra insiemi astratti. In particolare, avranno rilievo le funzioni definite
nell’insieme dei numeri naturali N = {1, 2, 3, . . . n, . . .}.
2.2
Immagini e controimmagini
Siano X e Y due insiemi non vuoti e sia f una funzione definita in X a valori
in Y . Useremo sempre la notazione
f :X→Y
L’insieme X si chiama insieme di definizione di f . Si dice anche che f applica,
o mappa, X in Y .
Per ogni x ∈ X indicheremo con y = f (x) l’unico elemento y ∈ Y associato
ad x. ll valore f (x) si chiama immagine di x mediante f . Se A ⊆ X non è vuoto,
si indica con f (A) ⊆ Y l’insieme delle immagini dei punti x ∈ A. L’insieme f (A)
viene chiamato immagine di A mediante f . Si ha quindi
f (A) = {y ∈ Y : ∃x ∈ A
Se A = ∅, si pone per definizione f (A) = ∅.
29
f (x) = y} .
30
2. Funzioni
Y
X
x
f
y=f(x)
Y
X
f
A
f(A)
Immagine di un punto e di un insieme
In particolare, f (X) si chiama codominio o coinsieme di f .
Sia f : X → Y , e sia y ∈ Y . L’insieme di tutti gli x ∈ X tali che
f (x) = y si chiama controimmagine di y mediante f e si indica con f −1 (y). La
controimmagine di y può contenere più di un punto, o può anche essere l’insieme
vuoto.
Se B ⊆ Y si dice controimmagine di B mediante f il sottoinsieme di X
f −1 (B) = {x ∈ X : f (x) ∈ B} .
Se B non è vuoto, la controimmagine di B è l’unione delle controimmagini di
tutti i suoi punti.
Esempi 2.2.1
1. Sia X = Y = R, e f (x) = sin x. Allora f (R) =[−1, 1]. Si ha
f −1 (0) = {kπ : k ∈ Z} .
Inoltre f −1 (y) = ∅ se |y| > 1.
2. Sia X = Y = R e f (x) = x2 . Si ha f (R) = R+ ∪ {0}. La controimmagine
di 0 ha il solo elemento 0, mentre per ogni y > 0 si ha
√ √
f −1 (y) = {− y, y} .
Se y < 0 si ha f −1 (y) = ∅. Per ogni intervallo
√
 √ √
√
a, √
b] ∪ [− b, − a]
[ √



[− b, b]
f −1 ([a, b]) =

{0}


∅
[a, b], si ha
se
se
se
se
a≥0
a<0 eb>0
a<0eb=0
b<0
3. Sia X = R2 e Y = R. Poniamo f (x, y) = x. Si ha f (R2 ) = R. La
controimmagine di x ∈ R è la retta verticale passante per il punto (x, 0).
Questa funzione si chiama ‘proiezione sulla prima coordinata’.
4. Sia X = Y = N, e f (n) = 2n. Si ha f (N) = 2N (l’insieme dei numeri
interi positivi pari). Se m è pari f −1 (m) = {m/2}, mentre se m è dispari
f −1 (m) = ∅.
2.2. Immagini e controimmagini
31
3
5. Sia X = Y = R©e f (x)
ª = x . In questo caso f (R) = R, e, per ogni y ∈ R
√
−1
3
si ha f (y) =
y .
Definizione 2.2.2 Sia f : X → Y . Valgono le seguenti definzioni.
1. La funzione f si dice suriettiva se f (X) = Y .
2. La funzione f si dice iniettiva se
∀x1 , x2 ∈ X
x1 6= x2 =⇒ f (x1 ) 6= f (x2 ).
3. La funzione f si dice biunivoca se è suriettiva e iniettiva.
Le funzioni degli esempi 2.2.1.1 e 2.2.1.2 non sono né suriettive, né iniettive.
La funzione dell’esempio 2.2.1.3 è suriettiva, ma non iniettiva. La funzione
dell’esempio 2.2.1.4 è iniettiva, ma non suriettiva. La funzione dell’esempio
2.2.1.5 è sia iniettiva che suriettiva, cioè biunivoca. È altresı̀ ovvio che ogni
funzione è suriettiva sul suo codominio. Ad esempio, la funzione f (x) = sin x è
suriettiva da R a [−1, 1].
Se f : X → Y , il grafico di f si definisce come il sottoinsieme del prodotto
cartesiano X × Y costituito da tutti i punti del tipo (x, f (x)). In tal modo viene
generalizzato il noto concetto di grafico di una funzione reale di variabile reale.
Sia f : X → Y . Indichiamo con X1 , X2 e A sottoinsiemi di X e con Y1 , Y2
e B sottoinsiemi di Y . Indichiamo il complementare di A in X con Ac , e il
complementare di B in Y con B c . Si hanno le seguenti proprietà di semplice
dimostrazione.
1. f −1 (Y1 ∪ Y2 ) = f −1 (Y1 ) ∪ f −1 (Y2 )
2. f −1 (Y1 ∩ Y2 ) = f −1 (Y1 ) ∩ f −1 (Y2 )
3. f (X1 ∪ X2 ) = f (X1 ) ∪ f (X2 )
4. f (X1 ∩ X2 ) ⊆ f (X1 ) ∩ f (X2 )
5. A ⊆ f −1 (f (A)) e vale l’eguaglianza se f è iniettiva.
¡
¢
6. B ⊇ f ( f −1 (B) e vale l’eguaglianza se f è suriettiva.
¡
¢c
7. f −1 (B c ) = f −1 (B)
c
c
8. f (Ac ) ⊆ (f (A)) se f è iniettiva; (f (A)) ⊆ f (Ac ) se f è suriettiva;
c
f (Ac ) = (f (A)) se f è biunivoca.
32
2.3
2. Funzioni
Restrizione, funzione inversa, composta.
Data una funzione f : X → Y , definiamo una nuova applicazione ‘restringendo’
la variabile x a un sottoinsieme dell’insieme di definizione.
Definizione 2.3.1 Sia f : X → Y e sia A ⊆ X non vuoto. Si chiama
restrizione di f ad A la funzione f |A : A → Y tale che
∀x ∈ A
f |A (x) = f (x).
A sua volta f si chiama estensione a X di f |A .
La nozione di restrizione permetterà di considerare una data funzione definita
solo su opportuni sottoinsiemi di X.
Sia f : X → Y biunivoca. Ogni y ∈ Y è immagine di uno e un solo x ∈ X.
Possiamo quindi definire una funzione da Y a X, inversa della precedente.
Definizione 2.3.2 Sia f : X → Y biunivoca. La funzione inversa f −1 : Y →
X è la funzione che associa a ogni y ∈ Y l’unico elemento x ∈ X tale che
f (x) = y.
Y
X
f
x
y
f-1
Funzione inversa
−1
In altri termini, f
associa ad y l’unico elemento della controimmagine di
y. Questo motiva l’uso del simbolo f −1 , che ordinariamente è riservato alle
controimmagini (ricordiamo che una controimmagine è un insieme). Se f è
biunivoca, ovviamente anche f −1 è biunivoca e la sua inversa è la funzione f
stessa. Quando esiste una funzione biunivoca f : X → Y , si dice che X e Y
sono in corrispondenza biunivoca.
π/2
−π/2
La funzione arctan(x)
2.3. Restrizione, funzione inversa, composta.
33
Esempi 2.3.3
1. Sia f (x) = 10x . Questa funzione è definita in R e ha valori reali. Il
codominio è R+ e f è biunivoca da R a R+ . La sua funzione inversa è
f −1 (x) = log10 x, definita in R+ a valori in R. In modo analogo, l’inversa
di ex (ove e è il numero di Nepero) è il logaritmo naturale log x.
2. Sia f (x) = tan x. La tangente è definita in R ad eccezione dei punti x =
π/2 + kπ, ove k ∈ Z. Non è biunivoca, ma la sua restrizione a (−π/2, π/2)
applica biunivocamente questo intervallo su R. La sua funzione inversa
si chiama arcotangente di y. L’arcotangente è definita in R a valori in
(−π/2, π/2) ed è denotata con il simbolo arctan x.
3. La funzione f (x) = sin x ristretta a [−π/2, π/2] applica biunivocamente
questo intervallo su [−1, 1]. La sua funzione inversa si chiama arcoseno di x
ed è denotata con il simbolo arcsin(x). L’arcoseno applica biunivocamente
[−1, 1] su [−π/2, π/2].
4. In modo analogo la restrizione di cos x a [0, π] applica biunivocamente
questo intervallo su [−1, 1]. La sua funzione inversa si chiama arcocoseno di x ed è denotata con il simbolo arccos(x). L’arcocoseno applica
biunivocamente [−1, 1] su [0, π].
π
π/2
−1
π/2
1
−π/2
−1
0
1
Le funzioni arcsin(x) e arccos(x)
Le precedenti funzioni si possono restringere ad altri intervalli su cui sono biunivoche, ma i nomi arcotangente, arcoseno, arcocoseno sono riservati alle inverse
delle restrizioni agli intervalli precisati sopra.
Definizione 2.3.4 Sia f : X → Y e g : Y → Z. Si chiama funzione composta
di g e f (in questo ordine) la funzione g ◦ f : X → Z definita da
∀x ∈ X
g ◦ f (x) = g (f (x)) .
34
2. Funzioni
Esempi 2.3.5
1. Sia y = f (x) = 10x e z = g(y) = sin y. In questo caso X = Y = Z = R.
La funzione composta g ◦ f risulta
z = g ◦ f (x) = g (f (x)) = sin 10x .
In questo caso è anche possibile invertire l’ordine della composizione,
poiché tutti e tre gli insiemi coincidono. Si ha la nuova funzione
z = f ◦ g(x) = 10sin x .
2. Sia f : R → R2 definita da f (x) = (1 + x, 1 − x). Sia g : R2 → R2 definita
da g(x1 , x2 ) = (x1 + x2 , x1 − x2 ). Allora g ◦ f : R → R2 e
¡
¢
g ◦ f (x) = g f (x) = (2, 2x).
La composizione di funzioni può essere iterata, in modo da comporre un numero
qualunque di funzioni. Si noti che, se f è una applicazione biunivoca di X su
sé stesso, si ha
∀x ∈ X
f ◦ f −1 (x) = f −1 ◦ f (x) = x.
Teorema 2.3.6 Siano f : X → Y e g : Y → Z funzioni biunivoche. Allora
g ◦ f : X → Z è biunivoca.
Dimostrazione. Poiché le due funzioni sono suriettive, si ha f (X) = Y e
g(Y ) = Z. Quindi g (f (X)) = Z, di modo che anche la funzione composta è
suriettiva.
Se x1 6= x2 , si ha f (x1 ) 6= f (x2 ). Poiché g è pure iniettiva, si ha g (f (x1 )) 6=
g (f (x2 )). Quindi anche g ◦ f è iniettiva.
gof
x
X
f
f(x)
g
Y
Funzione composta
g(f(x))
Z
2.4. Successioni. Indici
2.4
35
Successioni. Indici
Denotiamo, come di consueto, con N = {1, 2, 3, . . . , n, . . .} l’insieme dei numeri
naturali.
Definizione 2.4.1 Sia X un insieme non vuoto. Una successione a valori in
X è una funzione f : N →X.
L’immagine f (n) dell’intero n viene abitualmente indicata con xn . Il valore xn si chiama termine generale o termine n-esimo della successione. La
successione viene indicata mediante un allineamento
x1 , x2 , x3 , . . . xn , . . .
oppure mediante uno dei simboli
∞
{xn }n=1
{xn }n∈N
{xn } .
Questi simboli vengono usati sia per denotare la successione che il suo codominio.
Consideriamo ad esempio la successione a valori reali
1,
1 1 1
1
, , , ..., , ...
2 3 4
n
(2.4.2)
In questo caso si ha xn = 1/n. Nel caso della successione, sempre a valori in R,
−1, 1, −1, 1, . . . , (−1)n , . . .
il termine generale è xn = (−1)n .
Si può presentare il caso di funzioni f : N → X definite solo a partire da un
certo numero in poi. Ad esempio, log(n − 1) è definita solo per n ≥ 2. Scrivendo
successivamente i valori della funzione per n = 2, 3, 4, . . . abbiamo
log 1, log 2, log 3, . . .
Otteniamo cosı̀ una successione il cui primo valore è log 1 = x2 , il secondo valore
è log 2 = x3 , il terzo valore è log 3 = x4 etc. Allo stesso modo avremo termini
generali definiti a partire da 0 o da un intero negativo. Ad esempio,
f (n) =
1
n+1
è definita per n ≥ 0 e la successione dei suoi valori è data da (2.4.2). In questo
caso useremo le notazioni
x0 , x1 , x2 , . . . xn , . . .
∞
{xn }n=0
e notazioni analoghe se il termine generale è definito per n ≥ k.
La nozione di successione può essere generalizzata a funzioni definite su
insiemi di qualsiasi natura. Iniziamo con tre esempi.
36
2. Funzioni
Esempi 2.4.3
1. In R consideriamo la famiglia di tutti gli intervalli del tipo (0, x), ove
x > 0. Possiamo indicare ciascuno di questi intervalli con Ax .
2. Nel piano cartesiano consideriamo l’insieme di tutte le semirette s uscenti
dall’origine. Sia θ, 0 ≤ θ < 2π, l’angolo di cui deve ruotare (in senso
antiorario) il semiasse positivo delle X per sovrapporsi a s. Associamo a
ogni θ ∈ [0, 2π) la corrispondente semiretta, che verrà indicata con sθ .
3. Sia α ∈ (0, 1) un numero reale. Le sue cifre decimali possiedono un valore
massimo, che denotiamo con mα . Abbiamo quindi associato ad ogni α ∈
(0, 1) un intero mα tra 0 e 9.
Definizione 2.4.4 Siano I e X insiemi non vuoti. Una indicizzazione a valori
in X è una funzione f : I → X. Gli elementi dell’insieme I vengono chiamati
indici.
L’immagine f (i) dell’indice i ∈ I si denota con xi e l’indicizzazione a valori
in X si denota con il simbolo {xi }i∈I .
Y
sθ
θ
X
Negli esempi precedenti gli insiemi degli indici sono rispettivamente R+ ,
[0, 2π), (0, 1). Gli insiemi X sono rispettivamente la famiglia degli intervalli aperti con primo estremo 0, la famiglia delle semirette del piano uscenti
dall’origine, l’insieme delle cifre {0, 1, 2, . . . , 9}.
Possiamo ora definire le operazioni di unione e intersezione per famiglie qualunque di insiemi. Sia {Ai }i∈I una famiglia di sottoinsiemi di un insieme A.
Poniamo
\
Ai = {x ∈ A : ∀i ∈ I x ∈ Ai } ,
i∈I
[
i∈I
Ai = {x ∈ A : ∃i ∈ I
x ∈ Ai } .
2.5. Potenza di un insieme
37
Per gli insiemi dell’esempio 2.4.3.1 si ha
\
[
Ax = ∅,
Ax = (0, +∞).
x∈R+
Nell’esempio 2.4.3.2 si ha
\
x∈R+
[
sθ = {(0, 0)} ,
θ∈[0,2π)
sθ = R 2 .
θ∈[0,2π)
Se l’insieme degli indici è N (cioè nel caso di una successione di insiemi), si usano
le notazioni
+∞
+∞
\
[
An ,
An .
n=1
n=1
Se l’insieme degli indici è l’insieme dei primi k naturali {1, 2, . . . , k}, si usano le
notazioni
k
k
\
[
An ,
An .
n=1
n=1
L’unione e l’intersezione di famiglie qualsiasi di sottoinsiemi godono delle consuete proprietà di queste operazioni.
2.5
Potenza di un insieme
Definizione 2.5.1 Sia X un insieme non vuoto. Si dice che X è finito se esiste
n ∈ N tale che X sia in corrispondenza biunivoca con l’insieme {1, 2, . . . , n}. Il
numero n si dice potenza, o cardinalità, di X.
Si noti che la potenza di un insieme finito è unica. Se X è in corrispondenza
biunivoca con {1, 2, 3, . . . , n} e con {1, 2, 3, . . . , m}, allora questi due insiemi
devono essere in corrispondenza biunivoca tra loro e quindi m = n.
Se X = ∅ si assegna convenzionalmente a X la cardinalità 0.
Definizione 2.5.2 Un insieme non vuoto si dice infinito se non è finito.
Pur senza introdurre il concetto di cardinalità per insiemi infiniti, possiamo
tuttavia definire la nozione di insiemi che hanno eguale cardinalità.
Definizione 2.5.3 Si dice che due insiemi non vuoti X e Y sono equipotenti, o che hanno la stessa potenza, o la stessa cardinalità, se essi sono in
corrispondenza biunivoca. In tal caso si scrive X ∼ Y .
Si dice che X ha potenza, o cardinalità, maggiore di quella di Y se X non è
equivalente a Y ed esiste un sottoinsieme proprio A ⊂ X tale che A ∼ Y .
Osserviamo che se X ∼ Y e Y ∼ Z allora X ∼ Z Infatti, se f : X → Y è
biunivoca e g : Y → Z è biunivoca, allora la funzione composta g ◦ f : X → Z
è pure biunivoca per il Teorema 2.3.6.
38
2. Funzioni
Due insiemi finiti sono equipotenti se e solo se hanno la stessa cardinalità secondo la definizione 2.5.1. In particolare, un insieme finito ha sempre cardinalità
maggiore di quella di un suo sottoinsieme proprio.
Se X è infinito, la situazione è diversa. Ad esempio, definiamo una applicazione f : N → 2N (i numeri naturali pari) ponendo f (n) = 2n. Questa
applicazione è biunivoca, poiché il codominio concide con 2N e numeri differenti hanno immagini differenti. Quindi N è equipotente a un suo sottoinsieme
proprio.
Il seguente Teorema mostra che questa proprietà caratterizza gli insiemi
infiniti. La dimostrazione è svolta nell’Appendice.
Teorema 2.5.4 Un insieme non vuoto X è infinito se e solo se esiste un suo
sottoinsieme proprio A tale che A ∼ X.
2.6
Potenza del numerabile
Definizione 2.6.1 Si dice che un insieme A è numerabile (o che ha la potenza
del numerabile) se A è equipotente a N.
Se A è numerabile esiste un funzione biunivoca f : N →A. Posto an = f (n),
gli elementi di A si possono ‘elencare in successione’:
a1 , a2 , a3 , . . . , an , . . .
(2.6.2)
Un esempio di insieme numerabile diverso da N stesso è fornito da Z, l’insieme
degli interi relativi. Gli elementi di Z si possono infatti elencare in successione
con la legge
0, −1, 1, −2, 2, −3, 3, . . .
Il seguente Teorema mostra che la potenza del numerabile è la ‘più piccola’
cardinalità infinita.
Teorema 2.6.3 Sia A un insieme numerabile e B ⊆ A un insieme infinito.
Allora B è numerabile.
Dimostrazione. Supponiamo gli elementi di A indicizzati come in (2.6.2).
Tra questi elementi si trovano anche gli elementi b ∈ B. Denotiamo con b1 il
primo elemento di B che appare in (2.6.2). Denotiamo con b2 il primo elemento
di B successivo a b1 . In generale, avendo definito bk , denotiamo con bk+1 il
primo elemento di B successivo a bk . Poiché B è infinito, tale processo non
può avere termine, e tutti gli elementi di B risultano elencati in successione:
b1 , b2 , . . . , bk , . . .
Teorema 2.6.4 Sia A1 , A2 , . . . , An ,. . . una successione di insiemi ciascuno dei
quali è numerabile. Allora
∞
[
A=
An
n=1
è numerabile.
2.6. Potenza del numerabile
39
Dimostrazione. Indichiamo con ank gli elementi di An , cioè
An = {an1 , an2 , an3 , . . . , ank , . . .} .
Gli elementi dell’unione
quadro
A1 :
A2 :
A3 :
A4 :
...
An :
...
sono tutti e soli gli elementi che appaiono nel seguente
a11
a21%
a31 %
a41 %
...
an1 %
...
a12
a13
a14
a22 % a23 % a24
a32 % a33
a34
a42
a43
a44
...
...
...
an2
an3
an4
...
...
...
...
...
...
...
...
...
...
Gli elementi della tabella si possono numerare con procedimento ’diagonale’:
a11, a21 , a12 , a31 , a22 , a13 , a41 , a32 , a23 , a14,...
(2.6.5)
Poiché gli An non sono necessariamente a due a due disgiunti, un elemento può
apparire più volte nella successione (2.6.5). Conveniamo quindi di omettere, nel
processo di numerazione descritto, ogni elemento che sia già apparso una volta.
In tal modo A risulta posto in corrispondenza biunivoca con l’insieme dei
numeri naturali.
Il Teoema precedente si enuncia anche nel seguente modo: l’unione di una
infinità numerabile di insiemi numerabile è numerabile.
Corollario 2.6.6 Siano A1 , A2 , . . . , An insiemi numerabili. Allora, il loro prodotto cartesiano
A1 × A2 × . . . × An
è numerabile.
Dimostrazione. Dimostriamo il Corollario per induzione sul numero n di
insiemi, iniziando da n = 2. Siano
A = {a1 , a2 , a3 , . . . , an , . . .} ,
B = {b1 , b2 , b3 , . . . , bk , . . .}
numerabili. Il generico elemento di A × B è del tipo (an , bk ). Quindi A × B
risulta unione numerabile degli insiemi numerabili
{a1 } × B = {(a1 , b1 ), (a1 , b2 ), (a1 , b3 ), . . . , (a1 , bk ), . . .}
{a2 } × B = {(a2 , b1 ), (a2 , b2 ), (a2 , b3 ), . . . , (a2 , bk ), . . .}
{a3 } × B = {(a3 , b1 ), (a3 , b2 ), (a3 , b3 ), . . . , (a3 , bk ), . . .}
.........
{an } × B = {(an , b1 ), (an , b2 ), (an , b3 ), . . . , (an , bk ), . . .}
.........
Per il Teorema 2.6.4 A × B è numerabile.
40
2. Funzioni
Supponiamo ora vera la tesi per n. Poniamo A = A1 × A2 × . . . × An e
B = An+1 , di modo che
A1 × A2 × . . . × An × An+1 = A × B.
Per l’ipotesi di induzione A è numerabile e quindi, come abbiamo appena visto,
anche A × B è numerabile.
Corollario 2.6.7 Q è numerabile. Qn è numerabile per ogni intero n ≥ 1.
Dimostrazione. Ogni numero razionale si esprime, in forma non unica, come
frazione p/q, ove p ∈ Z è un intero relativo e q ∈ N. Associando a p/q la coppia
(p, q), l’insieme di tutte le frazioni è in corrispondenza biunivoca con Z × N, che
è numerabile per il Corollario precedente. Poiché Q è un sottoinsieme infinito
dell’insieme numerabile di tutte le frazioni, per il Teorema 2.6.3 Q è numerabile.
Per il Corollario precedente anche Qn è numerabile.
2.7
Potenza del continuo
Non tutti gli insiemi infiniti sono numerabili. Questo paragrafo è dedicato alla
dimostrazione del Teorema di Cantor, che asserisce che R ha potenza maggiore
di N.
Definizione 2.7.1 Diciamo che un insieme ha la potenza del continuo se è
equipotente a R.
-1
1
y=
x
1 − |x|
2.7. Potenza del continuo
41
Lemma 2.7.2 L’intervallo (0, 1) ha la potenza del continuo.
Dimostrazione. La funzione g(x) = (x + 1)/2 applica biunivocamente (−1, 1)
su (0, 1) e quindi (0, 1) ∼ (−1, 1). Basta perciò dimostrare che (−1, 1) è
equipotente a R. Sia f : (−1, 1) → R definita da
f (x) =
x
.
1 − |x|
Evidentemente, f (0) = 0, f (x) > 0 se 0 < x < 1 e f (x) < 0 se −1 < x < 0. Sia
y ∈ R fissato. L’equazione
x
y=
1 − |x|
ammette in (−1, 1) l’unica soluzione
x=
y
1+y
se y > 0,
x=
y
1−y
se y < 0.
Quindi, per ogni y ∈ R esiste uno e un solo x ∈ (−1, 1) tale che f (x) = y, cioè
f è biunivoca.
È chiaro che, con ragionamento analogo, si dimostra che ogni intervallo (a, b)
ha la potenza del continuo.
Teorema 2.7.3 (di Cantor) R ha potenza maggiore di N.
Dimostrazione. Basta dimostrare che l’intervallo (0, 1) non è numerabile.
Questo implica, per il Lemma 2.7.2, che neppure R è numerabile. Inoltre, poiché
N ⊂ R, per la definizione 2.5.3 si ha che la cardinalità di R è maggiore di quella
di N.
Ragioniamo per assurdo e supponiamo che i punti di (0, 1) si possano di∞
sporre in successione, sia essa {xn }n=1 . Ogni elemento della successione ha una
rappresentazione decimale
x1 = 0, c11 c12 c13 . . . c1n . . .
x2 = 0, c21 c22 c23 . . . c2n . . .
x3 = 0, c31 c32 c33 . . . c3n . . .
...
......
xn = 0, cn1 cn2 cn3 . . . cnn . . .
...
......
(2.7.4)
Costruiamo ora un numero reale x ∈ (0, 1) che non coincide con nessuno degli
xn . Definiamo la prima cifra decimale c1 in modo che
c1 6= c11 , c1 6= 0, c1 6= 9.
Definiamo c2 in modo tale che
c2 6= c22 , c2 6= 9.
42
2. Funzioni
Definiamo c3 in modo che
c3 6= c33 , c3 6= 9.
Al passo n definiamo cn in modo che
cn 6= cnn ,
cn 6= 9.
Ad esempio, possiamo scegliere cn = 2 se cnn = 1, e cn = 1 se cnn 6= 1.
Il numero
x = 0, c1 c2 c3 . . . cn . . .
è positivo poiché c1 6= 0, ed è minore di 1 perché la sua parte intera è 0. Tuttavia
x differisce da tutti i numeri xn in (2.7.4), poiché, per ogni n, si ha cn 6= cnn .
Siamo cosı̀ arrivati a un assurdo.
Corollario 2.7.5 L’insieme I dei numeri irrazionali non è numerabile.
Dimostrazione. Altrimenti R = Q ∪ I sarebbe numerabile.
Ulteriori risultati sulla potenza degli insiemi sono contenuti in Appendice.
2.8
2.8.1
Appendice
Le funzioni come sottoinsiemi del prodotto cartesiano
Come abbiamo affermato nel primo paragrafo di questo capitolo, la nozione di
funzione si può definire tramite quella di sottoinsieme del prodotto cartesiano.
La definizione consiste nell’identificazione di una funzione con il suo grafico.
Siano X e Y due insiemi non vuoti, e sia F un sottoinsieme del prodotto
cartesiano X × Y con la seguente proprietà: per ogni x ∈ X esiste uno e un
solo y ∈ Y tale che (x, y) ∈ F . Diciamo allora che F definisce una funzione
f : X → Y . Per ogni x ∈ X l’unico elemento y tale che (x, y) ∈ F viene
indicato con il simbolo funzionale f (x).
2.8.2
Proprietà degli insiemi infiniti
Lemma 2.8.1 Sia X un insieme infinito. Allora
a) X contiene un insieme numerabile N tale che N c è infinito
b) Per ogni insieme numerabile N ⊆ X tale che N c è infinito, X è equipotente
a N c.
Dimostrazione. a) Sia x1 ∈ X qualsiasi. Poiché X non è finito, esiste x2 ∈ X
tale che x2 6= x1 . Analogamente, esiste x3 ∈ X distinto da x1 e x2 . Per
ogni n, dati x1, x2 , x3 , . . . , xn a due a due distinti, esiste xn+1 ∈ X distinto dai
precedenti. Quindi X contiene l’insieme numerabile N = {x1 x2 , x3 , . . . , xn , . . .}.
Se N c non è infinito, basta sostituire N con la successione x2 x4 , x6 , . . . , x2n , . . .
degli elementi di indice pari.
2.8. Appendice
43
b) Sia N ⊆ X numerabile tale che N c è infinito. Poniamo
N = {x1 , x2 , x3 , . . . , xn , . . .}
Per il punto a), N c contiene a sua volta un sottoinsieme numerabile
{y1, y2 , y3 , . . . , yn , . . .} ⊂ N c .
∞
Formiamo la successione {zn }n=1 con la seguente legge:
z2n−1 = xn ,
z2n = yn .
Chiamiamo Z l’insieme degli elementi della successione. La funzione
½
x
se x ∈ Z c
f (x) =
z2n = yn se x = zn ∈ Z
applica biunivocamente X su N c .
Corollario 2.8.2 Un insieme non vuoto X è infinito se e solo se esiste un suo
sottoinsieme proprio A tale che X ∼ A.
Dimostrazione. Se esiste un insieme infinito A ⊂ X tale che X ∼ A, l’insieme
X non può essere finito. L’affermazione inversa segue dai punti a) e b) del
Lemma precedente
Corollario 2.8.3 L’insieme dei numeri irrazionali ha la potenza del continuo.
Dimostrazione. Basta applicare il punto b) del Lemma 2.8.1 con X = R e
N = Q.
Teorema 2.8.4 L’insieme di tutti gli allineamenti delle cifre 0 e 1 ha la potenza
del continuo.
Dimostrazione. Sia X l’insieme degli allineamenti di 0 e 1. Ad esempio
1 0 0 11 0 10 0 1 . . .
Sia N il sottoinsieme degli allineamenti di periodo 1 e dell’allineamento che ha
la sola cifra 0. L’insieme N è numerabile. Infatti, c’è un solo allineamento
di periodo 1 senza antiperiodo, un allineamento di periodo 1 con antiperiodo
di una cifra, due allineamenti di periodo 1 con antiperiodo di due cifre, quattro allineamenti di periodo 1 con antiperiodo di tre cifre e, in generale, 2n−1
allineamenti di periodo 1 con antiperiodo di n cifre.
Tutti e soli gli allineamento di N c costituiscono le rappresentazioni binarie
dei numeri in (0, 1) (senza la parte intera 0). Quindi N c ∼ (0, 1), e per il punto
b) del Lemma 2.8.1, si ha anche X ∼ (0, 1).
Chiaramente, lo stesso risultato vale per tutti gli allineamenti decimali o in
base qualunque.
44
2.8.3
2. Funzioni
Potenza dell’insieme delle parti
Per ogni insieme X denotiamo con P(X) l’insieme delle parti di X, ovvero,
l’insieme di tutti i suoi sottoinsiemi. Per X = N si ha il seguente risultato.
Teorema 2.8.5 P(N) è equipotente a R.
Dimostrazione. Sia A ⊆ N. Ad ogni intero n associamo il numero 1 se n ∈ A,
altrimenti associamo a n il numero 0. Ad esempio, se A è l’insieme dei dispari
otteniamo l’allineamento infinito
1 0 1 01 0 1 0...
Se A è il sottoinsieme dei quadrati, otteniamo l’allineamento
1 0 0 1 0 0 0 0 1 ...
Quindi, ad ogni A viene associato un allineamento infinito di cifre 0 e 1. La
corrispondenza tra questi allineamenti e P(N) è chiaramente biunivoca. Per il
Teorema 2.8.4, P(N) ha la potenza del continuo.
Ci si può chiedere se esistano insiemi con potenza maggiore del continuo.
La risposta è affermativa. In analogia al caso di N, P(X) ha sempre potenza
maggiore di X. Prima di dimostrare questo risultato, osserviamo che, come nel
caso numerabile, P(X) è equipotente all’insieme di tutte le funzioni
f : X → {0, 1} .
Infatti, ad ogni A ⊆ X, si assegna la funzione f : X → {0, 1} tale che
½
1 se x ∈ A
f (x) =
0 se x ∈
/A
Teorema 2.8.6 Per ogni insieme X l’insieme delle parti P(X) ha potenza
maggiore di X.
Dimostrazione. Se X è l’insieme vuoto, allora l’insieme P(∅) ha cardinalità
1, poiché contiene ∅ come unico elemento. Supponiamo che X non sia vuoto.
Allora, P(X) contiene un sottoinsieme proprio equipotente a X. Infatti, l’insieme di tutti i singletons (insiemi con un solo elemento) è in corrispondenza
biunivoca con X.
Per dimostrare che P(X) non è equipotente a X, si generalizza la dimostrazione del Teorema di Cantor. Sia F l’insieme di tutte le funzioni f : X → {0, 1},
e supponiamo per assurdo che F si possa mettere in corrispondenza biunivoca
con X. In tal caso, ad ogni x viene associata in maniera biunivoca una funzione
fx ∈ F.
Costruiamo ora una funzione g ∈ F che non può corrispondere a nessun
indice x. La funzione
½
1 se fx (x) = 0
g(x) =
0 se fx (x) = 1
non può corrispondere a nessun x ∈ X. Infatti, per ogni x ∈ X, g differisce da
fx per il valore assunto in x.
2.8. Appendice
45
Corollario 2.8.7 Se X è finito con cardinalità n, P(X ) ha cardinalità 2n .
Dimostrazione. Basta dimostrare che l’insieme delle funzioni da X a {0, 1}
ha cardinalità 2n . Al primo elemento di X possono corrispondere due valori, 0
o 1; al secondo elemento due valori, 0 o 1; al terzo elemento ancora due valori
etc. Quindi, per i primi due elementi ci sono 4 scelte possibili, per i primi 3
elementi 8 scelte possibili, per i primi n elementi 2n scelte possibili.
In base alla proprietà espressa dal Corollario, per l’insieme delle parti di X
viene anche usata la notazione 2X .
Abbiamo dimostrato che il prodotto cartesiano di insiemi numerabili è numerabile. Una simile affermazione vale anche per la potenza del continuo.
Teorema 2.8.8 Rn è equipotente a R.
Dimostrazione. Dimostriamo il Teorema per semplicità nel caso n = 2, ma la
dimostrazione si estende in modo ovvio.
Sia X l’insieme di tutti gli allineamenti di cifre 0 e 1. Per il Teorema 2.8.4
X ∼ R. Chiaramente X ×X ∼ R×R. Basta quindi dimostrare che X ×X ∼ X.
Siano x e y appartenenti a X. Poniamo
x = a1 a2 . . . an . . .
y = b1 b2 . . . bn . . .
ove an e bn sono 0 o 1. Definiamo f : X × X → X associando alla coppia
ordinata (x, y) l’allineamento in cui le cifre dispari sono quelle di x e le cifre
pari quelle di y. Poniamo cioè
f (x, y) = a1 b1 a2 b2 a3 b3 . . . an bn . . .
Dimostriamo che f è biunivoca.
La funzione f è iniettiva. Infatti, se f (x, y) = f (x,e
e y ), si ha
a1 b1 a2 b2 a3 b3 . . . = e
a1 eb1 e
a2 eb2 e
a3 eb3 . . .
Ne segue an = e
an e bn = ebn per ogni n, cioè x = x
e e y = ye.
La funzione è anche suriettiva. Infatti, assegnato
z = c1 c2 c3 c4 . . . c2n−1 c2n . . . ,
si ha z = f (x, y), con
x = c1 c3 c5 . . . c2n−1 . . .
y = c2 c4 c6 . . . c2n . . . .
Capitolo 3
Spazi Metrici
3.1
Introduzione
Gli spazi metrici costituiscono un capitolo della topologia, una delle grandi
teorie unificanti della matematica moderna. Molti dei concetti presentati in
questo capitolo sono concetti topologici, che noi ci limiteremo a studiare nel
contesto metrico. La nozione di distanza appare nella matematica in svariati
contesti analitici e geometrici. La teoria degli spazi metrici, nata all’inizio del
secolo XX, fornisce un ambito astratto e unitario per la trattazione di questa
nozione.
3.2
Definizione ed esempi
Definizione 3.2.1 Sia X 6= ∅ e sia d : X × X → R. Si dice che (X, d) è uno
spazio metrico se sono soddisfatte le seguenti condizioni:
1. ∀x, y ∈ X
d(x, y) ≥ 0
2. ∀x, y ∈ X
d(x, y) = 0
3. ∀x, y ∈ X
d(x, y) = d(y, x)
4. ∀x, y, z ∈ X
se e solo se x = y
(proprietà di simmetria)
d(x, y) ≤ d(x, z) + d(z, y)
(diseguaglianza triangolare)
La funzione d si chiama metrica o distanza su X. Si dice anche che X è
metricizzato tramite d. Gli elementi x ∈ X vengono chiamati punti dello spazio
metrico.
Esempi 3.2.2
1. Sia X = R e d(x, y) = |x − y|. Le proprietà 1–4 sono immediatamente
verificate.
47
48
3. Spazi Metrici
Z
y ||
||_
x- _
_
y
x
_
Y
X
Distanza euclidea in R3
°
°
2. Sia X = Rn e d(x, y) = °x − y °. Le proprietà della norma studiate nel
paragrafo 1.8 del capitolo 1 assicurano che d è effettivamente una distanza
su Rn . Essa prende il nome di metrica euclidea. La metrica euclidea,
definita tramite la norma, è la distanza ‘naturale’ in Rn .
Nel seguito, quando non sia esplicitamente affermato il contrario, supporremo sempre Rn metricizzato con la metrica euclidea.
3. Un insieme ammette in generale più funzioni distanza che lo metricizzano.
Come esempio, introduciamo in Rn due distanze diverse da quella euclidea.
La prima è il massimo valore assoluto della differenza delle coordinate.
Poniamo
¡
¢
d∞ x, y = max {|x1 − y1 | , |x2 − y2 | , . . . , |xn − yn |} .
Che tale funzione sia una metrica è presto verificato. La 1 è ovvia, come
pure la 2, poiché maxk |xk − yk | = 0, implica x1 = y1 , . . . , xn = yn .
La simmetria è pure chiara, poiché |xk − yk | = |yk − xk | per ogni k.
Verifichiamo la proprietà triangolare. Si ha, per ogni k = 1, 2, . . . , n,
|xk − yk | ≤ |xk − zk | + |zk − yk | .
Passando ai massimi si ha
max |xk − yk | ≤ max |xk − zk | + max |zk − yk | ,
k
cioè
k
k
¡
¢
¡
¢
d∞ x, y ≤ d∞ (x, z) + d∞ z, y .
4. Definiamo un’altra distanza in Rn ponendo
d1 (x, y) = |x1 − y1 | + |x2 − y2 | + · · · |xn − yn |
n
X
=
|xk − yk | .
k=1
(3.2.3)
3.2. Definizione ed esempi
49
_y
y2
x
_
x2
x1
¡
y1
La distanza d1 x, y
¢
Le proprietà 1–3 sono ovvie, e anche la quarta discende dall’analoga proprietà del valore assoluto. Infatti, poiché (3.2.3) vale per ogni k, sommando si ottiene
n
X
k=1
|xk − yk | ≤
n
X
k=1
|xk − zk | +
n
X
|zk − yk | .
k=1
5. Sia (X, d) uno spazio metrico e sia Y ⊆ X un sottoinsieme non vuoto.
Detta dY la restrizione di d a Y × Y , (Y, dY ) è a sua volta uno spazio
metrico, chiamato sottospazio metrico di X. In questo caso diciamo che
Y ha la metrica indotta da X.
6. Sia C la circonferenza unitaria nel piano, e siano p e q due punti di C. Essi
suddividono la circonferenza in due archi di lunghezze `(p, q) e 2π−`(p, q).
Chiamiamo distanza di p da q la più piccola delle lunghezze di questi due
archi, cioè
d(p, q) = min (`(p, q), 2π − `(p, q)) .
Le proprietà della distanza sono imediatamente verificate. Si noti che
questa distanza non è la metrica indotta da R2 , descritta nel precedente
esempio. Infatti
dC (p, q) = kp − qk < min (`(p, q), 2π − `(p, q)) .
7. L’esempio precedente può essere generalizzato. Sia S ⊆ R3 la superficie
sferica unitaria. Siano p e q due punti di S. Per essi passa uno e un solo
cerchio massimo. Chiamiamo distanza tra p e q il minimo delle lunghezze
dei due archi di cerchio massimo. Anche in questo caso la distanza è
diversa dalla distanza indotta da R3 .
Questa metrica è un esempio di distanza geodetica. Data una superficie in
R3 , possiamo definire in essa lo stesso tipo di distanza qualora sia definito
50
3. Spazi Metrici
1
p
p
0
d(p,q)
dC(p,q)=||p-q||
–1
–1
q
q
–1
0
0
1 1
Distanza nel cerchio e sulla sfera
il concetto di curva di lunghezza minima (chiamata geodetica) che unisce
due punti. In tal caso, si definisce distanza di due punti della superficie
la lunghezza della geodetica che li unisce. Un altro esempio elementare di
questo tipo di superfici è il cilindro infinito.
8. Sia f : R → R una funzione iniettiva. Poniamo, per ogni coppia di numeri
reali x, y,
df (x, y) = |f (x) − f (y)|.
Si riconosce facilmente che le proprietà 1–4 della definizione 3.2.1 sono
verificate. La distanza euclidea in R si può considerare una distanza di
questo tipo, qualora si ponga f (x) = x.
f(y)
f(x)
y
x
La distanza df in R
9. Sia X l’insieme di tutte le funzioni limitate f : [0, 1] → R, cioè tali che
supx |f (x)| < +∞. La differenza di due funzioni in X è ancora limitata,
poiché
sup |f (x) − g(x)| ≤ sup |f (x)| + sup |g(x)| < +∞.
x
x
x
Poniamo
d(f, g) = sup |f (x) − g(x)| .
x
3.3. Intorni
51
È immediato verificare che le proprietà 1–4 nella definizione di spazio
metrico sono soddisfatte.
10. In ogni insieme non vuoto X può essere definita una metrica. Poniamo,
per ogni x, y ∈ X,
½
0 se x = y
d(x, y) =
1 se x 6= y
Le proprietà 1–3 della metrica sono immediate. Dimostriamo che vale la
diseguaglianza triangolare. Siano x, y, z elementi di X, non necessariamente distinti. Se x = y, allora
d(x, y) = 0 ≤ d(x, z) + d(y, z).
Se x 6= y, allora deve valere almeno una delle due relazioni: x 6= z, oppure
y 6= z. Quindi
d(x, y) = 1 ≤ d(x, z) + d(y, z).
La metrica ora descritta si chiama metrica discreta e (X, d) si chiama
spazio metrico discreto.
3.3
Intorni
Quando si sia definito il concetto di distanza in un insieme, la nozione più
naturale ad essa associata è quella di ‘cerchio’ di centro e raggio assegnato.
Definizione 3.3.1 Sia (X, d) uno spazio metrico. Sia p ∈ X e r > 0. Si
chiama intorno circolare (o semplicemente intorno) di p di raggio r l’insieme
B(p, r) = {x ∈ X : d(p, x) < r} .
Il punto p si chiama centro dell’intorno.
Esempi 3.3.2
1. Sia X = R con la metrica euclidea. In questo caso
B(p, r) = {x ∈ R : |p − x| < r} .
Poiché la diseguaglianza |p − x| < r equivale a
p − r < x < p + r,
l’intorno B(p, r) coincide con l’intervallo aperto (p − r, p + r).
2. Se X = R2 o X = R3 (ambedue con la metrica euclidea) B(p, r) è rispettivamente: il cerchio con centro p e raggio r, privato della circonferenza;
la sfera con centro p e raggio r, privata della superficie sferica. In Rn l’intorno B(p, r) è la generalizzazione al caso n-dimensionale di queste figure
geometriche.
52
3. Spazi Metrici
3. Consideriamo la metrica d∞ in Rn , limitandoci per semplicità a n = 2.
Gli intorni circolari dell’origine 0 nella metrica d∞ sono gli insiemi
©
ª
B(0, r) = (x, y) ∈ R2 : max (|x| , |y|) < r .
In altri termini, (x, y) ∈ B(0, r) se e solo se −r < x < r e −r < y < r.
Quindi B(0, r) coincide con il quadrato, privato dei lati, con centro in (0, 0)
e semilato r, con lati paralleli agli assi. Gli intorni B(p, r) del generico
punto p del piano sono i quadrati, privati dei lati, con centro in p e lato
2r. In R3 gli intorni in questa metrica sono dei cubi privati delle facce.
4. In R2 con la metrica d1 gli intorni dell’origine sono gli insiemi
©
ª
B(0, r) = (x, y) ∈ R2 : |x| + |y| < r .
Quindi, B(0, r) è l’insieme del piano limitato dalle quattro rette
y = ±x + r, y = ±x − r.
(3.3.3)
Tale insieme è un quadrato, privato dei lati, centrato nell’origine e avente
gli assi cartesiani come rette diagonali. Poiché le rette (3.3.3)
intercetta√
no le coordinate ±r sugli assi, la lunghezza del lato è r 2. Gli intorni
del generico punto p ∈ R2 si ottengono da quelli dell’origine mediante
traslazione.
r
-r
0
r
r
-r
0
r
-r
-r
Intorni di (0, 0) nelle metriche d∞ e d1
5. Gli intorni in un sottospazio metrico (Y, dY ) di uno spazio metrico (X, d)
sono esattamente le intersezioni degli intorni nello spazio ambiente X con
Y . Infatti, per ogni p ∈ Y indichiamo con BY (p, r) l’intorno di p nel
sottospazio (Y, dY ). Si ha
BY (p, r) = {y ∈ Y : dY (p, y) < r} = {y ∈ Y : d(p, y) < r}
= B(p, r) ∩ Y .
Ad esempio, sia X = R con la metrica euclidea e Y = [0, +∞). Gli
intorni di 0 nel sottospazio Y , con la metrica indotta, sono gli intervalli
[0, r) = Y ∩ (−r, r). Se p > 0, gli intorni di p in (Y, dY ) sono gli intervalli
(p − r, p + r)
se
p−r ≥0
[0, p + r)
se
p − r < 0.
3.3. Intorni
53
[
0
)
p+r
p
Intorno di p nella metrica indotta
6. Sia (X, d) lo spazio metrico dell’esempio 3.2.2.9. Per ogni f ∈ X si ha
½
¾
B(f, r) = g ∈ X : sup |f (x) − g(x)| < r .
x
Quindi, per ogni g ∈ B(f, r) esiste δ > 0 tale che supx |f (x) − g(x)| = r−δ.
Ne segue
∀x ∈ [0, 1]
f (x) − (r − δ) ≤ g(x) ≤ f (x) + (r − δ) .
Quindi B(f, r) consiste delle funzioni g il cui grafico è compreso tra quello
di f (x) − r e f (x) + r, ma che si mantiene ‘discosto’ da questi due grafici
per un opportuno valore δ, dipendente da g.
f(x)+r
f(x)
g(x)
f(x)-r
0
1
7. Sia (X, d) metrico discreto. Se r > 1, qualunque y ∈ X soddisfa la
diseguaglianza d(p, y) < r, poiché la distanza può valere al massimo 1. In
questo caso B(p, r) = X. Al contrario, se r ≤ 1, l’unico punto tale che
d(p, y) < r ≤ 1 è il punto p stesso. In questo caso B(p, r) = {p} si riduce
al centro.
Dalla definizione di intorno circolare segue che, se r1 < r2 , allora B(p, r1 ) ⊆
B(p, r2 ). Negli spazi euclidei vale il segno ⊂ di inclusione stretta, ma in uno
spazio metrico generico intorni di raggio diverso possono coincidere. Ad esempio,
in uno spazio metrico discreto, al variare del raggio ci sono due soli intorni di
x, lo spazio totale e il singleton di x. In ogni caso vale però la proprietà di
separazione degli intorni, o proprietà di Hausdorff.
Teorema 3.3.4 (Proprietà di Haudorff ) Sia (X, d) metrico e siano x, y ∈
X. Se x 6= y, allora esiste r > 0 tale che
B(x, r) ∩ B(y, r) = ∅.
54
3. Spazi Metrici
Dimostrazione. Poniamo r = 13 d(x, y). Sia z ∈ B(x, r), e valutiamo d(y, z).
Si ha, per la diseguaglianza triangolare e la simmetria,
3r = d(x, y) ≤ d(x, z) + d(z, y)
≤ r + d(y, z),
da cui d(y, z) ≥ 2r. Quindi z ∈
/ B(y, r).
3.4
Classificazione dei punti
Sia (X, d) uno spazio metrico e A ⊆ X un suo sottoinsieme. Mediante la nozione
di intorno circolare, i punti di X si possono classificare, rispetto ad A, in punti
interni, esterni o di frontiera.
Definizione 3.4.1 Un punto p ∈ X si dice
1. interno ad A se
∃r > 0 tale che B(p, r) ⊆ A;
2. esterno ad A se
∃r > 0 tale che B(p, r) ⊆ Ac ;
3. di frontiera per A se
∀r > 0 B(p, r) ∩ A 6= ∅
e
B(p, r) ∩ Ac 6= ∅.
Le condizioni ai punti 1, 2 e 3 sono mutuamente esclusive: ogni punto di X
soddisfa una e una sola delle tre condizioni.
Dalle definizioni discendono le seguenti considerazioni immediate: un punto
interno ad A appartiene necessariamente ad A e un punto esterno ad A è interno
ad Ac .
La definizione di punto di frontiera è simmetrica rispetto ad A e ad Ac . In
altri termini, un punto è di frontiera per A se e solo se è di frontiera per Ac .
Quindi un punto di frontiera può appartenere sia ad A che ad Ac .
L’insieme dei punti di frontiera di A viene chiamato frontiera o contorno di
A ed è indicato con il simbolo ∂A. L’insieme dei punti interni di A è chiamato
interno di A ed è indicato con il simbolo Å.
A
C
punto di frontiera
punto esterno
A
punto interno
Punto interno, esterno, di frontiera
3.4. Classificazione dei punti
55
Esempi 3.4.2
1. In ogni spazio metrico (X, d), l’insieme X ha solo punti interni. D’altro
lato, ogni punto è esterno all’insieme vuoto ∅.
2. Sia A = (a, b) ⊂ R. Ogni punto p ∈ (a, b) è interno. Infatti, se
r < min(p − a, b − p),
B(p, r) = (p − r, p + r) ⊂ (a, b). In questo caso Ac = (−∞, a] ∪ [b, +∞),
ma i punti esterni sono tutti e soli i punti p tali che p < a oppure p > b.
I punti a e b sono di frontiera.
Analogamente, se A = [a, b], o A = [a, b), o A = (a, b], si ha Å = (a, b) e
∂A = {a, b}.
©
ª
3. Sia A = (x, y) ∈ R2 : x2 + y 2 < 1 . In questo caso
Å = A
e
©
ª
∂A = ∂Ac = (x, y) ∈ R2 : x2 + y 2 = 1 .
L’insieme dei punti esterni è
©
ª
(x, y) ∈ R2 : x2 + y 2 > 1 .
Analoghe considerazioni si possono applicare ad altre figure geometriche
piane o spaziali. Ad esempio, un poligono convesso in R2 ha l’insieme dei
lati come frontiera e come interno i punti della figura che non appartengono
ai lati.
4. In un qualunque spazio metrico (X, d) i punti di un intorno circolare
B(p, s) sono interni. Infatti, sia x ∈ B(p, s). L’intorno di x di raggio
r < s − d(p, x) è contenuto in B(p, s), poiché, per ogni y ∈ B(x, r), si ha
d(p, y) ≤ d(p, x) + d(x, y) < d(p, x) + s − d(p, x) = s.
y
r
x
s
p
Tutti punti di un intorno sono interni
56
3. Spazi Metrici
5. Sia A = Q ⊂ R e sia p ∈ Q. Ogni intervallo (p − r, p + r) contiene infiniti
razionali e infiniti irrazionali. Quindi p ∈ ∂Q.
Denotiamo con I = Qc l’insieme degli irrazionali. Se x ∈ I, ogni intervallo
(x − r, x + r) contiene infiniti razionali e infiniti irrazionali. Quindi si ha
pure x ∈ ∂Q. Poiché la frontiera di un insieme e del suo complementare
coincidono, si ha
∂Q = ∂I = R.
6. Sia A = B(p, s). Abbiamo visto nell’esempio 3.4.2.3 che in Rn , dotato
della metrica euclidea, si ha
∂A = {y ∈ Rn : d(p, y) = s}
e i punti esterni sono quelli che hanno da x distanza maggiore di s. In
uno spazio metrico generico ciò non è sempre vero. Se (X, d) è uno spazio
metrico discreto B(p, 1) = {p} e l’insieme dei punti {y ∈ X : d(p, y) = 1}
è Ac . D’altra parte, ogni punto x ∈ Ac è esterno, poiché
B(z, 1) = {z} ⊆ Ac .
In questo caso ∂A = ∅ e {y ∈ X : d(x, y) > 1} = ∅.
Studiamo ora un altro tipo di classificazione dei punti. Sia (X, d) uno spazio
metrico e sia A ⊆ X. Se un punto p non è esterno ad A, ogni suo intorno
ha intersezione non vuota con A. Ci sono due possibilità: o ogni intorno di p
contiene un punto di A diverso da p, oppure esiste un intorno di p in cui l’unico
punto di A è p stesso.
Definizione 3.4.3 Sia (X, d) uno spazio metrico e A ⊆ X un suo sottoinsieme.
Un punto p ∈ X si dice
1. di accumulazione per A se
∀r ∃x 6= p tale che x ∈ B(p, r) ∩ A;
2. isolato in A se
∃r
B(p, r) ∩ A = {p}.
Dalla definizione si ha che un punto isolato appartiene necessariamente ad
A. Invece un punto di accumulazione può appartenere o ad A o ad Ac , come
apparirà chiaro dagli esempi. L’insieme dei punti di accumulazione di A si indica
con A0 e si chiama insieme derivato di A.
Teorema 3.4.4 Sia (X, d) uno spazio metrico e A ⊆ X. Un punto p è di
accumulazione per A se e solo se ogni suo intorno contiene infiniti punti di A.
3.4. Classificazione dei punti
57
Dimostrazione. Sia p di accumulazione per A e supponiamo, per assurdo, che
esista un intorno B(p, s) contenente un numero finito di punti di A. Denotiamo tali punti con x1 , x 2 , . . . , xn , omettendo il punto p stesso nel caso che esso
appartenga ad A. Sia
0 < r < min (d(p, x1 ), d(p, x2 ), . . . , d(p, xn )) .
Allora, l’intorno B(p, r) non può contenere nessun punto di A diverso da p,
assurdo.
Corollario 3.4.5 Sia (X, d) uno spazio metrico e sia A ⊆ X un sottoinsieme
finito. Allora A0 = ∅.
Esempi 3.4.6
1. Sia A = (a, b) ⊂ R. Tutti i punti di (a, b) sono di accumulazione per A.
Anche gli estremi a e b sono di accumulazione. Quindi A0 = [a, b]. Non ci
sono punti isolati. Se A = [a, b], oppure A è un intervallo semiaperto, si
ha ancora A0 = [a, b].
2. Sempre in R con la metrica euclidea, consideriamo l’insieme
½
¾
1 1
1
A = 1, , , . . . , , . . . .
2 3
n
Ogni punto di A è isolato. Infatti, per n = 1 l’intorno B(1, s), con s < 1/2,
contiene solo il punto 1 di A. Per n = 2, l’intorno B(1/2, s), con s < 1/6,
contiene solo il punto 1/2 di A. Per n generico sia
0<s<
1
1
1
−
=
.
n n+1
n(n + 1)
L’intorno B(1/n, s) contiene solo il punto 1/n di A.
r
)
0
1
_
n
1
_
3
(
1
_ -s
2
1
_
2
)
1
_+s
2
1
A = {1 , 1/2 , 1/3 , . . . , 1/n, , . . .}, A0 = {0}
Il punto 0 è di accumulazione. Infatti, assegnato ad arbitrio r > 0, per
ogni n > 1/r i punti 1/n appartengono a B(0, r). È anche chiaro che non
ci sono altri punti di accumulazione. Quindi A0 = {0}.
58
3. Spazi Metrici
3. In R2 con la metrica euclidea sia A un intorno circolare di p di raggio r.
Ogni punto sulla circonferenza è di accumulazione, e ogni punto interno è
di accumulazione. Quindi
©
ª
A0 = x ∈ R2 : d(p, x) ≤ r .
Non ci sono punti isolati. L’analoga proprietà vale per figure geometriche
elementari piane o spaziali, e per gli intorni circolari in Rn .
4. Sia A = Q ⊂ R. Il ragionamento dell’esempio 3.4.2.5 mostra che ogni numero reale è di accumulazione per Q ⊂ R, ovvero Q0 = R. Analogamente,
I0 = R
5. Sia (X, d) metrico discreto e A ⊆ X non vuoto. Ogni punto p ∈ A è
isolato, poiché l’intorno di raggio 1 di p contiene solo p. Ovviamente non
ci possono essere punti di accumulazione.
In generale, uno spazio metrico viene chiamato discreto se ogni suo punto
è isolato, anche se la distanza non assume solo i valori 0 e 1. Ad esempio,
N, con la metrica indotta da quella euclidea, ha solo punti isolati. Per
chiarezza di linguaggio, noi useremo il termine ‘spazio metrico discreto’
solo per gli spazi dotati della distanza discreta, che assume unicamente i
valori 0 e 1.
Nello spazio euclideo Rn ogni punto isolato di A è anche punto di frontiera
per A. Questo non vale in generale, come mostra l’esempio 3.4.6.5. Nella metrica
discreta la frontiera di un qualunque sottoinsieme A è vuota e ogni punto di A
è sia isolato che interno. In generale possiamo affermare i seguenti fatti:
a) un punto di A o è interno, oppure è di frontiera per A;
b) un punto di A o è di accumulazione per A, oppure è isolato;
c) un punto di frontiera per A o è di accumulazione per A, oppure è isolato;
d) un punto interno e un punto isolato di A appartengono necessariamente ad
A;
e) un punto di accumulazione per A non appartiene necessariamente ad A.
3.5
Insiemi aperti, chiusi, limitati
Definizione 3.5.1 Sia (X, d) uno spazio metrico e A ⊆ X. Si dice che A è
aperto se A = Å. Si dice che A è chiuso se Ac è aperto.
Quindi, un insieme A non vuoto è aperto se e solo se tutti i suoi punti sono
interni. I chiusi si possono caratterizzare in termini di punti di accumulazione.
Teorema 3.5.2 Sia (X, d) uno spazio metrico e sia A ⊆ X. L’insieme A è
chiuso se e solo se A0 ⊆ A.
3.5. Insiemi aperti, chiusi, limitati
59
Dimostrazione. Sia A chiuso e sia p ∈ Ac . Poiché p è interno ad Ac , esiste un
intorno B(p, r) che non contiene punti di A. Quindi p non è di accumulazione
per A. In altri termini, A0 ⊆ A.
Viceversa, sia A0 ⊆ A e sia p un qualunque punto di Ac . Per ipotesi p non è
di accumulazione per A. Questo significa che esiste un intorno B(p, r) che non
contiene alcun punto di A diverso da p. Dato che p ∈ Ac , B(p, r) non contiene
nessun punto di A; perciò B(p, r) ⊆ Ac . Quindi p è interno ad Ac . Ne segue
che Ac è aperto.
Esempi 3.5.3
1. In ogni spazio metrico (X, d) l’insieme X è aperto, poiché tutti suoi punti
sono interni. X è anche chiuso perché, essendo l’insieme totale, contiene
necessariamente X 0 . Ne segue che anche ∅ è sia chiuso che aperto.
2. In qualunque spazio metrico (X, d) un insieme finito A è chiuso. Infatti,
A0 = ∅ ⊂ A, per il Corollario 3.4.5.
3. Ogni intervallo (a, b) ⊂ R è aperto. Cosı̀ pure sono aperti gli intervalli
(a, +∞) e (−∞, a). Gli intervalli [a, b] sono chiusi, come pure gli intervalli
[a, +∞) e (−∞, a]. Le definizioni di intervalli aperti e chiusi del capitolo
1 sono quindi coerenti con la definizione 3.5.1 di insiemi aperti e chiusi.
Gli intervalli del tipo [a, b) e (a, b] non sono né aperti né chiusi. Infatti
uno dei due estremi appartiene all’insieme ma non è interno, mentre l’altro
estremo è punto di accumulazione, ma non appartiene all’insieme.
4. Sia (X, d) uno spazio metrico, sia Y ⊆ X un insieme non vuoto, e consideriamo il sottospazio (Y, dY ) con la metrica indotta. Abbiamo visto
nell’esempio 3.3.2.5 che gli intorni di un punto y ∈ Y nella metrica indotta sono gli insiemi B(y, r) ∩ Y . Da questo segue che gli aperti nella
metrica indotta sono esattamemte gli insiemi A ∩ Y , ove A è aperto in X.
5. Sia (X, d) uno spazio metrico e B(p, r) ⊆ X un qualunque intorno circolare. Nell’esempio 3.4.2.4 abbiamo mostrato che ogni punto di B(p, r) è
interno. Quindi B(p, r) è aperto. In maniera del tutto analoga si dimostra
che l’insieme
A = {x ∈ X : d(p, x) > r}
è aperto. Ne segue che il suo complementare
{x ∈ X : d(p, x) ≤ r}
è chiuso. In particolare, in R2 è chiuso un cerchio che includa la sua
circonferenza e in R3 una sfera che includa la sua superficie sferica. Analogamente, figure geometriche elementari piane, o spaziali, che includano
il loro contorno, sono chiuse.
6. Sia (X, d) metrico discreto e A ⊆ X non vuoto. Poiché ogni punto di A è
interno, A è aperto. D’altra parte, A0 = ∅, e quindi A è anche chiuso.
60
3. Spazi Metrici
Teorema 3.5.4 Se A ⊆ R è un insieme chiuso e limitato superiormente, allora
sup A ∈ A. Se A è chiuso e limitato inferiormente, allora inf A ∈ A.
Dimostrazione. Sia p = sup A. Per ogni r > 0, deve esistere x ∈ A tale
che p − r < x ≤ p, altrimenti p non sarebbe il minimo dei maggioranti. In
altri termini, per ogni r > 0 esiste x ∈ A tale che x ∈ B(p, r). Quindi p non
è esterno ad A. Perciò, o p è isolato, nel qual caso appartiene ad A, o p è di
accumulazione, nel qual caso, essendo A chiuso, appartiene ancora ad A.
Una analoga dimostrazione vale per l’estremo inferiore.
Teorema 3.5.5 Sia (X, d) uno spazio metrico e {Ai }i∈I una famiglia qualunque di sottoinsiemi aperti di X. Allora
a)
A=
[
Ai è aperto.
i∈I
b) Se la famiglia è finita, sia essa {A1 , A2 , . . . , An }, allora,
A=
n
\
Ai è aperto.
i=1
Dimostrazione. a) Dimostriamo che ogni p ∈ A è interno ad A. Esiste un
indice i0 ∈ I tale che p ∈ Ai0 . Poiché Ai0 è aperto, p è interno a Ai0 . Quindi
esiste r tale che B(p, r) ⊆ Ai0 . Si ha
[
B(p, r) ⊆ Ai0 ⊆
Ai .
i∈I
Quindi p è interno ad A.
b) Sia p ∈ ∩ni=1 Ai . Poiché ogni Ai è aperto, per ogni i = 1, . . . , n esiste
ri > 0 tale che
B(p, ri ) ⊆ Ai .
Sia r = mini ri . Allora, per ogni i = 1, . . . , n, si ha
B(p, r) ⊆ B(p, ri ) ⊆ Ai .
Ne segue
B(p, r) ⊆
n
\
Ai
i=1
e quindi p è interno all’intersezione.
In generale l’intersezione di infiniti aperti non è un insieme aperto. Ad
esempio, sia Ak = (−1/k, 1), k ∈ N. Si ha ∩∞
k=1 Ak = [0, 1), che non è aperto né
chiuso.
Teorema 3.5.6 Sia (X, d) uno spazio metrico e {Ai }i∈I una famiglia qualunque di sottoinsiemi chiusi di X. Allora
3.5. Insiemi aperti, chiusi, limitati
a)
A=
\
61
Ai
è chiuso.
i∈I
b) Se la famiglia è finita, sia essa {A1 , A2 , . . . , An }, allora
A=
n
[
Ai è chiuso.
i=1
Dimostrazione. a) Passando ai complementari, si ha che ogni Aci è aperto. Si
ha inoltre
´c [
³\
Ac =
Ai
=
Aci .
i∈I
i∈I
Per il Teorema precedente Ac è aperto e quindi A è chiuso.
b) Si dimostra nella stessa maniera.
L’unione di infiniti chiusi in generale non è un insieme chiuso. Ad esempio,
se Ak = [1/k, 1], ove k ∈ N, si ha ∪∞
k=1 Ak = (0, 1], che non è chiuso né aperto.
Definizione 3.5.7 Sia (X, d) uno spazio metrico e sia A ⊆ X. Si chiama
chiusura di A l’insieme
A = A ∪ A0 .
La chiusura di un insieme è il ‘più piccolo’ chiuso che contiene l’insieme, nel
senso chiarito dal seguente Teorema.
Teorema 3.5.8 Sia (X, d) uno spazio metrico e sia A ⊆ X.
a) A è un insieme chiuso.
b) Se F è un insieme chiuso tale che F ⊇ A, allora F ⊇ A.
c) Se A è chiuso, allora A = A.
d Se A ⊇ B, allora A ⊇ B.
Dimostrazione. a) Mostriamo che ogni punto di accumulazione di A appartiene a A.
Se p è un punto di accumulazione per A ∪ A0 , allora p deve essere di accumulazione per almeno uno dei due sottoinsiemi.
Se p è di accumulazione per A, allora p ∈ A0 . Se p è di accumulazione per A0 ,
ogni intorno B(p, r) deve contenere un punto x ∈ A0 . Poiché B(p, r) è aperto,
esiste s > 0 tale che B(x, s) ⊂ B(p, r). Poiché B(x, s) contiene infiniti punti di
A, lo stesso vale per B(p, r). Quindi, di nuovo, p ∈ A0 .
b) I punti di accumulazione di A sono anche punti di accumulazione di F .
Poiché F è chiuso, si ha F ⊇ A ∪ A0 .
c) Segue da b).
d) Poiché A ⊇ B, la tesi segue da a) e b).
62
3. Spazi Metrici
Esempi 3.5.9
˙ oppure A = [a, b), oppure A = (a, b]. Per tutti questi
1. In R sia A = (a, b),
intervalli si ha A = [a, b].
2. Sia A = {1, 1/2, . . . , 1/n, . . .} ⊂ R. Si ha
A = A ∪ {0} .
3. In Rn si ha (si confronti con l’esempio 3.5.3.5)
B(p, r) = {x ∈ Rn : ||p − x|| ≤ r} .
4. Se A = Q, si ha Q = R.
Nel capitolo I abbiamo definito la nozione di sottoinsieme limitato di R
mediante la relazione d’ordine per i numeri reali. Benché uno spazio metrico
generico non sia un insieme ordinato, il concetto di insieme limitato si può
definire mediante la distanza. In R, dotato della metrica euclidea, la definizione
metrica che ora enunciamo è coerente con la definizione basata sull’ordinamento.
Definizione 3.5.10 Sia (X, d) uno spazio metrico e sia A ⊆ X, A non vuoto.
Si dice diametro di A la quantità
diam A = sup d(x, y).
x,y∈A
Se diam A < +∞, si dice che A è limitato.
Esempi 3.5.11
1. Nel caso di figure geometriche elementari, piane o spaziali, il diametro
appena definito coincide con la usuale nozione di diametro.
2. Sia A ⊂ R non vuoto e limitato, sia superiormente che inferiormente.
Allora
diam A = sup A − inf A.
Quindi A è limitato anche secondo la nuova definizione.
3. In uno spazio metrico discreto il diametro di qualunque insieme con almeno
due punti è 1.
Teorema 3.5.12 Sia (X, d) uno spazio metrico e sia A ⊆ X non vuoto. Allora
a) diam A = 0 se e solo se A è un singleton.
b) Se A ⊆ B allora diam A ≤ diam B.
c) diam A = diam A.
3.5. Insiemi aperti, chiusi, limitati
63
Dimostrazione. a) Se A = {x}, ovviamente il diametro di A è zero. Viceversa,
se A contiene due punti distinti x e y, si ha diam A ≥ d(x, y) > 0.
b) Se x e y sono punti di A ⊆ B, si ha d(x, y) ≤ diam B. Passando
all’estremo superiore, si ha l’asserto.
c) Per il punto b) si ha diam A ≤ diam A. Se diam A = +∞, si ha diam A =
+∞. Supponiamo quindi A limitato e dimostriamo che diam A ≤ diam A.
Siano x, y ∈ A. Per ogni ε > 0 esistono a, b ∈ A tali che
d(x, a) < ε,
d(y, b) < ε.
Infatti, se x ∈ A basta scegliere a = x; se x ∈ A0 , si sceglie a ∈ A ∩ B(x, ε). Lo
stesso vale per b. Si ha, applicando due volte la diseguaglianza triangolare,
d(x, y) ≤ d(x, a) + d(a, b) + d(b, y)
< d(a, b) + 2ε
≤ diam A + 2ε.
Quindi diam A + 2ε maggiora tutti i numeri d(x, y). Passando all’estremo superiore si ha
∀ε > 0
diam A ≤ diam A + 2ε.
Per l’arbitrarietà di ε segue la tesi.
Infine, osserviamo che, aggiungendo un numero finito di punti a un insieme
limitato, si ottiene ancora un insieme limitato.
Teorema 3.5.13 Sia (X, d) uno spazio metrico e sia A ⊆ X non vuoto e
limitato. Sia {x1 , x2 , . . . , xn } ⊆ X un insieme finito. Allora
B = A ∪ {x1 , x2 , . . . , xn }
è limitato.
Dimostrazione. Possiamo supporre n = 1. Ripetendo n volte il ragionamento
si ottiene il caso generale.
Fissiamo un qualunque punto x ∈ A e poniamo δ = d(x1 , x). Si ha, per ogni
y ∈ A,
d(x1 , y) ≤ d(x1 , x) + d(x, y)
< δ + diam A.
Ne segue diam B ≤ δ + diam A.
Con la analoghi ragionamenti si dimostra che l’unione di due insiemi limitati
è ancora limitata.
64
3. Spazi Metrici
3.6
Compattezza
Definizione 3.6.1 Sia (X, d) uno spazio metrico e sia E ⊆ X. Sia {Ai }i∈I
una famiglia qualunque di sottoinsiemi aperti di X. Diciamo che la famiglia
{Ai }i∈I è una copertura aperta di E se
E⊆
[
Ai .
i∈I
Esempi 3.6.2
∞
1. La famiglia {An }n=3 degli intervalli An = (1/n, 1 − 1/n) costituisce una
copertura aperta dell’intervallo E = (0, 1). In questo caso la famiglia è
numerabile.
2. La famiglia {Ax }x∈[0,1] degli intervalli Ax = (x − 1/2, x + 1/2) costituisce
una copertura aperta dell’intervallo E = [0, 1]. In questo caso la famiglia
è indicizzata mediante [0, 1] stesso.
3. Se E ⊆ R2 non è vuoto, la famiglia {Qp }p∈E dei quadrati aperti di lato 1,
centrati nei punti p ∈ E, è una copertura aperta di E. In questo caso la
famiglia è indicizzata con i centri, cioè i punti di E.
E
Alcuni quadrati della copertura di E
Data una copertura aperta {Ai }i∈I di E, indicheremo con
{Ai1 , Ai2 , . . . , Ain }
una sottofamiglia finita di {Ai }i∈I .
Definizione 3.6.3 Una sottocopertura finita estratta dalla copertura aperta
{Ai }i∈I di E è una sottofamiglia finita {Ai1 , Ai2 , . . . , Ain } tale che
E⊆
n
[
k=1
Aik .
3.6. Compattezza
65
©
ª
Nell’esempio 3.6.2.2 precedente, la famiglia A0 , A1/2 , A1 è una sottocopertura finita estratta dalla copertura {Ax }x∈[0,1] di E. Infatti
[0, 1] ⊂ (−1/2, 1/2) ∪ (0, 1) ∪ (1/2, 3/2).
Definizione 3.6.4 Sia (X, d) uno spazio metrico. Un insieme E ⊆ X si dice
compatto se da ogni copertura aperta di E si può estrarre una sottocopertura
finita.
Esempi 3.6.5
1. Sia (X, d) uno spazio metrico e sia E = {x} un singleton. Si vede facilmente che E è compatto. Infatti, sia {Ai }i∈I una copertura aperta di
E. Allora x ∈ ∪i∈I Ai . Quindi esiste un insieme Ai1 della famiglia tale
che x ∈ Ai1 . In questo caso la sottofamiglia {Ai1 } costituita dal singolo
aperto Ai1 è una sottocopertura finita di E.
Analogamente, se E = {x1 , x2 } ha due elementi, e se {Ai }i∈I è una copertura aperta di E, devono esistere Ai1 e Ai2 tali che
x1 ∈ Ai1 ,
x2 ∈ Ai2 .
Quindi
{x1 , x2 } ⊆ Ai1 ∪ Ai2 .
La famiglia {Ai1 , Ai2 } è una sottocopertura finita di E. In modo analogo
si dimostra che ogni insieme finito in X è compatto.
2. Sia E = (0, 1) e siano An = (1/n, 1−1/n) gli insiemi della copertura aperta
∞
di E dell’esempio 3.6.2.1. Dalla famiglia {An }n=3 non si può estrarre
nessuna sottocopertura finita. Infatti
n
[
Ak
k=3
non contiene i punti degli intervalli (0, 1/n) e (1 − 1/n, 1). Quindi (0, 1)
non è compatto.
3. Sia (X, d) metrico discreto e sia E ⊆ X infinito. Allora E non è compatto.
Infatti, {B(x, 1/2)}x∈E è una copertura aperta di E. Ogni insieme della
copertura è il singleton {x}. Quindi nessuna sottofamiglia finita può essere
una sottocopertura di E.
Teorema 3.6.6 Sia (X, d) uno spazio metrico e sia E ⊆ X non vuoto. Se E è
compatto, allora:
a) E è limitato.
b) E è chiuso.
66
3. Spazi Metrici
c) Per ogni sottoinsieme infinito A ⊆ E, si ha A0 6= ∅.
Dimostrazione. a) Consideriamo la copertura aperta di E costituita dagli
intorni di raggio 1 dei punti di E, cioè.
{B(p, 1)}p∈E .
Per la compattezza di E si può estrarre una sottocopertura finita. Quindi esistono n punti di E, siano essi p1 , p2 , . . . , pn , tali che la famiglia
{B(p1 , 1), B(p2 , 1) . . . , B(pn , 1)}
è una sottocopertura finita, cioè
n
[
E⊆
B(pk , 1).
k=1
Poniamo
δ = max {d(pi , pj ) : 1 ≤ i, j ≤ n} .
Siano x, y ∈ E. Esistono due centri pi e pj tali che
d(x, pi ) < 1,
d(y, pj ) < 1.
Ne segue
d(x, y) ≤ d(x, pi ) + d(pi , pj ) + d(pj , y)
< 2 + δ.
Quindi diam E ≤ 2 + δ.
b) Dimostriamo che E c è aperto. Sia y ∈ E c e poniamo, per ogni p ∈ E,
r(p) =
1
d(y, p) > 0.
3
La famiglia di tutti gli intorni B(p, r(p)) è una copertura aperta di E. Per la
compattezza di E, si può estrarre una sottocopertura finita. Quindi esistono n
punti di E, siano essi p1 , p2 , . . . , pn , tali che
E⊆
n
[
B(pk , r(pk )).
k=1
Sia r = mink r(pk ). Per ogni x ∈ E esiste pk tale che d(pk , x) < r(pk ). Quindi
d(y, x) ≥ d(y, pk ) − d(pk , x) > 3r(pk ) − r(pk ) = 2r(pk )
≥ 2r.
Quindi B(y, r) ∩ E = ∅, cioè y è interno ad Ac .
3.6. Compattezza
67
c) Se, per assurdo, A0 = ∅, nessun p ∈ E è di accumulazione per A. Quindi,
per ogni p ∈ E esiste un intorno B(p, r(p)) tale che B (p, r(p)) ∩ A è vuoto o
finito.
Poiché la famiglia{B (p, r(p))}p∈E è una copertura aperta di E, per la compattezza di E si può estrarre una sottocopertura finita. Quindi esistono n punti
di E, siano essi p1 , p2 , . . . , pn , tali che
A⊆E⊆
n
[
B(pk , r(pk )).
(3.6.7)
k=1
L’unione a destra in (3.6.7) può contenere al più un numero finito di elementi
di A, contro l’ipotesi che A sia infinito.
Si noti che se E è compatto e A ⊆ E, ogni punto di accumulazione di A è
anche punto di accumulazione di E. Poiché E è chiuso, A0 ⊆ E.
In generale, un sottoinsieme chiuso e limitato non è necessariamente compatto. Ad esempio, sia (X, d) uno spazio metrico discreto e sia X infinito. Allora,
X è chiuso e limitato, ma non compatto.
La proprietà c) è non solo necessaria, ma anche sufficiente per la compattezza
di E. Vale infatti il seguente Teorema, la cui dimostrazione esula però dagli scopi
di questo libro.
Teorema 3.6.8 Sia (X, d) uno spazio metrico e sia E ⊆ X. Condizione necessaria e sufficiente affinché E sia compatto è che ogni sottoinsieme infinito di
E abbia almeno un punto di accumulazione in E.
Teorema 3.6.9 Sia (X, d) uno spazio metrico e sia E ⊆ X compatto. Sia
F ⊆ E un sottoinsieme chiuso. Allora F è compatto.
Dimostrazione. Sia {Ai }i∈I una copertura aperta di F . Denotiamo con F c il
complementare di F in X. Poiché
[
F ⊆
Ai ,
i∈I
si ha anche
E⊆X=
[
Ai ∪ F c .
i∈I
Quindi la famiglia
{Ai , F c }i∈I
è una copertura aperta di E. Esiste perciò una sottocopertura finita di E
estratta da questa famiglia. A questa sottocopertura finita possiamo aggiungere
F c , qualora già non vi appartenga. Quindi
F ⊆E⊆
n
[
k=1
Aik ∪ F c .
68
3. Spazi Metrici
Ne segue
n
[
F ⊆
Ai k .
k=1
Corollario 3.6.10 Sia (X, d) uno spazio metrico. Sia E ⊆ X compatto e F ⊆
X chiuso. Allora F ∩ E è compatto.
In generale l’intersezione di una successione decrescente di insiemi può essere
vuota. Ad esempio, se En = (n, +∞) si ha ∩+∞
n En = ∅. Tuttavia, se gli insiemi
sono compatti, l’intersezione della famiglia non può essere vuota.
Teorema 3.6.11 Sia (X, d) uno spazio metrico e {En }∞
n=1 un famiglia di compatti in X tali che
E1 ⊇ E2 ⊇ · · · ⊇ En ⊇ · · ·
Allora
∞
\
En 6= ∅.
n=1
Dimostrazione. Supponiamo per assurdo che l’intersezione sia vuota. Allora
∞
[
E1 ⊆ X =
Enc .
n=1
Poichè E1 è compatto e gli Enc sono aperti, esiste una sottofamiglia finita
© c
ª
En1 , Enc 2 , . . . , Enc k
tale che
E1 ⊆
k
[
Enc j .
(3.6.12)
j=1
Passando ai complementari nella relazione (3.6.12), e tenendo presente che la
successione di insiemi è decrescente rispetto all’inclusione, si ha
E1c ⊇
k
\
Enj = Enk .
j=1
Questo è assurdo poichè Enk ⊆ E1 .
Terminiamo questo paragrafo con un’osservazione sulla compattezza in un
sottospazio di (X, d).
Sia Y ⊆ X non vuoto, e sia (Y, dY ) il sottospazio con la metrica indotta
da X. Come abbiamo osservato nel paragrafo precedente, un insieme C ⊆ Y
è aperto nel sottospazio (Y, dY ) se e solo se esiste un aperto A ⊆ X tale che
C = A ∩ Y . Ne segue che Y è compatto come sottoinsieme di X se e solo se Y
è compatto nella metrica indotta.
3.7. Il Teorema di Heine–Borel
3.7
69
Il Teorema di Heine–Borel
Per il Teorema 3.6.6 del paragrafo precedente, un insieme compatto in uno spazio metrico (X, d) è necessariamente chiuso e limitato. D’altra parte, l’ esempio
3.6.5.3 mostra che un insieme chiuso e limitato non è necessariamente compatto.
Tuttavia, in Rn dotato della metrica euclidea le due condizioni si equivalgono.
Teorema 3.7.1 (di Heine–Borel) Un insieme E ⊂ Rn è compatto se e solo
se è chiuso e limitato.
La dimostrazione del Teorema di Heine–Borel è svolta nell’Appendice.
Corollario 3.7.2 (Teorema di Bolzano–Weierstrass) Sia A ⊂ Rn un insieme infinito e limitato. Allora A ha almeno un punto di accumulazione.
Dimostrazione. Sia δ = diam A < +∞. Fissato p ∈ A, per ogni x ∈ A si ha
||p − x|| ≤ δ. Quindi
A ⊆ B(p, δ).
Per il Teorema di Heine–Borel l’insieme chiuso e limitato B(p, δ) è compatto.
Per il punto c) del Teorema 3.6.6, A0 6= ∅.
3.8
Connessione
Definizione 3.8.1 Sia (X, d) uno spazio metrico. Siano A e B sottoinsiemi
non vuoti di X. Si dice che A e B sono separati se
A ∩ B = ∅,
A ∩ B = ∅.
Il concetto di separazione è più forte di quello di disgiunzione. Se due insiemi
sono separati, essi sono ovviamente disgiunti, ma due insiemi possono essere
disgiunti senza essere separati.
Esempi 3.8.2
1. Sia A = (a, b) e B = (b, c). I due insiemi sono separati, poiché A = [a, b]
non ha punti in comune con B, e B = [b, c] non ha punti comuni con A.
2. Sia A = (a, b) e B = [b, c). I due insiemi non sono separati, pur essendo
disgiunti. Infatti A ∩ B = {b}.
3. Se A0 = ∅ e B 0 = ∅, allora A e B sono separati se e solo se sono disgiunti.
In particolare, in qualunque spazio metrico (X, d), due insiemi finiti che
non hanno punti in comune sono separati. Per lo stesso motivo, in uno
spazio metrico discreto due qualunque insiemi disgiunti e non vuoti sono
separati.
70
3. Spazi Metrici
Definizione 3.8.3 Sia (X, d) uno spazio metrico, e sia E ⊆ X non vuoto. Si
dice che E è connesso se non esistono due insiemi A e B non vuoti e separati
tali che E = A ∪ B.
A
B
A
A
A
B
B
B
E = A ∪ B non connesso
E = A ∪ B connesso
I sottoinsiemi connessi di R hanno una semplice caratterizzazione.
Teorema 3.8.4 Sia E ⊆ R, dotato della metrica euclidea. L’insieme E è connesso se e solo se E è un singleton oppure un intervallo (di qualsiasi tipo).
Dimostrazione. Se E = {p} è un singleton, allora E è connesso. Sia E un
intervallo e supponiamo, per assurdo, che esistano A e B non vuoti e separati
tali che A ∪ B = E. Siano a ∈ A e b ∈ B, con, ad esempio, a < b. Poiché E è
un intervallo, ogni punto di [a, b] appartiene ad A oppure a B. Poniamo
p = sup {x : x ∈ A ∩ [a, b]} .
Il punto p non può appartenere a B, poiché p appartiene a A, per il Teorema
3.5.4. Quindi p ∈ A. Ne segue p < b e (p, b] ⊆ B. Ma allora p ∈ B, assurdo.
Viceversa, supponiamo E connesso. Dimostriamo che se E non è un singleton, allora E deve essere un intervallo. Ragioniamo per assurdo. Se E non è un
intervallo devono esistere tre numeri
x<z<y
tali che x ∈ E, y ∈ E ma z ∈
/ E. Poniamo
A = (−∞, z) ∩ E,
B = E ∩ (z, +∞).
A e B non sono vuoti, poiché x ∈ A e y ∈ B. Essi sono separati, poiché lo
sono gli intervalli (−∞, z) e (z, +∞). Chiaramente A ∪ B = E. Quindi E non
è connesso, assurdo
Esempi 3.8.5
1. In ogni spazio metrico (X, d) ogni insieme finito E = {x1 , . . . , xn }, con
n ≥ 2, non è connesso. Infatti, basta porre A = {x1 } e B = {x2 , . . . , xn }.
Più generalmente, se E ha un punto isolato p, allora non è connesso.
Infatti, basta porre A = {p} e denotare con B il complementare di A in
E. Il singleton {p} è chiuso, cosicché A ∩ B = ∅. Inoltre, poiché p non
può essere di accumulazione per B, si ha A ∩ B = ∅.
3.9. R come spazio metrico
71
2. È intuitivo che ogni poligono convesso nel piano e ogni poliedro convesso
nello spazio è connesso. Più in generale, in R2 e in R3 ogni figura convessa
(cioè tale che, se contiene due punti, allora contiene anche il segmento che
li unisce) è connessa. I cerchi e le sfere sono connessi. Analogamente, ogni
intorno circolare in Rn è connesso.
3.9
R come spazio metrico
Sia, secondo la definizione del capitolo 1, R = R∪ {−∞, +∞}. In questo paragrafo ci proponiamo di definire una metrica in R, la cui restrizione a R è
equivalente, nel senso precisato nell’Appendice, alla metrica euclidea. A questo
scopo consideriamo la funzione
g(x) =
x
.
1 + |x|
Essa applica biunivocamente R su (−1, 1). Infatti, per ogni y ∈ (−1, 1) l’equazione
x
y=
1 + |x|
ha l’unica soluzione
x=
y
.
1 − |y|
In particolare, g è la funzione inversa della funzione f introdotta nel paragrafo
2.7 per dimostrare il Teorema di Cantor.
1
-1
La funzione g(x) =
x
1 + |x|
Estendiamo g a R ponendo
g(+∞) = 1,
g(−∞) = −1
Questa estensione applica biunivocamente R su [−1, 1].
72
3. Spazi Metrici
Definizione 3.9.1 Per ogni x, y ∈ R poniamo
d∗ (x, y) = |g(x) − g(y)| .
È immediato verificare che d∗ è una metrica su R tale che
diam R = diam R = d∗ (−∞, +∞) = 2.
È interessante notare che se x e p sono due numeri reali non negativi, si ha
g(x) = 1 −
1
,
x+1
g(p) = 1 −
1
p+1
e quindi
¯
¯
¯ 1
1 ¯¯
¯
d (x, p) = ¯
−
.
(3.9.2)
1 + x 1 + p¯
In questo caso distanza d∗ è la distanza euclidea tra i reciproci di x + 1 e p + 1.
Se p = +∞ e x ≥ 0, allora
∗
1
.
(3.9.3)
1+x
Quindi, se x è ‘grande’, la sua distanza da +∞ è ‘piccola’. In modo analogo, se
x e p sono numeri reali non positivi si ha
¯
¯
¯ 1
1 ¯¯
d∗ (x, p) = ¯¯
−
1 − x 1 − p¯
d∗ (x, +∞) = |1 − g(x)| =
e d∗ (x, −∞) = 1/(1 − x).
¡
¢
Denotiamo con B ∗ (p, ε) gli intorni di p ∈ R nello spazio metrico R, d∗ .
Esaminiamo dapprima gli intorni di +∞, supponendo per semplicità ε < 1.
Tenendo conto di (3.9.3) si ha
½
¾
1
∗
B (+∞, ε) = x ∈ R+ :
< ε ∪ {+∞}
1+x
½
¾
1
= x ∈ R+ : − 1 < x ∪ {+∞} .
ε
Per questo motivo, posto M = 1/ε − 1, gli intervalli reali (M, +∞) (anche con
M ≤ 0) vengono chiamati intorni di +∞. Il linguaggio è improprio, visto che
si esclude +∞ da questi insiemi, ma è efficace quando si trattano funzioni a
valori reali (che non assumono quindi i valori +∞ o −∞). Simmetricamente,
gli intervalli reali (−∞, M ) vengono chiamati intorni di −∞.
Teorema 3.9.4 Se E ⊆ R è illimitato superiormente, allora +∞ è un punto
di accumulazione di E nella metrica d∗ . Se E ⊆ R è illimitato inferiormente,
allora −∞ è un punto di accumulazione di E nella metrica d∗ .
Dimostrazione. Sia E ⊆ R illimitato superiormente. Poiché nessun numero
reale è un maggiorante per E, per ogni M esiste un elemento x ∈ E tale che
x > M . Quindi ogni intorno di +∞ contiene un punto di E (ovviamente diverso
da +∞).
Se E ⊆ R è illimitato inferiormente la dimostrazione è analoga.
3.10. Appendice
3.10
3.10.1
73
Appendice
Compattezza in Rn
In questo sottoparagrafo dimostriamo il Teorema di Heine–Borel. Iniziamo con
due Lemmi.
Lemma 3.10.1 Sia I1 ⊇ I2 ⊇ . . . Im ⊇ . . . una successione non crescente di
intervalli chiusi e limitati in R. Allora
∞
\
Im 6= ∅.
m=1
Dimostrazione. Sia Im = [am , bm ]. Si ha
a1 ≤ a2 ≤ . . . am ≤ . . .
b1 ≥ b2 ≥ . . . bm ≥ . . .
Inoltre, per ogni j e k si ha aj < bk . Infatti, se j ≥ k, si ha [aj , bj ] ⊆ [ak , bk ] e
quindi
ak ≤ aj < bj ≤ bk .
Se j < k si ha
ak < bk ≤ bj .
Sia z = supj aj . Ogni bk è un maggiorante, per cui z ≤ inf k bk . Per ogni m si
ha quindi am ≤ z ≤ bm , cioè z ∈ ∩∞
m=1 Im .
Definizione 3.10.2 Siano I1 , I2 , . . . , In intervalli chiusi e limitati in R. Si
chiama rettangolo (o rettangolo chiuso) il prodotto cartesiano
R = I1 × I2 × . . . × In .
Nel piano R è un rettangolo nel senso della geometria elementare, e un
parallelepipedo retto nello spazio.
Posto Ij = [aj , bj ], il rettangolo R è individuato dai due estremi
a = (a1 , a2 , . . . , an ),
b = (b1 , b2 , . . . , bn ).
Si può anche descrivere come l’insieme
R = {x ∈ Rn : a1 ≤ x1 ≤ b1 , a2 ≤ x2 ≤ b2 , . . . , an ≤ xn ≤ bn } .
Si ha chiaramente diam R = ka − bk. Il centro c di R è il punto di coordinate
c1 =
a1 + b1
a2 + b2
an + bn
, c2 =
, . . . , cn =
.
2
2
2
In R2 le due rette x1 = c1 e x2 = c2 dividono R in quattro rettangoli eguali, che
hanno in comune a due a due solo punti di frontiera. In R3 i tre piani x1 = c1 ,
74
3. Spazi Metrici
x2 = c2 e x3 = c3 dividono R in otto parallelepipedi retti eguali, che hanno
in comune a due a due solo punti di frontiera. In Rn gli iperpiani xj = cj per
j = 1, . . . , n, dividono R in 2n rettangoli chiusi eguali, che hanno in comune a
due a due solo punti di frontiera. Ciascuno dei 2n rettangoli chiusi ha diametro
ka − bk /2.
Lemma 3.10.3 Sia R1 ⊇ R2 ⊇ . . . Rm ⊇ . . . una successione non crescente di
intervalli chiusi e limitati in Rn . Allora
∞
\
Rm 6= ∅.
m=1
Dimostrazione. Sia Rm = I1,m × I2,m × . . . × In,m . Per l’ipotesi di inclusione
si ha
I11 ⊇ I12 ⊇ . . . I1m ⊇ . . .
I21 ⊇ I22 ⊇ . . . I2m ⊇ . . .
......
In1 ⊇ In2 ⊇ . . . Inm ⊇ . . .
Si ha cosı̀, per il Lemma 3.10.1,
∞
\
m=1
Rm =
∞
\
m=1
I1m ×
∞
\
m=1
I2m × · · ·
∞
\
Inm 6= ∅.
m=1
Dimostrazione del Teorema di Heine–Borel. Dimostriamo che ogni
sottoinsieme chiuso e limitato E ⊂ Rn è compatto, iniziando dal caso in cui
E = R è un rettangolo chiuso di estremi a e b.
Supponiamo per assurdo che R non sia compatto. In tal caso esiste una
copertura aperta {Ai }i∈I di R da cui non si può estrarre alcuna sottocopertura
finita. Dividiamo R in 2n rettangoli mediante gli iperpiani xj = cj , come
descritto sopra, e indichiamo con S il generico rettangolo cosı̀ ottenuto.
La famiglia {Ai }i∈I è, a maggior ragione, una copertura aperta di ciascuno degli S. Se per ogni S si potesse estrarre da {Ai }i∈I una sottocopertura
finita, allora l’unione di tutti gli insiemi di queste 2n famiglie finite conterrebbe R, contro l’ipotesi d’assurdo. Quindi esiste un rettangolo, diciamo R1 , con
la stessa proprietà di R : dalla copertura {Ai }i∈I non si può estrarre alcuna
sottocopertura finita per R1 .
Iteriamo ora il procedimento. Dividiamo R1 in 2n rettangoli chiusi mediante
gli iperpiani che passano per il suo centro. Almeno uno di questi rettangoli, sia
esso R2 , ha la stessa proprietà di R e R1 : dalla copertura {Ai }i∈I non si può
estrarre alcuna sottocopertura finita per R2 .
Avendo definito Rm , con il procedimento descritto definamo Rm+1 per ogni
intero positivo m. I rettangoli chiusi Rm hanno le seguenti proprietà:
3.10. Appendice
75
a) essi formano una successione decrescente, ossia Rm ⊃ Rm+1 ;
b) ogni Rm è tale che dalla copertura aperta {Ai }i∈I non si può estrarre una
sottocopertura finita per Rm ;
c) diam Rm = 2−m ka − bk.
L’ultima proprietà discende dal fatto che ad ogni passo il diametro si dimezza.
Per il Lemma 3.10.3, l’intersezione di questa successione di rettangoli non è
vuota. Sia z ∈ ∩∞
m=1 Rm . Poiché {Ai }i∈I è una copertura aperta di R, e poiché
z ∈ R, deve esistere un insieme Ai0 della famiglia tale che z ∈ Ai0 . Quindi esiste
r tale che B(z, r) ⊂ Ai0 . Sia m cosı̀ grande che
diam Rm = 2−m ka − bk < r.
Si ha, per ogni y ∈ Rm ,
°
°
°z − y ° ≤ 2−m ka − bk < r.
Quindi
Rm ⊂ B(z, r) ⊂ Ai0 .
Dunque è possibile estrarre da {Ai }i∈I una sottocopertura finita di Rm , costituita da un solo aperto della famiglia, assurdo.
R2
R1
R
Sia ora E ⊂ Rn un qualsiasi insieme chiuso e limitato. Sia δ = diam E e sia
z ∈ E. Poniamo
a = (z1 − δ, z2 − δ, . . . , zn − δ)
b = (z1 + δ, z2 + δ, . . . , zn + δ) .
Sia R il rettangolo chiuso di estremi a e b. Per ogni x ∈ E e per ogni j si ha
³
´1/2
2
2
2
|xj − zj | ≤ |x1 − z1 | + |x2 − z2 | + . . . + |xn − zn |
= kx − zk ≤ δ.
Quindi x ∈ R, cioè E ⊆ R. Poiché E è chiuso, E è compatto per il Teorema
3.6.9.
76
3. Spazi Metrici
3.10.2
Norme e distanze
La norma euclidea in Rn è un caso particolare della nozione di norma in un insieme dotato di una struttura di spazio vettoriale su un campo che, per semplicità,
assumiamo essere il campo reale.
Definizione 3.10.4 Sia X uno spazio vettoriale su R. Una funzione, che indicheremo con il simbolo k·k, definita in X a valori reali, si chiama norma su
X se gode delle seguenti proprietà:
1. ∀x ∈ X
kxk ≥ 0.
2. ∀x ∈ X
kxk = 0
3. ∀x ∈ X ∀α ∈ R
4. ∀x, y ∈ X
se e solo se x = 0.
kαxk = |α| kxk.
kx + yk ≤ kxk + kyk.
Uno spazio vettoriale dotato di norma si chiama spazio normato, e si indica
con (X, k·k).
Lo spazio Rn , dotato della norma euclidea è uno spazio normato. Come
nel caso della distanza, uno spazio vettoriale a priori può essere dotato di varie
norme. Ad esempio, in Rn si hanno le norme
kxk∞ = max |xk | ,
kxk1 =
k
n
X
|xk | .
(3.10.5)
k=1
Le proprietà 1–4 sono facilmente verificate. Un altro esempio di spazio normato
è lo spazio X di tutte le funzioni limitate f : [0, 1] → R con la norma
kf k∞ = sup |f (x)| .
x
(3.10.6)
Sia (X, k·k) uno spazio normato. Come nel caso euclideo, a partire dalla
norma si può definire una distanza su X ponendo
∀x, y ∈ X
d(x, y) = kx − yk .
Le proprietà della distanza discendono immediatamente da quelle della norma.
Le distanze d∞ e d1 negli esempi 3.2.2.3 e 3.2.2.4 sono ottenute in questo modo
dalle norme (3.10.5). La distanza nell’esempio 3.2.2.8 è ottenuta mediante la
norma (3.10.6).
Non ogni distanza si può però definire tramite una norma. Infatti, il procedimento appena descritto richiede che X sia uno spazio vettoriale. Negli esempi
3.2.2.6 e 3.2.2.7 le distanze non sono ottenute tramite una norma. Anche se X
è uno spazio vettoriale, si possono definire distanze tali che d(x, 0) non è una
norma. Ad esempio, se X = Rn , la metrica discreta non può essere definita
tramite una norma.
3.10. Appendice
3.10.3
77
¡
¢
Proprietà dello spazio metrico R, d∗
Sia d∗ la metrica in R descritta nel paragrafo 3.9. Confrontiamo gli intorni di un
numero reale p nella metrica euclidea e in d∗ , mantenendo la notazione B(p, r)
per gli intorni euclidei di p e B ∗ (p, r) per gli intorni nella metrica d∗ .
Teorema 3.10.7 Per ogni p ∈ R valgono le proprietà
a)
∀s > 0 ∃r > 0
B(p, r) ⊂ B ∗ (p, s)
b)
∀r > 0 ∃s > 0
B ∗ (p, s) ⊂ B(p, r).
Dimostrazione. a) Innanzi tutto notiamo che la funzione g è strettamente
crescente, cioè
∀x, y ∈ R
x<y
se e solo se
g(x) < g(y).
Quindi
B ∗ (p, s) = {x : |g(x) − g(p)| < s}
= {x : g(p) − s < g(x) < g(p) + s}
©
ª
= x : g −1 (g(p) − s) < x < g −1 (g(p) + s) .
(3.10.8)
Posto a = g −1 (g(p) − s) e b = g −1 (g(p) + s), si ha a < p < b. Sia r tale che
a < p − r < p + r < b.
Da (3.10.8) si ha
B(p, r) = (p − r, p + r) ⊂ (a, b) = B ∗ (p, s).
b) Poiché g è strettamente crescente si ha
B(p, r) = {x : p − r < x < p + r}
= {x : g(p − r) < g(x) < g(p + r)} .
(3.10.9)
Posto u = g(p − r) e v = g(p + r), si ha u < g(p) < v. Sia s tale che
u < g(p) − s < g(p) + s < v.
Quindi
B ∗ (p, s) = {x : g (p) − s < g(x) < g (p) + s} ⊂ {x : u < g(x) < v} = B(p, r).
La restrizione della distanza d∗ a R×R non coincide con la metrica euclidea,
ma è ad essa equivalente, nel senso che ogni intorno di p ∈ R in una delle due
metriche contiene un intorno nell’altra metrica.
78
3. Spazi Metrici
Le due inclusioni a) e b) implicano che, per ogni sottoinsieme E ⊆ R, un
punto p è interno, di frontiera, esterno, di accumulazione, isolato secondo una
metrica, se e solo se lo è secondo l’altra. Quindi gli insiemi aperti, i chiusi, i
compatti, i connessi di R sono gli stessi con le due metriche.
La notazione R non è casuale. Infatti, per i Teoremi appena dimostrati, R è
effettivamente la chiusura di R nella metrica d∗ .
¡
¢
Dimostriamo, come ultimo risultato, che, con la metrica d∗ , R, d∗ è una
compattificazione di R.
¡
¢
Teorema 3.10.10 Lo spazio metrico R, d∗ è compatto.
Dimostrazione. Assegnata una qualsiasi copertura aperta {Ai }i∈I di R, devono esistere due aperti Ai1 e Ai2 tali che +∞ ∈ Ai1 e −∞ ∈ Ai2 . Questi aperti
contengono rispettivamente un intorno di +∞, sia esso (b, +∞] e uno di −∞,
sia esso [−∞, a). Il restante intervallo [a, b] è compatto e quindi da {Ai }i∈I si
può estrarre sottocopertura finita {Ai3 , Ai4 , . . . Ain } per [a, b]. Ne segue
R=
n
[
k=1
Aik .
Capitolo 4
Successioni
4.1
Introduzione
La nozione di successione a valori in un insieme X qualunque è stata introdotta
nel paragrafo 2.4. D’ora innanzi considereremo esclusivamente successioni a
valori in uno spazio metrico, con particolare riguardo agli spazi euclidei.
Premettiamo alla trattazione delle successioni e dei loro limiti il concetto di
proprietà posseduta definitivamente da una successione.
Definizione 4.1.1 Si dice che una successione {xn } possiede definitivamente,
o per n abbastanza grande, una proprietà P, se esiste n0 tale che per ogni n ≥ n0
il termine xn gode della proprietà P.
Ad esempio, la successione a valori reali
2, 4, 8 , 16, . . . , 2n , . . .
(4.1.2)
è definitivamente maggiore di 10. Infatti, la proprietà vale per n ≥ n0 = 4. La
successione di termine generale xn = n − 2 è definitivamente positiva. In questo
caso la proprietà è verificata per n ≥ n0 = 3. La successione xn = (−1)n non è
definitivamente positiva, sebbene abbia infiniti termini positivi.
Se una successione {xn } possiede definitivamente la proprietà P1 e possiede
definitivamente la proprietà P2 , allora essa possiede definitivamente ambedue
le proprietà. Infatti, esiste n0 tale che per ogni n ≥ n0 il termine xn gode
della proprietà P1 , ed esiste n1 tale che per ogni n ≥ n1 il termine xn gode
della proprietà P2 . Per n ≥ max(n0 , n1 ), xn gode di ambedue le proprietà.
Ad esempio, il termine generale della successione (4.1.2) è divisibile per 8 se
n ≥ n0 = 3. Quindi xn è definitivamente maggiore di 10 e divisibile per otto,
per n ≥ max(4, 3) = 4.
Questa osservazione si applica anche al caso in cui una successione {xn }
possieda definitivamente la proprietà P1 e un’altra successione {yn } possieda
definitivamente la proprietà P2 . Per n abbastanza grande, il termine xn gode
della proprietà P1 e, allo stesso tempo, il termine yn gode della proprietà P2 .
79
80
4.2
4. Successioni
Successioni convergenti
Definizione 4.2.1 Sia (X, d) uno spazio metrico e sia {xn } una successione a
valori in X. Si dice che la successione (o, semplicemente, xn ) converge a p ∈ X
se
∀ε > 0 ∃n0 ∀n ≥ n0
d(xn , p) < ε.
(4.2.2)
Nella definizione precedente, il numero ε è arbitrario e può essere scelto ‘piccolo
a piacere’, mentre n0 è funzione di ε. In generale, come si vedrà dagli esempi,
al decrescere di ε il corrispondente n0 diventa sempre più grande. Il simbolo
ε in Analisi Matematica è usato quasi esclusivamente per denotare un numero
positivo che si può scegliere arbitrariamente piccolo.
La definizione di convergenza può essere espressa in modo equivalente adottando la terminologia introdotta nel primo paragrafo: una successione {xn } ⊆ X
converge a p ∈ X se, per ogni ε > 0, si ha definitivamente d(xn , p) < ε. Oppure: una successione {xn } ⊆ X converge a p ∈ X se, per ogni ε > 0, si ha
definitivamente xn ∈ B(p, ε).
x1
x2
x3
p
xn
x4
La proprietà di separazione di Hausdorff implica che una successione non
può convergere a due punti diversi.
Teorema 4.2.3 (di unicità del limite) Sia (X, d) uno spazio metrico e {xn }
una successione a valori in X. Se la successione converge sia p1 che a p2 , allora
p1 = p2 .
Dimostrazione. Sia per assurdo p1 6= p2 . Per il Teorema 3.3.4 esiste r > 0
tale che B(p1 , r) ∩ B(p2 , r) = ∅. Poiché la successione converge a p1 , definitivamente xn ∈ B(p1 , r). Analogamente, poiché la successione converge a p2 ,
definitivamente xn ∈ B(p2 , r). Quindi definitivamente deve essere
xn ∈ B(p1 , r) ∩ B(p2 , r) = ∅,
assurdo.
4.2. Successioni convergenti
81
Definizione 4.2.4 Sia (X, d) uno spazio metrico e sia {xn } una successione a
valori in X. Se la successione converge a p ∈ X, si dice che p è il limite di xn
per n che tende a +∞. Si scrive
lim xn = p,
n→+∞
o anche
xn → p
per
n → +∞.
Esempi 4.2.5
1. Sia X = R e xn = 1/n. Allora limn→+∞ 1/n = 0. Infatti, per ogni
ε > 0 sia n0 un qualunque intero tale che n0 > 1/ε. Allora si ha, per ogni
n ≥ n0 ,
¯
¯
¯1
¯
1
1
d (xn , 0) = ¯¯ − 0¯¯ = ≤
< ε.
n
n
n0
In maniera del tutto analoga si dimostra che 1/nα converge a 0 per ogni
α > 0.
µ
¶
1
1
2. Sia X = R2 e xn = √ , 2 − √ . Allora limn→+∞ xn = (0, 2). Infatti,
n
n
°¡ √
°
√ ¢
° 1/ n, 2 − 1/ n − (0, 2)° =
r
1
1
+ =
n n
r
2
.
n
Per ogni ε > 0 sia n0 un intero tale che n0 > 2/ε2 . Per ogni n ≥ n0 si ha
r
2
< ε.
n
3. In un qualsiasi spazio metrico, se una successione è definitivamente eguale
a una costante p, allora xn converge a p. Infatti, si ha definitivamente
d(xn , p) = 0.
Viceversa, in uno spazio metrico discreto le uniche successioni convergenti
sono le successioni definitivamente costanti. Basta infatti scegliere ε ≤ 1
nella definizione di convergenza. Se xn appartiene definitivamente B(p, ε),
allora definitivamente xn = p.
4. Consideriamo in R la successione {xn } delle troncate n-esime del numero
1/3 = 0, 33333 . . . = 0, 3
0, 3, 0, 33, 0, 333, 0, 3333, . . . , 0, 3333333
| {z } , . . .
n cifre
82
4. Successioni
Si ha xn → 1/3 per → +∞. Infatti
¯
¯
¯0, 3 − xn ¯ = 0, 3 − xn = 0, 3 − 0, 3333333
| {z }
n cifre
−n
= 0, |00 .{z
. . 00} 3 = 1/3 · 10
.
n zeri
Per ogni ε > 0 sia n0 tale che n0 > 1/3ε. Per n ≥ n0 risulta
0, 3 − xn =
1
1
1
· 10−n ≤ · 10−n0 <
< ε.
3
3
3n0
Allo stesso modo si dimostra che le troncate n-esime della rappresentazione
decimale di un qualunque numero reale convergono al numero stesso.
5. La successione di termine generale xn = (−1)n non è convergente. Infatti, posto ad esempio ε = 1/2, xn non appartiene definitivamente a
B(−1, 1/2), poiché tutti gli elementi di indice pari non vi appartengono.
Un analogo ragionamento mostra che xn non appartiene definitivamente a B(1, 1/2). È pure chiaro che xn non appartiene definitivamente a
B(p, 1/2) per nessun p ∈ R.
Si noti che in un qualunque spazio metrico (X, d) una successione {xn } converge
a p ∈ X se e solo se la successione dei numeri reali non negativi {d(xn , p)}
converge a 0. Infatti, la condizione (4.2.2), che esprime la convergenza di xn a
p, esprime anche la convergenza di d(xn , p) a 0 in R.
Definizione 4.2.6 Sia (X, d) uno spazio metrico e sia {xn } una successione a
valori in X. Si dice che la successione è limitata se la sua immagine {xn } è
limitata in X.
Ad esempio, la successione (4.1.2) non è limitata, mentre le successioni {1/n}
e {(−1)n } sono limitate.
Teorema 4.2.7 Sia (X, d) uno spazio metrico e sia {xn } una successione a
valori in X. Se la successione è convergente, allora è limitata.
Dimostrazione. Sia p il limite della successione e si scelga ε = 1 nella definizione di convergenza. Esiste n0 tale che per ogni n ≥ n0 si ha xn ∈ B(p, 1). Ne
segue che l’insieme dei valori della successione a partire da n0 ha diametro non
superiore a 2. Per il Teorema 3.5.13 del capitolo 3, {xn } è un insieme limitato.
Teorema 4.2.8 Sia (X, d) uno spazio metrico e sia A ⊆ X. Se p è un punto
di accumulazione di A, allora esiste una successione di punti xn ∈ A, xn 6= p,
convergente a p.
4.3. Sottosuccessioni e punti di accumulazione
83
Dimostrazione. Poiché B(p, r) ∩ A è infinito per ogni r > 0, assegnando
a r successivamente i valori 1, 1/2, 1/3, . . . , 1/n, . . ., troviamo successivamente
punti x1 , x2 , . . . , xn , . . . tali che
x1 ∈ A e d(x1 , p) < 1,
x2 ∈ A e d(x2 , p) < 1/2,
.........
xn ∈ A e d(xn , p) < 1/n,
.........
La successione {xn } cosı̀ ottenuta converge a p. Infatti, per ogni ε > 0 sia n0
un intero tale che n0 > 1/ε. Per ogni n ≥ n0 si ha
d(xn , p) <
4.3
1
1
≤
< ε.
n
n0
Sottosuccessioni e punti di accumulazione
Definizione 4.3.1 Sia (X, d) uno spazio metrico e sia {xn } una successione a
valori in X. Sia
n1 < n2 < n3 < · · · < nk < · · ·
(4.3.2)
una qualsiasi successione crescente di interi positivi. Si chiama sottosuccessione
di {xn } la successione
xn1 , xn2 , xn3 , . . . , xnk , . . .
Esempi 4.3.3
1. Sia n1 = 2, n2 = 4, . . . , nk = 2k, . . .. La sottosuccessione corrispondente
è la successione dei termini di indice pari
x2 , x4 , x6 , . . . , x2k , . . .
Per esempio, se xn = (−1)n , la sottosuccessione {x2k } è la successione
costante 1, 1, 1, 1, . . .
2. Siano n1 = 1, n2 = 4, n3 = 9, n4 = 16, . . . , nk = k 2 , . . . La sottosuccessione corrispondente è la successione degli elementi il cui indice è un
quadrato
x1 , x4 , x9 , x16 . . . , xk2 , . . .
Per esempio, se xn = 1/n, la sottosuccessione {xk2 } è la successione
1, 1/4, 1/9, 1/16, . . .
84
4. Successioni
Si noti che una sottosuccessione {xnk } non è altro che la restrizione della
successione {xn } al sottoinsieme infinito {n1 , n2 , n3 , . . . , nk , . . .}.
Poiché una sottosuccessione {xnk } è a sua volta una successione (dipendente
dall’indice k), ci si può interrogare sulla convergenza di xnk per k → +∞.
Questo studio sarà condotto in maggiore dettaglio nel paragrafo sulla classe
limite. Per il momento ci limitiamo a notare il seguente teorema.
Teorema 4.3.4 Sia (X, d) uno spazio metrico e sia {xn } una successione a
valori in X. Se xn converge a p ∈ X, allora ogni sua sottosuccessione converge
allo stesso limite.
Dimostrazione. Sia {xnk } una sottosuccessione di {xn }. Sia ε > 0 arbitrario.
Poiché xn è convergente, esiste un intero n0 tale che per ogni n ≥ n0 si ha
d(xn , p) < ε. Poiché la successione degli indici in (4.3.2) è crescente, esiste k0
tale che nk0 > n0 . Per i successivi valori di k, a maggior ragione si ha nk > n0 .
Ne segue d(xnk , p) < ε per k ≥ k0 . In altri termini, xnk → p per k → +∞.
Sia p un punto di accumulazione di una successione {xn }. Per il Teorema
4.2.8, esiste una successione di punti dell’insieme A = {xn } convergente a p.
Questi punti possono essere scelti in modo da formare una sottosuccessione di
{xn }.
Teorema 4.3.5 Sia (X, d) uno spazio metrico e sia {xn } una successione a
valori in X. Se p è un punto di accumulazione di {xn }, allora esiste una
sottosuccessione {xnk } convergente a p.
Dimostrazione. La dimostrazione è simile a quella del Teorema 4.2.8, ove si
ponga A = {xn }. In questo caso si devono però scegliere i punti di A in modo
da rispettare la condizione (4.3.2).
Sia xn1 un elemento della successione tale che xn1 ∈ B(p, 1). Poiché B(p, 1/2)
contiene infiniti elementi della successione, deve esistere n2 > n1 tale che
xn2 ∈ B(p, 1/2). Analogamente, poiché B(p, 1/3) contiene infiniti elementi della
successione, deve esistere esiste n3 > n2 tale che xn3 ∈ B(p, 1/3).
Con questo procedimento si definisce xnk per induzione: poiché B(p, 1/k)
contiene infiniti elementi della successione, esiste nk > nk−1 tale che xnk ∈
B(p, 1/k). La sottosuccessione {xnk } converge chiaramente a p.
Corollario 4.3.6 Sia (X, d) uno spazio metrico, sia E ⊆ X un insieme compatto e sia {xn } una successione a valori in E. Allora {xn } ha almeno una
sottosuccessione convergente.
Dimostrazione. Se il coinsieme {xn } è infinito, allora esso ha almeno un punto
di accumulazione, per il punto c) del Teorema 3.6.6. In questo caso la tesi segue
dal Teorema 4.3.5.
Se xn assume solo un numero finito di valori, allora almeno uno dei valori,
sia esso p, deve corrispondere a infiniti indici n1 < n2 < . . . nk < . . .. Si ha cosı̀
la sottosuccessione costante (e quindi convergente) xnk = p per ogni k.
4.4. Successioni a valori reali
4.4
85
Successioni a valori reali
Sia, qui e nel seguito, {xn } una successione a valori reali. La nozione di convergenza in R con la metrica euclidea assume la seguente forma: xn converge a
p ∈ R se per ogni ε > 0 esiste n0 tale che per ogni n ≥ n0
|xn − p| < ε.
(4.4.1)
Le seguenti affermazioni sono quindi equivalenti per n → +∞:
xn → p,
|xn − p| → 0,
xn − p → 0.
In particolare, xn → 0 se e solo se |xn | → 0.
La diseguaglianza (4.4.1) equivale alle due seguenti diseguaglianze
p − ε < xn < p + ε.
Può accadere che una successione convergente verifichi definitivamente la più
forte diseguaglianza
p ≤ xn < p + ε,
(4.4.2)
oppure
p − ε < xn ≤ p.
(4.4.3)
Ad esempio, xn = 1/n verifica definitivamente (4.4.2) con p = 0, mentre xn =
1 − 1/n verifica definitivamente (4.4.3) con p = 1. Siamo cosı̀ condotti alla
seguente definizione.
Definizione 4.4.4 Sia {xn } una successione a valori reali convergente a p. Si
dice che la successione converge a p per eccesso o dalla destra, se
∀ε > 0 ∃n0 ∀n ≥ n0
p ≤ xn < p + ε.
Analogamente, si dice che la successione converge a p per difetto, o dalla
sinistra, se
∀ε > 0 ∃n0 ∀n ≥ n0
p − ε < xn ≤ p.
Se xn converge a p dalla destra si scrive
lim xn = p + ,
n→+∞
o anche
xn → p + per n → +∞.
Se xn converge a p dalla sinistra si scrive
lim xn = p − ,
n→+∞
o anche
xn → p − per n → +∞.
Secondo queste definizioni, limn→+∞ 1/n = 0+ e limn→+∞ (1 − 1/n) = 1−.
Invece, la successione xn = (−1)n /n converge a 0, ma non converge né dalla
destra né dalla sinistra.
La nozione di successione limitata del precedente paragrafo nel caso reale
può essere ulteriormente precisata.
86
4. Successioni
Definizione 4.4.5 Diremo che una successione a valori reali è limitata superiormente (oppure inferiormente) se la sua immagine {xn } è limitata superiormente (rispettivamente, inferiormente). Chiameremo estremo superiore,
inferiore, massimo, minimo della successione l’estremo superiore, inferiore, il
massimo (se esiste), il minimo (se esiste) dell’immagine {xn }.
Per il Teorema 4.2.7 ogni successione reale convergente è limitata sia inferiormente che superiormente. Tuttavia, il concetto di limite può essere esteso per
caratterizzare il comportamento ‘regolare’ di alcune successioni reali illimitate.
Definizione 4.4.6 Sia {xn } una successione a valori reali. Si dice che la
successione diverge a +∞ se
∀M ∃n0 ∀n ≥ n0
xn > M .
(4.4.7)
Analogamente, dice che la successione diverge a −∞
∀M ∃n0 ∀n ≥ n0
xn < M .
(4.4.8)
Se xn diverge a +∞ si scrive
lim xn = +∞,
n→+∞
o anche
xn → +∞ per n → +∞.
Se xn diverge a −∞ si scrive
lim xn = −∞,
n→+∞
o anche xn → −∞ per n → +∞.
Nella definizione di divergenza a +∞, il numero M è arbitrario e può essere
scelto positivo ‘grande a piacere’, mentre n0 è funzione di M . In generale, al
crescere di M anche n0 cresce. Analoga osservazione per la divergenza a −∞: in
questo caso M può essere scelto negativo e di valore assoluto grande a piacere.
Dalla definizione risulta chiaro che xn diverge a +∞ se e solo se −xn diverge a
−∞.
Esempi 4.4.9
√
1. La successione di termine generale xn = n diverge
√ a√+∞. Infatti, per
2
ogni M > 0 sia n0 > M . Per ogni n ≥ n0 si ha n ≥ n0 > M .
In modo analogo si dimostra che tutte le successioni {nα }, ove α > 0,
divergono a +∞.
2. Sia {xn } la successione
−1, 2, −3, 4, . . . , (−1)n n, . . .
Questa successione, benché illimitata, non è divergente, né a −∞, né a
+∞. Infatti, qualunque sia M > 0, essa non soddisfa definitivamente la
diseguaglianza xn > M , né la diseguaglianza xn < −M
4.5. Permanenza del segno. Confronto
87
Una successione divergente a +∞ è illimitata superiormente ed è definitivamente positiva. Una successione divergente a −∞ è illimitata inferiormente
ed è definitivamente negativa. Ne segue che una successione divergente a +∞
non può divergere a −∞ e non può convergere. Analogamente una successione divergente a −∞ non può divergere a +∞ e non può convergere. Infine,
una successione convergente non può divergere. In altri termini, anche con l’introduzione dei limiti +∞ e −∞, il limite di una successione reale, se esiste, è
unico.
Definizione 4.4.10 Sia {xn } una successione a valori reali. Si dice che {xn } è
r egolare se essa ammette limite (finito o infinito). Altrimenti si dice irregolare
od oscillante.
Vale per il limiti infiniti l’analogo del Teorema 4.3.4
Teorema 4.4.11 Sia {xn } una successione a valori reali. Se xn diverge a +∞,
allora ogni sua sottosuccessione diverge a +∞. Se xn diverge a −∞, allora ogni
sua sottosuccessione diverge a −∞.
Dimostrazione. La dimostrazione è del tutto analoga a quella del Teorema
4.3.4. Basta sostituire all’intorno B(p, ε) l’intervallo (M, +∞) nel caso della
divergenza a −∞, e (−∞, M ) nel caso della divergenza a −∞.
Nel paragrafo 3.9 è stata introdotta una metrica d∗ in R. Nello spazio metrico (R, d∗ ) le successioni divergenti a +∞ o −∞ sono esattamente le successioni
che tendono a questi limiti, secondo la definizione del paragrafo 4.1.
4.5
Permanenza del segno. Confronto
Sia {xn } una successione reale convergente a p. Per la definizione di limite,
assegnato un qualunque intervallo (a, b) tale che p ∈ (a, b), si ha definitivamente
xn ∈ (a, b). Questa osservazione permette di mettere in relazione il segno di xn
e quello di p.
Teorema 4.5.1 (di permanenza del segno) Sia {xn } una successione reale
convergente a p.
a) Se p > 0, allora definitivamente xn > 0.
b) Se p < 0, allora definitivamente xn < 0.
c) Se definitivamente xn ≥ 0, allora p ≥ 0.
d) Se definitivamente xn ≤ 0, allora p ≤ 0.
Dimostrazione. Sia ε > 0 tale che p − ε > 0. Per la definizione di convergenza
si ha definitivamente
0 < p − ε < xn < p + ε.
Quindi a) è vera. La dimostrazione di b) è analoga.
88
4. Successioni
Supponiamo che definitivamente valga xn ≥ 0. Allora non può valere p < 0,
altrimenti, per il punto b), si avrebbe definitivamente xn < 0. Quindi c) è vera.
In modo analogo si dimostra d).
Si noti che c) e d) non sono le inverse di a) e b). Anche nella più forte
ipotesi xn > 0, non si può dedurre p > 0. Basta infatti considerare l’esempio
della successione xn = 1/n.
Teorema 4.5.2 (del confronto; convergenza) Siano {xn },{yn } e {zn } tre
successioni reali tali che:
i) xn e yn convergono allo stesso limite p;
ii) definitivamente xn ≤ zn ≤ yn .
Allora zn converge a p.
Dimostrazione. Sia ε > 0 fissato ad arbitrio. Per l’ipotesi i) definitivamente
valgono ambedue le diseguaglianze
p − ε < xn < p + ε;
p − ε < yn < p + ε.
(4.5.3)
(4.5.4)
Quindi, per l’ipotesi ii), (4.5.3) e (4.5.4), si ha definitivamente
p − ε < xn ≤ zn ≤ yn < p + ε.
Ne segue che definitivamente vale p − ε < zn < p + ε e quindi la tesi.
Teorema 4.5.5 (del confronto; divergenza) Siano {xn } e {yn } due successioni reali tali che definitivamente xn ≤ yn . Allora:
a) se xn diverge a +∞ anche yn diverge a +∞;
b) se yn diverge a −∞ anche xn diverge a −∞.
Dimostrazione. Ci limitiamo a dimostrare a), dato che la dimostrazione di b)
è analoga. Sia M fissato ad arbitrio. Definitivamente si ha xn > M . Poiché
definitivamente yn ≥ xn , definitivamente si ha yn > M . Quindi yn diverge a
+∞.
Esempi 4.5.6
1. Sia {xn } tale che limn→+∞ xn = 0. Dimostriamo che
lim sin xn = 0,
n→+∞
lim cos xn = 1 − .
n→+∞
Possiamo supporre xn ≥ 0, poiché sin(−xn ) = − sin xn e cos(−xn ) =
cos xn .
4.5. Permanenza del segno. Confronto
89
Sia x un angolo (in radianti) tale che 0 < x < π/2. Nel cerchio di centro
o e raggio 1 si consideri il triangolo di vertici o, p, r e il settore circolare
con gli stessi vertici. Indichiamo con T1 e S rispettivamente le loro aree.
Si ha
1
1
T1 = sin x, , S = x.
2
2
Quindi
0 < sin x < x.
Sostituendo xn a x si ha limn→+∞ sin xn = 0 per il Teorema 4.5.2.
La seconda relazione di limite si ottiene dalla prima e dal Teorema del
confronto 4.5.2. Si ha infatti, sempre per 0 < x < π/2,
0 < 1 − cos x < 1 − cos2 x = sin2 x < sin x.
Quindi limn→+∞ cos xn = 1−.
2. Sia yn = n2 − n. Per n ≥ 2 si ha
³
1 ´ n2
≥
.
yn = n2 1 −
n
2
Posto xn = n2 /2, chiaramente xn → +∞. Per il Teorema 4.5.5 si ha
limn→+∞ (n2 − n) = +∞.
1
tan(x)
q
p
sin(x)
x
o
r
Dimostriamo una relazione di limite notevole con l’aiuto del Teorema 4.5.2.
Teorema 4.5.7 Sia {xn } una successione tale che xn 6= 0 e limn→+∞ xn = 0.
Allora
sin xn
=1−.
(4.5.8)
lim
n→+∞ xn
90
4. Successioni
Dimostrazione. Poiché
sin (−xn )
sin xn
=
,
−xn
xn
possiamo supporre xn > 0. Sia 0 < x < π/2. Nel cerchio di centro o e raggio 1
si consideri il triangolo di vertici o, p, r, il triangolo rettangolo di vertici o, q, r e
il settore circolare di vertici o, p, r. Indichiamo con T1 , T2 e S rispettivamente
le loro aree. Si ha
1
1
1
T1 = sin x, T2 = tan x, S = x.
2
2
2
Poiché T1 < S < T2 , otteniamo le diseguaglianze
sin x < x < tan x,
da cui
sin x
< 1.
x
Sostituendo xn a x, e ricordando che limn→+∞ cos xn = 1, si ottiene la relazione
(4.5.8) dal Teorema del confronto.
cos x <
4.6
Successioni monotone
Definizione 4.6.1 Sia {xn } una successione a valori reali. Si dice che la
successione è:
a) monotona crescente in senso lato, o non decrescente, se
∀n
xn ≤ xn+1 ;
b) monotona crescente in senso stretto, se
∀n
xn < xn+1 ;
c) monotona decrescente in senso lato, o non crescente, se
∀n
xn ≥ xn+1 ;
d) monotona decrescente in senso stretto se
∀n
xn > xn+1 .
√
Ad esempio, la successione { n} è monotona crescente in senso stretto,
mentre la successione 1, 1, 2, 2, . . . , n, n . . . è crescente in senso lato, ma non in
senso stretto. La successione (−1)n non è monotona. È altresı̀ chiaro che, se
{xn } è crescente (in senso lato o stretto), allora {−xn } è decrescente (in senso
lato o stretto, rispettivamente). Inoltre, una successione è allo stesso tempo
monotona non decrescente e monotona non crescente se e solo se è costante.
La rilevanza delle successioni monotone deriva dal fatto che esse sono regolari.
4.7. Calcolo dei limiti
91
Teorema 4.6.2 Ogni successione monotona {xn } è regolare. Se {xn } è monotona crescente (in senso lato o stretto), allora
lim xn = sup {xn } .
n→+∞
(4.6.3)
Se {xn } è monotona decrescente (in senso lato o stretto), allora
lim xn = inf {xn } .
n→+∞
(4.6.4)
Dimostrazione. Dimostriamo (4.6.3), distinguendo tra il caso in cui l’estremo
superiore è finito e quello in cui è infinito. Sia dapprima
L = sup {xn } < +∞.
Per ogni ε > 0 il numero L − ε non è un maggiorante della successione. Esiste
quindi xn0 , tale che L − ε < xn0 ≤ L. Poichè xn è non decrescente, si ha, per
ogni n ≥ n0 ,
L − ε < xn0 ≤ xn ≤ L.
Quindi xn → L− per n → +∞.
Sia ora supn {xn } = +∞. Poiché la successione non ha maggioranti, per
ogni M esiste xn0 tale che M < xn0 . Poiché xn è non decrescente, si ha, per
ogni n ≥ n0 ,
M < xn0 ≤ xn .
Quindi xn → +∞ per n → +∞.
La dimostrazione di (4.6.4) è del tutto analoga.
4.7
Calcolo dei limiti
Siano {an } e {bn } due successioni a valori reali. A partire da esse si possono
definire delle nuove successioni, eseguendo su an e bn le operazioni di somma,
prodotto, quoziente (se bn 6= 0), elevamento a potenza (se an > 0), passaggio al
logaritmo (se an > 0, an 6= 1, bn > 0). Otteniamo cosı̀ le successioni di termine
generale
an
an + bn , an bn ,
, abnn , logan bn
(4.7.1)
bn
Dimostreremo che, se an e bn sono regolari, allora anche le successioni in (4.7.1)
sono regolari, salvo le eccezioni che verranno esplicitamente indicate nel seguito
(le cosiddette forme di indecisione). Dimostreremo inoltre che, escludendo le
suddette eccezioni, il limite delle successioni (4.7.1) si ottiene eseguendo sui
limiti di an e bn la stessa operazione eseguita sui termini generali. In altre
parole, il limite della somma è la somma dei limiti, il limite del prodotto è il
prodotto dei limiti etc. Tuttavia, se uno o ambedue questi limiti sono infiniti,
o il denominatore del rapporto tende a 0, o la base della potenza tende a 0+,
o l’argomento del logaritmo tende a 0+, o la base del logaritmo tende a 1 o a
0+, le corrispondenti operazioni sui limiti non sono definite nel campo reale.
Lo studio del comportamento delle successioni (4.7.1) per n → +∞ permetterà
di aritmetizzare (ad esclusione delle eccezioni sopra menzionate) i simboli +∞,
−∞, 0+ e 0− in modo da dare significato alle operazioni con queste quantità.
92
4. Successioni
4.7.1
Calcolo dei limiti in R
Esaminiamo dapprima il caso in cui le operazioni tra i limiti hanno significato
nel campo reale.
Teorema 4.7.2 Siano {an } e {bn } due successioni a valori reali entrambe convergenti. Sia
an → a, bn → b per n → +∞.
Allora, per n → +∞ si ha:
1. an + bn → a + b.
2. an bn → ab.
3. Se bn 6= 0 e b 6= 0, allora
an
a
→ .
bn
b
4. Se an > 0 e a > 0, allora
abnn → ab .
5. Se an , a > 0, an , a 6= 1, bn , b > 0, allora logan bn → loga b.
La dimostrazione del Teorema è svolta nell’Appendice. Come esempio diamo
la dimostrazione della 1. Fissato ε > 0, si ha definitivamente |an − a| < ε e
|bn − b| < ε. Perciò si definitivamente vale
|an + bn − a − b| ≤ |an − a| + |bn − b| < 2ε,
da cui l’asserto.
Esempi 4.7.3
1.
1
1
1
3n − 1
− cos = 3 − − cos → 3 − 0 − 1 = 2.
n
n
n
n
2.
3n − 1
1
cos → 3 · 1 = 3.
n
n
3. tan
1
sin 1/n
0
=
→ = 0.
n
cos 1/n
1
4. Sia x > 0. Si ha x1/n → x0 = 1.
µ
¶
1
5. Sia a > 0, a 6= 1. Si ha loga 1 +
→ loga 1 = 0.
n
4.7.2
Calcolo dei limiti in R
Le dimostrazioni dei Teoremi enunciati in questo sottoparagrafo sono svolte in
Appendice.
4.7. Calcolo dei limiti
93
Somma
Teorema 4.7.4 Siano {an } e {bn } due successioni a valori reali. Valgono le
seguenti implicazioni:
an
an
an
an
→ +∞
→ +∞
→ −∞
→ −∞
e
e
e
e
bn
bn
bn
bn
→b
→ +∞
→b
→ −∞
=⇒ an + bn
=⇒ an + bn
=⇒ an + bn
=⇒ an + bn
→ +∞
→ +∞
→ −∞
→ −∞.
Riassumiamo il Teorema nella seguente tabella, che estende la somma a R,
con l’eccezione del caso +∞ − ∞
Tabella I
+∞ + b = +∞, +∞ + (+∞) = +∞
−∞ + b = −∞, −∞ + (−∞) = −∞
Se an → +∞ e bn → −∞, la successione an + bn può avere qualsiasi
comportamento, come mostrano gli esempi seguenti.
Esempi 4.7.5
1. Sia an = n, bn = −n + x, ove x è un numero reale qualunque. Allora
an + bn = x.
2. Sia an = n2 , bn = −n. Ricordando l’esempio 4.5.6.2, si ha
an + bn = n2 − n → +∞.
Se an = n e bn = −n2 , si ha an + bn → −∞.
3. Sia an = n2 e
(
−n2
bn =
−n
se n è pari
se n è dispari.
La successione an + bn è irregolare, poiché la sottosuccessione dei pari è
identicamente 0, mentre quella dei dispari diverge a +∞.
Si dice che
∞−∞
è una forma di indecisione.
94
4. Successioni
Prodotto
Teorema 4.7.6 Siano {an } e {bn } due successioni a valori reali. Valgono le
seguenti implicazioni:
an
an
an
an
an
→ +∞
→ +∞
→ −∞
→ +∞
→ −∞
e
e
e
e
e
bn
bn
bn
bn
bn
→ +∞
→ −∞
→ −∞
→b≷0
→b≷0
=⇒
=⇒
=⇒
=⇒
=⇒
an bn
an bn
an bn
an bn
an bn
→ +∞
→ −∞
→ +∞
→ ±∞
→ ∓∞.
Riassumiamo il Teorema nella seguente tabella, che estende il prodotto a R,
con l’eccezione del caso 0 · ∞.
Tabella II
se b ≷ 0,
+∞ · +∞ = +∞,
+∞ · b = ±∞, −∞ · b = ∓∞
+∞ · −∞ = −∞,
−∞ · −∞ = +∞
Se an → 0 e bn → ±∞, la successione an bn può avere qualsiasi comportamento, come mostrano i seguenti esempi.
Esempi 4.7.7
1. Sia an = 1/n e bn = n. Allora an bn = 1 → 1.
2. Sia an = 1/n e bn = n2 . Allora an bn = n → +∞.
3. Sia an = 1/n2 e bn = n. Allora an bn = 1/n → 0.
4. Sia an = 1/n2 per n pari e an = 1/n per n dispari; sia bn = n. Allora
an bn oscilla, poiché an bn = 1/n per n pari e an bn = 1 per n dispari.
Abbiamo cosı̀ la seconda forma di indecisione
0·∞
Quoziente
Il comportamento al limite di an /bn deduce combinando lo studio del comportamento al limite di 1/bn con il Teorema 4.7.6
Teorema 4.7.8 Sia {bn } una successione a valori reali tale che bn 6= 0. Valgono le seguenti implicazioni:
bn
bn
bn
bn
→ 0+
=⇒ 1/bn → +∞
→ 0−
=⇒ 1/bn → −∞
→ +∞ =⇒ 1/bn → 0+
→ −∞ =⇒ 1/bn → 0−
4.7. Calcolo dei limiti
95
Si noti che se bn tende a 0, ma non è bn → 0+, né bn → 0−, allora 1/bn
oscilla. In questo caso infatti, 1/bn è illimitata, ma non ha definitivamente segno
positivo, né negativo.
Riassumiamo il Teorema nella seguente tabella.
Tabella III
1
= +∞,
0+
1
=0+,
+∞
1
= −∞
0−
1
= 0−
−∞
Dalla forma di indecisione 0 · ∞ e dal Teorema 4.7.8 si ricavano le due forme
di indecisione per il quoziente.
∞
,
∞
0
0
Potenze
Teorema 4.7.9 Siano {an } e {bn } due successioni a valori reali. Sia an > 0 e
a > 0. Valgono le seguenti implicazioni:
an
an
an
an
→a>1
→a>1
→a<1
→a<1
e
e
e
e
bn
bn
bn
bn
→ +∞ =⇒ abnn
→ −∞ =⇒ abnn
→ +∞ =⇒ abnn
→ −∞ =⇒ abnn
→ +∞
→ 0+
→ 0+
→ +∞.
Se an → 1 e bn → +∞, oppure bn → −∞, la successione abnn può avere qualsiasi comportamento. Giustificheremo questa affermazione nel prossimo
paragrafo. Riassumiamo il Teorema nella seguene tabella.
Tabella IV
se a > 1,
a+∞ = +∞, a−∞ = 0+
se 0 < a < 1, a+∞ = 0+, a−∞ = +∞
Si ha la forma di indecisione
1∞
96
4. Successioni
Teorema 4.7.10 Siano {an } e {bn } due successioni a valori reali. Sia an > 0.
Valgono le seguenti implicazioni:
an → 0+
e
bn → b > 0
=⇒
abnn → 0+
an → +∞
an → 0+
an → +∞
e
e
e
bn → b > 0
bn → b < 0
bn → b < 0
=⇒
=⇒
=⇒
abnn → +∞
abnn → +∞
abnn → 0 + .
Riassumiamo il Teorema nella seguente Tabella
Tabella V
se b > 0,
se b < 0,
0+b = 0+,
0+b = +∞,
+∞b = +∞
+∞b = 0+
Dal Teorema precedente è escluso il caso in cui an → 0+ e bn → 0 e il caso
in cui an → +∞ e bn → 0. In tali casi infatti, la successione abnn può avere
qualsiasi comportamento.
Esempi 4.7.11
1. Sia an = 2−n . Per il Teorema 4.7.10 an → 0+ per n → +∞. Se bn =
−1/n, si ha abnn = 2.
√
√
2. Sia an = 2−n e bn = −1/ n. Si ha abnn = 2 n → +∞, sempre per il
Teorema 4.7.10.
3. Sia an = 2−n e sia bn = 1/n per n pari, bn = −1/n per n dispari. In
questo caso abnn oscilla.
√
4. Le successioni an = 2n e bn = 1/n, oppure bn = 1/ n, forniscono, ragionando come nel caso 00 , esempi che mostrano che ∞0 è effettivamente
una forma di indecisione.
Abbiamo quindi altre due forme di indecisione
00 ,
∞0
Il seguente Teorema completa lo studio dei limiti delle potenze.
Teorema 4.7.12 Siano {an } e {bn } due successioni a valori reali. Sia an > 0.
Valgono le seguenti implicazioni.
a → 0+
a → 0+
a → +∞
a → +∞
e
e
e
e
bn
bn
bn
bn
→ +∞
→ −∞
→ +∞
→ −∞
=⇒
=⇒
=⇒
=⇒
abnn
abnn
abnn
abnn
→ 0+
→ +∞
→ +∞
→0+.
4.7. Calcolo dei limiti
97
Riassumiamo il Teorema nella seguente Tabella.
Tabella VI
0++∞ = 0 + ,
+∞+∞ = +∞,
0+−∞ = +∞
+∞−∞ = 0+
Logaritmi
Teorema 4.7.13 Sia a > 0, a 6= 1. Sia bn 6=
zioni.
a>1
e
bn → +∞ =⇒
a>1
e
bn → 0+ =⇒
a<1
e
bn → +∞ =⇒
a<1
e
bn → 0+ =⇒
0. Valgono le seguenti implicaloga bn
loga bn
loga bn
loga bn
→ +∞
→ −∞
→ −∞
→ +∞.
Come prima, il Teorema può essere riassunto in una tabella.
Tabella VII
se a > 1,
se a < 1,
loga +∞ = +∞,
loga +∞ = −∞,
loga 0+ = −∞
loga 0+ = +∞
Il comportamento del logaritmo con base variabile si deduce dai Teoremi
precedenti e dalla formula
logan bn =
log10 bn
log10 an
(4.7.14)
Il termine a destra in 4.7.14 presenta i casi di indecisione del rapporto se ambedue le sucessioni tendono a 1, o a 0+, o a +∞, oppure se una delle due tende a
0+ e l’altra a +∞.
Le Tabelle I–VII costituiscono la cosiddetta aritmetizzazione parziale dei
simboli +∞, −∞, 0+, 0−. Assieme al Teorema 4.7.2, e alle sette forme di
indecisione, esse danno un panorama esauriente del calcolo dei limiti delle successioni reali. Raccogliamo in una tabella le forme di indecisione incontrate.
Tabella VIII. Le forme di indecisione
∞−∞
0·∞
1∞
00
0
0
∞0
∞
∞
98
4. Successioni
4.8
Il numero e
Il numero e, base dei logaritmi naturali o neperiani, è definito come il limite
della successione
¶n
µ
1
en = 1 +
.
(4.8.1)
n
Poiché {en } presenta il caso di indecisione 1∞ , la sua convergenza non discende dai teoremi del paragrafo precedente, ma deve essere dimostrata separatamente.
Teorema 4.8.2 La successione {en } converge.
Dimostrazione. La dimostrazione si articola in due punti.
a) en è strettamente crescente.
b) en è limitata superiormente.
La convergenza di {en } seguirà allora dal Teorema 4.6.2.
Dimostriamo dapprima che en /en−1 > 1 per ogni n ≥ 2. Si ha
¶n
µ
1
µ
¶n µ
¶n−1
1+
en
n+1
n−1
n
=µ
=
¶n−1
en−1
n
n
1
1+
n−1
µ 2
¶n
µ
¶n
n −1
1
1
−
n2
n2
=
=
.
n−1
1
1−
n
n
(4.8.3)
(4.8.4)
Ricordiamo ora la diseguaglianza, dimostrata nel Lemma 1.6.1,
(1 + ε)n > 1 + nε,
(4.8.5)
valida per ogni n ≥ 2 e ε > −1, ε 6= 0. Posto ε = −1/n2 , si ha da (4.8.3) e
(4.8.4)
µ
¶n
1
1
1− 2
1−n· 2
en
n
n = 1.
=
>
1
1
en−1
1−
1−
n
n
Quindi la successione (4.8.1) è strettamente crescente.
Per dimostrare il punto b) consideriamo la successione
e∗n
µ
¶n+1
1
= 1+
.
n
(4.8.6)
4.8. Il numero e
99
Dimostriamo che essa è strettamente decrescente. Infatti, ragionando come
sopra, si ha per n ≥ 2
¶n
µ
1
µ
¶n µ
¶n+1
1
+
e∗n−1
n
n
n−1
(4.8.7)
= µ
¶n+1 =
e∗n
n−1
n+1
1
1+
n
µ
¶n
¶n
µ
2
n
1
1+ 2
n2 − 1
n −1
=
=
.
(4.8.8)
1
n+1
1+
n
n
Per la diseguaglianza (4.8.5), ove si ponga ε = 1/(n2 − 1), si ha
µ
1+
1
2
n −1
¶n
>1+n·
n2
1
n
> 1 + 2.
−1
n
(4.8.9)
Da (4.8.7), (4.8.8) e (4.8.9) segue
e∗n−1
=
e∗n
µ
1+
1
n2 − 1
1
1+
n
¶n
> 1.
Quindi {e∗n } è strettamente decrescente. Ne segue che {en } è limitata, poiché
en =
µ
¶n µ
¶n+1
1
1
1+
< 1+
= e∗n < e∗1 = 4.
n
n
Definizione 4.8.10 Si pone
µ
e = lim
n→+∞
1
1+
n
¶n
.
Poiché en è crescente, si ha limn→+∞ en = e−.
Corollario 4.8.11 Sia e∗n come in (4.8.6). Allora limn→+∞ e∗n = e+.
Dimostrazione. Segue dal Teorema precedente e dal Teorema del confronto.
Infatti,
0 ≤ e∗n − en =
e∗n
e∗1
<
.
n+1
n+1
Il limite è per eccesso, poiché e∗n è decrescente.
(4.8.12)
100
4. Successioni
La successione {en } converge ad e ‘lentamente’. Se si vuole approssimare e,
l’errore En commesso arrestandosi al passo n è, per (4.8.12),
En = e − en < e∗n − en <
4
.
n+1
Ad esempio, per approssimare e alla terza cifra decimale, e quindi avere un errore
dell’ordine di 10−4 , occorre calcolare en con n dell’ordine di 104 . L’approssimazione effettiva di e si effettua con altri metodi, a cui accenneremo nell’Appendice
del capitolo sulle serie numeriche.
Il numero e, chiamato anche costante di Nepero (dal nome del matematico
John Napier, inventore dei logaritmi), è un numero irrazionale trascendente
(ossia, come π, non è radice di nessun polinomio a coefficienti interi). Dalla
diseguaglianza e1 < e < e∗1 ricaviamo 2 < e < 4. In realtà, le prime cifre
decimali di e sono
e = 2, 71828182845904 . . .
In Analisi Matematica si assume abitualmente il numero e come base dei logaritmi. La scrittura log x starà sempre ad indicare il logaritmo di x in
base e.
Siamo in grado ora di costruire gli esempi che mostrano che 1∞ è effettivamente una forma di indecisione. Si considerino le successioni
 µ
¶n2


√
 1+ 1
µ
¶n2 µ
¶ n
se n è pari

1
1
n √
1+
,
1+
, an =
¶ n
µ

n
n
1


 1+
se n è dispari
n
La prima diverge a +∞, poiché
µ
¶n2 ·µ
¶n ¸n
1
1
→ e+∞ = +∞,
1+
=
1+
n
n
per la Tabella IV nel paragrafo precedente. Per la seconda si ha
µ
¶√n ·µ
¶n ¸1/√n
1
1
1+
=
1+
→ e0 = 1.
n
n
La terza successione è chiaramente oscillante.
Il numero e si può ottenere come limite di successioni la cui espressione
generalizza quella di en .
Lemma 4.8.13 Sia {xn } una successione a valori reali tale che xn → +∞,
opppure tale che xn → −∞, per n → +∞. Allora
µ
¶xn
1
lim
1+
= e.
n→+∞
xn
4.8. Il numero e
101
Dimostrazione. Innanzi tutto notiamo che
µ
¶k
µ
¶−1
1
1
1+
= ek+1 1 +
→ e.
k+1
k+1
(4.8.14)
Fissato quindi ε > 0, esiste k0 tale che per ogni k ≥ k0 valgono le diseguaglianze
µ
¶k µ
¶k+1
1
1
e−ε< 1+
< 1+
<e+ε
(4.8.15)
k+1
k
Sia dapprima xn → +∞. Per ogni xn sia [xn ] il massimo intero che non supera
xn . Si ha [xn ] ≤ xn < [xn ] + 1, da cui
µ
1+
1
[xn ] + 1
¶[xn ]
<
µ
¶xn µ
¶[xn ]+1
1
1
1+
< 1+
.
xn
[xn ]
Poiché [xn ] → +∞, definitivamente si ha [xn ] > k0 . La tesi in questo caso segue
da (4.8.15) e dal Teorema del confronto 4.5.2.
Supponiamo ora xn → −∞. Posto yn = −xn , si ha yn → +∞ e
¶xn µ
¶−yn µ
¶yn −1 µ
¶
µ
1
1
1
1
= 1−
= 1+
1+
→e
1+
xn
yn
yn − 1
yn − 1
per il risultato precedente.
Teorema 4.8.16 Sia {xn } una successione a valori reali tale che |xn | → +∞.
Allora
µ
¶xn
1
lim
1+
= e.
n→+∞
xn
Dimostrazione. Fissato ε > 0 ad arbitrio, per il Lemma precedente valgono
definitivamente ambedue le diseguaglianze
¯µ
¯
¶|xn |
¯
¯
1
¯
¯
− e ¯ < ε,
¯ 1+
¯
¯
|xn |
¯µ
¯
¶
−|x
|
¯
¯
n
1
¯
¯
− e ¯ < ε.
¯ 1−
¯
¯
|xn |
Per ogni n si ha xn = |xn |, oppure xn = − |xn |. Quindi la sottosuccessione corrispondente agli xn positivi tende ad e, come pure la sottosuccessione
corrispondente agli xn negativi. Ne segue la convergenza della successione.
Con l’ausilio del Teorema appena dimostrato si deducono alcuni limiti fondamentali in Analisi Matematica. Il primo limite presenta la forma di indecisione
0
1∞ , gli altri la forma .
0
102
4. Successioni
Teorema 4.8.17 Sia {εn } una successione a valori reali tale che limn→+∞ εn =
0 e εn 6= 0. Sia a un numero reale. Allora
1/εn
a) (1 + a · εn )
→ ea .
b)
log(1 + a · εn )
→ a.
εn
c)
aεn − 1
→ log a
εn
d)
(1 + εn )a − 1
→ a.
εn
(se a > 0).
Dimostrazione. a) Anzitutto si noti che 1 + a · εn è definitivamente positivo,
poiché εn → 0. Quindi l’espressione in a) e b) ha senso per n abbastanza grande.
Se a = 0 l’asserto è ovvio. Sia a 6= 0, e si ponga xn = (aεn )−1 . Poiché
εn → 0 si ha |xn | → +∞. Risulta quindi
·µ
1/εn
(1 + a · εn )
=
1+
1
xn
¶xn ¸a
→ ea .
b) Passando ai logaritmi nella relazione di limite in a) si ha l’asserto per il
punto 5 del Teorema 4.7.2.
c) Poniamo σn = aεn − 1, di modo che εn = loga (1 + σn ). Si ha
σn
σn
aεn − 1
=
=
log a.
εn
loga (1 + σn )
log(1 + σn )
Per il punto 3 del Teorema 4.7.2, si ha σn → 0. Per il punto b) appena dimostrato si ha l’asserto.
d) Se a = 0 l’asserto è ovvio. Sia a 6= 0. Si ponga σn = a log(1 + εn ). Per il
punto 5 del Teorema 4.7.2, σn → 0. Si ha
(1 + εn )a − 1
eσn − 1 log(1 + εn )
=a
·
→a
εn
σn
εn
per i punti b) e c) precedenti.
Esempi 4.8.18
1
1
µq
¶
2
1. (cos 1/n) sin 1/n =
1 − sin2 1/n sin 1/n =
2
1
¶
µ
2
1
2
sin
1/n → e−1/2 .
2
= 1 − · 2 sin 1/n
2
4.9. Infiniti e infinitesimi
103
µ
¶
3
3
µ
¶ log 1 + sin
sin
3
n
n ·3→3
2. n log 1 + sin
=
·
3
3
n
sin
n
n
(si veda il Teorema 4.5).
3. n
4.
¡√
n
√
4.9
¢ 101/n − 1
10 − 1 =
→ log 10.
1/n
Ãr
n2 + n − n = n
!
1
−1
n
1+
µ
¶1/2
1
1+
−1
1
n
=
→ .
1
2
n
Infiniti e infinitesimi
Definizione 4.9.1 Sia {xn } una successione a valori reali. Si dice che xn è un
infinitesimo se limn→+∞ xn = 0. Si dice che xn è un infinito se limn→+∞ xn =
+∞, oppure limn→+∞ xn = −∞.
Tra gli infiniti che ricorrono maggiormente in Analisi Matematica vi sono
loga n, nb , ecn , ove a, b, c sono costanti positive. Analogamente, gli infinitesimi
più ricorrenti sono i reciproci dei precedenti, log−a n, n−b , e−cn . Accanto ad
c
essi possono presentarsi infiniti del tipo log (log n), en , n!, nn , e gli infinitesimi
che sono i loro reciproci.
Prima di confrontare tra loro queste successioni, enunciamo un criterio utile
a stabilire se una successione sia infinita o infinitesima.
Teorema 4.9.2 (Criterio del rapporto per le successioni) Sia an > 0 per
ogni n. Esista
an+1
α = lim
.
n→+∞ an
a) Se 0 ≤ α < 1, allora an → 0+.
b) Se 1 < α ≤ +∞, allora an → +∞.
Dimostrazione. a) Sia ε > 0 tale che α + ε < 1. Esiste n0 tale che per ogni
n ≥ n0 si abbia an+1 /an < α + ε. Per tali valori di n si ha
an+1
an
an−1
an +1
·
·
· · · 0 · an0
an
an−1 an−2
an0
< (α + ε) · (α + ε) · (α + ε) · · · (α + ε) an0
an+1 =
n+1−n0
= (α + ε)
Quindi
n
an0
−n0
0 < an < (α + ε) (α + ε)
an0 → 0.
104
4. Successioni
La tesi segue dal Teorema del confronto 4.5.2.
b) Sia bn = 1/an . Allora
lim
n→+∞
bn+1
an
= lim
< 1.
n→+∞
bn
an+1
Per il punto a) bn → 0+ e quindi an → +∞.
Se α = 1, in generale non si può dedurre nulla sul comportamento della
successione. Si considerino ad esempio le due successioni an = n e an = 1/n, la
prima infinita e la seconda infinitesima. Al tendere di n a +∞ per ambedue si
ha an+1 /an → 1.
Teorema 4.9.3 Sia b > 0 e c > 0. Allora
ecn
→ +∞.
nb
(4.9.4)
Dimostrazione. Per dimostrare il Teorema applichiamo il criterio del rapporto
alla successione an = ecn /nb . Si ha
an+1
ec(n+1)
=
·
an
ecn
µ
n
n+1
¶b
→ ec > 1,
da cui (4.9.4).
Il criterio del rapporto non basta per determinare il limite di an = nb / loga n.
Infatti
µ
¶b µ
¶a
an+1
n+1
log n
=
·
.
(4.9.5)
an
n
log(n + 1)
Il primo fattore a destra in (4.9.5) tende a 1. Per il secondo fattore si ha
log n
log n
=
=
log(n + 1)
log n + log(1 + 1/n)
1
→ 1.
log(1 + 1/n)
1+
log n
Prima di studiare il comportamento al limite del rapporto an = nb / loga n,
dimostriamo una disuguaglianza sul logaritmo.
Lemma 4.9.6 Per ogni x > −1 si ha log(1 + x) ≤ x.
Dimostrazione. Per il Lemma 1.6.1 si ha, per ogni x > −1, x 6= 0,
³
x ´n
x
1+
> 1 + n = 1 + x.
n
n
Per il punto a) del Teorema 4.8.17 e per (4.9.7) si ha
³
x ´n
ex = lim 1 +
≥ 1 + x.
n→+∞
n
(4.9.7)
4.9. Infiniti e infinitesimi
105
Quindi ex ≥ 1 + x, da cui x ≥ log(1 + x). Questa relazione vale anche per x = 0
con il segno di eguaglianza.
Si può dimostrare che l’equazione log(1+x) = x, ovvero 1+x = ex , ammette
l’unica soluzione x = 0. Si veda a questo proposito l’esempio 8.8.9.2 nel capitolo
8.
Teorema 4.9.8 Sia a > 0 e b > 0. Allora
nb
→ +∞.
loga n
Dimostrazione. Per il Lemma precedente si ha
³
´
b
log n = log nb/2a < log 1 + nb/2a ≤ nb/2a .
2a
Quindi
µ ¶a
nb
nb
nb
nb
2a
¢a > b/2 = nb/2 → +∞.
=¡b
¢a = ¡
a
b
log n
n
log nb/2a
2a log n
Definizione 4.9.9 Siano {xn } e {yn } due infiniti. Si dice che xn diverge più
lentamente di yn , o che xn è un infinito di ordine inferiore rispetto a yn , se
xn /yn → 0. Equivalentemente, si dice che yn diverge più rapidamente di xn , o
che yn è un infinito di ordine superiore rispetto a xn .
Si dice che xn e yn sono infiniti dello stesso ordine se esiste un numero reale
β > 0 tale che |xn /yn | → β.
Si ha l’analoga definizione per gli infinitesimi.
Definizione 4.9.10 Siano {xn } e {yn }, yn 6= 0, due infinitesimi. Si dice che
xn tende a 0 più rapidamente di yn , o che xn è un infinitesimo di ordine superiore rispetto a yn , se xn /yn → 0. Equivalentemente, si dice che yn tende a 0
più lentamente di xn , o che yn è un infinitesimo di ordine inferiore rispetto a
xn .
Si dice che xn e yn sono infinitesimi dello stesso ordine se esiste un numero
reale β > 0 tale che |xn /yn | → β.
Se xn tende a 0 più rapidamente di yn e yn tende a 0 più rapidamente di zn ,
allora xn tende a 0 più rapidamente di zn . Infatti, se xn /yn → 0 e yn /zn → 0,
allora
xn
xn yn
=
·
→ 0.
zn
yn zn
Analogamente, se xn e yn sono infinitesimi dello stesso ordine, e se yn e zn
sono infinitesimi dello stesso ordine, allora xn e zn sono infinitesimi dello stesso
ordine. Infatti, se |xn /yn | → β > 0 e |yn /zn | → γ > 0, allora
¯ ¯ ¯ ¯ ¯ ¯
¯ xn ¯ ¯ xn ¯ ¯ yn ¯
¯ ¯ = ¯ ¯ · ¯ ¯ → βγ > 0.
¯ zn ¯ ¯ yn ¯ ¯ zn ¯
Le stesse osservazioni si applicano agli infiniti.
106
4. Successioni
Esempi 4.9.11
1. Dai Teoremi 4.9.3 e 4.9.8 segue che, per ogni a, b, c positivi, ecn diverge più
rapidamente di nb , il quale diverge più rapidamente di loga n. Passando
ai reciproci, e−cn tende a 0 più rapidamente di n−b , il quale tende a 0 più
rapidamente di log−c n.
2. I due infiniti n e n + (−1)n hanno lo stesso ordine. Dal Teorema 4.5 segue
che sin 1/n è infinitesimo dello stesso ordine di 1/n. Dal Teorema 4.8.17
segue che log(1+ a/n) è infinitesimo dello stesso ordine di 1/n (per a 6= 0).
Deduciamo altri due confronti tra infiniti
Teorema 4.9.12 Valgono i seguenti limiti
nn
n!
→ +∞,
→ +∞.
n!
en
Dimostrazione. Sia an = nn /n!. Si ha
(4.9.13)
(n + 1)n (n + 1)
an+1
(n + 1)n+1
n!
1
=
·
=
·
n
an
n
(n + 1)!
nn
n+1
µ
¶n
1
= 1+
→ e > 1.
n
Per il criterio del rapporto la prima relazione di limite è vera.
Poniamo ora an = n!/en . Si ha
an+1
(n + 1)! en
n+1
=
· n+1 =
→ +∞.
an
n!
e
e
Quindi vale anche la seconda relazione di limite in 4.9.13.
Definizione 4.9.14 Siano {xn } e {yn } due infinitesimi, tali che xn 6= 0 e
yn 6= 0. Sia α un numero reale positivo. Si dice che xn è un infinitesimo di
ordine α rispetto a yn se esiste β > 0 tale che
|xn |
α → β.
|yn |
(4.9.15)
Una analoga definizione vale per gli infiniti.
Esempi 4.9.16
1
1
1. 3/2 è un infinitesimo di ordine 3/2 rispetto a . Analogamente, n3/2 è
n
n
un infinito di ordine 3/2 rispetto a n.
2. 1 − cos 1/n è un infinitesimo di ordine 2 rispetto a 1/n. Infatti
µ
¶2
1 − cos 1/n
1 sin 1/2n
1
=
→ .
2
1/n
2
1/2n
2
Si noti che, dati due infinitesimi{xn } e {yn }, non esiste necessariamente α
tale che valga la (4.9.15). Ad esempio, xn = e−n e yn = 1/n.
4.10. o piccolo e asintotico
4.10
107
o piccolo e asintotico
Definizione 4.10.1 Siano {xn } e {yn } due successioni reali, e sia yn 6= 0. Si
dice che xn è o piccolo di yn se
xn
→ 0.
yn
In tal caso si scrive
xn = o (yn ) .
Esempi 4.10.2
1. Se a, b e c sono positivi, si ha
¡ ¢
¡
¢
loga n = o nb , e−cn = o 1/nb ,
2. Si ha
1 − cos
Infatti
1/n2 = o(1/n),
√
n = o(n).
1
= o(1/n).
n
1 − cos 1/n
1 1 − cos 1/n
= ·
→ 0.
1/n
n
1/n2
per l’esempio 4.9.16.2.
La scrittura o(1) sta ad indicare un generico infinitesimo. Ad esempio, 1/n =
o(1), e−n = o(1), etc. La scrittura xn = zn + o(yn ) equivale a xn − zn = o(yn ).
Se xn converge a x, allora xn − x → 0 e quindi xn = x + o(1).
Definizione 4.10.3 Siano {xn } e {yn } due successioni reali tali che xn 6= 0 e
yn 6= 0. Si dice che xn è asintotico a yn se
xn
→ 1.
yn
In tal caso si scrive
xn ∼ yn
Ad esempio,
n2 − 3n ∼ n2 ,
sin 1/n ∼ 1/n,
log (1 + 1/n) ∼ 1/n,
e2/n − 1 ∼ 2/n.
La relazione ∼ è riflessiva, cioé xn ∼ xn , simmetrica, cioé xn ∼ yn se e solo se
yn ∼ xn , transitiva, cioé xn ∼ yn e yn ∼ zn implicano xn ∼ zn . Infatti,
xn
xn yn
=
·
→ 1.
zn
yn zn
108
4. Successioni
Se xn ∼ yn e se xn → α ∈ R, allora yn → α. Infatti
yn
· xn → α.
yn =
xn
Si noti tuttavia che la relazione xn ∼ yn non implica che le due successioni
siano regolari. Ad esempio, (−1)n + 1/n ∼ (−1)n , ma ambedue le successioni
oscillano.
Infine, introduciamo i simboli di O grande ed eguale ordine di grandezza,
anche se essi sono meno frequentemente usati.
Definizione 4.10.4 Siano {xn } e {yn } due successioni reali, e sia yn > 0. Si
dice che che xn è O grande di yn se esiste una costante c tale
|xn |
≤ c.
yn
(4.10.5)
In tal caso si scrive
xn = O(yn ).
Siano xn 6= 0 e yn 6= 0. Si dice che xn e yn hanno eguale ordine di grandezza
se esistono due costanti c > 0 e d > 0 tali che definitivamente
¯ ¯
¯ xn ¯
0 < d ≤ ¯¯ ¯¯ ≤ c.
(4.10.6)
yn
In tal caso si scrive
xn ³ yn .
Due successioni asintotiche hanno chiaramente eguale ordine di grandezza, ma non vale l’implicazione opposta, come mostrato nel successivo esempio
4.10.7.3
Esempi 4.10.7
1. n sin n = O(n). In questo caso (4.10.5) vale con c = 1. Si noti che n sin n
è irregolare.
√
√
¡
¢
2
2. e n +n ³ en . Infatti, n2 + n − n = n (1 + 1/n)1/2 − 1 → 1/2, da cui
e
√
n2 +n
en
=e
√
n2 +n−n
→ e1/2 .
3. ((−1)n + 1/n) sin n ³ sin n. In questo esempio ambedue le successioni
sono irregolari e non sono asintotiche. La (4.10.6) vale con c = 3/2 e
d = 2/3 (per n > 1).
Tra i vari simboli introdotti in questo paragrafo esistono le seguenti implicazioni, nessuna delle quali può essere invertita.
∼ =⇒ ³ =⇒ O
o =⇒ O
4.11. Successioni in Rk
4.11
109
Successioni in Rk
Sia {xn } una successione di punti dello spazio euclideo Rk , k ≥ 1. Poniamo
xn = (x1n , x2n , . . . , xkn ) .
(4.11.1)
La successione {xn } individua k successioni reali, dipendenti da un doppio indice: la successione {x1n } delle prime coordinate, la successione {x2n } delle
seconde coordinate, . . . , la successione {xkn } delle k-esime coordinate. Ad
esempio, la successione
¶
µ
1
1
(4.11.2)
xn = sin , cos
n
n
individua le due successioni reali
x1n = sin
1
,
n
x2n = cos
1
.
n
Viceversa, assegnate k successioni reali {x1n }, {x2n }, . . . , {xkn }, esse individuano la successione di punti (4.11.1). Questa osservazione permette, come vedremo, di ricondurre il calcolo dei limiti in Rk al calcolo dei limiti delle successioni
reali.
Innanzi tutto enunciamo esplicitamente la definizione di convergenza nel caso
in cui lo spazio metrico sia Rk con la metrica euclidea.
La successione (4.11.1) converge a un punto x = (x1 , x2 , . . . , xk ) ∈ Rk se per
ogni ε > 0 esiste n0 tale che per ogni n ≥ n0 si abbia
v
u k
uX
kxn − xk = t (xjn − xj )2 < ε
j=1
Lemma 4.11.3 Sia an = (a1 , a2 , . . . , ak ) un punto di Rk . Valgono le seguenti
diseguaglianze
q
(4.11.4)
max |aj | ≤ a21 + a22 + · · · a2k ≤ |a1 | + |a2 | + · · · + |ak | .
j=1,...,k
Dimostrazione. Dimostriamo dapprima la diseguaglianza di sinistra. Si ha,
per ogni j = 1, . . . , k
a2j ≤ a21 + a22 + · · · a2k .
Passando alle radici quadrate si ha ottiene per ogni j = 1, . . . , k,
q
q
|aj | = a2j ≤ a21 + a22 + · · · a2k .
Dimostriamo ora la diseguaglianza di destra. Si ha
2
(|a1 | + |a2 | + · · · + |ak |) =
a21 + a22 + · · · a2k + 2 |a1 | |a2 | + 2 |a1 | |a3 | + · · · + 2 |ak−1 | |ak |
≥ a21 + a22 + · · · a2k .
110
4. Successioni
Passando alle radici quadrate si ottiene
q
q
2
|a1 | + |a2 | + · · · + |ak | = (|a1 | + |a2 | + · · · + |ak |) ≥ a21 + a22 + · · · a2k .
Teorema 4.11.5 Sia {xn } una successione di punti di Rk . La successione
converge a x = (x1 , x2 , . . . , xk ) ∈ Rk se e solo se xjn converge a xj per ogni
j = 1, . . . , k
Dimostrazione. Supponiamo dapprima xn → x per n → +∞. Per ogni ε > 0
esiste n0 tale che per ogni n ≥ n0 si ha kxn − xk < ε. Per la diseguaglianza di
sinistra in (4.11.4), per ogni n ≥ n0 e per ogni j = 1, . . . , k si ha
|xjn − xj | ≤ kxn − xk < ε.
Quindi xjn → xj per n → +∞, per ogni j = 1, . . . , k.
Viceversa, supponiamo xjn → xj per ogni j = 1, . . . , k. Per ogni ε > 0
ognuna delle seguenti diseguaglianze vale definitivamente
|x1n − x1 | < ε,
|x2n − x1 | < ε, . . . , |xkn − xk | < ε.
(4.11.6)
Quindi esiste n0 tale che per ogni n ≥ n0 tutte le diseguaglianze (4.11.6) valgono
contemporaneamente. Dalla diseguaglianza di destra in (4.11.4) si ha, per ogni
n ≥ n0 ,
k
X
kxn − xk ≤
|xjn − xj | < kε.
j=1
Quindi xn → x.
Esempi 4.11.7
1. Sia {xn } la successione in (4.11.2). Si ha xn → (0, 1) per n → +∞.
2. La successione dei punti xn = (1/n, (−1)n ) non converge, poiché la successione delle seconde coordinate non converge.
In Rk sono definite tre operazioni: somma, prodotto per uno scalare e prodotto interno. Il calcolo dei limiti rispetto a queste tre operazioni è una immediata
conseguenza del Teorema 4.11.5.
Teorema 4.11.8 Siano {xn } e {y n } successioni in Rk . Sia {αn } una successione di numeri reali. Supponiamo che per n → +∞ si abbia
xn → x,
Allora
a) xn + y n → x + y
y n → y,
αn → α ∈ R.
4.12. Classe limite
111
b) αn xn → αx
c) (xn , y n ) → (x, y).
Dimostrazione. Ci limitiamo a dimostrare, come esempio, il punto c), poiché
la dimostrazione degli altri due punti è del tutto analoga. Sia xn come in
(4.11.1), y n = (y1n , y2n , . . . , ykn ), x = (x1 , x2 , . . . , xk ), y = (y1 , y2 , . . . , yk ).
Per il Teorema 4.11.5 si ha, al tendere di n a +∞,
x1n → x1 , x2n → x2 , . . . , xkn → xk ,
y1n → y1 , y2n → y2 , . . . , ykn → yk .
Applicando il Teorema 4.7.2 si ha
(xn , y n ) = x1n y1n + x2n y2n + · · · + xkn ykn → x1 y1 + x2 y2 + · · · + xk yk = (x, y).
4.12
Classe limite
Sia {xn } una successione di numeri reali e sia {xnk } una sua sottosuccessione.
Anche se {xn } non è regolare, può accadere che la sottosuccessione ammetta
limite, finito o infinito. Siamo cosı̀ condotti alla seguente definizione.
Definizione 4.12.1 Sia {xn } una successione a valori reali. Un elemento α ∈
R si chiama valore limite della successione se esiste una sottosuccessione {xnk }
tale che limk→+∞ xnk = α. L’insieme dei valori limite di {xn } si chiama classe
limite della successione.
Esempi 4.12.2
1. Sia xn = (−1)n . In questo caso la classe limite è {−1, 1}. Infatti x2k =
1 → 1 e x2k−1 = −1 → −1. Ogni altra sottosuccessione regolare tende a
1 oppure a −1.
nπ
2. Sia xn = sin
, con n ≥ 0. La classe limite è {0, 1, −1}. Infatti, per ogni
2
k ≥ 0 intero, si ha
x4k = 0,
x4k+1 = 1,
x4k+2 = 0, x4k+3 = −1.
Ogni altra sottosuccessione regolare converge a uno di questi valori limite.
3. Sia xn = n sin
nπ
. In questo caso
2
x4k = 0,
x4k+1 = n,
La classe limite è {−∞, 0, +∞}.
x4k+2 = 0, x4k+3 = −n.
112
4. Successioni
4. L’insieme Q dei numeri razionali è numerabile, e quindi può essere disposto in successione. Sia {rn } la successione dei razionali. La sua classe
limite è R.
Per vedere ciò, ricordiamo che ogni numero reale x è punto di accumulazione della successione. Per il Teorema 4.3.5, esiste una sottosuccessione
{rnk } tale che rnk → x per k → +∞. Inoltre anche +∞ e −∞ sono valori
limite. Infatti, per ogni intero k > 0 si può definire induttivamente rnk
in modo che rnk > k e n1 < n2 < n3 < · · · . Ovviamente rnk → +∞ per
k → +∞. In modo analogo si costruisce una sottosuccessione divergente
a −∞.
Teorema 4.12.3 Sia {xn } una successione di numeri reali e sia E ⊆ R la sua
classe limite. Allora
a) E 6= ∅
b) E ∩ R è un chiuso
c) E ha massimo e minimo (nell’insieme ordinato R).
Dimostrazione. a) Se {xn } è limitata, la ©sua ªchiusura è compatta. Per il
Corollario 4.3.6 esiste una sottosuccessione di xnj convergente. Quindi E =
6 ∅.
Se {xn } è illimitata superiormente, possiamo definire induttivamente una
sottosuccessione divergente a +∞. Infatti, esiste un indice n1 tale che xn1 > 1;
esiste un indice n2 > n1 tale che xn2 > 2; esiste un indice n3 > n2 tale che
xn3 > 3, etc. Chiaramente limk→+∞ xnk = +∞. Quindi +∞ ∈ E.
In modo analogo si dimostra che −∞ ∈ E se {xn } è illimitata inferiormente.
0
b) Sia (E ∩ R) 6= ∅, e sia z un punto di accumulazione di E ∩ R. Sia
yk ∈ E ∩ R convergente a z. Poiché ogni yk è limite di una sottosuccessione,
esiste n1 tale che |xn1 − y1 | < 1; esiste n2 > n1 tale che |xn2 − y2 | < 1/2.
Per induzione, per ogni intero positivo k esiste nk tale che |xnk − yk | < 1/k e
nk > nk−1 . Si ha
|z − xnk | ≤ |z − yk | + |yk − xnk | < |z − yk | + 1/k → 0.
Quindi z è il limite della sottosuccessione {xnk }.
c) Se {xn } è illimitata superiormente, come abbiamo già visto nella dimostrazione del punto a), +∞ ∈ E, e quindi E ha +∞ come massimo.
Se {xn } è limitata superiormente, allora anche E è limitata superiormente.
Infatti, nessun elemento
α > sup xn
può essere un valore limite della successione. Sia L = sup E. Poichè E ∩ R è un
chiuso, per il Teorema 3.5.4 L ∈ E ∩ R. Quindi L è il massimo di E.
L’esistenza del minimo si dimostra in modo analogo.
4.12. Classe limite
113
Definizione 4.12.4 Sia {xn } una successione di numeri reali e sia E la sua
classe limite. Si chiama limite superiore (o massimo limite) della successione
il massimo della classe limite.
Si chiama limite inferiore (o minimo limite) della successione il minimo
della classe limite. Per il limite superiore si usano le notazioni
lim sup xn ,
limn→+∞ xn .
n→+∞
Per il limite inferiore si usano le notazioni
lim inf xn ,
n→+∞
limn→+∞ xn .
Esempi 4.12.5
1. Negli esempi 4.12.2.1 e 4.12.2.2 si ha
lim sup xn = 1,
n→+∞
lim inf xn = −1.
n→+∞
Negli esempi 4.12.2.3 e 4.12.2.4 si ha
lim sup xn = +∞,
n→+∞
lim inf xn = −∞.
n→+∞
2. Negli esempi 4.12.2 ha lim supn→+∞ xn = sup xn e lim inf n→+∞ xn =
inf xn , ma in generale il limite superiore non coincide con l’estremo superiore e il limite inferiore non coincide con l’estremo inferiore. Ad esempio,
sia xn = (−1)n (3 + 1/n), ove n ∈ N. Si ha
lim sup xn = 3, lim inf xn = −3,
n→+∞
3. Sia xn =
n→+∞
max xn = 7/2,
min xn = −4.
µ
¶n
(−1)n
1+
. Allora
n
lim sup xn = e,
n→+∞
lim inf xn = e−1 .
n→+∞
4. Sia xn = −n. Allora xn → −∞ e si ha −∞ = lim inf n→+∞ xn =
lim supn→+∞ xn .
Teorema 4.12.6 Sia {xn } una successione di numeri reali.
a) Se lim supn→+∞ xn = L < +∞, allora, per ogni ε > 0 si ha definitivamente
xn < L + ε.
b) Se lim inf n→+∞ xn = ` > −∞, allora, per ogni ε > 0 si ha definitivamente
xn > ` − ε.
114
4. Successioni
Dimostrazione. Supponiamo, per assurdo, che a) sia falsa. Allora esiste ε > 0
tale che esistono infiniti indici nk tali che xnk ≥ L + ε. Se α è un valore limite
della sottosuccessione {xnk }, si ha necessariamente α ≥ L + ε. Poiché α è anche
un valore limite della successione originaria {xn }, L non può essere il limite
superiore di {xn }, assurdo. In modo analogo si dimostra b).
Dalla definizione 4.12.4 si ha che lim inf n→+∞ xn ≤ lim supn→+∞ xn . Ovviamente, detta E la classe limite di {xn }, l’eguaglianza E = {α} equivale a
lim inf n→+∞ xn = lim supn→+∞ xn = α.
Corollario 4.12.7 Si ha lim inf n→+∞ xn = lim supn→+∞ xn = α ∈ R se e solo
se limn→+∞ xn = α.
Dimostrazione. Se xn → α, per i Teoremi 4.3.4 e 4.4.11 ogni sottosuccessione
deve tendere a α, per cui la classe limite E si riduce a {α}.
Viceversa, sia E = {α}. Se α ∈ R, dal Teorema precedente si ha definitivamente α − ε < xn < α + ε, e quindi xn converge a α.
Sia α = +∞. Se, per assurdo, xn non diverge a +∞, deve esistere M > 0
tale che esistono infiniti
nj per cui xnj ≤ M . Sia β un valore limite
© indici
ª
della sottosuccessione xnj . Allora β ≤ M . Poiché β è anche un valore limite
della successione originaria {xn }, la classe limite deve contenere un elemento
β 6= +∞, assurdo.
Se α = −∞ si ragiona in modo analogo al caso precedente.
4.13
La condizione di Cauchy
Sia (X, d) uno spazio metrico e sia {xn } una successione a valori in X convergente a p ∈ X. Per ogni ε > 0 esiste n0 tale che per ogni n ≥ n0 si
ha
d(xn , p) < ε/2.
(4.13.1)
Se m è un altro intero tale che m ≥ n0 , si ha
d(xm , p) < ε/2.
(4.13.2)
Da queste due diseguaglianze si ottiene
d(xn , xm ) ≤ d(xn , p) + d(xm , p) < ε.
Quindi una successione convergente in uno spazio metrico soddisfa la seguente
condizione, chiamata condizione di Cauchy:
∀ε > 0 ∃n0 ∀m, n ≥ n0 ,
d(xn , xm ) < ε.
(C)
Si noti che l’espressione della condizione condizione (C) non fa alcun riferimento
al valore del limite di {xn }.
Come abbiamo appena mostrato, in qualunque spazio metrico la condizione
di Cauchy è necessaria per la convergenza di una successione. Tuttavia esistono
spazi metrici in cui essa non è sufficiente per la convergenza.
4.13. La condizione di Cauchy
115
Esempi 4.13.3
1. Sia X = Q con la metrica√euclidea. Sia {xn } una qualunque successione
di razionali convergente a 2. Essa è di Cauchy, in quanto convergente in
R. Tuttavia essa non converge in Q.
¯
¯
¯1
1¯
2. Per ogni m, n ∈ N poniamo d(n, m) = ¯¯ − ¯¯. È immediato verificare
n m
che (N, d) è uno spazio metrico.
La successione xn = n di tutti gli elementi di N soddisfa la condizione di
Cauchy. Infatti, per ogni ε > 0, sia n0 > 2/ε. Per ogni m, n ≥ n0 si ha
¯
¯
¯1
1¯
1
1
2
<
d(n, m) = ¯¯ − ¯¯ < +
< ε.
n m
n m
n0
Tuttavia, la successione {xn } non converge. Infatti, per ogni k ∈ N si ha
¯
¯
¯1
1 ¯¯ 1
¯
lim d(xn , k) = lim ¯ − ¯ = > 0.
n→+∞
n→+∞ k
n
k
Definizione 4.13.4 Sia (X, d) uno spazio metrico e sia {xn } una successione
a valori in X. Si dice che {xn } è una successione di Cauchy se essa soddisfa la
condizione (C). Lo spazio (X, d) si dice completo se ogni successione di Cauchy
è convergente.
Lo spazio Q con la metrica euclidea e lo spazio N con la metrica definita
nell’esempio 4.13.3.2 non sono spazi metrici completi.
Teorema 4.13.5 Rk dotato della metrica euclidea è completo per ogni k ≥ 1.
Dimostrazione. Sia {xn } una successione di Cauchy in Rk . Poniamo, per ogni
n ≥ 1,
En = {xn , xn+1 , xn+2 , xn+3 , . . .}
Si ha
E1 ⊇ E2 ⊇ · · · ⊇ En ⊇ En+1 ⊇ · · ·
(4.13.6)
En è limitato per ogni n. Infatti, per la condizione (C), in cui scelga ε = 1,
esiste n0 tale che per ogni r, s ≥ n0 si ha d(xr , xs ) < 1, ove abbiamo denotato
con d la metrica euclidea. Ne segue, per ogni n ≥ n0 ,
diam En ≤ diam En0 = sup d(xr , xs ) ≤ 1.
(4.13.7)
r,s≥n0
Quindi En è limitato per ogni n ≥ n0 . Per il Teorema 3.5.13, En è limitato per
ogni n ≥ 1.
Consideriamo ora la successione delle chiusure E n di En . Per il Teorema
3.5.12, diam En = diam E n . Per il Teorema di Heine-Borel, gli insiemi En sono
compatti.
116
4. Successioni
Per il punto d) del Teorema 3.5.8, le relazioni di inclusione (4.13.6) valgono
anche per E n . Si ha quindi
E 1 ⊇ E 2 ⊇ · · · ⊇ E n ⊇ E n+1 ⊇ · · · .
(4.13.8)
Possiamo applicare il Teorema 3.6.11 e concludere che
F =
+∞
\
E n 6= ∅.
n=1
Sia p ∈ F . Dimostriamo che limn→+∞ xn = p (per l’unicità del limite, questo
dimostra implicitamente che F si riduce a un singleton).
Fissiamo ε > 0 ad arbitrio e sia n0 tale che per ogni r, s ≥ n0 si abbia
d(xr , xs ) < ε. Per n ≥ n0 si ha
diam En ≤ diam En0 = sup d(xr , xs ) ≤ ε.
(4.13.9)
r,s≥n0
Quindi diam En = diam E n → 0. Poiché xn e p appartengono a E n , ne segue
d(xn , p) ≤ diam E n → 0
per n → +∞.
Gli spazi metrici compatti costituiscono un’altra importante classe di spazi
metrici completi.
Teorema 4.13.10 Sia (X, d) uno spazio metrico. Se X è compatto, allora è
completo
Dimostrazione. Sia {xn } una successione
© diª Cauchy a valori in X. Per il
Teorema 4.3.6 esiste una sottosuccessione xnj convergente a p ∈ X. Fissato
ε > 0, esiste j0 tale che
d(p, xnj ) < ε
d(xn , xm ) < ε
per j ≥ j0
per m, n ≥ nj0
Per n ≥ nj0 si ha
d(p, xn ) ≤ d(p, xnj0 ) + d(xnj0 , xn ) < 2ε
4.14
4.14.1
Appendice
Dimostrazione del Teorema 4.7.2
1. L’asserto riguardante il limite della somma è già stato dimostrato di seguito
all’enunciato del Teorema 4.7.2.
4.14. Appendice
117
2. Sia ε > 0 fissato ad arbitrio e minore di 1. Definitivamente si ha
|an − a| < ε e |bn − b| < ε. Quindi, definitivamente,
|an bn − ab| ≤ |an − a| · |bn | + |a| · |bn − b|
≤ ε (|b| + ε) + |a| ε < ε (|a| + |b| + 1) .
−1
3. Dimostriamo che b−1
. L’asserto sul quoziente segue allora
n converge a b
dal punto 2. Sia ε > 0 fissato ad arbitrio e tale che ε < |b| /2. Definitivamente
si ha |bn − b| < ε. Allora, definitivamente,
¯
¯
¯ ¯
¯ −1
¯
ε
2ε
¯bn − b−1 ¯ = ¯ bn − b ¯ <
¯ bn b ¯ |b| (|b| − ε) < |b|2 .
4. Dimostriamo dapprima che aδn → 1 se δn → 0. Basta dimostrare questo
asserto nel caso a > 1. Infatti, se a = 1 l’asserto è ovvio, se 0 < a < 1 si applica
il punto 3 alla successione 1/aδn .
Sia ε > 0 fissato ad arbitrio e sia m ≥ 2 un intero tale che 1 + mε > a.
Definitivamente si ha |δn | < 1/m. Se δn > 0 si ha, per la diseguaglianza (4.8.5),
1 ≤ aδn < a1/m < (1 + mε)
1/m
< 1 + ε.
(4.14.1)
Se δn = 0, si ha aδn = 1. Se δn = − |δn | < 0, si ha, passando ai reciproci in
4.14.1,
−1/m
−1
1 ≥ aδn > a−1/m > (1 + mε)
> (1 + ε) > 1 − ε.
¯
¯
Quindi, in ogni caso, definitivamente vale ¯1 − aδn ¯ < ε.
b
Dimostriamo ora che (an /a) n → 1. Per il punto 3 basta dimostrare l’asserto
per b > 0.
Definitivamente si ha bn < 2b. Si fissi ε > 0 tale che ε < 1 e sia δ > 0 un
numero tale che
n
o
1/2b
1/2b
δ < min (1 + ε)
− 1, 1 − (1 − ε)
.
Definitivamente si ha a − aδ < an < a + aδ, da cui
2b
1 − ε < (1 − δ)
< (1 − δ)
bn
< abnn a−bn < (1 + δ)bn < (1 + δ)2b < 1 + ε.
Infine, per i risultati precedenti e il punto 2 si ha
abnn = ab abn −b
³ a ´bn
n
a
→ ab
5. Si ha bn = b + xn ove xn → 0. Si ha
¡
¢
loga bn = loga (b + xn ) = loga b + log 1 + b−1 xn → loga b.
Il comportamento del logaritmo con base variabile si deduce dal punto 3, da
(4.14.1) precedenti e dalla formula
logan bn =
log bn
log an
(4.14.2)
118
4.14.2
4. Successioni
Dimostrazione dei Teoremi 4.7.4 e 4.7.6
I Teoremi 4.7.4 e 4.7.6 sono una immediata conseguenza della seguente Proposizione
Proposizione 4.14.3 Siano {an } e {bn } due successioni reali.
a) Se an → +∞ ed esiste c tale che definitivamte bn > c, allora an +bn → +∞.
b) Se an → +∞ ed esiste c > 0 tale che definitivamente bn > c, allora an bn →
+∞
Dimostrazione. a) Sia M > 0 arbitrario e sia n0 tale che per ogni n ≥ n0 si
abbia an > M −c. Per tali valori di n si ha an +bn > M . Quindi an +bn → +∞.
b) Sia M > 0 arbitrario e sia n0 tale che per ogni n ≥ n0 si abbia an > c−1 M .
Per tali valori di n si ha an bn > M . Quindi an bn → +∞.
4.14.3
Dimostrazione del Teorema 4.7.8
Dimostriamo ora la prima e la terza implicazione del Teorema 4.7.8. Le altre
due seguono da queste ponendo −bn al posto di bn .
Sia bn → 0+. Sia M > 0 arbitrario e sia n0 tale che per ogni n ≥ n0 si abbia
bn < 1/M . Per tali valori di n si ha anche 1/bn > M . Quindi 1/bn → +∞.
Sia bn → +∞. Sia ε > 0 arbitrario e sia n0 tale che per ogni n ≥ n0 si abbia
bn > 1/ε. Per tali valori di n si ha anche 1/bn < ε. Quindi 1/bn → 0+.
4.14.4
Dimostrazione dei Teoremi 4.7.9, 4.7.10, 4.7.12, 4.7.13
Dimostrazione del Teorema 4.7.9. Sia an → a > 1 e bn → +∞. Si fissi
ε > 0 tale che a − ε > 1. Definitivamente si ha an > a − ε.
Si fissi M > 0 ad arbitrio. Posto a − ε = 1 + δ, sia m > 0 un intero tale
che 1 + mδ > M . Definitivamente vale bn > m. Si ha cosı̀, per n abbastanza
grande,
m
abnn > (a − ε)bn > (1 + δ) > 1 + mδ > M .
(4.14.4)
Quindi abnn → +∞.
Se an → a > 1 e bn → −∞, si ha
abnn =
1
n
a−b
n
(4.14.5)
n
con −bn → +∞. Quindi a−b
→ +∞ e, per (4.14.4) e il Teorema 4.7.6, abnn →
n
0+. Le implicazioni per a < 1 si dimostrano in modo analogo.
Dimostrazione del Teorema 4.7.10. Sia an → +∞ e bn → b > 0. Si fissi
ε > 0 tale che b − ε > 0. Si fissi M > 0 ad arbitrio. Sia m un intero tale che
m > M 1/(b−ε) . Definitivamente si ha an > m. Quindi si ha, per n abbastanza
grande,
abnn > mbn > mb−ε > M .
4.14. Appendice
119
Ne segue abnn → +∞. Se an → 0+ si ha a−1
n → +∞, per il Teorema 4.7.6.
n
Per la (4.14.5) e il risultato appena dimostrato si ha a−b
→ +∞, e quindi, per
n
bn
il Teorema 4.7.6 nuovamente, an → 0+. Gli altri casi si dimostrano in modo
analogo.
Dimostrazione del Teorema 4.7.12. Sia an → 0+ e bn → +∞. Fissato
ε > 0 tale che ε < 1, si ha definitivamente an < ε e quindi
abnn < εbn → 0+
per il Teorema 4.7.9. Se an → 0+ e bn → −∞, dalla (4.14.5) e dal Teorema
4.7.6 si ha abnn → +∞. Gli altri casi si dimostrano in maniera analoga.
Dimostrazione del Teorema 4.7.13. Sia a > 1 e bn → +∞. Per ogni
M > 0 si ha definitivamente bn > aM , da cui loga bn > M . Quindi log bn → +∞.
Sia a > 1 e bn → 0+. Per ogni M > 0 si ha definitivamente bn < a−M , da
cui loga bn < −M . Quindi log bn → −∞. Le altre implicazioni si dimostrano in
modo simile.
Capitolo 5
Serie
5.1
Introduzione
La somma
a1 + a2 + · · · + ak
di k numeri reali è definita per sommazioni successive. Prima si calcola a1 + a2 ,
poi (a1 + a2 ) + a3 , poi ancora ((a1 + a2 ) + a3 ) + a4 etc., fino al risultato finale
((. . . ((a1 + a2 ) + a3 ) + · · · ) + ak−1 ) + ak .
Le parentesi possono essere omesse per la proprietà associativa della somma.
Qualora si voglia dare senso alla somma di una infinità numerabile di numeri
reali,
a1 + a2 + a3 + · · · + an + an+1 + · · ·
(5.1.1)
il procedimento descritto sopra non giunge mai a termine, ma produce una successione di ‘somme parziali’. Ciò suggerisce di definire la ‘somma di infiniti
addendi’ mediante un passaggio al limite su questa successione di somme parziali, qualora tale limite esista. La nozione di serie, studiata in questo capitolo,
rappresenta appunto la formalizzazione di questa idea.
5.2
Definizioni ed esempi
+∞
Sia {an }n=1 una successione di numeri reali. Poniamo, per ogni k ∈ N,
Ak = a1 + a2 + a3 + · · · + ak =
k
X
an
(5.2.1)
n=1
Definizione 5.2.2 Sia {an } una successione di numeri reali e sia Ak definita
come in (5.2.1). La successione {Ak } si chiama serie numerica (o semplicemente serie) di termine generale an . La quantità Ak viene chiamata somma
parziale k-esima della serie.
121
122
5. Serie
La serie di termine generale an viene indicata con il simbolo
+∞
X
an
(5.2.3)
n=1
Qualora non vi sia possibilità di equivoci, scriveremo semplicemente
Spesso useremo anche il simbolo
P
an .
a1 + a2 + a3 + · · · + an + · · ·
I termini an vengono anche chiamati addendi della serie.
Definizione 5.2.4 Si dice che la serie (5.2.3) converge ad A ∈ R se
lim Ak = A.
k→+∞
Si dice che la serie diverge a +∞, oppure a −∞, se
lim Ak = +∞,
k→+∞
oppure
lim Ak = −∞.
k→+∞
Se una serie converge ad A, o diverge a +∞, oppure a −∞, si dice che la
serie è regolare. In tal caso si pone, rispettivamente,
+∞
X
an = A,
n=1
+∞
X
an = +∞,
n=1
+∞
X
an = −∞.
n=1
Il numero A, oppure +∞, oppure −∞, si chiama somma della serie. Se la serie
non è regolare, si dice che è irregolare o oscillante.
Esempi 5.2.5
1. Sia an =
1
. La serie
n(n + 1)
+∞
X
1
n(n
+ 1)
n=1
si chiama serie di Mengoli. Dimostriamo che questa serie converge. Anzitutto si nota che
1
1
1
= −
n(n + 1)
n n+1
da cui
Ak =
k
X
1 1 1 1 1
1
1
1
= 1 − + − + − + ··· + −
n(n
+
1)
2
2
3
3
4
k
k
+
1
n=1
=1−
1
→ 1.
k+1
5.2. Definizioni ed esempi
123
Quindi la serie di Mengoli converge e ed ha somma 1. Scriviamo
+∞
X
1
= 1.
n(n
+ 1)
n=1
2. Sia an = q n , ove q è un qualsiasi numero reale. La serie
+∞
X
qn
n=0
si chiama serie geometrica di ragione q. Al variare di q questa serie
presenta tutti i caratteri possibili.
Se q = 1 la serie diviene
1 + 1 + 1 + 1 + 1 + ···
per cui Ak = k + 1 → +∞. In questo caso la serie diverge a +∞.
Sia q 6= 1. Per le somme parziali vale l’espresssione
Ak = 1 + q + q 2 + · · · + q k =
Se |q| < 1, la frazione in (5.2.6) converge a
Ak → +∞.
Se q = −1, la serie diviene
1 − q k+1
.
1−q
(5.2.6)
1
. Se q > 1, si ha invece
1−q
1 − 1 + 1 − 1 + 1 − 1 + ···
e quindi Ak = 1 per k pari, Ak = 0 per k dispari. La serie in questo caso
è oscillante.
Se q < −1, (5.2.6) mostra che A2k → +∞ e A2k−1 → −∞. Anche in
questo caso la serie oscilla.
Riassumiamo i risultati sulla serie geometrica.

+∞
se q ≥ 1

+∞

X
1
n
se |q| < 1
q =

 1−q
n=0
oscilla se q ≤ −1
3. La serie
+∞
X
1
n
n=1
si chiama serie armonica. Dimostriamo che la serie armonica diverge a
+∞. Innanzi tutto notiamo che
Ak+1 = Ak +
1
> Ak ,
k+1
124
5. Serie
e quindi le somme parziali costituiscono una successione strettamente
crescente. Tale successione non può convergere, poiché non soddisfa la
condizione di Cauchy. Infatti, per ogni k ≥ 1 si ha
1
1
1
+
+ ··· +
k+1 k+2
2k
1
1
= .
>k
2k
2
P+∞
Possiamo quindi concudere che Ak → +∞, ovvero n=1
A2k − Ak =
1
n
= +∞.
Terminiamo questo paragrafo con una semplice osservazione che sarà utilizzata
varie volte nel seguito.
P+∞
Sia c una costante diversa da 0. La serie n=1 can ha lo stesso carattere
P+∞
delle serie n=1 an . Infatti
k
X
can = c
n=1
k
X
an .
(5.2.7)
n=1
P+∞
P+∞
In particolare, se
n=1 can
n=1 an converge ad A, oppure diverge a ±∞,
converge a cA, oppure diverge a c · ±∞. Ad esempio
+∞
X
+∞
X
3
= 3,
n(n
+ 1)
n=1
5.3
n=1
−
1
= −∞.
n
La condizione di Cauchy per le serie
Abbiamo dimostrato (Teorema 4.13.5) che R è uno spazio completo, cioè che
la condizione di Cauchy è necessaria e sufficiente per la convergenza di una
successione di numeri reali. Nel caso in cui la successione sia la successione
delle somme parziali di una serie numerica, la condizione di Cauchy assume una
forma particolare, che viene evidenziata nel seguente Teorema.
Teorema 5.3.1
di Cauchy) Condizione necessaria e sufficiente afP(Criterio
+∞
finché la serie n=1 an converga è che
∀ε > 0 ∃p0 ∀p ≥ p0 ∀q ≥ 0
¯ p+q ¯
¯X ¯
¯
¯
a ¯ < ε.
¯
¯n=p n ¯
(C)
Dimostrazione. Condizione necessaria e sufficiente per la convergenza della
successione {Ak } è che per ogni ε > 0 esista p0 tale che per ogni k > h > p0 si
abbia
¯
¯ ¯
¯
k
h
k
¯X
¯ ¯ X
¯
X
¯
¯ ¯
¯
|Ak − Ah | = ¯
an −
an ¯ = ¯
an ¯ < ε.
(5.3.2)
¯
¯ ¯
¯
n=1
n=1
n=h+1
5.3. La condizione di Cauchy per le serie
125
Mutiamo di nome agli indici, ponendo h = p − 1 e k = p + q, con q ≥ 0. La
(5.3.2) diviene
¯ p+q ¯
¯X ¯
¯
¯
|Ap+q − Ap−1 | = ¯
a ¯<ε
¯n=p n ¯
per ogni p ≥ p0 e q ≥ 0.
La condizione (C) si chiama condizione di Cauchy per le serie. Come caso
particolare, otteniamo una notevole condizione necessaria per la convergenza di
una serie.
Corollario 5.3.3 Se
P+∞
n=1
an converge, allora an → 0 per n → +∞.
Dimostrazione. Applichiamo il Teorema precedente. Poiché la serie converge,
vale (C). In particolare, scegliendo q = 0, si ha
∀ε > 0 ∃p0 ∀p ≥ p0
|ap | < ε,
cioè la tesi.
La condizione an → 0 per n → +∞ è necessaria, ma non sufficiente per la
convergenza di una serie. Ad esempio, il termine generale della serie armonica
tenda a 0, ma la serie diverge.
P+∞
Definizione 5.3.4 Si dice che una serie n=1 an converge assolutamente se
converge la serie
+∞
X
|an | .
n=1
L’interesse della nozione di convergenza assoluta di una serie risiede nel
seguente Teorema.
Teorema 5.3.5 Se una serie converge assolutamente, allora converge.
P+∞
Dimostrazione. Supponiamo che la serie n=1 an converga assolutamente.
Poiché (C) è necessaria per la convergenza, si ha
∀ε > 0 ∃p0 ∀p ≥ p0 ∀q ≥ 0
p+q
X
|an | < ε.
(5.3.6)
n=p
Poiché
¯ p+q ¯ p+q
¯X ¯ X
¯
¯
a ¯≤
|an | ,
¯
¯n=p n ¯
n=p
P+∞
anche che la serie n=1 an soddisfa (C). Poiché (C) è sufficiente per la converP+∞
genza, n=1 an converge.
126
5. Serie
La convergenza assoluta è sufficiente, ma non necessaria per la convergenza
di una serie. Infatti, come vedremo più avanti, la serie
+∞
X
(−1)n
n
n=1
converge. La serie dei valori assoluti è la serie armonica, che diverge.
P+∞
P+∞
Teorema 5.3.7 Siano n=1 an e n=1 bn due serie tali che an = bn definitivamente. Allora le due serie hanno lo stesso carattere.
Dimostrazione. Sia r un intero tale che an = bn per ogni n > r. Poniamo
Ak =
k
X
an ,
Bk =
n=1
k
X
bn .
n=1
Per ogni k > r si ha
Ak =
Bk =
r
X
an +
k
X
n=1
n=r+1
r
X
k
X
bn +
n=1
an
bn
n=r+1
Sottraendo termine a termine le due eguaglianze, si ha che
Ak − Bk =
r
X
an −
n=1
r
X
bn
(5.3.8)
n=1
è costante per ogni k > r. Detta C la costante che appare a destra in (5.3.8), si
ha definitivamente
Ak = Bk + C.
Le due successioni {Ak } e {Bk } hanno quindi lo stesso carattere.
Il Teorema esprime una proprietà
notevole, che sarà utilizzata varie volte
P
nel seguito: assegnata una serie
an , possiamo modificarne un numero finito
di termini, ad esempio ponendoli eguali a 0, o cambiandone il segno, a seconda
della necessità. La serie risultante avrà lo stesso carattere delle serie originaria.
Quindi: alterando un numero finito di termini di una serie, non se ne altera il
carattere.
Naturalmente, se la serie converge,Pla serie modificata
non avrà la stessa
P+∞
+∞
somma. Dalla (5.3) è chiaro che, se
n=1 an = A e
n=1 bn = B, allora
A = B + C.
5.4. Serie a termini non negativi
5.4
127
Serie a termini non negativi
P+∞
Sia n=1 an una serie numerica tale che an ≥ 0 per ogni n. Le sue somme
parziali costituisono una successione monotona non decrescente, poiché
Ak+1 − Ak = ak+1 ≥ 0.
In forza del Teorema 4.6.2, Ak è regolare. Piú precisamente, la serie converge
se la successione degli Ak è limitata superiormente, diverge a +∞ se la successione degli Ak è illimitata superiormente. Questa osservazione ci permette
di dimostrare facilmente il Teorema del confronto per le serie a termini non
negativi.
P+∞
P+∞
Teorema 5.4.1 (del confronto per le serie) Siano n=1 an e n=1 bn due
serie tali che per ogni n
0 ≤ an ≤ bn .
(5.4.2)
Allora
P+∞
converge, anche n=1 an converge;
P+∞
P+∞
b) se n=1 an diverge, anche n=1 bn diverge.
a) se
P+∞
n=1 bn
Dimostrazione. Posto
Ak =
k
X
an ,
Bk =
n=1
k
X
bn ,
n=1
dalla relazione (5.4.2) si ha Ak ≤ Bk per ogni k. Se Bk converge, esiste un
numero M tale che
Ak ≤ Bk ≤ M .
Quindi Ak è limitata superiormente e perciò convergente. Viceversa, se Ak
diverge, per ogni M si ha definitivamente
M < Ak ≤ Bk .
Quindi anche Bk diverge.
Esempi 5.4.3
1. La serie
+∞
X
n=0
1
converge. Infatti,
+ 1)
2n (n
an =
La serie
P+∞
n=0 bn
1
1
≤ n = bn .
+ 1)
2
2n (n
converge poiché è la serie geometrica di ragione 1/2.
128
5. Serie
2. La serie
+∞
X
2 + sin n
diverge. Infatti
n
n=1
an =
e la serie
P+∞
n=1
1
2 + sin n
≤
= bn ,
n
n
an è la serie armonica, che diverge.
Osservazione. In forza del Teorema 5.3.7, il Teorema 5.4.1 continua a valere se la diseguaglianza (5.4.2) è verificata definitivamente, o se i termini sono
definitivamente non negativi. Infatti, si possono alterare i termini an e bn (in
numero finito) che non soddisfano le ipotesi, ad esempio ponendoli tutti eguali
a 0. Il carattere delle serie non ne risulta alterato.
Invece, a) e b) nel Teorema 5.4.1 non valgono se le due serie non hanno
termini definitivamente positivi. Si veda l’Appendice per un controesempio.
Corollario 5.4.4 Siano
sitivi tali che
P
an e
P
bn due serie a termini definitivamente po-
an ∼ bn .
Allora le due serie hanno lo stesso carattere.
Dimostrazione. Poiché bn /an → 1, definitivamente si ha
1
an ≤ bn ≤ 2an .
2
P
Le serie di termini generali 12 an e 2an hanno lo stesso carattere di
an . La tesi
del Corollario segue quindi dal Teorema 5.4.1 e dall’osservazione precedente.
Dalla dimostrazione del Corollario risulta chiaro che la tesi continua a valere
se alla condizione an ∼ bn si sostituisce la più debole condizione an ³ bn .
Esempi 5.4.5
µ
¶
µ
¶
1
1
1
1. La serie
log 1 +
diverge, poiché log 1 +
∼ , termine gen
n
n
n=1
nerale della serie armonica.
¶
µ
+∞
X
1
2. La serie
log 1 + 2 converge, poiché
n
n=1
+∞
X
µ
¶
1
1
1
log 1 + 2 ∼ 2 ∼
,
n
n
n(n + 1)
termine generale della serie di Mengoli.
5.5. Criteri della radice e del rapporto
5.5
129
Criteri della radice e del rapporto
P
an una serie tale che an > 0
Teorema 5.5.1 (Criterio della radice) Sia
per ogni n. Esista α tale che
√
α = lim n an .
n→+∞
a) Se 0 ≤ α < 1, allora
P
an converge.
P
b) Se 1 < α ≤ +∞, allora
an diverge.
Dimostrazione. a) Sia 0 ≤ α < 1. Sia ε > 0 tale che α+ε < 1. Definitivamente
si ha
√
n
an < α + ε,
P
n
n
ossia an < (α + ε) . La serie
(α + ε) è la serie geometrica di ragione 0 <
(α
P + ε) < 1. Per il Teorema del confronto 5.4.1 (e l’osservazione successiva),
an converge.
P
√
b) Sia α > 1. Definitivamente si ha n an > 1, da cui an > 1. La serie
an
diverge poiché an non tende a 0.
Se α = 1, in generale non si può dire nulla sulla convergenza
P+∞ o divergenza
della serie. Come esempi si considerino la serie armonica n=1 1/n e la serie
P+∞
2
n=1 1/n . Si ha
µ ¶1/n
1
1
= e− n log n → 1,
n
µ ¶1/n
2
1
= e− n log n → 1.
n2
La prima serie diverge, mentre la seconda converge, in quanto 1/n2 ∼ 1/n(n+1),
termine generale della serie di Mengoli.
Esempi 5.5.2
µ
¶n2
¶n
+∞ µ
X
3
3
1/n
converge, poiché an = 1 −
→ e−3 < 1.
1.
1−
n
n
n=4
¶n2
µ
¶n
+∞ µ
X
3
3
1/n
2.
1+
diverge, poiché an = 1 +
→ e3 > 1.
n
n
n=1
La divergenza di questa serie può anche essere dedotta dal fatto che il
termine generale tende all’infinito, violando la condizione necessaria per
la convergenza (si veda il Corollario 5.3.3)
P
an una serie tale che an > 0
Teorema 5.5.3 (Criterio del rapporto) Sia
per ogni n. Esista α tale che
an+1
.
α = lim
n→+∞ an
130
5. Serie
a) Se 0 ≤ α < 1, allora
P
an converge.
P
b) Se 1 < α ≤ +∞, allora
an diverge.
Dimostrazione. a) Sia ε > 0 tale che α + ε < 1. Esiste n0 tale che per ogni
n ≥ n0 si abbia an+1 /an < α + ε. Per tali valori di n si ricava
an+1
an
an−1
an +1
·
·
· · · 0 · an0
an
an−1 an−2
an0
< (α + ε) · (α + ε) · (α + ε) · · · (α + ε) an0
an+1 =
n+1−n0
= (α + ε)
Quindi
n
an0
−n
an < (α + ε) (α + ε) 0 an0 .
P
−n
n
Posto c = (α + ε) 0 an0 , la serie
c (α + ε) converge, in quanto il suo termine generale è multiplo del termine generale di una serie geometrica convergente.
La tesi segue dal Teorema del confronto.
b) Sia α > 1. Esiste n0 tale che per ogni n ≥ n0 si ha an+1 /an > 1. Quindi
an+1
an
an−1
an +1
·
·
· · · 0 · an0
an
an−1 an−2
an0
> an0 > 0.
an+1 =
Il termine generale non tende a 0 e quindi la serie diverge.
Come nel caso del criterio della radice, se α = 1 non si può dire nulla
sulla convergenza oP
divergenza della serie.PCome esempi si considerino di nuovo
+∞
+∞
2
la serie armonica
n=1 1/n . In ambedue i casi si ha
n=1 1/n e la serie
an+1 /an → 1.
Esempi 5.5.4
1.
+∞ n
X
x
converge assolutamente qualunque sia x. Infatti, la convergenza
n!
n=0
per x = 0 è ovvia. Se x 6= 0, si ha
¯
¯
¯ an+1 ¯
n! |x|n+1
|x|
¯
¯
¯ an ¯ = (n + 1)! |x|n = n + 1 → 0.
Dimostreremo nell’Appendice del capitolo 8 che
+∞ n
X
x
= ex
n!
n=0
La convergenza di questa serie è ‘rapida’, e può essere utilizzata per il
calcolo di ex .
5.6. Criterio di condensazione
2. La serie
131
+∞ n2
X
2
diverge. Infatti
n!
n=0
2
an+1
n!2(n+1)
22n+1
=
=
→ +∞.
2
an
n+1
(n + 1)!2n
Il criterio del rapporto per le serie, simile nelle ipotesi al criterio del rapporto
per le successioni (Teorema 4.9.2), differisce da esso nella tesi. Il criterio del
rapporto per le successioni è una condizione sufficiente affinché una successione
positiva sia infinitesima o infinita. Il criterio del rapporto per le serie è una
condizione sufficiente per la convergenza o la divergenza di una serie a termini
positivi.
Un esame della dimostrazione del criterio della radice e del criterio del rapporto mostra che le tesi di questi teoremi continuano a valere sotto ipotesi più
deboli.
P
Teorema 5.5.5 Sia
an una serie tale che an > 0 per ogni n. Se esiste α < 1
√
tale che definitivamente n an < α, oppure tale che definitivamente an+1 /an <
√
α, allora la serie converge. Se definitivamente n an ≥ 1, oppure definitivamente
an+1 /an ≥ 1, allora la serie diverge.
√
L’ipotesi che esista α tale che definitivamente valga n an < α < 1 è ad
esempio verificata se
√
β = lim sup n an < 1.
n→+∞
Infatti, fissato ε > 0 tale che β+ε < 1, per il Teorema 4.12.6 si ha definitivamente
√
n a
n < β + ε. Una analoga ossservazione vale per il rapporto.
5.6
Criterio di condensazione
Teorema 5.6.1 (Criterio di condensazione) Sia an > 0 tale che an ≥ an+1
per ogni n ≥ 1. Allora, le due serie
+∞
X
n=1
an ,
+∞
X
2n a2n
n=0
hanno lo stesso carattere.
P+∞
Dimostrazione. Denotiamo con Ak le somme parziali di n=1 an e con Ck le
P+∞ n
n
somme parziali di n=0
P 2n a2 .
Supponiamo che
2 a2n converga. Poiché an è non crescente, si ha per
ogni intero m ≥ 0
A2m+1 − A2m = a2m +1 + a2m +2 + . . . + a2m+1
≤ 2m a2m .
132
5. Serie
Per ogni k ≥ 1 sia m ≥ 0 un intero tale che k ≤ 2m+1 . Si ha
Ak ≤ A2m+1
= A1 + (A2 − A1 ) + (A4 − A2 ) + (A8 − A4 ) + · · · + (A2m+1 − A2m )
≤ a1 + 20 a1 + 2a2 + 4a4 + · · · + 2m a2m = a1 + Cm
Poiché le somme parziali Cm sono limitate, anche Ak è limitata e quindi
converge.
P n
Supponiamo ora che
2 a2n diverga. Poiché an è non crescente,
P
an
A2m+1 − A2m = a2m +1 + a2m +2 + . . . + a2m+1
¢
1 ¡ m+1
≥ 2m a2m+1 =
2
a2m+1
2
Per ogni k > 1 sia m ≥ 0 il massimo intero tale che k ≥ 2m+1 . Si ha
Ak ≥ A2m+1
= A1 + (A2 − A1 ) + (A4 − A2 ) + (A8 − A4 ) + · · · + (A2m+1 − A2m )
¢ 1
1¡
1
≥ a1 +
2a2 + 4a4 + 8a8 + · · · + 2m+1 a2m+1 = a1 + Cm+1 .
2
2
2
Per la scelta di m, se k → +∞ anche m → +∞, e quindi la divergenza di Cm
implica quella di Ak .
P n
P
La serie
2 a2n viene chiamata serie condensata della serie
an .
Come applicazione del criterio di condensazione determiniamo il carattere
di una serie notevole, il cui termine generale dipende da un parametro reale p.
I criteri presentati nei paragrafi precedenti non sono sufficienti per determinare
il carattere di questa serie i tutti i casi.
Corollario 5.6.2 Sia p un numero reale. La serie
+∞
X
1
np
n=1
(5.6.3)
converge se p > 1, diverge se p ≤ 1.
Dimostrazione. La serie condensata della serie (5.6.3) è
+∞
X
n=0
2n
+∞
X
1
1
=
,
n(p−1)
2np
2
n=0
cioè la serie geometrica di ragione 1/2(p−1) . Se p > 1 si ha 1/2(p−1) < 1 e quindi
la serie converge. Se p ≤ 1 si ha 1/2(p−1) ≥ 1 e quindi la serie diverge.
Combinando il Corollario precedente con il Teorema del confronto e il criterio
di condensazione, si determina il carattere di un’altra serie notevole, più generale
della precedente.
5.6. Criterio di condensazione
133
Corollario 5.6.4 Siano p e q numeri reali. La serie
+∞
X
1
p logq n
n
n=2
(5.6.5)
ha il seguente carattere:
½
converge per
½
diverge per
p > 1 e q qualunque
p=1eq>1
p=1eq≤1
p < 1 e q qualunque
Dimostrazione. Sia p > 1. Se q ≥ 0 si ha
1
1
≤ p
np logq n
n
e quindi la serie converge per il Corollario precedente
¡
¢e il criterio del confronto.
Se q < 0, posto p = 1 + δ, con δ > 0, si ha log−q n /nδ/2 → 0 per n → +∞.
Ne segue che definitivamente vale la diseguaglianza log−q n < nδ/2 . Quindi
1
1
< 1+δ/2 ,
np logq n
n
da cui, di nuovo, si ha la convergenza della serie.
Sia p = 1. Se q ≤ 0, si ha
log−q n
1
≥
n
n
e quindi la serie diverge, in quanto maggiorante della serie armonica.
Se q > 0, applichiamo il criterio di condensazione. A meno di una moltiplicazione per una costante positiva, possiamo supporre che la base del logaritmo
sia 2. La serie condensata ha termine generale
2m
1
1
= q.
2m logq2 2m
m
Per il Corollario precedente la serie converge per q > 1 e diverge per q ≤ 1.
Infine, sia p < 1. Se q ≤ 0, si ha
1
1
log−q n
> p >
np
n
n
e quindi la serie diverge. Se q > 0, posto p = 1−δ con δ > 0, si ha nδ/2 / logq n →
+∞. Quindi, definitivamente, vale la diseguaglianza log−q n > n−δ/2 . Ne segue,
definitivamente,
1
1
> 1−δ/2 ,
np logq n
n
da cui, di nuovo, la divergenza della serie.
134
5.7
5. Serie
Criterio di Leibniz
Per il Teorema 5.3.5, una serie assolutamente convergente è anche convergente.
Questo Teorema, combinato con i criteri di convergenza per le serie a termini
non negativi dei precedenti paragrafi, permette di dimostrare la convergenza di
un’ampia classe di serie con termini di segno qualunque. Ad esempio, la serie
X sin n
n2
è assolutamente convergente, poiché
¯
¯
¯ sin n ¯
1
¯
¯
¯ n2 ¯ ≤ n2 .
P
Tuttavia, la divergenza assoluta, cioè la relazione
|an | = +∞, non dà in
generale
alcuna
informazione
sul
carattere
della
serie.
P
P Ad esempio, la serie
(−1)n oscilla, ma diverge assolutamente. La serie (−1)n /n converge, ma
diverge assolutamente. La convergenza di quest’ultima serie è una conseguenza
del criterio di Leibniz, che si applica alle serie con termini di segno alternato.
P+∞
Teorema 5.7.1 (Criterio di Leibniz) Sia n=1 (−1)n an tale che
i) an > 0 per ogni n
ii) an ≥ an+1 per ogni n
iii) limn→+∞ an = 0.
Allora la serie converge.
Dimostrazione. Denotiamo con Am le somme parziali della serie, con A2k−1 le
somme di indice dispari e con A2k le somme parziali di indice pari, k = 1, 2, 3, . . .
Si ha
A2k+1 = A2k−1 + a2k − a2k+1 .
Per l’ipotesi ii) a2k −a2k+1 ≥ 0 e quindi A2k+1 ≥ A2k−1 . La successione {A2k−1 }
è non decrescente. Analogamente,
A2k+2 = A2k − a2k+1 + a2k+2 .
Sempre per l’ipotesi ii), −a2k+1 + a2k+2 ≤ 0 e quindi A2k+2 ≤ A2k .
successione {A2k } è non crescente. Inoltre
La
A1 ≤ A2k−1 = A2k − a2k < A2k ≤ A2 ,
poiché a2k > 0 per l’ipotesi i). Le successioni {A2k−1 } e {A2k } sono quindi
convergenti, in quanto monotone e limitate. Poniamo
S1 = lim A2k−1 ,
k→+∞
S2 = lim A2k .
k→+∞
5.8. Convergenza incondizionata
135
Si ha
S2 − S1 = lim (A2k − A2k−1 ) = lim a2k = 0
k→+∞
k→+∞
per l’ipotesi iii). Quindi le successioni A2k e A2k−1 convergono allo stesso limite
S, ossia S2 = S1 = S. Ne segue che la successione {Am } di tutte le somme
parziali converge a S.
Osservazione. Siano Am e S come nella dimostrazione del Teorema. La successione {A2k−1 } converge a S per difetto, mentre la successione {A2k } converge
a S per eccesso. Si ha quindi per ogni k
A2k+1 ≤ S ≤ A2k .
Sia Em = |S − Am | l’errore commesso nel calcolo della somma della serie
arrestandosi al passo m. Si ha
E2k
E2k−1
=
=
A2k − S ≤ A2k − A2k+1 = a2k+1
S − A2k−1 ≤ A2k − A2k−1 = a2k .
Sia per m pari che dispari si ha dunque Em ≤ am+1 , cioè l’errore è minore del
valore assoluto del primo termine trascurato.
Esempi 5.7.2
+∞
X
(−1)n
converge. Infatti, le ipotesi i) – iii) sono chiaramente
n
n=1
1
1
soddisfatte da an = . In questo caso l’errore Em non supera
.
n
m+1
1. La serie
+∞
X
(−1)n
converge. Le ipotesi i) – iii) sono chiaramente sod1 + log n
n=1
1
disfatte da an =
.
1 + log n
√
+∞
X
n
n
(−1)
3. La serie
converge. Le ipotesi i) e iii) sono ovviamente
n
+
1
n=1
soddisfatte. Per verificare la ii) si osserva che
2. La serie
µ
an+1
an
¶2
=
n + 1 (n + 1)2
< 1,
n (n + 2)2
da cui an+1 < an .
5.8
Convergenza incondizionata
Sia
a1 + a2 + a3 + a4 · · · + an + · · ·
136
5. Serie
una serie numerica. Accanto ad essa possiamo considerare una serie in cui si sia
effettuata una permutazione dell’ordine degli addendi; ad esempio la seguente
serie
a1 + a3 + a2 + a5 + a7 + a4 + a9 + a11 + a6 + · · · ,
(5.8.1)
in cui si scrivono due elementi di indice dispari seguiti da uno di indice pari. Si
possono immaginare anche permutazioni più complesse, in cui si scambiano di
posto gruppi con un numero variabile di addendi.
In una somma finita si possono permutare gli addendi senza mutare il risultato della somma. Per studiare l’analoga proprietà per le serie, occorre innanzi
tutto precisare il significato del termine ‘permutazione’ nel contesto di infiniti
addendi.
Definizione 5.8.2 Si chiama permutazione di N una qualsiasi applicazione
biunivoca π : N → N.
Data una serie
a1 + a2 + a3 + a4 · · · + an · · ·
(5.8.3)
e assegnata una permutazione π di N, si chiama serie permutata (o, semplicemente, permutazione) della serie (5.8.3) la serie
aπ(1) + aπ(2) + aπ(3) + aπ(4) · · · + aπ(n) + · · ·
Ad esempio, la serie (5.8.1) è ottenuta dalla (5.8.3) mediante la permutazione
1 2
π: ↓ ↓
1 3
3
↓
2
4
↓
5
5
↓
7
6
↓
4
7
↓
9
8
↓
11
9
↓
6
...
↓
...
In generale, le somme parziali della permutazione di una serie possono dare
luogo a una successione molto differente da quella delle somme parziali della
serie originaria. Si consideri ad esempio la serie oscillante
1 − 1 + 1 − 1 + 1 − 1 + ···
Si consideri la serie permutata in cui si scrive 1 dal primo posto al decimo e
−1 all’undicesimo, 1 dal dodicesimo posto al centesimo e −1 al centounesimo, 1
dal centoduesimo posto al millesimo, e −1 al milleunesimo, etc. Le sue somme
parziali Ak sono asintotiche a k e di conseguenza divergono a +∞. In generale quindi, permutando gli addendi di una serie è possibile cambiarne il
carattere. Esiste tuttavia una notevole classe di serie convergenti che possono
essere permutate senza alterarne il carattere né la somma.
Definizione 5.8.4 Una serie si dice incondizionatamente convergente se essa
e tutte le sue serie permutate convergono.
Le serie incondizionatamente convergenti hanno una semplice caratterizzazione.
5.9. Appendice
137
Teorema 5.8.5 Una serie è incondizionatamente convergente se e solo se è
assolutamente convergente. In tal caso, tutte le serie permutate hanno la stessa
somma.
In particolare, una serie a termini positivi converge sempre alla stessa somma, comunque si permutino gli addendi.
Per il Teorema appena enunciato, la serie
−1 +
1 1 1 1
− + − + ···
2 3 4 5
(5.8.6)
converge, ma non incondizionatamente. Esistono quindi permutazioni che fanno
mutare il carattere della serie. Inoltre, anche se una sua serie permutata converge, non è detto che converga alla stessa somma. Ad esempio, si può dimostrare
che la somma della serie (5.8.6) è − log 2, e che la permutazione (5.8.1) converge
a − 23 log 2.
La dimostrazione del Teorema 5.8.5 è svolta (in forma più generale) nell’Appendice.
5.9
5.9.1
Appendice
Somma di serie
P
P
Definizione 5.9.1 Siano
an e
bn serie numeriche. Si chiama somma
P
delle due serie la serie (an + bn ).
Siano Ak , Bk , e Ck le somme parziali della serie
rispettivamente.Tra esse intercorre la relazione
Ck =
k
X
(an + bn ) =
n=1
k
X
an +
n=1
k
X
P
an ,
P
bn e
bn = Ak + Bk .
P
(an + bn )
(5.9.2)
n=1
Il seguente Teorema è conseguenza immediata di (5.9.2).
P
P
Teorema 5.9.3 Se
an eP bn sono regolari, e se non si presenta il caso di
indecisione ∞ − ∞, anche (an + bn ) è regolare e si ha
X
(an + bn ) =
X
an +
X
bn .
Il Teorema appena enunciato può essere utilizzato per dimostrare che il Corollario 5.4.4 non vale per due serie il cui termine generale non è definitivamente
positivo. Consideriamo le due seguenti serie a termini di segno alterno
+∞
X
n=1
µ
n
(−1)
(−1)n
1
√ +
n
n
¶
,
+∞
X
(−1)n
√ .
n
n=1
138
5. Serie
La seconda serie converge, per il criterio di Leibniz. La prima serie invece
+∞
X
(−1)n
√
diverge, poiché essa è la somma della serie convergente
e della serie
n
n=1
divergente
+∞
X
1
. Tuttavia si ha
n
n=1
µ
(−1)n
1
(−1)n
√ +
n
n
¶
(−1)n
∼ √ .
n
Questo esempio mostra anche che l’ipotesi iii) del criterio di Leibniz non può
essere sostituita dalla relazione di asintotico a un termine monotono decrescente.
5.9.2
Prodotto di serie
P
In generale, le somme
an bn non sono il prodotto delle
P parziali
P della serie
somme parziali di
an e
bn . La definizione della serie prodotto richiede un
procedimento più elaborato. A titolo euristico, consideriamo le serie
a0 + a1 x + a2 x2 + a3 x3 + · · · + an xn + · · ·
b0 + b1 x + b2 x2 + b3 x3 + · · · + bn xn + · · ·
ed eseguiamone il prodotto in modo puramente formale. Ordinando per potenze
crescenti di x, si ottiene
a0 b0 + x (a0 b1 + a1 b0 ) + x2 (a0 b2 + a1 b1 + a2 b0 ) + · · · + xn
n
X
aj bn−j + · · ·
j=0
Siamo cosı̀ condotti alla seguente definizione.
P+∞
P+∞
Definizione 5.9.4 Siano n=0 an e n=0 bn due serie numeriche. Si chiama
P+∞
prodotto secondo Cauchy delle due serie la serie n=0 cn , ove
cn =
n
X
aj bn−j .
j=0
P+∞
P+∞
Teorema 5.9.5 Siano n=0 an e n=0 bn due serie numeriche assolutamente
P+∞
P+∞
convergenti e sia
n=0 cn
n=0 cn il loro prodotto secondo Cauchy. Allora
converge assolutamente. Si ha inoltre
+∞
X
cn =
n=0
+∞
X
n=0
an ·
+∞
X
bn .
(5.9.6)
n=0
Dimostrazione. Siano Ak , Bk e Ck le somme parziali delle tre serie. Osserviamo che
k X
n
X
X
am bn .
Ck =
aj bn−j =
n=0 j=0
0≤m+n≤k
5.9. Appendice
139
Quindi
Ak Bk =
k
X
am ·
m=0
= Ck +
X
k
X
X
bn =
n=0
am bn +
X
am bn
(5.9.7)
∗
0≤m+n≤k
am bn .
(5.9.8)
∗
P
In (5.9.7) e (5.9.8) la somma
∗
0 ≤ m ≤ k,
am bn è estesa a tutti gli indici m e n tali che
0 ≤ n ≤ k,
k < m + n ≤ 2k.
Per ottenere la relazione (5.9.6) basta dimostrare che il secondo termine in
(5.9.8) tende a 0 per k → +∞. In tal caso, infatti,
lim Ck = lim Ak Bk =
k→+∞
k→+∞
+∞
X
an ·
n=0
+∞
X
bn .
n=0
Ragioniamo per k pari. Si ha
¯
¯
¯X
¯
¯
¯
a
b
m n¯ ≤
¯
∗
X
|am bn | ≤
2k
X
m=0
k≤m+n≤2k
|am |
2k
X
|bn |
n=k/2
+
2k
X
|am |
2k
X
2k
X
|bn | → 0,
n=k/2
|am | → 0
|bn | . (5.9.9)
n=0
m=k/2
Per la convergenza assoluta delle due serie, le somme
sono limitate. Per il criterio di Cauchy,
2k
X
P2k
m=0
|am | e
P2k
n=0
|bn |
per k → +∞.
m=k/2
Per k dispari si ragiona allo stesso modo, sostituendo
P+∞ (k − 1)/2
P+∞a k/2.
Lo stesso ragionamento, applicato alle serie n=0 |an | e n=0 |bn |, dimostra
la convergenza assoluta del prodotto secondo Cauchy.
Se due serie convergono, ma ambedue non assolutamente, la serie prodotto
può non convergere. Ad esempio, si consideri la serie
+∞
X
an =
n=0
+∞
X
(−1)n
√
.
n+1
n=0
Tale serie converge per
P il criterio di Leibniz, ma non converge assolutamente.
La serie prodotto di
an con se stessa non converge. Infatti si ha
cn = (−1)n
n
X
j=0
√
1
1
√
j+1 n+1−j
140
5. Serie
e
√
1
1
1
1
1
√
√
≥√
=
.
n+1
j+1 n+1−j
n+1 n+1
Ne segue che cn non tende a zero, poiché
|cn | =
n
X
j=0
√
1
1
1
√
≥ (n + 1)
= 1.
n+1
j+1 n+1−j
Si può però dimostrare, con ragionamenti non molto dissimili da quelli della
dimostrazione del Teorema precedente, che se una delle due serie converge assolutamente e l’altra converge, allora il loro prodotto secondo Cauchy converge
al prodotto delle somme delle due serie.
5.9.3
Proprietà associativa per le serie
Dissociando i termini di una serie se ne può alterare il carattere, anche se la
serie è regolare. Ad esempio, data la serie (banalmente convergente)
0 + 0 + 0 + 0 + · · · = (1 − 1) + (1 − 1) + (1 − 1) + · · · ,
dissociandone i termini si ottiene la serie oscillante
1 − 1 + 1 − 1 + 1 − 1 + ···
Inversamente, associando i termini
P di una serie oscillante se ne può alterare il
carattere. Tuttavia, se la serie
an è regolare, si possono associare i termini
senza
mutarne
il
carattere.
Infatti,
siano Ak le somme parziali della serie
P+∞
n=1 an . Associamo i termini della serie secondo una legge qualunque. Ad
esempio
(a1 + a2 ) + a3 + (a4 + a5 + a6 ) + (a7 + a8 ) + (a9 + a10 + a11 ) + · · · (5.9.10)
Le somme parziali della nuova serie costituiscono una sottosuccessione di
quelle della serie originaria. Infatti, le somme parziali della serie (5.9.10) sono
A2 = (a1 + a2 )
A3 = (a1 + a2 ) + a3
A6 = (a1 + a2 ) + a3 + (a4 + a5 + a6 )
A8 = (a1 + a2 ) + a3 + (a4 + a5 + a6 ) + (a7 + a8 )
A11 = (a1 + a2 ) + a3 + (a4 + a5 + a6 ) + (a7 + a8 ) + (a9 + a10 + a11 )
..................
Poichè {Ak } è regolare, la sottosuccessione tende allo stesso limite.
5.9. Appendice
141
5.9.4
Permutazione dei termini di una serie
P
Teorema 5.9.11 (di Riemann) Sia
an una serie numerica.
P+∞
a) Se n=1 an converge assolutamente, allora la serie e ogni sua permutazione
convergono alla stessa somma.
P+∞
b) Se n=1 an converge, ma non assolutamente, comunque assegnati α e β tali
che −∞ ≤ α ≤ β ≤ +∞, esiste una permutazione π tale che
lim inf
k→+∞
k
X
aπ(n) = α,
n=1
lim sup
k
X
k→∞ n=1
aπ(n) = β.
Questo Teorema è chiaramente più generale del Teorema 5.8.5. Il punto b) afferma che una serie convergente, ma non assolutamente convergente,
può essere permutata in modo che le sue somme parziali abbiano qualunque
comportamemento prefissato.
Dimostrazione. a) Innanzi tutto osserviamo che, assegnata una qualsiasi
permutazione π : N → N, per ogni h esiste k ≥ h tale che
{π(1), π(2), . . . , π(h)} ⊆ {1, 2, . . . , k} .
Ne segue che
+∞
X
aπ(n) converge assolutamente, poiché
n=1
h
k
+∞
X
X
¯
¯ X
¯aπ(n) ¯ ≤
|an | ≤
|an | .
n=1
n=1
n=1
Per il criterioP
di Cauchy, per ogni ε > 0 esiste p0 tale che per ogni p ≥ p0 e
p+q
ogni q ≥ 0 si ha n=p |an | < ε. Per ogni p ≥ p0 esiste r > p tale che
{1, 2, . . . , p} ⊂ {π(1), π(2), . . . , π(r)} .
Sia q > 0 tale che maxj=1,...,r π(j) = p + q. La differenza
r
X
aπ(n) −
n=1
p
X
an
n=1
contiene solo addendi an con indice maggiore di p e minore o eguale a p + q. Si
ha quindi
¯
¯
p
p+q
r
¯X
¯
X
X
¯
¯
a
−
a
≤
|an | < ε.
(5.9.12)
¯
n¯
π(n)
¯
¯
n=1
n=1
n=p+1
Per p che tende a +∞, anche r tende a +∞ e quindi
+∞
X
n=1
aπ(n) =
+∞
X
n=1
an .
142
5. Serie
P
b) Possiamo eliminare da
an gli addendi nulli, senza mutare il carattere della
serie e delle sue permutazioni. Poniamo
pn =
|an | + an
,
2
mn =
|an | − an
.
2
Consideriamo le due serie a termini non negativi
X
X
pn ,
mn .
(5.9.13)
Esse non possono essere entrambe convergenti, altrimenti lo sarebbe la serie
X
X
(pn + mn ) =
|an | .
D’altra parte, non possono essere una convergente e l’altra divergente, altrimenti
sarebbe divergente la serie
X
X
(pn − mn ) =
an .
Quindi le due serie in (5.9.13) sono ambedueP
divergenti a +∞.
Eliminati
i
termini
nulli,
gli
addendi
di
pn sono tutti e soliPgli addendi
P
positivi di
an nell’ordine in cui P
si presentano, e gli addendi di
−mn sono
tutti e soli gli addendi negativi di
an nell’ordine in cui si presentano.
Siano {αj } e {βj } successioni di numeri reali tali che, per j → +∞,
αj < βj ,
αj → α,
βj → β.
Sia k1 il primo intero tale che
p1 + p2 + · · · + pk1 > β1 .
P
Un tale intero deve esistere, poiché
pn = +∞. Definito k1 , sia h1 il primo
intero tale che
p1 + p2 + · · · + pk1 − m1 − m2 − · · · − mh1 < α1 .
P
Un tale intero deve esistere, poiché
−mn = −∞. Sia ora k2 il primo intero
maggiore di k1 tale che
k1
X
pn −
n=1
h1
X
mn + pk1 +1 + pk1 +2 + · · · + pk2 > β2
n=1
e sia h2 il primo intero il primo intero maggiore di h1 tale che
k1
X
n=1
pn −
h1
X
n=1
mn +
k2
X
pn − mh1 +1 − mh1 +2 − · · · − mh2 < α2 .
n=k1 +1
Anche in questo caso k2 e h2 esistono, poiché le serie sono divergenti.
5.9. Appendice
143
Procedendo in questo modo, si costruiscono due successioni strettamente
crescenti di interi kj e hj tali che
k1
X
pn −
n=1
k1
X
h1
X
hj−1
mn + · · · −
n=1
pn −
n=1
h1
X
X
mn +
n=1
kj
X
pn > βj
(5.9.14)
m n < αj .
(5.9.15)
n=kj−1 +1
n=hj−2 +1
mn + · · · +
kj
X
pn −
n=kj−1 +1
hj
X
n=hj−1 +1
Poiché kj è il primo indice successivo a kj−1 per cui vale (5.9.14), si ha anche
k1
X
n=1
Quindi
pn −
h1
X
mn + · · · + pkj−1 +1 + · · · + pkj −1 ≤ βj .
n=1
¯
¯
¯ k1
¯
hj−1
kj
h1
X
X
X
¯X
¯
¯
pn −
mn + · · · −
mn +
pn − βj ¯¯ ≤ pkj .
¯
¯n=1
¯
n=1
n=hj−1 +1
n=kj−1 +1
Analogamente
¯
¯
¯ k1
¯
kj
hj
h1
X
X
X
¯X
¯
¯
pn −
mn + · · · +
pn −
mn − αj ¯¯ ≤ mhj .
¯
¯n=1
¯
n=1
n=kj +1
n=hj−1 +1
P
Poiché pkj → 0 e mhj → 0 (per la convergenza di
an ), la serie
p1 +· · ·+pk1 −m1 −· · ·−mh1 +pk1 +1 +· · ·+pk2 −mh1 +1 −· · ·−mh2 +pk2 +1 +· · ·
ha una sottosuccessione delle somme parziali (corrispondente agli indici hj ) che
tende a α e una (corrispondente agli indici kj ) che tende a β. Per costruzione,
α e β sono il limite superiore e inferiore delle somme parziali. Abbiamo cosı̀
costruito una permutazione della serie originaria con le proprietà desiderate.
5.9.5
Rappresentazione dei numeri reali come serie
Sia α = a0 , a1 a2 . . . an . . . un numero reale positivo. Il troncamento n–esimo di
α, definito nel capitolo 1, è il numero razionale
α
(n)
n
X
aj
.
= a0 , a1 a2 . . . an =
j
10
j=0
Nel paragrafo 1.5 abbiamo osservato che α = supn α(n) . D’altra parte, α(n) è la
somma parziale n–esima della serie
+∞
X
aj
.
j
10
j=0
(5.9.16)
144
5. Serie
Questa serie a termini non negativi converge per il criterio del confronto. Infatti,
per j > 0 si ha aj · 10−j ≤ 9 · 10−j , termine generale (a meno del fattore
moltiplicativo 9) della serie geometrica di ragione 1/10.
Essendo la serie (5.9.16) a termini non negativi, la sua somma è l’estremo
superiore delle somme parziali. Otteniamo cosı̀ la rappresentazione di un numero
reale come serie:
+∞
X
aj
α = sup α(n) =
.
j
10
n
j=0
Possiamo identificare gli allineamenti decimali di periodo 9 con serie numeriche.
Sia dato l’allineamento a0 , a1 a2 . . . an 9, con an 6= 9. Ad esso corrisponde la
serie
n
+∞
X
X
aj
9
+
.
j
j
10
10
j=0
j=n+1
Si ha
+∞
X
+∞
9
9 X 1
9
1
1
=
= n+1 ·
= n.
j
n+1
j
10
10
10
10
1 − 1/10
10
j=n+1
j=0
Quindi
a0 , a1 a2 . . . an 9 = a0 +
a1
a2
an
1
+ 2 + ··· + n + n.
10 10
10
10
Capitolo 6
Limiti di funzioni
6.1
Introduzione
Illustriamo il concetto di limite di una funzione con delle considerazioni intuitive
su alcuni esempi.
Esempi 6.1.1
1. Si consideri la funzione reale di variabile reale
f (x) = x2 .
Evidentemente, per valori di x prossimi a 0 i valori della funzione sono
piccoli e prossimi a 0.
2. Si consideri la funzione reale di variabile reale, definita per x 6= 0,
f (x) =
sin x
.
x
Quanto più x si approssima a 0, mantenendosi diverso da 0, tanto più i
valori della funzione si approssimano a 1.
3. Si consideri la funzione reale di variabile reale, definita per x 6= 0,
f (x) = −
1
.
x2
Quanto più x è prossimo a 0, mantenendosi diverso da 0, tanto più i valori
di − x12 si approssimano a −∞.
4. Si consideri la funzione reale di variabile reale, definita per x 6= 0,
2
f (x) = e−1/x .
Quando x è prossimo a 0, mantenendosi diverso da 0, − x12 si approssima
a −∞. Di conseguenza i valori dell’esponenziale si approssimano a 0.
145
146
6. Limiti di funzioni
5. Si consideri la funzione reale di variabile reale
1
f (x) = .
x
Quanto più x si approssima a +∞ tanto più i valori della funzione si
approssimano a 0.
6. Si consideri la funzione f : R2 → R2 definita da
f (x, y) = (x + y, x − y) .
Quanto più (x, y) si approssima a (1, 1) tanto più il punto (x + y, x − y)
si approssima al punto (2, 0).
In sintesi possiamo dire che le funzioni di questi esempi sono definite in un
insieme (di uno spazio metrico) di cui p è un punto di accumulazione. Negli
esempi si ha rispettivamente
p = 0, p = 0, p = 0, p = 0, p = +∞, p = (1, 1) .
Al ‘tendere di x a p’ i valori f (x) ‘tendono a un limite `’. Negli esempi si ha
rispettivamente
` = 0, ` = 1, ` = −∞, ` = 0, ` = 0, ` = (2, 0).
Si noti che p non è necessariamente un punto in cui la funzione è definita (esempi
2, 3, 4), ma semplicemente un punto di accumulazione dell’insieme di definizione.
Nel quinto esempio, la funzione è definita in R, di cui p = +∞ è un punto
di accumulazione nella metrica d∗ su R, come dimostrato nel paragrafo 3.9.
Ovviamente, f non è definita in +∞.
Il concetto di limite, le cui prime formulazioni rigorose risalgono a Cauchy e
Weierstrass, astrae e formalizza le considerazioni precedenti.
6.2
Limiti in spazi metrici
Siano (X1 , d1 ) e (X2 , d2 ) due spazi metrici. Sia E ⊆ X1 un sottoinsieme non
vuoto e sia p un punto di accumulazione di E. Sia f : E → X2 .
Definizione 6.2.1 Si dice che f (x) tende a ` ∈ X2 per x che tende a p se: per
ogni ε > 0 esiste δ > 0 tale che per ogni x ∈ E, tale che 0 < d1 (x, p) < δ, si ha
d2 (f (x), `) < ε.
La definizione si può scrivere in formula:
∀ε > 0 ∃δ ∀x ∈ E,
0 < d1 (x, p) < δ,
si ha
d2 (f (x), `) < ε.
(6.2.2)
Equivalentemente, f (x) tende a ` se per ogni ε > 0 esiste δ > 0 tale che per
ogni x ∈ E ∩ B(p, δ), x 6= p, si ha f (x) ∈ B(`, ε).
Il valore ` si chiama limite di f (x) per x che tende a p e si scrive
lim f (x) = `
x→p
oppure
f (x) → ` per x → p.
6.2. Limiti in spazi metrici
147
L+ε
L
L-ε
p-δ
p
p+δ
limx→p f (x) = L
Osservazioni.
a) Nella formulazione della definizione di limite 6.2.1, il numero ε è positivo e
arbitrariamente piccolo, mentre δ dipende da ε. In generale, diminuendo
il valore di ε diminuisce anche il valore di δ.
b) Come nel caso delle successioni, il limite, se esiste, è unico. Infatti, siano
`1 6= `2 limiti di f (x) per x che tende a p. Sia ε tale che
B(`1 , ε) ∩ B(`2 , ε) = ∅.
Esiste δ1 tale che per ogni ogni x ∈ E, x ∈ B(p, δ1 ) e x 6= p, si ha
f (x) ∈ B(`1 , ε). Analogamente, esiste δ2 tale che per ogni ogni x ∈ E,
x ∈ B(p, δ2 ) e x 6= p, si ha f (x) ∈ B(`2 , ε). Sia δ = min(δ1 , δ2 ); se
x ∈ B(p, δ) allora f (x) deve appartenere a B(`1 , ε) ∩ B(`2 , ε), assurdo.
c) Come abbiamo già osservato nel paragrafo precedente, p non appartiene
necessariamente a E; anche se vi appartenesse, il limite non dipende dal
valore della funzione in x = p. In altri termini, alterando la definizione
della funzione in x = p, l’esistenza e il valore del limite rimangono invariati.
Ad esempio, consideriamo la funzione f : R → R definita da f (x) = x. Sia
p = 0. Si ha banalmente
lim x = 0.
x→0
Infatti la condizione (6.2.2) è verificata: per ogni ε > 0, basta porre δ = ε.
Alteriamo ora f ponendo
½
x se x 6= 0,
fe(x) =
1 se x = 0.
Di nuovo vale limx→0 fe(x) = 0.
148
6. Limiti di funzioni
d) Come nel caso dei limiti di successioni, si ha f (x) → ` per x → p se solo se
la funzione a valori reali positivi d2 (f (x), `) tende a 0 per x → p.
Esempi 6.2.3
1. Sia f : R → R definita da f (x) = x2 .√ Sia p = 0. Dimostriamo che
limx→0 f (x) = 0. Fissato ε > 0 sia δ = ε. Per 0 < |x − p| = |x| < δ si
ha
¯ 2
¯
¯x − 0¯ = x2 < δ 2 = ε.
2. Sia di nuovo f (x) = x2 , ma sia p = 2. Dimostriamo che limx→2 f (x) = 4.
Fissiamo ε > 0. Possiamo supporre ε < 1. Sia δ = ε/5. Per 0 < |x − 2| <
δ si ha anche 0 < x + 2 < 4 + δ < 5. Quindi
¯ 2
¯
¯x − 4¯ = |x − 2| (x + 2) < 5δ = ε.
3. Sia f : R → R definita da f (x) = sin x. Sia p = 0. Dimostriamo che
limx→0 f (x) = 0. Fissato ε > 0 sia δ = ε. Per 0 < |x| < δ si ha
|sin x| < |x| < δ = ε.
Analogamente
si ha limx→0 cos x = 1. Infatti, fissato ε > 0 si ponga
√
δ = ε. Si ha, per 0 < |x| < δ,
|1 − cos x| = 1 − cos x < 1 − cos2 x
= sin2 x < x2 < ε.
1
−3π
−2π
−π
π
f (x) =
sin x
x
2π
3π
6.2. Limiti in spazi metrici
149
sin x
, definita per x 6= 0. Dimostriamo che limx→0 f (x) = 1.
x
Ricordiamo prima di tutto che per 0 < |x| < π/2 (diseguaglianze (4.5)) si
ha
sin x
cos x <
< 1.
x
√
Fissato ε > 0 (piccolo), sia δ = ε. Per 0 < |x| < δ si ha, per l’esempio
precedente,
1 − cos x < ε,
4. Sia f (x) =
da cui
¯
¯
¯
¯
¯1 − sin x ¯ = 1 − sin x < 1 − cos x < ε.
¯
x ¯
x
In questo esempio, a differenza dei precedenti, la funzione f non è definita
in p = 0.
5. Sia f : R2 → R2 definita da f (x, y) = (x + y, x − y). Sia p = (1, 1).
Dimostriamo che
lim
f (x, y) = (2, 0).
(x,y)→(1,1)
Fissato ε > 0, sia δ = ε/4. Si ha per k(x, y) − (1, 1)k < δ
|x − 1| ≤ k(x − 1, y − 1)k = k(x, y) − (1, 1)k < δ,
|y − 1| ≤ k(x − 1, y − 1)k = k(x, y) − (1, 1)k < δ.
Quindi
°
°
°f (x, y) − (2, 0)° = k(x + y − 2, x − y)k ≤ |x + y − 2| + |x − y|
≤ (|x − 1| + |y − 1|) + (|x − 1| + |y − 1|)
< 4δ = ε.
xy
. La funzione f è definita in ogni punto di R2
x2 + y 2
eccetto il punto (0, 0), ed assume valori in R.
6. Sia f (x, y) = p
Sia p = (0, 0). Dimostriamo che
lim
(x,y)→(0,0)
f (x, y) = 0.
Si ha x2 + y 2 ± 2xy = (x ± y)2 ≥ 0 e quindi |xy| ≤
1
2
¡ 2
¢
x + y 2 . Ne segue
p
x2 + y 2
≤ p
< x2 + y 2 .
x2 + y 2
2 x2 + y 2
|f (x, y)| = p
|xy|
Fissato ε > 0, sia δ < ε. Per ogni (x, y) tale che k(x, y)k =
da (6.2.4) si ottiene |f (x, y)| < ε.
Anche in questo esempio la funzione non è definita in p.
(6.2.4)
p
x2 + y 2 < δ,
150
6. Limiti di funzioni
7. La funzione f (x) = sgn x (signum, o segno, di x) è definita come
( x
se x 6= 0
|x|
sgn x =
0
se x = 0
Essa vale 1 per x > 0 e −1 per x < 0. Questa funzione non ammette
limite per x → 0. Infatti, ogni intorno dell’origine contiene numeri positivi
e numeri negativi. Scelto ε = 1/2, sgn x non appartiene a B(1, 1/2) per
x < 0 e non appartiene a B(−1, 1/2) per x > 0. Quindi 1 e −1 non
soddisfano la definizione di limite. Cosı̀ pure, il valore 0 non può essere
il limite della funzione. Infine, se ` è un numero reale diverso da ±1 e da
0, qualsiasi intorno di `, non contenente 1, 0 e −1, non contiene nessun
valore della funzione diverso da 0.
1
-1
f (x) = sgn x
6.3
Limiti infiniti e limiti all’infinito
In questo paragrafo esaminiamo la definizione 6.2.1 di limite di una funzione nel
caso in cui X1 o X2 , o entrambi, coincidano con R , e il punto di accumulazione
p o il limite `, o entrambi, siano +∞ o −∞.
Iniziamo dal caso in cui ` = ±∞. Tali valori sono elementi dello spazio
metrico (R, d∗ ), descritto nel capitolo 3. Gli intorni di +∞ e di −∞ (privati di
+∞ e −∞) nella metrica di d∗ sono, rispettivamente, gli insiemi
(M, +∞) ,
(−∞, M ) ,
(6.3.1)
ove M ∈ R. Una funzione f : E → R assume valori nell’intorno di +∞ (6.3.1)
se f (x) > M (ovviamente, si ha f (x) 6= +∞, poiché la funzione è a valori reali ).
Analogamente, f (x) assume valori nell’intorno (−∞, M ) se f (x) < M . La
definizione di limite assume quindi la seguente forma nel caso dei limiti infiniti
di una funzione a valori in R.
Sia (X, d) uno spazio metrico, E ⊆ X un sottoinsieme non vuoto e p un
punto di accumulazione di E. Sia f : E → R.
6.3. Limiti infiniti e limiti all’infinito
151
Definizione 6.3.2 Si dice che f (x) tende a +∞ per x che tende a p se: per
ogni M esiste δ > 0 tale che per ogni x ∈ E, tale che 0 < d(x, p) < δ, si ha
f (x) > M . In formula:
∀M ∃δ ∀x ∈ E,
0 < d(x, p) < δ,
si ha
f (x) > M.
Analogamente, si dice che f (x) tende a −∞ per x che tende a p se:
∀M ∃δ ∀x ∈ E,
0 < d(x, p) < δ,
si ha
f (x) < M.
Nel caso del limite +∞ il numero M può essere scelto positivo e grande a piacere.
Il numero δ è positivo, dipende da M e decresce, in generale, al crescere di M .
Nel caso del limite −∞ il numero M può essere scelto negativo con valore
assoluto grande a piacere.
M
p-δ
p+δ
p
limx→p f (x) = +∞
La notazione per i limiti infiniti è la stessa introdotta nel paragrafo precedente:
lim f (x) = +∞
oppure
f (x) → +∞
per x → p,
lim f (x) = −∞
oppure
f (x) → −∞
per x → p.
x→p
x→p
Si noti che f (x) → +∞ per x → p se e solo se −f (x) → −∞ per x → p. Se
X = R, la retta x = p viene chiamata asintoto verticale al grafico della funzione.
Esempi 6.3.3
1
, definita per x 6= 0. Sia p = 0. Dimostriamo
x2
che limx→0 f (x) = +∞. √
Fissato M > 0 sia δ = 1/ M . Per ogni x 6= 0 tale che |x| < δ si ha
1. Sia X = R, e sia f (x) =
1
1
> 2 = M.
2
x
δ
152
6. Limiti di funzioni
2. Sia E = (0, +∞) ⊂ R e sia f : E → R definita da f (x) = log x. Dimostriamo che f (x) → −∞ per x → 0.
Fissato M > 0, si ha log x < −M se e solo se x < e−M . Poniamo quindi
δ = e−M . Per ogni x tale che 0 < x < e−M si ha log x < −M .
Esaminiamo ora il caso in cui p = ±∞. Sia E ⊆ R un insieme illimitato superiormente. Per il Teorema 3.9.4, +∞ è un punto di accumulazione di E in R con
la metrica d∗ . Analogamente, se E ⊆ R è un insieme illimitato inferiormente,
−∞ è un punto di accumulazione di E. Nel primo caso ogni intervallo (M, +∞)
contiene infiniti punti di E. Nel secondo caso ogni intervallo (−∞, M ) contiene
infiniti punti di E. Chiaramente +∞ (rispettivamente −∞) non appartiene a
E, poiché E ⊆ R.
L+ε
L
L-ε
M
limx→+∞ f (x) = L
Sia (X, d) uno spazio metrico. Sia E ⊆ R illimitato superiormente e sia f : E →
X.
Definizione 6.3.4 Si dice che f (x) tende a ` ∈ X per x che tende a +∞ se:
∀ε > 0 ∃M ∀x ∈ E,
x > M,
si ha
d (f (x), `) < ε.
Se f : E → X e E ⊆ R è illimitato inferiormente, si ha la definizione analoga.
Definizione 6.3.5 Si dice che f (x) tende a ` per x che tende a −∞ se:
∀ε > 0 ∃M ∀x ∈ E,
x < M,
si ha
d (f (x), `) < ε.
Le notazioni in questo caso sono le seguenti
lim f (x) = `
oppure
f (x) → ` per x → +∞,
lim f (x) = `
oppure
f (x) → ` per x → −∞.
x→+∞
x→−∞
Se X = R, la retta y = ` si chiama asintoto orizzontale al grafico della funzione.
6.3. Limiti infiniti e limiti all’infinito
153
Esempi 6.3.6
1
. Si ha f (x) → 0 per
x
x → +∞. Infatti, fissato ε > 0, si ponga M = 1/ε. Per ogni x > M si ha
1. Sia E = (0, +∞) e f : E → R definita da f (x) =
0<
1
1
<
= ε.
x
M
1
→ 0 per x → −∞.
x
In modo analogo si dimostra che
2. Sia f : R → R definita da f (x) = ex . Dimostriamo che f (x) → 0 per
x → −∞.
Fissato ε > 0, sia M = log ε (si noti che log ε < 0 per ε < 1). Per ogni
x < log ε si ha
ex < elog ε = ε
3. Sia E = (−∞, 0) e sia f : E → R2 definita da f (x) = (ex , 1/x). Dimostriamo che f (x) → (0, 0) per x → −∞.
Fissato ε > 0, per gli esempi 1 e 2 precedenti, esiste M > 0 tale che per
x < −M si ha contemporaneamente
¯ ¯
¯1¯
¯ ¯ < ε/2,
ex < ε/2,
¯x¯
da cui
°
°
°f (x)° =
r
e2x +
1
ε
< √ < ε.
2
x
2
4. Sia f (x) = arctan x. Si ha
lim arctan x =
x→+∞
π
,
2
π
lim arctan x = − .
2
x→−∞
(6.3.7)
Dimostriamo il primo limite in (6.3.7). Fissiamo ε, con 0 < ε < π/2. Sia
M = tan(π/2 − ε). Per x > M si ha
³
³π
´´ π
π
> arctan x > arctan M = arctan tan
− ε = − ε.
2
2
2
Il secondo limite si dimostra in maniera analoga.
5. La definizione di limite per una successione rientra nella definizione precedente. Infatti, sia E = N ⊂ R. Una funzione f : N → X è una successione
a valori in X. Se la successione f (n) converge a ` per n → +∞ secondo la
definizione del capitolo 3, per ogni ε > 0 esiste n0 tale che per ogni n > n0
si ha definitivamente f (n) ∈ B(`, ε). Questa definizione coincide con la
definizione 6.3.4 in cui si ponga M = n0 .
154
6. Limiti di funzioni
N
M
limx→+∞ f (x) = +∞
Infine esaminiamo il caso in cui ambedue gli spazi metrici coincidono con R
e sia p che ` sono infiniti.
Sia E ⊆ R illimitato superiormente e sia f : E → R.
Definizione 6.3.8 Si dice che f (x) tende a +∞ per x che tende a +∞ se:
∀N ∃M ∀x ∈ E,
x > M,
si ha
f (x) > N.
Si dice che f (x) tende a −∞ per x che tende a +∞ se:
∀N ∃M ∀x ∈ E,
x > M,
si ha
f (x) < N.
Anche in questo caso è chiaro che f (x) → +∞ se e solo se −f (x) → −∞. La
definizione di limite infinito per x che tende a −∞ è analoga.
Sia E ⊆ R illimitato inferiormente e sia f : E → R.
Definizione 6.3.9 Si dice che f (x) tende a +∞ per x che tende a −∞ se:
∀N ∃M ∀x ∈ E,
x < M,
si ha
f (x) > N.
Si dice che f (x) tende a −∞ per x che tende a −∞ se:
∀N ∃M ∀x ∈ E,
x < M,
si ha
f (x) < N.
Le notazioni per i limiti infiniti all’infinito sono le seguenti
lim f (x) = ±∞
oppure
f (x) → ±∞
per x → +∞,
lim f (x) = ±∞
oppure
f (x) → ±∞
per x → −∞.
x→+∞
x→−∞
6.3. Limiti infiniti e limiti all’infinito
155
x
y=e
y=log x
1
1
Le funzioni ex e log x
Esempi 6.3.10
1. Sia f : R → R definita da f (x) = ex . Si ha f (x) → +∞ per x → +∞.
Infatti, fissato N > 0 sia M = log N . Per x > M si ha
ex > elog N = N .
In modo analogo si dimostra che e−x → +∞ per x → −∞.
2. Sia f : R → R definita da f (x) = x3 . Allora f (x) → +∞ per x → +∞ e
f (x) → −∞ per x → −∞. Fissato N > 0 sia M = N 1/3 . Per x > M si
ha x3 > N , mentre per x < −M si ha x3 < −N .
3. La parte intera [x] di un numero reale x è il massimo intero relativo che
non supera x. Ad esempio,
[1/2] = 0,
[−1/2] = −1,
[3/2] = 1,
[−3/2] = −2.
Dimostriamo che
lim [x] = +∞,
x→+∞
lim [x] = −∞.
x→−∞
Innanzi tutto osserviamo che si ha sempre [x] ≤ x < [x]+1. Fissato N > 0
si ponga M = N + 1. Per x > M si ha
[x] > x − 1 > N.
Per x < −M si ha
[x] ≤ x < −N − 1 < −N .
156
6. Limiti di funzioni
3
2
1
–4
–3
–2
–1
1
2
3
4
–1
–2
–3
–4
f (x) = [x]
6.4
Limiti di funzioni reali di variabile reale
Sia E ⊆ R e sia x0 ∈ E 0 . In questo paragrafo consideriamo funzioni f : E → R
e poniamo, come di consueto, la metrica euclidea in R. Nei casi più comuni E
sarà un intervallo, eventualmente privato del punto x0 . Sia ` un numero reale.
La definizione di limite 6.2.1 in questo caso diviene
∀ε > 0 ∃δ ∀x ∈ E,
0 < |x − x0 | < δ,
si ha
|f (x) − `| < ε.
(6.4.1)
La condizione |f (x) − `| < ε equivale a
` − ε < f (x) < ` + ε.
Come nel caso dei limiti di successioni, f (x) può tendere a ` mantendosi maggiore, oppure minore di ` in un opportuno intorno di x0 (privato di x0 stesso).
Definizione 6.4.2 Sia E ⊆ R, sia x0 ∈ E 0 e sia f : E → R. Si dice che la
funzione tende a ` ∈ R per eccesso o dalla destra per x → x0 , se
∀ε > 0 ∃δ ∀x ∈ E,
0 < |x − x0 | < δ,
si ha
` ≤ f (x) < ` + ε.
Analogamente, si dice che la funzione tende a ` ∈ R per difetto o dalla sinistra
per x → x0 , se
∀ε > 0 ∃δ ∀x ∈ E,
0 < |x − x0 | < δ,
si ha
` − ε < f (x) ≤ `.
6.4. Limiti di funzioni reali di variabile reale
157
Se f (x) tende a ` dalla destra si scrive
lim f (x) = ` + ,
x→x0
o anche f (x) → ` +
per x → x0 .
Se f (x) tende a ` dalla sinistra si scrive
lim f (x) = ` − ,
x→x0
o anche f (x) → ` −
per x → x0 .
L’analoga definizione vale se f è definita in un insieme E ⊆ R illimitato
superiormente e x → +∞, oppure in un insieme E illimitato inferiormente
e x → −∞. Basta sostituire, nella definizione precedente, gli intorni di x0
con gli intorni di +∞ (cioé gli intervalli (M, +∞)) o di −∞ (cioé gli intervalli
(−∞, M )). Lasciamo al lettore il semplice esercizio di formulare la definizione
per questi limiti.
Esempi 6.4.3
1. Sia f (x) =
sin x
. Si ha f (x) → 1− per x → 0.
x
2. Sia f (x) = x2 . Si ha f (x) → 0+ per x → 0.
3. Sia f (x) =
1
. Si ha
x
lim
x → +∞
1
=0+ ,
x
lim
x → −∞
1
=0−.
x
4. Sia f (x) = x3 . Si ha f (x) → 0 per x → 0, ma il limite non è né per eccesso
né per difetto. Infatti, f (x) > 0 per x > 0 e f (x) < 0 per x < 0.
Sia, come sopra, f : E ⊆ R → R, e sia x0 ∈ E 0 . La condizione 0 < |x − x0 | < δ
in (6.4.1) è equivalente alle due condizioni
x0 < x < x0 + δ,
x0 − δ < x < x 0 .
Può accadere che f (x) non abbia limite per x → x0 , ma che esista ` tale che
la condizione |f (x) − `| < ε sia verificata per x0 < x < x0 + δ, oppure per
x0 − δ < x < x0 . In questo caso si ha una nozione di limite per x che tende a
x0 dalla destra, o per x che tende a x0 dalla sinistra.
Definizione 6.4.4 Sia f : E ⊆ R → R, e sia x0 ∈ E 0 . Sia ` ∈ R. Si dice che
f (x) tende a ` per x che tende a x0 per eccesso o dalla destra se
∀ε > 0 ∃δ ∀x ∈ E,
x0 < x < x0 + δ,
si ha
|f (x) − `| < ε.
Si dice che f (x) tende a ` per x che tende a x0 per difetto, o dalla sinistra se
∀ε > 0 ∃δ ∀x ∈ E,
x0 − δ < x < x 0 ,
si ha
|f (x) − `| < ε.
158
6. Limiti di funzioni
Se f (x) tende a ` per x che tende a x0 dalla destra si scrive
lim f (x) = `, o anche f (x) → ` per x → x0 + .
x→x0+
Se f (x) tende a ` per x che tende a x0 dalla sinistra si scrive
lim f (x) = `,
x→x0 −
o anche f (x) → ` per x → x0 − .
Gli intervalli [x0 , x0 + δ) e (x0 − δ, x0 ], benché non siano aperti, vengono rispettivamente chiamati intorni destri e sinistri di x0 .
Esempi 6.4.5
1. Consideriamo la funzione f (x) = sgn x, introdotta nell’esempio 6.2.3.7. Si
ha
f (x) → −1 per x → 0 − ,
f (x) → 1 per x → 0 + .
2. Consideriamo la funzione f (x) = [x], introdotta nell’esempio 6.3.10.3. Per
ogni n intero si ha
f (x) → n − 1 per x → n − ,
f (x) → n per x → n + .
3. La funzione mantissa di x è definita per ogni x reale mediante la formula
mant x = x − [x].
Essa vale ovviamente 0 in ogni intero. Per ogni intero n si ha
f (x) → 1 per x → n − ,
f (x) → 0 per x → n + .
1
–4
–3
–2
–1
0
1
2
3
4
f (x) = mant x
In modo analogo si definiscono i limiti infiniti per x → x0 − e x → x0 +.
Basta sostituire, nella definizione 6.4.4, gli intorni di ` con gli intorni di +∞
(f (x) > M ) o di −∞ (f (x) < M ). Lasciamo al lettore il semplice esercizio di
formulare la definizione per questi limiti.
Le notazioni sono simili alle precedenti:
lim f (x) = ±∞, o anche f (x) → ±∞
x→x0+
per x → x0 + .
Analogamente
lim f (x) = ±∞,
x→x0 −
o anche f (x) → ±∞
per x → x0 − .
6.4. Limiti di funzioni reali di variabile reale
159
Esempi 6.4.6
1. Sia f (x) =
1
, definita per x 6= 0. Sia x0 = 0. Si ha
x
lim
x → 0+
1
= +∞ ,
x
lim
x → 0−
1
= −∞.
x
0
f (x) =
1
x
2. Sia f (x) = e1/x , definita per x 6= 0. Sia x0 = 0. Si ha
e1/x → +∞ per x → 0+,
1
0
f (x) = e1/x
e1/x → 0 per x → 0−.
160
6. Limiti di funzioni
Dalle definizioni precedenti si ricava in modo ovvio la definizione delle scritture
lim f (x) = `+,
x→x0+
lim f (x) = `+,
x→x0−
lim f (x) = `−,
x→x0+
lim f (x) = ` − .
x→x0−
ove ` ∈ R. A titolo di esempio, diamo la definizione del primo di questi limiti.
Si dice che f (x) tende a ` per eccesso al tendere di x a x0 dalla destra se: per
ogni ε > 0 esiste δ > 0 tale che per ogni x ∈ E, x0 < x < x0 + δ, si ha
` ≤ f (x) < ` + ε.
Ad esempio: mant x → 0+ per x → 1+; mant x → 1− per x → 1−;
e1/x → 0+ per x → 0−.
Sia f : (a, x0 ) ∪ (x0 , b) → R. Se f (x) → ` (finito o infinito) per x → x0 , si
ha immediatamente che f (x) → ` sia per x → x0 + che x → x0 −. Vale anche la
proprietà inversa.
Teorema 6.4.7 Sia f : (a, x0 ) ∪ (x0 , b) → R. Si ha limx→x0 f (x) = ` ∈ R se e
solo se
lim f (x) = lim f (x) = `.
(6.4.8)
x→x0 −
x→x0 +
Dimostrazione. Dimostriamo il Teorema supponendo ` ∈ R. La dimostrazione
nel caso dei limiti infiniti è la stessa, sostituendo agli intorni di ` ∈ R gli intorni
di +∞ o −∞. Supponiamo che valga (6.4.8). Per ogni ε > 0 esiste δ1 > 0 tale
che per ogni x ∈ (a, b), tale che x0 < x < x0 + δ1 , si ha |f (x) − `| < ε.
Analogamente, esiste δ2 > 0 tale che per ogni x ∈ (a, b), tale che x0 − δ2 <
x < x0 , si ha |f (x) − `| < ε. Posto δ = min(δ1 , δ2 ), per ogni x ∈ (a, b), tale che
0 < |x − x0 | < δ, si ha |f (x) − `| < ε.
6.5
Segno, confronto.
Sia f una funzione a valori reali. I concetti di funzione limitata, massimo,
minimo (se esistono), estremo superiore e inferiore di f si definiscono, come per
le successioni, per mezzo del coinsieme di f .
Definizione 6.5.1 Sia (X, d) uno spazio metrico e sia E ⊆ X. Una funzione f : E ⊆ X → R si dice limitata in E (limitata superiormente, inferiormente) se f (E) è un insieme limitato (rispettivamente, limitato superiormente,
inferiormente).
Si dice che α è l’estremo superiore (che β è l’estremo inferiore) di f (x) su
E se α (rispettivamente β) è l’estremo superiore (rispettivamente, inferiore) di
f (E). Si dice f (x) ha massimo in E (che f (x) ha minimo in E) se f (E) ha
massimo (rispettivamente, minimo).
Il massimo M e il minimo m (se esistono) di f (x) in E vengono anche
chiamati massimo assoluto e minimo assoluto della funzione in E. Ogni punto
6.5. Segno, confronto.
161
x0 ∈ E tale che f (x0 ) = M si chiama punto di massimo assoluto della funzione
in E. Analogamente, ogni punto x0 ∈ E tale che f (x0 ) = m si chiama punto di
minimo assoluto della funzione in E. Si ha
∀x ∈ E
∀x ∈ E
f (x) ≤ f (x0 )
f (x) ≥ f (x0 )
se x0 è punto di massimo assoluto,
se x0 è punto di minimo assoluto.
Le notazioni per massimo, minimo, estremo superiore e inferiore di f (x) in
E sono
max f (x), min f (x), sup f (x), inf f (x).
x∈E
x∈E
x∈E
x∈E
Qualora non ci sia possibilità di equivoci, si può omettere l’indicazione x ∈ E.
Esempi 6.5.2
1. Sia f (x) = mant x e sia E = R. La funzione è limitata e si ha
sup mant x = 1,
inf mant x = min mant x = 0.
La funzione non ha massimo.
e → R, e sia E ⊆ E.
e Il massimo e il minimo (se esistono), l’estremo
2. Sia f : E
superiore e l’estremo inferiore della restrizione di f (x) al sottoinsieme E
possono mutare al variare di E. Ad esempio, sia f (x) = ex , definita in
e = R. Sia E = [0, +∞). Si ha
E
sup
ex = +∞,
x∈[0,+∞)
inf
x∈[0,+∞)
ex =
min
x∈[0,+∞)
ex = e0 = 1 .
Sia ora E = (−∞, 0]. Si ha
sup
x∈(−∞,0]
ex =
max
x∈(−∞,0]
ex = e0 = 1,
inf
x∈(−∞,0]
ex = 0.
Sia f : E ⊆ X → R, ove (X, d) è uno spazio metrico. Se f (x) → ` ∈ R
per x → p ∈ E 0 , allora esiste un intorno B(p, δ) tale che f (x) è limitata in
B(p, δ) ∩ E. Infatti, fissato ε = 1, esiste δ tale che per ogni x ∈ B(p, δ) ∩ E,
x 6= p, si ha
` − 1 < f (x) < ` + 1.
In modo analogo si vede che, se f (x) → +∞ per x → p ∈ E 0 , esiste un intorno
B(p, δ) tale che f (x) è illimitata superiormente su B(p, δ) ∩ E. Cosı̀ pure, se
f (x) → −∞ per x → p ∈ E 0 , esiste un intorno B(p, δ) tale che f (x) è illimitata
inferiormente su B(p, δ) ∩ E.
Queste considerazioni valgono anche se p = ±∞, sostituendo a B(p, δ) gli
intervalli (M, +∞) o (−∞, M ) rispettivamente.
Sia (X, d) uno spazio metrico, sia E ⊆ X e p ∈ E 0 . Sia f : E ⊆ X → R. Nel
seguito di questo paragrafo, e nei paragrafi successivi, dimostreremo ulteriori
162
6. Limiti di funzioni
risultati sul comportamento di f (x) in un intorno di p, privato del punto p
stesso. Dalla trattazione precedente appare chiaro, che per funzioni di variabile
reale, o a valori reali, i casi in cui p o il limite ` siano infiniti non richiedono in
realtà una discussione separata. Infatti, essi sono elementi dello spazio metrico R
studiato nel capitolo 3. Il formalismo degli spazi metrici ci permette di trattare
in modo unitario anche i casi infiniti.
D’ora innanzi, nel caso in cui X = R e p = +∞, oppure p = −∞, è
sottinteso che gli intorni di p (privati di p stesso) sono gli intorni nella metrica
introdotta nel capitolo 3 in R. In altri termini, essi sono gli intervalli (−∞, M )
se p = −∞, e gli intervalli (M, +∞) se p = +∞.
Analogamente, se f (x) tende a ` per x → p, il limite potrà essere sia un
numero reale che ±∞. Se ` = ±∞, gli intorni di ` saranno gli intorni appena
descritti.
Il seguente Teorema è l’analogo, per i limiti di funzioni, del Teorema 4.5.1
Teorema 6.5.3 (di permanenza del segno) Sia (X, d) uno spazio metrico,
sia E ⊆ X e p ∈ E 0 . Sia f : E ⊆ X → R una funzione tale che f (x) → ` per
x → p.
a) Se ` > 0, allora esiste un intorno B(p, δ) tale che f (x) > 0 per ogni x ∈
B(p, δ) ∩ E, x 6= p.
b) Se ` < 0, allora esiste un intorno B(p, δ) tale che f (x) < 0 per ogni x ∈
B(p, δ) ∩ E, x 6= p.
c) Se esiste un intorno B(p, δ), tale che f (x) ≥ 0 per ogni x ∈ B(p, δ) ∩ E,
x 6= p, allora ` ≥ 0.
d) Se esiste un intorno B(p, δ), tale che f (x) ≤ 0 per ogni x ∈ B(p, δ) ∩ E,
x 6= p, allora ` ≤ 0.
Dimostrazione. a) Sia ` ∈ R e sia ε > 0 tale che ` − ε > 0. Per la definizione
di limite esiste δ > 0 tale che
0 < ` − ε < f (x) < ` + ε.
per ogni x ∈ E tale che 0 < d(x, p) < δ. Quindi a) è vera. In modo analogo si
dimostra b). Se ` = ±∞, la dimostrazione è analoga.
c) Supponiamo ora che esista δ tale che f (x) ≥ 0 per ogni x ∈ E tale che
0 < d(x, p) < δ. Allora non può essere ` < 0. Altrimenti, per il punto b),
esisterebbe δ1 tale che f (x) < 0 per ogni x ∈ E con 0 < d(x, p) < δ1 . Posto
δ2 = min(δ, δ1 ), i punti x ∈ E tale che 0 < d(x, p) < δ2 dovrebbero soddisfare
sia la condizione f (x) ≥ 0 che f (x) < 0, assurdo. Quindi c) è vera. In modo
analogo si dimostra d).
In modo analogo ai teoremi del confronto per le successioni si dimostrano i
teoremi del confronto per le funzioni.
6.6. Limiti di successioni e limiti di funzioni
163
Teorema 6.5.4 (del confronto; limite finito) Siano f , g, h, tre funzioni
definite in un sottoinsieme E di uno spazio metrico (X, d) a valori in R. Sia
p ∈ E 0 . Supponiamo che
i) limx→p f (x) = limx→p h(x) = ` ∈ R
ii) esiste δ > 0 tale che per ogni x ∈ B(p, δ) ∩ E, x 6= p, si abbia
f (x) ≤ g(x) ≤ h(x).
(6.5.5)
Allora si ha anche limx→p g(x) = `.
Dimostrazione. Si fissi ε > 0. Esistono δ1 e δ2 tali che per ogni x ∈ E
0 < d(x, p) < δ1 =⇒ ` − ε < f (x) < ` + ε,
0 < d(x, p) < δ2 =⇒ ` − ε < h(x) < ` + ε.
(6.5.6)
(6.5.7)
Posto δ3 = min(δ, δ1 , δ2 ), per x ∈ E, con 0 < d(x, p) < δ3 , valgono contemporaneamente (6.5.5), (6.5.6) e (6.5.7). Quindi, per tali valori di x si
ha
` − ε < f (x) ≤ g(x) ≤ h(x) < ` + ε,
da cui la tesi.
Teorema 6.5.8 (del confronto; limite infinito) Siano f e g due funzioni
definite in un sottoinsieme E di uno spazio metrico (X, d) a valori in R. Sia
p ∈ E0.
Esista δ > 0 tale che per ogni x ∈ B(p, δ) ∩ E, x 6= p, si abbia f (x) ≤ g(x).
Allora
a) se limx→p f (x) = +∞, si ha anche limx→p g(x) = +∞;
b) se limx→p g(x) = −∞, si ha anche limx→p f (x) = −∞.
Dimostrazione. Dimostriamo a). Per ogni M > 0 esiste δ1 > 0 tale che per
ogni x ∈ E
0 < d(x, p) < δ1 =⇒ f (x) > M.
Posto δ2 = min(δ, δ1 ), per ogni x ∈ B(p, δ2 ) ∩ E, x 6= p, si ha g(x) ≥ f (x) > M .
In modo analogo si dimostra b).
6.6
Limiti di successioni e limiti di funzioni
Abbiamo visto nell’esempio 6.3.6.5 che la nozione di limite per le successioni è
un caso particolare della nozione generale di limite per funzioni tra spazi metrici.
D’altra parte, i limiti di funzioni possono essere ricondotti a limiti di successioni,
nel senso che verrà chiarito tra poco.
Iniziamo con due esempi. Sia f (x) = x2 . Abbiamo visto (esempio 6.2.1) che
f (x) → 0 per x → 0. Consideriamo una qualunque successione di numeri reali
164
6. Limiti di funzioni
xn tale che xn → 0 per n → +∞. Calcolando la funzione nei valori xn si ottiene
la nuova successione
f (xn ) = x2n → 0 per n → +∞.
sin x
, definita per x 6= 0. Sappiamo che f (x) → 1
x
(esempio 6.2.3) per x → 0. Data una qualunque successione di numeri xn 6= 0,
tali che xn → 0, si ha pure (Teorema 4.5.7)
Analogamente, sia f (x) =
f (xn ) =
sin xn
→ 1 per n → +∞.
xn
1
f(x )
n
f(x3)
f(x2)
f (xn ) =
xn
x3
x2
x
1
sin xn
xn
La situazione messa in luce da questi due esempi ha carattere del tutto
generale.
Teorema 6.6.1 Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici. Sia E ⊆ X1 e sia
p ∈ E 0 . Sia f : E → X2 . Le due seguenti affermazioni sono equivalenti
i) limx→p f (x) = `;
ii) limn→+∞ f (xn ) = ` per ogni successione {xn } verificante le tre seguenti
proprietà:
xn 6= p, xn ∈ E, xn → p per n → +∞.
(6.6.2)
Dimostrazione. Supponiamo dapprima che valga i) e sia {xn } una successione
di punti verificante (6.6.2). Si fissi ε > 0 e sia δ tale che d2 (f (x), `) < ε per ogni
x ∈ B(p, δ) ∩ E,
x 6= p.
(6.6.3)
Poiché xn → p, esiste n0 tale che per ogni n > n0 si ha xn ∈ B(p, δ). Quindi,
per n > n0 i valori xn soddisfano (6.6.3), da cui d2 (f (x), `) < ε. Segue ii).
6.7. Calcolo dei limiti
165
Viceversa valga ii) per ogni successione che verifica le tre proprietà (6.6.2).
Per assurdo, supponiamo che non valga i). Allora esiste ε > 0 tale che per ogni
δ > 0 esiste un punto x soddisfacente (6.6.3), ma tale che
d2 (f (x), `) ≥ ε.
Assegnando a δ successivamente i valori 1, 1/2, 1/3, . . . , 1/n, . . ., si ottiene una
successione di punti xn tale che
xn ∈ B(p, δ) ∩ E,
xn 6= p,
ma tali che d2 (f (xn ), `) ≥ ε. Quindi la successione {xn } soddisfa le tre proprietà
(6.6.2), ma f (xn ) non tende a `, contro l’ipotesi.
L’equivalenza espressa dal teorema continua a sussistere se f è definita in un
insieme E ⊆ R, p ∈ R e il limite di f (x) è per x → p+ oppure x → p−. In questo
caso, la terza condizione in (6.6.2) va sostituita da xn → p+ oppure xn → p−,
rispettivamente. Cosı̀ pure, l’equivalenza continua a valere se f (x) → `+ o
f (x) → `−. In questo caso la ii) viene sostituita da f (xn ) → `+ o f (xn ) → `−,
rispettivamente.
6.7
Calcolo dei limiti
Il Teorema 6.6.1 permette di dedurre il calcolo dei limiti per funzioni a valori
reali a partire dal calcolo dei limiti per successioni a reali.
Teorema 6.7.1 Sia (X, d) uno spazio metrico e sia E ⊆ X. Sia p ∈ E 0 . Siano
f, g : E → R. Sia
lim f (x) = α,
lim g(x) = β,
x→p
x→p
ove α, β ∈ R. Allora
a) limx→p [f (x) + g(x)] = α + β
b) limx→p [f (x) · g(x)] = αβ
c) limx→p
f (x)
α
=
g(x)
β
(g(x) 6= 0)
d) limx→p f (x)g(x) = αβ
(f (x) > 0)
e) limx→p logg(x) f (x) = logβ α
(f (x) > 0 e g(x) > 0, g(x) 6= 1),
ove le operazioni sui limiti sono da interpretare secondo le tabelle di aritmetizzazione parziale I–VII del capitolo 4 per i simboli +∞ , −∞, 0+, 0−, e ove non
si presentino le forme di indecisione della Tabella VIII.
166
6. Limiti di funzioni
Dimostrazione. Dimostriamo ad esempio a). La dimostrazione degli altri
punti è del tutto analoga. Sia {xn } una qualunque successione verificante le tre
proprietà (6.6.2). Allora, per il Teorema precedente ((i)=⇒ ii)), si ha
f (xn ) → α,
g(xn ) → β
per n → +∞. Se non si presentano forme di indecisione, si ha f (xn ) + g(xn ) →
α + β per n → +∞. Ne segue, sempre per il Teorema 6.6.1 (l’affermazione ii)
implica la i)), f (x) + g(x) → α + β per x → p.
Come ulteriore applicazione del Teorema 6.6.1, si dimostrano per le funzioni
i limiti notevoli analoghi a quelli del Teorema 4.8.17 per le successioni. La
dimostrazione, come sopra, consiste nella riduzione dei limiti di funzione a limiti
di successioni.
Teorema 6.7.2 Sia (X, d) uno spazio metrico e sia E ⊆ X. Sia p ∈ E 0 . Sia
ε(x) una funzione definita in E a valori in R tale che ε(x) 6= 0 e ε(x) → 0 per
x → p. Sia a ∈ R. Allora, per x → p si ha:
a) (1 + a · ε(x))
1/ε(x)
→ ea
b)
log(1 + a · ε(x))
→a
ε(x)
c)
aε(x) − 1
→ log a
ε(x)
d)
(1 + ε(x))a − 1
→a
ε(x)
(se a > 0).
Si noti che, come caso particolare del punto a), si ha
¶x
¶x
µ
µ
1
1
lim
= lim
= e.
1+
1+
x→+∞
x→−∞
x
x
Il Teorema 6.6.1 riconduce anche lo studio dei limiti di funzioni a valori in Rk
allo studio dei limiti di successioni.
Innanzi tutto osserviamo che una funzione f : E → Rk è individuata da k
funzioni a valori reali fj : E → R, j = 1, 2, . . . , k. In altri termini
f (x) = (f1 (x), f2 (x), . . . , fk (x)) .
(6.7.3)
Il seguente Teorema è l’analogo del Teorema 4.11.5
Teorema 6.7.4 Sia (X, d) uno spazio metrico e sia E ⊆ X. Sia p ∈ E 0 . Sia
f : E → Rk della forma (6.7.3). Allora si ha
lim f (x) = ` = (`1 , `2 , . . . , `k )
x→p
(6.7.5)
se e solo se
lim fj (x) = `j ,
x→p
per ogni j = 1, 2, , . . . , k.
(6.7.6)
6.8. Infiniti, infinitesimi, o piccolo, asintotico
167
Dimostrazione. Sia {xn } una successione verificante le tre proprietà (6.6.2).
Per il Teorema 6.6.1 la formula (6.7.5) vale se e solo se f (xn ) → ` per n → +∞.
Per il Teorema 4.11.5 questa relazione di limite vale se e solo se fj (xn ) → `j
per n → +∞, per ogni j = 1, 2, . . . , k. Di nuovo per il Teorema 6.6.1, queste k
relazioni di limite equivalgono a (6.7.6).
Il calcolo dei limiti in Rk segue dal precedente Teorema.
Teorema 6.7.7 Sia (X, d) uno spazio metrico e sia E ⊆ X. Sia p ∈ E 0 . Siano
f , g : E → Rk . Sia λ : E → R. Valga
lim f (x) = α,
x→p
lim g(x) = β,
x→p
lim λ(x) = γ ∈ R.
x→p
Allora
£
¤
a) limx→p f (x) + g(x) = α + β
b) limx→p λ(x) · f (x) = γα
¡
¢ ¡
¢
c) limx→p f (x), g(x) = α, β .
Dimostrazione. I punti a), b) e c) seguono dal Teorema 6.7.4 precedente
e dal calcolo dei limiti per funzioni a valori reali. Dimostriamo ad esempio
c). Denotiamo con fj (x), gj (x), αj e βj le coordinate di f (x), g(x), α e β
rispettivamente. Per ogni j si ha, al tendere di x a p,
fj (x) → αj ,
gj (x) → βj .
Per i punti a) e b) del Teorema 6.7.1, si ha, per x → p,
k
k
X
¡
¢ X
¡
¢
f (x), g(x) =
fj (x)gj (x) →
αj βj = α, β .
j=1
6.8
j=1
Infiniti, infinitesimi, o piccolo, asintotico
La definizione di successione infinita e successione infinitesima si generalizza a
fuzioni definite in uno spazio metrico e a valori reali.
Definizione 6.8.1 Sia (X, d) uno spazio metrico e sia E ⊆ X. Sia p ∈ E 0 e
sia f : E → R. Si dice che f (x) è un infinitesimo per x → p se limx→p f (x) =
0. Si dice che f (x) è un infinito per x → p se limx→p f (x) = +∞, oppure
limx→p f (x) = −∞.
Ad esempio, tutte le funzioni xα , con α reale positivo, sono infinitesimi per
x tendente 0+ e infiniti per x tendente a +∞. Analogamente, le funzioni 1/xα ,
con α reale positivo, sono infiniti per x → 0+ e infinitesimi per x tendente a
+∞. La funzione ex è un infinito per x → +∞ e un infinitesimo per x → −∞.
La funzione log x è un infinito per x → +∞ e per x → 0+, ed è un infinitesimo
per x → 1.
168
6. Limiti di funzioni
Definizione 6.8.2 Sia (X, d) uno spazio metrico, sia E ⊆ X e sia p ∈ E 0 .
Siano f, g : E → R.
Se f e g sono ambedue infiniti per x → p si dice che f (x) tende all’infinito
più lentamente di g(x) per x → p, o che f (x) è un infinito di ordine inferiore
rispetto a g(x), se
f (x)
lim
= 0.
(6.8.3)
x→p g(x)
Se f e g sono ambedue infinitesimi per x → p, e g(x) 6= 0, si dice che f (x)
tende a 0 più rapidamente di g(x) per x → p, o che f (x) è un infinitesimo di
ordine superiore rispetto a g(x) , se
lim
x→p
f (x)
= 0.
g(x)
(6.8.4)
Se f e g sono infiniti e vale (6.8.3), si dice equivalentemente che g è un
infinito di ordine superiore rispetto a f . Se f e g sono infinitesimi e vale (6.8.3),
si dice equivalentemente g è un infinitesimo di ordine inferiore rispetto a f .
Definizione 6.8.5 Sia (X, d) uno spazio metrico, E ⊆ X e p ∈ E 0 . Siano
f, g : E → R ambedue infinitesimi (oppure ambedue infiniti) per x → p. Sia
g(x) 6= 0 e sia α > 0 un numero reale. Si dice che f (x) è un infinitesimo
(rispettivamente, un infinito) di ordine α rispetto a g(x) per x → p se esiste
β > 0 tale che
|f (x)|
lim
α → β.
x→p |g(x)|
Se α = 1 si dice che f (x) e g(x) sono infinitesimi (rispettivamente, infiniti)
dello stesso ordine.
Ad esempio, sin x è infinitesimo dello stesso ordine
√ di x per x → 0; 1 − cos x
è infinitesimo di ordine 2 rispetto a x per x → 0; x è infinito di ordine 1/2
rispetto a x per x → +∞.
Come nel caso delle successioni, per x → +∞ e a, b, c positivi, eax è un
infinito di ordine superiore rispetto a xb che, a sua volta, è un infinito di ordine
superiore rispetto a logc x.
Teorema 6.8.6 Si ha, per ogni a, b, c positivi,
eax
= +∞,
x→+∞ xb
lim
xb
= +∞.
c
x→+∞ log x
lim
(6.8.7)
Dimostrazione. Dimostriamo il primo limite in (6.8.7), utilizzando il limite
per le corrispondenti successioni, dimostrato nel capitolo 4. Fissato M > 0,
esiste n0 tale che per ogni n > n0 si ha
ean
> M ea .
nb
6.8. Infiniti, infinitesimi, o piccolo, asintotico
169
Sia x > n0 . Indicando con [x] la parte intera di x, si ha
eax
ea[x]
ea([x]+1)
>
= e−a
> M.
b
b
b
x
([x] + 1)
([x] + 1)
In maniera analoga si dimostra la seconda relazione di limite in (6.8.7).
Le definizioni di o piccolo, asintotico, O grande ed eguale ordine di grandezza
per funzioni sono pure analoghe a quelle per le successioni.
Definizione 6.8.8 Sia (X, d) uno spazio metrico e sia E ⊆ X. Sia p ∈ E 0 e
siano f, g : E → R. Sia g(x) 6= 0. Diciamo che f (x) è o piccolo di g(x) per
x → p se
f (x)
lim
= 0.
x→p g(x)
In tal caso si scrive
f (x) = o (g(x)) .
Esempi 6.8.9
1. Se a, b e c sono positivi, si ha per x → +∞
¡ ¢
¡
¢
√
logc x = o xb , e−ax = o x−b ,
x = o (x) ,
sin x = o(x).
2. Per x → 0 si ha
x2 = o(x),
log |x| = o(x−b ), ove b > 0.
3. Con riferimento all’esempio 6.2.3.6, per (x, y) → (0, 0)
xy = o (k(x, y)k) .
La scrittura f (x) = h(x) + o (g(x)) per x → p equivale a f (x) − h(x) = o (g(x)).
La scrittura o(1) indica un generico infinitesimo per x → p. In particolare, se
f (x) → ` ∈ R per x → p, si ha f (x) = ` + o(1).
Definizione 6.8.10 Sia (X, d) uno spazio metrico e sia E ⊆ X. Sia p ∈ E 0 e
siano f, g : E → R, tali che f (x) 6= 0 e g(x) 6= 0. Si dice che f (x) è asintotica
a g(x) per x → p se
f (x)
= 1.
lim
x→p g(x)
In tal caso si scrive
f (x) ∼ g(x)
per x → p.
170
6. Limiti di funzioni
Esempi 6.8.11
1. Per x → 0, si ha
√
√
x3 + 3 x ∼ 3 x,
sin x ∼ x,
log (1 + x) ∼ x,
2. Per x → +∞ si ha
√
x3 + x ∼ x3 , x2 + sin x ∼ x2 ,
ex − 1 ∼ x.
log(1 + x) ∼ log x,
[x] ∼ x.
Come nel caso delle successioni, la relazione ∼ per x → p è riflessiva, cioè
f (x) ∼ f (x), simmetrica, cioè f (x) ∼ g(x) se e solo se g(x) ∼ f (x), transitiva,
cioè f (x) ∼ g(x) e g(x) ∼ h(x) implicano f (x) ∼ h(x).
Sempre come nel caso delle successioni, se per x → p f (x) ∼ g(x) e f (x) →
` ∈ R, allora si ha anche g(x) → ` per x → p.
Definizione 6.8.12 Sia (X, d) uno spazio metrico e sia E ⊆ X. Sia p ∈ E 0
e siano f, g : E → R, con g(x) > 0 Si dice che che f (x) è O grande di g(x)
per x → p se esiste una costante c e un numero δ > 0 tali che per ogni x ∈
B(p, δ) ∩ E, x 6= p, si abbia
|f (x)|
≤ c.
(6.8.13)
g(x)
In tal caso si scrive
f (x) = O(g(x)).
Siano f (x) 6= 0 e g(x) 6= 0. Si dice che f (x) e g(x) hanno eguale ordine di
grandezza per x → p se esistono due costanti c > 0 e d > 0 e un numero δ > 0
tali che per ogni x ∈ B(p, δ) ∩ E, x 6= p, si abbia
¯
¯
¯ f (x) ¯
¯
¯ ≤ c.
0<d≤¯
(6.8.14)
g(x) ¯
In tal caso si scrive
f (x) ³ g(x).
Due funzioni asintotiche per x → p hanno anche eguale ordine di grandezza,
ma non vale l’implicazione opposta.
Esempi 6.8.15
1. x sin x = O(|x|) per x → ±∞. In questo caso (6.8.13) vale con c = 1 e x
qualunque.
2.
1
x
³
per x → 2. La diseguaglianza (6.8.14) vale per ogni x 6= 2
x−2
x−2
tale che |x − 2| < 1, con c = 3 e d = 1.
3. x(1 + sin2 x) ³ x per x → ±∞. La diseguaglianza (6.8.14) vale per ogni
x con d = 1 e c = 2.
6.9. Appendice
6.9
6.9.1
171
Appendice
Classe limite di una funzione
Nel capitolo 4 abbiamo introdotto la classe limite per le successioni a valori
reali. Questa nozione si estende naturalmente alle funzioni, coerentemente con
il Teorema 6.6.1 che pone in relazione i limiti funzionali e i limiti successionali.
Sia (X, d) uno spazio metrico, E ⊆ X e p ∈ E 0 . Sia f : E → R. Consideriamo, come nel paragrafo 6.6, una qualunque successione tale che
xn 6= p,
xn ∈ E,
xn → p per n → +∞.
(6.9.1)
Definizione 6.9.2 Si chiama valore limite di f (x) per x → p un qualunque elemento α ∈ R per cui esiste una successione {xn }, soddisfacente le tre proprietà
(6.9.1), tale che
lim f (xn ) = α.
n→+∞
L’insieme dei valori limite si chiama classe limite di f (x) per x → p.
Denoteremo usualmente con il simbolo Ep la classe limite di f (x) per x → p.
Esempi 6.9.3
1
e sia p = 0. In questo caso la classe limite E0 è l’insieme
x
{−∞, +∞}. Infatti sia {xn } soddisfacente le tre proprietà (6.9.1) con
1
p = 0. Se xn → 0−, allora f (xn ) =
→ −∞. Se xn → 0+, allora
xn
1
f (xn ) =
→ +∞. Se xn → 0, ma non tende a 0+ né a 0−, allora f (xn )
xn
non ha limite.
1. Sia f (x) =
2. Sia f (x) = sin x e sia p = +∞. In questo caso la classe limite E+∞ coincide
con l’intervallo [−1, 1]. Infatti, sia −1 ≤ α ≤ 1 e sia xn = arcsin α + 2nπ,
con n ∈ N. La successione {xn } soddisfa ovviamente le tre proprietà
(6.9.1) per n → +∞. Si ha
sin (arcsin α + 2nπ) = sin (arcsin α) = α.
3. Sia f (x) = mant x, e sia p = +∞. In questo caso si ha E+∞ = [0, 1]. Per
vedere ciò osserviamo in primo luogo che [0, 1) ⊂ E+∞ . Infatti, in modo
analogo all’esempio precedente, sia α ∈ [0, 1) e poniamo xn = α + n. Si
ha
mant (α + n) = mant α = α.
Sia ora xn = n−1/n. Questa successione soddisfa di nuovo le tre proprietà
(6.9.1). Si ha
¶
µ
¶
µ
1
1
1
= mant 1 −
= 1 − → 1.
mant n −
n
n
n
Quindi 1 ∈ E+∞ .
172
6. Limiti di funzioni
Si noti che, data una successione {xn } verificante le tre proprietà (6.9.1),
ogni valore limite α della successione f (xn ) appartiene a Ep . Infatti, se α è un
valore limite di f (xn ), esiste una sottosuccessione {xnk } tale che f (xnk ) tende
a α. Tale sottosuccessione verifica necessariamente le proprietà (6.9.1).
Teorema 6.9.4 Sia (X, d) uno spazio metrico, E ⊆ X e p ∈ E 0 . Sia f : E →
R. Allora
a) Ep 6= ∅
b) Ep ∩ R è chiusa
c) Ep ha massimo e minimo (nell’insieme ordinato R).
Dimostrazione. a) Sia {xn } una successione verificante le tre proprietà (6.9.1).
Per il punto a) del Teorema 4.12.3 sulla classe limite delle successioni, la successione f (xn ) ha almeno un valore limite. Tale valore limite appartiene necessariamente a Ep , come osservato sopra.
0
b) Sia (Ep ∩ R) 6= ∅, e sia z un punto di accumulazione di Ep ∩ R. Sia
α
∈
k
© k ª Ep ∩ R convergente a z per k → +∞. Per ogni k esiste una successione
xn verificante (6.9.1) tale che
∀k
¡ ¢
αk = lim f xkn
n→+∞
¯ ¡ 1 ¢
¯
¯
¯
Quindi esiste
¯ ¡ 2n1¢ tale ¯che f xn1 − α1 < 1. Cosı̀ pure esiste esiste n2 > n1
tale che ¯f ¯xn¡2 −¢α2 ¯ <¯ 1/2. Per induzione, per ogni intero positivo k esiste
nk tale che ¯f xknk − αk ¯ < 1/k e nk > nk−1 .
©
ª
Si noti che anche la successione xknk soddisfa (6.9.1) al tendere di k a +∞.
Si ha, per k → +∞,
¯
¯
¡
¢¯
¡
¢¯
¯z − f xkn ¯ ≤ |z − αk | + ¯αk − f xkn ¯ < |z − αk | + 1/k → 0.
k
k
© ¡
¢ª
Quindi z è il limite della sottosuccessione f xknk .
c) Se f (x) è illimitata superiormente in un intorno di p, allora esiste necessariamente xn 6= p, xn ∈ E e xn → p tale che f (xn ) → +∞. Quindi
+∞ ∈ Ep .
Se f (x) è limitata superiormente in un intorno B(p, δ), allora anche Ep è
limitata superiormente. Infatti, nessun elemento
α>
sup
f (x)
x∈B(p,δ)
può essere un valore limite della funzione per x → p. Sia L = sup Ep . Poiché
Ep ∩ R è chiuso, L ∈ Ep ∩R per il Teorema 3.5.4. Quindi L è il massimo di Ep .
L’esistenza del minimo si dimostra in modo analogo.
6.9. Appendice
173
Definizione 6.9.5 Sia (X, d) uno spazio metrico, E ⊆ X e p ∈ E 0 . Sia f :
E → R e sia Ep la sua classe limite per x → p. Si chiama limite superiore (o
massimo limite) della funzione per x → p il massimo della classe limite.
Si chiama limite inferiore (o minimo limite) della funzione per x → p il
minimo della classe limite.
Per il limite superiore si usano le notazioni
lim sup f (x),
x→p
limx→p f (x).
Per il limite inferiore si usano le notazioni
lim inf f (x),
x→p
limx→p f (x).
Negli esempi 6.9.3 il limite superiore è rispettivamente +∞, 1, 1. Il limite
inferiore è −∞, −1, 0.
Le definizioni di valore limite, classe limite, limite superiore e inferiore e il
teorema precedente continuano a sussistere per x → p+ oppure per x → p−.
Teorema 6.9.6 Sia (X, d) uno spazio metrico, E ⊆ X e p ∈ E 0 . Sia f : E :→
R.
a) Se lim supn→+∞ f (x) = L < +∞, allora, per ogni ε > 0 esiste δ > 0 tale
che per ogni x ∈ B(p, δ) ∩ E, x 6= p, si ha f (x) < L + ε.
b) Se lim inf n→+∞ f (x) = ` > −∞, allora, per ogni ε > 0 esiste δ > 0 tale che
per ogni x ∈ B(p, δ) ∩ E, x 6= p, si ha f (x) > ` − ε.
Dimostrazione. Ci limitiamo a dimostrare a), poiché la imostrazione di b) è
del tutto simile.
Se a) è falsa, esiste ε > 0 tale che per ogni δ > 0 esiste x ∈ B(p, δ) ∩ E
tale che f (x) ≥ L + ε. Dando successivamente a δ i valori 1, 1/2 . . . , 1/n, . . . si
ottiene una successione di punti xn soddisfacenti (6.9.1) e tali che f (xn ) ≥ L+ε.
Allora esiste una sottosuccessione {f (xnk )} avente limite α ≥ L + ε, assurdo.
Tenendo presente che limx→p f (x) = α se e solo se f (xn ) → α per ogni
successione che soddisfa le proprietà (6.9.1), il seguente Corollario si dimostra
come nel caso delle successioni.
Corollario 6.9.7 Sia (X, d) uno spazio metrico, E ⊆ X e p ∈ E 0 . Sia f : E →
R. Si ha
lim sup f (x) = lim inf f (x) = α
n→+∞
se e solo se f (x) → α per x → p.
n→+∞
Capitolo 7
Continuità
7.1
Introduzione
Le funzioni elementari dell’analisi, cioè funzioni quali potenze, radici, esponenziali, logaritmi, funzioni trigonometriche e loro inverse, funzioni ottenute dalle
precedenti mediante operazioni aritmetiche o di composizione, ammettono limite eguale a f (p) per x → p, qualunque sia p nel loro insieme di definizione. Lo
studio di tale proprietà, che non è limitata alle sole funzioni reali di variabile
reale, si effettua in modo naturale nell’ambito degli spazi metrici.
7.2
Continuità in spazi metrici
Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici, sia E ⊆ X1 un sottoinsieme non vuoto
e sia p ∈ E.
Definizione 7.2.1 Una funzione f : E → X2 si dice continua in p ∈ E se: per
ogni ε > 0 esiste δ > 0 tale che per ogni x ∈ E, tale che d1 (x, p) < δ, si ha
d2 (f (x), f (p)) < ε.
La definizione 7.2.1 può anche anche essere scritta nel modo seguente:
∀ε > 0 ∃δ ∀x ∈ E,
d1 (x, p) < δ,
si ha
d2 (f (x), f (p)) < ε.
(7.2.2)
Equivalentemente, f è continua in p ∈ E se per ogni ε > 0 esiste un intorno
B(p, δ) tale che
f (B(p, δ) ∩ E) ⊆ B(f (p), ε).
(7.2.3)
Osservazione. A differenza della definizione di limite (6.2.2), il punto p deve
appartenere all’insieme di definizione E, ma non deve necessariamente essere di
accumulazione per E.
Poiché un punto p ∈ E è isolato oppure è di accumulazione, si ha che:
a) se p è un punto isolato di E, allora ogni funzione f : E → X2 è continua
in p. Infatti, per definizione di punto di isolato, esiste δ > 0 tale che
B(p, δ) ∩ E = {p}. Ovviamente, f (p) ∈ B(f (p), ε), qualunque sia ε > 0.
La (7.2.3) è perciò soddisfatta con δ = δ.
175
176
7. Continuità
b) se p appartiene ad E ed è anche di accumulazione per E, allora f è continua
in p se e solo se
lim f (x) = f (p).
(7.2.4)
x→p
Infatti, l’unica differenza tra la definizione di continuità (7.2.2) e la definizione di limite (6.2.2) nel capitolo 6 consiste nella clausola x 6= p contenuta
nella definizione di limite. Quindi, se vale (7.2.2) a maggior ragione vale
(7.2.4).
Viceversa, se limx→p f (x) = f (p), allora per ogni ε > 0 esiste δ tale che
per ogni x ∈ B(p, δ) ∩ E, x 6= p, si ha d2 (f (x), f (p)) < ε. Poiché, per
x = p, si ha d2 (f (p), f (p)) = 0 < ε, vale anche (7.2.2).
Esempi 7.2.5
√
1. Sia X1 = X2 = E = R con la metrica euclidea. Sia f (x) = 3 x e sia p = 0.
Scelto ad arbitrio ε > 0 basta porre δ = ε3 perché ogni punto x tale che
|x| < δ soddisfi |f (x)| < ε. Quindi f è continua in p = 0.
2. Sia X1 = E = R2 e sia X2 = R, ambedue con la metrica euclidea. Sia

x3

se (x, y) 6= (0, 0)
2
f (x, y) =
x + y2

0
se (x, y) = (0, 0).
Dimostriamo che f è continua in p = p
(0, 0). Fissato ε > 0 basta porre δ = ε
affinché ogni punto (x, y) tale che x2 + y 2 < δ soddisfi |f (x, y)| < ε.
Infatti si ha, al di fuori dell’origine,
|f (x, y)| = |x|
p
x2
≤
|x|
≤
x2 + y 2 .
x2 + y 2
Quindi limx→(0,0) f (x, y) = 0 = f (0, 0).
3. Sia (X1 , d1 ) uno spazio metrico discreto, e sia (X2 , d2 ) uno spazio metrico
arbitrario. Sia f : X1 → X2 una qualunque funzione. Qualunque punto
p ∈ X1 è isolato, e quindi f è continua in un qualsiasi punto di X1 .
4. Sia X1 = E = R e sia X2 = R3 , ambedue con la metrica euclidea. Sia
p = 0. Sia
f (x) = (sin x, cos x, x) .
Per x → 0 si ha
sin x = f1 (x) → 0, cos x = f2 (x) → 1, x = f3 (x) → 0.
Quindi limx→0 f (x) = (0, 1, 0) = f (0), e la funzione è continua in p = 0.
Dal Teorema 6.6.1 si ricava immediatamente che la continuità di una funzione
in un punto può essere caratterizzata mediante i limiti successionali.
7.3. Continuità globale
177
Teorema 7.2.6 Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici e sia E ⊆ X1 . Sia
p ∈ E ∩ E 0 . Una funzione f : E → X2 è continua in p se e solo se
lim f (xn ) = f (p)
n→+∞
per ogni successione {xn } verificante le due condizioni
xn ∈ E
e
xn → p
per n → +∞.
(7.2.7)
Questo Teorema segue in modo ovvio dal Teorema 6.6.1. Basta osservare
che la condizione xn 6= p in (6.6.2) non è necessaria nel caso della continuità,
come abbiamo notato sopra.
Teorema 7.2.8 (di continuità della funzione composta) Siano (X1 , d1 ),
(X2 , d2 ) e (X3 , d3 ) spazi metrici. Sia E ⊆ X1 , e sia p ∈ E. Sia f : E → X2 e
sia g : X2 → X3 . Se f è continua in p e g è continua in f (p), allora la funzione
composta g ◦ f : E → X3 è continua in p.
Dimostrazione. La dimostrazione si basa sul Teorema precedente. Se p è
isolato, ogni funzione è continua in p, come già osservato sopra. Sia quindi p di
accumulazione. Sia {xn } una successione verificante le due condizioni (7.2.7).
Per la continuità di f in p si ha f (xn ) → f (p) per n → +∞. Se f (p) è isolato in
X2 , allora definitivamente deve essere f (xn ) = f (p) e quindi, definitivamente,
g (f (xn )) = g (f (p)). Se f (p) è di accumulazione, poiché g è continua in f (p),
si ha g (f (xn )) → g (f (p)) per n → +∞. In ambedue i casi si ha g (f (xn )) →
g (f (p)) per n → +∞, da cui la tesi.
.
7.3
Continuità globale
Definizione 7.3.1 Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici e sia f : X1 → X2 .
Si dice che f è (globalmente) continua in X1 se è continua in ogni punto p ∈ X1 .
In seguito, nel caso di funzioni globalmente continue in sottoinsiemi E di spazi metrici assegnati, (X1 , d1 ) denoterà semplicemente l’insieme E dotato della
metrica indotta. Ad esempio, se f : [a, b] → R è continua in [a, b], lo spazio
metrico (X1 , d1 ) sarà l’intervallo [a, b] con la metrica euclidea indotta.
Teorema 7.3.2 Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici, e sia f : X1 → X2 . La
funzione f è continua in X1 se e solo se
per ogni aperto A ⊆ X2 la controimmagine f −1 (A) è aperta in X1 .
Dimostrazione. Sia A ⊆ X2 aperto e sia f continua in X1 . Dimostriamo che
ogni punto p ∈ f −1 (A) è interno a f −1 (A). Sia q ∈ A tale che f (p) = q. Sia
ε > 0 tale che B(q, ε) ⊆ A. Per (7.2.3) esiste δ > 0 tale che f (B(p, δ)) ⊆ B(q, ε).
Quindi
B(p, δ) ⊆ f −1 (B(q, ε)) ⊆ f −1 (A),
178
7. Continuità
cioè p è interno a f −1 (A).
Viceversa supponiamo che f −1 (A) sia aperto in X1 per ogni aperto A ⊆ X2 .
Sia p ∈ X1 e sia q = f (p). Fissato ε > 0, poniamo A = B(q, ε). Per ipotesi
f −1 (B(q, ε)) è aperto e quindi p è ad esso interno. Esiste quindi δ > 0 tale che
B(p, δ) ⊆ f −1 (B(q, ε)). Ne segue
f (B(p, δ)) ⊆ B(q, ε),
cioè la continuità di f in p.
La continuità di f in X1 può essere equivalentemente caratterizzata mediante
le contrommagini dei chiusi.
Corollario 7.3.3 Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici, e sia f : X1 → X2 .
La funzione f è continua in X1 se e solo se
per ogni chiuso F ⊆ X2 la controimmagine f −1 (F ) è chiusa in X1 .
Dimostrazione. Il Corollario si dimostra ricordando che un insieme è chiuso
se e solo se il suo complementare è aperto. Sia F ⊆ X2 chiuso, e sia A = F c .
Allora A è aperto in X2 . Si ha
¡
¢c
f −1 (F ) = f −1 (Ac ) = f −1 (A) .
La funzione f è continua se e solo se f −1 (A) è aperto e quindi se e solo se
f −1 (F ) è chiuso.
È bene osservare che nel caso in cui X1 sia un sottospazio metrico con la
metrica indotta f −1 (A) deve essere aperto in tale metrica. Se, ad esempio, X1 =
[a, b] ⊂ R, gli aperti di [a, b] nella metrica euclidea indotta sono le intersezioni di
[a, b] con gli aperti R. Analogamente, gli intorni di p ∈ [a, b] sono le intersezioni
degli intervalli (p − ε, p + ε) con [a, b]. Ad esempio, per valori piccoli di ε gli
intorni di a sono gli intervalli [a, a + ε) = [a, b] ∩ (a − ε, a + ε).
7.4
Continuità delle funzioni a valori reali
Teorema 7.4.1 Sia (X, d) uno spazio metrico, e siano f, g : X → R. Se f e g
sono continue in p ∈ X allora sono continue in p anche le funzioni f + g, f − g,
f /g (se g(p) 6= 0), f g (se f (p) > 0), logg f (se f (p) > 0, g(p) > 0, g(p) 6= 1).
Dimostrazione. Se p è isolato l’asserto è ovvio. Se p è di accumulazione, la
tesi segue dal Teorema 6.7.1.
Si noti che se g(p) 6= 0 e p è di accumulazione, allora anche g(x) 6= 0 in un
opportuno intorno di p. Infatti, g(x) deve avere lo stesso segno del suo limite
g(p) in un opportuno intorno di p. Quindi f /g è definita in tale intorno. La
stessa considerazione si applica alla funzione f g e a logg f .
Il Teorema appena dimostrato, assieme al Teorema sulla composizione di
funzione continue, permette di dimostrare la continuità delle funzioni elementari
dell’analisi nel loro insieme di definizione.
7.4. Continuità delle funzioni a valori reali
179
1) Iniziamo osservando che la fuzione f (x) = x è banalmente continua in
tutto R e che la fuzione f (x) = c, ove c è una qualsiasi costante, è pure banalmente continua (di fatto queste funzioni sono continue in ogni spazio metrico).
Sono quindi continui su tutto R i monomi cxn , con n ∈ N, e di conseguenza
tutti polinomi
P (x) = c0 + c1 x + c2 x2 + · · · + cn xn .
Sono pure continui i rapporti di polinomi
il denominatore.
P1 (x)
in ogni punto che non annulla
P2 (x)
2) Gli esponenziali sono continui in ogni punto. Infatti, sia f (x) = ax , ove
a > 0 e a 6= 1. Sia x0 un qualsiasi numero reale. Per il Teorema 6.7.2 al tendere
di x a x0 si ha
¡
¢
ax − ax0 = ax0 ax−x0 − 1 ∼ (x − x0 )ax0 log a → 0.
Quindi ax → ax0 per x → x0 .
3) Come conseguenza del punto precedente e del Teorema 7.4.1, sono continue in ogni punto le funzioni iperboliche
sinh x =
ex − e−x
,
2
cosh x =
ex + e−x
,
2
tanh x =
sinh x
.
cosh x
y=cosh(x)
1
y=tanh(x)
y=tanh(x)
-1
y=sinh(x)
Le funzioni iperboliche
4) Sia f (x) = log x, ove x > 0. Al tendere di x → x0 > 0 si ha, per il
Teorema 6.7.2,
µ
¶
x
x − x0
x − x0
log x − log x0 = log
= log 1 +
∼
→ 0.
x0
x0
x0
180
7. Continuità
Quindi log x è continua in ogni punto x0 > 0.
5) Sia f (x) = xα , ove α ∈ R e α 6= 0. Questa funzione è definita per x > 0.
Se α > 0 il suo insieme di definizione include anche lo 0: infatti, si pone in
questo caso f (0) = 0.
Sia x0 > 0. Si ha
¶
µµ ¶α
³
´
x
α log xx
α
0 − 1
xα − xα
=
x
−
1
= xα
.
0
0
0 e
x0
Per quanto appena visto, log
Teorema 6.7.2,
x
→ log 1 = 0 per x → x0 . Quindi, per il
x0
α
xα − xα
0 ∼ x0 α log
x
→ 0.
x0
Sia ora x0 = 0 e α > 0. Fissato ε > 0, sia δ = ε1/α . Per 0 ≤ x < δ si ha xα < ε,
e quindi limx→0+ xα = 0.
α>1
0<α<1
1
α<0
1
f (x) = xα
6) Sia α = m/n, con m e n interi non nulli, n > 0. La funzione xm/n è
definita per ogni x > 0 come
√
xm/n = n xm .
(7.4.2)
La radice a destra in (7.4.2) è definita anche per x < 0, eccetto il caso in cui n
sia pari e m dispari.
Per n dispari si ha
p
√
n
xm = − n (−x)m , se m è dispari
q
√
m
n
xm = n (−x) ,
se m è pari.
7.4. Continuità delle funzioni a valori reali
181
Ad esempio
√
3
√
x = − 3 −x,
√
3
q
x2 =
3
√
5
2
(−x) ,
x3 = −
q
5
3
(−x) .
Se n è pari e m è pari si ha
√
n
Ad esempio
√
4
xm =
q
m
n
|x| .
q
x2 =
4
2
|x| =
p
|x|.
In base a queste √
osservazioni, la continuità di xm/n in ogni punto x0 > 0 implica
n
la continuità di xm anche in x0 < 0. Se m/n > 0 le radici sono continue anche
in x0 = 0.
| x|
|x|
3
3
x
x
Le funzioni
p
|x| e
√
3
x
7) Esaminiamo le funzioni trigonometriche. Per ogni x0 si ha
µ
¶
µ
¶
x − x0
x + x0
sin x − sin x0 = 2 cos
sin
2
2
(7.4.3)
e l’espressione a destra in (7.4.3) tende a 0 per x → x0 . Analogamente, si ha,
per x → x0
¶
µ
¶
µ
x − x0
x + x0
sin
→ 0.
cos x − cos x0 = −2 sin
2
2
Quindi sin x e cos x sono continue in ogni punto. Di conseguenza, tan x è
continua in ogni x0 6= π/2 + kπ, con k intero.
182
7. Continuità
La continuità delle funzioni inverse delle funzioni trigonometriche sarà dimostrata più avanti, come caso particolare del Teorema di continuità della funzione
inversa.
Per studiare la continuità di funzioni a valori in Rk , notiamo il seguente
Teorema, la cui dimostrazione è una ovvia conseguenza del Teorema 6.7.4.
Teorema 7.4.4 Sia (X, d) uno spazio metrico e sia p ∈ X. Sia f : X → Rk .
Posto
f (x) = (f1 (x), f2 (x), . . . , fk (x)) ,
la funzione f è continua in p se e solo se fj : X → R è continua in p per ogni
j = 1, 2, . . . , k.
Applichiamo questo Teorema al caso in cui X = Rk , dotato della metrica
euclidea, e alla funzione identica
f (x) = x = (x1 , x2 , . . . , xk ) ,
che associa a ogni x ∈ Rk il punto x stesso. Ovviamente f è continua in Rk .
In questo caso si ha
f1 (x) = x1 , f2 (x) = x2 , . . . , fk (x) = xk .
La funzione fj si chiama proiezione sull’asse j–esimo, o j–esima proiezione, ed
è funzione continua di x. Ne segue che, per moltiplicazione e addizione, sono
funzione continue di x tutti i monomi in k variabili e tutti i polinomi in k
variabili; si veda il punto seguente.
8) Sia, per semplicità, k = 2. I monomi nelle due variabili x e y sono
1, x, y, x2 , xy, y 2 , x3 , x2 y, xy 2 , y 3 , . . .
Il generico polinomio di grado n in due variabili è
P (x, y) = c0,0 +c1,0 x+c0,1 y +c2,0 x2 +c1,1 xy +c0,2 y 2 +· · ·+c1,n−1 xy n−1 +c0,n y n
P (x, y) è una funzione continua di (x, y), per quanto detto sopra. Sono pure
continui i rapporti di due polinomi in tutti i punti che non annullano il denominatore.
9) Altri esempi di fuzioni continue, in una o più variabili reali, si ottengono
componendo le funzioni studiate in questo paragrafo ed eseguendo operazioni su
di esse. Ad esempio, sono continue in ogni punto del loro insieme di definizione
le funzioni
√
√
x+1
xy
sin x
sin (log x) , e
, √
, log(2 + cos x), cosh x,
, cos (x + y) .
1 + x2 + y 2
x−1
In generale possiamo affermare che tutte le funzioni elementari dell’analisi (in
una o più variabili) sono continue nel loro insieme di definizione.
7.5. Il Teorema di Weierstrass
7.5
183
Il Teorema di Weierstrass
Teorema 7.5.1 Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici. Sia f : X1 → X2
continua in X1 . Se X1 è compatto, allora anche f (X1 ) è compatto.
Dimostrazione. Sia {Ai }i∈I , ove Ai ⊆ X2 per ogni i, una copertura aperta
di f (X1 ).
Si ha
[
Ai .
f (X1 ) ⊆
i∈I
Di conseguenza
X1 = f
−1
µ[
¶
Ai
[
=
i∈I
f −1 (Ai ).
(7.5.2)
i∈I
La prima eguaglianza in (7.5.2) vale perché X1 non può essere contenuto propriamente in suo sottoinsieme.
Poniamo Vi = f −1 (Ai ). Per il Teorema 7.3.2, ogni insieme Vi è aperto e
per (7.5.2) la famiglia {Vi }i∈I costituisce una copertura aperta di X1 . Esistono
quindi n insiemi della famiglia, siano essi Vi1 , Vi2 , . . . , Vin , tali che
X1 =
n
[
Vi k .
k=1
¡
¢
Poiché f (Vik ) = f f −1 (Aik ) ⊆ Aik , segue che
f (X1 ) = f
µ[
n
k=1
¶
Vik
=
n
[
f (Vik ) ⊆
k=1
n
[
Ai k ,
k=1
Quindi la famiglia {Ai1 , Ai2 , . . . , Ain } è una sottocopertura finita di f (X1 )
estratta dalla copertura aperta {Ai }i∈I .
Come conseguenza si ottiene il Teorema di Weierstrass.
Corollario 7.5.3 (Teorema di Weierstrass) Sia (X, d) uno spazio metrico
e sia f : X → R continua in X. Se X è compatto allora f (x) ha un punto di
massimo e un punto di minimo assoluto in X.
Dimostrazione. Poiché f (X) è un compatto, esso è chiuso e limitato. Sia L
l’estremo superiore di f (X). Per la limitatezza di f (X) si ha L < +∞. Per la
chiusura di f (X) e per il Teorema 3.5.4, L ∈ f (X). Quindi L è anche massimo
assoluto della funzione.
In maniera analoga si dimostra l’esistenza del minimo assoluto.
Il Teorema di Weierstrass, originariamente dimostrato per funzioni continue
f : [a, b] → R, si applica, ad esempio, a funzioni di due o più variabili reali. Ogni
funzione continua in un cerchio chiuso in R2 e a valori reali ammette massimo
e minimo.
184
7.6
7. Continuità
Il Teorema di Darboux
Se f : [a, b] → R è continua, per il Teorema di Weierstrass si ha f ([a, b]) ⊆
[m, M ], ove M e m sono il massimo e il minimo della funzione. In questo
paragrafo dimostreremo che in realtà si ha f ([a, b]) = [m, M ]. Più in generale,
dimostreremo che l’immagine di un qualunque intervallo mediante una funzione
continua a valori in R è a sua volta un intervallo. Questa proprietà si basa sulla
connessione degli intervalli.
Teorema 7.6.1 Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici. Sia f : X1 → X2
continua in X1 . Se X1 è connesso, allora anche f (X1 ) è connesso.
Dimostrazione. Supponiamo per assurdo che f (X1 ) non sia connesso. Allora
esistono A e B non vuoti tali che
A ∪ B = f (X1 ),
A ∩ B = ∅,
A ∩ B = ∅.
Poniamo E = f −1 (A) e F = f −1 (B). Chiaramente E e F non sono vuoti. Si
ha
X1 = f −1 (f (X1 )) = f −1 (A ∪ B) = E ∪ F .
Arriveremo all’assurdo dimostrando che E e F sono ¡separati.
¢
Dalla relazione A ⊆ A si deduce f −1 (A) ⊆ f −1 A . Poiché f è continua,
¡ ¢
f −1 A è chiuso per il Corollario 7.3.3. Ne segue
¡ ¢
E = f −1 (A) ⊆ f −1 A .
Quindi
¡ ¢
¡
¢
E ∩ F = f −1 (A) ∩ F ⊆ f −1 A ∩ f −1 (B) = f −1 A ∩ B = ∅.
In modo analogo si dimostra che E ∩ F = ∅.
Corollario 7.6.2 (Teorema di Darboux) Sia I ⊆ R un intervallo di qualsiasi tipo, e sia f : I → R continua e non costante. Allora f (I) è un intervallo. In particolare, se I = [a, b] si ha f ([a, b]) = [m, M ] , ove M e m sono
rispettivamente il massimo e il minimo assoluto di f (x) in [a, b].
Corollario 7.6.3 (Teorema dei valori intermedi) Sia f : [a, b] → R continua. Sia f (a) < f (b) (oppure f (b) < f (a)). Allora, per ogni y0 tale che
f (a) < y0 < f (b) (rispettivamente, f (b) < y0 < f (a)), esiste x0 ∈ (a, b) tale che
f (x0 ) = y0 .
Dimostrazione. Sia ad esempio f (a) < f (b). Allora
y0 ∈ (f (a), f (b)) ⊂ [m, M ] = f ([a, b]).
Quindi deve esistere x0 ∈ (a, b) tale che f (x0 ) = y0 .
7.6. Il Teorema di Darboux
185
f(a)
y0
f(b)
a
x0
b
f (x) assume tutti i valori intermedi
Questo Corollario asserisce che una funzione reale di variabile reale, continua
in un intervallo, non può passare da un valore ad un altro senza assumere tutti
i valori intermedi. Il grafico della funzione incontra tutte le rette orizzontali
y = y0 , con y0 ∈ (f (a), f (b)). Da un punto di vista intuitivo, se si disegna
manualmente il grafico di questa funzione, non si può staccare la penna dal
foglio. Questo giustifica la denominazione di funzione ‘continua’.
Corollario 7.6.4 (Teorema degli zeri) Sia f : [a, b] → R continua. Sia
f (a) < 0 < f (b)
(oppure f (b) < 0 < f (a)).
Allora esiste x0 ∈ (a, b) tale che f (x0 ) = 0.
Questo Corollario si può applicare per dimostrare l’esistenza di soluzioni per
certe equazioni del tipo f (x) = 0 in opportuni intervalli. Ad esempio, sia
f (x) = x5 − x4 + x3 − 2x2 + 3x − 1.
Si ha f (0) = −1 e f (1) = 1, e quindi l’equazione f (x) = 0 deve avere almeno
una soluzione x0 tale che 0 < x0 < 1. Si può approssimare ulteriormente x0
osservando che f (0, 4) vale circa (è minore di) −0.07 mentre f (0, 5) vale circa
(è maggiore di) 0, 09. Quindi si ha 0.4 < x0 < 0.5. Ripetuti calcoli di questo
tipo portano alla stima x0 = 0, 4418 . . .
Come ulteriore esempio si consideri la funzione
f (x) = x − 3 log x.
Poiché f (x) → +∞ per x → 0+, per valori di x prossimi a 0 si ha f (x) > 0.
D’altra parte, f (e) = e − 3 < 0, e quindi deve esistere x0 < e tale che f (x0 ) = 0.
Poiché f (x) → +∞ per x → +∞, deve esistere un ulteriore valore x1 > e tale
che f (x1 ) = 0.
186
7.7
7. Continuità
Uniforme continuità
Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici e sia f : X1 → X2 continua in X1 . Ciò
significa che la (7.2.2), che esprime la continuità di f in p, è verificata in ogni
punto. Riscriviamo dunque la definizione di continuità, mettendone in evidenza
la validità in ogni punto p ∈ X1 . Si ha
∀p ∈ X1 ∀ε > 0 ∃δ ∀x ∈ X1 ,
d1 (x, p) < δ,
si ha
d2 (f (x), f (p)) < ε.
(7.7.1)
L’unica differenza rispetto alla (7.2.2) è l’apposizione della clausola: ∀p ∈ X1 .
Da questa definizione risulta evidente che il numero δ dipende non solo dal
valore di ε, ma anche che dal punto p.
Chiariamo questo fatto con un esempio. Sia X1 = (0, +∞), X2 = R e sia
f (x) = x2 . La funzione è continua in ogni punto p. Possiamo valutare δ per
ogni ε > 0 e p > 0 assegnati. Si ha, per ogni x ∈ (p − δ, p + δ),
¯
¯
ε > ¯x2 − p2 ¯ .
(7.7.2)
Questa diseguaglianza deve valere per anche x = p + δ/2 > p. Da (7.7.2) si
ottiene
¯
¯
δ
ε > ¯x2 − p2 ¯ = (x + p) |x − p| > 2p = pδ.
2
Ne segue δ < ε/2p, che tende a 0 per p → +∞. Fissato ε > 0 non è quindi
possibile trovare δ > 0, per quanto piccolo, dipendente solo da ε.
Diversa è la situazione se si restringe f a un intervallo compatto. Sia ad
esempio X1 = [0, b]. Si ha
¯ 2
¯
¯x − p2 ¯ = (x + p) |x − p| ≤ 2b |x − p| .
¯
¯
Fissato ε > 0, basta porre δ = ε/2b per avere ¯x2 − p2 ¯ < ε per ogni x e p tali
che |x − p| < δ. In questo caso δ dipende solo ε e non da p. Siamo cosı̀ condotti
alla nozione di uniforme continuità.
Definizione 7.7.3 Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici e sia f : X1 → X2
continua in X1 . Si dice che f è uniformemente continua in X1 se per ogni ε > 0
esiste δ tale che per ogni x, p ∈ X1 , tali che d1 (x, p) < δ, si ha d2 (f (x), f (p)) <
ε. In formula:
∀ε > 0 ∃δ ∀x ∈ X1 ∀p ∈ X1 ,
d1 (x, p) < δ,
si ha
d2 (f (x), f (p)) < ε.
(7.7.4)
In altri termini, f è uniformemente continua in X1 se è continua in X1 e il
numero δ dipende solo da ε e non dal punto p. Prefissato ε > 0, coppie di punti
che distano tra loro per meno di δ = δ(ε) hanno immagini che distano tra loro
per meno di ε, ovunque sia situata questa coppia di punti nello spazio metrico
X1 .
7.7. Uniforme continuità
187
Teorema 7.7.5 (di Heine–Cantor) Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici e
sia f : X1 → X2 continua in X1 . Se X1 è compatto allora f è uniformemente
continua in X1 .
Dimostrazione. La dimostrazione è per assurdo. Se (7.7.4) non vale, allora
esiste ε > 0 tale che per ogni δ > 0 esiste una coppia di punti x, y ∈ X1 , tali
che d1 (x, y) < δ, ma d2 (f (x), f (y)) ≥ ε.
Diamo a δ i valori 1, 1/2, . . . , 1/n, . . .. Esistono x1 e y1 tali che d1 (x1 , y1 ) <
1, ma d2 (f (x1 ), f (y1 )) ≥ ε. Esistono x2 , y2 tali che d1 (x2 , y2 ) < 1/2, ma
d2 (f (x2 ), f (y2 )) ≥ ε, etc.
Esistono quindi due successioni {xn } ⊆ X1 e {yn } ⊆ X1 tali che per ogni n
d1 (xn , yn ) < 1/n
d2 (f (xn ), f (yn )) ≥ ε.
(7.7.6)
Poiché X1 è compatto, esiste una sottosuccessione {xnk } convergente a un
punto z ∈ X1 , cioè d1 (xnk , z) → 0 per k → +∞. Si ha, per gli stessi indici nk ,
d1 (ynk , z) ≤ d1 (ynk , xnk ) + d1 (xnk , z) <
1
+ d1 (xnk , z).
nk
Quindi anche la sottosucessione {ynk } converge a z.
Poiché f è continua in ogni punto, e quindi anche in z, per Teorema 7.2.6 si
ha f (xnk ) → f (z) e f (ynk ) → f (z) per k → +∞.
Dalla diseguaglianza triangolare,
d2 (f (xnk ), f (ynk )) ≤ d2 (f (xnk ), f (z)) + d2 (f (z), f (ynk )) ,
si deduce che d2 (f (xnk ), f (ynk )) → 0 per k → +∞. D’altra parte, per (7.7.6)
si ha per ogni k
d2 (f (xnk ), f (ynk )) ≥ ε,
il che è assurdo.
Come conseguenza del Teorema di Heine–Cantor, ogni funzione continua
f : [a, b] → R è anche uniformemente continua.
Il Teorema di Heine–Cantor è una condizione sufficiente, ma non necessaria,
per l’uniforme continuità. Esistono infatti funzioni uniformemente continue definite in spazi metrici non compatti. Banalmente, la funzione identica f (x) = x
è uniformemente continua in ogni spazio metrico, come pure le funzioni costanti.
Un esempio non banale è fornito dalla funzione f (x) = log x ristretta a [1, +∞).
Per ogni x > −1 vale la diseguaglianza log(1+x) ≤ x (Lemma 4.9.6). Quindi,
dati due punti x, y ≥ 1, con x > y, si ha
µ
¶
x
x−y
= log 1 +
y
y
x−y
≤ x − y.
≤
y
|log x − log y| = log
Fissato ε > 0, basta scegliere δ = ε affinché |x − y| < δ implichi |log x − log y| <
ε, per ogni x, y ∈ [1, +∞).
188
7.8
7. Continuità
Punti di discontinuità
Teorema 7.8.1 Sia f : (a, b) → R, e sia x0 ∈ (a, b). La funzione è continua in
x0 se e solo se
lim f (x) = lim f (x) = f (x0 ).
x→x0 −
x→x0 +
Dimostrazione. Segue immediatamente dal Teorema 6.4.7.
Se f (x) non è continua in x0 si dice che x0 è un punto di discontinuità. È
opportuno tuttavia ampliare la nozione di punto di discontinuità al caso in cui
f non sia necessariamente definita in x0 .
7.8.1
Discontinuità di prima specie
Definizione 7.8.2 Sia f : (a, x0 ) ∪ (x0 , b) → R. Si dice che x0 è un punto di
discontinuità di prima specie se esistono finiti
lim f (x)
x→x0 −
e
lim f (x)
(7.8.3)
x→x0 +
ed essi sono diversi tra loro.
Si noti che non è richiesto che la funzione sia definita in x0 .
Esempi 7.8.4
1. Sia f (x) = mant x. Ogni punto x0 = n, con n intero, è un punto di
discontinuità di prima specie. In questo caso f è definita in x0 = n e si ha
lim f (x) = 0 = f (n),
lim f (x) = 1.
x→n+
x→n−
Analogamente, f (x) = [x] ha una discontinuità di prima specie in tutti i
punti con ascissa intera.
1
2. Sia f (x) = arctan , definita per x 6= 0. In questo caso x0 = 0 è un
x
punto di discontinuità di prima specie. Infatti, tenendo presente l’esempio
6.3.6.4, si ha
lim arctan
x→0−
1
π
=− ,
x
2
lim arctan
x→0+
π/2
-π/2
f (x) = arctan
1
x
1
π
= .
x
2
7.8. Punti di discontinuità
189
La quantità limx→x0 + f (x) − limx→x0 − f (x) si chiama anche salto della funzione
in x0 .
7.8.2
Discontinuità di seconda specie
Definizione 7.8.5 Sia f : (a, x0 ) ∪ (x0 , b) → R. Si dice che x0 è un punto di
discontinuità di seconda specie se almeno uno dei due limiti
lim f (x),
x→x0 −
lim f (x)
x→x0 +
non esiste o non è finito.
Anche in questo caso non è richiesto che la funzione sia definita in x0 .
Esempi 7.8.6
1. La funzione f (x) = 1/x, definita per x 6= 0, ha in x0 = 0 un punto di
discontinuità di seconda specie. Infatti
lim
x→0−
1
= −∞,
x
lim
x→0+
1
= +∞.
x
2. Sia f (x) = e1/x , definita per x 6= 0. Si ha
lim e1/x = 0,
x→0−
lim e1/x = +∞.
x→0+
Il punto x0 = 0 è un punto di discontinuità di seconda specie
1
3. Sia f (x) = sin , definita per x 6= 0. Si ha, per ogni intero n,
x
µ ¶
µ
¶
µ
¶
1
2
2
f
= 0 (n 6= 0), f
= 1, f
= −1.
nπ
π(4n + 1)
π(4n − 1)
Per il Teorema 6.6.1 la funzione non ammette limite né per x → 0+, né
per x → 0−. La figura successiva illustra il comportamento di f (x) in un
intorno di 0.
4. Sia
½
f (x) =
x se x è razionale
−x se x è irrazionale.
Questa funzione è continua solo in x0 = 0. Ogni altro punto è un punto
di discontinuità di seconda specie.
La definizione precdente si adatta al caso in cui x0 sia uno degli estremi. Se
f : (a, b) → R è tale che limx→a+ f (x) non esiste o è infinito, diremo ancora che
a è un punto di discontinuità di seconda specie. Analoga definizione vale se la
discontinuità è nell’estremo destro.
Ad esempio, la funzione f (x) = sin 1/x1/2 , definita per x > 0, ha in x0 =
0 una discontinuità di seconda specie. Il suo comportamento per valori di x
positivi e prossimi a 0 è oscillatorio e ricorda quello di sin 1/x.
190
7. Continuità
1/2π 1/π
f (x) = sin
7.8.3
1
x
Discontinuità eliminabili
Definizione 7.8.7 Sia f : (a, x0 ) ∪ (x0 , b) → R. Si dice che x0 è un punto di
discontinuità eliminabile se si verifica uno dei due seguenti casi:
a) f non è definita in x0 ma esiste finito il limite
lim f (x) = `;
x→x0
(7.8.8)
b) f è definita in x0 , esiste finito il limite (7.8.8), ma
lim f (x) = ` 6= f (x0 ).
x→x0
Esempi 7.8.9
1. Sia f (x) =
sin x
, definita per x 6= 0. Si ha
x
lim
x→0
sin x
= 1.
x
Il punto x0 = 0 è un punto di discontinuità eliminabile per f .
2
2. Sia f (x) = e−1/x , definita per x 6= 0. Poiché −1/x2 → −∞ per x → 0, si
ha
2
lim e−1/x = 0.
x→0
Il punto x0 = 0 è un punto di discontinuità eliminabile per f .
3. Negli esempi precedenti l’espressione analitica di f (x) non è definita in x0 .
Sia ora
¡
¢
f (x) = mant 1 − x2 ,
7.8. Punti di discontinuità
191
funzione definita
per¢ ogni x. Se 0 < |x| < 1, si ha 0 < (1 − x2 ) < 1 e
¡
quindi mant 1 − x2 ¡ = 1 − ¢x2 .
Se x = 0 si ha mant 1 − x2 = mant 1 = 0. Ne segue
¡
¢
¡
¢
lim mant 1 − x2 = lim 1 − x2 = 1 6= mant 1.
x→0
x→0
Il punto x0 = 0 è un punto di discontinuità eliminabile per f (x).
Se f ha in x0 un punto di discontinuità eliminabile, si può definire, o ridefinire, f (x) in x0 ponendo f (x0 ) = `. Si ottiene in tal modo una funzione continua
in x0 . Si dice in tal caso che la funzione è stata prolungata per continuità in x0 .
Ad esempio la funzione

sin x


x
f (x) =


1
se x 6= 0
se x = 0
è prolungata per continuità in x0 = 0.
La definizione precedente si adatta anche al caso in cui x0 sia un estremo di un intervallo in cui f è definita. Sia f : (x0 , b) → R. Diciamo che f
ha una discontinuità eliminabile in x0 se si verificano a) o b) della definizione
7.8.7, sostituendo a limx→x0 f (x) il limite dalla destra limx→x0 + f (x). Analoga
definizione vale se la discontinuità è nell’estremo destro.
Esempi 7.8.10
1. La funzione
¡
√ ¢
f (x) = mant 1 − x ,
definita per x ≥ 0, ha una discontinuità eliminabile in x0 = 0. Infatti
¡
¡
√ ¢
√ ¢
lim mant 1 − x = lim 1 − x = 1 6= mant 1 = 0.
x→0+
x→0+
2. La funzione
f (x) = x log x,
definita per x > 0, ha una discontinuità eliminabile in x0 = 0. Infatti si
ha
lim x log x = 0.
x→0+
In questo caso si pone f (0) = 0. La funzione risulta cosı̀ prolungata per
continuità in 0.
192
7. Continuità
1
y=mant(1-x1/2)
f(0)=0
f (x) = mant (1 −
√
1
x), 0 ≤ x < 1
1
y=xlogx
f (x) = x log x in prossimità di 0
7.9
Funzioni monotone
Definizione 7.9.1 Sia I ⊆ R un intervallo e sia f : I → R. Si dice che la
funzione è:
a) monotona crescente in senso lato, o non decrescente, in I se
∀x, y ∈ I
x < y =⇒ f (x) ≤ f (y)
b) monotona crescente in senso stretto in I se
∀x, y ∈ I
x < y =⇒ f (x) < f (y)
c) monotona decrescente in senso lato, o non crescente, in I se
∀x, y ∈ I
x < y =⇒ f (x) ≥ f (y)
7.9. Funzioni monotone
193
d) monotona decrescente in senso stretto in I se
∀x, y ∈ I
x < y =⇒ f (x) > f (y)
Esempi 7.9.2
1. Consideriamo le due funzioni, definite in R, f (x) = x e g(x) = [x]. La
prima funzione è ovviamente monotona crescente in senso stretto. La
seconda è monotona crescente in senso lato, ma non in senso stretto.
2. La funzione f (x) = sgn x (segno di x) è monotona crescente in senso lato,
ma non in senso stretto in R.
3. La funzione f (x) = x3 è monotona crescente in senso stretto in R. La
funzione f (x) = x2 è monotona decrescente in senso stretto in (−∞, 0], e
monotona crescente in senso stretto in [0, +∞).
4. La funzione f (x) = 1/x è monotona decrescente in senso stretto sia in
(−∞, 0) che in (0, +∞).
5. L’esponenziale ax = ex log a è monotona crescente in senso stretto in R se
a > 1, monotona decrescente in senso stretto se 0 < a < 1.
Chiaramente una funzione f (x) è monotona crescente in I, in senso stretto
o lato, se e solo se −f (x) è monotona decrescente in senso stretto o lato in I.
Teorema 7.9.3 Sia f : (a, b) → R (−∞ ≤ a < b ≤ +∞) monotona. Allora
esistono i limiti di f (x) per x → a+ e x → b−. Precisamente:
a) se f è monotona non decrescente, allora
lim f (x) = inf f (x),
x→a+
x∈(a,b)
lim f (x) = sup f (x).
x→b−
x∈(a,b)
b) se f è monotona non crescente, allora
lim f (x) = sup f (x),
x→a+
x∈(a,b)
lim f (x) = inf f (x).
x→b−
x∈(a,b)
Dimostrazione. Ci limitiamo a dimostrare il Teorema nel caso in cui a e b
sono numeri reali. Le modificazioni da apportare sono ovvie nel caso in cui uno
o ambedue gli estremi siano infiniti.
a) Sia f non decrescente e dimostriamo che limx→b− f (x) = supx f (x).
Se supx f (x) = +∞, fissato N > 0 esiste x0 tale che f (x0 ) > N . Posto x0 = b−δ,
la monotonia implica che per ogni x, tale che x0 = b − δ < x < b, si abbia
f (x) ≥ f (x0 ) > N,
194
7. Continuità
da cui la tesi.
Se supx f (x) = L < +∞, fissato ε > 0 esiste x0 tale che f (x0 ) > L−ε. Posto
x0 = b − δ, la monotonia implica che per ogni x, tale che x0 = b − δ < x < b, si
abbia
L − ε < f (x0 ) ≤ f (x) ≤ L.
La dimostrazione per x → a+ è analoga.
b) Poiché −f (x) è non crescente se e solo se f (x) è non decrescente, b)
segue da a).
La funzione dell’esempio 7.8.6.4 ha un’infinità non numerabile di punti di discontinuità ed essi sono di seconda specie. Per le funzioni monotone la situazione
è differente.
Teorema 7.9.4 Sia f : (a, b) → R (−∞ ≤ a < b ≤ +∞) monotona. Allora f
ha al più una infinità numerabile di punti di discontinuità ed essi sono tutti di
prima specie.
Dimostrazione. Dimostriamo dapprima che le discontinuità di una funzione
monotona sono di prima specie.
Supponiamo, per fissare le idee, che f sia non decrescente. Sia x0 ∈ (a, b) un
punto di discontinuità. Poiché f (x) è monotona non decrescente sia in (a, x0 )
che in (x0 , b), esistono finiti i limiti per x → x0 − che per x → x0 +. Poniamo
`1 = lim f (x),
x→x0 −
`2 = lim f (x).
x→x0 +
(7.9.5)
Per ogni x, y tali che x < x0 < y si ha f (x) ≤ f (x0 ) ≤ f (y). Passando al limite
per x che tende x0 − e y che tende a x0 +, si ottiene
`1 ≤ f (x0 ) ≤ `2 .
(7.9.6)
I limiti sono diversi tra loro, altrimenti
`1 = f (x0 ) = `2 ,
il che implicherebbe la continuità di f in x0 (Teorema 7.8.1).
Dimostriamo ora che l’insieme dei punti di discontinuità è al più numerabile.
Sia x0 un punto di discontinuità e consideriamo l’intervallo aperto (`1 , `2 ), ove
`1 e `2 sono come in (7.9.5).
Sia x00 > x0 un altro punto di discontinuità e sia (`01 , `02 ) l’analogo intervallo.
Evidentemente `1 < `2 ≤ `01 < `02 . Quindi
(`1 , `2 ) ∩ (`01 `02 ) = ∅.
(7.9.7)
Associamo a ogni punto x0 di discontinuità un numero razionale r(x0 ) ∈ (`1 , `2 ).
Per (7.9.7), a punti di discontinuità diversi corrispondono razionali diversi.
Quindi l’insieme dei punti di discontinuità è in corrispondenza biunivoca con
un sottoinsieme dei razionali. Tale sottoinsieme è finito o numerabile per il
Teorema 2.6.3.
7.9. Funzioni monotone
195
Osservazione. Se f è definita in un intervallo chiuso o semichiuso, le
eventuali discontinuità agli estremi sono eliminabili.
Sia ad esempio f : [a, b) → R monotona non decrescente. Se x0 = a è un
punto di discontinuità, per il Teorema 7.9.3 esiste limx→a+ f (x). Tale limite
deve essere finito, poiché f (x) ≥ f (a), e diverso da f (a). Quindi
lim f (x) = ` > f (a).
x→a+
Chiaramente un analogo ragionamento vale se x0 = b o se f è monotona non
crescente.
l'2=f(x'0)
l'1
l2
f(x0)
l1
f(a)
a
x0
x'0
b
Discontinuità di una funzione monotona in [a, b)
Sia I ⊆ R un intervallo e sia f : I → R una funzione continua, che supponiamo non costante. L’immagine J = f (I) è un intervallo, per il Teorema
di Darboux. Se, oltre che continua, f è strettamente monotona, crescente o
decrescente, allora f è chiaramente una applicazione biunivoca di I su J. Vale
anche la proprietà inversa.
Teorema 7.9.8 Sia I ⊆ R un intervallo e sia f : I → R una applicazione
continua in I. Sia J = f (I). Se f applica biunivocamente I su J allora f è
strettamente monotona.
Dimostrazione. Supponiamo dapprima I = [a, b]. Sia, per fissare le idee,
f (a) < f (b). Dimostriamo che f è monotona strettamente crescente.
Sia x tale che a < x < b. Se, per assurdo, f (x) < f (a), avremmo f (x) <
f (a) < f (b). Per il Teorema dei valori intermedi dovrebbe esistere x0 ∈ (x, b)
tale che f (x0 ) = f (a), negando la biunivocità. Quindi deve essere f (a) < f (x).
In modo analogo si dimostra che f (x) < f (b). Quindi
f (a) < f (x) < f (b).
Sia ora y tale che x < y < b. Applicando lo stesso ragionamento all’intervallo
[x, b], otteniamo che f (x) < f (y) < f (b). Quindi f è monotona crescente in
senso stretto.
196
7. Continuità
Sia ora I un intervallo di tipo qualunque e siano a < b due punti di I.
Supponiamo, per fissare le idee, f (a) < f (b). La restrizione di f a [a, b] è
ancora continua e biunivoca tra [a, b] e f ([a, b]) e quindi è monotona strettamente
crescente. Per lo stesso motivo, dati due punti x ≤ a < b ≤ y, la restrizione di
f a [x, y] ⊇ [a, b] è strettamente monotona, e necessariamente crescente, dato
che f (a) < f (b). Quindi deve essere f (x) < f (y) per ogni x < y.
Il Teorema appena dimostrato, assieme all’osservazione che lo precede,
caratterizza le funzioni continue e iniettive definite in un intervallo di R.
7.10
Continuità della funzione inversa
Dati due spazi metrici (X1 , d1 ), (X2 , d2 ) e una funzione continua e biunivoca
f : X1 → X2 , la funzione inversa f −1 : X2 → X1 non è necessariamente
continua (si veda l’appendice per un controesempio). Tuttavia, i risultati del
precedente paragrafo permettono di dimostrare la continuità di f −1 se X1 e X2
sono intervalli reali. Iniziamo con un Lemma.
Lemma 7.10.1 Sia I ⊆ R un intervallo e sia f : I → R una funzione strettamente monotona. Allora f (I) è un intervallo se e solo se f è continua.
Dimostrazione. Se f è continua allora f (I) è un intervallo, per il Teorema di
Darboux. Viceversa, supponiamo che f (I) sia un intervallo e supponiamo, per
assurdo, che x0 ∈ I sia un punto di discontinuità. Ragioniamo nel caso in cui x0
sia interno a I, poiché la dimostrazione si adatta facilmente al caso in cui x0 sia
un estremo di I. Supponiamo anche, per fissare le idee, che f sia strettamente
crescente.
Per il Teorema 7.9.4, x0 è un punto di discontinuità di prima specie. Poniamo
quindi
`1 = lim f (x) < lim f (x) = `2 .
x→x0 −
x→x0 +
Per ogni x1 < x0 < x2 si ha
f (x1 ) < `1 ≤ f (x0 ) ≤ `2 < f (x2 ).
Possiamo quindi concludere che:
a) [`1 , `2 ] ⊂ [f (x1 ), f (x2 )];
b) [`1 , `2 ] non è contenuto in f (I), poiché f (x0 ) è l’unico valore della funzione
appartenente a [`1 , `2 ].
D’altra parte, f (I) è un intervallo e quindi [f (x1 ), f (x2 )] ⊆ f (I), in contraddizione con a) e b).
Se f non è monotona, può accadere che f (I) sia un intervallo anche se f non
è continua. Ad esempio f (x) = mant x non è continua in R, ma f (R) = [0, 1).
7.11. Appendice
197
Teorema 7.10.2 Siano I e J intervalli in R. Sia f : I → J continua in I e
biunivoca. Allora la funzione inversa f −1 : J → I è continua in J.
Dimostrazione. Per il Teorema 7.9.8 f è strettamente monotona. Allora anche
f −1 è strettamente monotona. Infatti sia, per fissare le idee, f strettamente
crescente e sia y1 = f (x1 ) < y2 = f (x2 ). Allora non può essere x1 = f −1 (y1 ) ≥
x2 = f −1 (y2 ), altrimenti si avrebbe f (x1 ) ≥ f (x2 ).
Poiché f −1 (J) = I è un intervallo, la continuità di f −1 segue dal Lemma
precedente.
Come conseguenza di questo Teorema sono continue in ogni punto del loro
insieme di definizione le funzioni
arctan x,
7.11
7.11.1
arcsin x,
arccos x.
Appendice
Continuità della funzione inversa in spazi metrici
Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici e sia f : X1 → X2 continua e biunivoca.
La funzione inversa f −1 : X2 → X1 non è necessariamente continua. Sia ad
esempio
©
ª
X1 = [0, 2π) e X2 = (x, y) ∈ R2 : x2 + y 2 = 1
ambedue dotati della metrica euclidea indotta. Sia, per ogni θ ∈ [0, 2π),
f (θ) = (cos θ, sin θ) .
La funzione f applica biunivocamente X1 su X2 ed è continua, poiché ambedue
le coordinate lo sono. La funzione inversa associa ad ogni vettore (x, y) della
circonferenza trigonometrica l’angolo θ ∈ [0, 2π) formato (in senso antiorario)
dall’asse delle ascisse con il vettore stesso. Tale funzione non è continua in (0, 0).
Infatti, data una successione (xn , yn ) ∈ X2 convergente a (0, 0), i corrispondenti
angoli θn convergono a 0 se yn > 0, mentre convergono a a 2π se yn < 0.
Se X1 è compatto si può tuttavia dimostrare la continuità di f −1 .
Teorema 7.11.1 Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici e sia f : X1 → X2
continua e biunivoca. Se X1 è compatto, allora f −1 è continua.
Dimostrazione. Per il Corollario 7.3.3 applicato a f −1 , basta dimostrare che,
per ogni chiuso F ⊆ X1 , la controimmagine
¡ −1 ¢−1
(F ) = f (F )
f
è chiusa in X2 . Poiché X1 è compatto e F ⊆ X1 è chiuso, F è compatto. Per
la continuità di f l’immagine f (F ) è compatta e quindi chiusa.
198
7. Continuità
7.11.2
Uniforme continuità. Funzioni lipschitziane e hölderiane.
Come abbiamo notato, il Teorema di Heine–Cantor fornisce una condizione
sufficiente, ma non necessaria, per l’uniforme continuità. Un’altra condizione
sufficiente è la condizione di Lipschitz.
Definizione 7.11.2 Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici e sia f : X1 → X2 .
Si dice che f soddisfa la condizione di Lipschitz (o che è lipschitziana) se esiste
una costante K > 0 tale che per ogni x, y ∈ X1 si abbia
d2 (f (x), f (y)) ≤ Kd1 (x, y).
(7.11.3)
Una funzione lipschitziana f è anche uniformemente continua. Infatti, fissato
ε > 0, basta scegliere δ < ε/K perché ogni coppia di punti x, y ∈ X1 , aventi tra
loro distanza minore di δ, verifichi d2 (f (x), f (y)) < ε.
Abbiamo visto nel paragrafo 7.6 che la funzione log(1 + x) è lipschitziana
in [1, +∞). Diamo altri, esempi limitandoci per semplicità a funzioni a valori
reali.
Esempi 7.11.4
1. Sia f : R2 → R un polinomio di primo grado, cioè della forma
f (x, y) = ax + by + c
ove a, b, c sono costanti. Si ha, per ogni coppia di punti (x, y) e (x0 , y0 ),
|f (x, y) − f (x0 , y0 )| ≤ |a| |x − x0 | + |b| |y − y0 |
≤ (|a| + |b|) k(x, y) − (x0 , y0 )k .
Quindi (7.11.3) vale con K = |a| + |b|.
2. Sia f (x) = sin x. Si ha
¯
¶¯ ¯ µ
¶¯
µ
¯
x + y ¯¯ ¯¯
x − y ¯¯
|sin x − sin y| = 2 ¯¯cos
sin
¯¯
¯
2
2
¯
¯
¯
x − y ¯¯
≤ 2 ¯¯sin
≤ |x − y| .
2 ¯
Quindi sin x è lipschitziana in R.
Una generalizzazione della condizione di Lipschitz è la condizione di Hölder.
Ci limitiamo per semplicità al caso reale.
Definizione 7.11.5 Sia f : (a, b) → R. Sia α un numero reale, 0 < α ≤ 1. Si
dice che f soddisfa la condizione di Hölder di ordine α (o che è α–hölderiana)
se esiste una costante K > 0 tale che per ogni x, y ∈ (a, b) si abbia
α
|f (x) − f (y)| ≤ K |x − y| .
(7.11.6)
7.11. Appendice
199
-1Una funzione α–hölderiana è uniformemente continua. Infatti, fissato ε >
1/α
0, basta scegliere δ < (ε/K)
perché ogni coppia di punti x, y ∈ (a, b), aventi
tra loro distanza minore di δ, verifichi |f (x) − f (y)| < ε.
Un esempio di funzioni che soddisfano la condizione di Hölder di ordine α
α
in R è fornito dalle funzioni f (x) = |x| , con 0 < α ≤ 1. Per dimostrare ciò,
osserviamo innanzi tutto che per ogni 0 ≤ t ≤ 1 vale la diseguaglianza
α
(1 + t) ≤ 1 + t ≤ 1 + tα .
(7.11.7)
Siano ora x e y reali, non entrambi nulli, e supponiamo ad esempio |x| ≥ |y|. Si
ha, applicando (7.11.7) con t = |y|/|x|,
¯ y ¯´ α
³
¯ ¯
α
α
α
|x + y| ≤ (|x| + |y|) = |x| 1 + ¯ ¯
x
¯ y ¯α ´
³
¯ ¯
α
α
α
≤ |x| 1 + ¯ ¯ = |x| + |y| .
x
Quindi
α
α
α
α
|x| = |x − y + y| ≤ |x − y| + |y| ,
α
α
α
α
α
da cui |x| − |y| ≤ |x − y| . Scambiando i ruoli di x e y si ha |y| − |x| ≤
α
|x − y| e quindi
α
α
α
||x| − |y| | ≤ |x − y| .
Quindi (7.11.6) vale con K = 1.
Il prodotto di funzioni uniformemente continue non è in generale uniformemente continuo. Infatti, f (x) = x è uniformemente continua in R, mentre
f (x)f (x) = x2 non lo è. Questo esempio mostra anche che il prodotto di funzioni lipschitziane in generale non è lipschitziano. Tuttavia, la composizione di
funzioni uniformemente continue è uniformemente continua.
Teorema 7.11.8 Siano (X1 , d1 ), (X2 , d2 ) e (X3 , d3 ) spazi metrici. Sia f :
X1 → X2 uniformemente continua e g : X2 → X3 uniformemente continua.
Allora g ◦ f è uniformemente continua.
Dimostrazione. Per ogni ε > 0 esiste σ > 0 tale che per ogni y1 , y2 ∈ X2 , tali
che d2 (y1 , y2 ) < σ, si abbia
d2 (g(y1 ), g(y2 )) < ε.
Per ogni σ > 0 esiste δ > 0 tale che per ogni x1 , x2 ∈ X1 , tali che d1 (x1 , x2 ) < δ,
si abbia
d2 (f (x1 ), f (x2 )) < σ.
Quindi, da d1 (x1 , x2 ) < δ segue
d3 (g(f (x1 )), g(f (x2 )) < ε.
Capitolo 8
Calcolo differenziale
8.1
Introduzione
Il problema della determinazione della tangente geometrica ad una curva piana condusse Newton e Leibniz a formulare i concetti fondamentali del calcolo
differenziale nella seconda metà del secolo XVII. Un secolo e mezzo dopo, Louis
Augustin Cauchy precisò la definizione di derivata mediante la nozione di limite,
da lui formulata nel 1823.
Sia f : (a, b) → R e sia x0 ∈ (a, b). Sia x0 + h, con h 6= 0, un altro punto di
(a, b). Si chiama rapporto incrementale della funzione f , con punto iniziale x0
e incremento h della variabile indipendente, la quantità
f (x0 + h) − f (x0 )
.
h
(8.1.1)
Il significato geometrico del rapporto incrementale è evidente: esso costituisce
il coefficiente angolare della retta passante per i punti del piano di coordinate
( x0 , f (x0 )) e (x0 + h, f (x 0 + h)). Tale retta è chiamata retta secante al grafico
della funzione. Per ogni h fissato, la secante ha equazione
y = f (x0 ) +
f (x0 + h) − f (x0 )
(x − x0 ) .
h
(8.1.2)
Se la funzione è derivabile (secondo la definizione che verrà precisata tra poco),
al tendere di h a 0 il punto (x0 + h, f (x 0 + h)) tende al punto ( x0 , f (x0 )) e
la retta secante ruota attorno al punto fisso ( x0 , f (x0 )), tendendo a disporsi in
una posizione limite, che è appunto la tangente geometrica al grafico di f in
( x0 , f (x0 )).
Da un punto di vista geometrico il rapporto incrementale rappresenta quindi
la pendenza della retta secante. Da un punto di vista analitico esso rappresenta
la velocità media (o il tasso medio) di variazione della quantità f (x) nell’intervallo [x0 , x0 + h] (o [x0 + h, x0 ], se h < 0). Qualora la funzione rappresenti
una quantità fisica, il rapporto incrementale è la velocità media di variazione
di questa quantità. Se, ad esempio, f (x) rappresenta lo spazio percorso da un
punto mobile su una retta al tempo x, il rapporto incrementale rappresenta la
201
202
8. Calcolo differenziale
velocità media del punto nell’intervallo di tempo suddetto. Se f (x) rappresenta
la quantità di carica elettrica che passa per una sezione di filo ad un certo tempo
x, il rapporto incrementale rappresenta l’intensità media di corrente etc.
f(x0+h)
P
retta secante
retta tangente
Q
f(x0)
R
x0+h
x0
Retta secante e retta tangente
8.2
Derivata e differenziale
Definizione 8.2.1 Sia f : (a, b) → R e sia x0 ∈ (a, b). Si dice che la funzione
è derivabile in x0 se esiste finito il limite del rapporto incrementale per h → 0.
Tale limite si indica con f 0 (x0 ) e si chiama derivata di f in x0 .
Si ha dunque, se f è derivabile in x0 ,
f 0 (x0 ) = lim
h→0
f (x0 + h) − f (x0 )
.
h
(8.2.2)
Posto x = x0 + h, il rapporto incrementale assume la forma equivalente
f (x) − f (x0 )
x − x0
(8.2.3)
per ogni x ∈ (a, b) e x 6= x0 . Chiaramente, la relazione h → 0 equivale alla
relazione x → x0 . Quindi (8.2.2) equivale a
f 0 (x0 ) = lim
x→x0
f (x) − f (x0 )
.
x − x0
(8.2.4)
Nel seguito useremo indifferentemente l’espressione (8.2.2) o la (8.2.4). Altri
simboli per denotare la derivata della funzione y = f (x) in x0 sono i seguenti:
Df (x0 ),
df
(x0 ),
dx
dy
(x0 ), y 0 (x0 ).
dx
(8.2.5)
Le funzioni elementari dell’analisi sono derivabili in tutti i punti del loro insieme
di definizione, eccetto al più punti isolati, come vedremo più avanti.
8.2. Derivata e differenziale
203
Il significato geometrico della derivata appare evidente dalle considerazioni
svolte nel primo paragrafo. Se il rapporto incrementale tende a un limite finito,
il coefficiente angolare della secante tende al coefficiente angolare di una retta
che interpreteremo come retta tangente al grafico in (x0 , f (x0 )).
Definizione 8.2.6 Sia f : (a, b) → R derivabile in x0 ∈ (a, b). Si chiama retta
tangente al grafico della funzione in ( x0 , f (x0 )) la retta
y = f (x0 ) + f 0 (x0 ) (x − x0 ).
Sia ad esempio f (x) = x2 e sia x0 un punto qualunque di R. Si ha
f (x0 + h) − f (x0 )
(x0 + h)2 − x20
2x0 h + h2
=
=
h
h
h
= 2x0 + h.
0
Passando
¡
¢al limite per h → 0 si ottiene f (x0 ) = 2x0 . La tangente alla parabola
2
in x0 , x0 ha dunque equazione
y = x20 + 2x0 (x − x0 ).
Dal punto di vista analitico, la derivata rappresenta la velocità istantanea
di variazione di f (x) in x0 . Ad esempio, se f è la legge del moto di un punto
su una retta, f 0 (x0 ) rappresenta la velocità istantanea del punto al tempo x0 .
Se f (x) rappresenta la quantità di carica elettrica che passa per una sezione di
filo ad un certo tempo x, f 0 (x0 ) rappresenta l’intensità istantanea di corrente
al tempo x0 .
La derivata destra e la derivata sinistra in punto x0 si definiscono in modo
naturale.
Definizione 8.2.7 Sia f : [x0 , b) → R (oppure f : (a, x0 ] → R). Si dice che f
è derivabile dalla destra in x0 (rispettivamente, dalla sinistra) se esiste finito il
limite
lim
h→0+
f (x0 + h) − f (x0 )
h
(rispettivamente, lim
h→0−
f (x0 + h) − f (x0 )
).
h
(8.2.8)
Tali limiti vengono chiamati rispettivamente derivata destra e derivata sinistra di f in x0 , e vengono denotati con uno dei simboli
0
f+
(x0 ), D+ f (x0 ) per la derivata destra
0
f−
(x0 ), D− f (x0 ) per la derivata sinistra
o con simboli analoghi a quelli in (8.2.5). I due rapporti incrementali in (8.2.8)
vengono chiamati rapporto incrementale destro e sinistro, rispettivamente.
È altresı̀ chiaro che f : (a, b) → R è derivabile in x0 ∈ (a, b) se e solo se è
derivabile dalla destra e dalla sinistra e
D+ f (x0 ) = D− f (x0 ) = Df (x0 ).
204
8. Calcolo differenziale
Se f è derivabile dalla destra in x0 si dice semitangente destra al grafico in
( x0 , f (x0 )) la semiretta
0
y = f (x0 ) + f+
(x0 )(x − x0 ),
x ≥ x0 .
Analoga definizione sussiste per la semitangente sinistra.
Definizione 8.2.9 Sia f : (a, b) → R. Diciamo che f è derivabile in (a, b) se
f è derivabile in ogni punto x ∈ (a, b).
Sia f : [a, b] → R. Diciamo che f è derivabile in [a, b] se f è derivabile in
ogni punto interno ed esiste la derivata destra in a e la derivata sinistra in b.
Se f è derivabile in un intervallo I, la funzione che associa ad ogni x ∈ I
la derivata f 0 (x) viene chiamata funzione derivata. Ad esempio, abbiamo visto
che f (x) = x2 è derivabile in R e che la sua funzione derivata è f 0 (x) = 2x.
La nozione di derivabilità in un punto è più forte di quella di continuità. Si
ha infatti il seguente risultato.
Teorema 8.2.10 Sia f : [a, b] → R e sia x0 ∈ [a, b]. Se f è derivabile in x0 ,
allora f è continua in x0 .
Dimostrazione. Poiché
lim
x→x0
si ha
f (x) − f (x0 )
= f 0 (x0 ),
x − x0
f (x) − f (x0 )
= f 0 (x0 ) + o(1).
x − x0
Moltiplicando ambo i lati di questa eguaglianza per (x − x0 ) si ottiene
f (x) − f (x0 ) = (x − x0 ) f 0 (x0 ) + (x − x0 ) o(1)
(8.2.11)
Al tendere di x a x0 il termine a destra in (8.2.11) tende a 0 e quindi f (x) →
f (x0 ) per x → x0 .
Osservazion¿. La derivabilità di f in un punto implica la continuità in quel
punto, ma non vale l’implicazione inversa. Ad esempio, la funzione f (x) = |x|
è continua in x0 = 0 ma non è ivi derivabile. Infatti si ha
½
f (x) − f (0)
|x|
1
per x > 0
=
=
(8.2.12)
−1 per x < 0
x
x
La funzione non è derivabile in 0 perché
1 = D+ f (0) 6= D− f (0) = −1.
Se f : [a, b] → R è una funzione derivabile in x0 ∈ [a, b], allora vale la
relazione (8.2.11). Poiché
(x − x0 ) o(1) = o (x − x0 )
8.3. Tangente verticale, punti angolosi, cuspidi
205
la formula (8.2.11) si riscrive come
f (x) − f (x0 ) = (x − x0 ) f 0 (x0 ) + o (x − x0 ) .
(8.2.13)
Questa formula assume il nome di prima formula dell’incremento finito. Essa
esprime l’incremento della funzione, al passaggio della variabile indipendente
da x0 a x, come somma di due termini. Il primo termine è funzione lineare
dell’incremento (x − x0 ), il secondo è un infinitesimo di ordine superiore rispetto
a (x − x0 ).
Riscrivendo la (8.2.13) come
f (x) = f (x0 ) + (x − x0 ) f 0 (x0 ) + o (x − x0 ) ,
vediamo che, in un intorno di x0 , f (x) è approssimata dall’ordinata della tangente al grafico a meno di un infinitesimo di ordine superiore.
Con riferimento alla figura del primo paragrafo, l’incremento della funzione
è la lunghezza del segmento RP , il termine lineare (x − x0 ) f 0 (x0 ) è la lunghezza
del segmento RQ e o (x − x0 ) è la lunghezza del segmento QP .
Poniamo
df = (x − x0 ) f 0 (x0 ).
La quantità df si chiama il differenziale di f in x0 relativo all’incremento
(x − x0 ).
Nel simbolismo di Leibniz, gli incrementi ‘infinitesimi’ di una variabile, dipendente o indipendente, venivano indicati con la lettera d. Quindi df per l’incremento ‘infinitesimo’ della funzione, dx per l’incremento ‘infinitesimo’ della x.
Il differenziale diventa
df = f 0 (x0 )dx,
da cui la notazione
8.3
df
per la derivata.
dx
Tangente verticale, punti angolosi, cuspidi
Abbiamo definito la derivata in x0 come limite finito del rapporto incrementale.
Questo implica che la tangente al grafico in (x0 , f (x0 )) ha coefficiente angolare
finito e quindi non può avere equazione x = x0 . Completiamo la definizione di
tangente al grafico includendo il caso in cui il limite del rapporto incrementale
è infinito.
Definizione 8.3.1 Sia f : (a, b) → R e sia f continua in x0 ∈ (a, b). Si dice
che il grafico di f ha in (x0 , f (x0 )) tangente verticale (o che x0 è un punto di
tangente verticale) se si verifica una delle due relazioni:
lim
x→x0
f (x) − f (x0 )
= +∞
x − x0
oppure
lim
x→x0
f (x) − f (x0 )
= −∞.
x − x0
(8.3.2)
In tal caso la retta x = x0 si chiama tangente al grafico di f in (x0 , f (x0 )).
206
8. Calcolo differenziale
Si noti che nella definizione precedente si richiede a priori che f sia continua
in x0 . In questo modo si escludono casi come quello di sign x, che ha in x0 = 0
una discontinuità di prima specie ed è tale che il rapporto incrementale con
punto iniziale 0 tende a +∞.
Esempi 8.3.3
1. Sia f (x) =
√
3
x e sia x0 = 0. Si ha, per x → 0,
√
3
1
f (x) − f (x0 )
x
= √
=
→ +∞.
3
x − x0
x
x2
2. Sia f (x) = x log |x|, ove la funzione è prolungata per continuità in x = 0
ponendo f (0) = 0. Per x → 0 si ha
f (x) − f (0)
= log |x| → −∞.
x
In ambedue gli esempi precedenti la retta x = 0 è la tangente verticale in
(0, 0).
Sottolineiamo il fatto che, nel caso in cui valga (8.3.2), la funzione non
è derivabile in x0 . La derivabilità equivale al fatto che il limite del rapporto
incrementale è finito.
Tangente verticale in (0, 0)
Se f : [x0 , b) → R (oppure f : (a, x0 ] → R) e se il rapporto incrementale
destro (rispettivamente, sinistro) tende a +∞ o a −∞, diremo che la semiretta
x = x0 , y ≥ y0 , è la semitangente verticale destra (rispettivamente,
sinistra)
√
al grafico in (x0 , f (x0 )). Ad esempio, la funzione y = x, definita per x ≥ 0,
ammette il semiasse positivo delle ordinate come semitangente verticale destra
in (0, 0). Si ha infatti
√
x
1
lim
= lim √ = +∞.
x→0+ x
x→0+
x
Definizione 8.3.4 Sia f : (a, b) → R e sia x0 ∈ (a, b). Si dice che il grafico
di f ha in (x0 , f (x0 )) un punto angoloso (o che x0 è un punto angoloso) se si
verifica uno dei seguenti casi:
8.3. Tangente verticale, punti angolosi, cuspidi
207
0
0
a) esistono f+
(x0 ) e f−
(x0 ) ed esse sono diverse tra loro;
0
b) f è continua in x0 , esiste f+
(x0 ) e il rapporto incrementale sinistro tende
a +∞ o a −∞;
0
c) f è continua in x0 , esiste f−
(x0 ) e il rapporto incrementale destro tende a
+∞ o a −∞.
In un punto angoloso le semitangenti destra e sinistra esistono e formano un
angolo non piatto e non nullo.
Definizione 8.3.5 Sia f : (a, b) → R continua in x0 ∈ (a, b). Si dice che il
grafico di f ha in (x0 , f (x0 )) una cuspide (o che x0 è un punto di cuspide) se
f (x) − f (x0 )
= +∞
x − x0
e
f (x) − f (x0 )
= −∞
x→x0 −
x − x0
e
lim
x→x0 −
lim
x→x0 +
f (x) − f (x0 )
= −∞,
x − x0
oppure
lim
f (x) − f (x0 )
= +∞.
x→x0 +
x − x0
lim
π
-x
y=
/2
y=
xπ
/2
In una cuspide le semitangenti destra e sinistra sono ambedue verticali e formano
un angolo nullo.
Le funzioni f (x) = x arctan x1 e f (x) = |x|
Esempi 8.3.6
1. Sia f (x) = |x| e sia x0 = 0. Il punto x0 = 0 è angoloso. Infatti, abbiamo
0
0
visto in (8.2) che f+
(0) = 1 e f−
(0) = −1. Le semitangenti destra e
sinistra sono le semirette y = x, con x ≥ 0, e y = −x, con x ≤ 0.
2. Sia
(
f (x) =
x arctan
0
1
x
per x 6= 0
per x = 0
1
Questa funzione è ottenuta prolungando per continuità x arctan in x0 =
x
0. Il punto x0 = 0 è angoloso. Infatti
1
π
f (x) − f (0)
= arctan → ±
per x → 0 ± .
x
x
2
0
0
Quindi f+
(0) = π/2 e f−
(0) = −π/2. Le semitangenti destra e sinistra
sono le semirette y = xπ/2, con x ≥ 0, e y = −xπ/2, con x ≤ 0.
208
8. Calcolo differenziale
3. Sia f (x) definita come
½
f (x) =
x
√
x
per x ≤ 0
per x > 0
Questa funzione presenta un punto angoloso in x0 = 0. Si ha infatti

per x < 0
f (x) − f (0)  1
1
=
per x > 0
 √
x
x
0
(0) = 1, mentre il rapporto incrementale destro tende a
In questo caso f−
+∞. La semitangente destra è la semiretta x = 0, con y ≥ 0, mentre la
semitangente sinistra è la semiretta y = x, con x ≤ 0.
p
4. Sia f (x) = |x|. Il punto x0 = 0 è di cuspide. Infatti





1
√
x
f (x) − f (0)
=

x

1

 −√
−x
per x > 0
per x < 0
Ne segue
f (x) − f (0)
= +∞
x
f (x) − f (0)
= −∞
lim
x→0−
x
lim
x→0+
y=x1/2
y=x
8.4
cuspide
nell'origine
Regole di derivazione
Teorema 8.4.1 Siano f e g due funzioni definite in [a, b] a valori in R, derivabili in x0 ∈ [a, b]. Siano c1 e c2 costanti. Allora sono derivabili in x0 le
funzioni
f
(g(x) 6= 0) .
c1 f + c2 g,
f · g,
g
8.4. Regole di derivazione
209
Si ha
0
(c1 f + c2 g) (x0 ) = c1 f 0 (x0 ) + c2 g 0 (x0 )
0
(f · g) (x0 ) = f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 )
µ ¶0
f
f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 )
(x0 ) =
g
g(x0 )2
Dimostrazione. Iniziamo dalla somma. Si ha, per x → x0 ,
f (x) + g(x) − f (x0 ) − g (x0 )
f (x) − f (x0 ) g(x) − g(x0 )
=
+
→ f 0 (x0 ) + g 0 (x0 ).
x − x0
x − x0
x − x0
Ora la derivata del prodotto. Si ha, aggiungendo e sottraendo f (x0 )g(x),
f (x) − f (x0 )
g(x) − g(x0 )
f (x)g(x) − f (x0 )g (x0 )
=
g(x) + f (x0 )
.
x − x0
x − x0
x − x0
Poiché g è derivabile in x0 , essa è ivi continua. Quindi g(x) → g(x0 ) per x → x0 .
Ne segue, per x → x0 ,
f (x) − f (x0 )
g(x) → f 0 (x0 )g(x0 )
x − x0
g(x) − g(x0 )
f (x0 )
→ f (x0 )g 0 (x0 ).
x − x0
Mediante una simile manipolazione dimostriamo la formula per la derivata del
quoziente. Si ha
µ
¶
1
f (x) f (x0 )
1 f (x)g(x0 ) − f (x0 )g (x)
−
=
x − x0 g(x)
g(x0 )
x − x0
g(x)g(x0 )
Come prima si ha g(x) → g(x0 ) per x → x0 , poiché g è continua in x0 . Quindi
g(x)g(x0 ) → g(x0 )2 . Inoltre si ha, per x → x0 ,
f (x)g(x0 ) − f (x0 )g (x)
f (x) − f (x0 )
g(x) − g(x0 )
=
g(x0 ) − f (x0 )
x − x0
x − x0
x − x0
→ f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 ).
Il Teoema è cosı̀ completamente dimostrato.
Teorema 8.4.2 (di derivazione della funzione inversa) Siano I e J intervalli in R. Sia f : I → J continua in I e biunivoca. Sia f derivabile in
x0 ∈ I e sia y0 = f (x0 ). Se f 0 (x0 ) 6= 0, allora la funzione inversa f −1 è
derivabile in y0 e si ha
1
.
Df −1 (y0 ) =
Df (x0 )
210
8. Calcolo differenziale
Dimostrazione. Per ogni y ∈ J, y 6= y0 sia x tale che y = f (x). Si ha
f −1 (y) − f −1 (y0 )
x − x0
=
.
y − y0
f (x) − f (x0 )
Poiché f −1 è continua, per y → y0 si ha x → x0 e, per la continuità di f ,
f (x) → f (x0 ). Quindi
lim
y→y0
f −1 (y) − f −1 (y0 )
1
= 0
.
y − y0
f (x0 )
Teorema 8.4.3 (di derivazione della funzione composta) Siano I, J ⊆ R
intervalli. Sia f : I → J derivabile in x0 ∈ I. Sia g : J → R derivabile in
y0 = f (x0 ). Allora la funzione composta g ◦ f è derivabile in x0 e si ha
D (g ◦ f ) (x0 ) = g 0 (f (x0 )) f 0 (x0 ).
Dimostrazione. Poiché g è derivabile in y0 si ha
g(y) − g(y0 )
= g 0 (y0 ) + o(1)
y − y0
ove o(1) → 0 per y → y0 . Moltiplicando ambo i lati per y − y0 si ottiene
g(y) − g(y0 ) = (y − y0 ) (g 0 (y0 ) + o(1)) .
(8.4.4)
Poniamo y = f (x) e y0 = f (x0 ) in (8.4.4) e dividiamo per x − x0 . Si ottiene
g (f (x)) − g(f (x0 ))
f (x) − f (x0 ) 0
=
(g (y0 ) + o(1)) .
x − x0
x − x0
(8.4.5)
Si osservi ora che o(1) è una funzione di y − y0 , infinitesima per y → y0 . Poiché
f è continua in x0 (in quanto derivabile), si ha
y = f (x) → y0 = f (x0 )
per x → x0
e quindi o(1) → 0 per x → x0 . Passando al limite per x → x0 in (8.4.5) si
ottiene
g (f (x)) − g(f (x0 ))
→ f 0 (x0 )g 0 (f (x0 )) .
x − x0
Una funzione definita in un intervallo (−M, M ) si dice pari se f (x) = f (−x)
per ogni x ∈ (−M, M ). Si dice dispari se f (x) = −f (−x) per ogni x ∈ (−M, M ).
Ad esempio, la funzione f (x) = x2 è pari, mentre la funzione f (x) = x3 è dispari.
Il grafico di una funzione pari è simmetrico rispetto all’asse delle ordinate,
mentre il grafico di una funzione dispari è simmetrico rispetto all’origine.
8.5. Derivate delle funzioni elementari
211
Teorema 8.4.6 Sia f : (−M, M ) → R pari, oppure dispari. Sia f derivabile
in x0 ∈ (−M, M ). Allora f è derivabile in −x0 e si ha
f 0 (−x0 ) = −f 0 (x0 )
f 0 (−x0 ) = f 0 (x0 )
se f è pari
se f è dispari.
Dimostrazione. Si ha
f (−x0 + h) − f (−x0 )
f (x0 − h) − f (x0 )
=∓
h
−h
ove vale il segno − se f è pari, il segno + se è dispari. Passando al limite per
h → 0 si ha l’asserto.
Corollario 8.4.7 Sia f : (−M, M ) → R derivabile in ogni punto x ∈ (−M, M ).
Se f è pari la sua funzione derivata f 0 (x) è una funzione dispari. Se f è dispari
la sua funzione derivata f 0 (x) è una funzione pari.
8.5
Derivate delle funzioni elementari
Le funzioni elementari dell’analisi sono derivabili in ogni punto del loro insieme
di definizione, con le possibili eccezioni di punti isolati. Qui di seguito ricaviamo
la tabella di derivazione.
8.5.1
Potenze e radici
Sia f (x) = c, ove c è una qualunque costante reale. In questo caso il rapporto
incrementale è sempre nullo. Ne segue
Dc = 0
Sia f (x) = xα , con x > 0. Si ha, per h → 0,
µ
¶α
h
1+
−1
α
(x + h) − xα
x
= xα
h
µ h ¶α
h
1+
−1
x
α−1
=x
h
x
→ αxα−1
Quindi
Dxα = αxα−1
α reale
212
8. Calcolo differenziale
Se x = 0 e α > 1 si per h → 0+
hα
= hα−1 → 0.
h
Se 0 < α < 1 il rapporto incrementale tende a +∞.
Sia f (x) = xn con n > 0 intero e x reale qualunque. Lo stesso calcolo
effettuato nel caso precedente mostra che
n
(x + h) − xn
→ nxn−1
h
e la stessa formula vale per se n è un intero negativo e x 6= 0.
Dxn = nxn−1
n intero
In particolare si √
ha Dx = 1.
√
Sia f (x) = n xm . Se x > 0 si ha n xm = xm/n e quindi, per il punto
precedente,
√
m
m√
n
D n xm = x(m/n)−1 =
xm−n .
n
n
Ad esempio si ha, per x > 0,
√
√
1
3
4
D x= √ ,
D x3 = √
.
2 x
44x
√
Se n è dispari, la funzione f (x) = n xm è definita
per ogni x 6= 0 e, se m/n > 0,
√
è definita anche in x = 0. In particolare, n xm è una funzione pari se m è pari
(m 6= 0), dispari se m è dispari. Quindi f è derivabile in x < 0 per il Teorema
8.4.6 e si ha
q
√
mn
m√
n
m−n
D n xm = −
(−x)
=
xm−n
se m è pari,
nq
n
√
mn
m√
n
m−n
D n xm =
(−x)
=
xm−n
se m è dispari.
n
n
Si ha quindi, se n è dispari e m intero qualunque
D
√
n
xm =
m√
n
xm−n
n
m e n interi, n dispari
Questa espressione vale anche in 0 se m > n. Ad esempio, si ha per ogni
x 6= 0,
√
√
√
1
2
5√
3
5
3
2 = √
5 =
x
x
x2
D3x= √
,
D
,
D
3
5
2
3
3
3 x
5 x
e l’ultima eguaglianza vale anche in x = 0.
8.5. Derivate delle funzioni elementari
213
√
m/n
Siano ora n pari e m pari. In questo caso n xm = |x|
e perciò la funzione
è pari. Quindi, se x < 0,
q
√
mn
m√
n
m−n
D n xm = −
(−x)
=−
xm−n .
n
n
Pertanto si ha
D
√
n
xm =
√
m
n
sgn x xm−n
n
m e n interi pari
Questa espressione vale anche in x = 0 se m > n. Ad esempio si ha
√
√
1
sgn x
4
4
D x2 = sgn x x−2 = p ,
2
2 |x|
8.5.2
√
√
D x4 = 2sgn x x2 = 2x.
Esponenziali e funzioni iperboliche
Sia f (x) = ax , con a > 0, a 6= 1. Sia x reale qualunque. Per h → 0 si ha
ah − 1
ax+h − ax
= ax
→ ax log a.
h
h
Quindi, per ogni x
Dax = ax log a
In particolare
Dex = ex
Dal risultato precedente si deducono immediatamente le derivate delle funzioni iperboliche. Si ha
ex − e−x
1
= Dex −
2
2
1
ex + e−x
= Dex +
D cosh x = D
2
2
D sinh x = D
1 −x
ex + e−x
De =
2
2
1 −x
ex − e−x
De =
2
2
Quindi
D sinh x = cosh x, D cosh x = sinh x
214
8. Calcolo differenziale
Infine, applicando la regola di derivazione del quoziente si ha
D tanh x = D
sinh x
cosh2 x − sinh2 x
=
cosh x
cosh2 x
Ricordando che cosh2 x − sinh2 x = 1, si ottiene
D tanh x =
8.5.3
1
= 1 − tanh2 x
cosh2 x
Logaritmi
Sia f (x) = log x. Sia x > 0. Per h → 0 si ha
¶
µ
h
log 1 +
log(x + h) − log x
1
1
x
→ .
=
h
h
x
x
x
Per ogni x > 0 si ha dunque
D log x =
8.5.4
1
x
Funzioni trigonometriche
Sia f (x) = sin x. Sia x un qualunque numero reale. Si ha, per h → 0,
¶
µ ¶
µ
h
h
sin
cos x +
sin (x + h) − sin x
2
2
=2
h
h
µ ¶
h
µ
¶ sin
h
2
= cos x +
h
2
2
→ cos x.
In modo analogo si ha, per h → 0,
µ
¶
µ ¶
h
h
sin x +
sin
cos (x + h) − cos x
2
2
= −2
→ − sin x.
h
h
Quindi
8.5. Derivate delle funzioni elementari
215
D sin x = cos x, D cos x = − sin x
La derivata di tan x si ottiene mediante la regola di derivazione del quoziente.
Per ogni x 6= π/2 + kπ, ove k è un intero, si ha
D tan x = D
sin x
sin2 x + cos2 x
=
cos x
cos2 x
da cui
D tan x =
1
= 1 + tan2 x
cos2 x
Con calcoli analoghi si ottiene la derivata della cotangente
D cot x = −
8.5.5
1
= −1 − cot2 x
sin2 x
Inverse delle funzioni trigonometriche
La funzione x = arctan y è l’inversa della restrizione di y = tan x all’intervallo
(−π/2, π/2). Poiché D tan x 6= 0 per ogni x ∈ (−π/2, π/2), possiamo applicare
il Teorema di derivazione della funzione inversa. Si ha, per ogni y = tan x,
D arctan y =
1
1
=
.
1 + y2
1 + tan2 x
Questa formula si scrive usualmente denotando con x la variabile indipendente
dell’arcotangente.
D arctan x =
1
1 + x2
La funzione x = arcsin y è l’inversa della restrizione di y = sin x all’intervallo
[−π/2, π/2]. L’arcoseno è definito in [−1, 1], ma è derivabile solo nell’intervallo
aperto (−1, 1), in quanto cos x = D sin x si annulla in ±π/2. Possiamo applicare
il Teorema di derivazione della funzione inversa in ogni punto y ∈ (−1, 1).
Tenendo conto che cos x è positivo in (−π/2, π/2), si ha
D arcsin y =
1
1
1
=p
.
=p
2
cos x
1 − y2
1 − sin x
Come prima la formula si scrive usualmente denotando con x la variabile indipendente dell’arcoseno.
216
8. Calcolo differenziale
D arcsin x = √
1
1 − x2
La funzione x = arccos y è l’inversa della restrizione di y = cos x all’intervallo [0, π]. Come l’arcoseno, essa è definita in [−1, 1], ma è derivabile solo
nell’intervallo aperto (−1, 1), in quanto − sin x = D cos x si annulla in 0 e π. Si
ha, come sopra
D arccos y = −
1
1
1
= −√
= −p
sin x
1 − cos2 x
1 − y2
Riscriviamo la derivata cambiando nome alla variabile indipendente.
D arccos x = − √
8.5.6
1
1 − x2
Derivate di funzioni composte
Le derivate calcolate in precedenza, il Teorema di derivazione della funzione composta, e gli altri Teoremi dimostrati nel paragrafo 8.4, permettono di derivare
tutte le funzioni elementari dell’analisi. Ad esempio
D sin
1
1
1
= − 2 cos ,
x
x
x
D arctan
√
1
x= √
,
2 x(1 + x)
3
3
Dex = 3x2 ex .
Studiamo qui di seguito alcuni casi notevoli.
Derivata della potenza di una funzione
α
Sia h(x) = (f (x)) , ove α è un numero reale non nullo e f è una funzione
derivabile in (a, b), con f (x) > 0. La derivata si calcola notando che h è la
funzione composta h = g ◦ f , ove g è la potenza g(y) = y α . Applicando il
Teorema di derivazione della funzione composta, si ha l’espressione della derivata
di h.
α
D (f (x)) = α (f (x))
α−1
Df (x)
Ad esempio, per x ∈ (0, 1) si ha
p
1 1 − 2x
D x − x2 = D(x − x2 )1/2 = √
2 x − x2
Se n è un intero non nullo (e f (x) 6= 0 se n < 0), si ha
n
n−1
D (f (x)) = n (f (x))
Ad esempio, D sinn x = n sinn−1 x cos x.
Df (x)
(8.5.1)
8.5. Derivate delle funzioni elementari
217
Derivata del modulo di una funzione
La funzione |x| è derivabile in ogni punto x 6= 0. La sua derivata vale 1 se x > 0,
−1 se x < 0. Quindi
D |x| = sgn x, x 6= 0.
Ne segue che, se f è derivabile in (a, b), la funzione |f (x)| è derivabile in tutti i
punti x ∈ (a, b) in cui f (x) 6= 0. In tali punti si ha
D |f (x)| = sgn (f (x)) Df (x))
¯
¯
Ad esempio, ¯ 12 x2 − x¯ è derivabile tranne che in x = 0 e in x = 2. Si ha
¯
¯
µ
¶ ½
¯1 2
¯
1 2
x − 1 se x < 0 oppure x > 2
¯
¯
D¯ x − x¯ = (x − 1) sgn
x −x =
1 − x se 0 < x < 2
2
2
Non è difficile dimostrare che |f (x)| è derivabile anche nei punti in cui f (x) = 0,
purché in tali punti si abbia anche f 0 (x) = 0. In tal caso si ha D |f (x)| = 0. Ad
esempio, la derivata di |x|3 in x = 0 esiste e vale 0.
Derivata logaritmica
La derivata logaritmica di una funzione è la derivata del logaritmo della funzione
stessa. Sia f (x) derivabile e positiva in (a, b), e consideriamo la funzione h(x) =
log f (x). Essa è derivabile per il Teorema di derivazione della funzione composta
e si ha
D log f (x) =
Df (x)
f (x)
Ad esempio, se f (x) = x2 + x + 2, si ha
D log(x2 + x + 2) =
2x + 1
.
+x+2
x2
Se f (x) = |cos x|, con x 6= π/2 + kπ, si ha
D log |cos x| = −sgn (cos x)
sin x
= − tan x.
|cos x|
Analogamente, se f (x) = |x| si ha
D log |x| =
1
x
La derivata logaritmica esprime il tasso istantaneo di variazione di una quantità rapportato alla quantità stessa, cioè la sua variazione percentuale. Per
questo motivo essa è di uso comune nelle applicazioni della matematica.
218
8. Calcolo differenziale
Derivata di una funzione avente una funzione a esponente
Sia h(x) = f (x)g(x) , ove f (x) > 0 e f e g sono derivabili in (a, b). La derivazione
di h può essere ricondotta alla derivazione di una funzione composta. Infatti,
basta scrivere h(x) nella forma
h(x) = f (x)g(x) = eg(x) log f (x) .
Derivando questa funzione composta si ha
¶
³
´ µ
g(x) 0
g(x)
0
D f (x)
= g (x) log f (x) +
f (x) eg(x) log f (x) .
f (x)
Quindi
¡
¢
D f (x)g(x) =
µ
¶
g(x) 0
g 0 (x) log f (x) +
f (x) f (x)g(x)
f (x)
Ad esempio, la derivata di xx vale
Dxx = (log x + 1) xx .
8.6
Massimi e minimi relativi
Definizione 8.6.1 Sia I ⊆ R un intervallo e sia f : I → R. Si dice che x0 è
un punto di massimo relativo (o locale) di f (x) in I se esiste δ > 0 tale che per
ogni x ∈ B(x0 , δ) ∩ I si ha
f (x) ≤ f (x0 ).
(8.6.2)
Si dice x0 è un punto di minimo relativo (o locale) di f (x) in I se esiste δ > 0
tale che per ogni x ∈ B(x0 , δ) ∩ I si ha
f (x) ≥ f (x0 ).
(8.6.3)
Se x0 è un punto di massimo relativo, f (x0 ) si chiama massimo relativo della
funzione in I. Se x0 è un punto di minimo relativo, f (x0 ) si chiama minimo
relativo della funzione in I. Il massimo e il minimo assoluti di f (x) in I (se
esistono), sono anche massimi e minimi relativi, e i punti di massimo e minimo
assoluti sono anche punti di massimo e minimo relativi. Si veda il paragrafo 6.5.
Chiameremo collettivamente i massimi e minimi relativi in I estremi relativi
della funzione in I. Analogamente il massimo e il minimo assoluto verranno
chiamati estremi assoluti. I punti in cui vengono assunti i valori estremi relativi e quelli assoluti, vengono chiamati rispettivamente estremanti relativi ed
estremanti assoluti.
Se in (8.6.2) vale il segno < per x 6= x0 , si dice che x0 è un punto di massimo
relativo forte. Analogamente, se in (8.6.3) vale il segno > per x 6= x0 , si dice
8.6. Massimi e minimi relativi
219
che x0 è un punto di minimo relativo forte. Se un estremante non è forte esso
si dice debole.
Una funzione può possedere estremi relativi in I senza possedere estremi
assoluti, come apparirà chiaro dagli esempi. Si noti infine che la nozione di
massimo e minimo relativo si può formulare in anche per funzioni definite in un
qualunque spazio metrico, purché a valori in R. La definizione è esattamente la
stessa.
-1
0
f (x) = (1 − x2 )2
1
Esempi 8.6.4
1. Sia f (x) = (1 − x2 )2 . Questa funzione assume il minimo assoluto nei punti
x = ±1, ma non ha massimo assoluto in R. Il punto x = 0 è un punto di
massimo relativo. Tutti gli estremanti sono forti.
2. Sia f (x) = x3 − 3x. Il punto x = −1 è un punto di massimo relativo
forte e il punto x = 1 è un punto di minimo relativo forte. Non ci sono
estremanti assoluti.
3. Sia f (x) = [x]. Tutti i punti x ∈
/ Z (gli interi relativi) sono sia punti di
massimo che minimo relativo debole per f (x). I punti x ∈ Z sono punti
di massimo relativo debole. Non ci sono estremanti assoluti.
4. La funzione f (x) = x non ha estremanti relativi né assoluti in R. La sua
restrizione a un qualunque intervallo [a, b] ha un punto di minimo assoluto
in x = a e un punto di massimo assoluto in x = b.
220
8. Calcolo differenziale
1
-1
f (x) = x3 − 3x
√
5. Sia f (x) = x + 2 sin x. Per ogni intero k, la funzione ammette massimo
relativo, ma non assoluto, in 3π/4 + 2kπ, e minimo relativo, ma non
assoluto, in −3π/4 + 2kπ. Per controllare questa affermazione si può
utilizzare il successivo Corollario 8.8.8. Tutti gli estremanti di questa
funzione sono forti.
−3π/4
3π/4
f (x) = x +
√
2 sin x
Teorema 8.6.5 (di Fermat) Sia f : (a, b) → R e sia x0 ∈ (a, b). Se x0 è un
estremante relativo e se f è derivabile in x0 , allora f 0 (x0 ) = 0.
Dimostrazione. Supponiamo, per fissare le idee, che x0 sia un punto di minimo
relativo. Esiste δ > 0 tale che per ogni x ∈ (x0 − δ, x0 +δ) si abbia f (x) ≥ f (x0 ).
8.6. Massimi e minimi relativi
221
Se per x0 < x < x0 + δ si ha quindi
f (x) − f (x0 )
≥ 0.
x − x0
(8.6.6)
Il rapporto incrementale sinistro invece è non positivo. Se x0 − δ < x < x0 si ha
f (x) − f (x0 )
≤ 0.
x − x0
(8.6.7)
Poiché la funzione è derivabile in x0 , passando al limite per x → x0 + in (8.6.6)
si ha
f (x) − f (x0 )
f 0 (x0 ) = lim
≥ 0.
x→x0 +
x − x0
Analogamente, passando al limite per x → x0 − in (8.6.7) si ha
f 0 (x0 ) = lim
x→x0 −
f (x) − f (x0 )
≤ 0.
x − x0
Quindi non può che essere f 0 (x0 ) = 0.
Sottolineiamo che la condizione f 0 (x0 ) = 0 è necessaria, ma non sufficiente
per l’esistenza di un estremante relativo. La funzione f (x) = x3 ha come derivata 3x2 , che si annulla in x = 0. Tale punto non è un estremante, poiché
f (0) = 0, ma f (x) è negativa per x < 0, positiva per x > 0.
Esempi 8.6.8
1. Sia f (x) = x2 . Tale funzione possiede un minimo assoluto in x = 0. La
derivata è 2x che si annulla in 0.
2. Sia, come nell’esempio 8.6.4.1, f (x) = (1 − x2 )2 . Abbiamo notato che i
punti 0 e ±1 sono estremanti. Si ha
f 0 (x) = −4x(1 − x2 )
che si annulla appunto per x = 0 e x = ±1.
3. La derivata della funzione f (x) = x3 − 3x dell’esempio 8.6.4.2 vale 3x2 − 3
e si annulla nei punti x = 1 e x =
√−1.
Analogamente,
la
funzione
x
+
2 sin x dell’esempio 8.6.4.5 ha derivata
√
f 0 (x) = 1 + 2 cos x, che si annulla nei punti ±3π/4 + 2kπ, ove k ∈ Z.
4. Per la validità del Teorema di Fermat è necessario che il punto x0 sia
interno. Una funzione definita in [a, b] e ivi derivabile può avere un estremante in a o in b senza che la derivata (destra o sinistra, rispettivamente)
sia nulla in tal punto. Ad esempio la restrizione di f (x) = x a [0, 1] ha
minimo e massimo assoluti in x = 0 e x = 1 rispettivamente, ma f 0 (x) = 1
per ogni x.
222
8.7
8. Calcolo differenziale
Teoremi di Rolle, Cauchy, Lagrange
Teorema 8.7.1 (di Rolle) Sia f : [a, b] → R soddisfacente le seguenti ipotesi:
i) f è continua in [a, b];
ii) f è derivabile in (a, b);
iii) f (a) = f (b).
Allora esiste z ∈ (a, b) tale che f 0 (z) = 0.
Dimostrazione. Se f (x) è costante, per qualunque z ∈ (a, b) si ha f 0 (z) = 0.
Supponiamo dunque che f (x) non sia costante.
Poiché la funzione è continua in un intervallo compatto, per il Teorema
di Weierstrass esiste un punto di massimo assoluto e uno di minimo assoluto
in [a, b]. Almeno uno dei due estremanti deve essere interno, altrimenti, per
l’ipotesi iii), la funzione sarebbe costante. Chiamiamo z questo estremante
interno. Per l’ipotesi ii) la funzione è sicuramente derivabile in z. Per il Teorema
di Fermat si ha f 0 (z) = 0.
Teorema 8.7.2 (di Cauchy) Siano F : [a, b] → R e G : [a, b] → R due funzioni tali che:
i) F e G sono continue in [a, b];
ii) F e G sono derivabili in (a, b).
Allora esiste z ∈ (a, b) tale che
[G(b) − G(a)] F 0 (z) = [F (b) − F (a)] G0 (z).
(8.7.3)
Dimostrazione. Poniamo
f (x) = [G(b) − G(a)] F (x) − [F (b) − F (a)] G(x).
(8.7.4)
Evidentemente f continua in [a, b], derivabile in (a, b) e
f 0 (x) = [G(b) − G(a)] F 0 (x) − [F (b) − F (a)] G0 (x).
Inoltre, si verifica immediatamente che
f (a) = f (b).
Quindi f soddisfa le tre ipotesi del Teorema di Rolle. Di conseguenza esiste
z ∈ (a, b) tale che f 0 (z) = 0. Dall’espressione (8.7) di f 0 si ricava la tesi.
Se G(b) 6= G(a) e G0 (z) 6= 0, la (8.7.3) si può riscrivere nella forma
F 0 (z)
F (b) − F (a)
= 0 .
G(b) − G(a)
G (z)
(8.7.5)
8.7. Teoremi di Rolle, Cauchy, Lagrange
223
Teorema 8.7.6 (di Lagrange) Sia f : [a, b] → R soddisfacente le seguenti
ipotesi:
i) f è continua in [a, b];
ii) f è derivabile in (a, b).
Allora esiste z ∈ (a, b) tale che
f (b) − f (a)
= f 0 (z).
b−a
(8.7.7)
Dimostrazione. Questo Teorema è un corollario del Teorema di Cauchy, ove
si ponga F (x) = f (x) e G(x) = x.
f(b)
f(z)
f(a)
a
z
b
Il Teorema di Lagrange assume anche il nome di Teorema del valor medio.
Da un punto di vista geometrico, esso afferma che, nelle ipotesi dichiarate sulla funzione f , esiste un punto interno z tale che il coefficiente angolare della
tangente in (z, f (z)) è eguale al coefficiente angolare della retta per i punti
(a, f (a)) e (b, f (b)). Ciò implica che la tangente in (z, f (z)) è parallela alla retta
per (a, f (a)) e (b, f (b).
Sia f : [x0 , x0 + h] → R, oppure f : [x0 + h, x0 ] → R, a seconda che sia h > 0
oppure h < 0. Supponiamo che f soddisfi le ipotesi del Teorema di Lagrange,
cioè che sia continua nell’intervallo chiuso e derivabile nell’aperto. Esiste un
punto z interno all’intervallo tale che (qualunque sia il segno di h) si abbia
f (x0 + h) − f (x0 )
= f 0 (z).
h
Possiamo esprimere z nella forma z = x0 + θh, ove θ è un opportuno numero
tale che 0 < θ < 1. Otteniamo cosı̀ la seconda formula dell’incremento finito
f (x0 + h) − f (x0 ) = hf 0 (x0 + θh) .
(8.7.8)
La prima formula dell’incremento finito (8.2.13) fornisce una stima asintotica
per x → x0 sotto ipotesi puntuali, cioè la derivabilità di f nel solo punto x0 .
224
8. Calcolo differenziale
La seconda formula fornisce informazioni quantitative in ipotesi globali, cioè su
tutto l’intervallo chiuso di estremi x0 e x0 + h.
Posto x = x0 + h la (8.7.8) si può scrivere come
f (x) = f (x0 ) + (x − x0 )f 0 (x0 + θ(x − x0 )) .
(8.7.9)
Esaminiamo ora alcune conseguenze del Teorema di Lagrange, rimandando
al prossimo paragrafo la sua applicazione allo studio della monotonia di una
funzione.
Corollario 8.7.10 Sia I ⊆ R un intervallo e sia f : I → R, f derivabile in I.
Se esiste una costante C tale che |f 0 (x)| ≤ C per ogni x ∈ I, allora
|f (x1 ) − f (x2 )| ≤ C |x1 − x2 | .
In particolare, f è uniformemente continua.
Dimostrazione. Siano x1 , x2 ∈ I, con x1 < x2 . Possiamo applicare il Teorema
di Lagrange all’intervallo [x1 , x2 ] ⊆ I. Si ha da (8.7.8)
|f (x1 ) − f (x2 )| = |x1 − x2 | |f 0 (x1 + θ(x2 − x1 ))|
≤ C |x1 − x2 | .
L’uniforme continuità è ora immediata. Fissato ε > 0, sia δ = ε/C. Da
|x1 − x2 | < δ segue |f (x1 ) − f (x2 )| < ε.
Nelle ipotesi del Corollario, f è lipschitziana in I secondo la definizione
dell’appendice del capitolo 7.
Teorema 8.7.11 Sia f : [x0 , x0 + δ] → R continua in [x0 , x0 + δ] e derivabile
in (x0 , x0 + δ). Esista finito
lim f 0 (x) = γ.
x→x0 +
Allora f è derivabile (dalla destra) in x0 e si ha
0
f+
(x0 ) = γ.
Dimostrazione. Sia 0 < h < δ. Per la seconda formula dell’incremento finito
si ha
f (x0 + h) − f (x0 )
= f 0 (x0 + θh) ,
(8.7.12)
h
ove θ = θ(h) è un opportuno numero in (0, 1) dipendente da h. Per h → 0+ si
ha x0 + θh → x0 + e quindi f 0 (x0 + θh) → γ. Ne segue
lim
h→0+
f (x0 + h) − f (x0 )
= γ.
h
8.7. Teoremi di Rolle, Cauchy, Lagrange
225
In modo del tutto analogo si dimostra che se f : [x0 − δ, x0 ] → R è continua
in [x0 − δ, x0 ] e derivabile in (x0 − δ, x0 ), e se esiste finito limx→x0 − f 0 (x) = γ,
0
allora f è derivabile dalla sinistra in x0 e f−
(x0 ) = γ.
Come esempio, si consideri la funzione
(
1
arctan
se x > 0
f (x) =
x
π/2
se x = 0.
Tale funzione è continua in [0, +∞). La sua derivata per x > 0 vale
1
=−
.
(8.7.13)
1
1 + x2
1+ 2
x
0
Per x → 0+ si ha f (x) → −1. Quindi f è derivabile dalla destra in x = 0 e
0
f+
(0) = −1.
f 0 (x) = −
1
x2
1
Corollario 8.7.14 Sia f : [x0 − δ, x0 + δ] → R continua in [x0 − δ, x0 + δ] e
derivabile in (x0 − δ, x0 + δ). Se x0 è un punto di discontinuità per f 0 (x), allora
è necessariamente di seconda specie.
Dimostrazione. Sia per assurdo x0 un punto di discontinuità eliminabile o di
prima specie. Allora esistono finiti
lim f 0 (x) = γ1
x→x0 +
e
lim f 0 (x) = γ2 .
x→x0 −
0
0
Per il Teorema 8.7.11 si ha f+
(x0 ) = γ1 e f−
(x0 ) = γ2 . Poiché per ipotesi esiste
la derivata in x0 , si ha
0
0
γ1 = f+
(x0 ) = f 0 (x0 ) = f−
(x0 ) = γ2
e quindi x0 non può essere un punto di discontinuità per f 0 (x), assurdo.
Diamo un esempio di funzione con derivata discontinua in un punto. Sia
(
1
x2 cos
se x 6= 0
f (x) =
x
0
se x = 0
Chiaramente la funzione è continua per ogni x e derivabile per x 6= 0. La sua
derivata in x 6= 0 vale
1
1
f 0 (x) = 2x cos + sin .
x
x
Quindi f 0 (x) non ammette limite per x → 0. D’altra parte, f è derivabile in 0
e f 0 (0) = 0. Infatti
f (x) − f (0)
1
= lim x cos = 0.
x→0
x
x
La derivata ha una discontinuità di seconda specie in x0 = 0.
Vedremo nel capitolo 10 che ogni funzione continua in un intervallo è una
funzione derivata. Invece, come conseguenza del Corollario, funzioni quali sgn x,
mant x e le funzioni monotone discontinue, non sono le funzioni derivate di
alcuna funzione.
lim
x→0
226
8.8
8. Calcolo differenziale
Crescere e decrescere
Le due formule dell’incremento finito permettono di caratterizzare le funzioni
monotone.
Teorema 8.8.1 Sia I ⊆ R un intervallo e sia f : I → R derivabile in I.
a) Condizione necessaria e sufficiente affinché f sia monotona non decrescente
in I è che f 0 (x) ≥ 0 per ogni x ∈ I.
b) Condizione necessaria e sufficiente affinché f sia monotona non crescente
in I è che f 0 (x) ≤ 0 per ogni x ∈ I.
Dimostrazione. Ci limitiamo a dimostrare a), poiché la dimostrazione di b) è
del tutto analoga. Supponiamo f 0 (x) ≥ 0 e siano x1 , x2 ∈ I, tali che x1 < x2 .
Possiamo applicare il Teorema di Lagrange all’intervallo [x1 , x2 ] ⊆ I. Esiste
θ ∈ (0, 1) tale che
f (x2 ) − f (x1 ) = (x2 − x1 )f 0 (x1 + θ(x2 − x1 )) ≥ 0
e quindi f è monotona non decrescente.
Viceversa, sia f monotona non decrescente. Per assurdo, esista x0 ∈ I tale
che f 0 (x0 ) < 0. Sia x ∈ I, x 6= x0 . Per la prima formula dell’incremento finito,
µ
¶
o(x − x0 )
f (x) − f (x0 ) = (x − x0 ) f 0 (x0 ) +
.
(8.8.2)
x − x0
Esiste δ > 0 tale che per 0 < |x − x0 | < δ si ha
f 0 (x0 ) +
o(x − x0 )
< 0.
x − x0
Per questi valori di x, (8.8.2) implica che f (x)−f (x0 ) ha segno opposto a x−x0 .
La funzione non può quindi essere non decrescente, assurdo.
Corollario 8.8.3 (caratterizzazione delle funzioni costanti) Sia I ⊆ R
un intervallo e sia f : I → R, derivabile in I. La funzione f è costante se
e solo se f 0 (x) = 0 per ogni x ∈ I.
Dimostrazione. Se f (x) è costante, ovviamente f 0 (x) = 0 per ogni x. Viceversa, sia f 0 (x) = 0 per ogni x ∈ I. Allora, per il Teorema precedente, f è allo
stesso tempo monotona non crescente e non decrescente. Quindi è costante.
Il Corollario vale per funzioni definite in un intervallo, ma non vale in
generale se f non è definita in un intervallo.
Esempi 8.8.4
1. Si definisca
½
f (x) =
1
2
se 0 ≤ x ≤ 1,
se 2 ≤ x ≤ 3.
Questa funzione ha derivata nulla in ogni punto del suo insieme di definizione, ma non è costante, poiché f (1) 6= f (2).
8.8. Crescere e decrescere
227
2. Sia f (x) = arctan x + arctan 1/x e sia x > 0. Si ha (si veda (8.7.13))
1
1 + x2
1
1
D arctan = −
,
x
1 + x2
D arctan x =
da cui f 0 (x) = 0. Quindi f (x) = C. Si può calcolare il valore della costante
ponendo x = 1. Poiché arctan 1 = π/4, si ottiene
∀x > 0
arctan x + arctan
1
π
= .
x
2
(8.8.5)
Consideriamo ora la stessa funzione per x < 0. La derivata è ancora nulla
e quindi f (x) è costante anche sui negativi. Calcoliamo f (−1). Poiché
arctan (−1) = −π/4, si ottiene
∀x < 0
arctan x + arctan
1
π
=− .
x
2
(8.8.6)
3. In modo del tutto analogo all’esempio precedente si può ottenere l’ovvia
identità
π
∀x ∈ [−1, 1] arcsin x + arccos x = .
2
La derivata di una funzione strettamente monotona può annullarsi in qualche
punto. Ad esempio, f (x) = x3 è strettamente crescente in R, ma f 0 (0) = 0. La
situazione è chiarita dal seguente Teorema.
Teorema 8.8.7 Sia I ⊆ R un intervallo e sia f : I → R derivabile in I.
a) Se f 0 (x) ≥ 0 e gli eventuali punti in cui f 0 (x) = 0 sono isolati, allora f è
monotona strettamente crescente in I.
b) Se f 0 (x) ≤ 0 e gli eventuali punti in cui f 0 (x) = 0 sono isolati, allora f è
monotona strettamente decrescente in I.
Dimostrazione. Ci limitiamo a dimostrare a), poiché la dimostrazione di b)
è del tutto analoga. Poiché f 0 (x) non è mai negativa, la funzione è monotona
non decrescente. Siano x1 , x2 ∈ I, tali che x1 < x2 . Si ha f (x1 ) ≤ f (x2 ).
Supponiamo per assurdo che valga l’eguaglianza, cioè f (x1 ) = f (x2 ). Allora,
per la monotonia, f (x1 ) = f (x) = f (x2 ) per ogni x ∈ [x1 , x2 ]. Quindi f 0 (x) = 0
in [x1 , x2 ], contro l’ipotesi che gli zeri della derivata siano isolati.
Corollario 8.8.8 Sia f : (x0 − δ, x0 + δ) → R derivabile in (x0 − δ, x0 + δ). Sia
f 0 (x0 ) = 0.
a) Se f 0 (x) < 0 per x ∈ (x0 − δ, x0 ) e f 0 (x) > 0 per x ∈ (x0 , x0 + δ), allora x0
è un punto di minimo forte.
228
8. Calcolo differenziale
b) Se f 0 (x) > 0 per x ∈ (x0 − δ, x0 ) e f 0 (x) < 0 per x ∈ (x0 , x0 + δ), allora x0
è un punto di massimo forte.
Dimostrazione. Se vale l’ipotesi di a), per il Teorema 8.8.7, f (x) è monotona
strettamente decrescente in (x0 − δ, x0 ] e monotona strettamente crescente in
[x0 , x0 + δ). Quindi x0 è un punto di minimo forte. La dimostrazione di b) è
analoga.
Se la derivata mantiene lo stesso segno per x < x0 e per x > x0 allora f è
strettamente monotona in (x0 −δ, x0 +δ). Il punto x0 , come vedremo in seguito,
è un punto di flesso a tangente orizzontale.
Esempi 8.8.9
1. Sia f (x) = x2n , ove n ∈ N. Si ha f 0 (x) = 2nx2n−1 . La derivata si annulla
in x = 0 ed è negativa per x < 0, positiva per x > 0. Quindi 0 è un punto
di minimo forte.
Sia f (x) = x2n+1 , ove n ∈ N. Si ha f 0 (x) = (2n + 1)x2n . La derivata si
annulla in x = 0, ma tale punto non è estremante, poiché f 0 (x) si mantiene
positiva a destra e a sinistra di 0. La funzione è crescente.
2. Sia f (x) = log(1 + x) − x, definita per x > −1. Si ha
f 0 (x) =
1
− 1.
1+x
La derivata si annulla solo in x = 0. Per −1 < x < 0 si ha f 0 (x) > 0,
mentre per x > 0 si ha f 0 (x) < 0. Quindi x = 0 è un punto di massimo
forte. Ne segue, per ogni x > −1, x 6= 0,
log(1 + x) < x.
1
-1
-1
f (x) = log(1 + x) − x
8.9. Teorema di De l’Hospital
8.9
229
Teorema di De l’Hospital
0 ∞
Il Teorema di De l’Hospital permette di studiare le forme di indecisione e
0 ∞
nel calcolo dei limiti. Ci limitiamo a enunciare il Teorema, la cui dimostrazione
è svolta nell’Appendice.
Teorema 8.9.1 (di De l’Hospital) Siano f : (a, b) → R e g : (a, b) → R due
funzioni derivabili in (a, b), ove −∞ ≤ a < b ≤ +∞. Siano g(x) 6= 0 e g 0 (x) 6= 0
in (a, b). Siano verificate le seguenti ipotesi:
f (x)
0
∞
presenta il caso di indecisione oppure
per x → a+
g(x)
0
∞
(oppure per x → b−);
i) il rapporto
ii) limx→a+
f 0 (x)
f 0 (x)
=
γ
∈
R
(rispettivamente,
lim
=γ∈R)
x→b−
g 0 (x)
g 0 (x)
Allora:
lim
x→a+
f (x)
=γ
g(x)
(rispettivamente, lim
x→b−
f (x)
= γ)
g(x)
Esempi 8.9.2
1 − cos 2x
1. Calcoliamo limx→0
. Questo limite presenta la forma di indecix2
0
sione . Il rapporto delle derivate è
0
2 sin 2x
→2
2x
Quindi limx→0
per x → 0.
1 − cos 2x
= 2.
x2
x − log(1 + x)
. Questo limite presenta la forma di
2. Calcoliamo limx→0
x2
0
indecisione . Il rapporto delle derivate è
0
1−
Quindi limx→0
1
1
1
1+x =
→
2x
2(1 + x)
2
1
x − log(1 + x)
= .
2
x
2
per x → 0.
230
8. Calcolo differenziale
3. Calcoliamo limx→0+ x cot x. Questo limite presenta la forma di indecisione
∞
0 · ∞, ma può essere ricondotto alla forma
, scrivendo
∞
x cot x =
cot x
.
1
x
Il rapporto delle derivate è
1
2
sin x2 = x
→1
1
sin2 x
− 2
x
−
per x → 0.
Quindi limx→0+ x cot x = 1.
π
4. Determiniamo l’ordine di infinitesimo per x → +∞ di −arctan x rispetto
2
1
all’infinitesimo . Si tratta si determinare per quale valore a > 0 il limite
x
lim
x→+∞
π
− arctan x
2 µ ¶
a
1
x
esiste finito e diverso da 0. Passiamo al rapporto delle derivate. Esso è
1
−
a+1
xa−1
1 + x2 = x
∼
.
µ ¶a+1
2
a (1 + x )
a
1
−a
x
Il limite di tale rapporto per x → +∞ è finito e diverso da 0 se e solo se
a = 1. Quindi l’ordine di infinitesimo è 1.
5. L’esistenza del limite del rapporto delle derivate è condizione sufficiente
ma non necessaria per l’esistenza del limite del rapporto delle funzioni.
Ad esempio, siano
1
f (x) = x2 sin ,
x
Per x → 0 il rapporto
g(x) = ex − 1.
f (x)
ha limite 0, poiché
g(x)
1
1
x sin
1
x
x
= lim x
lim x
= lim x sin = 0.
e
−
1
x→0
x→0 e − 1
x→0
x
x
x2 sin
8.10. Derivate di ordine superiore
231
Invece, il rapporto delle derivate è
1
1
2x sin − cos
f 0 (x)
x
x
=
g 0 (x)
ex
che non ammette limite per x → 0.
8.10
Derivate di ordine superiore
Abbiamo notato che una funzione elementare dell’analisi è derivabile in tutto il
suo insieme di definizione (con la possibile eccezione di punti isolati). Le funzioni
derivate delle funzioni elementari sono ancora funzioni elementari e quindi a loro
volta derivabili. Questa osservazione ci conduce alla definizione delle derivate
successive di una funzione.
Definizione 8.10.1 Sia I ⊆ R un intervallo e sia f : I → R una funzione
derivabile in I. Sia x0 ∈ I. Si dice che la funzione f (x) è derivabile due volte
in x0 se la funzione derivata f 0 : I → R è a sua volta derivabile in x0 .
Si chiama derivata seconda della funzione in x0 la derivata di f 0 (x) in x0 .
La derivata seconda di f in x0 si denota usualmente con f 00 (x0 ), oppure con
un dei simboli
d2 f
D2 f (x0 ),
(x0 ), y 00 (x0 ).
dx2
In maniera analoga si definisce la derivata terza. Se f 00 (x) esiste in I ed è a sua
volta derivabile in x0 , si dice che f è derivabile tre volte in x0 e la derivata della
derivata seconda si chiama derivata terza di f in x0 . Essa viene indicata con
uno dei simboli
f 000 (x0 ),
D3 f (x0 ),
d3 f
(x0 ),
dx3
y 000 (x0 ).
Per induzione possiamo ora definire la derivata n–esima di una funzione.
Definizione 8.10.2 Sia I ⊆ R un intervallo, e sia f : I → R una funzione
derivabile n − 1 volte in I. Sia x0 ∈ I.
Se la derivata (n − 1)–esima è a sua volta derivabile in x0 , si dice che f
è derivabile n volte in x0 e la derivata della derivata (n − 1)–esima si chiama
derivata n–esima di f in x0 , o derivata di ordine n.
La derivata n–esima in x0 viene indicata con uno dei simboli
f (n) (x0 ),
Dn f (x0 ),
D(n) f (x0 ),
dn f
(x0 ),
dxn
y (n) (x0 ).
In questo contesto, la derivata f 0 (x) viene chiamata derivata prima di f . Si
pone anche, per ogni funzione f ,
f (0) (x) = f (x).
232
8. Calcolo differenziale
Si noti che, come l’esistenza della derivata prima in x0 implica che la funzione sia
definita in un intorno di x0 (in un intorno destro o sinistro di x0 per la derivata
destra o sinistra), l’esistenza di f (n) (x0 ) implica l’esistenza di f (n−1) (x0 ) in un
intorno di x0 (in un intorno destro o sinistro di x0 se x0 è un estremo di I).
Esempi 8.10.3
1. Sia f (x) = xn , ove n è intero positivo. Si ha Dxn = xn−1 . Le derivate
successive sono
D2 xn = n(n − 1)xn−2 ,
D3 xn = n(n − 1)(n − 2)xn−3 ,
Dn xn = n!
Le derivate di ordine maggiore di n sono tutte nulle. Di conseguenza, le
derivate di ordine maggiore di n un polinomio di grado n sono tutte nulle.
2. Sia f (x) = ex . Si ha per ogni n > 0 intero
f 0 (x) = ex ,
f 00 (x) = ex , . . . , f (n) (x) = ex , . . .
In questo caso tutte le derivate coincidono con ex . Per ogni n ≥ 0 intero
D n ex = ex
3. Sia f (x) = sin x. Si ha
f 0 (x) = cos x,
f 00 (x) = − sin x,
f 000 (x) = − cos x,
f (4) (x) = sin x = f (x) .
La derivata quarta è quindi eguale alla funzione. Per ogni k ≥ 0 intero si
ha perciò
D(4k) sin x = sin x,
D(4k+1) sin x = cos x,
D(4k+2) sin x = − sin x,
D(4k+3) sin x = − cos x .
Analogamente, se f (x) = cos x, si ha
f 0 (x) = − sin x,
f 000 (x) = sin x,
f 00 (x) = − cos x,
f (4) (x) = cos x .
Quindi, per ogni k ≥ 0 intero si ha
D(4k) cos x = cos x,
D(4k+2) cos x = − cos x,
D(4k+1) cos x = − sin x,
D(4k+3) cos x = sin x .
4. Le derivate di ordine superiore di sinh x e cosh x si calcolano tenendo
presente che D sinh x = cosh x e D cosh x = sinh x. Per ogni intero k ≥ 0
si ha
D(2k) sinh x = sinh x,
D(2k+1) sinh x = cosh x,
D(2k) cosh x = cosh x,
D(2k+1) cosh x = sinh x .
8.10. Derivate di ordine superiore
233
5. Sia f (x) = log(1 + x). Si ha
f 0 (x) =
f 000 (x) =
1
,
1+x
2
(1 + x)
f 00 (x) = −
1
2,
(1 + x)
2·3
f (4) (x) = −
4, ...
(1 + x)
3,
Si ha cosı̀ per ogni n > 0 intero
Dn log(1 + x) = (−1)n−1
(n − 1)!
n .
(1 + x)
6. Sia f (x) = (1 + x)α , ove α 6= 0 è un numero reale. Si ha
f 0 (x) = α(1 + x)α−1 ,
f 00 (x) = α(α − 1)(1 + x)α−2 ,
f 000 (x) = α(α − 1)(α − 2)(1 + x)α−3 , . . .
Per ogni intero k > 0 si ha dunque
Dk (1 + x)α = α(α − 1)(α − 2) · · · (α − k + 1)(1 + x)α−k .
(8.10.4)
Se α = n ∈ N, l’espressione delle derivate (8.10.4) si annulla per k > n.
Si pone
µ ¶
α(α − 1)(α − 2) · · · (α − k + 1)
α
=
.
(8.10.5)
k!
k
La quantità definita in (8.10.5) si chiama coefficiente binomiale di α su k.
Se α = n ∈ N, tale espressione coincide con il noto coefficiente binomiale.
Infatti, per n ≤ k si ha
µ ¶
n
n!
n(n − 1)(n − 2) · · · (n − k + 1)
=
=
.
k
k! (n − k)!
k!
7. Calcoliamo le derivate di arctan x fino al terzo ordine. Si ha
D arctan x = (1 + x2 )−1
2x
D2 arctan x = −
(1 + x2 )2
2(3x2 − 1)
D3 arctan x =
.
(1 + x2 )3
8. Diamo un esempio di funzione derivabile una volta, ma non due volte in
un punto. Sia f (x) = x |x|. Si ha
f 0 (x) = 2x
f 0 (x) = −2x
se x > 0
se x < 0
Sia per x → 0+ che per x → 0− si ha f 0 (x) → 0. Per il Teorema 8.7.11 la
derivata di f in 0 esiste e f 0 (0) = 0. Si ha quindi per ogni x reale
f 0 (x) = 2 |x|
che non è a sua volta derivabile in x = 0.
234
8.11
8. Calcolo differenziale
Formula di Taylor
Sia f : [a, b] → R e siano x e x0 due punti di [a, b]. Se f è derivabile in x0 la
prima formula dell’incremento finito, f (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + o(x − x0 ),
fornisce una approssimazione della funzione mediante un polinomio lineare che
rappresenta l’ordinata della tangente al grafico in x0 . L’errore, o resto, tende a
0 più velocemente dell’incremento (x − x0 ).
Supponiamo ora che f sia derivabile n volte in x0 . Ci chiediamo se f (x)
possa essere approssimata, con un errore ancora più piccolo, mediante un polinomio di grado n, il cui grafico passa per (x0 , f (x0 )). La formula di Taylor,
congiuntamente alle espressioni del resto, risponde a tale quesito.
Definizione 8.11.1 Sia f : [a, b] → R derivabile n − 1 volte (n ≥ 1) in x0 ∈
[a, b]. Sia x ∈ [a, b]. Si chiama formula di Taylor arrestata all’ordine n, con
punto iniziale x0 e incremento (x−x0 ) della variabile indipendente, l’espressione
f 0 (x0 )
f 00 (x0 )
f 000 (x0 )
(x − x0 ) +
(x − x0 )2 +
(x − x0 )3 + · · ·
1!
2!
3!
f (n−1) (x0 )
+
(x − x0 )n−1 + Tn (x − x0 ).
(n − 1)!
(8.11.2)
f (x) = f (x0 ) +
La quantità Tn (x − x0 ) si chiama resto n–esimo. Il polinomio
pn−1 (x − x0 ) =
n−1
X
k=0
f (k) (x0 )
(x − x0 )k
k!
che appare a secondo membro della (8.11.2) si chiama polinomio di Taylor (n −
1)–esimo con centro in x0 .
È evidente che, essendo Tn (x − x0 ) null’altro che la differenza tra f (x) e il
polinomio di Taylor, la sostanza della formula di Taylor consiste nell’espressione di Tn (x − x0 ). Esistono varie forme del resto, ma noi ci limiteremo qui a
due espressioni, che generalizzano la prima e la seconda formula dell’incremento
finito.
Teorema 8.11.3 (Formula di Taylor con resto di Peano) Sia f : [a, b] →
R derivabile n − 1 volte in x0 ∈ [a, b]. Se esiste in x0 la derivata n–esima
f (n) (x0 ), allora
Tn (x − x0 ) =
f (n) (x0 )
(x − x0 )n + o ((x − x0 )n ) .
n!
(8.11.4)
Equivalentemente
f (x) =
n
X
f (k) (x0 )
k=0
k!
(x − x0 )k + o ((x − x0 )n )
n
= pn (x − x0 ) + o ((x − x0 ) )
(8.11.5)
8.11. Formula di Taylor
235
Dimostrazione. Dimostriamo il Teorema per induzione. Se n = 1 l’espressione
(8.11.5) si riduce a
f (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + o(x − x0 ),
che ovviamente vale se f è derivabile in x0 .
Supponiamo vera la (8.11.5) per ogni funzione derivabile n volte in x0 e
dimostriamo che essa vale, con n + 1 al posto di n, per ogni funzione derivabile
n + 1 volte in x0 .
Poiché deve essere f (x)−pn+1 (x−x0 ) = o((x−x0 )n+1 ), dobbiamo dimostrare
che
n+1
X f (k) (x0 )
f (x) −
(x − x0 )k
k!
k=0
lim
= 0.
(8.11.6)
x→x0
(x − x0 )n+1
0
Poiché il limite in (8.11.6) presenta la forma di indecisione
per x → x0 ,
0
applichiamo il Teorema di De l’Hospital. Calcoliamo il rapporto delle derivate.
La derivata del denominatore vale (n + 1)(x − x0 )n . La derivata del numeratore
vale
2 00
3
f (x0 )(x − x0 ) − f (3) (x0 )(x − x0 )2 −
2!
3!
4
n + 1 (n+1)
− f (4) (x0 )(x − x0 )3 − · · · −
f
(x0 )(x − x0 )n =
4!
(n + 1)!
f 0 (x) − f 0 (x0 ) −
= f 0 (x) −
n+1
X
k=1
f (k) (x0 )
(x − x0 )k−1 .
(k − 1)!
(8.11.7)
Denotiamo con g(x) la funzione f 0 (x). Evidentemente f (k) (x) = g (k−1) (x).
L’espressione (8.11.7) della derivata del numeratore diviene
g(x) −
n+1
X
k=1
n
X
g (k−1) (x0 )
g (j) (x0 )
(x − x0 )k−1 = g(x) −
(x − x0 )j .
(k − 1)!
j!
j=0
Poiché g è derivabile n volte in x0 , per l’ipotesi di induzione si ha
g(x) −
n
X
g (j) (x0 )
j=0
j!
(x − x0 )j
(n + 1)(x − x0 )n
→0
per x → x0 .
Per il Teorema di De l’Hospital possiamo concludere che (8.11.6) vale. Questo
conclude la dimostrazione.
Teorema 8.11.8 (Formula di Taylor con resto di Lagrange) Sia data f :
[a, b] → R e siano x0 , x ∈ [a, b], ove x0 < x. Supponiamo che valgano le seguenti
ipotesi:
236
8. Calcolo differenziale
i) f è continua in [x0 , x];
ii) esistono le derivate di f fino all’ordine (n − 1) in [x0 , x), ed esse sono ivi
continue;
iii) esiste la derivata n− esima di f in (x0 , x).
Allora
f (n) (x0 + θ(x − x0 ))
(x − x0 )n
n!
ove θ è un opportuno numero tale che 0 < θ < 1. Si ha quindi
Tn (x − x0 ) =
f (x) =
n−1
X
k=0
f (k) (x0 )
f (n) (x0 + θ(x − x0 ))
(x − x0 )k +
(x − x0 )n
k!
n!
(8.11.9)
f (n) (x0 + θ(x − x0 ))
= pn−1 (x − x0 ) +
(x − x0 )n .
n!
Lo stesso risultato vale se x < x0 , con le ovvie modifiche delle ipotesi.
Dimostrazione. La tesi seguirà da una ripetuta applicazione del Teorema di
Cauchy.
Per ogni t ∈ [x0 , x] poniamo F (t) = f (t) − pn−1 (t − x0 ) e G(t) = (t − x0 )n .
Definiamo
F1 (t) = F 0 (t) = f 0 (t) − p0n−1 (t − x0 ), G1 (t) = G0 (t) = n(t − x0 )n−1
00
F2 (t) = F10 (t) = f 00 (t) − p00n−1 (t − x0 ), G2 (t) = G (t) = n(n − 1)(t − x0 )n−2
........................
(n−1)
Fn−1 (t) = F (n−1) (t) = f (n−1) (t) − pn−1 (t − x0 ),
Gn−1 (t) = G(n−1) (t) = n!(t − x0 ).
Si osservi ora che, in forza dell’esempio 8.10.3.1, le derivate di pn−1 (t − x0 )
calcolate per t = x0 coincidono con le derivate di f (t) in x0 . Ad esempio
p0n−1 (t − x0 ) = f 0 (x0 ) + (t − x0 )f 00 (x0 ) + · · · +
n−1
(t − x0 )n−2 ,
(n − 1)!
da cui p0n−1 (0) = f 0 (x0 ), etc. Si ha cosı̀
F1 (x0 ) = 0,
F2 (x0 ) = 0,
G1 (x0 ) = 0
G2 (x0 ) = 0
...............
Fn−1 (x0 ) = 0,
Gn−1 (x0 ) = 0.
Sono verificate nell’intervallo [x0 , x] le ipotesi del Teorema di Cauchy per le
funzioni F e G. Esiste quindi z1 ∈ (x0 , x) tale che
F (x) − F (x0 )
F 0 (z1 )
F1 (z1 ) − F1 (x0 )
F (x)
=
= 0
=
.
G(x)
G(x) − G(x0 )
G (z1 )
G1 (z1 ) − G1 (x0 )
8.11. Formula di Taylor
237
Notiamo ora che nell’intervallo [x0 , z1 ] le funzioni F1 e G1 soddisfano a loro volta
le ipotesi del Teorema di Cauchy. Esiste quindi z2 ∈ (x0 , z1 ) tale che
F1 (z1 ) − F1 (x0 )
F 0 (z2 )
F2 (z2 ) − F2 (x0 )
= 10
.
=
G1 (z1 ) − G1 (x0 )
G1 (z2 )
G2 (z2 ) − G2 (x0 )
Continuando questo procedimento, dopo n − 1 passi si arriva all’eguaglianza
F 0 (zn )
Fn−1 (zn−1 ) − Fn−1 (x0 )
= n−1
Gn−1 (zn−1 ) − Gn−1 (x0 )
G0n−1 (zn )
ove x0 < zn < zn−1 < · · · z1 < x. Si ha
0
(zn ) = f (n) (zn ),
Fn−1
G0n−1 (zn ) = n!.
Poiché
F (x)
F1 (z1 ) − F1 (x0 )
Fn−1 (x) − Fn−1 (x0 )
=
= ······ =
G(x)
G1 (z1 ) − G1 (x0 )
Gn−1 (x) − Gn−1 (x0 )
si ottiene l’eguaglianza desiderata
Tn (x − x0 )
f (x) − pn−1 (x − x0 )
f (n) (x0 + θ(x − x0 ))
=
=
,
n
n
(x − x0 )
(x − x0 )
n!
ove si è posto zn = x0 + θ(x − x0 ).
Per n = 1 il Teorema si riduce al Teorema di Lagrange e la formula (8.11.9)
non è altro che la seconda formula dell’incremento finito.
I resti di Peano e di Lagrange non sono le uniche espressioni note del resto
della formula di Taylor. Nell’Appendice del capitolo 10 dimostreremo un’altra
espressione del resto, la cosiddetta forma integrale.
La formula di Taylor con resto di Peano fornisce uno sviluppo di f (x) mediante polinomi in (x − x0 ), con un errore che è o ((x − x0 )n ). Tale sviluppo è
unico, nel senso precisato dal seguente Teorema.
Teorema 8.11.10 (di unicità dello sviluppo) Sia f : [a, b] → R, e sia x0 ∈
[a, b]. Valgano ambedue le espressioni
f (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + · · · + an (x − x0 )n + o ((x − x0 )n )
(8.11.11)
f (x) = b0 + b1 (x − x0 ) + b2 (x − x0 )2 + · · · + bn (x − x0 )n + o ((x − x0 )n ) .
(8.11.12)
Allora: a0 = b0 , a1 = b1 , a2 = b2 , . . . , an = bn .
Dimostrazione. Ragioniamo per assurdo. Se la tesi è falsa, esiste un primo
indice k ≤ n tale che ak 6= bk . Sottraendo (8.11.12) da (8.11.11) si ha
0 = (ak − bk ) (x − x0 )k + (ak+1 − bk+1 ) (x − x0 )k+1 + · · ·
+ (an − bn ) (x − x0 )n + o ((x − x0 )n ) .
(8.11.13)
238
8. Calcolo differenziale
Dividiamo ambo i membri di (8.11.13) per (x−x0 )k e portiamo a primo membro
(ak − bk ). Otteniamo
− (ak − bk ) = (ak+1 − bk+1 ) (x − x0 ) + (ak+2 − bk+2 ) (x − x0 )2 + · · ·
+ (an − bn ) (x − x0 )n−k +
o ((x − x0 )n )
.
(x − x0 )k
(8.11.14)
Passando al limite per x → x0 vediamo che il secondo membro di (8.11.14) tende
a 0. Quindi ak − bk = 0, assurdo.
8.12
1) Sia
Esempi sulla formula di Taylor
P (x) = c0 + c1 x + c2 x2 + · · · + cn xn
un polinomio di grado n. Questa funzione è derivabile infinite volte e tutte le
sue derivate di ordine maggiore di n sono nulle.
Fissati due qualsiasi numeri x0 e x, possiamo scrivere la formula di Taylor
con resto di Lagrange arrestata all’ordine n+1 con punto iniziale x0 e incremento
(x − x0 ). Tuttavia tale resto è nullo, poiché P (n+1) (x) = 0 per ogni x. Quindi
si ha
00
P 0 (x0 )
P (x0 )
P
P (x) = P (x0 ) +
(x − x0 ) +
(x − x0 )2 + · · · +
1!
2!
(n)
(x0 )
(x − x0 )n ,
2!
cioè P (x) coincide con il suo polinomio di Taylor n–esimo.
2) Sia f (x) = sin x e x0 = π/4. Calcoliamo la formula di Taylor arrestata
al terzo ordine con resto di Peano. Si ha
1
f (π/4) = sin π/4 = √
2
1
f 0 (π/4) = cos π/4 = √
2
1
f 00 (π/4) = − sin π/4 = − √
2
1
f 000 (π/4) = − cos π/4 = − √ .
2
Quindi
µ³
¶
1 ³
π´
1 ³
π ´2
1 ³
π ´3
π ´3
1
− √ x−
− √ x−
+o x −
.
sin x = √ + √ x −
4
4
4
4
2
2
2 2
6 2
3) Sia f (x) = log(2 + x + x2 ) e sia x0 = −1. Calcoliamo la formula di Taylor
arrestata al secondo ordine con resto di Peano. Si ha
f 0 (x) =
1 + 2x
,
2 + x + x2
f 00 (x) =
3 − 2x − 2x2
2,
(2 + x + x2 )
8.12. Esempi sulla formula di Taylor
239
da cui f (−1) = log 2, f 0 (−1) = −1/2, f 00 (−1) = 3/4. Quindi
1
3
2
log(2 + x + x2 ) = log 2 − (x + 1) + (x + 1)2 + o((x + 1) ).
2
8
Se x0 = 0 la formula di Taylor con resto di Peano assume il nome di formula
di McLaurin e il relativo polinomio di Taylor si chiama polinomio di McLaurin.
Nel seguito calcoliamo la formula di McLaurin con resto di Peano arrestata
all’ordine n per alcune funzioni elementari, tenendo conto dell’espressione per
le derivate di ordine superiore di tali funzioni calcolate nel paragrafo 8.10.
Esponenziale e funzioni iperboliche Per ogni n la derivata n–esima di ex
è ex stessa e quindi vale 1 in x = 0. Si ha
ex = 1 +
x
x2
x3
xn
+
+
+ ··· +
+ o (xn ) .
1!
2!
3!
n!
Le derivate pari di sinh x coincidono con sinh x, e quindi sono nulle in x = 0,
mentre le derivate dispari coincidono con cosh x e quindi valgono 1 in x = 0.
Scriviamo la formula di McLaurin arrestata a un ordine dispari:
sinh x =
¡
¢
x
x3
x5
x2n+1
+
+
+ ··· +
+ o x2n+1 .
1!
3!
5!
(2n + 1)!
Ad esempio, per 2n + 1 = 3 si ha
sinh x = x +
x3
+ o(x3 ).
3!
Dato che il termine successivo è x5 /5! , in realtà l’o piccolo è o(x4 ).
Analogamente, in x = 0 le derivate dispari del coseno iperbolico sono nulle,
mentre le derivate pari valgono 1. Scrivamo la formla di McLaurin arrestata a
un ordine pari:
cosh x = 1 +
¡
¢
x2
x4
x2n
+
+ ··· +
+ o x2n .
2!
4!
(2n)!
Ad esempio, per 2n + 2 = 2 si ha
cosh x = 1 +
x2
+ o(x2 ).
2!
Anche in questo caso, dato che il termine successivo è x4 /4! , in realtà l’o piccolo
è o(x3 ).
Funzioni circolari Le derivate di ordine pari del seno sono ± sin x, e quindi
nulle in x = 0. Le derivate dispari sono ± cos x e valgono ±1 in x = 0. Si ha
sin x =
¡
¢
x3
x5
x7
x2n+1
x
−
+
−
+ · · · + (−1)n
+ o x2n+1 .
1!
3!
5!
7!
(2n + 1)!
240
8. Calcolo differenziale
Per 2n + 1 = 3 si ha
x3
+ o(x3 ).
1!
Dato che il termine successivo è x5 /5! , anche in questo caso l’o piccolo è in
realtà o(x4 ).
In x = 0 le derivate le derivate dispari del coseno sono nulle, mentre le
derivate pari valgono ∓1. Si ha
¢
¡
x4
x6
x2n
x2
+
−
+ · · · + (−1)n
+ o x2n .
cos x = 1 −
2!
4!
6!
(2n)!
sin x = x −
Ad esempio, per 2n + 2 = 2 si ha
x2
+ o(x2 ).
2!
Il termine successivo è x4 /4! e quindi l’o piccolo è in realtà o(x3 ).
cos x = 1 −
Logaritmo
x > −1
Ricordando l’espressione delle derivate di log(1+x), si ottiene per
x2
x3
x4
xn
+
−
+ · · · + (−1)n−1
+ o (xn ) .
2
3
4
n
Per n = 2 si ha ad esempio
log(1 + x) = x −
log(1 + x) = x −
x2
+ o(x2 ).
2
Potenze Sia α 6= 0 un numero reale non appartenente a N. Si ha per x > −1
µ ¶
µ ¶
µ ¶
α
α 2
α n
(1 + x)α = 1 +
x+
x + ··· +
x + o(xn ).
1
2
n
Ad esempio, se α = 1/2 e n = 2 si ha
√
1
1
1 + x = 1 + x − x2 + o(x2 ).
2
8
Se α = n è intero positivo, (1 + x)n è un polinomio di grado n e quindi
coincide con il suo polinomio di McLaurin n−esimo. Possiamo usare la formula
di McLaurin per ricavare l’espressione della potenza n−esima di un binomio. Si
ha infatti
µ ¶
µ ¶
µ ¶
n
n 2
n n
(1 + x)n = 1 +
x+
x + ··· +
x
1
2
n
n µ ¶
X
n k
x .
=
k
k=0
b
Ponendo ora x = ed eseguendo le semplificazioni, si ottiene la nota formula
a
n µ ¶
X
n n−k k
a
b .
(a + b)n =
k
k=0
8.12. Esempi sulla formula di Taylor
241
Inverse delle funzioni trigonometriche Ricaviamo la formula di McLaurin
arrestata al terzo ordine dell’arcotangente. Tenendo conto che arctan 0 = 0 e
dei calcoli svolti nell’esempio 8.10.3.7, si ottiene
arctan x = x −
x3
+ o(x3 ) .
3
Si può dimostrare che per ogni intero n > 0 si ha
arctan x = x −
¢
¡
x5
x2n+1
x3
+
+ · · · + (−1)n
+ o x2n+1 .
3
5
2n + 1
Con semplici calcoli si ricava pure la formula arrestata al terzo ordine per
arcsin x.
x3
arcsin x = x +
+ o(x3 ).
6
Si può anche dimostrare che per ogni intero n > 0 vale la formula
arcsin x = x +
¢
¡
1 x3 1 · 3 x5
1 · 3 · 5 · 7 · · · (2n − 1) x2n+1
+
+···+
+ o x2n+1 .
2 3
2·4 5
2 · 4 · 6 · 8 · · · 2n 2n + 1
Lo sviluppo di arccos x si ottiene da quello di arcsin x, osservando che arccos x =
π
2 − arcsin x.
Applicazioni del teorema di unicità dello sviluppo Si voglia scrivere la
formula di McLaurin di sin x5 arrestata al quindicesimo ordine. Non è necessario
eseguire quindici derivate. Infatti, posto z = x5 , si ha
sin z = z −
z3
+ o(z 3 ).
6
Sostituendo a z il valore x5 si ottiene
sin x5 = x5 −
x15
+ o(x15 ).
6
Per il Teorema di unicità dello sviluppo, questa espressione coincide con la
formula di McLaurin arrestata al quindicesimo ordine.
Calcoliamo ora la formula di McLaurin per log2 (1 + x) arrestata al terzo
ordine. Si ha
µ
¶2
x2
2
2
log (1 + x) = x −
+ o(x )
2
¸
· 4
¡ 2 ¢2
x
2
2
2
2
3
+ o(x ) + 2xo(x ) − x o(x ) .
=x −x +
4
Si verifica immediatamente che il termine in parentesi quadrata è o(x3 ) e quindi
la formula cercata è
log2 (1 + x) = x2 − x3 + o(x3 ).
242
8. Calcolo differenziale
Si noti che è bastato sviluppare log(1 + x) al secondo ordine e poi calcolare il
quadrato di questo sviluppo. Sviluppando log(1 + x) al terzo ordine, si giunge
al medesimo risultato. Infatti, passando al quadrato, i termini aggiuntivi danno
luogo a infinitesimi di ordine superiore al terzo. In altri casi può essere invece
necessario sviluppare fino al terzo ordine.
8.13
Convessità, concavità, flessi.
Definizione 8.13.1 Sia I ⊆ R un intervallo e sia f : I → R. Si dice che f è
convessa in I se per ogni terna di punti x1 < x < x2 di I si ha
f (x) ≤ f (x1 ) +
f (x2 ) − f (x1 )
(x − x1 ).
x2 − x1
(8.13.2)
f (x2 ) − f (x1 )
(x − x1 ).
x2 − x1
(8.13.3)
Si dice che f è concava in I se
f (x) ≥ f (x1 ) +
f(x1)
f(x2)
f(x)
x1
x
x2
Funzione strettamente convessa
La diseguaglianza (8.13.2) ha un evidente significato geometrico: il grafico
della funzione sta non al di sopra del segmento che unisce i punti (x1 , f (x1 )) e
(x2 , f (x2 )). Infatti l’espressione a destra in (8.13.2) è l’ordinata della retta che
congiunge tali punti.
Se la funzione è concava il suo grafico sta non al di sotto del segmento.
Evidentemente f è convessa se e solo se −f è concava.
Se la diseguaglianza in (8.13.2) vale in senso forte, cioè con il segno < per
ogni x1 < x < x2 , si dice che f è strettamente convessa in I. Analoga definizione
vale per la concavità stretta.
8.13. Convessità, concavità, flessi.
243
Funzione concava ma non strettamente concava
Esempi 8.13.4
1. La funzione f (x) = |x| è strettamente convessa in R, come pure le funzioni
x2n con n ∈ N.
2. Ogni funzione lineare f (x) = mx + q è sia convessa che concava in R.
3. La funzione f (x) = sin x è strettamente concava in [0, π] e strettamente
convessa in [π, 2π].
4. La funzione che vale −(x + 1) per x ≤ −1, vale 0 per |x| < 1 e vale x − 1
per x ≥ 1 è convesssa, ma non strettamente convessa in R.
5. Si può dimostrare che f è convessa se e solo se il suo sopragrafo, cioè la
regione di piano {(x, y) : x ∈ I, y ≥ f (x)}, è un insieme convesso nel senso
usuale: il segmento che unisce due punti del sopragrafo è tutto contenuto
nel sopragrafo stesso.
In questo paragrafo studieremo le funzioni convesse (e concave) sotto l’ipotesi che esse siano derivabili due volte in I. Nell’Appendice accenneremo alle
proprietà delle funzioni convesse senza questa ipotesi di derivabilità.
Prima di caratterizzare la concavità e la convessità, riscriviamo la (8.13.2) in
un modo equivalente ma più adatto ai nostri scopi. La diseguaglianza (8.13.2)
equivale a
(x2 − x1 ) (f (x) − f (x1 )) ≤ (f (x2 ) − f (x1 )) (x − x1 ).
(8.13.5)
Scriviamo ora x2 − x1 = (x2 − x) + (x − x1 ). La (8.13.5) diviene
(x2 − x) (f (x) − f (x1 )) ≤ (x − x1 ) (f (x2 ) − f (x1 ) − f (x) + f (x1 ))
= (x − x1 ) (f (x2 ) − f (x))
che a sua volta è equivalente a
f (x2 ) − f (x)
f (x) − f (x2 )
f (x) − f (x1 )
≤
=
.
x − x1
x2 − x
x − x2
(8.13.6)
244
8. Calcolo differenziale
per ogni x1 < x < x2 . Analogamente, nel caso in cui f sia concava, (8.13.3)
equivale a
f (x) − f (x1 )
f (x2 ) − f (x)
f (x) − f (x2 )
≥
=
.
x − x1
x2 − x
x − x2
Teorema 8.13.7 Sia I ⊆ R un intervallo e sia f : I → R una funzione
derivabile due volte in I.
Condizione necessaria e sufficiente affinché f sia convessa è che f 00 (x) ≥ 0
per ogni x ∈ I.
Condizione necessaria e sufficiente affinché f sia concava è che f 00 (x) ≤ 0
per ogni x ∈ I.
Dimostrazione. Dimostriamo l’asserto per le convessità. Supponiamo f convessa e dimostriamo che f 0 (x) è monotona non decrescente.
Facendo tendere x a x1 in (8.13.6) si ottiene
f 0 (x1 ) ≤
f (x2 ) − f (x1 )
.
x2 − x1
(8.13.8)
Facendo invece tendere x a x2 , sempre in (8.13.6), si ottiene
f (x2 ) − f (x1 )
≤ f 0 (x2 ).
x2 − x1
(8.13.9)
Da (8.13.8) e (8.13.9) si ottiene, per ogni x1 < x2 ,
f 0 (x1 ) ≤
f (x2 ) − f (x1 )
≤ f 0 (x2 ).
x2 − x1
(8.13.10)
Abbiamo cosı̀ dimostrato che f 0 (x) è non decrescente. Ne segue f 00 (x) ≥ 0.
Supponiamo ora che f 00 (x) ≥ 0 per ogni x. Dobbiamo dimostrare che vale
la (8.13.6) per ogni x1 < x < x2 .
Applichiamo il Teorema di Lagrange agli intervalli [x1 , x] e [x, x2 ]. Esistono
z1 ∈ (x1 , x) e z2 ∈ (x, x2 ) tali che
f (x) − f (x1 )
= f 0 (z1 )
x − x1
f (x2 ) − f (x)
= f 0 (z2 ).
x2 − x
La derivata prima è non decrescente, poiché f 00 (x) ≥ 0. Quindi f 0 (z1 ) ≤ f 0 (z2 ).
Ne segue (8.13.6).
Non è difficile dedurre dai ragionamenti impiegati nella dimostrazione che f
è strettamente convessa in I se e solo se f 00 (x) ≥ 0 per ogni x e i punti in cui
f 00 (x) = 0 sono isolati.
La convessità e la concavità possono anche essere caratterizzate mediante la
posizione del grafico rispetto alla tangente in ogni x0 ∈ I.
8.13. Convessità, concavità, flessi.
245
Teorema 8.13.11 Sia I ⊆ R un intervallo e sia f : I → R derivabile due volte
in I. Condizione necessaria e sufficiente affinché f sia convessa è che
∀ x0 , x ∈ I
f (x) ≥ f (x0 ) + (x − x0 )f 0 (x0 ).
(8.13.12)
Condizione necessaria e suffciente affinché sia concava è che per
∀ x0 , x ∈ I
f (x) ≤ f (x0 ) + (x − x0 )f 0 (x0 ).
Dimostrazione. Dimostriamo l’asserto per la convessità. Supponiamo che
valga la (8.13.12). Scriviamo la formula di Taylor con resto di Peano arrestata
al secondo ordine con punto iniziale x0 . Si ha, per ogni x ∈ I,
f (x) = f (x0 ) + (x − x0 )f 0 (x0 ) +
¡
¢
(x − x0 )2 00
f (x0 ) + o (x − x0 )2
2
ovvero
Ã
f (x) − f (x0 ) − (x − x0 )f 0 (x0 ) = (x − x0 )2
¡
¢!
o (x − x0 )2
1 00
f (x0 ) +
.
2
(x − x0 )2
Sia per assurdo f 00 (x0 ) < 0. Allora esiste un intorno B(x0 , δ) di x0 (intorno destro o sinistro, se x0 è un estremo dell’intervallo) tale che per ogni x ∈ B(x0 , δ),
x 6= x0 , si ha
¡
¢
o (x − x0 )2
1 00
f (x0 ) +
< 0.
2
(x − x0 )2
In tale intorno quindi, si ha f (x) < f (x0 ) − (x − x0 )f 0 (x0 ), contro l’ipotesi. Ne
segue f 00 (x0 ) ≥ 0 per ogni x0 ∈ I e quindi la convessità di f per il Teorema
precedente.
Viceversa, sia f convessa. In questo caso sappiamo che f 0 (x0 ) ≥ 0 per
ogni x0 ∈ I. Scriviamo la formula di Taylor con resto di Lagrange arrestata al
secondo ordine con punto iniziale x0 . Per ogni x ∈ I esiste θ ∈ (0, 1) tale che
f (x) = f (x0 ) + (x − x0 )f 0 (x0 ) +
(x − x0 )2 00
f (x0 + θ(x − x0 ))
2
ossia
f (x) − f (x0 ) − (x − x0 )f 0 (x0 ) =
Quindi (8.13.12) vale.
(x − x0 )2 00
f (x0 + θ(x − x0 )) ≥ 0.
2
246
8. Calcolo differenziale
Funzione convessa e tangente al grafico
Il significato della condizione (8.13.12) è evidente: f è convessa se e solo se il
grafico della funzione sta al di sopra (non al di sotto) della tangente in qualunque
punto x0 ∈ I. Analogamente, f è concava se e solo se il grafico della funzione
sta al di sotto (non al di sopra) della tangente in qualunque punto x0 ∈ I. In
altri termini, la tangente divide il piano in due semipiani e il grafico di una
funzione convessa (concava) sta nel semipiano superiore (inferiore).
Definizione 8.13.13 Sia f : (x0 − δ, x0 + δ) → R derivabile una volta in x0 .
Si dice che x0 è un punto di flesso ascendente se
f (x) ≤ f (x0 ) + (x − x0 )f 0 (x0 )
f (x) ≥ f (x0 ) + (x − x0 )f 0 (x0 )
per x ∈ (x0 − δ, x0 ]
per x ∈ [x0 , x0 + δ).
(8.13.14)
(8.13.15)
Si dice che x0 è un punto di flesso discendente se
f (x) ≥ f (x0 ) + (x − x0 )f 0 (x0 )
f (x) ≤ f (x0 ) + (x − x0 )f 0 (x0 )
per x ∈ (x0 − δ, x0 ]
per x ∈ [x0 , x0 + δ).
Il punto (x0 , f (x0 )) viene chiamato flesso (ascendente o discendente) per il
grafico della funzione.
La tangente in un punto x0 divide il piano in due semipiani. Un punto di
flesso ascendente (discendente) è un punto in cui il grafico, al passare di x da
sinistra a destra di x0 , passa dal semipiano inferiore (superiore) al semipiano
superiore (inferiore).
Se x0 è un punto di tangente verticale, si dice che x0 è un punto di flesso a
tangente verticale. In questo caso il grafico passa dal semipiano sinistro a quello
√
2n+1
x,
destro rispetto alla tangente x = x0 . Ad esempio, ogni funzione f (x) =
con n ∈ N, ha in x0 = 0 un punto di flesso a tangente verticale.
Si ha una condizione necessaria, simile al Teoema di Fermat, affinché x0 sia
punto di flesso per una funzione due volte derivabile in tal punto.
Teorema 8.13.16 Sia f : (x0 − δ, x0 + δ) → R derivabile due volte in x0 . Se
x0 è un punto di flesso, allora f 00 (x0 ) = 0.
8.13. Convessità, concavità, flessi.
247
Dimostrazione. Sia per assurdo f 00 (x0 ) 6= 0 e, per fissare le idee, sia f 00 (x0 ) <
0. Come nella dimostrazione del Teorema precedente, scriviamo formula di
Taylor con resto di Peano arrestata al secondo ordine con punto iniziale x0 . Si
ha
Ã
¡
¢!
o (x − x0 )2
1 00
0
2
f (x) − f (x0 ) − (x − x0 )f (x0 ) = (x − x0 )
f (x0 ) +
.
2
(x − x0 )2
Esiste δ1 < δ tale che per ogni x ∈ (x0 − δ1 , x0 + δ1 ), x 6= x0 , si abbia
¡
¢
o (x − x0 )2
1 00
f (x0 ) +
<0
2
(x − x0 )2
Quindi f (x) < f (x0 ) − (x − x0 )f 0 (x0 ) sia a destra che a sinistra di x0 , contro
l’ipotesi che x0 sia un punto di flesso.
La condizione f 00 (x0 ) = 0 è necessaria ma non sufficiente affinché x0 sia un
punto di flesso. Ad esempio f 00 (x) = x4 è convessa in R, poiché f 00 (x) = 12x2 ≥
0. Il punto x0 = 0 in cui si annulla la derivata seconda non è un punto di flesso.
Se f è concava (rispettivamente, convessa) in (x0 − δ, x0 ] e convessa (rispettivamente, concava) in [x0 , x0 + δ), allora x0 è un punto di flesso ascendente
(rispettivamente, discendente). Si ha cosı̀ una condizione sufficiente affinché x0
sia un punto di flesso.
Corollario 8.13.17 Sia f : (x0 − δ, x0 + δ) → R derivabile due volte in (x0 −
δ, x0 + δ). Sia f 00 (x0 ) = 0.
a) Se f 00 (x) < 0 per x ∈ (x0 − δ, x0 ) e f 00 (x) > 0 per x ∈ (x0 , x0 + δ), allora x0
è un punto di flesso ascendente.
b) Se f 00 (x) > 0 per x ∈ (x0 − δ, x0 ) e f 00 (x) < 0 per x ∈ (x0 , x0 + δ), allora x0
è un punto di flesso discendente.
Dimostrazione. Ad esempio, nel caso a) f è concava in (x0 − δ, x0 ] e convessa
in [x0 , x0 + δ).
Se f : (x0 − δ, x0 + δ) → R è derivabile in questo intervallo e se f 0 (x0 ) = 0,
la condizione
f 0 (x) > 0 per x ∈ (x0 − δ, x0 ) ∪ (x0 , x0 + δ),
(8.13.18)
implica che x0 sia un punto di flesso ascendente. Infatti, in questo caso la
tangente è la retta y = f (x0 ) e la funzione è monotona strettamente crescente.
Quindi (8.13.18) implica
f (x) ≤ f (x0 ) per
x ∈ (x0 − δ, x0 ],
f (x) ≥ f (x0 ) per
x ∈ [x0 , x0 + δ),
ovvero (8.13.14) e (8.13.15). Se invece f 0 (x0 ) = 0 e la derivata è negativa negli
altri punti di (x0 − δ, x0 + δ), lo stesso ragionamento mostra che x0 è un punto
248
8. Calcolo differenziale
di flesso discendente. Questi punti di flesso vengono chiamati punti di flesso a
tangente orizzontale.
Ad esempio, le funzioni f (x) = x2n+1 , con n ∈ N, hanno in x0 = 0 un punto
di flesso ascendente a tangente orizzontale.
Flessi ascendenti
Flessi discendenti
Sottolineiamo che il termine ‘ascendente’ non si riferisce alla monotonia della
funzione, ma al passaggio dalla concavità alla convessità. Analoga osservazione
vale per il termine ’discendente’.
Flesso a tangente orizontale e flesso a tangente verticale
8.14. Asintoti obliqui
8.14
249
Asintoti obliqui
Definizione 8.14.1 Sia f : (a, +∞) → R (oppure f : (−∞, a) → R). Si dice
che la retta y = mx + q è un asintoto obliquo al grafico di f per x → +∞ (o
per x → −∞) se
lim [f (x) − mx − q] = 0,
x→+∞
(rispettivamente,
lim [f (x) − mx − q] = 0)
x→−∞
(8.14.2)
Si noti che se m = 0 la retta si riduce ad un asintoto orizzontale.
f (x) = x arctan x3
Esempi 8.14.3
1
1. Sia f (x) = x + , definita per x 6= 0. Oltre ad ammettere la retta x = 0
x
come asintoto verticale, il grafico di questa funzione ammette la retta
y = x come asintoto obliquo, sia per x → +∞ che per x → −∞.
2. Sia f (x) = x arctan x3 . Il grafico di questa funzione ammette la retta
π
π
y = x come asintoto obliquo per x → +∞ e la retta y = − x come
2
2
asintoto obliquo per x → −∞. Infatti, ricordando l’identità (8.8.5), si ha
per x → +∞
x arctan x3 −
π
1
x
x = −x arctan 3 ∼ − 3 → 0.
2
x
x
Analogamente, ricordando (8.8.6), si ha per x → −∞
x arctan x3 +
1
x
π
x = −x arctan 3 ∼ − 3 → 0.
2
x
x
Teorema 8.14.4 Sia f : (a, +∞) → R. Condizione necessaria e sufficiente
affinché la retta y = mx + q sia asintoto obliquo al grafico di f per x → +∞ è
che:
250
8. Calcolo differenziale
i) esista finito limx→+∞
f (x)
= m;
x
ii) esista finito limx→+∞ [f (x) − mx] = q.
Se f : (−∞, a) → R, le analoghe condizioni sono necessarie e sufficienti
affinché y = mx + q sia asintoto obliquo al grafico di f per x → −∞.
Dimostrazione. Le condizioni sono necessarie. Sia y = mx+q asintoto obliquo
per x → +∞. Si ha, per x → +∞,
f (x) − mx − q → 0
(8.14.5)
da cui
f (x)
q
− m − → 0.
x
x
Poiché q/x tende a 0, deve necessariamente verificarsi la i). Ovviamente (8.14.5)
implica ii).
Le condizioni sono sufficienti. Supponiamo che valga i) e che la differenza
f (x) − mx tenda a q. Allora, ovviamente, f (x) − mx − q → 0 per x → +∞.
Sia f derivabile in (a, +∞) e tenda a ±∞ per x → +∞. Supponiamo che
esista limx→+∞ f 0 (x) = γ. Allora, per il Teorema di De l’Hospital, anche f (x)/x
tende a γ. Abbiamo quindi il seguente Corollario.
Corollario 8.14.6 Sia f : (a, +∞) → R derivabile in tale intervallo. Sia
f (x) → ±∞ per x → +∞. Condizione sufficiente affinché la retta y = mx + q
sia asintoto obliquo al grafico di f per x → +∞ è che:
i) esista finito limx→+∞ f 0 (x) = m;
ii) esista finito limx→+∞ [f (x) − mx] = q.
Se limx→+∞ f 0 (x) = ±∞, allora non esiste asintoto obliquo per x → +∞.
La medesima proposizione vale per gli asintoti obliqui per x → −∞.
Esempi 8.14.7
1. Sia f (x) = 2x + tanh x + e−x . Applichiamo il Corollario per x → +∞. Si
ha
1
f 0 (x) = 2 +
− e−x → 2.
cosh2 x
Inoltre, sempre per x → +∞
f (x) − 2x = tanh x + e−x → 1.
Quindi la retta y = 2x + 1 è asintoto obliquo per x → +∞. Non esistono
invece asintoti obliqui per x → −∞, poiché f 0 (x) → −∞ per x → −∞.
8.15. Appendice
2. Sia f (x) = x +
251
sin x2
. Il limite della derivata non esiste, poiché
x
f 0 (x) = 1 + 2 cos x2 −
sin x2
x2
non ammette limite per x → +∞ né per x → −∞. Tuttavia possiamo
vedere direttamente che
f (x) − x =
sin x2
→0
x
per x → ±∞.
Quindi y = x è asintoto obliquo sia per x → +∞ che per x → −∞.
Possiamo dedurre questo risultato anche dal Teorema 8.14.4. Si ha, sia
per x → +∞ che per x → −∞,
sin x2
f (x)
=1+
→1=m
x
x2
sin x2
f (x) − x =
→0=q
x
f (x) = x +
8.15
8.15.1
sin x2
x
Appendice
Dimostrazione del Teorema di De l’Hospital
Dimostriamo la tesi nel caso che il limite sia per x → a+. La dimostrazione per
x → b− è del tutto simile.
Sia dapprima −∞ ≤ γ < +∞. Si fissi un numero reale v1 > γ, e sia u tale
che γ < u < v1 . Esiste c ∈ (a, b) tale che per ogni x ∈ (a, c) si abbia
f 0 (x)
< u.
g 0 (x)
252
8. Calcolo differenziale
Si fissi x ∈ (a, c). Poiché g(y) → 0 oppure g(y) → ±∞ per y → a+, esiste c1 ,
con a < c1 < x, tale che per ogni a < y < c1 si ha g(x) 6= g(y).
Possiamo applicare il Teorema di Cauchy all’intervallo [y, x]. Esiste z ∈ (y, x)
tale che
f (x) − f (y)
f 0 (z)
= 0
< u.
(8.15.1)
g(x) − g(y)
g (z)
Questa diseguaglianza vale per ogni x ∈ (a, c) e ogni y ∈ (a, c1 ) , ove c1 < x.
Distinguiamo ora i due casi.
0
a) Supponiamo che si abbia la forma di indecisione e passiamo al limite
0
per y → a+ in (8.15.1). Si ottiene la diseguaglianza
f (x)
≤ u < v1 ,
g(x)
(8.15.2)
valida per ogni x ∈ (a, c).
∞
b) Supponiamo ora che si abbia la forma di indecisione
. Sia, per ogni x
∞
fissato in (a, c),
·
¸·
¸−1
f (x)
g(x)
ψ(y) =
−1
−1
f (y)
g(y)
Evidentemente ψ(y) → 1 per y → a. Da (8.15.1) si ottiene
f (y)
ψ(y) < u,
g(y)
ossia
lim sup
y→a+
f (y)
≤u
g(y)
Esiste quindi c2 < c1 tale che per ogni y ∈ (a, c2 ) si ha
f (y)
< v1 .
g(y)
(8.15.3)
Tenendo conto di (8.15.2) e (8.15.3), vediamo che, in ambedue i casi, fissato
un numero qualsiasi v1 > γ esiste c2 > a tale che
∀x ∈ (a, c2 )
f (x)
< v1 .
g(x)
(8.15.4)
Se −∞ < γ ≤ +∞ si dimostra allo stesso modo che, fissato un qualsiasi
numero reale v2 < γ, esiste c3 > a tale che
∀x ∈ (a, c3 )
Per l’arbitrarietà di v1 e v2 si ha:
se γ = −∞ (8.15.4) implica limx→a+
f (x)
> v2 .
g(x)
f (x)
= −∞;
g(x)
(8.15.5)
8.15. Appendice
253
se γ = +∞ (8.15.5) implica limx→a+
f (x)
= +∞;
g(x)
se −∞ < γ < +∞, (8.15.4) e (8.15.5) assieme implicano limx→a+
8.15.2
f (x)
= γ.
g(x)
Convessità
Le funzioni convesse (e quelle concave) in un intervallo possiedono notevoli
proprietà di regolarità.
Teorema 8.15.6 Se f è convessa in un intervallo (a, b) (senza ulteriori ipotesi
sulla funzione) allora f possiede derivata destra e sinistra in ogni punto di (a, b).
Dimostrazione. Infatti, riscriviamo la (8.13.2) come
f (x) − f (x1 )
f (x2 ) − f (x1 )
≤
,
x − x1
x2 − x1
(8.15.7)
valida per ogni x1 < x < x2 . Questa diseguaglianza implica che il rapporto
incrementale destro con punto iniziale x1 è monotono non decrescente. Inoltre,
è anche limitato inferiormente poiché, se x0 < x1 < x, la (8.15.7) diviene
f (x0 ) − f (x1 )
f (x) − f (x1 )
≤
.
x0 − x1
x − x1
Quindi esiste finito per ogni x1
lim
x→x1+
f (x) − f (x1 )
0
(x1 )
= f+
x − x1
In modo analogo si vede che esiste la derivata sinistra in ogni punto di (a, b).
Infatti, sempre per x1 < x < x2 , la condizione (8.13.2) di convessità si può
scrivere equivalentemente come
f (x) ≤ f (x2 ) +
f (x1 ) − f (x2 )
(x − x2 ),
x1 − x2
da cui
f (x) − f (x2 )
f (x1 ) − f (x2 )
≥
.
x − x2
x1 − x2
Da qui si vede che il rapporto incrementale sinistro con punto iniziale x2 è non
decrescente e che (ragionando in modo a analogo al caso precedente) è limitato
superiormente. Ne segue che esiste finito per ogni x2
lim
x→x2−
f (x) − f (x2 )
= f− (x2 ).
x − x2
Corollario 8.15.8 Se f è convessa in un intervallo (a, b) allora è continua in
(a, b).
254
8. Calcolo differenziale
Dimostrazione. Infatti f è continua da destra e da sinistra in ogni punto di
(a, b).
Teorema 8.15.9 Sia f è convessa in un intervallo (a, b). Allora f è derivabile
in (a, b) eccetto un insieme al più numerabile di punti angolosi.
Dimostrazione. Passiamo al limite in (8.15.7) per x → x1 + e ricordiamo che
il rapporto incrementale sinistro è monotono non decrescente, per cui
f (x2 ) − f (x1 )
≤ f− (x2 ).
x2 − x1
Otteniamo, per ogni x1 < x2 ,
0
0
f+
(x1 ) ≤ f−
(x2 ).
(8.15.10)
In (8.15.7) facciamo ora tendere x1 a x− e, successivamente, x2 a x+. Si ottiene
per ogni x
0
0
f−
(x) ≤ f+
(x).
(8.15.11)
Combinando (8.15.10) e (8.15.11) si ha, per ogni x1 < x2 ,
0
0
0
0
f−
(x1 ) ≤ f+
(x1 ) ≤ f−
(x2 ) ≤ f+
(x2 ).
(8.15.12)
0
Poniamo, per ogni x ∈ (a, b), F (x) = f+
(x) − f 0 (x). Evidentemente f è derivabile in x e solo se F (x) = 0. Se, per assurdo, l’insieme dei punti in cui F (x) > 0
non è numerabile, esiste [c, d] ⊂ (a, b) tale che
E = {x ∈ [c, d] : F (x) > 0}
non è numerabile. Per ogni n > 0 intero poniamo
En = {x ∈ [c, d] : F (x) > 1/n} .
Poiché ∪+∞
n=1 En = E, esiste n tale che En è infinito. Siano
c < x1 < x2 < · · · < xk < d
k punti di En . Per j = 1 . . . k si ha
0
F (xj ) = f+
(xj ) − f 0 (xj ) > 1/n.
. Per (8.15.12) si ha
0
0
0
0
0
0
0
f+
(a) ≤ f−
(x1 ) ≤ f+
(x1 ) ≤ f−
(x2 ) ≤ f+
(x2 ) ≤ · · · ≤ f+
(xk ) ≤ f−
(d).
Quindi
0
0
f−
(c) − f+
(c) ≥
k
X
¡
j=1
¢ k
0
0
f+
(xj ) − f−
(xj ) > .
n
Facendo tendere k a +∞ si arriva all’assurdo.
8.15. Appendice
8.15.3
255
Estremanti e punti di flesso
La formula di Taylor con resto di Peano implica una condizione sufficiente,
basata sulle derivate successive, affinché un punto x0 sia un estremante o un
punto di flesso,
Teorema 8.15.13 Sia f : (a, b) → R derivabile n ≥ 2 volte in x0 . Sia
f 0 (x0 ) = f 00 (x0 ) = · · · = f (n−1) (x0 ) = 0.
Sia f (n) (x0 ) 6= 0.
a) Se n è pari, x0 è un estremante. Precisamente, x0 è punto di minimo se
f (n) (x0 ) > 0, di massimo se f (n) (x0 ) < 0.
b) Se n è dispari, x0 è un punto di flesso a tangente orizzontale, ascendente se
f (n) (x0 ) > 0, discendente se f (n) (x0 ) < 0.
Dimostrazione. Si ha per ogni x ∈ (a, b)
f (n) (x0 )
+ o ((x − x0 )n )
n!
µ (n)
¶
f (x0 ) o ((x − x0 )n )
n
= (x − x0 )
+
.
n!
(x − x0 )n
f (x) − f (x0 ) = (x − x0 )n
Esiste δ > 0 tale che per |x − x0 | < δ, x 6= x0 , il segno di
f (n) (x0 ) o (((x − x0 )n )
+
n!
(x − x0 )n
coincide con il segno di f (n) (x0 ). Per n pari si ha, per tali x,
f (x) − f (x0 ) ≷ 0
(n)
a seconda che f (x0 ) ≷ 0. Se invece n è dispari, f (x) − f (x0 ) cambia di segno
al passaggio di x da sinistra a destra di x0 .
Teorema 8.15.14 Sia f : (a, b) → R derivabile n ≥ 3 volte in x0 . Sia
f 00 (x0 ) = f 000 (x0 ) = · · · = f (n−1) (x0 ) = 0.
Sia f (n) (x0 ) 6= 0. Allora
a) Se n è dispari, x0 è un punto di flesso. Precisamente x0 è un punto di flesso
ascendente se f (n) (x0 ) > 0, discendente se f (n) (x0 ) < 0.
b) Se n è pari, x0 non è un punto di un flesso.
Dimostrazione. Si ragiona come nel Teorema precedente. Si ha per ogni
x ∈ (a, b)
f (n) (x0 )
+ o ((x − x0 )n ) .
n!
Come prima esiste δ > 0 tale che per |x − x0 | < δ, x 6= x0 , il segno del termine
di sinistra è il segno di f (n) (x0 ) se n è pari, mentre cambia passando da sinistra
a destra di x0 se n è dispari.
f (x) − f (x0 ) − f 0 (x0 )(x − x0 ) = (x − x0 )n
256
8.15.4
8. Calcolo differenziale
Serie di Taylor
Se una funzione f : (a, b) → R è derivabile infinite volte in x0 , si può scrivere la
sua formula di Taylor arrestata a qualunque n. Il polinomio di Taylor n−esimo
pn (x) = f (x0 ) + f 0 (x0 )(x − x0 ) +
f 00 (x0 )
f (n) (x0 )
(x − x0 )2 + · · · +
(x − x0 )n
2!
n!
è la somma parziale n−esima della serie
+∞ (k)
X
f (x0 )
k!
k=0
(x − x0 )k .
Tale serie si chiama serie di Taylor di f con centro in x0 . È naturale chiedersi
se tale serie converga e se converga a f (x), almeno per x abbastanza prossimo
a x0 .
Lo studio delle serie di Taylor, e delle serie di potenze in generale, esula dallo
scopo di queso testo. Tuttavia, possiamo ottenere alcuni risultati in maniera
elementare per le serie di McLaurin (con centro in x0 = 0) di alcune funzioni
studiate nel paragrafo 8.12.
Iniziamo con la funzione esponenziale ex . Il suo polinomio di McLaurin
n−esimo è
n
X
xn
pn (x) =
.
n!
k=0
Scrivendo la formula di McLaurin con resto di Lagrange, si ha che per ogni x e
ogni n esiste θn ∈ (0, 1) tale che
ex −
n
X
xk
k=0
k!
=
eθn x
xn+1 .
(n + 1)!
Poiché, per ogni x fissato,
eθn x
xn+1 → 0
(n + 1)!
per n → +∞,
possiamo asserire che per ogni x vale l’eguaglianza
ex =
+∞ k
X
x
k=0
k!
.
Esaminiamo ora la funzione sin x. Il suo polinomio di McLaurin di grado 2n + 1
è
n
X
x2k+1
.
p2n+1 (x) =
(−1)k
(2k + 1)!
k=0
Per ogni x e ogni n esiste θn ∈ (0, 1) tale che
sin x − p2n+1 (x) =
± sin(θn x) 2n+2
x
.
(2n + 2)!
8.15. Appendice
257
Il segno + o − dipende dalla parità di n. Anche in questo caso
± sin(θn x) 2n+2
x
→0
(2n + 2)!
per n → +∞.
Quindi per ogni x
sin x =
+∞
X
x2k+1
.
(2k + 1)!
(−1)k
k=0
In maniera analoga si vede che per ogni x
cos x =
+∞
X
(−1)k
k=0
x2k
.
(2k)!
Le stesse osservazioni si applicano alle funzioni sinh x e cosh x. Si ha per ogni x
sinh x =
+∞
X
x2k+1
,
(2k + 1)!
cosh x =
k=0
+∞
X
x2k
.
(2k)!
k=0
Si può dimostrare che per ogni −1 < x ≤ 1
log(1 + x) =
n
X
(−1)k−1
k=1
xk
.
k
(8.15.15)
Questa formula invece non vale per x > 1, dato che per tali x la serie di McLaurin
non converge.
Notiamo la formula, ottenuta da (8.15.15) con x = 1,
log 2 = −
+∞
X
(−1)k
k=1
k
.
Capitolo 9
Primitive
9.1
Introduzione
Definizione 9.1.1 Sia I ⊆ R un intervallo e sia f : I → R. Si dice che
una funzione ϕ : I → R è una primitiva di f in I se ϕ è derivabile in I e
ϕ0 (x) = f (x) per ogni x ∈ I.
Esempi 9.1.2
1. Sia f (x) = cos x. La funzione ϕ(x) = sin x + C è una primitiva di f in R,
qualunque sia il valore della costante C.
x2
+ C, per ogni valore della
2
costante C, è una primitiva di f in [0, 1). Tuttavia tale funzione non
è una primitiva di mant x nell’intervallo chiuso [0, 1], né su qualunque
intervallo contenente propriamente [0, 1).
2. Sia f (x) = mant x. La funzione ϕ(x) =
Il secondo esempio mostra che una funzione può essere primitiva della restrizione di f a un intervallo I, ma non della restrizione di f a un intervallo
contenente propriamente I.
In generale, non è detto che una funzione ammetta primitiva in un intervallo.
Infatti, se f ammette primitiva in I, allora f è una funzione derivata e quindi
deve possedere le proprietà delle funzioni derivate. In particolare, le discontinuità di f in I possono essere solo di seconda specie, per il Corollario 8.7.14. Ad
esempio, nessuna funzione ϕ può essere la primitiva di mant x in un intervallo
che contenga un punto ad ascissa intera. Infatti, la discontinuità della mantissa
in tali punti è di prima specie.
Evidentemente, se ϕ è una primitiva di f in I, anche ϕ + C, ove C è una
costante arbitraria, è una primitiva di f in I. Nel prossimo capitolo vedremo che
ogni funzione continua in I ammette ivi primitiva. Per il momento ci limitiamo
a notare che le formule per le derivate ottenute nel paragrafo 8.5 permettono
di dedurre le primitive di alcune funzioni elementari. Ad esempio, xn ammette
259
260
9. Primitive
xn+1
1
+ C, ammette come primitiva log |x| + C, etc. D’altra
n+1
x
parte, si può dimostrare che esistono funzioni elementari dell’analisi, come
come primitiva
ex
,
x
sin x
,
x
log(1 + x)
x
la cui primitiva non è una funzione elementare dell’analisi. I prossimi paragrafi
saranno dedicati allo studio di alcune classi di funzioni la cui primitiva può
essere espressa in termini elementari.
9.2
Regole di integrazione indefinita
Teorema 9.2.1 Sia I ⊆ R un intervallo e sia f : I → R. Supponiamo che f
ammetta una primitiva ϕ in I. Allora, tutte e sole le primitive di f in I sono
le funzioni
ϕ(x) + C, ove C è una costante arbitraria.
Dimostrazione. Se Dϕ(x) = f (x) per ogni x ∈ I, evidentemente
D (ϕ(x) + C) = Dϕ(x) = f (x),
qualunque sia la costante C. Viceversa, supponiamo che ϕ1 sia un’altra primitiva di f in I. Allora, per ogni x ∈ I
D(ϕ1 − ϕ)(x) = f (x) − f (x) = 0.
Per il Corollario 8.8.3 (caratterizzazione delle funzioni costanti) esiste una costante C tale che ϕ1 (x) − ϕ2 (x) = C per ogni x ∈ I.
La generica primitiva di f in I, ammesso che esista, viene usualmente indicata con il simbolo
Z
f (x)dx.
(9.2.2)
Il simbolo in (9.2.2) si chiama integrale indefinito di f (x). A sua volta, la
funzione f (x) viene chiamata funzione integranda.
Per definizione si ha, per ogni x ∈ I,
Z
D f (x)dx = f (x)
Z
ϕ0 (x)dx = ϕ(x) + C.
(9.2.3)
Ad esempio,
Z
xn+1
x dx =
+ C,
n+1
n
Z
1
dx = log |x| + C,
x
Z
1
dx = arctan x + C.
1 + x2
9.2. Regole di integrazione indefinita
261
Se f1 e f2 ammettano primitiva in I e se c1 e c2 sono costanti reali, anche
c1 f1 + c2 f2 ammette primitiva in I e si ha
Z
Z
Z
(c1 f1 (x) + c2 f2 (x)) dx = c1 f1 (x)dx + c2 f2 (x)dx + C.
(9.2.4)
La (9.2.4) si verifica immediatamente per derivazione.
Ammettiamo per il momento il risultato menzionato precedentemente, cioè
che ogni funzione continua in un intervallo ha primitiva in questo intervallo.
Abbiamo allora le formule di integrazione per parti e per sostituzione.
Teorema 9.2.5 (di integrazione per parti) Sia I ⊆ R un intervallo e siano
f : I → R e g : I → R derivabili in I con derivata continua. Allora per ogni
x ∈ I vale la formula
Z
Z
0
f (x)g (x)dx = f (x)g(x) − f 0 (x)g(x)dx + C.
(9.2.6)
Dimostrazione. Poiché
(f g)0 (x) = f 0 (x)g(x) + f (x)g 0 (x),
si ha, passando alle primitive,
Z
Z
Z
0
0
(f g) (x)dx = f (x)g(x)dx + f (x)g 0 (x)dx + C.
Dato che
Z
(f g)0 (x)dx = f (x)g(x) + C,
segue la tesi.
Il termine g 0 (x) in (9.2.6) si chiama fattore differenziale, mentre f (x) si
chiama fattore finito.
Esempi 9.2.7
R
1. Si voglia calcolare arctan xdx in I = R. Poniamo f (x) = arctan x e
g 0 (x) = 1, ossia g(x) = x. Si ha
Z
Z
x
arctan xdx = x arctan x −
dx + C.
1 + x2
Si riconosce immediatamente che una primitiva di
x
è la funzione
1 + x2
1
log(1 + x2 ). Quindi
2
Z
1
arctan xdx = x arctan x − log(1 + x2 ) + C.
2
262
9. Primitive
2. Dimostriamo, integrando per parti, che
Z
1
cos2 xdx = (sin x cos x + x) + C.
2
(9.2.8)
Poniamo f (x) = cos x e g 0 (x) = cos x, di modo che g(x) = sin x. Dalla
(9.2.6) si ha
Z
Z
cos2 xdx = sin x cos x + sin2 xdx + C =
Z
Z
2
= sin x cos x + (1 − cos x)dx + C = sin x cos x + x − cos2 xdx + C,
da cui (9.2.8). In modo del tutto analogo si dimostra che
Z
1
sin2 xdx = − (sin x cos x − x) + C.
2
3. Il Teorema di integrazione per parti permette di calcolare ricorsivamente
alcuni integrali dipendenti da un parametro intero n ≥ 0, una volta che
sia noto il primo o i primi integrali. Ad esempio, si voglia calcolare per
ogni intero n ≥ 0
Z
In =
xn ex dx.
Assumendo ex come fattore differenziale si ha
Z
n x
In = x e − n xn−1 ex dx + C = xn ex − nIn−1 + C.
(9.2.9)
Questa formula permette di calcolare In a partire da I0 = ex + C. Ad
esempio
¡
¢
I3 = x3 ex − 3I2 = x3 ex − 3 x2 ex − 2I1 + C
= x3 ex − 3x2 ex + 6xex − 6I0 + C
= x3 ex − 3x2 ex + 6xex − 6ex + C.
Formule del tipo (9.2.9), che esprimono In in funzione dell’integrale (o
degli integrali) precedenti si chiamano formule di ricorrenza.
4. Un esempio notevole di integrale che si calcola per ricorrenza è il seguente.
Sia, per ogni n ≥ 1
Z
1
In =
n dx.
(1 + x2 )
Z
1
Ovviamente I1 =
dx = arctan x + C. Consideriamo l’identità
1 + x2
1
1
x2
.
−
n =
n−1
2
(1 + x2 )n
(1 + x )
(1 + x2 )
9.2. Regole di integrazione indefinita
263
Integrando ambo i lati si ottiene
Z
In = In−1 −
x2
dx.
(1 + x2 )n
(9.2.10)
Il secondo integrale a destra in (9.2.10) si calcola per parti, assumendo
come fattore differenziale x(1 + x2 )−n . Si ha
Z
Z
1
x2
x
dx
+
dx
=
−
n−1
n−1 + C
(1 + x2 )n
2(n − 1)
2(n − 1) (1 + x2 )
(1 + x2 )
x
1
=−
n−1 + 2(n − 1) In−1 + C.
2(n − 1) (1 + x2 )
Otteniamo cosı̀ la formula di ricorrenza
In = −
x
2(n − 1) (1 +
n−1
x2 )
+
2n − 3
In−1 + C.
2n − 2
che riconduce il calcolo di In a quello di I1 .
Teorema 9.2.11 (di integrazione per sostituzione) Siano I e J intervalli
in R. Sia f : I → R continua in I e sia x = x(t) : J → I una funzione derivabile
con derivata continua in J. Posto
Z
ϕ(x) = f (x)dx ,
Z
ψ(t) = f (x(t)) x0 (t)dt ,
si ha per ogni t ∈ J
ϕ(x(t)) = ψ(t) + C.
(9.2.12)
Se x(t) è anche biunivoca, detta t = t(x) : I → J la funzione inversa, si ha
ϕ(x) = ψ(t(x))
(9.2.13)
Dimostrazione. Deriviamo la funzione composta ϕ(x(t)). Si ha
d
[ϕ(x(t))] = ϕ0 (x(t))x0 (t) = f (x(t)) x0 (t).
dt
e quindi ϕ(x(t)) è una primitiva di f (x(t)) x0 (t) in J, da cui (9.2.12). Se x(t) è
anche biunivoca, si ha x(t(x)) = x e quindi (9.2.13) segue da (9.2.12).
La formula (9.2.12) significa che, se vogliamo calcolare la primitiva di una
funzione della forma f (x(t)) x0 (t), basta calcolare la primitiva della funzione
f (x), salvo poi tornare alla variabile t ponendo x = x(t) nella primitiva trovata.
Analogamente, la formula (9.2.13) significa che, se vogliamo calcolare la primitiva di f (x), possiamo calcolare la primitiva di f (x(t)) x0 (t), salvo poi tornare
alla variabile x ponendo t = t(x) nella primitiva trovata. In questo secondo caso
la sostituzione x = x(t) deve essere biunivoca.
264
9. Primitive
Lo studente apprezzerà il simbolismo dell’integrale indefinito: l’eguaglianza dx = x0 (t)dt esplicita il differenziale dx rispetto alla variabile t, fornendo
l’espressione della nuova funzione integranda.
Esempi 9.2.14
1. Calcoliamo per ogni t reale
Z
(sin t)4 cos tdt.
ψ(t) =
In questo caso poniamo x = sin t, che non è ovviamente biunivoca. Si ha
dx = x0 (t)dt = cos tdt. Quindi
Z
x5
ϕ(x) = x4 dx =
+ C.
5
Applicando (9.2.12) si ottiene
Z
sin5 t
(sin t)4 cos tdt =
+ C.
5
2. Calcoliamo per ogni t ∈ (−1, 1)
Z
√
ψ(t) =
t2
dt.
1 − t6
Poniamo x = t3 , da cui dx = 3t2 dt. Si ha
Z
1
1
1
√
ϕ(x) =
dx = arcsin x + C.
3
3
1 − x2
Da (9.2.12) si ottiene
ψ(t) =
1
arcsin t3 + C.
3
3. Calcoliamo per ogni x reale
Z
ϕ(x) =
ex
dx
1 + ex
per ogni x reale. Poniamo ex = t, ossia x = log t, che è biunivoca da R+
dt
a R. In questo caso dx = x0 (t)dt = , da cui
t
Z
1
ψ(t) =
dt = log |1 + t| + C.
1+t
Per (9.2.13) si ha
Z
ϕ(x) =
ex
dx = log(1 + ex ) + C.
1 + ex
9.3. Primitive delle funzioni razionali fratte
265
4. Calcoliamo per ogni x > 0
Z
√
sin xdx
ϕ(x) =
Poniamo x = t2 , da cui dx = 2tdt. Il calcolo dell’integrale si riduce al
calcolo di
Z
2 t sin tdt.
Integrando per parti si ha
Z
Z
t sin tdt = −t cos t + cos tdt + C = −t cos t + sin t + C.
Quindi
Z
sin
9.3
√
√
√
√
xdx = −2 x cos x + 2 sin x + C.
Primitive delle funzioni razionali fratte
Una funzione razionale fratta è una funzione del tipo
R(x) =
P (x)
,
Q(x)
ove P e Q sono polinomi. R(x) è definita in tutti i punti che non annullano il
denominatore. Nel seguito denotiamo con con grA(x) il grado di un polinomio
A(x).
In questo paragrafo mostreremo come calcolare la primitiva di una qualunque
funzione razionale fratta nel suo campo di esistenza. In particolare vedremo che
la primitiva di una funzione razionale fratta
lineare di funzioni
¯ è combinazione
¯
razionali fratte, di funzioni del tipo log ¯ax2 + bx + c¯ e di funzioni del tipo
arctan(ax2 + bx + c).
Se grQ(x) = 0, ossia
R(x) = P (x) =
n
X
ck xk ,
k=0
la primitiva è a sua volta un polinomio che si calcola immediatamente:
Z X
n
ck xk dx =
k=0
=
n
X
k=0
n
X
k=0
Z
ck
xk dx + C
ck k+1
x
+ C.
k+1
266
9. Primitive
Se grP (x) ≥ grQ(x), esiste un polinomio P ∗ (x), con grP ∗ (x) < grQ(x), tale che
P − P ∗ è divisibile per Q. Quindi esiste un polinomio A(x) tale che
P (x)
P ∗ (x)
= A(x) +
.
Q(x)
Q(x)
Ne segue
Z
P (x)
dx =
Q(x)
Z
Z
A(x) +
P ∗ (x)
dx + C.
Q(x)
Di conseguenza, d’ora in avanti supporremo sempre che il grado di P sia minore
di quello di Q. Supporremo anche che P e Q non abbiano fattori comuni.
9.3.1
Caso in cui il grado del denominatore è 1 o 2
Se il grado di Q è 1, allora f (x) è della forma
R(x) =
a
x−b
per opportune costanti a e b. Quindi
Z
Z
a
R(x)dx =
= a log |x − b| + C.
x−b
Supponiamo ora che il grado di Q sia 2. Allora f (x) è della forma
R(x) =
ax + b
a 2x + p
1 pa − 2b
=
−
.
x2 + px + q
2 x2 + px + q 2 x2 + px + q
ove a, b, p e q sono opportune costanti. Quindi
Z
Z
Z
a
2x + p
pa − 2b
dx
R(x)dx =
dx
−
+C
2
2
2
x + px + q
2
x + px + q
Z
pa − 2b
dx
a
+ C.
= log(x2 + px + q) −
2
2
x2 + px + q
Siamo quindi ricondotti al calcolo di
Z
x2
dx
.
+ px + q
(9.3.1)
Esaminamo il discriminante del denominatore.
Se p2 − 4q > 0, il trinomio x2 + px + q ha due radici distinte reali c1 e c2 .
Possiamo scrivere la frazione in nella forma
µ
¶
1
1
1
1
=
−
.
(x − c1 )(x − c2 )
c1 − c2 x − c1
x − c2
Ne segue
Z
1
1
dx
=
log |x − c1 | −
log |x − c2 | + C.
(x − c1 )(x − c2 )
c1 − c2
c1 − c2
9.3. Primitive delle funzioni razionali fratte
267
Se p2 − 4q = 0, allora x2 + px + q = (x + p/2)2 . In questo caso
Z
dx
1
+ C.
=−
(x + p/2)2
x + p/2
Se p2 − 4q < 0, si ha
¡
¢
x2 + px + q = q − p2 /4
Ã
!
2
(x + p/2)
+1 .
q − p2 /4
p
Poniamo, per semplicità di scrittura, k = q − p2 /4. L’integrale (9.3.1) diviene
Z
1
dx
,
µ
¶2
k2
x + p/2
+1
k
che si calcola con la sostituzione (x + p/2) /k = t. Dato che dx = kdt, siamo
ricondotti all’integrale
Z
1
dt
1
= arctan t + C.
2
k
t +1
k
In definitiva
Z
dx
1
=p
arctan
x2 + px + q
q − p2 /4
Ã
x + p/2
p
q − p2 /4
!
+ C.
(9.3.2)
Esempi 9.3.3
P (x)
x3 + x
= 2
. In questo esempio il grado del numeratore è maggiore
Q(x)
x −1
di quello del denominatore. Si ha x3 + x = (x2 − 1)x + 2x, da cui
1. Sia
x3 + x
2x
=x+ 2
,
2
x −1
x −1
Z
Z
Z 3
¯
¯
2x
x2
x +x
dx
=
xdx
+
dx
+
C
=
+ log ¯x2 − 1¯ + C
x2 − 1
x2 − 1
2
2x
Si noti che, anziché integrare 2
direttamente, lo si può prima scomx −1
porre come
1
1
2x
=
+
,
x2 − 1
x+1 x−1
e poi effettuare l’integrazione.
2. Sia
1
1
P (x)
= 2
=
. Si ha
Q(x)
x −x−6
(x − 3)(x + 2)
Z
dx
1
1
= log |x − 3| − log |x + 2| + C.
x2 − x − 6
5
5
268
9. Primitive
3. Sia
P (x)
1
=
2 . In questo caso
Q(x)
(x − 1)
Z
dx
1
2 = − x − 1 + C.
(x − 1)
4. Sia f (x) =
(9.3.2)
9.3.2
1
. Il discriminante del denominatore è −3. Si ha da
x2 + x + 1
µ
¶
Z
dx
2
2x + 1
√
√
=
arctan
+ C.
x2 + x + 1
3
3
Casi fondamentali
Come vedremo nel possimo sottoparagrafo, i casi fondamentali a cui si riconduce
l’integrazione delle funzioni razionali fratte sono, con una eventuale sostituzione
lineare, i tre seguenti:
Z
dx
(9.3.4)
(x − a)n
Z
dx
(9.3.5)
n ,
(x2 + px + q)
Z
x
0
(9.3.6)
n dx .
(x2 + px + q)
ove n è un intero positivo, a , p e q sono numeri reali e p2 − 4q < 0.
L’integrale (9.3.4) è di calcolo immediato. Si ha
Z
dx
= log |x − a| + C,
x−a
Z
1
dx
+ C se n ≥ 2.
n =−
(n − 1)(x − a)n−1
(x − a)
Per il calcolo dell’integrale (9.3.5) si effettua la sostituzione
x + p/2
p
= t.
q − p2 /4
Posto k =
(9.3.7)
p
q − p2 /4, si ottiene l’integrale
Z
1
dt
.
2n−1
k
(1 + t2 )n
(9.3.8)
Questo integrale è stato studiato nell’esempio 9.2.7.4, ove si è mostrato come
effettuarne il calcolo per ricorrenza.
L’integrale (9.3.6) si calcola pure mediante la sostituzione (9.3.7). Si ottiene
l’integrale
Z
Z
p
1
t
dt
dt − 2n−1
.
(9.3.9)
k 2n−2
(1 + t2 )
2k
(1 + t2 )n
9.3. Primitive delle funzioni razionali fratte
269
Il secondo integrale in (9.3.9) è del tipo (9.3.8), appena visto. Per il primo
integrale si ha
Z
t
1
dt = log(1 + t2 ) + C,
2
1+t
2
Z
t
1
se n ≥ 2.
n dt = −
n−1 + C
(1 + t2 )
2(n − 1) (1 + t2 )
9.3.3
Caso generale
Iniziamo con un risultato che si deduce dal Teorema fondamentale dell’Algebra,
la cui dimostrazione esula dallo scopo di questo testo e sarà svolta nei corsi di
Algebra.
Teorema 9.3.10 Sia Q(x) un polinomio di grado n sul campo reale. Allora
Q(x) si può scrivere come prodotto
¡
¡
¢m1
¢mk
Q(x) = a0 (x − a1 )n1 · · · (x − ah )nh x2 + p1 x + q1
· · · x2 + pk x + qk
(9.3.11)
ove:
a) a0 a1 , . . . , ah , p1 , . . . , pk e q1 , . . . , qk sono numeri reali univocamente determinati. Gli aj , per j ≥ 1, sono a due a due distinti e i trinomi sono a
due a due distinti. Inoltre, ciascun trinomio ha discriminante negativo;
b) n1 , . . . , nh e m1 , . . . , mk sono numeri interi positivi univocamente determinati tali che n1 + · · · + nh + 2m1 + · · · + 2mk = n.
Il numero nj si chiama molteplicità della radice aj . Il numero mj è la
molteplicità del trinomio x2 + pj x + qj
Vedremo che rapporto P (x)/Q(x) si può scrivere come combinazione lineare di funzioni razionali fratte dei tre tipi fondamentali studiati nel precedente
sottoparagrafo. Iniziamo con degli esempi.
Esempi 9.3.12
1. Si voglia calcolare
Z
dx
.
x2 (x2 − 1)
In questo caso Q(x) ha le radici 1 e −1 con molteplicità 1 e la radice 0
con molteplicità 2. Si possono trovare quattro costanti a, b, c e d tali che
1
x2 (x2
− 1)
=
a
b
c
d
+ +
+
.
2
x
x x−1 x+1
(9.3.13)
Infatti, riduciamo le frazioni a secondo membro a minimo comun denominatore ed eseguiamo la somma. La precedente eguaglianza equivale
a
1
x2 (x2 − 1)
=
a(x2 − 1) + bx(x2 − 1) + cx2 (x + 1) + dx2 (x − 1)
.
x2 (x2 − 1)
270
9. Primitive
Eguagliando i coefficienti dei termini di egual grado al numeratore, si
arriva al sistema
b + c + d = 0, a + c − d = 0, b = 0,
− a = 1.
Le soluzioni sono a = −1, b = 0, c = 1/2, d = −1/2. Tutti gli integrali
da calcolare rientrano nel caso (9.3.4). Si ottiene
¯
¯
Z
¯x − 1¯
dx
1 1
¯
¯
=
+
log
¯x + 1¯ + C
x2 (x2 − 1)
x 2
2. Si voglia calcolare
Z
x4 − 1
dx.
+ x + 1)2
x(x2
In questo caso Q(x) ha la radice 0 con molteplicità 1, mentre il trinomio
irriducibile x2 + x + 1 ha molteplicità 2. Cerchiamo delle costanti a, b, c,
r e s tali che
x4 − 1
a
bx + c
rx + s
= + 2
+ 2
.
2
2
2
x(x + x + 1)
x (x + x + 1)
x +x+1
Come nell’esempio precedente, riduciamo le frazioni a secondo membro
a minimo comun denominatore ed eseguiamo la somma. Eguagliando il
numeratore della somma a x4 − 1 si ha
x4 − 1 = (a + r)x4 + (2a + s + r)x3 + (3a + s + r + b)x2 + (2a + s + c)x + a.
Eguagliando i coefficienti dei termini di egual grado si ottiene il sistema
1 = a + r, 0 = 2a + s + r, 0 = 3a + s + r + b, 0 = 2a + s + c, −1 = a,
che ha l’unica soluzione
a = −1, b = 1, c = 2, r = 2, s = 0.
Quindi
Z
x4 − 1
dx = −
2
x(x + x + 1)2
Z
dx
+
x
Z
x+2
dx +
(x2 + x + 1)2
Z
2xdx
+ C.
x2 + x + 1
Il primo integrale a secondo membro è del tipo (9.3.4). Il secondo e terzo
integrale si riconducono ai casi (9.3.5) e (9.3.6). Infatti il denominatore è
una potenza di x2 + x + 1, che ha discriminante p2 − 4q = −3 < 0. La
sostituzione (9.3.7) assume la forma
2x + 1
√
= t.
3
9.4. Primitive di funzioni razionali fratte in un argomento
271
Come si intuisce dagli esempi, l’integrazione indefinita di una funzione razionale
fratta si riduce al calcolo di integrali dei tipi (9.3.4), (9.3.5) e (9.3.6). Precisiamo
tale affermazione nel seguente Teorema. La dimostrazione è svolta in Appendice.
Teorema 9.3.14 (di decomposizione) Siano P (x) e Q(x) due polinomi tali
P (x)
che grP (x) < grQ(x). Sia Q(x) della forma (9.3.11). Allora il rapporto
Q(x)
si esprime in maniera unica come combinazione lineare dei seguenti addendi:
1
1
1
1
,
,...,
,
ove j = 1, . . . , h,
,
n
n
−1
n
−2
j
j
j
(x − aj )
(x − aj )
(x − aj )
x − aj
1
1
1
mj ,
mj −1 ,
m −2 , . . .
2
2
2
(x + pj x + qj )
(x + pj x + qj )
(x + pj x + qj ) j
1
......, 2
,
ove j = 1, . . . , k,
x + pj x + qj
x
x
x
,
mj ,
m
−1
m −2 , . . .
2
j
(x + pj x + qj )
(x2 + pj x + qj )
(x2 + pj x + qj ) j
1
......, 2
,
ove j = 1, . . . , k.
x + pj x + qj
Nei paragrafi successivi studiamo le principali classi di integrali indefiniti
che, con opportune sostituzioni, si possono ricondurre a integrali di funzioni razionali fratte. La trattazione che segue non vuole, né può, essere esaustiva, bensı̀
solo una indicazione di come si possa affrontare il problema della integrazione
indefinita per mezzo di funzioni elementari.
9.4
Primitive di funzioni razionali fratte in un argomento
Sia f (t) una funzione derivabile con derivata continua in un intervallo I. Sia,
come nel paragrafo precedente,
R(x) =
P (x)
Q(x)
ove P e Q sono polinomi. Il calcolo della primitiva
Z
R (f (t)) f 0 (t)dt
si ottiene integrando per sostituzione. Infatti, posto x = f (t), si ha dx = f 0 (t)dt.
Il calcolo viene cosı̀ ricondotto a quello di
Z
R(x)dx.
Illustriamo alcuni casi notevoli con degli esempi
272
9. Primitive
Esempi 9.4.1
1. Si voglia calcolare
Z
1 + sin t
cos tdt.
1 + sin2 t
Posto x = sin x, da cui dx = cos tdt, si ottiene l’integrale
Z
Z
Z
dx
x
1+x
dx =
+
dx + C
1 + x2
1 + x2
1 + x2
1
= arctan x + log(1 + x2 ) + C.
2
Quindi
Z
1 + sin t
1
cos t dt = arctan (sin t) + log(1 + sin2 t) + C.
2
sin2 t + 1
2. Si voglia calcolare
Z
Z
¡
¢
tan3 t
¡
¢ 1 + tan2 t dt.
tan3 tdt =
2
1 + tan t
¡
¢
Posto x = tan t, da cui dx = 1 + tan2 t dt, siamo ricondotti al calcolo di
Z
Z
Z
x3
x
= xdx −
+ C.
1 + x2
1 + x2
Si ottiene
Z
tan3 tdt =
¡
¢
1
1
tan2 t − log 1 + tan2 t + C.
2
2
3. In maniera analoga si calcolano integrali del tipo
Z
Z
Z
R(cos t) sin tdt,
R(sinh t) cosh tdt,
R(cosh t) sinh tdt,
Z
Z
R(et ) t
R(et )dt =
e dt, etc.
et
9.5
Primitive di funzioni razionali fratte in più argomenti
Una funzione razionale fratta in n variabili R(x1 , x2 , . . . , xn ) è il rapporto
R(x1 , x2 , . . . , xn ) =
P (x1 , x2 , . . . , xn )
,
Q(x1 , x2 , . . . , xn )
ove P e Q sono polinomi in x1 , x2 , . . . , xn . Ad esempio
R(x, y, z) =
x+y+z
.
x2 + y 2 + z 2
In questo paragrafo indicheremo come si calcola la primitiva di una funzione
razionale fratta i cui argomenti sono particolari tipi di funzioni.
9.5. Primitive di funzioni razionali fratte in più argomenti
9.5.1
273
Primitive di R(cos t, sin t)
In questo caso si utilizzano le note identità che esprimono sin t e cos t in funzione
di tan t/2:
t
t
2 tan
1 − tan2
2 , cos t =
2 .
sin t =
t
t
1 + tan2
1 + tan2
2
2
Quindi


t
t
t
Z
Z
2 tan
1 − tan2
1 + tan2


2
2
2
R(cos t, sin t)dt = R 
,
dt . (9.5.1)
t 1 + tan2 x 
t
1 + tan2
1 + tan2
2
2
2
Si opera la sostituzione
x = tan
t
2
(9.5.2)
µ
¶
1
t
da cui dx =
1 + tan2
dt. In forza di (9.2.13) siamo ricondotti al calcolo
2
2
della primitiva di una funzione razionale fratta in x, cioè
¶
µ
Z
1 − x2
2
2x
,
dx.
R
1 + x2 1 + x2 1 + x2
9.5.2
Primitive di R(cos2 t, sin2 t, tan t)
Questo caso differisce dal precedente, in quanto le funzioni seno e coseno appaiono solo a potenza pari, oppure sotto forma di tangente. Conviene utilizzare le
identità
tan2 t
1
sin2 t =
cos2 t =
.
2 ,
1 + tan t
1 + tan2 t
Posto
x = tan t,
(9.5.3)
Z
¡
¢
si ha dx = 1 + tan2 t dt. L’integrale R(cos2 t, sin2 t, tan t)dt diviene
µ
Z
R
¶
x2
1
1
,
,x
dx
1 + x2 1 + x2
1 + x2
che è l’integrale di una funzione razionale fratta in x.
Esempi 9.5.4
1. Si voglia calcolare
ottiene
Z
Z
dt
.
cos t + sin t
Operando la sostituzione (9.5.2) si
¯
¯
√ ¯¯
√ ¯¯
1
1
2
¯
¯
√
√
log
−
1
+
2
−
log
−
1
−
2¯ + C.
dx
=
¯x
¯
¯x
−x2 + 2x + 1
2
2
274
9. Primitive
Quindi
Z
¯
¯ tan2
1
1
¯
dt = √ log ¯
¯ tan2
cos t + sin t
2
t
2
t
2
√ ¯¯
2¯
√ ¯ + C.
− 1 − 2¯
−1+
In modo analogo si calcolano gli integrali della forma
Z
dt
a cos t + b sin t + c
Z
2. Si voglia calcolare
cos2 t + tan t
dt. Operando la sostituzione (9.5.3) si
sin4 t
ottiene l’integrale
Z
1
1
(x−1 + x−3 + x−4 )dx = log |x| − x−2 − x−3 + C.
2
3
Quindi
Z
9.5.3
cos2 t + tan t
1
1
dt = − log | cot t| − cot2 t − cot3 t + C.
4
2
3
sin t
¡ q√
¢
q√
q√
Primitive di R x, 1 xp1 , 2 xp2 , . . . , n xpn
Supponiamo che le frazioni pi /qi siano irriducibili e che qi > 0 per ogni i =
1, . . . , n. Sia q il minimo
comune
multiplo di q1 , q2 , . . . , qn . Poniamo ki =
√
q
q√
q/qi , di modo che i xpi = xpi ki . Si applica la formula (9.2.12) operando la
sostituzione
x = tq ,
(9.5.5)
da cui dx = qtq−1
Z dt.
¡ q√
¢
q√
q√
L’integrale R x, 1 xp1 , 2 xp2 , . . . , n xpn dx diviene
Z
q
¡
¢
R tq , tp1 k1 , tp2 k2 , . . . , tpn kn tq−1 dt
che è l’integrale di una funzione razionale fratta in t.
9.5.4
r³
µ r³
´p1 r³
´p 2
´pn ¶
q1
q2
qn
ax+b
ax+b
ax+b
Primitive di R x,
,
...,
cx+d
cx+d
cx+d
Supponiamo ad−bc 6= 0, altrimenti le frazioni sotto radice sono eguali a costanti.
Come prima, supponiamo qi > 0 e che tutte le frazioni pi /qi , per i = 1 . . . n,
siano irriducibili. Denotiamo con q il minimo comune multiplo dei qi . Poniamo
ki = q/qi , di modo che
s
sµ
µ
¶p
¶p k
q
ax + b i
ax + b i i
qi
=
, i = 1, . . . , n.
cx + d
cx + d
9.5. Primitive di funzioni razionali fratte in più argomenti
275
Si opera la sostituzione
ax + b
= tq , da cui
cx + d
t
x=
tq d − b
.
−tq c + a
(9.5.6)
q−1
2 dt. L’integrale
(−tq c + a)
sµ
à sµ
¶ p sµ
¶p
¶p !
Z
ax + b 1 q2 ax + b 2
ax + b n
q1
qn
R x,
,
,...,
dx
cx + d
cx + d
cx + d
Si ha dx = q (ad − bc)
(9.5.7)
si riconduce all’integrale di una funzione razionale fratta, cioè a
µ
Z
q (ad − bc)
R
tq d − b p1 k1 p2 k2
,t
,t
, . . . , tp n k n
−tq c + a
¶
t
q−1
(−tq c
dt
2.
+ a)
Esempi 9.5.8
1. Si voglia calcolare
Z
√
3
dx
x2
−
√ .
x
In questo caso si ha q1 = 3, q2 = 2, p1 = 2, p1 = 1. Il minimo comune
denominatore è q = 6. Con la sostituzione x = t6 si ottiene l’integrale
Z
Z
Z
Z
t5
t2
dt
6
dt = 6
dt = 6 (t + 1) dt + 6
+C
4
3
t −t
t−1
t−1
= 3t2 + 6t + 6 log |t − 1| + C.
Quindi
Z
√
3
¯√
¯
√
√
3
6
6
√ = 3 x + 6 x + 6 log ¯ x − 1¯ + C.
− x
dx
x2
2. Si voglia calcolare
Z
1
x−1
r
x+1
dx.
x−1
Si ha ad − bc = −2, p = 1, q = 2. La sostituzione è
t2 + 1
x+1
= t2 , da cui x = 2
.
x−1
t −1
Si ha dx = −
4t
2 dt.
(t2 − 1)
Z
−2
Sostituendo si ottiene
¯
¯
¯t − 1¯
t2
¯
¯ + C.
= −2t − log ¯
t2 − 1
t + 1¯
276
9. Primitive
Quindi
Z
1
x−1
r
r
x+1
dx = −2
x−1
¯q
¯
¯ x+1 − 1 ¯
¯
¯
x−1
x+1
¯ + C.
− log ¯¯ q
¯
x−1
x+1
¯ x−1
+ 1¯
Osservazione. Per applicare la formula (9.2.12) dobbiamo verificare la
biunivocità della sostituzione operata. Se q è dispari, tutti i qi sono dispari e la funzione (9.5.5) applica biunivocamente R su R. Se q è pari, almeno
uno dei qi è pari. Sia, per fissare le idee, q1 pari.√ Poiché abbiamo suppoq
sto pi¡/qi √
irriducibile,
p1 è dispari.
Ne segue che 1 xp1 , e quindi la funzio¢
√
q1
q√
q
n
ne R x, xp1 , 2 xp2 , . . . ,
xpn , è definita per x > 0. La funzione (9.5.5)
in questo caso applica biunivocamente l’insieme dei reali positivi su sé stesso.
Analoghe osservazioni valgono per l’integrale (9.5.7).
9.5.5
³ p
´
Primitive di R x, ±x2 + px + q
Supponiamo che il determinante del trinomio ±x2 + px + q non sia nullo,
altrimenti si ha una funzione razionale fratta in x.
Operiamo una sostituzione che riduca la radice
p
±x2 + px + q
(9.5.9)
√
√
alla forma t2 ± 1 oppure 1 − t2 .
2
p a) Valga nella radice (9.5.9) il segno +. Se p /4 − q < 0, posto k =
q − p2 /4, la consueta sostituzione
x + p/2
=t
k
√
¢
R¡ p
trasforma la radice in k t2 + 1. L’integrale x, ±x2 + px + q dx diviene
Z
³
´
p
k R kt − p/2, k t2 + 1 dt.
(9.5.10)
Se p2 /4 − q > 0, posto k =
p
p2 /4 − q, la sostituzione
x + p/2
=t
k
√
trasforma la radice in k t2 − 1. L’integrale diviene
Z
³
´
p
k R kt − p/2, k t2 − 1 dt
(9.5.11)
(9.5.12)
b) Valga nella radice (9.5.9)
p il segno −. In questo caso si ha necessariamente
p2 /4 + q > 0. Posto k = p2 /4 + q, con la sostituzione
x − p/2
=t
k
9.5. Primitive di funzioni razionali fratte in più argomenti
√
la radice si trasforma k 1 − t2 . L’integrale corrispondente è
Z
³
´
p
k R kt + p/2, k 1 − t2 dt.
277
(9.5.13)
Per il calcolo di questi integrali vi sono varie sostituzioni possibili, che riducono la funzione integranda a una funzione razionale fratta. In (9.5.10), tenendo
conto che cosh2 t − sinh2 t = 1, la sostituzione t = sinh u, dt = cosh udu, riduce
l’integranda a una fuzione razionale fratta nelle funzioni iperboliche, e quindi
in eu . Analogamente, in (9.5.12) si può operare la sostituzione t = cosh u,
dt = sinh udu. In (9.5.13) la sostituzione t = sin u, dt = cos udu, riduce
l’integranda a una funzione razionale fratta nelle funzioni circolari.
√ Senza passare per le funzioni iperboliche, nell’integrale (9.5.12) si può porre
t2 − 1 = u − t, che, risolta rispetto a t, dà
t=
Quindi
p
Poiché dt =
u
1
+
.
2 2u
t2 − 1 =
(9.5.14)
u
1
−
.
2 2u
1
1
− 2 , siamo ricondotti al calcolo di una primitiva del tipo
2 2u
¶
µ
Z
1 u
1 u2 − 1
u
+
, −
du.
R1
2 2u 2 2u
2u2
L’analoga sostituzione
p
t2 + 1 = u − t
razionalizza l’integrale (9.5.10).
In (9.5.13) si possono
√ usare le funzioni circolari, come già notato, oppure
operare la sostituzione 1 − t2 = u(1 − t). Risolvendo rispetto a t si ha
t=
da cui
Si ha dt =
tipo
p
u2 − 1
u2 + 1
1 − t2 =
2u
.
1 + u2
4u
du e quindi siamo ricondotti al calcolo di una primitiva del
(1 + u2 )2
µ 2
¶
Z
u −1
2u
4u
R1
,
du.
1 + u2 1 + u2 (1 + u2 )2
Le sostituzioni menzionate sopra sono solo alcune delle possibili sostituzioni per
calcolare queste primitive. La scelta della sostituzione migliore, in questo come
pure negli altri tipi di integrali, dipende in generale dalla forma della funzione
integranda.
278
9. Primitive
Esempi 9.5.15
Z √
1. Si voglia calcolare
diventa
Z
1 + x2
dx. Con la sostituzione x = sinh u l’integrale
x2
¶
Z µ
1
cosh u
+C
1+
du = u −
2
sinh u
sinh u
p
1 + sinh2 u
=u−
+C
sinh u
cosh2 u
du =
sinh2 u
Per calcolare questa espressione in x dobbiamo procurarci l’espressione
della funzione inversa di x = sinh u. Risolvendo rispetto a u l’equazione
µ
¶
1 u
1
sinh u =
e − u =x
2
e
si ottiene
³
´
p
u = log x + 1 + x2 .
Quindi la primitiva cercata è
³
´ √1 + x2
p
log x + 1 + x2 +
+ C.
x
Z
√
2. Si voglia calcolare x x2 − 4x + 3 dx. In questo caso p2 /4 − q = 1.
L’integrale (9.5.12) è
Z
(t + 2)
p
t2 − 1dt.
Usiamo la sostituzione (9.5.14). L’integrale diviene
¶µ
¶µ
¶
Z µ
u
1
u
1
1
1
+
+2
−
− 2 du
2 2u
2 2u
2 2u
che è di integrazione elementare. Una volta eseguito
√ questo calcolo, per
ottenere la primitiva originaria, occorre sostituire t2 − 1 + t a u e, successivamente, x − 2 a t.
Z √ 2
−x + 2x + 15
3. Calcoliamo
dx. In questo caso p2 /4 + q = 16. L’inte3
(x − 1)
grale (9.5.13) è
Z √
1
1 − t2
dt.
4
t3
√
La sostituzione 1 − t2 = u(1 − t) conduce al calcolo di
Z
u2
2
3 du.
(u2 − 1)
9.6. Integrali binomi
9.6
279
Integrali binomi
Si chiama integrale binomio un integrale indefinito della forma
Z
xm (a + bxn )p dx,
(9.6.1)
ove m, n e p sono numeri razionali e a 6= 0, b 6= 0. Si dimostra che questi
integrali si possono calcolare in termini finiti se e solo se uno dei tre seguenti
numeri
m+1
m+1
p,
,
+p
n
n
è intero.
a) Se p è intero, l’integrale binomio è del tipo già studiato nel sottoparagrafo
9.5.3.
m+1
r
b) Se
è intero, posto p = , ove r e s sono interi, si opera la
n
s
sostituzione
µ
¶1/n
ts − a
b
µ s
¶−1+1/n
s−1
st
t −a
dx =
dt.
nb
b
x=
Si ha
µ
m
n p
x (a + bx ) =
ts − a
b
(9.6.2)
¶m/n
tr .
L’integrale (9.6.1) diviene
s
nb
µ
Z
r+s−1
t
ts − a
b
¶ m+1
n −1
dt
che è l’integrale di una funzione razionale fratta.
m+1
r
c) Se
+ p è intero, posto p = , ove r e s sono interi, si opera la
n
s
sostituzione
µ
x=
ts − b
a
¶−1/n
s
dx = − ts−1
na
(9.6.3)
µ
ts − b
a
¶−1−1/n
Si ha
µ
m
n p
m+np
x (a + bx ) = x
(b + ax
−n p
) =
ts − b
a
¶− m
n −p
tr .
280
9. Primitive
L’integrale (9.6.1) diviene
s
−
na
µ
Z
t
r+s−1
ts − b
a
¶− m+1
n −p−1
dt
che è l’integrale di una funzione razionale fratta.
Esempi 9.6.4
1. Calcoliamo
Z
√
q
x
3
√
3 − 4 4 x dx.
In questo caso m = 1/2, n = 1/4 e p = 1/3. Si ha (m + 1)/n = 6 e siamo
perciò nel caso b). La sostituzione (9.6.2) riconduce l’integrale a
Z
¡
¢5
3
t3 t3 − 3 dt
5
4
che è l’integrale di un polinomio. Una volta calcolato questo integrale si
ritorna a una funzione in x ricavando t da (9.6.2).
2. Calcoliamo
Z
¡
√
√ ¢−2/3
3
x 1+2 x
dx.
In questo caso m = 1/3, n = 1/2, p = −2/3. Si ha (m + 1)/n + p = 2,
e quindi siamo nel caso c). Operando la sostituzione (9.6.3) arriviamo
all’integrale
Z
dt
6
3
(2 − t3 )
che è l’integrale di una funzione razionale fratta.
9.7
9.7.1
Appendice
Decomposizione di una funzione razionale fratta
In questa Appendice dimostriamo il Teorema 9.3.14 di decomposizione di una
funzione razionale fratta. Tenendo presente la (9.3.11), la dimostrazione segue
da una applicazione ripetuta dei due lemmi seguenti.
Lemma 9.7.1 Siano P (x) e Q(x) due polinomi tali che gr P (x) < gr Q(x). Sia
Q(x) = (x − a)n R(x).
ove n ≥ 1 e R(a) 6= 0.
Posto Q1 (x) = (x − a)n−1 R(x), si possono trovare in maniera unica una
costante κ e un polinomio P1 (x) tali che
a) gr P1 (x) < gr Q1 (x)
9.7. Appendice
b)
281
κ
P (x)
P1 (x)
=
.
+
Q(x)
(x − a)n
Q1 (x)
Dimostrazione. Determiniamo κ in modo che
P (x) − κR(x)
P (x)
κ
=
−
(x − a)n R(x)
(x − a)n R(x) (x − a)n
P (a)
. Si ha P (a) −
R(a)
κR(a) = 0 e quindi esiste un unico polinomio P1 (x) tale che
sia della forma desiderata. Poiché R(a) 6= 0, poniamo κ =
P (x) − κR(x) = (x − a)P1 (x).
(9.7.2)
Ne segue
κ
P1 (x)
κ
P1 (x)
P (x)
=
+
=
+
.
n
n−1
n
Q(x)
(x − a)
(x − a)
R(x)
(x − a)
Q1 (x)
Dato che i gradi di P (x) e R(x) sono minori di gr Q(x), per (9.7.2) si ha
1 + gr P1 (x) ≤ max (gr P (x), gr R(x)) < gr Q(x) = 1 + gr Q1 (x).
Lemma 9.7.3 Siano P (x) e Q(x) due polinomi tali che gr P (x) < gr Q(x). Sia
Q(x) = (x2 + px + q)n R(x).
ove p2 − 4q < 0, n ≥ 1 e R(x) non è divisibile per (x2 + px + q).
Posto Q1 (x) = (x2 + px + q)n−1 R(x), si possono trovare in maniera unica
due costanti α e β e un polinomio P1 (x) tali che
a) gr P1 (x) < gr Q1 (x)
b)
P (x)
αx + β
P1 (x)
= 2
+
.
n
Q(x)
(x + px + q)
Q1 (x)
Dimostrazione. La dimostrazione di questo Lemma in realtà è la stessa del
Lemma precedente, purché sipoperi nel campo complesso e si considerino le radici
−p ± i q − 4p2
complesse coniugate
. Possiamo tuttavia evitare il formalismo
2
complesso. Innanzi tutto, posto
x+p
t= p
,
4q − p2
il polinomio Q assume la forma (con un piccolo abuso di notazioni)
Q(t) = (t2 + 1)n R(t),
282
9. Primitive
ove R(t) non è divisibile per (t2 + 1). Determiniamo due costanti α e β in modo
che
P (t) − (αt + β) R(t)
P (t)
αt + β
= 2
− 2
2
n
n
(t + 1) R(t)
(t + 1) R(t) (t + 1)n
abbia le proprietà desiderate. Separando le potenze pari di t da quelle dispari,
i polinomi P (t) e R(t) si possono scrivere come
P (t) = P+ (t2 ) + tP− (t2 )
R(t) = R+ (t2 ) + tR− (t2 )
ove P+ , P− , R+ , R− sono polinomi nella variabile t2 . Quindi
£
¤
P (t) − (αt + β) R(t) = P+ (t2 ) − βR+ (t2 ) − αt2 R− (t2 )
£
¤
+ t P− (t2 ) − αR+ (t2 ) − βR− (t2 ) . (9.7.4)
I polinomi nelle parentesi quadrate sono ambedue polinomi in t2 . Posto t2 = u,
cerchiamo α e β in modo che ambedue i polinomi
P+ (u) − βR+ (u) − αuR− (u),
P− (u) − αR+ (u) − βR− (u)
siano divisibili per (u + 1). Otteniamo il sistema
½
−αR− (−1) + βR+ (−1) = P+ (−1)
αR+ (−1) + βR− (−1)
= P− (−1)
2
2
il cui determinante è −R+
(−1) − R−
(−1). Tale espressione è diversa da 0,
altrimenti sia R+ (u) che R− (u) sarebbero divisibili per (u + 1) e quindi R(t)
sarebbe divisibile per (t2 + 1).
Dette α e β le soluzioni, si ha
P+ (u) − βR+ (u) − αuR− (u) = (u + 1)A(u)
P− (u) − αR+ (u) − βR− (u) = (u + 1)B(u)
¡
¢
e quindi P (t) − (αt + β) R(t) = (t2 + 1) A(t2 ) + tB(t2 ) = (t2 + 1)P1 (t). Ne
segue
P (t) − (αt + β) R(t)
P1 (t)
P1 (t)
= 2
=
.
(t2 + 1)n R(t)
(t + 1)n−1 R(t)
Q1 (t)
Ovviamente
2 + gr P1 (t) ≤ max (gr P (t), gr R(t)) < gr Q(t) = 2 + gr Q1 (t).
Capitolo 10
Integrale di Riemann
10.1
Introduzione
La teoria dell’integrazione risponde a due problemi: il calcolo dell’area sottesa
dal grafico di una funzione f (x) e la determinazione della primitiva di f (x).
Newton e Leibniz concepirono l’integrale essenzialmente come calcolo dell’inversa della derivata, e definirono l’area mediante la differenza dei valori della
primitiva agli estremi dell’intervallo. Nella trattazione di Cauchy l’area viene
definita indipendentemente, mediante approssimazione con plurirettangoli. In
questo capitolo esponiamo la teoria di Riemann, che generalizza l’integrale di
Cauchy, originariamente formulato per le sole funzioni continue. Ulteriori generalizzazioni, specialmente quella di Lebesgue, sono oggetto dei programmi dei
corsi successivi di Analisi Matematica.
10.2
Somme superiori e inferiori
Definizione 10.2.1 Sia [a, b] un intervallo chiuso e limitato. Una partizione
P di [a, b] è un insieme di n + 1 punti
a = x0 < x1 < x2 < · · · < xn = b.
Una partizione P = {x0 , x1 , . . . , xn } suddivide l’intervallo [a, b] in n intervalli
[xj , xj+1 ], ciascuno dei quali ha ampiezza xj+1 − xj , per ogni j = 0, 1, . . . , n − 1.
Sia f : [a, b] → R una funzione limitata. Data una qualunque partizione P ,
a maggior ragione f è limitata su ciascuno degli intervalli [xj , xj+1 ]. Poniamo,
per ogni j = 0, 1, . . . , n − 1,
Lj =
sup
f (x),
xj ≤x≤xj+1
`j =
inf
xj ≤x≤xj+1
f (x).
Definizione 10.2.2 Sia f : [a, b] → R una funzione limitata e sia P una
partizione di [a, b]. Si chiama somma superiore (relativa alla partizione P ) la
283
284
10. Integrale di Riemann
quantità
S(P ) =
n−1
X
Lj (xj+1 − xj ) .
j=0
Si chiama somma inferiore (relativa alla partizione P ) la quantità
s(P ) =
n−1
X
`j (xj+1 − xj ) .
j=0
Se f (x) ≥ 0 per ogni x ∈ [a, b], le somme inferiori rappresentano l’area dell’unione dei rettangoli di base [xj , xj+1 ] e altezza `j . Tale figura viene chiamata
plurirettangolo inscritto. Le somme superiori rappresentano l’area dell’unione
dei rettangoli di base [xj , xj+1 ] e altezza Lj . Tale figura viene chiamata plurirettangolo circoscritto. Sempre nel caso in cui f (x) ≥ 0, è evidente dal significato
geometrico che, assegnate due qualunque partizioni P1 e P2 di [a, b], vale la
diseguaglianza
s(P1 ) ≤ S(P2 ).
(10.2.3)
Se f (x) ha segno qualunque si ha s(P ) ≤ S(P ) per ogni partizione P , poiché
`j ≤ Lj per ogni j. Tuttavia, la diseguaglianza (10.2.3) non è più immediata
per due partizioni diverse. Per dimostrare la validità della diseguaglianza della
(10.2.3) nel caso generale, iniziamo con la seguente definizione.
Definizione 10.2.4 Data una partizione P , si dice che un partizione P ∗ è un
raffinamento di P se P ⊂ P ∗ , ossia se ogni punto di P è anche un punto di P ∗ .
Date due partizioni P1 e P2 , si chiama comune raffinamento di P1 e P2 la
partizione P ∗ = P1 ∪ P2 .
a=x0
x1
x2
x3
Plurirettangolo inscritto
x4
x5=b
10.2. Somme superiori e inferiori
a=x0
x2
x1
285
x3
x4
x5=b
Plurirettangolo circoscritto
Un raffinamento di P è quindi ottenuto introducendo nuovi punti nella partizione. Mostriamo che questa operazione fa sı̀ che le somme inferiori crescano
e le somme superiori descrescano.
Lemma 10.2.5 Sia P ∗ un raffinamento di P . Allora
s(P ) ≤ s(P ∗ ),
S(P ) ≥ S(P ∗ ).
Dimostrazione. Dimostriamo l’asserto per le somme inferiori, poiché il ragionamento per le somme superiori è del tutto analogo.
Supponiamo che P ∗ contenga esattamente un punto in più di P . Sia x∗ tale
punto. Esiste k, 0 ≤ k ≤ n − 1, tale che xk < x∗ < xk+1 . La somma s(P ∗ )
ha gli stessi addendi di s(P ), ad eccezione dell’addendo `k (xk+1 − xk ). Al suo
posto s(P ∗ ) ha i due addendi
`∗1 (x∗ − xk ) + `∗2 (xk+1 − x∗ )
ove
`∗1 =
inf
xk ≤x≤x∗
f (x),
`∗2 =
inf
x∗ ≤x≤xk+1
f (x).
Ovviamente `∗1 ≥ `k e `∗2 ≥ `k . Quindi
s(P ∗ ) − s(P ) = `∗1 (x∗ − xk ) + `∗2 (xk+1 − x∗ ) − `k (xk+1 − xk )
≥ `k (x∗ − xk ) + `k (xk+1 − x∗ ) − `k (xk+1 − xk )
= 0.
Se P ∗ contiene m punti in più di P , ripetendo il precedente ragionamento m
volte si ottiene la tesi.
286
10. Integrale di Riemann
Teorema 10.2.6 Sia f : [a, b] → R una funzione limitata e siano P1 e P2
partizioni di [a, b]. Allora s(P1 ) ≤ S(P2 ).
Dimostrazione. Sia P ∗ = P1 ∪ P2 . Per il Lemma precedente si ha
s(P1 ) ≤ s(P ∗ ) ≤ S(P ∗ ) ≤ S(P2 ).
10.3
L’integrale di Riemann
Sia A l’insieme di tutte le somme inferiori e B l’insieme di tutte le somme
superiori. In forza del Teorema 10.2.6, ogni elemento di B è un maggiorante
di A e ogni elemento di A è un minorante di B. In particolare, A è limitato
superiormente e B è limitato inferiormente.
Definizione 10.3.1 Sia f : [a, b] → R una funzione limitata.
integrale inferiore di f in [a, b] la quantità
Z b
f (x)dx = sup s(P ).
Si chiama
P
a
Si chiama integrale superiore di f in [a, b] la quantità
Z
b
f (x)dx = inf S(P ).
a
P
In forza del Lemma 10.2.6 si ha
Z b
Z b
f (x)dx ≤
f (x)dx,
a
a
ma l’integrale superiore e quello inferiore possono non coincidere per una arbitraria funzione limitata f . Consideriamo infatti la funzione di Dirichlet
½
0 se x ∈ [0, 1] è irrazionale
f (x) =
1 se x ∈ [0, 1] è razionale.
Data una qualunque partizione P , si ha `j = 0 e Lj = 1 per ogni j, poiché
ogni intervallo contiene punti razionali e punti irrazionali. Ne segue s(P ) = 0 e
Pn−1
S(P ) = j=0 (xj+1 − xj ) = 1. L’integrale superiore vale quindi 1 e l’integrale
inferiore vale 0.
Definizione 10.3.2 Sia f : [a, b] → R una funzione limitata. Si dice che f è
integrabile secondo Riemann (o Riemann–integrabile, o anche R–integrabile) in
[a, b] se
Z b
Z b
f (x)dx =
f (x)dx.
a
a
10.3. L’integrale di Riemann
287
Il comune valore viene indicato con
Z
b
f (x)dx
a
e viene chiamato integrale (di Riemann) di f in [a, b], o anche integrale di
f esteso a [a, b]. La funzione f , che appare sotto il segno di integrale, viene
chiamata funzione integranda.
T
a
b
Il trapezoide T
Se f : [a, b] → R limitata. Supponiamo f (x) ≥ 0 per ogni x ∈ [a, b]. Si
chiama trapezoide (sotteso dal grafico di f ) la regione piana
T = {(x, y) : a ≤ x ≤ b, 0 ≤ y ≤ f (x)} .
(10.3.3)
Poiché f (x) ≥ 0 per ogni x, le somme inferiori e superiori sono tutte non negative. Se f è integrabile secondo Riemann in [a, b], si ha necessariamente
Rb
f (x)dx ≥ 0. In questo caso il significato geometrico dell’integrale è evidente:
a
esso è l’area del trapezoide T . Si pone quindi per definizione
Z b
area (T ) =
f (x)dx.
a
Rb
Se T è una figura geometrica elementare si può dimostrare che a f (x)dx
coincide con l’area di T definita nella geometria. Questo apparirà chiaro dal
Teorema fondamentale del calcolo. Per ora
R b ci limitiamo all’ovvia osservazione
che, se f (x) = C per ogni x ∈ [a, b], si ha a f (x)dx = C(b − a).
Definizione 10.3.4 Si denota con R[a, b] l’insieme di tutte le funzioni f :
[a, b] → R limitate e R–integrabili in [a, b]
Teorema 10.3.5 Sia f : [a, b] → R una funzione limitata. Condizione necessaria e sufficiente affinché f ∈ R[a, b] è che
∀ε > 0 ∃P ∗
S(P ∗ ) − s(P ∗ ) < ε.
(10.3.6)
288
10. Integrale di Riemann
Dimostrazione. Poniamo
Z b
I1 =
f (x)dx,.
Z
I2 =
a
b
f (x)dx.
a
Per definizione I1 è l’estremo superiore delle somme inferiori e I2 è l’estremo
inferiore delle somme superiori. Quindi, fissato ε > 0, esistono una partizione
P1 e una partizione P2 tali che
I1 −
ε
ε
< s(P1 ) ≤ I1 ≤ I2 ≤ S(P2 ) < I2 + .
2
2
Posto P ∗ = P1 ∪ P2 , si ha per il Lemma 10.2.5
I1 −
ε
ε
< s(P ∗ ) ≤ I1 ≤ I2 ≤ S(P ∗ ) < I2 + .
2
2
Per tale partizione si ha quindi
S(P ∗ ) − s(P ∗ ) < I2 − I1 + ε.
(10.3.7)
Se f è Riemann integrabile in [a, b] si ha I1 = I2 e quindi S(P ) − s(P ) < ε.
Viceversa valga (10.3.6). Poiché
s(P ∗ ) ≤ I1 ≤ I2 ≤ S(P ∗ )
si ha 0 ≤ I2 − I1 < S(P ∗ ) − s(P ∗ ) < ε. Per l’arbitrarietà di ε si ha I1 = I2 .
10.4
Proprietà dell’integrale
Teorema 10.4.1 (di linearità dell’integrale) Siano f1 , f2 ∈ R[a, b]. Siano
c1 , c2 ∈ R. Allora c1 f1 + c2 f2 ∈ R[a, b] e si ha
Z b
Z b
Z b
(c1 f1 (x) + c2 f2 (x)) dx = c1
f1 (x)dx + c2
f2 (x)dx.
(10.4.2)
a
a
a
Dimostrazione. Denotiamo con s(P, f ) e S(P, f ) le somme inferiori e superiori
relative a una funzione f . Poniamo
Z b
Z b
I1 =
f1 (x)dx, I2 =
f2 (x)dx.
a
a
Per il Teorema 10.3.5, per ogni ε > 0 esistono due partizioni P1 e P2 tali che,
per k = 1, 2,
(S(Pk , fk ) − Ik ) + (Ik − s(Pk , fk )) = S(Pk , fk ) − s(Pk , fk ) < ε/2.
Si ha quindi
ε
− + I1 ≤ s(P1 , f1 ) ≤ S(P1 , f1 ) ≤ I1 +
2
ε
− + I2 ≤ s(P2 , f2 ) ≤ S(P2 , f2 ) ≤ I2 +
2
ε
2
ε
2
(10.4.3)
(10.4.4)
10.4. Proprietà dell’integrale
289
Posto P = P1 ∪ P2 , per il Lemma 10.2.5 le diseguaglianze (10.4.3) e (10.4.4)
continuano a valere con P al posto di P1 e P2 . Sommando queste diseguaglianze
(con P al posto di P1 e P2 ) si ha
−ε + I1 + I2 ≤ s(P, f1 ) + s(P, f2 ) ≤ S(P, f1 ) + S(P, f2 ) ≤ I1 + I2 + ε. (10.4.5)
Sia P = {x0 , x1 , . . . , xn }. Osserviamo che
Lj =
`j =
sup
(f1 (x) + f2 (x)) ≤
xj ≤x≤xj+1
inf
(f1 (x) + f2 (x)) ≥
xj ≤x≤xj+1
sup
xj ≤x≤xj+1
inf
xj ≤x≤xj+1
f1 (x) +
f1 (x) +
sup
xj ≤x≤xj+1
inf
xj ≤x≤xj+1
f2 (x) = L1j + L2j ,
f2 (x) = `1j + `2j .
Ne segue
S(P, f1 + f2 ) =
n−1
X
Lj (xj+1 − xj ) ≤
j=0
n−1
X
L1j (xj+1 − xj ) +
j=0
n−1
X
L1j (xj+1 − xj )
j=0
˙
= S(P, f1 ) + S(P, f2 ),
e, allo stesso modo,
˙
s(P, f1 + f2 ) ≥ s(P, f1 ) + s(P, f2 ).
Da (10.4.5) si ottiene
−ε + I1 + I2 ≤ s(P, f1 + f2 ) ≤ S(P, f1 + f2 ) ≤ I1 + I2 + ε.
Poiché ε è arbitrario si ha che f1 + f2 è Riemann-integrabile in [a, b] e che
Z
Z
b
a
Z
b
(f1 (x) + f2 (x)) dx =
b
f1 (x)dx +
a
f2 (x)dx.
a
Notiamo ora che, per ogni funzione f limitata in [a, b] e per ogni partizione P ,
si ha
s(P, −f ) = −S(P, f )
S(P, −f ) = −s(P, f ).
Quindi, se fk (con k = 1, 2) è Riemann-integrabile in [a, b], lo è anche −fk e
Z
Z
b
−
fk (x)dx =
a
b
−fk (x))dx.
a
Possiamo perciò supporre c1 e c2 non negativi. Si ha
s(P, c1 f1 ) = c1 s(P, f1 )
S(P, c1 f1 ) = c1 S(P, f1 ).
290
10. Integrale di Riemann
Quindi c1 f1 è Riemann integrabile e
Z
Z
b
b
c1 f1 (x)dx = c1
f1 (x)dx.
a
(10.4.6)
a
In modo analogo si ha
Z
Z
b
b
c2 f2 (x)dx = c2
f2 (x)dx.
a
a
Abbiamo notato nel paragrafo 10.3 che una funzione R-integrabile e non
negativa ha integrale non negativo. Dal Teorema precedente segue immediatamente la proprietà di monotonia dell’integrale, nel senso precisato dal seguente
Corollario.
Corollario 10.4.7 (Teorema di monotonia) Siano f, g ∈ R[a, b]. Se f (x) ≤
g(x) per ogni x ∈ [a, b], allora
Z
Z
b
b
f (x)dx ≤
g(x)dx.
a
a
Dimostrazione. Si ha g − f ∈ R[a, b] e
Z
Z
b
g(x)dx −
a
Z
b
b
f (x)dx =
a
(g(x) − f (x)) dx ≥ 0.
a
Teorema 10.4.8 (di additività) Sia f : [a, b] → R limitata. Le seguenti affermazioni sono equivalenti:
a) f ∈ R[a, b];
b) ∀c ∈ (a, b)
f ∈ R[a, c] e f ∈ R[c, b].
Se vale una di queste due affermazioni, allora
Z
Z
b
f (x)dx =
a
Z
c
f (x)dx +
a
b
f (x)dx.
(10.4.9)
c
Dimostrazione. a) =⇒ b)
Sia f ∈ R[a, b]. Dimostriamo che f ∈ R[a, c]
e f ∈ R[c, b]. Per il Teorema 10.3.5, per ogni ε > 0 esiste una partizione
P di [a, b] tale che S(P ) − s(P ) < ε. Possiamo supporre che c appartenga
a P . Altrimenti raffiniamo la partizione aggiungendovi tale punto; le somme
superiori non crescono e le inferiori non decrescono, di modo che vale ancora la
diseguaglianza precedente.
10.4. Proprietà dell’integrale
291
Sia P1∗ la partizione di [a, c] ottenuta restringendo P ai soli punti xj tali che
xj ∈ [a, c]. Sia P2∗ la partizione di [c, b] ottenuta restringendo P ai soli punti xj
tali che xj ∈ [c, b]. Si ha
s(P ) = s(P1∗ ) + s(P2∗ )
S(P ) = S(P1∗ ) + S(P2∗ ),
da cui
(10.4.10)
(10.4.11)
S(P1∗ ) − s(P1∗ ) + S(P2∗ ) − s(P2∗ ) = S(P ) − s(P ) < ε,
A maggior ragione S(Pk∗ ) − s(Pk∗ ) < ε, per k = 1, 2. Sempre per il Teorema
10.3.5, b) vale.
b) =⇒ a). Fissato ε > 0 esistono partizioni P1∗ di [a, c] e P2∗ di [c, b] tali che
S(Pk∗ ) − s(Pk∗ ) < ε, per k = 1, 2.
(10.4.12)
Detta P la partizione di [a, b] ottenuta unendo i punti di P1∗ e P2∗ , valgono le
relazioni (10.4.10) e (10.4.11). Ne segue S(P ) − s(P ) < 2ε, e quindi a).
Si osservi ora che (10.4.12) implica
Z c
Z c
−ε +
f (x)dx ≤ s(P1∗ ) ≤ S(P1∗ ) ≤
f (x)dx + ε
a
Z
−ε +
c
da cui, sommando,
Z c
Z
−2ε+
f (x)dx+
a
a
b
Z
f (x)dx ≤ s(P2∗ ) ≤ S(P2∗ ) ≤
b
f (x)dx + ε
c
Z
b
f (x)dx ≤ s(P, f ) ≤ S(P, f ) ≤
c
Z
c
f (x)dx+
a
Poiché si ha anche
Z
s(P, f ) ≤
f (x)dx ≤ S(P, f ),
a
si ha (10.4.9) per l’arbitrarietà di ε.
T1
a
T2
c
I trapezoidi T1 e T2
f (x)dx+2ε.
c
b
b
b
292
10. Integrale di Riemann
Rb
Se f (x) ≥ 0 in [a, b], l’integrale c f (x)dx rappresenta l’area del trapezoide
Rb
Rc
(10.3.3), mentre a f (x)dx e c f (x)dx rappresentano le aree degli analoghi
trapezoidi T1 e T2 con base [a, c] e [c, b], rispettivamente. Si ha T = T1 ∪ T2 ,
mentre T1 ∩ T2 consiste di un segmento, la cui area è nulla (questa affermazione
sarà dimostrata nel prossimo paragrafo). Il Teorema 10.4.8 afferma che
Area(T ) = Area(T1 ) + Area(T2 ).
Se f (x) non ha segno costante, l’integrale di Riemann di f non rappresenta
più l’area della regione delimitata dal grafico e dall’asse delle ascisse. L’area
di questa regione si ottiene invece come integrale di |f (x)|. Tuttavia, bisogna
prima dimostrare che |f (x)| è Riemann integrabile in [a, b] se lo è f .
Teorema 10.4.13 Sia f ∈ R[a, b]. Allora |f (x)| ∈ R[a, b] e si ha
¯Z
¯ Z
¯ b
¯
b
¯
¯
f (x)dx¯ ≤
|f (x)| dx
¯
¯ a
¯
a
(10.4.14)
Dimostrazione. Sia fissi ε > 0 e sia P una partizione tale che S(P, f ) −
s(P, f ) < ε. Per ogni j = 0, . . . n − 1, denotiamo con `˜j e L̃j l’estremo inferiore e
quello superiore di |f | nell’intervallo [xj , xj+1 ] e, al solito, con `j e Lj l’estremo
inferiore e quello superiore di f nello stesso intervallo.
¯
¯
Per ogni t, s ∈ [xj , xj+1 ] si ha chiaramente ¯|f (t)| − |f (s)|¯ ≤ |f (t) − f (s)|,
da cui
¯
¯
L̃j − `˜j =
sup ¯|f (t)| − |f (s)|¯ ≤
sup
|f (t) − f (s)| = Lj − `j .
t,sε[xj ,xj+1 ]
t,sε[xj ,xj+1 ]
Ne segue
S(P, |f |) − s(P, |f |) ≤ S(P, f ) − s(P, f ) < ε.
Quindi |f | ∈ R[a, b] per il Teorema 10.3.5.
Evidentemente − |f (x)| ≤ f (x) ≤ |f (x)|. Per il Teorema di monotonia,
Z
Z
b
−
|f (x)| dx ≤
a
Z
b
b
f (x)dx ≤
a
|f (x)| dx ,
a
che equivale a (10.4.14)
Le funzioni
1
(f (x) + |f (x)|)
2
1
f− (x) = (f (x) − |f (x)|) .
2
f+ (x) =
si chiamano rispettivamente parte positiva e parte negativa di f . Per quanto
appena dimostrato, se f è integrabile in [a, b], anche f+ e f− lo sono.
10.5. Classi di funzioni integrabili
f(x)
293
|f(x)|
a
b a
b
f (x) e |f (x)|
f-(x)
f+(x)
a
b a
b
Parte negativa e positiva di f (x)
10.5
Classi di funzioni integrabili
In questo paragrafo dimostriamo che una funzione limitata in [a, b] è Riemann
integrabile se è continua, oppure ha un numero finito di discontinuità, oppure è
monotona.
Teorema 10.5.1 Sia f : [a, b] → R continua. Allora f ∈ R[a, b].
Dimostrazione. Dimostriamo che se f è continua allora vale (10.3.6).
Si fissi ε > 0 ad arbitrio. Poiché f è uniformemente continua in [a, b], per
il Teorema di Heine–Cantor esiste δ > 0 tale che per ogni coppia di punti
t, s ∈ [a, b], con |t − s| < δ, si ha
|f (t) − f (s)| < δ.
Sia P una partizione tale che
max
0≤j≤n−1
(xj+1 − xj ) < δ.
(10.5.2)
294
10. Integrale di Riemann
Dobbiamo valutare
S(P ) − s(P ) =
n−1
X
Lj (xj+1 − xj ) −
j=0
=
n−1
X
n−1
X
`j (xj+1 − xj )
j=0
(Lj − `j ) (xj+1 − xj ) .
j=0
Per il teorema di Weierstrass, per ogni j esistono due punti tj , sj ∈ [xj , x+1 ] tali
che
f (tj ) =
f (sj ) =
max
f (x) = Lj
min
f (x) = `j .
xj ≤x≤x+1
xj ≤x≤x+1
Si ha |tj − sj | ≤ xj+1 − xj < δ per (10.5.2). Quindi
Lj − `j = f (tj ) − f (sj ) < ε.
Ne segue
n−1
X
(Lj − `j ) (xj+1 − xj ) <
n−1
X
j=0
ε (xj+1 − xj ) = ε
j=0
n−1
X
(xj+1 − xj )
j=0
= ε(b − a)
che è arbitrario assieme ad ε.
Come conseguenza del Teorema precedente e del Teorema 10.4.8, otteniamo
la seguente estensione.
Teorema 10.5.3 Sia f : [a, b] → R limitata. Se f ha un numero finito di
discontinuità, allora f ∈ R[a, b].
Dimostrazione. Supponiamo dapprima che f abbia un solo punto di discontinuità in a. Fissiamo ε > 0 ad arbitrio. Poiché f è continua, e quindi integrabile
in [a + ε, b], esiste una partizione P = {a + ε < x1 < · · · < xn < b} di [a + ε, b]
tale che S(P ) − s(P ) < ε.
Per quanto riguarda l’intervallo [a, a + ε], osserviamo che, detti L e ` gli
estremi inferiore e superiore di f (x) in tutto [a, b], si ha evidentemente
sup
f (x) ≤ L,
inf
a≤x≤a+ε
a≤x≤a+ε
f (x) ≥ `.
Aggiungendo a P il punto a, otteniamo una partizione P ∗ di [a, b]. Si ha
s(P ∗ ) = s(P ) + ε
inf
f (x) ≥ s(P ) + ε`
sup
f (x) ≤ S(P ) + εL
a≤x≤a+ε
S(P ∗ ) = S(P ) + ε
a≤x≤a+ε
10.5. Classi di funzioni integrabili
295
e quindi
S(P ∗ ) − s(P ∗ ) ≤ S(P ) − s(P ) + ε (L − `) < ε(L − ` + 1).
Per il Teorema 10.3.5, f ∈ R[a, b]. In modo analogo si ragiona se vi è un unico
punto di discontinuità in b.
Se vi è un unico punto di discontinuità t interno, f è R–integrabile in [a, t]
e [t, b] e quindi in [a, b], per il Teorema 10.4.8. Infine, se ci sono m punti
di discontinuità a ≤ t1 < · · · < tm ≤ b, si fissano m − 1 punti cj tale che
tj < cj < tj+1 , per ogni j = 1, . . . , m − 1. Per quanto appena dimostrato, f è
Riemann integrabile in ogni intervallo [cj , cj+1 ] e quindi in
[a, b] = [a, c1 ] ∪ [c1 , c2 ] ∪ · · · ∪ [cn−1 , b].
Si può dimostrare che condizione necessaria e sufficiente affinché f sia R-integrabile in [a, b] è che l’insieme dei punti di discontinuità abbia misura nulla
secondo Lebesgue. Noi ci limitiamo a dimostrare l’integrabilità delle funzioni
monotone, che possono avere una infinità numerabile di punti di discontinuità.
Si noti che una funzione monotona in [a, b] è necessariamente limitata. Se, ad
esempio, f (x) è non decrescente, si ha f (a) ≤ f (x) ≤ f (b) per ogni x ∈ [a, b].
Teorema 10.5.4 Sia f : [a, b] → R monotona. Allora f ∈ R[a, b].
Dimostrazione. Supponiamo, per fissare le idee, che f sia monotona non
decrescente. Sia P una generica partizione di [a, b]. Per la monotonia si ha
`j = f (xj ),
Lj = f (xj+1 ),
per ogni j = 0, 1, . . . , n − 1.
Quindi
S(P ) − s(P ) =
n−1
X
(Lj − `j ) (xj+1 − xj )
j=0
=
n−1
X
(f (xj+1 ) − f (xj+1 )) (xj+1 − xj ).
j=0
Fissato ε > 0 ad arbitrio, scegliamo P in modo che
xj+1 − xj < ε,
per ogni j = 0, 1, . . . , n − 1.
Si ha quindi
n−1
X
j=0
(f (xj+1 ) − f (xj+1 )) (xj+1 − xj ) < ε
n−1
X
(f (xj+1 ) − f (xj ))
j=0
= ε (f (x1 ) − f (x0 ) + f (x2 ) − f (x1 ) − f (x2 ) + · · · + f (xn )) = ε (f (b) − f (a)) .
296
10. Integrale di Riemann
Poiché ε è arbitrario, segue la tesi.
Sappiamo che una funzione non negativa e R–integrabile in [a, b] possiede
integrale non negativo. Si consideri ora il seguente esempio. Si fissi x0 ∈ [a, b]
e sia f : [a, b] → R tale che f (x) = 0 se x 6= x0 , ma tale che f (x0 ) > 0. Una
funzione di questo tipo è Riemann-integrabile in [a, b], poiché possiede una sola
Rb
discontinuità. Inoltre a f (x)dx = 0, perché tutte le somme inferiori sono nulle.
Il trapezoide T si riduce in questo caso a un segmento, che possiede area nulla.
Rb
Esistono quindi funzioni R–integrabili tali che f (x) ≥ 0, a f (x)dx = 0, ma
f non è identicamente nulla. Il seguente Teorema mostra che questo fenomeno
non può accadere per una funzione continua.
Teorema 10.5.5 (di annullamento) Sia f : [a, b] → R continua in [a, b]. Sia
f (x) ≥ 0 per ogni x ∈ [a, b]. Se
Z b
f (x)dx = 0,
a
allora f (x) = 0 per ogni x ∈ [a, b].
Dimostrazione. Per assurdo esista x0 ∈ [a, b] tale che f (x0 ) > 0. Supponiamo,
per fissare le idee, x0 interno. Poiché f è continua, esiste δ > 0 tale che per ogni
x ∈ [x0 − δ, x0 + δ] si ha f (x) ≥ 12 f (x0 ). Si ha, poiché f (x) ≥ 0 in [a, b],
Z b
Z x0 −δ
Z x0 +δ
Z b
f (x)dx =
f (x)dx +
f (x)dx +
f (x)dx
a
a
Z
x0 −δ
x0 +δ
Z
x0 +δ
≥
f (x)dx ≥
x0 −δ
x0 −δ
x0 +δ
1
f (x0 )dx
2
= δf (x0 ) > 0,
contro l’ipotesi che l’integrale sia nullo, assurdo.
10.6
Integrale esteso a un intervallo orientato
Rb
Nella definizione del simbolo a f (x)dx si è finora supposto a < b, cioè l’integrale è esteso a un intervallo orientato concordemente all’orientazione dell’asse
delle ascisse. Per conferire maggiore flessibilità formale al simbolo di integrale,
introduciamo l’integrale esteso a un intervallo orientato negativamente, o esteso
a un singolo punto.
Definizione 10.6.1 Sia f : [a, b] → R limitata e Riemann integrabile in [a, b].
Poniamo:
Z a
Z b
f (x)dx = −
f (x)dx
a
Zb a
f (x)dx = 0.
a
10.6. Integrale esteso a un intervallo orientato
297
RIla Teorema di linearità 10.4.1 continua ovviamente a valere per il simbolo b f (x)dx. Il Teorema di monotonia vale con diseguaglianza invertita. Il
Teorema 10.4.8 continua a valere, ma richiede una semplice verifica.
Teorema 10.6.2 Sia f ∈ R[α, β] → R. Siano a, b, c tre punti qualsiasi di
[α, β], disposti in qualunque ordine e non necessariamente distinti. Si ha
Z b
Z c
Z b
f (x)dx =
f (x)dx +
f (x)dx.
(10.6.3)
a
a
c
Dimostrazione. La dimostrazione di (10.6.3) si conduce esaminando tutti i
casi possibili. Sia ad esempio c < a < b. Si ha
Z b
Z a
Z b
f (x)dx =
f (x)dx +
f (x)dx,
c
c
a
da cui
Z
Z
b
a
Z
b
f (x)dx =
a
f (x)dx −
c
Z
=
f (x)dx
c
Z
c
f (x)dx +
a
b
f (x)dx.
c
Gli altri casi si verificano in modo analogo.
Il Teorema 10.4.13 vale in forma diversa.
Teorema 10.6.4 Siano f, g ∈ R[α, β] → R, e siano a, b ∈ [α, β], disposti in
qualunque ordine e non necessariamente distinti. Allora
¯Z
¯ ¯Z
¯
¯ b
¯ ¯ b
¯
¯
¯ ¯
¯
f (x)dx¯ ≤ ¯
|f (x)| dx¯ .
(10.6.5)
¯
¯ a
¯ ¯ a
¯
Dimostrazione. Se a = b la tesi è ovvia. Se a < b, (10.6.5) non è altro che
(10.4.14). Se b < a, si applica il Teorema 10.4.13 all’intervallo [b, a]. Si ottiene
¯Z
¯ ¯Z
¯ Z a
¯ b
¯ ¯ a
¯
¯
¯ ¯
f (x)dx¯ = ¯
f (x)dx¯¯ ≤
|f (x)| dx
¯
¯ a
¯
b
b
¯Z
¯
¯ b
¯
¯
¯
=¯
|f (x)| dx¯ .
¯ a
¯
Corollario 10.6.6 Sia f ∈ R[α, β] → R, e siano a, b ∈ [α, β], disposti in
qualunque ordine e non necessariamente distinti. Se |f (x)| ≤ g(x) per ogni x,
allora
¯Z
¯ ¯Z
¯
¯ b
¯ ¯ b
¯
¯
¯ ¯
¯
f (x)dx¯ ≤ ¯
g(x)dx¯ .
(10.6.7)
¯
¯ a
¯ ¯ a
¯
298
10. Integrale di Riemann
Dimostrazione. Se a = b la tesi è ovvia. Se a < b
¯Z
¯ Z
¯Z
¯
Z b
¯ b
¯
¯ b
¯
b
¯
¯
¯
¯
f (x)dx¯ ≤
|f (x)| dx ≤
g(x)dx = ¯
g(x)dx¯ .
¯
¯ a
¯
¯
¯
a
a
a
Se a > b la tesi continua a valere, poiché (10.6.7) non dipende dall’ordine di a
e b.
10.7
Il Teorema fondamentale del calcolo integrale
Definizione 10.7.1 Sia f ∈ [a, b] → R, limitata e R–integrabile in [a, b]. Per
ogni x ∈ [a, b] poniamo
Z x
F (x) =
f (t)dt.
(10.7.2)
a
La funzione F cosı̀ definita si chiama funzione integrale di f in [a, b].
Teorema 10.7.3 Sia f ∈ [a, b] → R, limitata e R–integrabile in [a, b]. La
funzione integrale F (x) gode delle seguenti proprietà
a) F è continua in [a, b].
b) Se f è continua in x0 ∈ [a, b], allora F è derivabile in x0 e si ha
F 0 (x0 ) = f (x0 ).
(10.7.4)
Dimostrazione. a) Dimostriamo che F è uniformemente continua. Per ogni
x, y ∈ [a, b] si ha, tenendo conto di (10.6.3),
¯Z x
¯ ¯Z x
¯
Z y
Z a
¯
¯ ¯
¯
¯
¯
¯
|F (x) − F (y)| = ¯
f (t)dt −
f (t)dt ¯ = ¯
f (t)dt +
f (t)dt¯¯
a
a
a
y
¯Z x
¯
¯
¯
= ¯¯
f (t)dt ¯¯ .
y
Poniamo L = supx∈[a,b] |f (x)|. Per (10.6.5) e per il Corollario 10.6.6 (con g(x) =
L) si ha
¯Z x
¯ ¯Z x
¯ ¯Z x
¯
¯
¯ ¯
¯ ¯
¯
¯
¯≤¯
¯≤¯
¯
f
(t)dt
|f
(t)|
dt
Ldx
¯
¯ ¯
¯ ¯
¯
y
y
y
= L|x − y|.
Fissato ε > 0 ad arbitrio, sia δ = ε/M . In tal caso, |x − y| < δ implica
|F (x) − F (y)| < ε.
b) Il rapporto incrementale di F relativo al punto iniziale x0 si può scrivere
come
"Z
#
Z x0
x0 +h
1
F (x0 + h) − F (x0 )
=
f (t)dt −
f (t)dt
h
h a
a
Z
1 x0 +h
=
f (t)dt.
h x0
10.7. Il Teorema fondamentale del calcolo integrale
299
Si può inoltre scrivere
f (x0 ) =
1
h
Z
x0 +h
f (x0 )dt.
x0
Per (10.6.5) si ha
¯
¯ ¯¯ Z x0 +h
¯
¯
¯ ¯1
¯ F (x0 + h) − F (x0 )
¯
¯=¯
¯
−
f
(x
)
(f
(t)
−
f
(x
))
dt
¯
0
0
¯
¯
¯
¯
h
h x0
¯Z
¯
¯
1 ¯¯ x0 +h
¯
≤
|f (t) − f (x0 )| dt ¯ .
¯
¯
|h| ¯ x0
(10.7.5)
Poiché f è continua in x0 , fissato ε > 0 esiste δ > 0 tale che |f (t) − f (x0 )| < ε
per ogni t tale che |t − t0 | < δ, si ha |t − t0 | < δ. Sia h tale che |h| < δ, h 6= 0.
Per ogni t ∈ [x0 , x0 + h] (o t ∈ [x0 + h, x0 ]) si ha allora |t − t0 | < δ. Ne segue
che l’integranda in (10.7.5) è minore di ε. Per il Corollario 10.6.6,
¯Z
¯Z
¯
¯
¯
¯
1 ¯¯ x0 +h
1 ¯¯ x0 +h
¯
¯
|f (t) − f (x0 )| dt ¯ ≤
εdt ¯ = ε
¯
¯
¯
¯
¯
¯
|h| x0
|h| x0
e quindi la tesi.
Se c ∈ [a, b] è fissato, si può definire, in analogia a (10.7.2), la funzione
integrale a partire dal punto c. Si pone cioè, per ogni x ∈ [a, b],
Z x
Fc (x) =
f (t)dt.
(10.7.6)
c
La funzione Fc differisce dalla funzione F = Fa per una costante. Infatti
Z x
Z c
F (x) = Fa (x) =
f (t)dt =
f (t)dt + Fc (x).
a
a
Quindi a) e b) del Teorema 10.7.3 valgono anche per Fc .
Se f : [a, b] → R è continua per ogni x ∈ [a, b], per il punto b) del Teorema
precedente la funzione F (x) è derivabile in [a, b] con funzione derivata f (x). Si
ha quindi il risultato anticipato nel capitolo 9.
Corollario 10.7.7 (Esistenza della primitiva di una funzione continua)
Sia f : [a, b] → R continua in [a, b]. La funzione integrale (10.7.2) è una
primitiva di f in [a, b].
Segue immediatamente il risultato principale di questo paragrafo.
Teorema 10.7.8 (Teorema fondamentale del calcolo integrale) Sia f :
[a, b] → R continua in [a, b]. Sia ϕ una qualunque primitiva di f in [a, b].
Allora
Z
b
f (t)dt = ϕ(b) − ϕ(a).
a
(10.7.9)
300
10. Integrale di Riemann
Dimostrazione. Poiché anche la funzione integrale F (x) è una primitiva, esiste
una costante C tale che per ogni x ∈ [a, b]
Z x
f (t)dt = ϕ(x) + C.
(10.7.10)
a
Posto x = a in (10.7.10), si ha 0 = ϕ(a) + C, ossia C = −ϕ(a). Posto x = b, si
ottiene (10.7.9).
Il Teorema fondamentale del calcolo integrale asserisce che, una volta calcolata con qualsivoglia metodo una primitiva di f in [a, b], l’integrale di Riemann
di f in [a, b] si calcola come differenza dei valori della primitiva agli estremi dell’intervallo. La differenza ϕ(b) − ϕ(a) viene usualmente indicata con il simbolo
b
[ϕ(x)]a .
Il Teorema 10.7.8 vale anche in ipotesi più generali. Ne daremo una estensione nell’Appendice. Notiamo il seguente Corollario.
Corollario 10.7.11 (Teorema della media) Se f : [a, b] → R è continua in
[a, b], esiste z ∈ (a, b) tale che
1
b−a
Z
b
f (t)dt = f (z).
(10.7.12)
a
Dimostrazione. Sia ϕ una primitiva di f in [a, b]. Per il Teorema di Lagrange
esiste z ∈ (a, b) tale che ϕ(b) − ϕ(a) = (b − a)f (z). La tesi segue da (10.7.9).
La quantità a sinistra in (10.7.12) viene chiamata media di f in [a, b]. Sia
f (t) ≥ 0 in [a, b] e riscriviamo (10.7.12) nella forma
Z
b
f (t)dt = f (z)(b − a).
(10.7.13)
a
Il significato geometrico del Teorema della media è chiaro: l’area del trapezoide
relativo a f (t) è eguale all’area di un rettangolo di base [a, b] e altezza f (z).
Esempi 10.7.14
Z
π/2
1. Calcoliamo
sin xdx. Una primitiva di sin x è ϕ(x) = − cos x. Si ha
0
Z
π/2
0
Z
π/2
sin xdx = [− cos x]0
=1
1
(x3 + x)dx. Si ha
2. Calcoliamo
0
Z
0
1
·
(x3 + x)dx =
x4
x2
+
4
2
¸1
=
0
3
4
10.7. Il Teorema fondamentale del calcolo integrale
Z
301
1
3. Calcoliamo
arctan xdx. La primitiva dell’arcotangente è stata calcola0
ta nell’esempio 9.2.7.1. Risulta
¸1
·
Z 1
1
2
arctan xdx = x arctan x − log(1 + x )
2
0
0
π 1
= − log 2.
4
2
Z
2
x3 ex dx. La primitiva è stata calcolata nell’esempio 9.2.7.4.
4. Calcoliamo
Si ha
0
Z
2
0
¤2
£
x3 ex dx = x3 ex − 3x2 ex + 6xex − 6ex 0 = 2e2 + 6.
Il Teorema di integrazione per parti 9.2.5 fornisce la seguente formula per
l’integrale di Riemann:
Z b
Z b
b
0
f (x)g (x)dx = [f (x)g(x)]a −
f 0 (x)g(x)dx,
a
a
valida se f e g hanno derivata continua [a, b].
L’applicazione del Teorema 9.2.11, di integrazione per sostituzione, richiede
qualche commento. Sia f : I → R continua e sia x = x(t) : [a, b] → I una
funzione derivabile. Non si richiede che la funzione x(t) sia iniettiva né che sia
suriettiva. Poniamo, come nel paragrafo 9.2,
Z
ϕ(x) = f (x)dx,
Z
ψ(t) = f (x(t)) x0 (t)dt.
Sappiamo che ψ(t) = ϕ(x(t)) + C. Poniamo x(a) = c e x(b) = d. Si noti che
Z b
può essere sia c < d che c ≥ d. Se si vuole calcolare
f (x(t)) x0 (t)dt, si ottiene
a
dal Teorema fondamentale del calcolo integrale
Z b
f (x(t)) x0 (t)dt = ψ(b) − ψ(a)
a
= ϕ(d) − ϕ(c)
Z d
=
f (x)dx.
c
Se c ≥ d quest’ultimo integrale va interpretato come nella definizione 10.6.1.
Quindi non occorre, una volta calcolata ϕ(x), ricalcolare per sostituzione ψ(t).
Possiamo semplicemente calcolare la differenza dei valori di ϕ(x) in x(b) = d e
in x(a) = c.
302
10. Integrale di Riemann
Supponiamo ora che x(t) applichi biunivocamente [a, b] su [c, d]. Per fissare
le idee, sia x(t) crescente, in modo che x(a) = c e x(b) = d. Anche la funzione
inversa t(x) è crescente e ψ(t(x)) = ϕ(x). Si ha inoltre d = t(b), c = t(a). Si
Z d
voglia calcolare
f (x)dx. Si ha
c
Z
d
f (x) dx = ϕ(d) − ϕ(c)
c
= ψ(b) − ψ(a)
Z b
=
f (x(t)) x0 (t)dt.
a
Anche in questo caso non occorre, una volta calcolata ψ(t), risostituire t(x) a t.
Esempi 10.7.15
Z
π
(sin t)4 cos tdt. Per il calcolo della primitiva si pone, come
1. Calcoliamo
π/2
nell’esempio 9.2.14.1, x = sin t, da cui dx = cos tdt. In questo caso x(a) =
x(π/2) = 1 e x(b) = x(π) = 0. Si ha
Z π
Z 0
1
(sin t)4 cos tdt =
x4 dx = − .
5
π/2
1
Z
1
ex
dx. Per il calcolo della primitiva mediante sostitux
−1 1 + e
zione si veda l’esempio 9.2.14.3. Posto t = ex , si ha
Z 1
Z e
ex
dt
dx
=
= log(1 + e) − log(1 + e−1 ).
x
−1 1 + e
e−1 1 + t
2. Calcoliamo
10.8
Integrali impropri
L’integrale di Riemann è definito per funzioni limitate in intervalli compatti.
Queste restrizioni costituiscono una severa limitazione alle applicazioni del calcolo integrale. Con l’integrale di Lebesgue si ottiene una teoria soddisfacente
che supera queste restrizioni. Tuttavia, anche nell’ambito della teoria di Riemann, la nozione di integrale improprio (o generalizzato) offre una estensione
della nozione di integrale sufficiente per le applicazioni più comuni.
10.8.1
Integrali impropri di prima specie
Sia f : (a, b] → R e supponiamo f limitata e Riemann integrabile in ogni
intervallo del tipo [x, b], ove a < x < b. Non si richiede che f sia limitata in
tutto (a, b], né che sia definita in a. La funzione
Z b
f (t)dt
x
10.8. Integrali impropri
303
è definita per ogni x ∈ (a, b]. Essa non è altro che l’opposto della funzione
integrale Fb (x) definita in (10.7.6). Quindi
Z
b
−Fb (x) =
f (t)dt.
x
T
a
b
Trapezoide illimitato
Definizione 10.8.1 Sia f : (a, b] → R, e supponiamo f limitata e Riemann integrabile in [x, b], per ogni a < x < b. Si dice che f ammette integrale improprio
Rb
di prima specie in [a, b] se esiste finito limx→a+ x f (t)dt. In tal caso si pone
Z
x→a+
Z
b
lim
f (t)dt =
x
b
f (t)dt.
(10.8.2)
a
Il limite in (10.8.2), se esiste finito, si chiama integrale improprio di prima
specie di f in [a, b] e si indica con il medesimo simbolo dell’integrale di Riemann.
Questo non può dare luogo a equivoci. Infatti, se f ∈ R[a, b], in virtù della
continuità della funzione integrale (punto a) del Teorema 10.7.3, il limite di
−Fb (x) per x → a+ esiste ed è eguale all’integrale di Riemann di f in [a, b].
Se f (x) ≥ 0 in (a, b], l’integrale improprio di prima specie, se esiste, ha il
significato di area del trapezoide illimitato
T = {(x, y) : a < x ≤ b, 0 ≤ y ≤ f (x)} .
Quindi, anche se il trapezoide T è illimitato, la sua area può essere finita.
Si definisce analogamente l’integrale improprio di una funzione f : [a, b) → R,
limitata e Riemann integrabile in ogni intervallo [a, x], ove a < x < b. In questo
304
10. Integrale di Riemann
caso diremo cheR f ammette integrale improprio di prima specie in [a, b] se esiste
x
finito limx→b− a . Si pone di nuovo
Z
lim
f (t)dt =
x→b−
Si noti che
Rx
Z
x
a
b
f (t)dt.
a
= Fa (x) = F (x).
a
Studiamo ora l’esistenza dell’integrale improprio di prima specie per una
famiglia notevole di funzioni elementari. Sia, per ogni λ ∈ R,
fλ (t) =
1
,
(t − a)λ
ove a < t ≤ b.
Evidentemente, queste funzioni sono continue e quindi R–integrabili in ogni
intervallo del tipo [x, b]. Si ha
Z
b
x

b
[log |t − a|]x




dt
"
#x
=
1
1

(t − a)λ


 1−λ
λ−1
(t − a)
se λ = 1
se λ 6= 1.
a
Se λ = 1 si ha per x → a+
Z
b
x
dt
= log |b − a| − log |x − a| → +∞
(t − a)λ
e perciò f1 (t) non ammette integrale improprio in [a, b]. Se λ 6= 1, si ha
Z
b
x
"
#
1
dt
1
1
−
=
.
λ−1
(t − a)λ
1 − λ (b − a)λ−1
(x − a)
Per x → a+ si ha
Z
Z
b
x
b
x
dt
1
1
→
(t − a)λ
1 − λ (b − a)λ−1
dt
→ +∞
(t − a)λ
se λ < 1,
se λ > 1.
1
ammettono integrale improprio in [a, b] se e
(t − a)λ
1
solo se λ < 1. In maniera del tutto analoga si dimostra che le funzioni
(b − t)λ
ammettono integrale improprio in [a, b] se e solo se λ < 1.
In conclusione, le funzioni
10.8. Integrali impropri
10.8.2
305
Integrali impropri di seconda specie
Gli integrali impropri di seconda specie estendono la nozione di integrale agli intervalli illimitati. Come nel caso precedente, l’estensione è basata sull’esistenza
del limite finito della funzione integrale
Z x
Fa (x) =
f (t)dt.
a
Definizione 10.8.3 Sia f : [a, +∞) → R, limitata e Riemann integrabile in
ogni intervallo [a, x], ove a < x < +∞. Si dice che f ammette integrale improprio di seconda specie in [a, +∞) se esiste finito limx→+∞ Fa (x). In tal caso
poniamo
Z
Z
x
lim Fa (x) = lim
x→∞
x→+∞
+∞
f (t)dt =
a
f (t)dt.
(10.8.4)
a
Il limite in (10.8.2), se esiste finito, si chiama integrale improprio di seconda
speciedi f in [a, +∞).
Se f (x) ≥ 0 in [a, +∞), l’integrale improprio di seconda specie, se esiste, ha
il significato di area del trapezoide illimitato
T = {(x, y) : a ≤ x < +∞, 0 ≤ y ≤ f (x)} .
T
a
Trapezoide illimitato
In maniera analoga si definisce l’integrale improprio di seconda specie per
una funzione f : (−∞, a] → R, limitata e Riemann integrabile in ogni intervallo
[x, a]. In questo caso diremo che f ammette
R a integrale improprio di seconda
specie in (−∞, a] se esiste finito limx→−∞ x f (t)dt. Si pone
Z a
Z a
lim −Fa (x) = lim
f (t)dt =
f (t)dt.
x→−∞
x→−∞
x
−∞
Come nel sottoparagrafo precedente, si può determinare agevolmente l’esistenza
dell’integrale improprio per una famiglia notevole di funzioni elementari. Sia
a > 0 e poniamo, per ogni µ reale,
gµ (t) =
1
,
tµ
ove 0 < a ≤ t.
306
10. Integrale di Riemann
Si ha
Z
a
Z
x

x
[log t]a



dt
·
¸x
=
1
1

tµ


1 − µ tµ−1 a
se µ = 1
se µ 6= 1.
x
dt
= log x − log a → +∞ per x → +∞, e g1 non è integrabile in
a t
senso improprio in [a, +∞). Se µ 6= 1 si ha
·
¸
Z x
1
1
1
dt
=
−
,
µ
1 − µ xµ−1
aµ−1
a t
Quindi
per cui, al tendere di x a +∞,
Z x
dt
1
=
se µ > 1,
µ
µ−1
t
(µ
−
1)a
a
Z x
dt
→ +∞ se µ < 1.
µ
a t
1
In conclusione, le funzioni µ ammettono integrale improprio in [a, +∞), ove
t
a > 0, se e solo se µ > 1. In maniera del tutto analoga si dimostra che le
1
funzioni
ammettono integrale improprio in (−∞, a], con a < 0, se e solo
(−t)µ
se µ > 1.
10.8.3
Criteri del confronto
Una volta stabilita l’esistenza o meno dell’integrale improprio delle funzioni
elementari considerate nel precedente paragrafo, l’esistenza degli integrali impropri di funzioni più generali si studia per mezzo di criteri del confronto. Le
dimostrazioni sono svolte in Appendice.
Teorema 10.8.5 (del confronto per gli integrali impropri di I specie)
Siano f, g : (a, b] → R limitate e Riemann integrabili in ogni intervallo del tipo
[x, b], ove a < x < b.
a) Se |f (t)| ≤ g(t) per ogni t ∈ (a, b] e se esiste l’integrale improprio di priRb
ma specie a g(t)dt, allora esiste l’integrale improprio di prima specie
Rb
f (t)dt.
a
b) Se 0 ≤ f (x) ≤ g(t) per ogni t ∈ [a, +∞) e se non esiste l’integrale improprio
Rb
di prima specie a f (t)dt, allora non esiste l’integrale improprio di prima
Rb
specie a g(t)dt.
Ovviamente, l’analogo Teorema vale per funzioni definite in [a, b), limitate e
Riemann integrabili in ogni intervallo del tipo [a, x], ove a < x < b. Pure analogo
è l’enunciato del criterio del confronto per gli integrali impropri di seconda
specie.
10.8. Integrali impropri
307
Teorema 10.8.6 (del confronto per gli integrali impropri di II specie)
Siano f, g : [a, +∞) → R limitate e Riemann integrabili in ogni intervallo del
tipo [a, x], ove a < x < +∞.
a) Se |f (t)| ≤ g(t) per ogni t ∈ [a, +∞) e se esiste l’integrale improprio di
R +∞
seconda specie a g(t)dt, allora esiste l’integrale improprio di seconda
R +∞
specie a f (t)dt.
b) Se 0 ≤ f (t) ≤ g(t) per ogni t ∈ [a, +∞) e se non esiste l’integrale improprio
R +∞
di seconda specie a f (t)dt, allora non esiste l’integrale improprio di
R +∞
seconda specie a g(t)dt.
Il criterio del confronto per gli integrali del tipo
le ovvie modifiche.
Ra
−∞
f (t)dt si enuncia con
Esempi 10.8.7
sin 1/t
√ , definita e continua per t > 0. Questa funzione ammette
t
integrale improprio di prima specie in [0, 1] per il punto a) del Teorema
10.8.5. Infatti si ha, per ogni t ∈ (0, 1],
¯
¯
¯ sin 1/t ¯
¯ √ ¯ ≤ √1 = g(t).
¯
t ¯
t
1. Sia f (t) =
1
La funzione g(t) = √ ammette integrale improprio di prima specie in
t
[0, 1] per quanto stabilito nel precedente paragrafo
1 + t2
, definita e continua per t 6= 2. Questa funzione non
2−t
ammette integrale improprio di prima specie in [0, 2] per il punto b) del
Teorema 10.8.5. Infatti, per ogni t ∈ [0, 2) si ha
2. Sia g(t) =
1 + t2
1
≥
= f (t)
2−t
2−t
che non ammette integrale improprio in [0, 2].
sin t
, definita e continua per t 6= 0. Questa funzione ammett2
te integrale improprio di seconda specie in [1, +∞) per il punto a) del
Teorema 10.8.6. Infatti si ha, per ogni t ∈ [1, +∞),
¯
¯
¯ sin t ¯
1
¯
¯
¯ t2 ¯ ≤ t2 = g(t)
3. Sia f (t) =
che ammette integrale improprio di prima specie in [1, +∞).
308
10. Integrale di Riemann
arctan t
√
, definita e continua per ogni t > 0. Questa funzione
t
non ammette integrale improprio di seconda specie in [1, +∞) per il punto
b) del Teorema 10.8.6. Infatti si ha, per t ≥ 1,
4. Sia g(t) =
arctan t
arctan 1
π
√
√
≥
= √ = f (t)
t
t
4 t
che non ammette integrale improprio in [1, +∞).
Osservazione. Per l’applicabilità dei Teoremi del confronto per gli integrali
impropri è sufficiente che l’ipotesi |f (t)| ≤ g(t) nel caso a), 0 ≤ f (t) ≤ g(t)
nel caso b), valga solo in un opportuno intervallo (a, a + ε) o [M, +∞) (oppure
(b − ε, b), o (−∞, M ]). Infatti, possiamo scrivere
Z
Z
b
x
Z
a+ε
f (t)dt =
b
f (t)dt +
x
f (t)dt
a+ε
Rb
e il secondo addendo è costante rispetto a x. Quindi limx→a+ x f (t)dt esiste
R a+ε
se e solo se esiste limx→a+ x f (t)dt. Gli altri casi si trattano in maniera del
tutto analoga.
Di conseguenza, se f (t) e g(t) hanno segno costante in un intorno destro di a
Rb
e f (t) ∼ g(t) per x → a+, l’integrale improprio di prima specie a f (t)dt esiste
Rb
se e solo se esiste l’integrale improprio di prima specie a f (t)dt. Infatti, la
relazione ∼ implica che esistono due costanti c1 e c2 tali che in un opportuno
intervallo (a, a + ε) si abbia
c1 g(t) ≤ f (t) ≤ c2 g(t)
per ogni t ∈ (a, a + ε). Poiché f (t) e g(t) hanno segno costante (che possiamo
supporre positivo) in (a, a + ε) possiamo applicare il Teorema del confronto
10.8.5 a tale intervallo.
La stessa osservazione vale per gli integrali impropri di seconda specie. Siano
f, g : [a, +∞) → R due funzioni R–integrabili in ogni intervallo [a, M ] e aventi
segno costante in un intorno di +∞. Se f (t) ∼ g(t) per t → +∞ l’integrale
R +∞
R +∞
f (t)dt esiste se e solo se esiste a g(t)dt.
a
Esempi 10.8.8
Z
π/2
1. Studiamo l’esistenza di
t − t3
sin4/3 t
0
t − t3
sin
4/3
t
∼
e quindi l’integrale proposto esiste.
dt. Si ha per t → 0+
t
t4/3
=
1
t1/3
10.8. Integrali impropri
309
Z
+∞ 2
2. Studiamo l’esistenza di
0
t − arctan t
dt. Si ha per t → +∞
t3 + t + 1
t2 − arctan t
t2
1
∼ 3 ∼
3
t +t+1
t
t
e quindi l’integrale proposto non esiste.
10.8.4
Integrali impropri di terza specie
a1
a2
Vengono chiamati integrali impropri di terza specie integrali estesi a intervalli
I, limitati o illimitati, contenenti n punti, a1 , . . . , an nel cui intorno la funzione
integranda non è necessariamente limitata. L’integranda si suppone tuttavia
limitata e R–integrabile in ogni sottointervallo compatto di I non contenente
nessuno dei punti aj . Illustriamo questo concetto iniziando dai casi più semplici.
a) Sia f : (a, b) → R limitata e R–integrabile in ogni intervallo del tipo [x, y],
ove a < x < y < b. Fissato c ∈ (a, b), se esistono ambedue gli integrali impropri
di prima specie
Z c
Z b
f (t)dt,
f (t)dt,
a
c
si dice che f ammette integrale improprio in [a, b] e si pone
Z b
Z c
Z b
f (t)dt =
f (t)dt +
f (t)dt.
a
a
c
Si osservi che questa definizione non dipende dal punto c scelto. Infatti se d è
un altro punto in (a, b) si ha, per ogni a < x < y < b
Z c
Z d
Z c
f (t)dt =
f (t)dt +
f (t)dt,
Z
x
y
x
d
f (t)dt =
c
d
Z
Z
f (t)dt +
c
y
f (t)dt.
d
310
10. Integrale di Riemann
Quindi
Z
Z
c
lim
x→a+
x→a+
x
Z y
lim
x
Z y
f (t)dt,
(10.8.9)
f (t)dt.
(10.8.10)
d
Z d
f (t)dṫ +
y→b−
c
c
f (t)dt +
f (t)dṫ = lim
y→b−
Z
d
f (t)dt = lim
d
c
Rc
Rd
L’integrale di prima specie a f (t)dt esiste se e solo se esiste l’integrale a f (t)dt.
Rb
Rb
Cosı̀ pure, c f (t)dt esiste se e solo se esiste d f (t)dt. Sommando termine a
termine (10.8.9) e (10.8.10), si ha
Z
Z
c
Z
b
f (t)dt +
a
c
Z
d
f (t)dt =
b
f (t)dt +
f (t)dt.
a
d
Questa osservazione rimane valida, con gli opportuni cambiamenti, anche nei
casi successivi.
b) Sia f :(a, +∞) → R, limitata e R–integrabile in ogni intervallo [x, y] , ove
a < x < y < +∞. Fissato un punto c ∈ (a, +∞), se esistono ambedue gli
integrali impropri
Z c
Z +∞
f (t)dt,
f (t)dt,
a
c
si dice che f ammette integrale improprio in [a, +∞) e si pone
Z
Z
+∞
f (t)dt =
a
Z
c
+∞
f (t)dt +
a
f (t)dt.
c
Come nel caso precedente, questa definizione non
Z dipende dal punto c. Del tutto
a
analoga è la definizione degli integrali del tipo
f (t)dt, ove f : (−∞, a) → R
−∞
è limitata e R–integrabile in ogni intervallo [x, y] , con −∞ < x < y < a.
Esempi 10.8.11
Z
1. L’integrale
1
−1
√
dt
esiste. Infatti
1 − t2

1


f (t) ∼ p


2 (1 + t)





 f (t) ∼ p
1
2 (1 − t)
per t → −1,
per t → 1.
Z
c
√
e quindi esistono ambedue gli integrali
−1 < c < 1).
−1
dt
e
1 − t2
Z
1
√
c
dt
(ove
1 − t2
10.8. Integrali impropri
Z
311
1
2. L’integrale
dt
1/3
(1 − t)
0
log(1 + t)
non esiste. Infatti sia 0 < c < 1. Si ha

1

 f (t) ∼
t
1

 f (t) ∼
1/3
(1 − t) log 2
Z
1
Quindi
c
esiste.
(1 − t)
Z
∞
√
3
3. L’integrale
0
per t → 1.
Z
dt
1/3
per t → 0,
log(1 + t)
0
dt
(1 − t)
1/3
log(1 + t)
non
e−t
dt esiste. Infatti
arctan t

1


3
 f (t) ∼ √



c
esiste, mentre
per t → 0,
t
q
f (t) ∼
3
2 −t
πe
Z
≤ Ct−2
c
e quindi ambedue gli integrali
−∞
−∞ < c < 0).
√
3
per t → +∞
et dt
,
arctan t
Z
0
c
√
3
et dt
esistono (ove
arctan t
c) Sia f : (−∞, +∞) → R, limitata e R–integrabile in ogni [x, y], ove −∞ <
x < y < +∞. Fissato un punto c, se esistono ambedue gli integrali
Z
Z
c
f (t)dt,
−∞
+∞
f (t)dt,
(10.8.12)
c
si dice che f ammette integrale improprio in (−∞, +∞) e si pone
Z
Z
+∞
f (t)dt =
−∞
Z
c
+∞
f (t)dt +
−∞
f (t)dt.
c
Esempi 10.8.13
Z
+∞
dt
esiste. Infatti, sia per t → +∞ che per
2 + 1 + cos t
t
−∞
−2
t → −∞, si ha f (t) ∼ t . Ambedue gli integrali in (10.8.12) esistono.
Z +∞
dt
2. L’integrale
non esiste. Infatti il secondo integrale in (10.8.12)
t+t
e
−∞
esiste, poiché f (t) ∼ e−t per t → +∞. Tuttavia il primo non esiste, poiché
f (t) ∼ 1/t per t → −∞.
1. L’integrale
312
10. Integrale di Riemann
Supponiamo ora I = (α, β) ⊆ R. Sia f una funzione a valori reali definita
in (α, β), con l’eccezione al più di n valori
a1 < a2 < . . . < an .
Supponiamo f limitata e R–integrabile in ogni intervallo compatto che non
contenga nessuno dei punti aj , per j = 1, . . . , n. Se esistono tutti gli integrali
impropri
Z
Z
a1
Z
a2
f (t)dt,
α
a1
Z
an
f (t)dt, . . . ,
β
f (t)dt,
an−1
f (t)dt,
an
si dice che f ammette integrale improprio in I e si pone
Z
Z
β
a1
f (t)dt =
α
f (t)dt +
α
n−1
X Z aj+1
j=1
Z
β
f (t)dt +
αj
f (t)dt.
an
Esempi 10.8.14
1. Studiamo l’esistenza dell’integrale
√
Z +∞
3
0
t−1
dt.
(t2 + 1) log t
Si ha in questo caso a1 = 0 , a2 = 1, a3 = +∞. Si hanno le seguenti
relazioni

1

≤ Ct−1/2
per t → 0 + ,
f (t) ∼ −


log
t





√


3

t−1
1
f (t) ∼
= q
per t → 1,
2(t − 1)
2
3

2
(t
−
1)








1
1

 f (t) ∼
≤ 5/3
per t → +∞.
t5/3 log t
t
Esistono quindi gli integrali impropri
Z 1
Z
f (t)dt,
+∞
f (t)dt
1
0
e di conseguenza esiste l’integrale proposto.
2. Studiamo l’esistenza dell’integrale
Z +∞
p
−2
1
|t(1 − t2 )|
dt.
10.9. Appendice
313
In questo caso a1 = −1, a2 = 0, a3 = 1, a4 = +∞. Si ha

1
1


f (t) ∼ √


2 |1 + t|1/2

per t → −1,
f (t) ∼


1
1


 f (t) ∼ √
2 |1 − t|1/2
per t → 1,
f (t) ∼ t−3/2
1
1/2
|t|
per t → 0,
per t → +∞.
Esistono quindi gli integrali impropri
Z
Z
−1
−2
Z
0
f (t)dt,
f (t)dt,
−1
Z
1
+∞
f (t)dt,
0
f (t)dt.
1
L’integrale proposto esiste.
10.9
10.9.1
Appendice
Estensione del Teorema fondamentale del calcolo integrale
Teorema 10.9.1 Sia f ∈ R[a, b] e sia ϕ : [a, b] → R continua in [a, b] e derivabile eccetto al più in n punti t1 , . . . , tn . Sia inoltre ϕ0 (t) = f (t) per ogni t 6= tj ,
j = 1, . . . , n. Allora
Z b
f (t)dt = ϕ(b) − ϕ(a).
(10.9.2)
a
Dimostrazione. Sia ε > 0 fissato ad arbitrio e sia P = {x0 , x1 , . . . , xn }
una partizione tale che S(P ) − s(P ) < ε. Possiamo supporre che i punti tj
appartengano alla partizione. Si ha
ϕ(b) − ϕ(a) =
n−1
X
(ϕ(xj+1 ) − ϕ(xj )) .
(10.9.3)
j=0
Per il Teorema di Lagrange esiste zj ∈ (xj , xj+1 ) tale che
ϕ(xj+1 ) − ϕ(xj ) = (xj+1 − xj )ϕ0 (zj ) = (xj+1 − xj )f (zj )
per ogni j = 0, . . . , n − 1. Evidentemente si ha `j ≤ f (zj ) ≤ Lj . Da (10.9.3)
segue
s(P ) ≤ ϕ(b) − ϕ(a) ≤ S(P ).
Quindi
¯Z
¯
¯ b
¯
¯
¯
f (t)dt − (ϕ(b) − ϕ(a))¯ ≤ S(P ) − s(P ) < ε.
¯
¯ a
¯
314
10. Integrale di Riemann
1/2
1/2 1
-1/2
f (t) = mant t −
1
2
Studiamo un esempio notevole che sarà utilizzato più avanti per dimostrare
la formula di Stirling. La funzione f (t) = mant t − 1/2 ovviamente ha gli stessi
punti di discontinuità della mantissa. Invece, la funzione
ϕ(t) =
1
2
(mant t − 1/2)
2
(10.9.4)
è continua ovunque in R. Infatti, per ogni m ∈ Z si ha ϕ(m) = 1/8 e
1
lim
t→m− 2
µ
¶2
µ
¶2
1
1
1
1
mant t −
= = lim
mant t −
.
2
8 x→m+ 2
2
Inoltre ϕ è derivabile in tutti punti non interi e si ha chiaramente ϕ0 (t) = f (t),
per ogni t ∈
/ Z. Possiamo quindi applicare il Teorema 10.9.1 ad ogni intervallo
[a, b]. Si ha
¶
Z bµ
ib
1h
1
2
.
dt =
(mant t − 1/2)
mant t −
2
2
a
a
1/8
1
ϕ(t) =
10.9.2
1
2
2
(mant t − 1/2)
Formula di Taylor con resto integrale
Dimostriamo un’ulteriore espressione per il resto Tn della formula di Taylor.
Benché in questo caso si richiedano ipotesi più forti di quelle richieste per resto di
Lagrange, la formula di Taylor con resto integrale è utile per le generalizzazioni
a funzioni a valori vettoriali.
Teorema 10.9.5 Sia f : [a, b] → R e siano x0 , x ∈ [a, b], ove x0 < x. Supponiamo che f sia derivabile n volte con derivata n−esima continua in [x0 , x] .
10.9. Appendice
315
Allora vale la formula (8.11.2) con
Z
(x − x0 )n 1
Tn (x − x0 ) =
(1 − t)n−1 f (n) (x0 + t(x − x0 ))dt.
(n − 1)! 0
Dimostrazione. Poniamo h = x − x0 e sia, per ogni t ∈ [0, 1],
F (t) =
n−1
X
k=0
(1 − t)k hk (k)
f (x0 + th).
k!
Si ha
F (1) − F (0) = f (x0 + h) −
n−1
X
k=0
hk (k)
f (x0 ).
k!
Poiché F è derivabile con derivata continua in [0, 1], si ha anche
Z 1
F (1) − F (0) =
F 0 (t)dt.
(10.9.6)
0
Derivando F (t) e, successivamente, operando manipolazioni algebriche elementari sulle sommatorie, si ottiene
F 0 (t) = −
n−1
X
k=1
n−1
X (1 − t)k hk+1
hk (1 − t)k−1 (k)
f (x0 + th) +
f (k+1) (x0 + th)
(k − 1)!
k!
k=0
=
hn
(1 − t)n−1 f (n) (x0 + th).
(n − 1)!
La tesi segue da (10.9.2).
10.9.3
Confronto e esistenza degli integrali impropri
I Teoremi 10.8.5 e 10.8.6 hanno dimostrazioni del tutto analoghe. Ci limitiamo
a dimostrare il primo.
Dimostrazione. a) Siano f e g come nelle ipotesi del Teorema 10.8.5, parte a).
Sia {xn } una successione di punti tale che a < xn < b per ogni n e xn → a+ per
Rb
n → +∞. Poiché x g(t)dt ammette limite finito per x → a+, per ogni ε > 0
esiste n0 tale che per ogni m, n ≥ n0
¯
¯Z xm
¯ ¯¯Z b
Z b
¯
¯
¯ ¯
¯
¯
¯=¯
g(t)dt
g(t)
−
g(t)dt
¯ < ε.
¯
¯ ¯
¯
xn
xm
xn
Per tali valori di m e n si ha
¯Z
¯ ¯Z
¯ ¯Z x m
¯
Z b
¯ b
¯ ¯ xn
¯ ¯
¯
¯
¯ ¯
¯
¯
¯
f
(t)dt
−
f
(t)dt
=
f
(t)dt
≤
|f
(t)|
dt
¯
¯ ¯
¯
¯
¯
¯ xm
¯
xn
xm
xn
¯Z x m
¯
¯
¯
≤ ¯¯
g(t)dt¯¯ < ε.
xn
316
10. Integrale di Riemann
Rb
Quindi la successione xn f (t)dt converge per n → +∞. Se {yn } è un’altra
successione tale che a < yn < b per ogni n, e yn → a+ per n → +∞, si ha come
sopra
¯Z
¯ ¯Z
¯
¯ ¯¯Z b
Z b
Z b
¯ ¯ xn
¯
¯ b
¯ ¯
¯
¯ ¯
¯
f (t)dt −
f (t)dt¯ ≤ ¯
g(t)dt¯¯ = ¯
g(t) −
g(t)dt¯ → 0
¯
¯ yn
¯
¯
¯
xn
yn
yn
xn
Rb
Rb
per n → +∞. Quindi yn f (t)dt e xn f (t)dt convergono allo stesso limite. Ne
Rb
segue che a f (t)dt esiste.
b) Siano f e g come nelle ipotesi del Teorema, parte b). Poiché f e g sono
Rb
Rb
non negative, le funzioni x f (t)dt e x g(t)dt sono non crescenti quindi ambeRb
due ammettono limite per x → a+. Poiché a f (t)dt non esiste, necessariamente
Rb
limx→a+ x f (t)dt = +∞. D’altra parte
Z
Z
b
b
f (t)dt ≤
x
da cui limx→a+
Rb
x
g(t)dt
x
g(t)dt = +∞.
Se esiste l’integrale improprio di |f (t)|, per il Teorema appena dimostrato
esiste quello di f (t). Viceversa, se esiste l’integrale improprio di f (t) non è detto
che esista quello di |f (t)|.
Si consideri il seguente esempio. Sia f (t) = mant t−1/2 e sia ϕ(t) la funzione
R +∞
in (10.9.4). Esiste l’integrale improprio 1 f (t)t−1 dt ma non quello del suo
valore assoluto. Infatti si ha, integrando per parti,
·
¸x Z x
Z x
f (t)
ϕ(t)
ϕ(t)
dt =
+
dt
t
t
t2
1
1
1
Z x
ϕ(x) 1
ϕ(t)
=
− +
dt.
x
8
t2
1
ϕ(t)
è una
t
funzione continua per t 6= 0, e per ogni ogni t ∈ [1, x] non intero, si ha
L’integrazione per parti è giustificata dal Teorema 10.9.1. Infatti
D
f (t) ϕ(t)
ϕ(t)
=
− 2 .
t
t
t
Poiché |ϕ(t)| ≤ 1/8, per x → +∞ si ha che
R +∞
Quindi esiste 1 f (t)t−1 dt.
D’altra parte
Z
1
n
ϕ(x)
→ 0 e che
x
Z
x
1
ϕ(t)
dt converge.
t2
n−1
n−1
X 1 Z k+1
|f (t)|
1X 1
dt ≥
|mant t − 1/2| dt =
t
k+1 k
2
k+1
k=1
k=1
10.9. Appendice
317
che diverge per n → +∞.
Lo stesso ragionamento può essere utilizzato per mostrare che esiste l’integrale improprio
Z +∞
sin t
dt
t
1
ma non quello del suo modulo. Infatti,
·
¸x Z x
Z x
sin t
cos t
cos t
dt = −
+
dt.
t
t
t2
1
1
1
(10.9.7)
Chiaramente il termine a destra in (10.9.7) tende a un limite finito per x → +∞.
D’altra parte
Z
nπ
1
10.9.4
Z (k+1)π
n−1
n−1
X
|sin t|
1
2X 1
dt ≥
|sint| =
.
t
(k + 1) π kπ
π
k+1
k=1
k=0
Formula di Wallis
Teorema 10.9.8 (Formula di Wallis) Vale la seguente formula
1
n→+∞ 2n + 1
lim
µ
2 · 4 · 6 · · · · · 2n
1 · 3 · 5 · · · · · (2n − 1)
¶2
=
π
.
2
(10.9.9)
Dimostrazione. Per ogni k ≥ 0 intero poniamo
Z
π/2
Ik =
sink xdx.
0
Calcoliamo Ik , ove k > 1, integrando per parti. Si ha
£
¤π/2
Ik = − cos x sink−1 x 0 + (k − 1)
Z
π/2
= (k − 1)
Z
π/2
0
Z
π/2
sink−2 xdx − (k − 1)
0
cos2 x sink−2 xdx
sink xdx.
0
Ne segue la formula ricorsiva
Ik =
k−1
Ik−2 .
k
Il calcolo di Ik è quindi ricondotto al calcolo di
Z
π/2
I0 =
dx =
0
Z
I1 =
π
,
2
π/2
sin dx = 1,
0
(10.9.10)
318
10. Integrale di Riemann
a seconda che k sia pari o dispari. Supponiamo dapprima k = 2n. Iterando n
volte la formula ricorsiva (10.9.10) si ottiene
(2n − 1) · (2n − 3) · · · · · 3 · 1
I0
(2n) · (2n − 2) · · · · · 4 · 2
(2n − 1) · (2n − 3) · · · · · 3 · 1 π
.
=
(2n) · (2n − 2) · · · · · 4 · 2 2
I2n =
Se invece k = 2n + 1 si ha, con lo stesso procedimento,
(2n) · (2n − 2) · · · · · 4 · 2
I1
(2n + 1) · (2n − 1) · · · · · 3 · 1
(2n) · (2n − 2) · · · · · 4 · 2
=
.
(2n + 1) · (2n − 1) · · · · · 3 · 1
I2n+1 =
Ne segue
I2n+1
1
=
I2n
2n + 1
µ
2 · 4 · 6 · · · · · 2n
1 · 3 · 5 · · · · · (2n − 1)
¶2
2
.
π
(10.9.11)
Si osservi ora che Ik+1 < Ik per ogni k ≥ 0. Tenendo conto di (10.9.10) si ha
2n + 1
I2n+2
I2n+1
I2n
=
<
<
= 1.
2n + 2
I2n
I2n
I2n
Quindi limn→+∞ I2n+1 /I2n = 1. La tesi segue ora da (10.9.11).
La formula di Wallis verrà utilizzata più avanti per dimostrare la formula di
Stirling. A tal fine è opportuno riformulare la (10.9.9) in modo diverso. Notiamo
anzitutto che
2 · 4 · 6 · · · · · 2n = 2n (1 · 2 · 3 · · · · · n) = 2n n!
(2n − 1) · (2n − 3) · · · · · 3 · 1 =
(2n)!
(2n)!
= n .
2 · 4 · 6 · · · · · (2n)
2 n!
Quindi la (10.9.9) diviene
2
22n (n!)
1
lim √
=
n→+∞
2n + 1 2n!
r
π
.
2
Passando ai logaritmi si ottiene
Ã
lim
n→+∞
2n log 2 + 2
n
X
k=1
2n
X
1
log k
log k − log(2n + 1) −
2
k=1
!
=
1
π
log .
2
2
(10.9.12)
10.9. Appendice
10.9.5
319
Somme e integrali. Formula di Eulero
Esiste unaR notevole relazione tra le somme parziali della serie
x
l’integrale 1 f (t)dt.
P+∞
n=1
f (k) e
Teorema 10.9.13 (di Eulero) Sia f : [0, +∞) → R, derivabile con derivata
continua in [0, +∞). Allora, per ogni n ∈ N vale la seguente formula di Eulero
n
X
Z
n
f (k) =
f (t)dt +
1
k=1
1
(f (1) + f (n)) +
2
Z
n
(mant t − 1/2) f 0 (t)dt. (10.9.14)
1
Dimostrazione. Per ogni k ≥ 0 intero e per ogni t ∈ [k, k + 1) si ha
mant t − 1/2 = t − k − 1/2.
Integrando per parti si ottiene
Z
Z
k+1
k+1
0
(mant t − 1/2) f (t)dt =
k
(t − k − 1/2) f 0 (t)dt
k
Z
k+1
= [(t − k − 1/2) f (t)]k
=
1
(f (k + 1) + f (k)) −
2
k+1
−
Z
f (t)dt
k
k+1
f (t)dt.
k
Sommando per k da 0 a n − 1 si ha
Z
n
1
Z n
n−1
n−1
1X
1X
(mant t − 1/2) f (t)dt =
f (k + 1) +
f (k) −
f (t)dt
2
2
1
k=1
k=1
Z n
n
X
1
=
f (k) − (f (1) + f (n)) −
f (t)dt,
2
1
0
k=1
che equivale alla (10.9.14).
Una
P+∞conseguenza interessante è un criterio di convergenza per le serie del
tipo n=1 f (k).
Corollario 10.9.15 Sia f : [1, +∞) → R, derivabile con derivata continua in
[1, +∞). Siano f e |f 0 |Pintegrabili in senso improprio in [1, +∞) e sia f (n) → 0
+∞
per n → +∞. Allora, n=1 f (k) converge e si ha
+∞
X
n=1
Z
+∞
f (k) =
1
1
f (t)dt + f (1) +
2
Z
+∞
(mant t − 1/2) f 0 (t)dt.
1
Dimostrazione. Si ha
|(mant t − 1/2) f 0 (t)| ≤
1 0
|f (t)|
2
(10.9.16)
320
10. Integrale di Riemann
R +∞
e quindi 1 (mant t − 1/2) f 0 (t)dt esiste. Passando al limite per n → +∞ in
(10.9.14) si ottiene la (10.9.16)
La formula di Eulero può essere utilizzata anche per stimare il comportamento asintotico di somme parziali di serie divergenti. Poniamo ad esempio
f (x) = 1/x. La (10.9.14) diviene
Z n
n
X
1
1
(mant t − 1/2)
= log n +
−
dt.
k
2n
t2
1
k=1
Sia
Z
+∞
γ=
1
Si ha
Z
1
poiché
n
Z
+∞
(mant t − 1/2)
dt
t2
n
µ ¶
1
,
=γ+O
2n
(mant t − 1/2)
dt = γ −
t2
¯Z
¯
¯
¯
Quindi
(mant t − 1/2)
dt.
t2
+∞
n
¯
Z
(mant t − 1/2) ¯¯ 1 +∞ dt
1
=
.
¯≤ 2
2
t2
t
2n
n
µ ¶
n
X
1
1
1
= log n +
+γ+O
.
k
2n
2n
k=1
La costante γ prende il nome di costante di Eulero-Mascheroni. Il suo valore è
γ = 0.5772 . . .
Un’altra applicazione notevole della (10.9.14) consiste in una semplice dimostrazione della formula di Stirling, che svolgeremo nel prossimo sottoparagrafo.
10.9.6
Formula di Stirling
Teorema 10.9.17 (Formula di Stirling) Per ogni intero n ≥ 1 intero vale
la formula
√
n! = nn e−n 2πn eθn /12n
(10.9.18)
ove |θn | ≤ 1.
Dimostrazione. Dimostriamo la (10.9.18) in forma logaritmica, ovvero
n
X
1
θn
1
log n + log 2π +
.
(10.9.19)
2
2
12n
k=1
Rx
Scriviamo la (10.9.14) con f (t) = log t, ricordando che 1 log tdt = x log x − x.
Si ha
Z n
n
X
1
(mant t − 1/2)
dt.
(10.9.20)
log k = n log n − n + 1 + log n +
2
t
1
k=1
log k = n log n − n +
10.9. Appendice
321
L’esistenza dell’integrale
Z
+∞
σ=
1
(mant t − 1/2)
dt
t
(10.9.21)
è stata dimostrata nella sottosezione 10.9.3. La (10.9.20) si può scrivere come
Z +∞
n
X
1
(mant t − 1/2)
log k = n log n − n + 1 + log n + σ −
dt. (10.9.22)
2
t
n
k=1
Procediamo alla valutazione di
Z +∞
(mant t − 1/2)
dt.
t
n
(10.9.23)
La generica primitiva di mant t − 1/2 (eccetto che nei punti interi) è la
funzione
1
2
ϕ(t) + C = (mant t − 1/2) + C.
2
Scegliamo C = −1/12. Questa scelta della costante permette di ottenere agevolmente la migliore stima dell’integrale in (10.9.23). Integrando per parti si
ha
·
¸+∞ Z +∞
Z +∞
(mant t − 1/2)
ϕ(t) − 1/12
ϕ(t) − 1/12
dt =
+
dt
t
t
t2
n
n
n
Z +∞
ϕ(t) − 1/12
1
+
dt.
=−
24n
t2
n
Poiché maxt |ϕ(t) − 1/12| = 1/8 − 1/12 = 1/24, si ha la stima
¯Z +∞
¯
Z +∞
¯
|ϕ(t) − 1/12|
(mant t − 1/2) ¯¯
1
¯
dt¯ ≤
+
dt
¯
t
24n
t2
n
n
Z +∞
1
1
dt
≤
+
24n 24 n
t2
1
=
.
12n
Equivalentemente, possiamo scrivere
Z +∞
(mant t − 1/2)
θn
dt =
,
ove |θn | ≤ 1.
t
12n
n
(10.9.24)
Rimane ora da calcolare l’integrale σ. Utilizziamo a tal fine la formula di Wallis
nella forma equivalente (10.9.12). Le due sommatorie che appaiono a sinistra in
(10.9.12) si esprimono mediante (10.9.20). Risulta
2
n
X
k=1
log k −
2n
X
log k =
k=1
= −2n log 2 + 1 +
1
n
log + 2
2
2
Z
1
n
(mant t − 1/2)
dt −
t
Z
1
2n
(mant t − 1/2)
dt.
t
322
10. Integrale di Riemann
Quindi
n
X
2n
X
1
log k − log(2n + 1) −
2n log 2 + 2
log k =
2
k=1
k=1
Z n
Z 2n
1
n
(mant t − 1/2)
(mant t − 1/2)
= 1 + log
+2
dt −
dt
2
4n + 2
t
t
1
1
(10.9.25)
Poiché
lim
n→+∞
µ Z
2
1
n
(mant t − 1/2)
dt −
t
Z
1
2n
¶
(mant t − 1/2)
dt = σ,
t
il termine in (10.9.25) tende a 1 − 12 log 4 + σ per n → +∞. In forza di (10.9.12)
si ha quindi
1
σ = −1 + log 2π.
(10.9.26)
2
Riunendo le formule (10.9.22), (10.9.24) e (10.9.26) si ottiene la (10.9.19).