Analisi Matematica Paolo Maurizio Soardi Indice Prefazione xi 1 Numeri reali 1.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . 1.2 Rappresentazione decimale dei numeri razionali . . 1.3 Numeri reali e ordinamento . . . . . . . . . . . . . 1.4 Partizioni di Q e di R . . . . . . . . . . . . . . . . 1.5 Operazioni tra numeri reali . . . . . . . . . . . . . 1.6 Una diseguaglianza fondamentale . . . . . . . . . . 1.7 Radici, potenze, logaritmi . . . . . . . . . . . . . . 1.8 Spazi euclidei . . . . . . . . . . . . . . . . . . . . . 1.9 Appendice . . . . . . . . . . . . . . . . . . . . . . . 1.9.1 Proprietà degli estremi superiore e inferiore 1.9.2 Proprietà delle operazioni in R . . . . . . . 1.9.3 Radici e potenze . . . . . . . . . . . . . . . 1.9.4 Logaritmi . . . . . . . . . . . . . . . . . . . 2 Funzioni 2.1 Introduzione . . . . . . . . . . . . . . . . 2.2 Immagini e controimmagini . . . . . . . 2.3 Restrizione, funzione inversa, composta. 2.4 Successioni. Indici . . . . . . . . . . . . 2.5 Potenza di un insieme . . . . . . . . . . 2.6 Potenza del numerabile . . . . . . . . . 2.7 Potenza del continuo . . . . . . . . . . . 2.8 Appendice . . . . . . . . . . . . . . . . . 2.8.1 Le funzioni come sottoinsiemi del 2.8.2 Proprietà degli insiemi infiniti . . 2.8.3 Potenza dell’insieme delle parti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 1 3 10 11 14 14 16 20 20 21 26 27 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . prodotto cartesiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 29 29 32 35 37 38 40 42 42 42 44 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Spazi Metrici 47 3.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 3.2 Definizione ed esempi . . . . . . . . . . . . . . . . . . . . . . . . 47 3.3 Intorni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 v vi Indice 3.4 3.5 3.6 3.7 3.8 3.9 3.10 Classificazione dei punti . . . . . . . Insiemi aperti, chiusi, limitati . . . . Compattezza . . . . . . . . . . . . . Il Teorema di Heine–Borel . . . . . . Connessione . . . . . . . . . . . . . . R come spazio metrico . . . . . . . . Appendice . . . . . . . . . . . . . . . 3.10.1 Compattezza in Rn . . . . . . 3.10.2 Norme e distanze . . . . . . . 3.10.3 Proprietà dello spazio metrico . . . . . . . . .¡ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .¢ . R, d∗ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 58 64 69 69 71 73 73 76 77 4 Successioni 4.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Successioni convergenti . . . . . . . . . . . . . . . . . . 4.3 Sottosuccessioni e punti di accumulazione . . . . . . . 4.4 Successioni a valori reali . . . . . . . . . . . . . . . . . 4.5 Permanenza del segno. Confronto . . . . . . . . . . . . 4.6 Successioni monotone . . . . . . . . . . . . . . . . . . 4.7 Calcolo dei limiti . . . . . . . . . . . . . . . . . . . . . 4.7.1 Calcolo dei limiti in R . . . . . . . . . . . . . . 4.7.2 Calcolo dei limiti in R . . . . . . . . . . . . . . 4.8 Il numero e . . . . . . . . . . . . . . . . . . . . . . . . 4.9 Infiniti e infinitesimi . . . . . . . . . . . . . . . . . . . 4.10 o piccolo e asintotico . . . . . . . . . . . . . . . . . . . 4.11 Successioni in Rk . . . . . . . . . . . . . . . . . . . . . 4.12 Classe limite . . . . . . . . . . . . . . . . . . . . . . . 4.13 La condizione di Cauchy . . . . . . . . . . . . . . . . . 4.14 Appendice . . . . . . . . . . . . . . . . . . . . . . . . . 4.14.1 Dimostrazione del Teorema 4.7.2 . . . . . . . . 4.14.2 Dimostrazione dei Teoremi 4.7.4 e 4.7.6 . . . . 4.14.3 Dimostrazione del Teorema 4.7.8 . . . . . . . . 4.14.4 Dimostrazione dei Teoremi 4.7.9, 4.7.10, 4.7.12, . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.7.13 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 79 80 83 85 87 90 91 92 92 98 103 107 109 111 114 116 116 118 118 118 5 Serie 5.1 Introduzione . . . . . . . . . . . . . . . . 5.2 Definizioni ed esempi . . . . . . . . . . . 5.3 La condizione di Cauchy per le serie . . 5.4 Serie a termini non negativi . . . . . . . 5.5 Criteri della radice e del rapporto . . . . 5.6 Criterio di condensazione . . . . . . . . 5.7 Criterio di Leibniz . . . . . . . . . . . . 5.8 Convergenza incondizionata . . . . . . . 5.9 Appendice . . . . . . . . . . . . . . . . . 5.9.1 Somma di serie . . . . . . . . . . 5.9.2 Prodotto di serie . . . . . . . . . 5.9.3 Proprietà associativa per le serie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 121 121 124 127 129 131 134 135 137 137 138 140 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Indice vii 5.9.4 5.9.5 Permutazione dei termini di una serie . . . . . . . . . . . 141 Rappresentazione dei numeri reali come serie . . . . . . . 143 6 Limiti di funzioni 6.1 Introduzione . . . . . . . . . . . . . . . . 6.2 Limiti in spazi metrici . . . . . . . . . . 6.3 Limiti infiniti e limiti all’infinito . . . . 6.4 Limiti di funzioni reali di variabile reale 6.5 Segno, confronto. . . . . . . . . . . . . . 6.6 Limiti di successioni e limiti di funzioni 6.7 Calcolo dei limiti . . . . . . . . . . . . . 6.8 Infiniti, infinitesimi, o piccolo, asintotico 6.9 Appendice . . . . . . . . . . . . . . . . . 6.9.1 Classe limite di una funzione . . . . . . . . . . . . . . . . . . . . . . 145 145 146 150 156 160 163 165 167 171 171 7 Continuità 7.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Continuità in spazi metrici . . . . . . . . . . . . . . . . . . . . . 7.3 Continuità globale . . . . . . . . . . . . . . . . . . . . . . . . . 7.4 Continuità delle funzioni a valori reali . . . . . . . . . . . . . . 7.5 Il Teorema di Weierstrass . . . . . . . . . . . . . . . . . . . . . 7.6 Il Teorema di Darboux . . . . . . . . . . . . . . . . . . . . . . . 7.7 Uniforme continuità . . . . . . . . . . . . . . . . . . . . . . . . 7.8 Punti di discontinuità . . . . . . . . . . . . . . . . . . . . . . . 7.8.1 Discontinuità di prima specie . . . . . . . . . . . . . . . 7.8.2 Discontinuità di seconda specie . . . . . . . . . . . . . . 7.8.3 Discontinuità eliminabili . . . . . . . . . . . . . . . . . . 7.9 Funzioni monotone . . . . . . . . . . . . . . . . . . . . . . . . . 7.10 Continuità della funzione inversa . . . . . . . . . . . . . . . . . 7.11 Appendice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.11.1 Continuità della funzione inversa in spazi metrici . . . . 7.11.2 Uniforme continuità. Funzioni lipschitziane e hölderiane. . . . . . . . . . . . . . . . . 175 175 175 177 178 183 184 186 188 188 189 190 192 196 197 197 198 8 Calcolo differenziale 8.1 Introduzione . . . . . . . . . . . . . . . . . . . 8.2 Derivata e differenziale . . . . . . . . . . . . . 8.3 Tangente verticale, punti angolosi, cuspidi . . 8.4 Regole di derivazione . . . . . . . . . . . . . . 8.5 Derivate delle funzioni elementari . . . . . . . 8.5.1 Potenze e radici . . . . . . . . . . . . . 8.5.2 Esponenziali e funzioni iperboliche . . 8.5.3 Logaritmi . . . . . . . . . . . . . . . . 8.5.4 Funzioni trigonometriche . . . . . . . 8.5.5 Inverse delle funzioni trigonometriche 8.5.6 Derivate di funzioni composte . . . . . 8.6 Massimi e minimi relativi . . . . . . . . . . . . . . . . . . . . . . . 201 201 202 205 208 211 211 213 214 214 215 216 218 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii 8.7 8.8 8.9 8.10 8.11 8.12 8.13 8.14 8.15 Indice Teoremi di Rolle, Cauchy, Lagrange Crescere e decrescere . . . . . . . . . Teorema di De l’Hospital . . . . . . Derivate di ordine superiore . . . . . Formula di Taylor . . . . . . . . . . Esempi sulla formula di Taylor . . . Convessità, concavità, flessi. . . . . . Asintoti obliqui . . . . . . . . . . . . Appendice . . . . . . . . . . . . . . . 8.15.1 Dimostrazione del Teorema di 8.15.2 Convessità . . . . . . . . . . . 8.15.3 Estremanti e punti di flesso . 8.15.4 Serie di Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222 226 229 231 234 238 242 249 251 251 253 255 256 9 Primitive 9.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . 9.2 Regole di integrazione indefinita . . . . . . . . . . . . . 9.3 Primitive delle funzioni razionali fratte . . . . . . . . . . 9.3.1 Caso in cui il grado del denominatore è 1 o 2 . . 9.3.2 Casi fondamentali . . . . . . . . . . . . . . . . . 9.3.3 Caso generale . . . . . . . . . . . . . . . . . . . . 9.4 Primitive di funzioni razionali fratte in un argomento . . 9.5 Primitive di funzioni razionali fratte in più argomenti . 9.5.1 Primitive di R(cos t, sin t) . . . . . . . . . . . . . 9.5.2 Primitive di R(cos2 t, sin2 t, tan t) . . . . . . . . . q√ q√ 1 9.5.3 Primitive di R (x, xp1 , . . . , n xpn ) . . . . . .´ . ³ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259 259 260 265 266 268 269 271 272 273 273 274 ´p . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . l’Hospital . . . . . . . . . . . . . . . . . . q` . . . . . . . . . . . . . . . . . . . . . . . . . . ´p n 1 . . . , qn ax+b Primitive di R x, q1 ax+b cx+d cx+d ¡ p ¢ 9.5.5 Primitive di R x, ±x2 + px + q . . . . . . . . Integrali binomi . . . . . . . . . . . . . . . . . . . . . . . Appendice . . . . . . . . . . . . . . . . . . . . . . . . . . 9.7.1 Decomposizione di una funzione razionale fratta 9.5.4 9.6 9.7 q` . . . . . . . . . . . . . . . . . . De . . . . . . 10 Integrale di Riemann 10.1 Introduzione . . . . . . . . . . . . . . . . . . . 10.2 Somme superiori e inferiori . . . . . . . . . . 10.3 L’integrale di Riemann . . . . . . . . . . . . . 10.4 Proprietà dell’integrale . . . . . . . . . . . . . 10.5 Classi di funzioni integrabili . . . . . . . . . . 10.6 Integrale esteso a un intervallo orientato . . . 10.7 Il Teorema fondamentale del calcolo integrale 10.8 Integrali impropri . . . . . . . . . . . . . . . . 10.8.1 Integrali impropri di prima specie . . . 10.8.2 Integrali impropri di seconda specie . 10.8.3 Criteri del confronto . . . . . . . . . . 10.8.4 Integrali impropri di terza specie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274 . . . . . . . . . . . . . . . . . . . . 276 279 280 280 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283 283 283 286 288 293 296 298 302 302 305 306 309 Indice 10.9 Appendice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.9.1 Estensione del Teorema fondamentale del calcolo integrale 10.9.2 Formula di Taylor con resto integrale . . . . . . . . . . . . 10.9.3 Confronto e esistenza degli integrali impropri . . . . . . . 10.9.4 Formula di Wallis . . . . . . . . . . . . . . . . . . . . . . . 10.9.5 Somme e integrali. Formula di Eulero . . . . . . . . . . . 10.9.6 Formula di Stirling . . . . . . . . . . . . . . . . . . . . . . ix 313 313 314 315 317 319 320 Prefazione Questo libro è destinato agli studenti del primo anno dei corsi di laurea in Matematica e in Fisica ed è basato sull’esperienza da me maturata in molti anni di insegnamento. Può anche essere utilizzato da studenti di altri corsi di laurea di carattere scientifico, che vogliano approfondire la loro conoscenza dell’Analisi matematica. Vengono esposti in modo rigoroso gli argomenti che fanno parte tradizionalmente dei corsi di Analisi matematica I: numeri reali, successioni e serie, limiti, continuità, calcolo differenziale in una variabile e calcolo integrale secondo Riemann in una variabile. Le nozioni di limite e continuità sono ambientate negli spazi metrici, di cui viene presentata una trattazione elementare ma precisa. I concetti astratti sono ogni volta interpretati e discussi nel caso di funzioni reali di variabile reale. In questo modo lo studente dovrebbe acquisire sia una padronanza degli strumenti classici, che una impostazione unitaria in vista dei successivi sviluppi dell’Analisi in dimensione superiore. Tutti i risultati enunciati nel libro (tranne due) vengono dimostrati, o nel corso dell’esposizione, o nelle appendici dei vari capitoli. Tuttavia, questo testo non vuole essere un’opera puramente teorica. Ho trattato in modo dettagliato argomenti che spesso sono demandati alle esercitazioni: il calcolo dei limiti per funzioni a valori reali o vettoriali, il calcolo delle derivate, i metodi più comuni di integrazione. Tutti gli argomenti esposti sono corredati da numerosi esempi e figure. Desidero ringraziare la dottoressa Margherita Mauri, che ha letto tutto il manoscritto e mi ha dato preziosi consigli. Ringrazio anche i miei studenti, che mi hanno segnalato refusi di varia natura in una precedente versione sperimentale di questo testo. xi Capitolo 1 Numeri reali 1.1 Introduzione I numeri reali nascono con la scoperta dell’esistenza di grandezze incommensurabili, quali le lunghezze del lato e della diagonale di un quadrato. I numeri interi e i loro rapporti non sono quindi in grado di descrivere fondamentali relazioni della geometria. Malgrado ciò, lo studio dei numeri reali cominciò ad imporsi solo dopo la scoperta del calcolo infinitesimale, dovuta a Newton e Leibniz. Tra le molte costruzioni equivalenti del campo reale, adotteremo quella forse per noi più intuitiva, cioè la costruzione dei numeri reali mediante allineamenti decimali infiniti. 1.2 Rappresentazione decimale dei numeri razionali Come è noto, ogni numero razionale si può rappresentare come allineamento decimale periodico, nel modo che ora descriveremo rapidamente. Indichiamo con Q l’insieme dei numeri razionali, dotato delle consuete operazioni di somma e prodotto e della relazione naturale di diseguaglianza. Sia r = p/q ∈ Q un numero razionale positivo, con p > 0, q > 0 interi. Si ha, mediante divisioni successive, p p0 = c0 + q q ove 0 ≤ p0 < q e c0 è un intero non negativo, p0 c1 p1 = + q 10 10q ove 0 ≤ p1 < q e c1 è un intero tra 0 e 9, c2 p2 p1 = + q 10 10q ove 0 ≤ p2 < q e c2 è un intero tra 0 e 9. Si ottiene quindi r = c0 + c1 c2 p2 + + 2 . 10 102 10 q 1 2 1. Numeri reali In tal modo abbiamo ottenuto le prime tre cifre dell’allineamento decimale di r. Eseguendo poi le divisioni p2 /q, p3 /q, . . . , pn−1 /q, . . ., si ottengono tutte le cifre successive. Al passo n si ha r = c0 + c1 c2 c3 cn pn + 2 + 3 + ··· + n + n . 10 10 10 10 10 q (1.2.1) L’allineamento, o rappresentazione decimale, di r è dunque dato da r = c0 , c1 c2 c3 . . . cn . . . (1.2.2) Si può esprimere il numero r anche mediante la scrittura, per ora puramente formale, c2 c1 c3 cn r = c0 + + 2 + 3 + ··· + n + ··· 10 10 10 10 Questa scrittura sarà precisata nel capitolo sulle serie numeriche. Poiché i resti possibili p1 , p2 , p3 . . . sono compresi tra 0 e q − 1, dopo al più q passi nella divisione si ripresenta uno dei resti precedenti. Da qui segue la periodicità dell’allineamento. Ad esempio, 1 = 0, 3, 3 7 = 0, 1590. 44 Se il periodo è 0, cioé r = c0 , c1 c2 . . . cn 000 . . ., si scrive semplicemente r = c0 , c1 c2 . . . cn . In tal caso l’allineamento decimale si dice finito, altrimenti si dice infinito. L’algoritmo di divisione descritto sopra non produce mai allineamenti decimali con periodo 9. Dimostriamo questa asserzione per i numeri periodici puri, cioé privi di antiperiodo. Si noti che questa non è una restrizione, poiché, se r ha un antiperiodo di k cifre, allora 10k r è periodico puro. Supponiamo per assurdo r = c0 , 9. Poiché 0 ≤ pn < q, dalla (1.2.1) si deduce che per ogni n c0 + 9 9 9 9 9 9 1 + + · · · + n ≤ r < c0 + + + ··· + n + n. 10 102 10 10 102 10 10 Poiché 9/10 + 9/102 + · · · + 9/10n + 1/10n = 1, le diseguaglianze precedenti diventano 1 ∀n 1 − n < r − c0 < 1, 10 o anche 1 ∀n 0 < c0 + 1 − r < n , 10 il che è assurdo. L’impossibilità di ottenere allineamenti con periodo 9 dipende dall’algoritmo da noi prescelto. Altri algoritmi danno luogo ad allineamenti con periodo 9, ma escludono il periodo 0, cioè gli allineamenti finiti. Ad esempio: 1 = 0, 9. 1.3. Numeri reali e ordinamento 3 D 0 ora innanzi escluderemo dalle nostre considerazioni gli allineamenti decimali con periodo 9. Il termine ‘allineamento decimale’ avrà il significato di allineamento in cui non compare il periodo 9. Un allineamento decimale periodico è sempre la rappresentazione decimale di un numero razionale. Per vedere ciò possiamo, come prima, supporre che l’allineamento sia periodico puro, cioé del tipo c0 , c1 c2 . . . cs . Il numero µ ¶ ³c c2 cs ´ 10s 1 + + ··· + s (1.2.3) r = c0 + 10 102 10 10s − 1 è il numero cercato. Infatti, la rappresentazione decimale di 10s /(10s − 1) è 10s 1 1 1 = 1 + s + 2s + · · · + ks + · · · 10s − 1 10 10 10 Sostituendo questa espressione in (1.2.3) si ha l’asserto. Quindi esiste una corrispondenza biunivoca tra i numeri razionali positivi e gli allineamenti decimali che non hanno periodo 9. Benché le operazioni di somma e prodotto tra allineamenti periodici siano generalmente complicate, la rappresentazione decimale permette di decidere facilmente quale tra due dati numeri razionali sia il maggiore. Infatti, sia r 6= r0 , e supponiamo che sia k il primo indice per cui ck 6= c0k . Risulta ck > c0k se e solo se r > r0 . Il concetto di rappresentazione decimale si estende ai numeri razionali negativi, semplicemente anteponendo il segno − all’allineamento. In altri termini, se il numero r ha la rappresentazione (1.2.2), diciamo che il numero −r ha la rappresentazione −r = −c0 c1 c2 c3 . . . cn . . .. L’allineamento 0, 000 . . . rappresenta il numero 0. 1.3 Numeri reali e ordinamento Gli allineamenti decimali periodici non costituiscono la totalità dei possibili allineamenti. Ad esempio, l’allineamento 1, 1 0 1 0 0 1 0 0 0 1 0 0 0 0 1 . . . (1.3.1) in cui ogni 1 è seguito da uno 0 in più del precedente 1, è chiaramente non periodico. D’altra parte, gli allineamenti non periodici si presentano in modo naturale quando si cerca di risolvere equazioni del tipo x2 = 2, prive di soluzioni nel campo razionale. 2 Teorema 1.3.2 Non esiste alcun numero razionale p/q tale che (p/q) = 2. Dimostrazione. Supponiamo per assurdo che esistano due interi positivi p e q tali che p2 = 2q 2 . Eseguendo le semplificazioni, possiamo supporre che p e q non abbiano fattori comuni. Poiché p2 è pari, anche p deve essere pari. Esiste quindi 4 1. Numeri reali un intero positivo m tale che p = 2m. Ne segue 2m2 = q 2 . Perciò anche q 2 e q sono pari. Questo contraddice l’ipotesi che p e q non abbiano fattori comuni. √ Quindi 2 non è razionale. Il noto algoritmo per il calcolo della radice quadrata fornisce successivamente i valori approssimati: 1 1, 4 1, 41 1, 414 1, 4142 1, 41421 . . . √ Questo procedimento conduce a esprimere 2 mediante un allineamento decimale, necessariamente non periodico: √ 2 = 1, 414213562 . . . Definizione 1.3.3 Definiamo numero reale un allineamento decimale con segno, ±c0 , c1 c2 . . . cn . . .. Se l’allineamento è periodico il numero è razionale. Se l’allineamento non è periodico il numero si dice irrazionale. Ricordiamo che sono esclusi gli allineamenti periodici con periodo 9. In questo capitolo indicheremo generalmente un numero reale con una lettera greca: ad esempio α = a0 , a1 a2 . . . an . . . In questa scrittura il numero a0 è un intero maggiore o eguale a 0 chiamato parte intera. I numeri dopo la virgola sono interi tra 0 e 9, chiamati cifre decimali. Sia α 6= 0. Se l’allineamento è preceduto dal segno + diremo che α è positivo, mentre se è preceduto dal segno − diremo che α è negativo. Denoteremo l’insieme dei numeri reali con R, l’insieme dei reali positivi con R+ , l’insieme dei reali negativi con R− . Si noti che, per definizione, Q ⊂ R. I simboli Q+ e Q− indicheranno rispettivamente i numeri razionali positivi e quelli negativi. Il valore assoluto |α| di un numero reale α è definito nel modo seguente: se α è positivo o nullo si pone |α| = α. Se invece α è negativo, si pone |α| = −α. Introduciamo ora l’ordinamento in R. Definizione 1.3.4 Siano α = a0 , a1 a2 . . . an . . . e β = b0 , b1 b2 . . . bn . . . due numeri reali non negativi diversi tra loro. Siano an e bn le prime cifre diverse, ovvero sia a0 = b0 , a1 = b1 , . . . , an−1 = bn−1 , an 6= bn . Poniamo α<β se an < bn . Se α e β sono negativi e diversi tra loro, poniamo α < β se |β| < |α|. Infine, se α è negativo e β è positivo o nullo, poniamo α < β. Evidentemente questa definizione estende da Q a R la relazione d’ordine per i numeri razionali. L’insieme dei reali risulta cosı̀ totalmente ordinato, nel senso precisato dalla seguente Teorema. Teorema 1.3.5 L’ordinamento su R ha le seguenti proprietà: 1. ∀α, β ∈ R vale una e una sola delle seguenti relazioni α = β, oppure α < β, oppure β < α. 1.3. Numeri reali e ordinamento 5 2. ∀α, β, γ ∈ R se α < β e β < γ allora α < γ. Dimostrazione. La prima proprietà è ovvia dalla definizione. Per dimostrare la seconda possiamo limitarci al caso in cui α, β, γ siano positivi, poiché gli altri casi seguono immediatamente da questo. Sia dunque α = a0 , a1 a2 . . . an . . . β = b0 , b1 b2 . . . bn . . . γ = c0 , c1 c2 . . . cn . . . . Sia n il primo indice per cui an 6= bn e m il primo indice per cui bm 6= cm . Se n < m si ha a0 = b0 = c0 , a1 = b1 = c1 , . . . . . . , an−1 = bn−1 = cn−1 , an < bn = cn da cui α < γ. Se invece m ≤ n si ha a0 = b0 = c0 , a1 = b1 = c1 , . . . . . . , am−1 = bm−1 = cm−1 , am ≤ bm < cm da cui nuovamente α < γ. Come usuale, la scrittura α > β equivale a β < α e la scrittura α ≤ β significa che non è β < α. Siano α e β numeri reali, α < β. Definiamo gli intervalli di estremi α e β ponendo: [α, β] = {x ∈ R : (α, β) = {x ∈ R : (α, β] = {x ∈ R : [α, β) = {x ∈ R : α ≤ x ≤ β} α < x < β} α < x ≤ β} α ≤ x < β} intervallo intervallo intervallo intervallo chiuso. aperto. (1.3.6) semiaperto a sinistra. semiaperto a destra. Si hanno altresı̀ gli intervalli illimitati di estremo α: [α, +∞) = {x ∈ R : α ≤ x} , (α, +∞) = {x ∈ R : α < x} . (−∞, α] = {x ∈ R : x ≤ α} , (−∞, α) = {x ∈ R : x < α} . (1.3.7) (1.3.8) Anche questi intervalli si diranno chiusi o aperti, a seconda che l’estremo α appartenga o meno all’insieme. I simboli ±∞ che appaiono nelle definizioni precedenti sono puramente formali. Teorema 1.3.9 (di densità) Tra due numeri reali esistono infiniti numeri razionali e infiniti numeri irrazionali. Dimostrazione. Siano α = a0 , a1 a2 . . . an . . . e β = b0 , b1 b2 . . . bn . . . due qualsiasi numeri positivi, con α < β. Basterà dimostrare che tra α e β esistono un razionale r e un irrazionale i, poiché il procedimento può essere ripetuto negli intervalli (α, r) e (α, i). Sia dunque n il primo indice per cui an < bn . Esiste un indice k > n tale che ak < 9. Definiamo r = a0 , a1 . . . an an+1 . . . ak−1 9 6 1. Numeri reali Chiaramente α < r. Si ha anche r < β, poiché a0 = b0 , a1 = b1 , . . . , an−1 = bn−1 , e an < bn . Si ponga ora i = a0 , a1 . . . an an+1 . . . ak−1 9101001000100001 . . . Le cifre dopo la k-esima sono definite con la stessa legge che in (1.3.1): ogni 1 è seguito da uno 0 in più del precedente 1. Quindi i è irrazionale e, come prima, α < i < β. Se α e β hanno segno qualsiasi, la costruzione precedente si adatta immediatamente. La proprietà enunciata nel Teorema si esprime dicendo che sia l’insieme dei numeri razionali, che l’insieme dei numeri irrazionali, è denso in R. Definizione 1.3.10 Un sottoinsieme non vuoto A ⊆ R si dice limitato superiormente se esiste β ∈ R tale che ∀α ∈ A α ≤ β. Un tale β si dice maggiorante di A. Analogamente, un sottoinsieme non vuoto A ⊆ R si dice limitato inferiormente se esiste γ ∈ R tale che ∀α ∈ A γ ≤ α. Un tale γ si dice minorante di A. Infine, A si dice limitato se è limitato sia superiormente che inferiormente. Esempi 1.3.11 1. L’insieme degli interi negativi è limitato superiormente, ma non inferiormente. In questo caso l’insieme dei maggioranti è l’intervallo [−1, +∞). Cosı̀ pure, l’insieme degli interi positivi è limitato inferiormente ma non superiormente. 2. Gli intervalli definiti in (1.3.6) sono limitati. Per tutti questi intervalli l’insieme dei maggioranti è [β, +∞), mentre l’insieme dei minoranti è (−∞, α]. 3. Gli intervalli in (1.3.7) sono illimitati superiormente, ma limitati inferiormente. Gli intervalli in (1.3.8) sono illimitati inferiormente, ma limitati superiormente. L’insieme dei minoranti per i due intervalli in (1.3.7) è (−∞, α], mentre l’insieme dei maggioranti per i due intervalli in (1.3.8) è [α, +∞). Definizione 1.3.12 Un numero reale M si dice massimo di un sottoinsieme A ⊆ R se M ∈ A e α ≤ M per ogni α ∈ A. Un numero reale m si dice minimo di un sottoinsieme A ⊆ R se m ∈ A e m ≤ α per ogni α ∈ A. 1.3. Numeri reali e ordinamento 7 Il massimo e il minimo di un insieme, se esistono, sono necessariamente unici. Chiaramente, il massimo di A è un maggiorante, e il minimo è un minorante. Tuttavia, un insieme limitato superiormente non ha necessariamente massimo, e un insieme limitato inferiormente non ha necessariamente minimo. Esempi 1.3.13 1. Un intervallo chiuso e limitato [α, β] ha come minimo α e come massimo β. L’intervallo aperto (α, β) non ha né massimo né minimo. L’intervallo [α, +∞) ha come minimo α, mentre (α, +∞) non ha minimo. 2. L’insieme limitato {1, 1/2, 1/3, . . . , 1/n, . . .} ha come massimo 1, ma non ha minimo (si noti che 0 non appartiene all’insieme). 3. L’insieme A = {r ∈ Q+ : r2 < 2} (1.3.14) è non vuoto (1 ∈ A) ed è limitato superiormente (3 è un maggiorante). L’insieme A non ha massimo. Infatti, per ogni r ∈ A, poniamo: s=r+ r+1 2 − r2 =2 . 2+r r+2 (1.3.15) Un semplice calcolo mostra che s2 < 2 e perciò s ∈ A. D’altra parte, r < s, e quindi r non può essere il massimo di A. Analogamente B = {r ∈ Q+ : r2 > 2} (1.3.16) è limitato inferiormente ma non ha minimo. In questo caso infatti, il numero s definito in (1.3.15) soddisfa s2 > 2, e quindi appartiene a B, ma s < r. Il massimo e il minimo di un insieme A vengono indicati rispettivamente con i simboli max A, min A. L’insieme ordinato dei numeri reali è completo, nel senso precisato dal seguente teorema. Teorema 1.3.17 (di completezza) Se A è un insieme limitato superiormente, l’insieme dei maggioranti di A ha minimo. Se A è un insieme limitato inferiormente, l’insieme dei minoranti di A ha massimo. Dimostrazione. Ci limitiamo a dimostrare la prima affermazione, poiché la seconda si dimostra in modo del tutto analogo. Sia A limitato superiormente e denotiamo con B l’insieme dei maggioranti di A. Supponiamo dapprima che nessun elemento di B sia negativo. In tal caso l’insieme delle parti intere degli elementi di B ha minimo non negativo. Denotiamo con c0 questo minimo e poniamo B0 = {β ∈ B : la parte intera di β è c0 } . 8 1. Numeri reali Poiché vi sono solo 10 scelte possibili per ogni cifra decimale, l’insieme delle prime cifre decimali degli elementi di B0 ha minimo: sia esso c1 . Poniamo B1 = {β ∈ B0 : la prima cifra decimale di β è c1 } . Analogamente, detto c2 il minimo delle seconde cifre decimali degli elementi di B1 , poniamo B2 = {β ∈ B1 : la seconda cifra decimale di β è c2 } . In questo modo definiamo per ricorrenza l’insieme Bk : detto ck minimo delle cifre decimali di Bk−1 , poniamo Bk = {β ∈ Bk−1 : la k-esima cifra decimale di β è ck } . Ovviamente, per ogni k si ha Bk 6= ∅, e Bk−1 ⊇ Bk . Ogni elemento di β ∈ Bk ha la forma β = c0 , c1 c2 . . . ck bk+1 bk+2 . . . (1.3.18) Poniamo γ = c0 , c1 c2 . . . ck . . . (1.3.19) L’allineamento in (1.3.19) non ha periodo 9. Infatti, ck è il minimo delle k-esime cifre decimali di Bk−1 . Se ck = 9 tutti gli elementi di Bk hanno k-esima cifra decimale 9. Quindi Bk−1 = Bk . Se da un certo k in poi tutti i ck fossero 9, si avrebbe Bk−1 = Bk = Bk+1 = · · · . Allora tutti gli elementi di Bk−1 avrebbero periodo 9, il che è assurdo, poiché abbiamo escluso tali periodi dalla definizione di numero reale. Se, per assurdo, γ non è un maggiorante di A, esiste α = a0 , a1 a2 . . . an . . . in A tale che α > γ. Detto k il primo indice per cui ak 6= ck , deve essere ak > ck e quindi, per (1.3.18), risulta anche α > β per ogni β ∈ Bk , assurdo. Quindi γ è un maggiorante. Dimostriamo che è il minimo dei maggioranti. Dato un qualsiasi β = b0 , b1 b2 . . . bn . . . ∈ B, o esso appartiene a tutti i Bk , e in tal caso deve coincidere con γ, oppure esiste un primo Bk a cui non appartiene. Quindi cn = bn per n < k, e ck < bk . In ogni caso γ ≤ β. Se B contiene dei numeri negativi, allora A ⊂ R− . Si ragiona su A come si è fatto su B nel caso precedente. Per ottenere il numero γ bisogna anche in questo caso scegliere ogni volta il minimo delle cifre decimali Definizione 1.3.20 Se è A limitato superiormente, definiamo estremo superiore di A il minimo dei maggioranti di A. Se è A limitato inferiormente, definiamo estremo inferiore di A il massimo dei minoranti di A. Per l’estremo superiore e inferiore si usano le notazioni sup A, inf A. Se A non è limitato superiormente, si pone convenzionalmente sup A = +∞. Se A non è limitato inferiormente, si pone convenzionalmente inf A = −∞. 1.3. Numeri reali e ordinamento 9 Se A ammette massimo M , allora sup A = M . Tuttavia, come abbiamo visto, un insieme limitato superiormente può non avere massimo, mentre l’estremo superiore esiste sempre. Analoga cosiderazione vale per il minimo. Si noti che l’estremo superiore è unico, poiché il minimo di un insieme (in questo caso i maggioranti) è unico. Analogamente, l’estremo inferiore è unico. Esempi 1.3.21 1. Sia A l’intervallo aperto (α, β). Si ha inf A = α e sup A = β, ma essi non sono minimo e massimo. Se A = [α, β), allora α = inf A = min A. Si ha ancora sup A = β, ma β non è massimo. 2. Sia A = {1, 1/2, 1/3, . . . , 1/n, . . .}. In questo caso si ha 1 = max A = sup A. Il numero 0 non è minimo, perché non appartiene ad A. Si ha però 0 = inf A. 3. Sia A = Q+ . L’insieme non è limitato superiormente, per cui sup A = +∞. Invece è limitato inferiormente e 0 = inf A. 4. Sia ½ A= 1 2 3 n−1 , , ,..., ,... 2 3 4 n ¾ In questo caso sup A = 1, ma tale valore non è massimo. Invece inf A = min A = 1/2. Osservazione. Sia L l’estremo superiore di un insieme A limitato superiormente. L è caratterizzato dalle due seguenti proprietà: 1. ∀α ∈ A α ≤ L. 2. ∀β < L ∃α ∈ A β < α ≤ L. La proprietà 1 esprime il fatto che L è un maggiorante di A. La 2 esprime il fatto che L è il minimo dei maggioranti. Per l’estremo inferiore ` di un insieme A limitato inferiormente si ha analogamente 1. ∀α ∈ A α ≥ `. 2. ∀β > ` ∃α ∈ A β > α ≥ `. Un’altra notazione comunemente usata per gli estremi superiore e inferiore di A è sup x, inf x. x∈A x∈A Se A = {xi }i∈I è un insieme di numeri dipendenti da un indice i, di qualunque natura, si usa anche la notazione sup xi , i inf xi . i 10 1. Numeri reali I simboli +∞ e −∞, introdotti nella definizione di estremo superiore e inferiore, sono di uso comune in Analisi Matematica. Aggiungendo all’insieme ordinato dei numeri reali questi simboli, si ottiene un insieme a cui è possibile estendere in modo naturale l’ordinamento definito in R. Definizione 1.3.22 Poniamo R = R ∪ {−∞, +∞}. Per ogni α reale poniamo −∞ < α < +∞. (1.3.23) L’insieme R viene chiamato R esteso. È immediato verificare che R, con la relazione < definita in (1.3.23), risulta un insieme totalmente ordinato, ossia valgono in R le proprietà 1 e 2 del Teorema 1.3.5. I concetti di maggiorante, minorante etc. si estendono in modo ovvio a R. 1.4 Partizioni di Q e di R L’insieme ordinato dei numeri razionali non è completo. Infatti, sia A = {r ∈ Q+ : r2 < 2} ∪ Q− ∪ {0}, B = {r ∈ Q+ : r2 > 2}. B costituisce l’insieme dei maggioranti razionali di A, e A costituisce l’insieme dei minoranti razionali di B. Poiché B non ha minimo e A non ha massimo, in Q non vale il Teorema di completezza. I due insiemi A e B sono separati, cioè per ogni a ∈ A e per ogni b ∈ B si ha a < b; inoltre, Q = A ∪ B. Si dice che due insiemi non vuoti che godono di queste due proprietà costituiscono una partizione di Q. Sia γ1 ∈ R l’estremo superiore di A, e γ2 ∈ R l’estremo inferiore di B. Si ha necessariamente γ1 = γ2 , altrimenti, per il Teorema di densità, esisterebbe un razionale s tale che γ1 < s < γ2 . Il numero s non può appartenere ad A, poiché è maggiore di sup A, né a B, poiché è minore di inf B, assurdo. Denotiamo con γ il comune valore di γ1 e γ2 . Si ha ∀a ∈ A ∀b ∈ B a < γ < b. (1.4.1) Il numero irrazionale γ si chiama elemento separatore ed è unico. Abbiamo cosı̀ costruito una partizione di Q mediante due insiemi, di cui il primo non ha massimo e il secondo non ha minimo. Questo non può accadere per una partizione di R. Teorema 1.4.2 Siano A e B due insiemi non vuoti e separati di numeri reali tali che A ∪ B = R. Allora esiste un unico numero reale γ tale che ∀α ∈ A ∀β ∈ B α ≤ γ ≤ β. Inoltre, o γ è il massimo di A, o γ è il minimo di B. 1.5. Operazioni tra numeri reali 11 Dimostrazione. L’insieme A è limitato superiormente, poiché ogni elemento di B è un maggiorante di A, e B è limitato inferiormente, poiché ogni elemento di A è minorante di B. Si ha sup A = inf B. Altrimenti, come nel ragionamento precedente, un numero α tale che sup A < α < inf B non potrebbe appartenere né ad A né a B, il che è assurdo. Posto γ = sup A = inf B, o γ ∈ A, nel qual caso è anche massimo di A, oppure γ ∈ B, nel qual caso è anche minimo di B. Intuitivamente, Q possiede dei ‘buchi’, che invece sono assenti nel campo reale. I numeri irrazionali provvedono a completare le lacune di Q. 1.5 Operazioni tra numeri reali Sia α = a0 , a1 a2 . . . an . . . un numero reale non negativo. Poniamo α(n) = a0 , a1 a2 . . . an . (n) Il numero razionale si chiama il troncamento o troncata n-esima di α. Se, √ α ad esempio, α = 2 = 1, 41421 . . ., i valori di α(n) sono successivamente 1, 1, 4, 1, 41, 1, 414,. . . Lemma 1.5.1 Sia α ≥ 0. Per ogni n ≥ 0 valgono le diseguaglianze α(n) ≤ α < α(n) + 10−n . (1.5.2) La successione dei numeri α(n) è non decrescente, cioè α(0) ≤ α(1) ≤ α(2) ≤ . . . ≤ α(n) ≤ . . . e la successione dei numeri α(n) + 10−n è non crescente, cioè α(0) + 1 ≥ α(1) + 10−1 ≥ α(2) + 10−2 ≥ . . . ≥ α(n) + 10−n ≥ . . . Si ha inoltre ³ ´ sup α(n) = α = inf α(n) + 10−n . n n (1.5.3) Omettiamo la dimostrazione di questo Lemma, di per sé intuitivo, poiché esso è un caso particolare del Lemma 1.9.4 dimostrato in Appendice. Basti solo osservare che la non decrescenza di α(n) è ovvia e che la non crescenza di α(n) + 10−n , si verifica immediatamente, poiché ´ ³ α(n) + 10−n − α(n+1) + 10−n−1 = 10−n − (an+1 + 1) 10−n−1 ≥ 0, Siano α = a0 , a1 a2 . . . an . . . e β = b0 , b1 b2 . . . bn . . . non negativi. Siano α(n) e β (n) i troncamenti n-esimi di α e β. L’insieme delle somme α(n) + β (n) è limitato superiormente, poiché α(n) + β (n) < (a0 + 1) + (b0 + 1). 12 1. Numeri reali Definizione 1.5.4 Per ogni α ≥ 0 e β ≥ 0 poniamo: α + β = sup(α(n) + β (n) ). n (1.5.5) Poniamo inoltre α + (−β) = sup(α(n) − β (n) − 1/10n ). n Infine, poniamo (−α) + (−β) = sup(−α(n) − β (n) − 2/10n ). n L’eguaglianza (1.5.5) è una eguaglianza definitoria. Il simbolo + a sinistra denota la somma di due numeri reali, che viene definita per mezzo della usuale somma tra due numeri razionali che compare a destra. Siano α e β non negativi. L’insieme dei prodotti α(n) β (n) è limitato superiormente, poiché α(n) β (n) ≤ (a0 + 1)(b0 + 1) per ogni n. Definizione 1.5.6 Per ogni α ≥ 0 e β ≥ 0 poniamo αβ = sup α(n) β (n) . n (1.5.7) Se uno dei duei numeri è negativo, poniamo αβ = − |α| |β| . Se ambedue i numeri sono negativi poniamo αβ = |α| |β| . Come nel caso della somma, l’eguaglianza in (1.5.7) è definitoria. Il prodotto di numeri reali a sinistra in (1.5.7) viene definito per mezzo del prodotto di numeri razionali che compare a destra. Definizione 1.5.8 Sia α > 0. Definiamo il reciproco di α come: α−1 = 1 1 = sup (n) α + 10−n n α Per i numeri negativi si pone −1 (−α) = −α−1 In generale, α(n) +β (n) non è la troncata n-esima di α+β. Basta considerare l’esempio dei due numeri razionali α = 1, 91 e β = 0, 29. Questi numeri mostrano anche che in generale α(n) β (n) non è la troncata n-esima di αβ. L’operazione di somma in R gode delle seguenti proprietà: 1.5. Operazioni tra numeri reali 1. ∀α, β α + β = β + α 13 proprietà commutativa della somma. 2. ∀α, β, γ (α + β) + γ = α + (β + γ) 3. ∀α α + 0 = α proprietà associativa della somma. esistenza dell’elemento neutro. 4. ∀α α + (−α) = 0 esistenza dell’opposto. Come di consueto, scriveremo x − y anziché x + (−y). Per il prodotto si ha: 5. ∀α, β αβ = βα proprietà commutativa del prodotto. 6. ∀α, β, γ (αβ) γ = α (βγ) 7. ∀α α1 = α proprietà associativa del prodotto. esistenza dell’elemento neutro del prodotto. 8. ∀α 6= 0 αα−1 = 1 esistenza del reciproco. Si ha inoltre 9. ∀α, β, γ (α + β) γ = αγ + βγ proprietà distributiva. L’ordinamento è legato alle operazioni di somma e prodotto dalle seguenti proprietà 10. ∀α, β, γ se α < β allora α + γ < β + γ. 11. ∀α, β e ∀γ > 0 se α < β allora αγ < βγ. Queste proprietà saranno dimostrate nell’Appendice. Abbiamo già osservato che la relazione d’ordine in R estende quella in Q. Ciò vale anche per le operazioni di somma e prodotto. Qualora i numeri α e β che compaiono nelle precedenti definizioni siano razionali, la loro somma e prodotto come numeri reali coincidono con le operazioni di somma e prodotto definite tra numeri razionali. Dimostreremo questo fatto nell’Appendice. Un insieme dotato di due operazioni interne, chiamate somma e prodotto, che soddisfano le proprietà da 1 a 9, viene detto campo numerico. Se poi nell’insieme è definito un ordinamento totale per cui valgono 10 e 11, il campo si dice ordinato. Quindi Q e R, dotati delle operazioni di somma e prodotto e dell’ordinamento in essi definito, sono campi ordinati, chiamati rispettivamente campo razionale e campo reale. Si dice anche che Q è un sottocampo ordinato di R. Tuttavia, come abbiamo osservato in precedenza, il campo razionale non è completo. Il campo reale, al pari del campo razionale, è archimedeo, vale cioè la seguente proprietà. Teorema 1.5.9 Per ogni α e β positivi esiste un intero n > 0 tale che nα > β. Dimostrazione. La proprietà vale chiaramente per i numeri razionali. Siano quindi r, s ∈ Q+ tali che 0 < r < α < β < s. Sia n > 0 un intero tale che nr > s. Per la proprietà 11 precedente si ha nα > nr > s > β. Teorema 1.5.10 Il campo reale è un campo ordinato, archimedeo e completo. 14 1.6 1. Numeri reali Una diseguaglianza fondamentale Lemma 1.6.1 Assegnati un intero n ≥ 2 e un numero reale ε > −1, ε 6= 0, si ha n (1 + ε) > 1 + nε. (1.6.2) Dimostrazione. La dimostrazione è per induzione. Se n = 2 si ha n (1 + ε) = 1 + 2ε + ε2 > 1 + 2ε. Supponiamo valida la (1.6.2) per n. Si ha allora n+1 (1 + ε) n = (1 + ε) (1 + ε) > (1 + nε) (1 + ε) = 1 + (n + 1)ε + nε2 > 1 + (n + 1)ε. La diseguaglianza (1.6.2) verrà utilizzata ripetutamente in questo libro. Ad esempio nella dimostrazione dell’esistenza delle radici n–esime, dell’esistenza dei logaritmi, in varie dimostrazioni riguardanti il calcolo dei limiti e in varie dimostrazioni del capitolo 4 riguardanti il numero e. 1.7 Radici, potenze, logaritmi In questo paragrafo definiamo i concetti di radice, di potenza a base ed esponente reale e di logaritmo. Le dimostrazioni dei teoremi sono svolte nell’Appendice. Teorema 1.7.1 Fissato un intero n ≥ 1 e un numero reale α > 0, esiste uno ed un solo numero reale β > 0 tale che β n = α. (1.7.2) Definizione 1.7.3 Il numero β > 0 che soddisfa (1.7.2) si chiama radice n– esima di α e si indica con il simbolo √ β = n α. Il numero α si chiama radicando e n si chiama indice della radice. Si usa anche la notazione β = α1/n . √ √ m Osserviamo ora che, per la definizione di radice n–esima, si ha ( n α) = n αm . Questa eguaglianza ci permette di definire le potenze a esponente razionale in modo che godano delle consuete proprietà. Definizione 1.7.4 Sia m è un intero relativo, sia n ≥ 1 un intero e sia α > 0. Si pone ¡ √ ¢m αm/n = n α . 1.7. Radici, potenze, logaritmi 15 Se n = 2k è pari, l’equazione (1.7.2) ha anche la soluzione −β. Noi riservere√ n mo la scrittura α all’unica soluzione positiva di (1.7.2). Cosı̀, non scriveremo p (−2)2 = −2, bensı̀ p (−2)2 = 2. Per un generico α ∈ R vale √ α2 = |α| . Esaminamo ora le radici dei numeri reali negativi. Sia −α ∈ R− e n ≥ 1 un intero. Innanzi tutto è chiaro che, se n = 2k è pari, non può esistere alcun ¡ ¢k β ∈ R tale che β 2k = β 2 = −α. Quindi non esistono in R le radici di indice pari dei numeri negativi. Sia α > 0. Supponiamo n = 2k + 1 dispari e sia β > 0 tale che β 2k+1 = α. Allora 2k+1 (−β) = −α. Il numero −β viene ancora chiamato radice n-esima di −α e viene indicato con il simbolo √ n −α. √ √ Per ciò che si è detto, se n è dispari vale n −α = − n α. Dopo avere definito le potenze a esponente razionale αm/n , possiamo definire le potenze a esponente reale αβ , per ogni α > 0 e β ∈ R. Anzitutto notiamo che, supposto α ≥ 1, β > 0 e β ≥ m/n, l’insieme delle potenze αm/n è limitato superiormente al variare di m/n. Infatti dato un qualsiasi intero p > β, si ha p > m/n, da cui αp > αm/n . Definizione 1.7.5 Sia α ≥ 1 e β > 0. Poniamo n o m αβ = sup αm/n : ≤β . n Se 0 < α < 1 e β > 0 poniamo αβ = 1 . (1/α)β Se α > 0 e β > 0 poniamo α−β = 1 . αβ Infine poniamo α0 = 1. In tal modo la potenza αβ risulta definita per ogni α > 0 e β reale. Anche le potenze a esponente reale godono delle usuali proprietà delle potenze (si veda l’Appendice). Definiamo ora i logaritmi. Teorema 1.7.6 Sia γ > 0 e α > 0, α 6= 1. Esiste uno e un solo numero reale x tale che αx = γ. (1.7.7) 16 1. Numeri reali Definizione 1.7.8 Il numero x in 1.7.7 si chiama logaritmo di γ in base α e si scrive x = logα γ. Il Teorema 1.7.6 è dimostrato nell’appendice, dove sono anche presentate le principali proprietà dei logaritmi 1.8 Spazi euclidei Definizione 1.8.1 Sia n un intero positivo. Indichiamo con Rn l’insieme di tutte le n-uple ordinate di numeri reali x = (x1 , x2 , . . . , xn ) , La n-upla x viene chiamata punto o vettore n-dimensionale. Il numero x1 viene chiamato prima coordinata di x, il numero x2 seconda coordinata di x, . . . ,il numero xn viene chiamato n-esima coordinata di x. In altri termini, Rn non è altro che il prodotto cartesiano di R con se stesso n volte. R1 , R2 e R3 rappresentano rispettivamente la retta, il piano e lo spazio euclideo, in cui si sia fissato un riferimento cartesiano. Possiamo quindi considerare Rn come la generalizzazione alla dimensione n della retta, del piano e dello spazio cartesiano. Y Z _ x y z _ x y Y x x punto in R2 X X punto in R3 Si noti che nella definizione 1.8.1 le n-uple sono ordinate; cosı̀, ad esempio, (1, 3, −2) 6= (3, 1, −2). Definiamo ora tre operazioni. Definizione 1.8.2 Siano x = (x1 , x2 , . . . , xn ) e y = (y1 , y2 , . . . , yn ) due vettori in Rn . Si dice somma di x e y il vettore x + y = (x1 + y1 , x2 + y2 , . . . , xn + yn ) . (1.8.3) 1.8. Spazi euclidei 17 Ad esempio, in R4 (1, 1/2, √ √ 2, 0) + (−1, 1/2, − 2, 1) = (0, 1, 0, 1). Se n = 1, l’operazione definita coincide con la usuale somma di numeri reali. Definizione 1.8.4 Sia α ∈ R e x = (x1 , x2 , . . . , xn ) ∈ Rn . Chiamiamo prodotto del vettore x per lo scalare α il vettore αx = (αx1 , αx2 , . . . , αxn ) . Ad esempio, in R3 √ ³ √ ´ ³√ √ ´ 2 1, 2, 3 = 2, 2, 3 2 Definizione 1.8.5 Siano x = (x1 , x2 , . . . , xn ) e y = (y1 , y2 , . . . , yn ) due vettori in Rn . Si dice prodotto interno dei due vettori il numero reale ¡ n X ¢ x, y = x1 y1 + x2 y2 + · · · xn yn = xj yj . j=1 Ad esempio in R3 , se x = (3, 1, 4) e y = (1/3, 10, 2), si ha ¡ ¢ 1 x, y = 3 · + 1 · 10 + 4 · 2 = 19. 3 La somma è un’operazione interna, cioè associa a due vettori di Rn un terzo vettore di Rn . Il prodotto per uno scalare e il prodotto interno non sono operazioni interne a Rn . Il prodotto per uno scalare è definito per una coppia costituita da un numero e un vettore, mentre il prodotto interno ha come risultato un numero. Nel caso n = 1, sia il prodotto per uno scalare che il prodotto interno coincidono con il consueto prodotto in R. Definizione 1.8.6 Rn , dotato delle tre operazioni ora definite, si chiama spazio euclideo n-dimensionale. Indichiamo con 0 il vettore (0, 0, . . . , 0), ‘l’origine degli assi’, e con −x il vettore (−x1 , −x2 , . . . , −xn ). Le operazioni di somma, prodotto per uno scalare e prodotto interno, hanno le seguenti proprietà. 18 1. Numeri reali Proprietà della somma 1. ∀x, y x+y =y+x ¡ ¢ ¡ ¢ x+ y+z = x+y +z 2. ∀x, y, z 3. ∀x x+0=x 4. ∀x x + (−x) = 0 Proprietà del prodotto per uno scalare 5. ∀α, β ∀x α (βx) = β (αx) = (αβ) x Proprietà del prodotto interno ¡ ¢ ¡ ¢ 6. ∀x, y x, y = y, x . Proprietà distributive ¡ ¢ 7. ∀x, y ∀α α x + y = αx + αy ¡ ¢ ¡ ¢ ¡ ¢ 8. ∀x, y, z x + z, y = x, y + z, y ¡ ¢ ¡ ¢ 9. ∀x, y, z x, y + z = x, y + (x, z) ¡ ¢ ¡ ¢ ¡ ¢ 10. ∀x, y ∀α α x, y = αx, y = x, αy La dimostrazione di queste proprietà è immediata. Definizione 1.8.7 Sia x = (x1 , x2 , . . . , xn ) ∈ Rn . Si chiama norma di x il numero reale non negativo q p kxk = (x, x) = x21 + x22 + · · · + x2n . La norma di x in dimensione 1 coincide con il valore assoluto, in dimensione 2 e 3 con la lunghezza del segmento che unisce il punto x all’origine degli assi. Quindi la norma costituisce una generalizzazione del concetto di distanza di un punto dall’origine. in dimensione 2, k(3, 4)k = 5. In dimensione 4, posto x = √ ¢ ¡ Ad√ esempio, 5, 2, 2, 5 , si ha kxk = 6. Proprietà della norma 1. ∀x kxk ≥ 0. 2. ∀x kxk = 0 se e solo se x = 0. 3. ∀x ∀α kαxk = |α| kxk omogeneità della norma. 1.8. Spazi euclidei 4. ∀x, y 5. ∀x, y 6. ∀x, y 19 ¯ ¯ ¯(x, y)¯ ≤ kxk ||y|| diseguaglianza di Cauchy. ||x + y|| ≤ kxk + ||y|| diseguaglianza triangolare. ¯ ¯ ¯kxk − ||y||¯ ≤ ||x + y||. Le proprietà 1 e 2 sono ovvie. Per la 3 si ha q q kαxk = α2 x21 + α2 x22 + · · · + α2 x2n = α2 (x21 + x22 + · · · + x2n ) √ q = α2 x21 + x22 + · · · + x2n = |α| kxk . Per dimostrare la diseguaglianza di Cauchy, si consideri il vettore tx + y per ogni t ∈ R. Possiamo supporre x 6= 0, altrimenti la 4 è ovvia. Per la 1 si ha ¢ ¡ tx + y, tx + y = ||tx + y||2 ≥ 0. D’altra parte, applicando successivamente le proprietà distributive e la commutatività del prodotto interno, si ha ¡ ¢ ¡ ¢ ¡ ¢ tx + y, tx + y = tx, tx + y + y, tx + y ¡ ¢ ¡ ¢ = (tx, tx) + 2 tx, y + y, y (1.8.8) ¡ ¢ 2 2 2 = t kxk + 2t x, y + ||y|| . Poiché questo trinomio in t non può essere negativo, il suo discriminante non può essere positivo. Quindi ¡ ¢2 2 x, y ≤ kxk ||y||2 . Passando alle radici quadrate si ottiene la 4. x _ +y _ Y y _ x _ X 0 Somma di vettori e diseguaglianza triangolare 20 1. Numeri reali Dimostriamo ora la diseguaglianza triangolare. Si ha, ragionando come in (1.8.8) con t = 1, ¡ ¢ ||x + y||2 = x + y, x + y ¡ ¢ 2 = kxk + 2 x, y + ||y||2 . ¡ ¢ Per la diseguaglianza di Cauchy x, y ≤ kxk ||y||, e quindi ¢2 ¡ ||x + y||2 ≤ kxk + ||y|| . ¢ ¡ La 6 discende immediatamente dalla 5. Si ha infatti x = x + y − y, e || − y|| = ||y|| per l’omogeneità della norma. Quindi kxk ≤ ||x + y|| + ||y||, da cui kxk − ||y|| ≤ ||x + y||. (1.8.9) Scambiando i ruoli di x e y si ha anche ||y|| − kxk ≤ ||x + y||. (1.8.10) ¯ ¯ Uno dei due numeri a sinistra in (1.8.9) o in (1.8.10) coincide con ¯kxk − ||y||¯. Il nome ‘diseguaglianza triangolare’ è dovuto al fatto che, nel piano o nello spazio, dati due punti x e y, i numeri kxk, ||y|| e ||x + y|| rappresentano le lunghezze dei lati del triangolo di vertici 0, x e x + y. La somma delle lunghezze di due lati non è mai minore della lunghezza del terzo. Analoga interpretazione vale per la 6. È possibile dimostrare che in 5 e in 6 vale il segno = se e solo se esiste un numero reale α tale che x = αy. 1.9 1.9.1 Appendice Proprietà degli estremi superiore e inferiore Elenchiamo alcune notevoli proprietà degli estremi superiore e inferiore. Alcune di esse presuppogono le proprietà di campo che verranno dimostrate nel sottoparagrafo successivo. Supporremo A e B limitati superiormente o inferiormente, a seconda dei casi. Indichiamo con α il generico elemento di A e con β il generico elemento di B. Si ha 1. sup(α + β) = sup α + sup β, 2. sup(αβ) = sup α sup β, 3. sup(−α) = − inf α 4. sup (1/α) = 1/ inf α, 5. Se A ⊆ B inf(α + β) = inf α + inf β. inf(αβ) = inf α inf β se α e β sono positivi. inf(−α) = − sup α. inf(1/α) = 1/ sup(α) se ogni α > 0 e inf α > 0. inf B ≤ inf A ≤ sup A ≤ sup B. 1.9. Appendice 21 6. Se ∀α ∈ A ∃β ∈ B tale che α ≤ β, allora sup α ≤ sup β. 7. Se ∀α ∈ A ∃β ∈ B tale che α ≥ β, allora inf α ≥ inf β. Queste formule sono valide anche per insiemi illimitati, una volta che vengano aritmetizzati i simboli ±∞. Ad esempio, se sup α = +∞ allora sup(α + β) = +∞. Se α > 0 si ha sup α = +∞ se e solo se inf(1/α) = 0. La dimostrazione delle precedenti relazioni è piuttosto semplice e viene lasciata come esercizio. Ad esempio, dimostriamo la prima eguaglianza in 1. Si ha α ≤ sup α e β ≤ sup β per ogni α ∈ A e β ∈ B. Quindi l’insieme delle somme α + β ammette sup α + sup β come maggiorante, da cui sup(α + β) ≤ sup α + sup β. Non può valere il segno <, altrimenti esisterebbero α e β tali che α + β > α + β per ogni α e β, assurdo. 1.9.2 Proprietà delle operazioni in R Se r e s sono due numeri razionali, il risultato della loro somma e prodotto come numeri reali coincide con quello della loro somma e prodotto nel campo razionale. Dimostriamo questa asserzione nel caso in cui ambedue i numeri siano positivi; con ovvie modificazioni, la dimostrazione vale anche negli altri casi. Sia quindi r = r0 , r1 r2 . . . rn . . . e s = s 0 , s 1 s 2 . . . sn . . . ove i due allineamenti sono periodici. Siano r(n) e s(n) le loro troncate n-esime. Si ha per la (1.5.2) r(n) ≤ r < r(n) + 10−n da cui e s(n) ≤ s < s(n) + 10−n r + s − 2 · 10−n < r(n) + s(n) ≤ r + s. (1.9.1) Si osservi che tutte le somme precedenti¡ sono nel campo razionale. Da (1.9.1) ¢ segue immediatamente che r + s = supn r(n) + s(n) . Per il prodotto si ragiona nella stessa maniera, osservando che al posto della (1.9.1) vale rs − (r + s)10−n − 10−2n < r(n) s(n) ≤ rs. Per una migliore comprensione delle operazioni in R introduciamo il concetto di successione che si stabilizza. Definizione 1.9.2 Sia γ1, γ2, . . . , γn . . . una successione di numeri reali positivi con allineamenti γ1 = c10 , c11 c12 . . . c1k . . . γ2 = c20 , c21 c22 . . . c2k . . . ......... γ2 = cn0 , cn1 cn2 . . . cnk . . . ......... 22 1. Numeri reali Diciamo che la successione si stabilizza se, per ogni indice k esiste n0 (dipendente in generale da k), tale che per ogni n > n0 la k-esima cifra decimale cnk di γn ha sempre lo stesso valore. Ad esempio, la sucessione γ1 γ2 γ3 γ4 = 0, 3311143 . . . = 0, 3234134 . . . = 0, 3235215 . . . = 0, 3235216 . . . ......... si stabilizza. Anche la successione 0, 9, 0, 99, 0, 999, benché l’allineamento finale abbia periodo 9. 0, 9999,. . . si stabilizza, Teorema 1.9.3 Se γ1, γ2, . . . , γn . . .è una successione di numeri reali positivi non decrescente e limitata superiormente, oppure non crescente, allora la successione si stabilizza. Dimostrazione. Supponiamo la successione non decrescente e limitata superiormente. Allora, la parte intera assumerà per un certo indice n0 il suo massimo valore, sia esso d0 . Per i valori di n successivi a n0 si avrà sempre cn0 = d0 , poiché γn è non decrescente. Esisterà n1 , che possiamo supporre maggiore di n0 , tale che la prima cifra decimale assumerà il suo valore massimo, sia esso d1 . Per i valori di n successivi a n1 si avrà cn0 = d0 e cn1 = d1 , poiché la successione γn è non decrescente.Cosı̀ proseguendo, al passo k esisterà nk > nk−1 > . . . > n0 tale che la k-esima cifra decimale assumerà il suo valore massimo, sia esso dk . Per n ≥ nk si avrà cn0 = d0 , cn1 = d1 , cn2 = d2 , . . . , cnk = dk Dunque la successione si stabilizza. Se la successione è non crescente, la dimostrazione è la stessa, sostituendo ai massimi i minimi. Supponiamo che la successione dei γn sia non decrescente. Se l’allineamento d0 , d1 d2 . . . dn . . . non ha periodo 9, il numero δ = d0 , d1 d2 . . . dn . . . è l’estremo superiore della successione. Se l’allineamento è del tipo d0 , d1 d2 . . . dm 99999 . . ., con dm < 9, l’estremo superiore è il numero razionale δ = d0 , d1 d2 . . . (dm + 1). Se la successione è non crescente, la costruzione del teorema mostra che l’allineamento d0 , d1 d2 . . . dn . . .non può avere periodo 9. Quindi, l’allineamento d0 , d1 d2 . . . dn . . . rappresenta sempre l’estremo inferiore della successione. Chiaramente il Teorema 1.9.3 si applica alla somma e al prodotto di numeri reali. Nella definizione di somma di due numeri reali positivi α e β, la successione γn = α(n) + β (n) è non decrescente, e quindi le cifre decimali di tale successione si stabilizzano a quelle di α + β, salvo il caso del periodo 9 notato dianzi. Ad esempio, 0, 18 + 0, 81 = 1, ma α(n) + β (n) = 0, 999 . . . 9 per ogni n > 0. 1.9. Appendice 23 Lemma 1.9.4 Sia x1 ≤ x2 ≤ . . . xn ≤ . . . una successione non decrescente di razionali e y1 ≥ y2 ≥ . . . yn ≥ . . .una successione non crescente di razionali. Supponiamo che C ∃C > 0 ∀n xn ≤ yn ≤ xn + n . 10 Allora sup xn = inf yn . n n Dimostrazione. Si fissi n e sia m > n. Allora xn ≤ xm ≤ ym e quindi xn ≤ inf m ym . Poiché inf m ym è un maggiorante dell’insieme degli xn , sup xn ≤ inf yn . n n Se fosse supn xn < inf n yn , esisterebbero due razionali r e s tali che ∀n sup xn < r < s < inf yn . n n Per ogni n varrebbe allora 0 < s − r < yn − xn ≤ C , 10n il che è assurdo, poiché contraddice la proprietà archimedea del campo razionale. Corollario 1.9.5 Per ogni α ≥ 0 e β ≥ 0 si ha α + β = inf (α(n) + β (n) + 2 · 10−n ) n ³ ´³ ´ αβ = inf α(n) + 10−n β (n) + 10−n n 1 1 = inf (n) n α α Dimostrazione. Si applica il Lemma 1.9.4. Nel caso della somma si pone xn = α(n) + β (n) e yn = α(n) + β (n) + 2 · 10−n = xn +¡ 2 · 10−n . ¢ ¡ ¢ Per il prodotto si pone xn = α(n) β (n) e yn = α(n) + 10n β (n) + 10−n . La successione yn è non crescente e yn ≤ xn + (α + β) 10−n + 10−2n . ¡ ¢−1 Per il reciproco si pone xn = α(n) + 10−n e yn = 1/α(n) . Se k è il primo (k) intero per cui α 6= 0, si ha ´−2 ³ yn ≤ xn + α(k) 10−n . 24 1. Numeri reali Nel caso della somma, le cifre di yn si stabilizzano, a quelle di α + β, nel caso del prodotto a quelle di αβ. Dimostriamo ora che R è un campo ordinato, ovvero dimostramo le proprietà da 1 a 11 del paragrafo 1.4. Proprietà 1. Siano α e β non negativi. Si ha α(n) + β (n) = β (n) + α(n) , α(n) β (n) = β (n) α(n) , e l’eguaglianza si mantiene passando all’estremo superiore. Se uno o ambedue i numeri sono negativi, la dimostrazione si adatta facilmente. Proprietà 2. Supponiamo α, β, e γ non negativi. Per il Corollario 1.9.5 (n) (α + β) Ne segue ≤ (α + β) ≤ α(n) + β (n) + 2 · 10−n . (α + β)(n) + γ (n) < α(n) + β (n) + γ (n) + 3 · 10−n . (n) Poiché α(n) + β (n) ≤ (α + β) , possiamo applicare il Lemma 1.9.4 con xn = (α + β)(n) + γ (n) , yn = α(n) + β (n) + γ (n) + 3 · 10−n . Si conclude che ³ ´ inf α(n) + β (n) + γ (n) + 3 · 10−n = sup(α + β)(n) + γ (n) = (α + β) + γ. n n Allo stesso modo si ha ³ ´ inf α(n) + β (n) + γ (n) + 3 · 10−n = α + (β + γ) , n da cui la proprietà 2 se tutti i numeri sono non negativi. La dimostrazione si adatta agli altri casi. Per dimostrare ad esempio che (α − β) + γ = α + (−β + γ) si ragiona come sopra, sostituendo alla successione β (n) la successione −β (n) − 10−n . Proprietà 3 e 4. La 3 è evidente poiché 0(n) = 0. La 4 è pure immediata, poiché per ogni α > 0 si ha α + (−α) = sup(α(n) − α(n) − 10−n ) = 0. Proprietà 5. Si dimostra sulla falsariga della 1. Proprietà 6. Se i tre numeri sono non negativi, si ragiona come nella dimostrazione della proprietà 2. Si ha ´ ´³ ´³ ³ (n) (αβ) γ (n) < α(n) + 10−n β (n) + 10−n γ (n) + 10−n . 1.9. Appendice 25 ¡ ¢¡ ¢¡ ¢ (n) Posto xn = (αβ) γ (n) e yn = α(n) + 10−n β (n) + 10−n γ (n) + 10−n , si ha yn < xn + (αβ + αγ + βγ)10−n + (α + β + γ)10−2n + 10−3n . (n) Poiché α(n) β (n) ≤ (αβ) , possiamo applicare il Lemma 1.9.4 per concludere che ³ ´³ ´³ ´ (αβ) γ = inf α(n) + 10−n β (n) + 10−n γ (n) + 10−n . n Allo stesso modo si vede che ³ ´³ ´³ ´ α (βγ) = inf α(n) + 10−n β (n) + 10−n γ (n) + 10−n . n Se uno o più numeri sono negativi, si passa ai valori assoluti, tenendo conto che, per due numeri reali positivi ρ e σ, si ha, per definizione di prodotto, −(ρσ) = (−ρ)σ = ρ(−σ). Proprietà 7 e 8. La 7 è evidente. Dimostriamo la 8. Possiamo limitarci al caso α > 0. Per n abbastanza grande si ha α(n) > 0. Poiché ³ 1 ´(n) α si ha 1 < α(n) + 10−n ≤ µ³ ´ 1 (n) α 1 1 ≤ (n) , α α ¶ + 10−n ≤ 1 + 10−n . α(n) Quindi ¶ ¶ ³ ³ ´ µ³ 1 ´(n) ´µ 1 −n 1 < α(n) + 10−n + 10 . + 10−n ≤ α(n) + 10−n α α(n) Passando all’estremo inferiore si ottiene αα−1 = 1. Proprietà 9. Supponiamo α, β, e γ non negativi. Si pone ³ ´³ ´ yn = α(n) + β (n) + 2 · 10−n γ (n) + 10−n (n) xn = (α + β) γ (n) . Si osserva che yn < xn + (α + β + 2γ) 10−n + 2 · 10−2n e si applica il Lemma 1.9.4. Si ottiene ´ ´³ ³ (α + β) γ = inf α(n) + β (n) + 2 · 10−n γ (n) + 10−n . n In modo analogo si valuta αγ + βγ, arrivando cosı̀ alla tesi. Se uno o più numeri sono negativi, a seconda dei casi si passa ai moduli o si sostituisce, ad esempio α(n) , con −α(n) − 10−n . 26 1. Numeri reali Proprietà 10. Sia 0 ≤ α < β. Si ha α(n) ≤ α < β < β (n) + 2 · 10−n , da cui α(n) + γ (n) < β (n) + γ (n) + 2 · 10−n . Per il Corollario 1.9.5, α + γ ≤ β + γ. (1.9.6) Se valesse l’eguaglianza in (1.9.6), sommando ad ambo i membri −γ e usando la proprietà 2 otterremmo α = β. Se uno o più i numeri sono negativi, la dimostrazione è la stessa, ad esempio sostituendo α(n) con −α(n) − 10−n . Proprietà 11. Si dimostra in maniera del tutto analoga alla proprietà 10. 1.9.3 Radici e potenze Sia α > 0 e sia n > 1 intero. Dimostriamo che esiste uno e un solo β > 0 tale che β n = α. L’unicità è banale, poiché, se ci fossero due radici distinte, β1 < β2 , si avrebbe anche α = β1n < β2n = α, assurdo. Dimostriamo l’esistenza. L’insieme A = {x ∈ R+ : xn < α} non è vuoto, poiché il numero α(1 + α)−1 è minore di 1 e di α, per cui ¶n µ α α < < α. 1+α 1+α Inoltre A è limitato superiormente. Infatti 1 + α è un maggiorante, poiché n (1 + α) > 1 + α > α. Poniamo β = sup A. n Sia, per assurdo, β > α. Possiamo trovare δ tale che µ ¶ β α 0<δ< 1 − n < β. n β Per il Lemma 1.6.1 e la scelta di δ, si ha µ ¶n µ ¶ δ δ n (β − δ) = β n 1 − > βn 1 − n > α. β β Abbiamo quindi trovato un maggiorante di A minore di β, assurdo. Sia ora, per assurdo, β n < α. Sia δ tale che µ ¶ 1 βn 1 0<δ< 1− < . nβ α β 1.9. Appendice 27 µ Ragionando come nel caso precedente, si ha βn < 1 −δ β ¶n > 1 , ossia α βn n < α, (1 − βδ) β è un elemento di A maggiore di β, assurdo. Questo conclude (1 − βδ) la dimostrazione. Quindi Per le potenze a esponente reale valgono le consuete proprietà. y x αx αy = αx+y , (αx ) = αxy , (αβ) = αx β x 0 < α < β e x > 0 implica αx < β x 0 < x < y e α > 1 implica αx < αy etc. . . . . . . . . Come esempio, dimostriamo brevemente la prima. Siano dapprima x e y razionali, x = m/n e y = r/s. Per la definizione di potenza a esponente frazionario si ha ³ ´ns αm/n αr/s = αms+rn e quindi αm/n αr/s = α(ms+rn)/ns . Passando agli estremi superiori si ha l’asserto per ogni x e y positivi. 1.9.4 Logaritmi Dimostriamo il Teorema 1.7.6. Sia γ > 0 e α > 1 e dimostriamo che l’equazione αx = γ ha una e una sola soluzione nel campo reale. L’unicità è evidente poiché, se ci fossero due soluzioni x1 < x2 , si avrebbe γ = αx1 < αx2 < γ, il che è assurdo. Sia A = {y ∈ R : αy ≤ γ} . L’insieme A non è vuoto. Infatti, poniamo α = (1 + ε), ove ε > 0. Sia n ≥ 2 tale che 1 + nε > γ −1 . Per il Lemma 1.6.1 si ha allora −n γ > (1 + ε) e quindi −n ∈ A. Inoltre, A è limitato superiormente. Infatti, sia n ≥ 2 tale che 1 + nε > γ. Allora, sempre per il Lemma 1.6.1, si ha n γ < (1 + ε) 28 1. Numeri reali e quindi n è un maggiorante di A. Poniamo x = sup A. Sia per assurdo αx > γ. Poniamo δ= αx − 1 > 0. γ Sia n > 1 un intero tale che 1 + nδ > α. Si ha allora, per il Lemma 1.6.1, αx−1/n > αx (1 + nδ) −1/n −1 > αx (1 + δ) = γ. Quindi x − 1/n è un maggiorante minore di x, assurdo. Se, per assurdo, αx < γ, si pone δ= γ −1>0 αx e si sceglie n in modo tale che 1 + nδ > α. Come prima si ottiene 1/n αx+1/n < αx (1 + nδ) < αx (1 + δ) = γ. Quindi αx+1/n ∈ A e x non può essere un maggiorante, assurdo. Se α < 1 la dimostrazione è del tutto analoga. I logaritmi hanno le seguenti ben note proprietà: 1. logα 1 = 0. 2. logα γ β = β log γ; in particolare, logα (1/γ) = − logα γ. 3. logα (βγ) = logα β + logα γ. 4. Sia α > 1. Si ha logα γ > 0 se γ > 1, logα γ < 0 se γ < 1. Se α < 1, il segno del logaritmo è invertito. ¡ ¢−1 5. logα γ = logγ α se γ 6= 1. La seguente formula permette il cambiamento di base dei logaritmi: logα γ = logβ γ logα β. (1.9.7) I sistemi di logaritmi generalmente adottati sono quelli che hanno come base il numero e di Nepero (logaritmi naturali), oppure quelli in base 10 (logaritmi decimali). La (1.9.7) fornisce la seguente relazione tra i due sistemi: loge γ = (2, 30258 . . .) log10 γ, poiché loge 10 = 2, 30258 . . .. Capitolo 2 Funzioni 2.1 Introduzione Benché la nozione di funzione si possa definire mediante quella di sottoinsieme di un prodotto cartesiano (si veda l’Appendice), per semplicità espositiva assumeremo il concetto di funzione come primitivo. A titolo illustrativo possiamo descrivere il concetto di funzione nel seguente modo. Siano X e Y due insiemi non vuoti. Una funzione f , definita in X e a valori in Y , è una legge che associa ad ogni elemento x ∈ X uno e un solo elemento y ∈Y. I termini applicazione e mappa vengono usati come sinonimi di funzione. In questo capitolo presentiamo i concetti e le proprietà generali delle applicazioni tra insiemi astratti. In particolare, avranno rilievo le funzioni definite nell’insieme dei numeri naturali N = {1, 2, 3, . . . n, . . .}. 2.2 Immagini e controimmagini Siano X e Y due insiemi non vuoti e sia f una funzione definita in X a valori in Y . Useremo sempre la notazione f :X→Y L’insieme X si chiama insieme di definizione di f . Si dice anche che f applica, o mappa, X in Y . Per ogni x ∈ X indicheremo con y = f (x) l’unico elemento y ∈ Y associato ad x. ll valore f (x) si chiama immagine di x mediante f . Se A ⊆ X non è vuoto, si indica con f (A) ⊆ Y l’insieme delle immagini dei punti x ∈ A. L’insieme f (A) viene chiamato immagine di A mediante f . Si ha quindi f (A) = {y ∈ Y : ∃x ∈ A Se A = ∅, si pone per definizione f (A) = ∅. 29 f (x) = y} . 30 2. Funzioni Y X x f y=f(x) Y X f A f(A) Immagine di un punto e di un insieme In particolare, f (X) si chiama codominio o coinsieme di f . Sia f : X → Y , e sia y ∈ Y . L’insieme di tutti gli x ∈ X tali che f (x) = y si chiama controimmagine di y mediante f e si indica con f −1 (y). La controimmagine di y può contenere più di un punto, o può anche essere l’insieme vuoto. Se B ⊆ Y si dice controimmagine di B mediante f il sottoinsieme di X f −1 (B) = {x ∈ X : f (x) ∈ B} . Se B non è vuoto, la controimmagine di B è l’unione delle controimmagini di tutti i suoi punti. Esempi 2.2.1 1. Sia X = Y = R, e f (x) = sin x. Allora f (R) =[−1, 1]. Si ha f −1 (0) = {kπ : k ∈ Z} . Inoltre f −1 (y) = ∅ se |y| > 1. 2. Sia X = Y = R e f (x) = x2 . Si ha f (R) = R+ ∪ {0}. La controimmagine di 0 ha il solo elemento 0, mentre per ogni y > 0 si ha √ √ f −1 (y) = {− y, y} . Se y < 0 si ha f −1 (y) = ∅. Per ogni intervallo √ √ √ √ a, √ b] ∪ [− b, − a] [ √ [− b, b] f −1 ([a, b]) = {0} ∅ [a, b], si ha se se se se a≥0 a<0 eb>0 a<0eb=0 b<0 3. Sia X = R2 e Y = R. Poniamo f (x, y) = x. Si ha f (R2 ) = R. La controimmagine di x ∈ R è la retta verticale passante per il punto (x, 0). Questa funzione si chiama ‘proiezione sulla prima coordinata’. 4. Sia X = Y = N, e f (n) = 2n. Si ha f (N) = 2N (l’insieme dei numeri interi positivi pari). Se m è pari f −1 (m) = {m/2}, mentre se m è dispari f −1 (m) = ∅. 2.2. Immagini e controimmagini 31 3 5. Sia X = Y = R©e f (x) ª = x . In questo caso f (R) = R, e, per ogni y ∈ R √ −1 3 si ha f (y) = y . Definizione 2.2.2 Sia f : X → Y . Valgono le seguenti definzioni. 1. La funzione f si dice suriettiva se f (X) = Y . 2. La funzione f si dice iniettiva se ∀x1 , x2 ∈ X x1 6= x2 =⇒ f (x1 ) 6= f (x2 ). 3. La funzione f si dice biunivoca se è suriettiva e iniettiva. Le funzioni degli esempi 2.2.1.1 e 2.2.1.2 non sono né suriettive, né iniettive. La funzione dell’esempio 2.2.1.3 è suriettiva, ma non iniettiva. La funzione dell’esempio 2.2.1.4 è iniettiva, ma non suriettiva. La funzione dell’esempio 2.2.1.5 è sia iniettiva che suriettiva, cioè biunivoca. È altresı̀ ovvio che ogni funzione è suriettiva sul suo codominio. Ad esempio, la funzione f (x) = sin x è suriettiva da R a [−1, 1]. Se f : X → Y , il grafico di f si definisce come il sottoinsieme del prodotto cartesiano X × Y costituito da tutti i punti del tipo (x, f (x)). In tal modo viene generalizzato il noto concetto di grafico di una funzione reale di variabile reale. Sia f : X → Y . Indichiamo con X1 , X2 e A sottoinsiemi di X e con Y1 , Y2 e B sottoinsiemi di Y . Indichiamo il complementare di A in X con Ac , e il complementare di B in Y con B c . Si hanno le seguenti proprietà di semplice dimostrazione. 1. f −1 (Y1 ∪ Y2 ) = f −1 (Y1 ) ∪ f −1 (Y2 ) 2. f −1 (Y1 ∩ Y2 ) = f −1 (Y1 ) ∩ f −1 (Y2 ) 3. f (X1 ∪ X2 ) = f (X1 ) ∪ f (X2 ) 4. f (X1 ∩ X2 ) ⊆ f (X1 ) ∩ f (X2 ) 5. A ⊆ f −1 (f (A)) e vale l’eguaglianza se f è iniettiva. ¡ ¢ 6. B ⊇ f ( f −1 (B) e vale l’eguaglianza se f è suriettiva. ¡ ¢c 7. f −1 (B c ) = f −1 (B) c c 8. f (Ac ) ⊆ (f (A)) se f è iniettiva; (f (A)) ⊆ f (Ac ) se f è suriettiva; c f (Ac ) = (f (A)) se f è biunivoca. 32 2.3 2. Funzioni Restrizione, funzione inversa, composta. Data una funzione f : X → Y , definiamo una nuova applicazione ‘restringendo’ la variabile x a un sottoinsieme dell’insieme di definizione. Definizione 2.3.1 Sia f : X → Y e sia A ⊆ X non vuoto. Si chiama restrizione di f ad A la funzione f |A : A → Y tale che ∀x ∈ A f |A (x) = f (x). A sua volta f si chiama estensione a X di f |A . La nozione di restrizione permetterà di considerare una data funzione definita solo su opportuni sottoinsiemi di X. Sia f : X → Y biunivoca. Ogni y ∈ Y è immagine di uno e un solo x ∈ X. Possiamo quindi definire una funzione da Y a X, inversa della precedente. Definizione 2.3.2 Sia f : X → Y biunivoca. La funzione inversa f −1 : Y → X è la funzione che associa a ogni y ∈ Y l’unico elemento x ∈ X tale che f (x) = y. Y X f x y f-1 Funzione inversa −1 In altri termini, f associa ad y l’unico elemento della controimmagine di y. Questo motiva l’uso del simbolo f −1 , che ordinariamente è riservato alle controimmagini (ricordiamo che una controimmagine è un insieme). Se f è biunivoca, ovviamente anche f −1 è biunivoca e la sua inversa è la funzione f stessa. Quando esiste una funzione biunivoca f : X → Y , si dice che X e Y sono in corrispondenza biunivoca. π/2 −π/2 La funzione arctan(x) 2.3. Restrizione, funzione inversa, composta. 33 Esempi 2.3.3 1. Sia f (x) = 10x . Questa funzione è definita in R e ha valori reali. Il codominio è R+ e f è biunivoca da R a R+ . La sua funzione inversa è f −1 (x) = log10 x, definita in R+ a valori in R. In modo analogo, l’inversa di ex (ove e è il numero di Nepero) è il logaritmo naturale log x. 2. Sia f (x) = tan x. La tangente è definita in R ad eccezione dei punti x = π/2 + kπ, ove k ∈ Z. Non è biunivoca, ma la sua restrizione a (−π/2, π/2) applica biunivocamente questo intervallo su R. La sua funzione inversa si chiama arcotangente di y. L’arcotangente è definita in R a valori in (−π/2, π/2) ed è denotata con il simbolo arctan x. 3. La funzione f (x) = sin x ristretta a [−π/2, π/2] applica biunivocamente questo intervallo su [−1, 1]. La sua funzione inversa si chiama arcoseno di x ed è denotata con il simbolo arcsin(x). L’arcoseno applica biunivocamente [−1, 1] su [−π/2, π/2]. 4. In modo analogo la restrizione di cos x a [0, π] applica biunivocamente questo intervallo su [−1, 1]. La sua funzione inversa si chiama arcocoseno di x ed è denotata con il simbolo arccos(x). L’arcocoseno applica biunivocamente [−1, 1] su [0, π]. π π/2 −1 π/2 1 −π/2 −1 0 1 Le funzioni arcsin(x) e arccos(x) Le precedenti funzioni si possono restringere ad altri intervalli su cui sono biunivoche, ma i nomi arcotangente, arcoseno, arcocoseno sono riservati alle inverse delle restrizioni agli intervalli precisati sopra. Definizione 2.3.4 Sia f : X → Y e g : Y → Z. Si chiama funzione composta di g e f (in questo ordine) la funzione g ◦ f : X → Z definita da ∀x ∈ X g ◦ f (x) = g (f (x)) . 34 2. Funzioni Esempi 2.3.5 1. Sia y = f (x) = 10x e z = g(y) = sin y. In questo caso X = Y = Z = R. La funzione composta g ◦ f risulta z = g ◦ f (x) = g (f (x)) = sin 10x . In questo caso è anche possibile invertire l’ordine della composizione, poiché tutti e tre gli insiemi coincidono. Si ha la nuova funzione z = f ◦ g(x) = 10sin x . 2. Sia f : R → R2 definita da f (x) = (1 + x, 1 − x). Sia g : R2 → R2 definita da g(x1 , x2 ) = (x1 + x2 , x1 − x2 ). Allora g ◦ f : R → R2 e ¡ ¢ g ◦ f (x) = g f (x) = (2, 2x). La composizione di funzioni può essere iterata, in modo da comporre un numero qualunque di funzioni. Si noti che, se f è una applicazione biunivoca di X su sé stesso, si ha ∀x ∈ X f ◦ f −1 (x) = f −1 ◦ f (x) = x. Teorema 2.3.6 Siano f : X → Y e g : Y → Z funzioni biunivoche. Allora g ◦ f : X → Z è biunivoca. Dimostrazione. Poiché le due funzioni sono suriettive, si ha f (X) = Y e g(Y ) = Z. Quindi g (f (X)) = Z, di modo che anche la funzione composta è suriettiva. Se x1 6= x2 , si ha f (x1 ) 6= f (x2 ). Poiché g è pure iniettiva, si ha g (f (x1 )) 6= g (f (x2 )). Quindi anche g ◦ f è iniettiva. gof x X f f(x) g Y Funzione composta g(f(x)) Z 2.4. Successioni. Indici 2.4 35 Successioni. Indici Denotiamo, come di consueto, con N = {1, 2, 3, . . . , n, . . .} l’insieme dei numeri naturali. Definizione 2.4.1 Sia X un insieme non vuoto. Una successione a valori in X è una funzione f : N →X. L’immagine f (n) dell’intero n viene abitualmente indicata con xn . Il valore xn si chiama termine generale o termine n-esimo della successione. La successione viene indicata mediante un allineamento x1 , x2 , x3 , . . . xn , . . . oppure mediante uno dei simboli ∞ {xn }n=1 {xn }n∈N {xn } . Questi simboli vengono usati sia per denotare la successione che il suo codominio. Consideriamo ad esempio la successione a valori reali 1, 1 1 1 1 , , , ..., , ... 2 3 4 n (2.4.2) In questo caso si ha xn = 1/n. Nel caso della successione, sempre a valori in R, −1, 1, −1, 1, . . . , (−1)n , . . . il termine generale è xn = (−1)n . Si può presentare il caso di funzioni f : N → X definite solo a partire da un certo numero in poi. Ad esempio, log(n − 1) è definita solo per n ≥ 2. Scrivendo successivamente i valori della funzione per n = 2, 3, 4, . . . abbiamo log 1, log 2, log 3, . . . Otteniamo cosı̀ una successione il cui primo valore è log 1 = x2 , il secondo valore è log 2 = x3 , il terzo valore è log 3 = x4 etc. Allo stesso modo avremo termini generali definiti a partire da 0 o da un intero negativo. Ad esempio, f (n) = 1 n+1 è definita per n ≥ 0 e la successione dei suoi valori è data da (2.4.2). In questo caso useremo le notazioni x0 , x1 , x2 , . . . xn , . . . ∞ {xn }n=0 e notazioni analoghe se il termine generale è definito per n ≥ k. La nozione di successione può essere generalizzata a funzioni definite su insiemi di qualsiasi natura. Iniziamo con tre esempi. 36 2. Funzioni Esempi 2.4.3 1. In R consideriamo la famiglia di tutti gli intervalli del tipo (0, x), ove x > 0. Possiamo indicare ciascuno di questi intervalli con Ax . 2. Nel piano cartesiano consideriamo l’insieme di tutte le semirette s uscenti dall’origine. Sia θ, 0 ≤ θ < 2π, l’angolo di cui deve ruotare (in senso antiorario) il semiasse positivo delle X per sovrapporsi a s. Associamo a ogni θ ∈ [0, 2π) la corrispondente semiretta, che verrà indicata con sθ . 3. Sia α ∈ (0, 1) un numero reale. Le sue cifre decimali possiedono un valore massimo, che denotiamo con mα . Abbiamo quindi associato ad ogni α ∈ (0, 1) un intero mα tra 0 e 9. Definizione 2.4.4 Siano I e X insiemi non vuoti. Una indicizzazione a valori in X è una funzione f : I → X. Gli elementi dell’insieme I vengono chiamati indici. L’immagine f (i) dell’indice i ∈ I si denota con xi e l’indicizzazione a valori in X si denota con il simbolo {xi }i∈I . Y sθ θ X Negli esempi precedenti gli insiemi degli indici sono rispettivamente R+ , [0, 2π), (0, 1). Gli insiemi X sono rispettivamente la famiglia degli intervalli aperti con primo estremo 0, la famiglia delle semirette del piano uscenti dall’origine, l’insieme delle cifre {0, 1, 2, . . . , 9}. Possiamo ora definire le operazioni di unione e intersezione per famiglie qualunque di insiemi. Sia {Ai }i∈I una famiglia di sottoinsiemi di un insieme A. Poniamo \ Ai = {x ∈ A : ∀i ∈ I x ∈ Ai } , i∈I [ i∈I Ai = {x ∈ A : ∃i ∈ I x ∈ Ai } . 2.5. Potenza di un insieme 37 Per gli insiemi dell’esempio 2.4.3.1 si ha \ [ Ax = ∅, Ax = (0, +∞). x∈R+ Nell’esempio 2.4.3.2 si ha \ x∈R+ [ sθ = {(0, 0)} , θ∈[0,2π) sθ = R 2 . θ∈[0,2π) Se l’insieme degli indici è N (cioè nel caso di una successione di insiemi), si usano le notazioni +∞ +∞ \ [ An , An . n=1 n=1 Se l’insieme degli indici è l’insieme dei primi k naturali {1, 2, . . . , k}, si usano le notazioni k k \ [ An , An . n=1 n=1 L’unione e l’intersezione di famiglie qualsiasi di sottoinsiemi godono delle consuete proprietà di queste operazioni. 2.5 Potenza di un insieme Definizione 2.5.1 Sia X un insieme non vuoto. Si dice che X è finito se esiste n ∈ N tale che X sia in corrispondenza biunivoca con l’insieme {1, 2, . . . , n}. Il numero n si dice potenza, o cardinalità, di X. Si noti che la potenza di un insieme finito è unica. Se X è in corrispondenza biunivoca con {1, 2, 3, . . . , n} e con {1, 2, 3, . . . , m}, allora questi due insiemi devono essere in corrispondenza biunivoca tra loro e quindi m = n. Se X = ∅ si assegna convenzionalmente a X la cardinalità 0. Definizione 2.5.2 Un insieme non vuoto si dice infinito se non è finito. Pur senza introdurre il concetto di cardinalità per insiemi infiniti, possiamo tuttavia definire la nozione di insiemi che hanno eguale cardinalità. Definizione 2.5.3 Si dice che due insiemi non vuoti X e Y sono equipotenti, o che hanno la stessa potenza, o la stessa cardinalità, se essi sono in corrispondenza biunivoca. In tal caso si scrive X ∼ Y . Si dice che X ha potenza, o cardinalità, maggiore di quella di Y se X non è equivalente a Y ed esiste un sottoinsieme proprio A ⊂ X tale che A ∼ Y . Osserviamo che se X ∼ Y e Y ∼ Z allora X ∼ Z Infatti, se f : X → Y è biunivoca e g : Y → Z è biunivoca, allora la funzione composta g ◦ f : X → Z è pure biunivoca per il Teorema 2.3.6. 38 2. Funzioni Due insiemi finiti sono equipotenti se e solo se hanno la stessa cardinalità secondo la definizione 2.5.1. In particolare, un insieme finito ha sempre cardinalità maggiore di quella di un suo sottoinsieme proprio. Se X è infinito, la situazione è diversa. Ad esempio, definiamo una applicazione f : N → 2N (i numeri naturali pari) ponendo f (n) = 2n. Questa applicazione è biunivoca, poiché il codominio concide con 2N e numeri differenti hanno immagini differenti. Quindi N è equipotente a un suo sottoinsieme proprio. Il seguente Teorema mostra che questa proprietà caratterizza gli insiemi infiniti. La dimostrazione è svolta nell’Appendice. Teorema 2.5.4 Un insieme non vuoto X è infinito se e solo se esiste un suo sottoinsieme proprio A tale che A ∼ X. 2.6 Potenza del numerabile Definizione 2.6.1 Si dice che un insieme A è numerabile (o che ha la potenza del numerabile) se A è equipotente a N. Se A è numerabile esiste un funzione biunivoca f : N →A. Posto an = f (n), gli elementi di A si possono ‘elencare in successione’: a1 , a2 , a3 , . . . , an , . . . (2.6.2) Un esempio di insieme numerabile diverso da N stesso è fornito da Z, l’insieme degli interi relativi. Gli elementi di Z si possono infatti elencare in successione con la legge 0, −1, 1, −2, 2, −3, 3, . . . Il seguente Teorema mostra che la potenza del numerabile è la ‘più piccola’ cardinalità infinita. Teorema 2.6.3 Sia A un insieme numerabile e B ⊆ A un insieme infinito. Allora B è numerabile. Dimostrazione. Supponiamo gli elementi di A indicizzati come in (2.6.2). Tra questi elementi si trovano anche gli elementi b ∈ B. Denotiamo con b1 il primo elemento di B che appare in (2.6.2). Denotiamo con b2 il primo elemento di B successivo a b1 . In generale, avendo definito bk , denotiamo con bk+1 il primo elemento di B successivo a bk . Poiché B è infinito, tale processo non può avere termine, e tutti gli elementi di B risultano elencati in successione: b1 , b2 , . . . , bk , . . . Teorema 2.6.4 Sia A1 , A2 , . . . , An ,. . . una successione di insiemi ciascuno dei quali è numerabile. Allora ∞ [ A= An n=1 è numerabile. 2.6. Potenza del numerabile 39 Dimostrazione. Indichiamo con ank gli elementi di An , cioè An = {an1 , an2 , an3 , . . . , ank , . . .} . Gli elementi dell’unione quadro A1 : A2 : A3 : A4 : ... An : ... sono tutti e soli gli elementi che appaiono nel seguente a11 a21% a31 % a41 % ... an1 % ... a12 a13 a14 a22 % a23 % a24 a32 % a33 a34 a42 a43 a44 ... ... ... an2 an3 an4 ... ... ... ... ... ... ... ... ... ... Gli elementi della tabella si possono numerare con procedimento ’diagonale’: a11, a21 , a12 , a31 , a22 , a13 , a41 , a32 , a23 , a14,... (2.6.5) Poiché gli An non sono necessariamente a due a due disgiunti, un elemento può apparire più volte nella successione (2.6.5). Conveniamo quindi di omettere, nel processo di numerazione descritto, ogni elemento che sia già apparso una volta. In tal modo A risulta posto in corrispondenza biunivoca con l’insieme dei numeri naturali. Il Teoema precedente si enuncia anche nel seguente modo: l’unione di una infinità numerabile di insiemi numerabile è numerabile. Corollario 2.6.6 Siano A1 , A2 , . . . , An insiemi numerabili. Allora, il loro prodotto cartesiano A1 × A2 × . . . × An è numerabile. Dimostrazione. Dimostriamo il Corollario per induzione sul numero n di insiemi, iniziando da n = 2. Siano A = {a1 , a2 , a3 , . . . , an , . . .} , B = {b1 , b2 , b3 , . . . , bk , . . .} numerabili. Il generico elemento di A × B è del tipo (an , bk ). Quindi A × B risulta unione numerabile degli insiemi numerabili {a1 } × B = {(a1 , b1 ), (a1 , b2 ), (a1 , b3 ), . . . , (a1 , bk ), . . .} {a2 } × B = {(a2 , b1 ), (a2 , b2 ), (a2 , b3 ), . . . , (a2 , bk ), . . .} {a3 } × B = {(a3 , b1 ), (a3 , b2 ), (a3 , b3 ), . . . , (a3 , bk ), . . .} ......... {an } × B = {(an , b1 ), (an , b2 ), (an , b3 ), . . . , (an , bk ), . . .} ......... Per il Teorema 2.6.4 A × B è numerabile. 40 2. Funzioni Supponiamo ora vera la tesi per n. Poniamo A = A1 × A2 × . . . × An e B = An+1 , di modo che A1 × A2 × . . . × An × An+1 = A × B. Per l’ipotesi di induzione A è numerabile e quindi, come abbiamo appena visto, anche A × B è numerabile. Corollario 2.6.7 Q è numerabile. Qn è numerabile per ogni intero n ≥ 1. Dimostrazione. Ogni numero razionale si esprime, in forma non unica, come frazione p/q, ove p ∈ Z è un intero relativo e q ∈ N. Associando a p/q la coppia (p, q), l’insieme di tutte le frazioni è in corrispondenza biunivoca con Z × N, che è numerabile per il Corollario precedente. Poiché Q è un sottoinsieme infinito dell’insieme numerabile di tutte le frazioni, per il Teorema 2.6.3 Q è numerabile. Per il Corollario precedente anche Qn è numerabile. 2.7 Potenza del continuo Non tutti gli insiemi infiniti sono numerabili. Questo paragrafo è dedicato alla dimostrazione del Teorema di Cantor, che asserisce che R ha potenza maggiore di N. Definizione 2.7.1 Diciamo che un insieme ha la potenza del continuo se è equipotente a R. -1 1 y= x 1 − |x| 2.7. Potenza del continuo 41 Lemma 2.7.2 L’intervallo (0, 1) ha la potenza del continuo. Dimostrazione. La funzione g(x) = (x + 1)/2 applica biunivocamente (−1, 1) su (0, 1) e quindi (0, 1) ∼ (−1, 1). Basta perciò dimostrare che (−1, 1) è equipotente a R. Sia f : (−1, 1) → R definita da f (x) = x . 1 − |x| Evidentemente, f (0) = 0, f (x) > 0 se 0 < x < 1 e f (x) < 0 se −1 < x < 0. Sia y ∈ R fissato. L’equazione x y= 1 − |x| ammette in (−1, 1) l’unica soluzione x= y 1+y se y > 0, x= y 1−y se y < 0. Quindi, per ogni y ∈ R esiste uno e un solo x ∈ (−1, 1) tale che f (x) = y, cioè f è biunivoca. È chiaro che, con ragionamento analogo, si dimostra che ogni intervallo (a, b) ha la potenza del continuo. Teorema 2.7.3 (di Cantor) R ha potenza maggiore di N. Dimostrazione. Basta dimostrare che l’intervallo (0, 1) non è numerabile. Questo implica, per il Lemma 2.7.2, che neppure R è numerabile. Inoltre, poiché N ⊂ R, per la definizione 2.5.3 si ha che la cardinalità di R è maggiore di quella di N. Ragioniamo per assurdo e supponiamo che i punti di (0, 1) si possano di∞ sporre in successione, sia essa {xn }n=1 . Ogni elemento della successione ha una rappresentazione decimale x1 = 0, c11 c12 c13 . . . c1n . . . x2 = 0, c21 c22 c23 . . . c2n . . . x3 = 0, c31 c32 c33 . . . c3n . . . ... ...... xn = 0, cn1 cn2 cn3 . . . cnn . . . ... ...... (2.7.4) Costruiamo ora un numero reale x ∈ (0, 1) che non coincide con nessuno degli xn . Definiamo la prima cifra decimale c1 in modo che c1 6= c11 , c1 6= 0, c1 6= 9. Definiamo c2 in modo tale che c2 6= c22 , c2 6= 9. 42 2. Funzioni Definiamo c3 in modo che c3 6= c33 , c3 6= 9. Al passo n definiamo cn in modo che cn 6= cnn , cn 6= 9. Ad esempio, possiamo scegliere cn = 2 se cnn = 1, e cn = 1 se cnn 6= 1. Il numero x = 0, c1 c2 c3 . . . cn . . . è positivo poiché c1 6= 0, ed è minore di 1 perché la sua parte intera è 0. Tuttavia x differisce da tutti i numeri xn in (2.7.4), poiché, per ogni n, si ha cn 6= cnn . Siamo cosı̀ arrivati a un assurdo. Corollario 2.7.5 L’insieme I dei numeri irrazionali non è numerabile. Dimostrazione. Altrimenti R = Q ∪ I sarebbe numerabile. Ulteriori risultati sulla potenza degli insiemi sono contenuti in Appendice. 2.8 2.8.1 Appendice Le funzioni come sottoinsiemi del prodotto cartesiano Come abbiamo affermato nel primo paragrafo di questo capitolo, la nozione di funzione si può definire tramite quella di sottoinsieme del prodotto cartesiano. La definizione consiste nell’identificazione di una funzione con il suo grafico. Siano X e Y due insiemi non vuoti, e sia F un sottoinsieme del prodotto cartesiano X × Y con la seguente proprietà: per ogni x ∈ X esiste uno e un solo y ∈ Y tale che (x, y) ∈ F . Diciamo allora che F definisce una funzione f : X → Y . Per ogni x ∈ X l’unico elemento y tale che (x, y) ∈ F viene indicato con il simbolo funzionale f (x). 2.8.2 Proprietà degli insiemi infiniti Lemma 2.8.1 Sia X un insieme infinito. Allora a) X contiene un insieme numerabile N tale che N c è infinito b) Per ogni insieme numerabile N ⊆ X tale che N c è infinito, X è equipotente a N c. Dimostrazione. a) Sia x1 ∈ X qualsiasi. Poiché X non è finito, esiste x2 ∈ X tale che x2 6= x1 . Analogamente, esiste x3 ∈ X distinto da x1 e x2 . Per ogni n, dati x1, x2 , x3 , . . . , xn a due a due distinti, esiste xn+1 ∈ X distinto dai precedenti. Quindi X contiene l’insieme numerabile N = {x1 x2 , x3 , . . . , xn , . . .}. Se N c non è infinito, basta sostituire N con la successione x2 x4 , x6 , . . . , x2n , . . . degli elementi di indice pari. 2.8. Appendice 43 b) Sia N ⊆ X numerabile tale che N c è infinito. Poniamo N = {x1 , x2 , x3 , . . . , xn , . . .} Per il punto a), N c contiene a sua volta un sottoinsieme numerabile {y1, y2 , y3 , . . . , yn , . . .} ⊂ N c . ∞ Formiamo la successione {zn }n=1 con la seguente legge: z2n−1 = xn , z2n = yn . Chiamiamo Z l’insieme degli elementi della successione. La funzione ½ x se x ∈ Z c f (x) = z2n = yn se x = zn ∈ Z applica biunivocamente X su N c . Corollario 2.8.2 Un insieme non vuoto X è infinito se e solo se esiste un suo sottoinsieme proprio A tale che X ∼ A. Dimostrazione. Se esiste un insieme infinito A ⊂ X tale che X ∼ A, l’insieme X non può essere finito. L’affermazione inversa segue dai punti a) e b) del Lemma precedente Corollario 2.8.3 L’insieme dei numeri irrazionali ha la potenza del continuo. Dimostrazione. Basta applicare il punto b) del Lemma 2.8.1 con X = R e N = Q. Teorema 2.8.4 L’insieme di tutti gli allineamenti delle cifre 0 e 1 ha la potenza del continuo. Dimostrazione. Sia X l’insieme degli allineamenti di 0 e 1. Ad esempio 1 0 0 11 0 10 0 1 . . . Sia N il sottoinsieme degli allineamenti di periodo 1 e dell’allineamento che ha la sola cifra 0. L’insieme N è numerabile. Infatti, c’è un solo allineamento di periodo 1 senza antiperiodo, un allineamento di periodo 1 con antiperiodo di una cifra, due allineamenti di periodo 1 con antiperiodo di due cifre, quattro allineamenti di periodo 1 con antiperiodo di tre cifre e, in generale, 2n−1 allineamenti di periodo 1 con antiperiodo di n cifre. Tutti e soli gli allineamento di N c costituiscono le rappresentazioni binarie dei numeri in (0, 1) (senza la parte intera 0). Quindi N c ∼ (0, 1), e per il punto b) del Lemma 2.8.1, si ha anche X ∼ (0, 1). Chiaramente, lo stesso risultato vale per tutti gli allineamenti decimali o in base qualunque. 44 2.8.3 2. Funzioni Potenza dell’insieme delle parti Per ogni insieme X denotiamo con P(X) l’insieme delle parti di X, ovvero, l’insieme di tutti i suoi sottoinsiemi. Per X = N si ha il seguente risultato. Teorema 2.8.5 P(N) è equipotente a R. Dimostrazione. Sia A ⊆ N. Ad ogni intero n associamo il numero 1 se n ∈ A, altrimenti associamo a n il numero 0. Ad esempio, se A è l’insieme dei dispari otteniamo l’allineamento infinito 1 0 1 01 0 1 0... Se A è il sottoinsieme dei quadrati, otteniamo l’allineamento 1 0 0 1 0 0 0 0 1 ... Quindi, ad ogni A viene associato un allineamento infinito di cifre 0 e 1. La corrispondenza tra questi allineamenti e P(N) è chiaramente biunivoca. Per il Teorema 2.8.4, P(N) ha la potenza del continuo. Ci si può chiedere se esistano insiemi con potenza maggiore del continuo. La risposta è affermativa. In analogia al caso di N, P(X) ha sempre potenza maggiore di X. Prima di dimostrare questo risultato, osserviamo che, come nel caso numerabile, P(X) è equipotente all’insieme di tutte le funzioni f : X → {0, 1} . Infatti, ad ogni A ⊆ X, si assegna la funzione f : X → {0, 1} tale che ½ 1 se x ∈ A f (x) = 0 se x ∈ /A Teorema 2.8.6 Per ogni insieme X l’insieme delle parti P(X) ha potenza maggiore di X. Dimostrazione. Se X è l’insieme vuoto, allora l’insieme P(∅) ha cardinalità 1, poiché contiene ∅ come unico elemento. Supponiamo che X non sia vuoto. Allora, P(X) contiene un sottoinsieme proprio equipotente a X. Infatti, l’insieme di tutti i singletons (insiemi con un solo elemento) è in corrispondenza biunivoca con X. Per dimostrare che P(X) non è equipotente a X, si generalizza la dimostrazione del Teorema di Cantor. Sia F l’insieme di tutte le funzioni f : X → {0, 1}, e supponiamo per assurdo che F si possa mettere in corrispondenza biunivoca con X. In tal caso, ad ogni x viene associata in maniera biunivoca una funzione fx ∈ F. Costruiamo ora una funzione g ∈ F che non può corrispondere a nessun indice x. La funzione ½ 1 se fx (x) = 0 g(x) = 0 se fx (x) = 1 non può corrispondere a nessun x ∈ X. Infatti, per ogni x ∈ X, g differisce da fx per il valore assunto in x. 2.8. Appendice 45 Corollario 2.8.7 Se X è finito con cardinalità n, P(X ) ha cardinalità 2n . Dimostrazione. Basta dimostrare che l’insieme delle funzioni da X a {0, 1} ha cardinalità 2n . Al primo elemento di X possono corrispondere due valori, 0 o 1; al secondo elemento due valori, 0 o 1; al terzo elemento ancora due valori etc. Quindi, per i primi due elementi ci sono 4 scelte possibili, per i primi 3 elementi 8 scelte possibili, per i primi n elementi 2n scelte possibili. In base alla proprietà espressa dal Corollario, per l’insieme delle parti di X viene anche usata la notazione 2X . Abbiamo dimostrato che il prodotto cartesiano di insiemi numerabili è numerabile. Una simile affermazione vale anche per la potenza del continuo. Teorema 2.8.8 Rn è equipotente a R. Dimostrazione. Dimostriamo il Teorema per semplicità nel caso n = 2, ma la dimostrazione si estende in modo ovvio. Sia X l’insieme di tutti gli allineamenti di cifre 0 e 1. Per il Teorema 2.8.4 X ∼ R. Chiaramente X ×X ∼ R×R. Basta quindi dimostrare che X ×X ∼ X. Siano x e y appartenenti a X. Poniamo x = a1 a2 . . . an . . . y = b1 b2 . . . bn . . . ove an e bn sono 0 o 1. Definiamo f : X × X → X associando alla coppia ordinata (x, y) l’allineamento in cui le cifre dispari sono quelle di x e le cifre pari quelle di y. Poniamo cioè f (x, y) = a1 b1 a2 b2 a3 b3 . . . an bn . . . Dimostriamo che f è biunivoca. La funzione f è iniettiva. Infatti, se f (x, y) = f (x,e e y ), si ha a1 b1 a2 b2 a3 b3 . . . = e a1 eb1 e a2 eb2 e a3 eb3 . . . Ne segue an = e an e bn = ebn per ogni n, cioè x = x e e y = ye. La funzione è anche suriettiva. Infatti, assegnato z = c1 c2 c3 c4 . . . c2n−1 c2n . . . , si ha z = f (x, y), con x = c1 c3 c5 . . . c2n−1 . . . y = c2 c4 c6 . . . c2n . . . . Capitolo 3 Spazi Metrici 3.1 Introduzione Gli spazi metrici costituiscono un capitolo della topologia, una delle grandi teorie unificanti della matematica moderna. Molti dei concetti presentati in questo capitolo sono concetti topologici, che noi ci limiteremo a studiare nel contesto metrico. La nozione di distanza appare nella matematica in svariati contesti analitici e geometrici. La teoria degli spazi metrici, nata all’inizio del secolo XX, fornisce un ambito astratto e unitario per la trattazione di questa nozione. 3.2 Definizione ed esempi Definizione 3.2.1 Sia X 6= ∅ e sia d : X × X → R. Si dice che (X, d) è uno spazio metrico se sono soddisfatte le seguenti condizioni: 1. ∀x, y ∈ X d(x, y) ≥ 0 2. ∀x, y ∈ X d(x, y) = 0 3. ∀x, y ∈ X d(x, y) = d(y, x) 4. ∀x, y, z ∈ X se e solo se x = y (proprietà di simmetria) d(x, y) ≤ d(x, z) + d(z, y) (diseguaglianza triangolare) La funzione d si chiama metrica o distanza su X. Si dice anche che X è metricizzato tramite d. Gli elementi x ∈ X vengono chiamati punti dello spazio metrico. Esempi 3.2.2 1. Sia X = R e d(x, y) = |x − y|. Le proprietà 1–4 sono immediatamente verificate. 47 48 3. Spazi Metrici Z y || ||_ x- _ _ y x _ Y X Distanza euclidea in R3 ° ° 2. Sia X = Rn e d(x, y) = °x − y °. Le proprietà della norma studiate nel paragrafo 1.8 del capitolo 1 assicurano che d è effettivamente una distanza su Rn . Essa prende il nome di metrica euclidea. La metrica euclidea, definita tramite la norma, è la distanza ‘naturale’ in Rn . Nel seguito, quando non sia esplicitamente affermato il contrario, supporremo sempre Rn metricizzato con la metrica euclidea. 3. Un insieme ammette in generale più funzioni distanza che lo metricizzano. Come esempio, introduciamo in Rn due distanze diverse da quella euclidea. La prima è il massimo valore assoluto della differenza delle coordinate. Poniamo ¡ ¢ d∞ x, y = max {|x1 − y1 | , |x2 − y2 | , . . . , |xn − yn |} . Che tale funzione sia una metrica è presto verificato. La 1 è ovvia, come pure la 2, poiché maxk |xk − yk | = 0, implica x1 = y1 , . . . , xn = yn . La simmetria è pure chiara, poiché |xk − yk | = |yk − xk | per ogni k. Verifichiamo la proprietà triangolare. Si ha, per ogni k = 1, 2, . . . , n, |xk − yk | ≤ |xk − zk | + |zk − yk | . Passando ai massimi si ha max |xk − yk | ≤ max |xk − zk | + max |zk − yk | , k cioè k k ¡ ¢ ¡ ¢ d∞ x, y ≤ d∞ (x, z) + d∞ z, y . 4. Definiamo un’altra distanza in Rn ponendo d1 (x, y) = |x1 − y1 | + |x2 − y2 | + · · · |xn − yn | n X = |xk − yk | . k=1 (3.2.3) 3.2. Definizione ed esempi 49 _y y2 x _ x2 x1 ¡ y1 La distanza d1 x, y ¢ Le proprietà 1–3 sono ovvie, e anche la quarta discende dall’analoga proprietà del valore assoluto. Infatti, poiché (3.2.3) vale per ogni k, sommando si ottiene n X k=1 |xk − yk | ≤ n X k=1 |xk − zk | + n X |zk − yk | . k=1 5. Sia (X, d) uno spazio metrico e sia Y ⊆ X un sottoinsieme non vuoto. Detta dY la restrizione di d a Y × Y , (Y, dY ) è a sua volta uno spazio metrico, chiamato sottospazio metrico di X. In questo caso diciamo che Y ha la metrica indotta da X. 6. Sia C la circonferenza unitaria nel piano, e siano p e q due punti di C. Essi suddividono la circonferenza in due archi di lunghezze `(p, q) e 2π−`(p, q). Chiamiamo distanza di p da q la più piccola delle lunghezze di questi due archi, cioè d(p, q) = min (`(p, q), 2π − `(p, q)) . Le proprietà della distanza sono imediatamente verificate. Si noti che questa distanza non è la metrica indotta da R2 , descritta nel precedente esempio. Infatti dC (p, q) = kp − qk < min (`(p, q), 2π − `(p, q)) . 7. L’esempio precedente può essere generalizzato. Sia S ⊆ R3 la superficie sferica unitaria. Siano p e q due punti di S. Per essi passa uno e un solo cerchio massimo. Chiamiamo distanza tra p e q il minimo delle lunghezze dei due archi di cerchio massimo. Anche in questo caso la distanza è diversa dalla distanza indotta da R3 . Questa metrica è un esempio di distanza geodetica. Data una superficie in R3 , possiamo definire in essa lo stesso tipo di distanza qualora sia definito 50 3. Spazi Metrici 1 p p 0 d(p,q) dC(p,q)=||p-q|| –1 –1 q q –1 0 0 1 1 Distanza nel cerchio e sulla sfera il concetto di curva di lunghezza minima (chiamata geodetica) che unisce due punti. In tal caso, si definisce distanza di due punti della superficie la lunghezza della geodetica che li unisce. Un altro esempio elementare di questo tipo di superfici è il cilindro infinito. 8. Sia f : R → R una funzione iniettiva. Poniamo, per ogni coppia di numeri reali x, y, df (x, y) = |f (x) − f (y)|. Si riconosce facilmente che le proprietà 1–4 della definizione 3.2.1 sono verificate. La distanza euclidea in R si può considerare una distanza di questo tipo, qualora si ponga f (x) = x. f(y) f(x) y x La distanza df in R 9. Sia X l’insieme di tutte le funzioni limitate f : [0, 1] → R, cioè tali che supx |f (x)| < +∞. La differenza di due funzioni in X è ancora limitata, poiché sup |f (x) − g(x)| ≤ sup |f (x)| + sup |g(x)| < +∞. x x x Poniamo d(f, g) = sup |f (x) − g(x)| . x 3.3. Intorni 51 È immediato verificare che le proprietà 1–4 nella definizione di spazio metrico sono soddisfatte. 10. In ogni insieme non vuoto X può essere definita una metrica. Poniamo, per ogni x, y ∈ X, ½ 0 se x = y d(x, y) = 1 se x 6= y Le proprietà 1–3 della metrica sono immediate. Dimostriamo che vale la diseguaglianza triangolare. Siano x, y, z elementi di X, non necessariamente distinti. Se x = y, allora d(x, y) = 0 ≤ d(x, z) + d(y, z). Se x 6= y, allora deve valere almeno una delle due relazioni: x 6= z, oppure y 6= z. Quindi d(x, y) = 1 ≤ d(x, z) + d(y, z). La metrica ora descritta si chiama metrica discreta e (X, d) si chiama spazio metrico discreto. 3.3 Intorni Quando si sia definito il concetto di distanza in un insieme, la nozione più naturale ad essa associata è quella di ‘cerchio’ di centro e raggio assegnato. Definizione 3.3.1 Sia (X, d) uno spazio metrico. Sia p ∈ X e r > 0. Si chiama intorno circolare (o semplicemente intorno) di p di raggio r l’insieme B(p, r) = {x ∈ X : d(p, x) < r} . Il punto p si chiama centro dell’intorno. Esempi 3.3.2 1. Sia X = R con la metrica euclidea. In questo caso B(p, r) = {x ∈ R : |p − x| < r} . Poiché la diseguaglianza |p − x| < r equivale a p − r < x < p + r, l’intorno B(p, r) coincide con l’intervallo aperto (p − r, p + r). 2. Se X = R2 o X = R3 (ambedue con la metrica euclidea) B(p, r) è rispettivamente: il cerchio con centro p e raggio r, privato della circonferenza; la sfera con centro p e raggio r, privata della superficie sferica. In Rn l’intorno B(p, r) è la generalizzazione al caso n-dimensionale di queste figure geometriche. 52 3. Spazi Metrici 3. Consideriamo la metrica d∞ in Rn , limitandoci per semplicità a n = 2. Gli intorni circolari dell’origine 0 nella metrica d∞ sono gli insiemi © ª B(0, r) = (x, y) ∈ R2 : max (|x| , |y|) < r . In altri termini, (x, y) ∈ B(0, r) se e solo se −r < x < r e −r < y < r. Quindi B(0, r) coincide con il quadrato, privato dei lati, con centro in (0, 0) e semilato r, con lati paralleli agli assi. Gli intorni B(p, r) del generico punto p del piano sono i quadrati, privati dei lati, con centro in p e lato 2r. In R3 gli intorni in questa metrica sono dei cubi privati delle facce. 4. In R2 con la metrica d1 gli intorni dell’origine sono gli insiemi © ª B(0, r) = (x, y) ∈ R2 : |x| + |y| < r . Quindi, B(0, r) è l’insieme del piano limitato dalle quattro rette y = ±x + r, y = ±x − r. (3.3.3) Tale insieme è un quadrato, privato dei lati, centrato nell’origine e avente gli assi cartesiani come rette diagonali. Poiché le rette (3.3.3) intercetta√ no le coordinate ±r sugli assi, la lunghezza del lato è r 2. Gli intorni del generico punto p ∈ R2 si ottengono da quelli dell’origine mediante traslazione. r -r 0 r r -r 0 r -r -r Intorni di (0, 0) nelle metriche d∞ e d1 5. Gli intorni in un sottospazio metrico (Y, dY ) di uno spazio metrico (X, d) sono esattamente le intersezioni degli intorni nello spazio ambiente X con Y . Infatti, per ogni p ∈ Y indichiamo con BY (p, r) l’intorno di p nel sottospazio (Y, dY ). Si ha BY (p, r) = {y ∈ Y : dY (p, y) < r} = {y ∈ Y : d(p, y) < r} = B(p, r) ∩ Y . Ad esempio, sia X = R con la metrica euclidea e Y = [0, +∞). Gli intorni di 0 nel sottospazio Y , con la metrica indotta, sono gli intervalli [0, r) = Y ∩ (−r, r). Se p > 0, gli intorni di p in (Y, dY ) sono gli intervalli (p − r, p + r) se p−r ≥0 [0, p + r) se p − r < 0. 3.3. Intorni 53 [ 0 ) p+r p Intorno di p nella metrica indotta 6. Sia (X, d) lo spazio metrico dell’esempio 3.2.2.9. Per ogni f ∈ X si ha ½ ¾ B(f, r) = g ∈ X : sup |f (x) − g(x)| < r . x Quindi, per ogni g ∈ B(f, r) esiste δ > 0 tale che supx |f (x) − g(x)| = r−δ. Ne segue ∀x ∈ [0, 1] f (x) − (r − δ) ≤ g(x) ≤ f (x) + (r − δ) . Quindi B(f, r) consiste delle funzioni g il cui grafico è compreso tra quello di f (x) − r e f (x) + r, ma che si mantiene ‘discosto’ da questi due grafici per un opportuno valore δ, dipendente da g. f(x)+r f(x) g(x) f(x)-r 0 1 7. Sia (X, d) metrico discreto. Se r > 1, qualunque y ∈ X soddisfa la diseguaglianza d(p, y) < r, poiché la distanza può valere al massimo 1. In questo caso B(p, r) = X. Al contrario, se r ≤ 1, l’unico punto tale che d(p, y) < r ≤ 1 è il punto p stesso. In questo caso B(p, r) = {p} si riduce al centro. Dalla definizione di intorno circolare segue che, se r1 < r2 , allora B(p, r1 ) ⊆ B(p, r2 ). Negli spazi euclidei vale il segno ⊂ di inclusione stretta, ma in uno spazio metrico generico intorni di raggio diverso possono coincidere. Ad esempio, in uno spazio metrico discreto, al variare del raggio ci sono due soli intorni di x, lo spazio totale e il singleton di x. In ogni caso vale però la proprietà di separazione degli intorni, o proprietà di Hausdorff. Teorema 3.3.4 (Proprietà di Haudorff ) Sia (X, d) metrico e siano x, y ∈ X. Se x 6= y, allora esiste r > 0 tale che B(x, r) ∩ B(y, r) = ∅. 54 3. Spazi Metrici Dimostrazione. Poniamo r = 13 d(x, y). Sia z ∈ B(x, r), e valutiamo d(y, z). Si ha, per la diseguaglianza triangolare e la simmetria, 3r = d(x, y) ≤ d(x, z) + d(z, y) ≤ r + d(y, z), da cui d(y, z) ≥ 2r. Quindi z ∈ / B(y, r). 3.4 Classificazione dei punti Sia (X, d) uno spazio metrico e A ⊆ X un suo sottoinsieme. Mediante la nozione di intorno circolare, i punti di X si possono classificare, rispetto ad A, in punti interni, esterni o di frontiera. Definizione 3.4.1 Un punto p ∈ X si dice 1. interno ad A se ∃r > 0 tale che B(p, r) ⊆ A; 2. esterno ad A se ∃r > 0 tale che B(p, r) ⊆ Ac ; 3. di frontiera per A se ∀r > 0 B(p, r) ∩ A 6= ∅ e B(p, r) ∩ Ac 6= ∅. Le condizioni ai punti 1, 2 e 3 sono mutuamente esclusive: ogni punto di X soddisfa una e una sola delle tre condizioni. Dalle definizioni discendono le seguenti considerazioni immediate: un punto interno ad A appartiene necessariamente ad A e un punto esterno ad A è interno ad Ac . La definizione di punto di frontiera è simmetrica rispetto ad A e ad Ac . In altri termini, un punto è di frontiera per A se e solo se è di frontiera per Ac . Quindi un punto di frontiera può appartenere sia ad A che ad Ac . L’insieme dei punti di frontiera di A viene chiamato frontiera o contorno di A ed è indicato con il simbolo ∂A. L’insieme dei punti interni di A è chiamato interno di A ed è indicato con il simbolo Å. A C punto di frontiera punto esterno A punto interno Punto interno, esterno, di frontiera 3.4. Classificazione dei punti 55 Esempi 3.4.2 1. In ogni spazio metrico (X, d), l’insieme X ha solo punti interni. D’altro lato, ogni punto è esterno all’insieme vuoto ∅. 2. Sia A = (a, b) ⊂ R. Ogni punto p ∈ (a, b) è interno. Infatti, se r < min(p − a, b − p), B(p, r) = (p − r, p + r) ⊂ (a, b). In questo caso Ac = (−∞, a] ∪ [b, +∞), ma i punti esterni sono tutti e soli i punti p tali che p < a oppure p > b. I punti a e b sono di frontiera. Analogamente, se A = [a, b], o A = [a, b), o A = (a, b], si ha Å = (a, b) e ∂A = {a, b}. © ª 3. Sia A = (x, y) ∈ R2 : x2 + y 2 < 1 . In questo caso Å = A e © ª ∂A = ∂Ac = (x, y) ∈ R2 : x2 + y 2 = 1 . L’insieme dei punti esterni è © ª (x, y) ∈ R2 : x2 + y 2 > 1 . Analoghe considerazioni si possono applicare ad altre figure geometriche piane o spaziali. Ad esempio, un poligono convesso in R2 ha l’insieme dei lati come frontiera e come interno i punti della figura che non appartengono ai lati. 4. In un qualunque spazio metrico (X, d) i punti di un intorno circolare B(p, s) sono interni. Infatti, sia x ∈ B(p, s). L’intorno di x di raggio r < s − d(p, x) è contenuto in B(p, s), poiché, per ogni y ∈ B(x, r), si ha d(p, y) ≤ d(p, x) + d(x, y) < d(p, x) + s − d(p, x) = s. y r x s p Tutti punti di un intorno sono interni 56 3. Spazi Metrici 5. Sia A = Q ⊂ R e sia p ∈ Q. Ogni intervallo (p − r, p + r) contiene infiniti razionali e infiniti irrazionali. Quindi p ∈ ∂Q. Denotiamo con I = Qc l’insieme degli irrazionali. Se x ∈ I, ogni intervallo (x − r, x + r) contiene infiniti razionali e infiniti irrazionali. Quindi si ha pure x ∈ ∂Q. Poiché la frontiera di un insieme e del suo complementare coincidono, si ha ∂Q = ∂I = R. 6. Sia A = B(p, s). Abbiamo visto nell’esempio 3.4.2.3 che in Rn , dotato della metrica euclidea, si ha ∂A = {y ∈ Rn : d(p, y) = s} e i punti esterni sono quelli che hanno da x distanza maggiore di s. In uno spazio metrico generico ciò non è sempre vero. Se (X, d) è uno spazio metrico discreto B(p, 1) = {p} e l’insieme dei punti {y ∈ X : d(p, y) = 1} è Ac . D’altra parte, ogni punto x ∈ Ac è esterno, poiché B(z, 1) = {z} ⊆ Ac . In questo caso ∂A = ∅ e {y ∈ X : d(x, y) > 1} = ∅. Studiamo ora un altro tipo di classificazione dei punti. Sia (X, d) uno spazio metrico e sia A ⊆ X. Se un punto p non è esterno ad A, ogni suo intorno ha intersezione non vuota con A. Ci sono due possibilità: o ogni intorno di p contiene un punto di A diverso da p, oppure esiste un intorno di p in cui l’unico punto di A è p stesso. Definizione 3.4.3 Sia (X, d) uno spazio metrico e A ⊆ X un suo sottoinsieme. Un punto p ∈ X si dice 1. di accumulazione per A se ∀r ∃x 6= p tale che x ∈ B(p, r) ∩ A; 2. isolato in A se ∃r B(p, r) ∩ A = {p}. Dalla definizione si ha che un punto isolato appartiene necessariamente ad A. Invece un punto di accumulazione può appartenere o ad A o ad Ac , come apparirà chiaro dagli esempi. L’insieme dei punti di accumulazione di A si indica con A0 e si chiama insieme derivato di A. Teorema 3.4.4 Sia (X, d) uno spazio metrico e A ⊆ X. Un punto p è di accumulazione per A se e solo se ogni suo intorno contiene infiniti punti di A. 3.4. Classificazione dei punti 57 Dimostrazione. Sia p di accumulazione per A e supponiamo, per assurdo, che esista un intorno B(p, s) contenente un numero finito di punti di A. Denotiamo tali punti con x1 , x 2 , . . . , xn , omettendo il punto p stesso nel caso che esso appartenga ad A. Sia 0 < r < min (d(p, x1 ), d(p, x2 ), . . . , d(p, xn )) . Allora, l’intorno B(p, r) non può contenere nessun punto di A diverso da p, assurdo. Corollario 3.4.5 Sia (X, d) uno spazio metrico e sia A ⊆ X un sottoinsieme finito. Allora A0 = ∅. Esempi 3.4.6 1. Sia A = (a, b) ⊂ R. Tutti i punti di (a, b) sono di accumulazione per A. Anche gli estremi a e b sono di accumulazione. Quindi A0 = [a, b]. Non ci sono punti isolati. Se A = [a, b], oppure A è un intervallo semiaperto, si ha ancora A0 = [a, b]. 2. Sempre in R con la metrica euclidea, consideriamo l’insieme ½ ¾ 1 1 1 A = 1, , , . . . , , . . . . 2 3 n Ogni punto di A è isolato. Infatti, per n = 1 l’intorno B(1, s), con s < 1/2, contiene solo il punto 1 di A. Per n = 2, l’intorno B(1/2, s), con s < 1/6, contiene solo il punto 1/2 di A. Per n generico sia 0<s< 1 1 1 − = . n n+1 n(n + 1) L’intorno B(1/n, s) contiene solo il punto 1/n di A. r ) 0 1 _ n 1 _ 3 ( 1 _ -s 2 1 _ 2 ) 1 _+s 2 1 A = {1 , 1/2 , 1/3 , . . . , 1/n, , . . .}, A0 = {0} Il punto 0 è di accumulazione. Infatti, assegnato ad arbitrio r > 0, per ogni n > 1/r i punti 1/n appartengono a B(0, r). È anche chiaro che non ci sono altri punti di accumulazione. Quindi A0 = {0}. 58 3. Spazi Metrici 3. In R2 con la metrica euclidea sia A un intorno circolare di p di raggio r. Ogni punto sulla circonferenza è di accumulazione, e ogni punto interno è di accumulazione. Quindi © ª A0 = x ∈ R2 : d(p, x) ≤ r . Non ci sono punti isolati. L’analoga proprietà vale per figure geometriche elementari piane o spaziali, e per gli intorni circolari in Rn . 4. Sia A = Q ⊂ R. Il ragionamento dell’esempio 3.4.2.5 mostra che ogni numero reale è di accumulazione per Q ⊂ R, ovvero Q0 = R. Analogamente, I0 = R 5. Sia (X, d) metrico discreto e A ⊆ X non vuoto. Ogni punto p ∈ A è isolato, poiché l’intorno di raggio 1 di p contiene solo p. Ovviamente non ci possono essere punti di accumulazione. In generale, uno spazio metrico viene chiamato discreto se ogni suo punto è isolato, anche se la distanza non assume solo i valori 0 e 1. Ad esempio, N, con la metrica indotta da quella euclidea, ha solo punti isolati. Per chiarezza di linguaggio, noi useremo il termine ‘spazio metrico discreto’ solo per gli spazi dotati della distanza discreta, che assume unicamente i valori 0 e 1. Nello spazio euclideo Rn ogni punto isolato di A è anche punto di frontiera per A. Questo non vale in generale, come mostra l’esempio 3.4.6.5. Nella metrica discreta la frontiera di un qualunque sottoinsieme A è vuota e ogni punto di A è sia isolato che interno. In generale possiamo affermare i seguenti fatti: a) un punto di A o è interno, oppure è di frontiera per A; b) un punto di A o è di accumulazione per A, oppure è isolato; c) un punto di frontiera per A o è di accumulazione per A, oppure è isolato; d) un punto interno e un punto isolato di A appartengono necessariamente ad A; e) un punto di accumulazione per A non appartiene necessariamente ad A. 3.5 Insiemi aperti, chiusi, limitati Definizione 3.5.1 Sia (X, d) uno spazio metrico e A ⊆ X. Si dice che A è aperto se A = Å. Si dice che A è chiuso se Ac è aperto. Quindi, un insieme A non vuoto è aperto se e solo se tutti i suoi punti sono interni. I chiusi si possono caratterizzare in termini di punti di accumulazione. Teorema 3.5.2 Sia (X, d) uno spazio metrico e sia A ⊆ X. L’insieme A è chiuso se e solo se A0 ⊆ A. 3.5. Insiemi aperti, chiusi, limitati 59 Dimostrazione. Sia A chiuso e sia p ∈ Ac . Poiché p è interno ad Ac , esiste un intorno B(p, r) che non contiene punti di A. Quindi p non è di accumulazione per A. In altri termini, A0 ⊆ A. Viceversa, sia A0 ⊆ A e sia p un qualunque punto di Ac . Per ipotesi p non è di accumulazione per A. Questo significa che esiste un intorno B(p, r) che non contiene alcun punto di A diverso da p. Dato che p ∈ Ac , B(p, r) non contiene nessun punto di A; perciò B(p, r) ⊆ Ac . Quindi p è interno ad Ac . Ne segue che Ac è aperto. Esempi 3.5.3 1. In ogni spazio metrico (X, d) l’insieme X è aperto, poiché tutti suoi punti sono interni. X è anche chiuso perché, essendo l’insieme totale, contiene necessariamente X 0 . Ne segue che anche ∅ è sia chiuso che aperto. 2. In qualunque spazio metrico (X, d) un insieme finito A è chiuso. Infatti, A0 = ∅ ⊂ A, per il Corollario 3.4.5. 3. Ogni intervallo (a, b) ⊂ R è aperto. Cosı̀ pure sono aperti gli intervalli (a, +∞) e (−∞, a). Gli intervalli [a, b] sono chiusi, come pure gli intervalli [a, +∞) e (−∞, a]. Le definizioni di intervalli aperti e chiusi del capitolo 1 sono quindi coerenti con la definizione 3.5.1 di insiemi aperti e chiusi. Gli intervalli del tipo [a, b) e (a, b] non sono né aperti né chiusi. Infatti uno dei due estremi appartiene all’insieme ma non è interno, mentre l’altro estremo è punto di accumulazione, ma non appartiene all’insieme. 4. Sia (X, d) uno spazio metrico, sia Y ⊆ X un insieme non vuoto, e consideriamo il sottospazio (Y, dY ) con la metrica indotta. Abbiamo visto nell’esempio 3.3.2.5 che gli intorni di un punto y ∈ Y nella metrica indotta sono gli insiemi B(y, r) ∩ Y . Da questo segue che gli aperti nella metrica indotta sono esattamemte gli insiemi A ∩ Y , ove A è aperto in X. 5. Sia (X, d) uno spazio metrico e B(p, r) ⊆ X un qualunque intorno circolare. Nell’esempio 3.4.2.4 abbiamo mostrato che ogni punto di B(p, r) è interno. Quindi B(p, r) è aperto. In maniera del tutto analoga si dimostra che l’insieme A = {x ∈ X : d(p, x) > r} è aperto. Ne segue che il suo complementare {x ∈ X : d(p, x) ≤ r} è chiuso. In particolare, in R2 è chiuso un cerchio che includa la sua circonferenza e in R3 una sfera che includa la sua superficie sferica. Analogamente, figure geometriche elementari piane, o spaziali, che includano il loro contorno, sono chiuse. 6. Sia (X, d) metrico discreto e A ⊆ X non vuoto. Poiché ogni punto di A è interno, A è aperto. D’altra parte, A0 = ∅, e quindi A è anche chiuso. 60 3. Spazi Metrici Teorema 3.5.4 Se A ⊆ R è un insieme chiuso e limitato superiormente, allora sup A ∈ A. Se A è chiuso e limitato inferiormente, allora inf A ∈ A. Dimostrazione. Sia p = sup A. Per ogni r > 0, deve esistere x ∈ A tale che p − r < x ≤ p, altrimenti p non sarebbe il minimo dei maggioranti. In altri termini, per ogni r > 0 esiste x ∈ A tale che x ∈ B(p, r). Quindi p non è esterno ad A. Perciò, o p è isolato, nel qual caso appartiene ad A, o p è di accumulazione, nel qual caso, essendo A chiuso, appartiene ancora ad A. Una analoga dimostrazione vale per l’estremo inferiore. Teorema 3.5.5 Sia (X, d) uno spazio metrico e {Ai }i∈I una famiglia qualunque di sottoinsiemi aperti di X. Allora a) A= [ Ai è aperto. i∈I b) Se la famiglia è finita, sia essa {A1 , A2 , . . . , An }, allora, A= n \ Ai è aperto. i=1 Dimostrazione. a) Dimostriamo che ogni p ∈ A è interno ad A. Esiste un indice i0 ∈ I tale che p ∈ Ai0 . Poiché Ai0 è aperto, p è interno a Ai0 . Quindi esiste r tale che B(p, r) ⊆ Ai0 . Si ha [ B(p, r) ⊆ Ai0 ⊆ Ai . i∈I Quindi p è interno ad A. b) Sia p ∈ ∩ni=1 Ai . Poiché ogni Ai è aperto, per ogni i = 1, . . . , n esiste ri > 0 tale che B(p, ri ) ⊆ Ai . Sia r = mini ri . Allora, per ogni i = 1, . . . , n, si ha B(p, r) ⊆ B(p, ri ) ⊆ Ai . Ne segue B(p, r) ⊆ n \ Ai i=1 e quindi p è interno all’intersezione. In generale l’intersezione di infiniti aperti non è un insieme aperto. Ad esempio, sia Ak = (−1/k, 1), k ∈ N. Si ha ∩∞ k=1 Ak = [0, 1), che non è aperto né chiuso. Teorema 3.5.6 Sia (X, d) uno spazio metrico e {Ai }i∈I una famiglia qualunque di sottoinsiemi chiusi di X. Allora 3.5. Insiemi aperti, chiusi, limitati a) A= \ 61 Ai è chiuso. i∈I b) Se la famiglia è finita, sia essa {A1 , A2 , . . . , An }, allora A= n [ Ai è chiuso. i=1 Dimostrazione. a) Passando ai complementari, si ha che ogni Aci è aperto. Si ha inoltre ´c [ ³\ Ac = Ai = Aci . i∈I i∈I Per il Teorema precedente Ac è aperto e quindi A è chiuso. b) Si dimostra nella stessa maniera. L’unione di infiniti chiusi in generale non è un insieme chiuso. Ad esempio, se Ak = [1/k, 1], ove k ∈ N, si ha ∪∞ k=1 Ak = (0, 1], che non è chiuso né aperto. Definizione 3.5.7 Sia (X, d) uno spazio metrico e sia A ⊆ X. Si chiama chiusura di A l’insieme A = A ∪ A0 . La chiusura di un insieme è il ‘più piccolo’ chiuso che contiene l’insieme, nel senso chiarito dal seguente Teorema. Teorema 3.5.8 Sia (X, d) uno spazio metrico e sia A ⊆ X. a) A è un insieme chiuso. b) Se F è un insieme chiuso tale che F ⊇ A, allora F ⊇ A. c) Se A è chiuso, allora A = A. d Se A ⊇ B, allora A ⊇ B. Dimostrazione. a) Mostriamo che ogni punto di accumulazione di A appartiene a A. Se p è un punto di accumulazione per A ∪ A0 , allora p deve essere di accumulazione per almeno uno dei due sottoinsiemi. Se p è di accumulazione per A, allora p ∈ A0 . Se p è di accumulazione per A0 , ogni intorno B(p, r) deve contenere un punto x ∈ A0 . Poiché B(p, r) è aperto, esiste s > 0 tale che B(x, s) ⊂ B(p, r). Poiché B(x, s) contiene infiniti punti di A, lo stesso vale per B(p, r). Quindi, di nuovo, p ∈ A0 . b) I punti di accumulazione di A sono anche punti di accumulazione di F . Poiché F è chiuso, si ha F ⊇ A ∪ A0 . c) Segue da b). d) Poiché A ⊇ B, la tesi segue da a) e b). 62 3. Spazi Metrici Esempi 3.5.9 ˙ oppure A = [a, b), oppure A = (a, b]. Per tutti questi 1. In R sia A = (a, b), intervalli si ha A = [a, b]. 2. Sia A = {1, 1/2, . . . , 1/n, . . .} ⊂ R. Si ha A = A ∪ {0} . 3. In Rn si ha (si confronti con l’esempio 3.5.3.5) B(p, r) = {x ∈ Rn : ||p − x|| ≤ r} . 4. Se A = Q, si ha Q = R. Nel capitolo I abbiamo definito la nozione di sottoinsieme limitato di R mediante la relazione d’ordine per i numeri reali. Benché uno spazio metrico generico non sia un insieme ordinato, il concetto di insieme limitato si può definire mediante la distanza. In R, dotato della metrica euclidea, la definizione metrica che ora enunciamo è coerente con la definizione basata sull’ordinamento. Definizione 3.5.10 Sia (X, d) uno spazio metrico e sia A ⊆ X, A non vuoto. Si dice diametro di A la quantità diam A = sup d(x, y). x,y∈A Se diam A < +∞, si dice che A è limitato. Esempi 3.5.11 1. Nel caso di figure geometriche elementari, piane o spaziali, il diametro appena definito coincide con la usuale nozione di diametro. 2. Sia A ⊂ R non vuoto e limitato, sia superiormente che inferiormente. Allora diam A = sup A − inf A. Quindi A è limitato anche secondo la nuova definizione. 3. In uno spazio metrico discreto il diametro di qualunque insieme con almeno due punti è 1. Teorema 3.5.12 Sia (X, d) uno spazio metrico e sia A ⊆ X non vuoto. Allora a) diam A = 0 se e solo se A è un singleton. b) Se A ⊆ B allora diam A ≤ diam B. c) diam A = diam A. 3.5. Insiemi aperti, chiusi, limitati 63 Dimostrazione. a) Se A = {x}, ovviamente il diametro di A è zero. Viceversa, se A contiene due punti distinti x e y, si ha diam A ≥ d(x, y) > 0. b) Se x e y sono punti di A ⊆ B, si ha d(x, y) ≤ diam B. Passando all’estremo superiore, si ha l’asserto. c) Per il punto b) si ha diam A ≤ diam A. Se diam A = +∞, si ha diam A = +∞. Supponiamo quindi A limitato e dimostriamo che diam A ≤ diam A. Siano x, y ∈ A. Per ogni ε > 0 esistono a, b ∈ A tali che d(x, a) < ε, d(y, b) < ε. Infatti, se x ∈ A basta scegliere a = x; se x ∈ A0 , si sceglie a ∈ A ∩ B(x, ε). Lo stesso vale per b. Si ha, applicando due volte la diseguaglianza triangolare, d(x, y) ≤ d(x, a) + d(a, b) + d(b, y) < d(a, b) + 2ε ≤ diam A + 2ε. Quindi diam A + 2ε maggiora tutti i numeri d(x, y). Passando all’estremo superiore si ha ∀ε > 0 diam A ≤ diam A + 2ε. Per l’arbitrarietà di ε segue la tesi. Infine, osserviamo che, aggiungendo un numero finito di punti a un insieme limitato, si ottiene ancora un insieme limitato. Teorema 3.5.13 Sia (X, d) uno spazio metrico e sia A ⊆ X non vuoto e limitato. Sia {x1 , x2 , . . . , xn } ⊆ X un insieme finito. Allora B = A ∪ {x1 , x2 , . . . , xn } è limitato. Dimostrazione. Possiamo supporre n = 1. Ripetendo n volte il ragionamento si ottiene il caso generale. Fissiamo un qualunque punto x ∈ A e poniamo δ = d(x1 , x). Si ha, per ogni y ∈ A, d(x1 , y) ≤ d(x1 , x) + d(x, y) < δ + diam A. Ne segue diam B ≤ δ + diam A. Con la analoghi ragionamenti si dimostra che l’unione di due insiemi limitati è ancora limitata. 64 3. Spazi Metrici 3.6 Compattezza Definizione 3.6.1 Sia (X, d) uno spazio metrico e sia E ⊆ X. Sia {Ai }i∈I una famiglia qualunque di sottoinsiemi aperti di X. Diciamo che la famiglia {Ai }i∈I è una copertura aperta di E se E⊆ [ Ai . i∈I Esempi 3.6.2 ∞ 1. La famiglia {An }n=3 degli intervalli An = (1/n, 1 − 1/n) costituisce una copertura aperta dell’intervallo E = (0, 1). In questo caso la famiglia è numerabile. 2. La famiglia {Ax }x∈[0,1] degli intervalli Ax = (x − 1/2, x + 1/2) costituisce una copertura aperta dell’intervallo E = [0, 1]. In questo caso la famiglia è indicizzata mediante [0, 1] stesso. 3. Se E ⊆ R2 non è vuoto, la famiglia {Qp }p∈E dei quadrati aperti di lato 1, centrati nei punti p ∈ E, è una copertura aperta di E. In questo caso la famiglia è indicizzata con i centri, cioè i punti di E. E Alcuni quadrati della copertura di E Data una copertura aperta {Ai }i∈I di E, indicheremo con {Ai1 , Ai2 , . . . , Ain } una sottofamiglia finita di {Ai }i∈I . Definizione 3.6.3 Una sottocopertura finita estratta dalla copertura aperta {Ai }i∈I di E è una sottofamiglia finita {Ai1 , Ai2 , . . . , Ain } tale che E⊆ n [ k=1 Aik . 3.6. Compattezza 65 © ª Nell’esempio 3.6.2.2 precedente, la famiglia A0 , A1/2 , A1 è una sottocopertura finita estratta dalla copertura {Ax }x∈[0,1] di E. Infatti [0, 1] ⊂ (−1/2, 1/2) ∪ (0, 1) ∪ (1/2, 3/2). Definizione 3.6.4 Sia (X, d) uno spazio metrico. Un insieme E ⊆ X si dice compatto se da ogni copertura aperta di E si può estrarre una sottocopertura finita. Esempi 3.6.5 1. Sia (X, d) uno spazio metrico e sia E = {x} un singleton. Si vede facilmente che E è compatto. Infatti, sia {Ai }i∈I una copertura aperta di E. Allora x ∈ ∪i∈I Ai . Quindi esiste un insieme Ai1 della famiglia tale che x ∈ Ai1 . In questo caso la sottofamiglia {Ai1 } costituita dal singolo aperto Ai1 è una sottocopertura finita di E. Analogamente, se E = {x1 , x2 } ha due elementi, e se {Ai }i∈I è una copertura aperta di E, devono esistere Ai1 e Ai2 tali che x1 ∈ Ai1 , x2 ∈ Ai2 . Quindi {x1 , x2 } ⊆ Ai1 ∪ Ai2 . La famiglia {Ai1 , Ai2 } è una sottocopertura finita di E. In modo analogo si dimostra che ogni insieme finito in X è compatto. 2. Sia E = (0, 1) e siano An = (1/n, 1−1/n) gli insiemi della copertura aperta ∞ di E dell’esempio 3.6.2.1. Dalla famiglia {An }n=3 non si può estrarre nessuna sottocopertura finita. Infatti n [ Ak k=3 non contiene i punti degli intervalli (0, 1/n) e (1 − 1/n, 1). Quindi (0, 1) non è compatto. 3. Sia (X, d) metrico discreto e sia E ⊆ X infinito. Allora E non è compatto. Infatti, {B(x, 1/2)}x∈E è una copertura aperta di E. Ogni insieme della copertura è il singleton {x}. Quindi nessuna sottofamiglia finita può essere una sottocopertura di E. Teorema 3.6.6 Sia (X, d) uno spazio metrico e sia E ⊆ X non vuoto. Se E è compatto, allora: a) E è limitato. b) E è chiuso. 66 3. Spazi Metrici c) Per ogni sottoinsieme infinito A ⊆ E, si ha A0 6= ∅. Dimostrazione. a) Consideriamo la copertura aperta di E costituita dagli intorni di raggio 1 dei punti di E, cioè. {B(p, 1)}p∈E . Per la compattezza di E si può estrarre una sottocopertura finita. Quindi esistono n punti di E, siano essi p1 , p2 , . . . , pn , tali che la famiglia {B(p1 , 1), B(p2 , 1) . . . , B(pn , 1)} è una sottocopertura finita, cioè n [ E⊆ B(pk , 1). k=1 Poniamo δ = max {d(pi , pj ) : 1 ≤ i, j ≤ n} . Siano x, y ∈ E. Esistono due centri pi e pj tali che d(x, pi ) < 1, d(y, pj ) < 1. Ne segue d(x, y) ≤ d(x, pi ) + d(pi , pj ) + d(pj , y) < 2 + δ. Quindi diam E ≤ 2 + δ. b) Dimostriamo che E c è aperto. Sia y ∈ E c e poniamo, per ogni p ∈ E, r(p) = 1 d(y, p) > 0. 3 La famiglia di tutti gli intorni B(p, r(p)) è una copertura aperta di E. Per la compattezza di E, si può estrarre una sottocopertura finita. Quindi esistono n punti di E, siano essi p1 , p2 , . . . , pn , tali che E⊆ n [ B(pk , r(pk )). k=1 Sia r = mink r(pk ). Per ogni x ∈ E esiste pk tale che d(pk , x) < r(pk ). Quindi d(y, x) ≥ d(y, pk ) − d(pk , x) > 3r(pk ) − r(pk ) = 2r(pk ) ≥ 2r. Quindi B(y, r) ∩ E = ∅, cioè y è interno ad Ac . 3.6. Compattezza 67 c) Se, per assurdo, A0 = ∅, nessun p ∈ E è di accumulazione per A. Quindi, per ogni p ∈ E esiste un intorno B(p, r(p)) tale che B (p, r(p)) ∩ A è vuoto o finito. Poiché la famiglia{B (p, r(p))}p∈E è una copertura aperta di E, per la compattezza di E si può estrarre una sottocopertura finita. Quindi esistono n punti di E, siano essi p1 , p2 , . . . , pn , tali che A⊆E⊆ n [ B(pk , r(pk )). (3.6.7) k=1 L’unione a destra in (3.6.7) può contenere al più un numero finito di elementi di A, contro l’ipotesi che A sia infinito. Si noti che se E è compatto e A ⊆ E, ogni punto di accumulazione di A è anche punto di accumulazione di E. Poiché E è chiuso, A0 ⊆ E. In generale, un sottoinsieme chiuso e limitato non è necessariamente compatto. Ad esempio, sia (X, d) uno spazio metrico discreto e sia X infinito. Allora, X è chiuso e limitato, ma non compatto. La proprietà c) è non solo necessaria, ma anche sufficiente per la compattezza di E. Vale infatti il seguente Teorema, la cui dimostrazione esula però dagli scopi di questo libro. Teorema 3.6.8 Sia (X, d) uno spazio metrico e sia E ⊆ X. Condizione necessaria e sufficiente affinché E sia compatto è che ogni sottoinsieme infinito di E abbia almeno un punto di accumulazione in E. Teorema 3.6.9 Sia (X, d) uno spazio metrico e sia E ⊆ X compatto. Sia F ⊆ E un sottoinsieme chiuso. Allora F è compatto. Dimostrazione. Sia {Ai }i∈I una copertura aperta di F . Denotiamo con F c il complementare di F in X. Poiché [ F ⊆ Ai , i∈I si ha anche E⊆X= [ Ai ∪ F c . i∈I Quindi la famiglia {Ai , F c }i∈I è una copertura aperta di E. Esiste perciò una sottocopertura finita di E estratta da questa famiglia. A questa sottocopertura finita possiamo aggiungere F c , qualora già non vi appartenga. Quindi F ⊆E⊆ n [ k=1 Aik ∪ F c . 68 3. Spazi Metrici Ne segue n [ F ⊆ Ai k . k=1 Corollario 3.6.10 Sia (X, d) uno spazio metrico. Sia E ⊆ X compatto e F ⊆ X chiuso. Allora F ∩ E è compatto. In generale l’intersezione di una successione decrescente di insiemi può essere vuota. Ad esempio, se En = (n, +∞) si ha ∩+∞ n En = ∅. Tuttavia, se gli insiemi sono compatti, l’intersezione della famiglia non può essere vuota. Teorema 3.6.11 Sia (X, d) uno spazio metrico e {En }∞ n=1 un famiglia di compatti in X tali che E1 ⊇ E2 ⊇ · · · ⊇ En ⊇ · · · Allora ∞ \ En 6= ∅. n=1 Dimostrazione. Supponiamo per assurdo che l’intersezione sia vuota. Allora ∞ [ E1 ⊆ X = Enc . n=1 Poichè E1 è compatto e gli Enc sono aperti, esiste una sottofamiglia finita © c ª En1 , Enc 2 , . . . , Enc k tale che E1 ⊆ k [ Enc j . (3.6.12) j=1 Passando ai complementari nella relazione (3.6.12), e tenendo presente che la successione di insiemi è decrescente rispetto all’inclusione, si ha E1c ⊇ k \ Enj = Enk . j=1 Questo è assurdo poichè Enk ⊆ E1 . Terminiamo questo paragrafo con un’osservazione sulla compattezza in un sottospazio di (X, d). Sia Y ⊆ X non vuoto, e sia (Y, dY ) il sottospazio con la metrica indotta da X. Come abbiamo osservato nel paragrafo precedente, un insieme C ⊆ Y è aperto nel sottospazio (Y, dY ) se e solo se esiste un aperto A ⊆ X tale che C = A ∩ Y . Ne segue che Y è compatto come sottoinsieme di X se e solo se Y è compatto nella metrica indotta. 3.7. Il Teorema di Heine–Borel 3.7 69 Il Teorema di Heine–Borel Per il Teorema 3.6.6 del paragrafo precedente, un insieme compatto in uno spazio metrico (X, d) è necessariamente chiuso e limitato. D’altra parte, l’ esempio 3.6.5.3 mostra che un insieme chiuso e limitato non è necessariamente compatto. Tuttavia, in Rn dotato della metrica euclidea le due condizioni si equivalgono. Teorema 3.7.1 (di Heine–Borel) Un insieme E ⊂ Rn è compatto se e solo se è chiuso e limitato. La dimostrazione del Teorema di Heine–Borel è svolta nell’Appendice. Corollario 3.7.2 (Teorema di Bolzano–Weierstrass) Sia A ⊂ Rn un insieme infinito e limitato. Allora A ha almeno un punto di accumulazione. Dimostrazione. Sia δ = diam A < +∞. Fissato p ∈ A, per ogni x ∈ A si ha ||p − x|| ≤ δ. Quindi A ⊆ B(p, δ). Per il Teorema di Heine–Borel l’insieme chiuso e limitato B(p, δ) è compatto. Per il punto c) del Teorema 3.6.6, A0 6= ∅. 3.8 Connessione Definizione 3.8.1 Sia (X, d) uno spazio metrico. Siano A e B sottoinsiemi non vuoti di X. Si dice che A e B sono separati se A ∩ B = ∅, A ∩ B = ∅. Il concetto di separazione è più forte di quello di disgiunzione. Se due insiemi sono separati, essi sono ovviamente disgiunti, ma due insiemi possono essere disgiunti senza essere separati. Esempi 3.8.2 1. Sia A = (a, b) e B = (b, c). I due insiemi sono separati, poiché A = [a, b] non ha punti in comune con B, e B = [b, c] non ha punti comuni con A. 2. Sia A = (a, b) e B = [b, c). I due insiemi non sono separati, pur essendo disgiunti. Infatti A ∩ B = {b}. 3. Se A0 = ∅ e B 0 = ∅, allora A e B sono separati se e solo se sono disgiunti. In particolare, in qualunque spazio metrico (X, d), due insiemi finiti che non hanno punti in comune sono separati. Per lo stesso motivo, in uno spazio metrico discreto due qualunque insiemi disgiunti e non vuoti sono separati. 70 3. Spazi Metrici Definizione 3.8.3 Sia (X, d) uno spazio metrico, e sia E ⊆ X non vuoto. Si dice che E è connesso se non esistono due insiemi A e B non vuoti e separati tali che E = A ∪ B. A B A A A B B B E = A ∪ B non connesso E = A ∪ B connesso I sottoinsiemi connessi di R hanno una semplice caratterizzazione. Teorema 3.8.4 Sia E ⊆ R, dotato della metrica euclidea. L’insieme E è connesso se e solo se E è un singleton oppure un intervallo (di qualsiasi tipo). Dimostrazione. Se E = {p} è un singleton, allora E è connesso. Sia E un intervallo e supponiamo, per assurdo, che esistano A e B non vuoti e separati tali che A ∪ B = E. Siano a ∈ A e b ∈ B, con, ad esempio, a < b. Poiché E è un intervallo, ogni punto di [a, b] appartiene ad A oppure a B. Poniamo p = sup {x : x ∈ A ∩ [a, b]} . Il punto p non può appartenere a B, poiché p appartiene a A, per il Teorema 3.5.4. Quindi p ∈ A. Ne segue p < b e (p, b] ⊆ B. Ma allora p ∈ B, assurdo. Viceversa, supponiamo E connesso. Dimostriamo che se E non è un singleton, allora E deve essere un intervallo. Ragioniamo per assurdo. Se E non è un intervallo devono esistere tre numeri x<z<y tali che x ∈ E, y ∈ E ma z ∈ / E. Poniamo A = (−∞, z) ∩ E, B = E ∩ (z, +∞). A e B non sono vuoti, poiché x ∈ A e y ∈ B. Essi sono separati, poiché lo sono gli intervalli (−∞, z) e (z, +∞). Chiaramente A ∪ B = E. Quindi E non è connesso, assurdo Esempi 3.8.5 1. In ogni spazio metrico (X, d) ogni insieme finito E = {x1 , . . . , xn }, con n ≥ 2, non è connesso. Infatti, basta porre A = {x1 } e B = {x2 , . . . , xn }. Più generalmente, se E ha un punto isolato p, allora non è connesso. Infatti, basta porre A = {p} e denotare con B il complementare di A in E. Il singleton {p} è chiuso, cosicché A ∩ B = ∅. Inoltre, poiché p non può essere di accumulazione per B, si ha A ∩ B = ∅. 3.9. R come spazio metrico 71 2. È intuitivo che ogni poligono convesso nel piano e ogni poliedro convesso nello spazio è connesso. Più in generale, in R2 e in R3 ogni figura convessa (cioè tale che, se contiene due punti, allora contiene anche il segmento che li unisce) è connessa. I cerchi e le sfere sono connessi. Analogamente, ogni intorno circolare in Rn è connesso. 3.9 R come spazio metrico Sia, secondo la definizione del capitolo 1, R = R∪ {−∞, +∞}. In questo paragrafo ci proponiamo di definire una metrica in R, la cui restrizione a R è equivalente, nel senso precisato nell’Appendice, alla metrica euclidea. A questo scopo consideriamo la funzione g(x) = x . 1 + |x| Essa applica biunivocamente R su (−1, 1). Infatti, per ogni y ∈ (−1, 1) l’equazione x y= 1 + |x| ha l’unica soluzione x= y . 1 − |y| In particolare, g è la funzione inversa della funzione f introdotta nel paragrafo 2.7 per dimostrare il Teorema di Cantor. 1 -1 La funzione g(x) = x 1 + |x| Estendiamo g a R ponendo g(+∞) = 1, g(−∞) = −1 Questa estensione applica biunivocamente R su [−1, 1]. 72 3. Spazi Metrici Definizione 3.9.1 Per ogni x, y ∈ R poniamo d∗ (x, y) = |g(x) − g(y)| . È immediato verificare che d∗ è una metrica su R tale che diam R = diam R = d∗ (−∞, +∞) = 2. È interessante notare che se x e p sono due numeri reali non negativi, si ha g(x) = 1 − 1 , x+1 g(p) = 1 − 1 p+1 e quindi ¯ ¯ ¯ 1 1 ¯¯ ¯ d (x, p) = ¯ − . (3.9.2) 1 + x 1 + p¯ In questo caso distanza d∗ è la distanza euclidea tra i reciproci di x + 1 e p + 1. Se p = +∞ e x ≥ 0, allora ∗ 1 . (3.9.3) 1+x Quindi, se x è ‘grande’, la sua distanza da +∞ è ‘piccola’. In modo analogo, se x e p sono numeri reali non positivi si ha ¯ ¯ ¯ 1 1 ¯¯ d∗ (x, p) = ¯¯ − 1 − x 1 − p¯ d∗ (x, +∞) = |1 − g(x)| = e d∗ (x, −∞) = 1/(1 − x). ¡ ¢ Denotiamo con B ∗ (p, ε) gli intorni di p ∈ R nello spazio metrico R, d∗ . Esaminiamo dapprima gli intorni di +∞, supponendo per semplicità ε < 1. Tenendo conto di (3.9.3) si ha ½ ¾ 1 ∗ B (+∞, ε) = x ∈ R+ : < ε ∪ {+∞} 1+x ½ ¾ 1 = x ∈ R+ : − 1 < x ∪ {+∞} . ε Per questo motivo, posto M = 1/ε − 1, gli intervalli reali (M, +∞) (anche con M ≤ 0) vengono chiamati intorni di +∞. Il linguaggio è improprio, visto che si esclude +∞ da questi insiemi, ma è efficace quando si trattano funzioni a valori reali (che non assumono quindi i valori +∞ o −∞). Simmetricamente, gli intervalli reali (−∞, M ) vengono chiamati intorni di −∞. Teorema 3.9.4 Se E ⊆ R è illimitato superiormente, allora +∞ è un punto di accumulazione di E nella metrica d∗ . Se E ⊆ R è illimitato inferiormente, allora −∞ è un punto di accumulazione di E nella metrica d∗ . Dimostrazione. Sia E ⊆ R illimitato superiormente. Poiché nessun numero reale è un maggiorante per E, per ogni M esiste un elemento x ∈ E tale che x > M . Quindi ogni intorno di +∞ contiene un punto di E (ovviamente diverso da +∞). Se E ⊆ R è illimitato inferiormente la dimostrazione è analoga. 3.10. Appendice 3.10 3.10.1 73 Appendice Compattezza in Rn In questo sottoparagrafo dimostriamo il Teorema di Heine–Borel. Iniziamo con due Lemmi. Lemma 3.10.1 Sia I1 ⊇ I2 ⊇ . . . Im ⊇ . . . una successione non crescente di intervalli chiusi e limitati in R. Allora ∞ \ Im 6= ∅. m=1 Dimostrazione. Sia Im = [am , bm ]. Si ha a1 ≤ a2 ≤ . . . am ≤ . . . b1 ≥ b2 ≥ . . . bm ≥ . . . Inoltre, per ogni j e k si ha aj < bk . Infatti, se j ≥ k, si ha [aj , bj ] ⊆ [ak , bk ] e quindi ak ≤ aj < bj ≤ bk . Se j < k si ha ak < bk ≤ bj . Sia z = supj aj . Ogni bk è un maggiorante, per cui z ≤ inf k bk . Per ogni m si ha quindi am ≤ z ≤ bm , cioè z ∈ ∩∞ m=1 Im . Definizione 3.10.2 Siano I1 , I2 , . . . , In intervalli chiusi e limitati in R. Si chiama rettangolo (o rettangolo chiuso) il prodotto cartesiano R = I1 × I2 × . . . × In . Nel piano R è un rettangolo nel senso della geometria elementare, e un parallelepipedo retto nello spazio. Posto Ij = [aj , bj ], il rettangolo R è individuato dai due estremi a = (a1 , a2 , . . . , an ), b = (b1 , b2 , . . . , bn ). Si può anche descrivere come l’insieme R = {x ∈ Rn : a1 ≤ x1 ≤ b1 , a2 ≤ x2 ≤ b2 , . . . , an ≤ xn ≤ bn } . Si ha chiaramente diam R = ka − bk. Il centro c di R è il punto di coordinate c1 = a1 + b1 a2 + b2 an + bn , c2 = , . . . , cn = . 2 2 2 In R2 le due rette x1 = c1 e x2 = c2 dividono R in quattro rettangoli eguali, che hanno in comune a due a due solo punti di frontiera. In R3 i tre piani x1 = c1 , 74 3. Spazi Metrici x2 = c2 e x3 = c3 dividono R in otto parallelepipedi retti eguali, che hanno in comune a due a due solo punti di frontiera. In Rn gli iperpiani xj = cj per j = 1, . . . , n, dividono R in 2n rettangoli chiusi eguali, che hanno in comune a due a due solo punti di frontiera. Ciascuno dei 2n rettangoli chiusi ha diametro ka − bk /2. Lemma 3.10.3 Sia R1 ⊇ R2 ⊇ . . . Rm ⊇ . . . una successione non crescente di intervalli chiusi e limitati in Rn . Allora ∞ \ Rm 6= ∅. m=1 Dimostrazione. Sia Rm = I1,m × I2,m × . . . × In,m . Per l’ipotesi di inclusione si ha I11 ⊇ I12 ⊇ . . . I1m ⊇ . . . I21 ⊇ I22 ⊇ . . . I2m ⊇ . . . ...... In1 ⊇ In2 ⊇ . . . Inm ⊇ . . . Si ha cosı̀, per il Lemma 3.10.1, ∞ \ m=1 Rm = ∞ \ m=1 I1m × ∞ \ m=1 I2m × · · · ∞ \ Inm 6= ∅. m=1 Dimostrazione del Teorema di Heine–Borel. Dimostriamo che ogni sottoinsieme chiuso e limitato E ⊂ Rn è compatto, iniziando dal caso in cui E = R è un rettangolo chiuso di estremi a e b. Supponiamo per assurdo che R non sia compatto. In tal caso esiste una copertura aperta {Ai }i∈I di R da cui non si può estrarre alcuna sottocopertura finita. Dividiamo R in 2n rettangoli mediante gli iperpiani xj = cj , come descritto sopra, e indichiamo con S il generico rettangolo cosı̀ ottenuto. La famiglia {Ai }i∈I è, a maggior ragione, una copertura aperta di ciascuno degli S. Se per ogni S si potesse estrarre da {Ai }i∈I una sottocopertura finita, allora l’unione di tutti gli insiemi di queste 2n famiglie finite conterrebbe R, contro l’ipotesi d’assurdo. Quindi esiste un rettangolo, diciamo R1 , con la stessa proprietà di R : dalla copertura {Ai }i∈I non si può estrarre alcuna sottocopertura finita per R1 . Iteriamo ora il procedimento. Dividiamo R1 in 2n rettangoli chiusi mediante gli iperpiani che passano per il suo centro. Almeno uno di questi rettangoli, sia esso R2 , ha la stessa proprietà di R e R1 : dalla copertura {Ai }i∈I non si può estrarre alcuna sottocopertura finita per R2 . Avendo definito Rm , con il procedimento descritto definamo Rm+1 per ogni intero positivo m. I rettangoli chiusi Rm hanno le seguenti proprietà: 3.10. Appendice 75 a) essi formano una successione decrescente, ossia Rm ⊃ Rm+1 ; b) ogni Rm è tale che dalla copertura aperta {Ai }i∈I non si può estrarre una sottocopertura finita per Rm ; c) diam Rm = 2−m ka − bk. L’ultima proprietà discende dal fatto che ad ogni passo il diametro si dimezza. Per il Lemma 3.10.3, l’intersezione di questa successione di rettangoli non è vuota. Sia z ∈ ∩∞ m=1 Rm . Poiché {Ai }i∈I è una copertura aperta di R, e poiché z ∈ R, deve esistere un insieme Ai0 della famiglia tale che z ∈ Ai0 . Quindi esiste r tale che B(z, r) ⊂ Ai0 . Sia m cosı̀ grande che diam Rm = 2−m ka − bk < r. Si ha, per ogni y ∈ Rm , ° ° °z − y ° ≤ 2−m ka − bk < r. Quindi Rm ⊂ B(z, r) ⊂ Ai0 . Dunque è possibile estrarre da {Ai }i∈I una sottocopertura finita di Rm , costituita da un solo aperto della famiglia, assurdo. R2 R1 R Sia ora E ⊂ Rn un qualsiasi insieme chiuso e limitato. Sia δ = diam E e sia z ∈ E. Poniamo a = (z1 − δ, z2 − δ, . . . , zn − δ) b = (z1 + δ, z2 + δ, . . . , zn + δ) . Sia R il rettangolo chiuso di estremi a e b. Per ogni x ∈ E e per ogni j si ha ³ ´1/2 2 2 2 |xj − zj | ≤ |x1 − z1 | + |x2 − z2 | + . . . + |xn − zn | = kx − zk ≤ δ. Quindi x ∈ R, cioè E ⊆ R. Poiché E è chiuso, E è compatto per il Teorema 3.6.9. 76 3. Spazi Metrici 3.10.2 Norme e distanze La norma euclidea in Rn è un caso particolare della nozione di norma in un insieme dotato di una struttura di spazio vettoriale su un campo che, per semplicità, assumiamo essere il campo reale. Definizione 3.10.4 Sia X uno spazio vettoriale su R. Una funzione, che indicheremo con il simbolo k·k, definita in X a valori reali, si chiama norma su X se gode delle seguenti proprietà: 1. ∀x ∈ X kxk ≥ 0. 2. ∀x ∈ X kxk = 0 3. ∀x ∈ X ∀α ∈ R 4. ∀x, y ∈ X se e solo se x = 0. kαxk = |α| kxk. kx + yk ≤ kxk + kyk. Uno spazio vettoriale dotato di norma si chiama spazio normato, e si indica con (X, k·k). Lo spazio Rn , dotato della norma euclidea è uno spazio normato. Come nel caso della distanza, uno spazio vettoriale a priori può essere dotato di varie norme. Ad esempio, in Rn si hanno le norme kxk∞ = max |xk | , kxk1 = k n X |xk | . (3.10.5) k=1 Le proprietà 1–4 sono facilmente verificate. Un altro esempio di spazio normato è lo spazio X di tutte le funzioni limitate f : [0, 1] → R con la norma kf k∞ = sup |f (x)| . x (3.10.6) Sia (X, k·k) uno spazio normato. Come nel caso euclideo, a partire dalla norma si può definire una distanza su X ponendo ∀x, y ∈ X d(x, y) = kx − yk . Le proprietà della distanza discendono immediatamente da quelle della norma. Le distanze d∞ e d1 negli esempi 3.2.2.3 e 3.2.2.4 sono ottenute in questo modo dalle norme (3.10.5). La distanza nell’esempio 3.2.2.8 è ottenuta mediante la norma (3.10.6). Non ogni distanza si può però definire tramite una norma. Infatti, il procedimento appena descritto richiede che X sia uno spazio vettoriale. Negli esempi 3.2.2.6 e 3.2.2.7 le distanze non sono ottenute tramite una norma. Anche se X è uno spazio vettoriale, si possono definire distanze tali che d(x, 0) non è una norma. Ad esempio, se X = Rn , la metrica discreta non può essere definita tramite una norma. 3.10. Appendice 3.10.3 77 ¡ ¢ Proprietà dello spazio metrico R, d∗ Sia d∗ la metrica in R descritta nel paragrafo 3.9. Confrontiamo gli intorni di un numero reale p nella metrica euclidea e in d∗ , mantenendo la notazione B(p, r) per gli intorni euclidei di p e B ∗ (p, r) per gli intorni nella metrica d∗ . Teorema 3.10.7 Per ogni p ∈ R valgono le proprietà a) ∀s > 0 ∃r > 0 B(p, r) ⊂ B ∗ (p, s) b) ∀r > 0 ∃s > 0 B ∗ (p, s) ⊂ B(p, r). Dimostrazione. a) Innanzi tutto notiamo che la funzione g è strettamente crescente, cioè ∀x, y ∈ R x<y se e solo se g(x) < g(y). Quindi B ∗ (p, s) = {x : |g(x) − g(p)| < s} = {x : g(p) − s < g(x) < g(p) + s} © ª = x : g −1 (g(p) − s) < x < g −1 (g(p) + s) . (3.10.8) Posto a = g −1 (g(p) − s) e b = g −1 (g(p) + s), si ha a < p < b. Sia r tale che a < p − r < p + r < b. Da (3.10.8) si ha B(p, r) = (p − r, p + r) ⊂ (a, b) = B ∗ (p, s). b) Poiché g è strettamente crescente si ha B(p, r) = {x : p − r < x < p + r} = {x : g(p − r) < g(x) < g(p + r)} . (3.10.9) Posto u = g(p − r) e v = g(p + r), si ha u < g(p) < v. Sia s tale che u < g(p) − s < g(p) + s < v. Quindi B ∗ (p, s) = {x : g (p) − s < g(x) < g (p) + s} ⊂ {x : u < g(x) < v} = B(p, r). La restrizione della distanza d∗ a R×R non coincide con la metrica euclidea, ma è ad essa equivalente, nel senso che ogni intorno di p ∈ R in una delle due metriche contiene un intorno nell’altra metrica. 78 3. Spazi Metrici Le due inclusioni a) e b) implicano che, per ogni sottoinsieme E ⊆ R, un punto p è interno, di frontiera, esterno, di accumulazione, isolato secondo una metrica, se e solo se lo è secondo l’altra. Quindi gli insiemi aperti, i chiusi, i compatti, i connessi di R sono gli stessi con le due metriche. La notazione R non è casuale. Infatti, per i Teoremi appena dimostrati, R è effettivamente la chiusura di R nella metrica d∗ . ¡ ¢ Dimostriamo, come ultimo risultato, che, con la metrica d∗ , R, d∗ è una compattificazione di R. ¡ ¢ Teorema 3.10.10 Lo spazio metrico R, d∗ è compatto. Dimostrazione. Assegnata una qualsiasi copertura aperta {Ai }i∈I di R, devono esistere due aperti Ai1 e Ai2 tali che +∞ ∈ Ai1 e −∞ ∈ Ai2 . Questi aperti contengono rispettivamente un intorno di +∞, sia esso (b, +∞] e uno di −∞, sia esso [−∞, a). Il restante intervallo [a, b] è compatto e quindi da {Ai }i∈I si può estrarre sottocopertura finita {Ai3 , Ai4 , . . . Ain } per [a, b]. Ne segue R= n [ k=1 Aik . Capitolo 4 Successioni 4.1 Introduzione La nozione di successione a valori in un insieme X qualunque è stata introdotta nel paragrafo 2.4. D’ora innanzi considereremo esclusivamente successioni a valori in uno spazio metrico, con particolare riguardo agli spazi euclidei. Premettiamo alla trattazione delle successioni e dei loro limiti il concetto di proprietà posseduta definitivamente da una successione. Definizione 4.1.1 Si dice che una successione {xn } possiede definitivamente, o per n abbastanza grande, una proprietà P, se esiste n0 tale che per ogni n ≥ n0 il termine xn gode della proprietà P. Ad esempio, la successione a valori reali 2, 4, 8 , 16, . . . , 2n , . . . (4.1.2) è definitivamente maggiore di 10. Infatti, la proprietà vale per n ≥ n0 = 4. La successione di termine generale xn = n − 2 è definitivamente positiva. In questo caso la proprietà è verificata per n ≥ n0 = 3. La successione xn = (−1)n non è definitivamente positiva, sebbene abbia infiniti termini positivi. Se una successione {xn } possiede definitivamente la proprietà P1 e possiede definitivamente la proprietà P2 , allora essa possiede definitivamente ambedue le proprietà. Infatti, esiste n0 tale che per ogni n ≥ n0 il termine xn gode della proprietà P1 , ed esiste n1 tale che per ogni n ≥ n1 il termine xn gode della proprietà P2 . Per n ≥ max(n0 , n1 ), xn gode di ambedue le proprietà. Ad esempio, il termine generale della successione (4.1.2) è divisibile per 8 se n ≥ n0 = 3. Quindi xn è definitivamente maggiore di 10 e divisibile per otto, per n ≥ max(4, 3) = 4. Questa osservazione si applica anche al caso in cui una successione {xn } possieda definitivamente la proprietà P1 e un’altra successione {yn } possieda definitivamente la proprietà P2 . Per n abbastanza grande, il termine xn gode della proprietà P1 e, allo stesso tempo, il termine yn gode della proprietà P2 . 79 80 4.2 4. Successioni Successioni convergenti Definizione 4.2.1 Sia (X, d) uno spazio metrico e sia {xn } una successione a valori in X. Si dice che la successione (o, semplicemente, xn ) converge a p ∈ X se ∀ε > 0 ∃n0 ∀n ≥ n0 d(xn , p) < ε. (4.2.2) Nella definizione precedente, il numero ε è arbitrario e può essere scelto ‘piccolo a piacere’, mentre n0 è funzione di ε. In generale, come si vedrà dagli esempi, al decrescere di ε il corrispondente n0 diventa sempre più grande. Il simbolo ε in Analisi Matematica è usato quasi esclusivamente per denotare un numero positivo che si può scegliere arbitrariamente piccolo. La definizione di convergenza può essere espressa in modo equivalente adottando la terminologia introdotta nel primo paragrafo: una successione {xn } ⊆ X converge a p ∈ X se, per ogni ε > 0, si ha definitivamente d(xn , p) < ε. Oppure: una successione {xn } ⊆ X converge a p ∈ X se, per ogni ε > 0, si ha definitivamente xn ∈ B(p, ε). x1 x2 x3 p xn x4 La proprietà di separazione di Hausdorff implica che una successione non può convergere a due punti diversi. Teorema 4.2.3 (di unicità del limite) Sia (X, d) uno spazio metrico e {xn } una successione a valori in X. Se la successione converge sia p1 che a p2 , allora p1 = p2 . Dimostrazione. Sia per assurdo p1 6= p2 . Per il Teorema 3.3.4 esiste r > 0 tale che B(p1 , r) ∩ B(p2 , r) = ∅. Poiché la successione converge a p1 , definitivamente xn ∈ B(p1 , r). Analogamente, poiché la successione converge a p2 , definitivamente xn ∈ B(p2 , r). Quindi definitivamente deve essere xn ∈ B(p1 , r) ∩ B(p2 , r) = ∅, assurdo. 4.2. Successioni convergenti 81 Definizione 4.2.4 Sia (X, d) uno spazio metrico e sia {xn } una successione a valori in X. Se la successione converge a p ∈ X, si dice che p è il limite di xn per n che tende a +∞. Si scrive lim xn = p, n→+∞ o anche xn → p per n → +∞. Esempi 4.2.5 1. Sia X = R e xn = 1/n. Allora limn→+∞ 1/n = 0. Infatti, per ogni ε > 0 sia n0 un qualunque intero tale che n0 > 1/ε. Allora si ha, per ogni n ≥ n0 , ¯ ¯ ¯1 ¯ 1 1 d (xn , 0) = ¯¯ − 0¯¯ = ≤ < ε. n n n0 In maniera del tutto analoga si dimostra che 1/nα converge a 0 per ogni α > 0. µ ¶ 1 1 2. Sia X = R2 e xn = √ , 2 − √ . Allora limn→+∞ xn = (0, 2). Infatti, n n °¡ √ ° √ ¢ ° 1/ n, 2 − 1/ n − (0, 2)° = r 1 1 + = n n r 2 . n Per ogni ε > 0 sia n0 un intero tale che n0 > 2/ε2 . Per ogni n ≥ n0 si ha r 2 < ε. n 3. In un qualsiasi spazio metrico, se una successione è definitivamente eguale a una costante p, allora xn converge a p. Infatti, si ha definitivamente d(xn , p) = 0. Viceversa, in uno spazio metrico discreto le uniche successioni convergenti sono le successioni definitivamente costanti. Basta infatti scegliere ε ≤ 1 nella definizione di convergenza. Se xn appartiene definitivamente B(p, ε), allora definitivamente xn = p. 4. Consideriamo in R la successione {xn } delle troncate n-esime del numero 1/3 = 0, 33333 . . . = 0, 3 0, 3, 0, 33, 0, 333, 0, 3333, . . . , 0, 3333333 | {z } , . . . n cifre 82 4. Successioni Si ha xn → 1/3 per → +∞. Infatti ¯ ¯ ¯0, 3 − xn ¯ = 0, 3 − xn = 0, 3 − 0, 3333333 | {z } n cifre −n = 0, |00 .{z . . 00} 3 = 1/3 · 10 . n zeri Per ogni ε > 0 sia n0 tale che n0 > 1/3ε. Per n ≥ n0 risulta 0, 3 − xn = 1 1 1 · 10−n ≤ · 10−n0 < < ε. 3 3 3n0 Allo stesso modo si dimostra che le troncate n-esime della rappresentazione decimale di un qualunque numero reale convergono al numero stesso. 5. La successione di termine generale xn = (−1)n non è convergente. Infatti, posto ad esempio ε = 1/2, xn non appartiene definitivamente a B(−1, 1/2), poiché tutti gli elementi di indice pari non vi appartengono. Un analogo ragionamento mostra che xn non appartiene definitivamente a B(1, 1/2). È pure chiaro che xn non appartiene definitivamente a B(p, 1/2) per nessun p ∈ R. Si noti che in un qualunque spazio metrico (X, d) una successione {xn } converge a p ∈ X se e solo se la successione dei numeri reali non negativi {d(xn , p)} converge a 0. Infatti, la condizione (4.2.2), che esprime la convergenza di xn a p, esprime anche la convergenza di d(xn , p) a 0 in R. Definizione 4.2.6 Sia (X, d) uno spazio metrico e sia {xn } una successione a valori in X. Si dice che la successione è limitata se la sua immagine {xn } è limitata in X. Ad esempio, la successione (4.1.2) non è limitata, mentre le successioni {1/n} e {(−1)n } sono limitate. Teorema 4.2.7 Sia (X, d) uno spazio metrico e sia {xn } una successione a valori in X. Se la successione è convergente, allora è limitata. Dimostrazione. Sia p il limite della successione e si scelga ε = 1 nella definizione di convergenza. Esiste n0 tale che per ogni n ≥ n0 si ha xn ∈ B(p, 1). Ne segue che l’insieme dei valori della successione a partire da n0 ha diametro non superiore a 2. Per il Teorema 3.5.13 del capitolo 3, {xn } è un insieme limitato. Teorema 4.2.8 Sia (X, d) uno spazio metrico e sia A ⊆ X. Se p è un punto di accumulazione di A, allora esiste una successione di punti xn ∈ A, xn 6= p, convergente a p. 4.3. Sottosuccessioni e punti di accumulazione 83 Dimostrazione. Poiché B(p, r) ∩ A è infinito per ogni r > 0, assegnando a r successivamente i valori 1, 1/2, 1/3, . . . , 1/n, . . ., troviamo successivamente punti x1 , x2 , . . . , xn , . . . tali che x1 ∈ A e d(x1 , p) < 1, x2 ∈ A e d(x2 , p) < 1/2, ......... xn ∈ A e d(xn , p) < 1/n, ......... La successione {xn } cosı̀ ottenuta converge a p. Infatti, per ogni ε > 0 sia n0 un intero tale che n0 > 1/ε. Per ogni n ≥ n0 si ha d(xn , p) < 4.3 1 1 ≤ < ε. n n0 Sottosuccessioni e punti di accumulazione Definizione 4.3.1 Sia (X, d) uno spazio metrico e sia {xn } una successione a valori in X. Sia n1 < n2 < n3 < · · · < nk < · · · (4.3.2) una qualsiasi successione crescente di interi positivi. Si chiama sottosuccessione di {xn } la successione xn1 , xn2 , xn3 , . . . , xnk , . . . Esempi 4.3.3 1. Sia n1 = 2, n2 = 4, . . . , nk = 2k, . . .. La sottosuccessione corrispondente è la successione dei termini di indice pari x2 , x4 , x6 , . . . , x2k , . . . Per esempio, se xn = (−1)n , la sottosuccessione {x2k } è la successione costante 1, 1, 1, 1, . . . 2. Siano n1 = 1, n2 = 4, n3 = 9, n4 = 16, . . . , nk = k 2 , . . . La sottosuccessione corrispondente è la successione degli elementi il cui indice è un quadrato x1 , x4 , x9 , x16 . . . , xk2 , . . . Per esempio, se xn = 1/n, la sottosuccessione {xk2 } è la successione 1, 1/4, 1/9, 1/16, . . . 84 4. Successioni Si noti che una sottosuccessione {xnk } non è altro che la restrizione della successione {xn } al sottoinsieme infinito {n1 , n2 , n3 , . . . , nk , . . .}. Poiché una sottosuccessione {xnk } è a sua volta una successione (dipendente dall’indice k), ci si può interrogare sulla convergenza di xnk per k → +∞. Questo studio sarà condotto in maggiore dettaglio nel paragrafo sulla classe limite. Per il momento ci limitiamo a notare il seguente teorema. Teorema 4.3.4 Sia (X, d) uno spazio metrico e sia {xn } una successione a valori in X. Se xn converge a p ∈ X, allora ogni sua sottosuccessione converge allo stesso limite. Dimostrazione. Sia {xnk } una sottosuccessione di {xn }. Sia ε > 0 arbitrario. Poiché xn è convergente, esiste un intero n0 tale che per ogni n ≥ n0 si ha d(xn , p) < ε. Poiché la successione degli indici in (4.3.2) è crescente, esiste k0 tale che nk0 > n0 . Per i successivi valori di k, a maggior ragione si ha nk > n0 . Ne segue d(xnk , p) < ε per k ≥ k0 . In altri termini, xnk → p per k → +∞. Sia p un punto di accumulazione di una successione {xn }. Per il Teorema 4.2.8, esiste una successione di punti dell’insieme A = {xn } convergente a p. Questi punti possono essere scelti in modo da formare una sottosuccessione di {xn }. Teorema 4.3.5 Sia (X, d) uno spazio metrico e sia {xn } una successione a valori in X. Se p è un punto di accumulazione di {xn }, allora esiste una sottosuccessione {xnk } convergente a p. Dimostrazione. La dimostrazione è simile a quella del Teorema 4.2.8, ove si ponga A = {xn }. In questo caso si devono però scegliere i punti di A in modo da rispettare la condizione (4.3.2). Sia xn1 un elemento della successione tale che xn1 ∈ B(p, 1). Poiché B(p, 1/2) contiene infiniti elementi della successione, deve esistere n2 > n1 tale che xn2 ∈ B(p, 1/2). Analogamente, poiché B(p, 1/3) contiene infiniti elementi della successione, deve esistere esiste n3 > n2 tale che xn3 ∈ B(p, 1/3). Con questo procedimento si definisce xnk per induzione: poiché B(p, 1/k) contiene infiniti elementi della successione, esiste nk > nk−1 tale che xnk ∈ B(p, 1/k). La sottosuccessione {xnk } converge chiaramente a p. Corollario 4.3.6 Sia (X, d) uno spazio metrico, sia E ⊆ X un insieme compatto e sia {xn } una successione a valori in E. Allora {xn } ha almeno una sottosuccessione convergente. Dimostrazione. Se il coinsieme {xn } è infinito, allora esso ha almeno un punto di accumulazione, per il punto c) del Teorema 3.6.6. In questo caso la tesi segue dal Teorema 4.3.5. Se xn assume solo un numero finito di valori, allora almeno uno dei valori, sia esso p, deve corrispondere a infiniti indici n1 < n2 < . . . nk < . . .. Si ha cosı̀ la sottosuccessione costante (e quindi convergente) xnk = p per ogni k. 4.4. Successioni a valori reali 4.4 85 Successioni a valori reali Sia, qui e nel seguito, {xn } una successione a valori reali. La nozione di convergenza in R con la metrica euclidea assume la seguente forma: xn converge a p ∈ R se per ogni ε > 0 esiste n0 tale che per ogni n ≥ n0 |xn − p| < ε. (4.4.1) Le seguenti affermazioni sono quindi equivalenti per n → +∞: xn → p, |xn − p| → 0, xn − p → 0. In particolare, xn → 0 se e solo se |xn | → 0. La diseguaglianza (4.4.1) equivale alle due seguenti diseguaglianze p − ε < xn < p + ε. Può accadere che una successione convergente verifichi definitivamente la più forte diseguaglianza p ≤ xn < p + ε, (4.4.2) oppure p − ε < xn ≤ p. (4.4.3) Ad esempio, xn = 1/n verifica definitivamente (4.4.2) con p = 0, mentre xn = 1 − 1/n verifica definitivamente (4.4.3) con p = 1. Siamo cosı̀ condotti alla seguente definizione. Definizione 4.4.4 Sia {xn } una successione a valori reali convergente a p. Si dice che la successione converge a p per eccesso o dalla destra, se ∀ε > 0 ∃n0 ∀n ≥ n0 p ≤ xn < p + ε. Analogamente, si dice che la successione converge a p per difetto, o dalla sinistra, se ∀ε > 0 ∃n0 ∀n ≥ n0 p − ε < xn ≤ p. Se xn converge a p dalla destra si scrive lim xn = p + , n→+∞ o anche xn → p + per n → +∞. Se xn converge a p dalla sinistra si scrive lim xn = p − , n→+∞ o anche xn → p − per n → +∞. Secondo queste definizioni, limn→+∞ 1/n = 0+ e limn→+∞ (1 − 1/n) = 1−. Invece, la successione xn = (−1)n /n converge a 0, ma non converge né dalla destra né dalla sinistra. La nozione di successione limitata del precedente paragrafo nel caso reale può essere ulteriormente precisata. 86 4. Successioni Definizione 4.4.5 Diremo che una successione a valori reali è limitata superiormente (oppure inferiormente) se la sua immagine {xn } è limitata superiormente (rispettivamente, inferiormente). Chiameremo estremo superiore, inferiore, massimo, minimo della successione l’estremo superiore, inferiore, il massimo (se esiste), il minimo (se esiste) dell’immagine {xn }. Per il Teorema 4.2.7 ogni successione reale convergente è limitata sia inferiormente che superiormente. Tuttavia, il concetto di limite può essere esteso per caratterizzare il comportamento ‘regolare’ di alcune successioni reali illimitate. Definizione 4.4.6 Sia {xn } una successione a valori reali. Si dice che la successione diverge a +∞ se ∀M ∃n0 ∀n ≥ n0 xn > M . (4.4.7) Analogamente, dice che la successione diverge a −∞ ∀M ∃n0 ∀n ≥ n0 xn < M . (4.4.8) Se xn diverge a +∞ si scrive lim xn = +∞, n→+∞ o anche xn → +∞ per n → +∞. Se xn diverge a −∞ si scrive lim xn = −∞, n→+∞ o anche xn → −∞ per n → +∞. Nella definizione di divergenza a +∞, il numero M è arbitrario e può essere scelto positivo ‘grande a piacere’, mentre n0 è funzione di M . In generale, al crescere di M anche n0 cresce. Analoga osservazione per la divergenza a −∞: in questo caso M può essere scelto negativo e di valore assoluto grande a piacere. Dalla definizione risulta chiaro che xn diverge a +∞ se e solo se −xn diverge a −∞. Esempi 4.4.9 √ 1. La successione di termine generale xn = n diverge √ a√+∞. Infatti, per 2 ogni M > 0 sia n0 > M . Per ogni n ≥ n0 si ha n ≥ n0 > M . In modo analogo si dimostra che tutte le successioni {nα }, ove α > 0, divergono a +∞. 2. Sia {xn } la successione −1, 2, −3, 4, . . . , (−1)n n, . . . Questa successione, benché illimitata, non è divergente, né a −∞, né a +∞. Infatti, qualunque sia M > 0, essa non soddisfa definitivamente la diseguaglianza xn > M , né la diseguaglianza xn < −M 4.5. Permanenza del segno. Confronto 87 Una successione divergente a +∞ è illimitata superiormente ed è definitivamente positiva. Una successione divergente a −∞ è illimitata inferiormente ed è definitivamente negativa. Ne segue che una successione divergente a +∞ non può divergere a −∞ e non può convergere. Analogamente una successione divergente a −∞ non può divergere a +∞ e non può convergere. Infine, una successione convergente non può divergere. In altri termini, anche con l’introduzione dei limiti +∞ e −∞, il limite di una successione reale, se esiste, è unico. Definizione 4.4.10 Sia {xn } una successione a valori reali. Si dice che {xn } è r egolare se essa ammette limite (finito o infinito). Altrimenti si dice irregolare od oscillante. Vale per il limiti infiniti l’analogo del Teorema 4.3.4 Teorema 4.4.11 Sia {xn } una successione a valori reali. Se xn diverge a +∞, allora ogni sua sottosuccessione diverge a +∞. Se xn diverge a −∞, allora ogni sua sottosuccessione diverge a −∞. Dimostrazione. La dimostrazione è del tutto analoga a quella del Teorema 4.3.4. Basta sostituire all’intorno B(p, ε) l’intervallo (M, +∞) nel caso della divergenza a −∞, e (−∞, M ) nel caso della divergenza a −∞. Nel paragrafo 3.9 è stata introdotta una metrica d∗ in R. Nello spazio metrico (R, d∗ ) le successioni divergenti a +∞ o −∞ sono esattamente le successioni che tendono a questi limiti, secondo la definizione del paragrafo 4.1. 4.5 Permanenza del segno. Confronto Sia {xn } una successione reale convergente a p. Per la definizione di limite, assegnato un qualunque intervallo (a, b) tale che p ∈ (a, b), si ha definitivamente xn ∈ (a, b). Questa osservazione permette di mettere in relazione il segno di xn e quello di p. Teorema 4.5.1 (di permanenza del segno) Sia {xn } una successione reale convergente a p. a) Se p > 0, allora definitivamente xn > 0. b) Se p < 0, allora definitivamente xn < 0. c) Se definitivamente xn ≥ 0, allora p ≥ 0. d) Se definitivamente xn ≤ 0, allora p ≤ 0. Dimostrazione. Sia ε > 0 tale che p − ε > 0. Per la definizione di convergenza si ha definitivamente 0 < p − ε < xn < p + ε. Quindi a) è vera. La dimostrazione di b) è analoga. 88 4. Successioni Supponiamo che definitivamente valga xn ≥ 0. Allora non può valere p < 0, altrimenti, per il punto b), si avrebbe definitivamente xn < 0. Quindi c) è vera. In modo analogo si dimostra d). Si noti che c) e d) non sono le inverse di a) e b). Anche nella più forte ipotesi xn > 0, non si può dedurre p > 0. Basta infatti considerare l’esempio della successione xn = 1/n. Teorema 4.5.2 (del confronto; convergenza) Siano {xn },{yn } e {zn } tre successioni reali tali che: i) xn e yn convergono allo stesso limite p; ii) definitivamente xn ≤ zn ≤ yn . Allora zn converge a p. Dimostrazione. Sia ε > 0 fissato ad arbitrio. Per l’ipotesi i) definitivamente valgono ambedue le diseguaglianze p − ε < xn < p + ε; p − ε < yn < p + ε. (4.5.3) (4.5.4) Quindi, per l’ipotesi ii), (4.5.3) e (4.5.4), si ha definitivamente p − ε < xn ≤ zn ≤ yn < p + ε. Ne segue che definitivamente vale p − ε < zn < p + ε e quindi la tesi. Teorema 4.5.5 (del confronto; divergenza) Siano {xn } e {yn } due successioni reali tali che definitivamente xn ≤ yn . Allora: a) se xn diverge a +∞ anche yn diverge a +∞; b) se yn diverge a −∞ anche xn diverge a −∞. Dimostrazione. Ci limitiamo a dimostrare a), dato che la dimostrazione di b) è analoga. Sia M fissato ad arbitrio. Definitivamente si ha xn > M . Poiché definitivamente yn ≥ xn , definitivamente si ha yn > M . Quindi yn diverge a +∞. Esempi 4.5.6 1. Sia {xn } tale che limn→+∞ xn = 0. Dimostriamo che lim sin xn = 0, n→+∞ lim cos xn = 1 − . n→+∞ Possiamo supporre xn ≥ 0, poiché sin(−xn ) = − sin xn e cos(−xn ) = cos xn . 4.5. Permanenza del segno. Confronto 89 Sia x un angolo (in radianti) tale che 0 < x < π/2. Nel cerchio di centro o e raggio 1 si consideri il triangolo di vertici o, p, r e il settore circolare con gli stessi vertici. Indichiamo con T1 e S rispettivamente le loro aree. Si ha 1 1 T1 = sin x, , S = x. 2 2 Quindi 0 < sin x < x. Sostituendo xn a x si ha limn→+∞ sin xn = 0 per il Teorema 4.5.2. La seconda relazione di limite si ottiene dalla prima e dal Teorema del confronto 4.5.2. Si ha infatti, sempre per 0 < x < π/2, 0 < 1 − cos x < 1 − cos2 x = sin2 x < sin x. Quindi limn→+∞ cos xn = 1−. 2. Sia yn = n2 − n. Per n ≥ 2 si ha ³ 1 ´ n2 ≥ . yn = n2 1 − n 2 Posto xn = n2 /2, chiaramente xn → +∞. Per il Teorema 4.5.5 si ha limn→+∞ (n2 − n) = +∞. 1 tan(x) q p sin(x) x o r Dimostriamo una relazione di limite notevole con l’aiuto del Teorema 4.5.2. Teorema 4.5.7 Sia {xn } una successione tale che xn 6= 0 e limn→+∞ xn = 0. Allora sin xn =1−. (4.5.8) lim n→+∞ xn 90 4. Successioni Dimostrazione. Poiché sin (−xn ) sin xn = , −xn xn possiamo supporre xn > 0. Sia 0 < x < π/2. Nel cerchio di centro o e raggio 1 si consideri il triangolo di vertici o, p, r, il triangolo rettangolo di vertici o, q, r e il settore circolare di vertici o, p, r. Indichiamo con T1 , T2 e S rispettivamente le loro aree. Si ha 1 1 1 T1 = sin x, T2 = tan x, S = x. 2 2 2 Poiché T1 < S < T2 , otteniamo le diseguaglianze sin x < x < tan x, da cui sin x < 1. x Sostituendo xn a x, e ricordando che limn→+∞ cos xn = 1, si ottiene la relazione (4.5.8) dal Teorema del confronto. cos x < 4.6 Successioni monotone Definizione 4.6.1 Sia {xn } una successione a valori reali. Si dice che la successione è: a) monotona crescente in senso lato, o non decrescente, se ∀n xn ≤ xn+1 ; b) monotona crescente in senso stretto, se ∀n xn < xn+1 ; c) monotona decrescente in senso lato, o non crescente, se ∀n xn ≥ xn+1 ; d) monotona decrescente in senso stretto se ∀n xn > xn+1 . √ Ad esempio, la successione { n} è monotona crescente in senso stretto, mentre la successione 1, 1, 2, 2, . . . , n, n . . . è crescente in senso lato, ma non in senso stretto. La successione (−1)n non è monotona. È altresı̀ chiaro che, se {xn } è crescente (in senso lato o stretto), allora {−xn } è decrescente (in senso lato o stretto, rispettivamente). Inoltre, una successione è allo stesso tempo monotona non decrescente e monotona non crescente se e solo se è costante. La rilevanza delle successioni monotone deriva dal fatto che esse sono regolari. 4.7. Calcolo dei limiti 91 Teorema 4.6.2 Ogni successione monotona {xn } è regolare. Se {xn } è monotona crescente (in senso lato o stretto), allora lim xn = sup {xn } . n→+∞ (4.6.3) Se {xn } è monotona decrescente (in senso lato o stretto), allora lim xn = inf {xn } . n→+∞ (4.6.4) Dimostrazione. Dimostriamo (4.6.3), distinguendo tra il caso in cui l’estremo superiore è finito e quello in cui è infinito. Sia dapprima L = sup {xn } < +∞. Per ogni ε > 0 il numero L − ε non è un maggiorante della successione. Esiste quindi xn0 , tale che L − ε < xn0 ≤ L. Poichè xn è non decrescente, si ha, per ogni n ≥ n0 , L − ε < xn0 ≤ xn ≤ L. Quindi xn → L− per n → +∞. Sia ora supn {xn } = +∞. Poiché la successione non ha maggioranti, per ogni M esiste xn0 tale che M < xn0 . Poiché xn è non decrescente, si ha, per ogni n ≥ n0 , M < xn0 ≤ xn . Quindi xn → +∞ per n → +∞. La dimostrazione di (4.6.4) è del tutto analoga. 4.7 Calcolo dei limiti Siano {an } e {bn } due successioni a valori reali. A partire da esse si possono definire delle nuove successioni, eseguendo su an e bn le operazioni di somma, prodotto, quoziente (se bn 6= 0), elevamento a potenza (se an > 0), passaggio al logaritmo (se an > 0, an 6= 1, bn > 0). Otteniamo cosı̀ le successioni di termine generale an an + bn , an bn , , abnn , logan bn (4.7.1) bn Dimostreremo che, se an e bn sono regolari, allora anche le successioni in (4.7.1) sono regolari, salvo le eccezioni che verranno esplicitamente indicate nel seguito (le cosiddette forme di indecisione). Dimostreremo inoltre che, escludendo le suddette eccezioni, il limite delle successioni (4.7.1) si ottiene eseguendo sui limiti di an e bn la stessa operazione eseguita sui termini generali. In altre parole, il limite della somma è la somma dei limiti, il limite del prodotto è il prodotto dei limiti etc. Tuttavia, se uno o ambedue questi limiti sono infiniti, o il denominatore del rapporto tende a 0, o la base della potenza tende a 0+, o l’argomento del logaritmo tende a 0+, o la base del logaritmo tende a 1 o a 0+, le corrispondenti operazioni sui limiti non sono definite nel campo reale. Lo studio del comportamento delle successioni (4.7.1) per n → +∞ permetterà di aritmetizzare (ad esclusione delle eccezioni sopra menzionate) i simboli +∞, −∞, 0+ e 0− in modo da dare significato alle operazioni con queste quantità. 92 4. Successioni 4.7.1 Calcolo dei limiti in R Esaminiamo dapprima il caso in cui le operazioni tra i limiti hanno significato nel campo reale. Teorema 4.7.2 Siano {an } e {bn } due successioni a valori reali entrambe convergenti. Sia an → a, bn → b per n → +∞. Allora, per n → +∞ si ha: 1. an + bn → a + b. 2. an bn → ab. 3. Se bn 6= 0 e b 6= 0, allora an a → . bn b 4. Se an > 0 e a > 0, allora abnn → ab . 5. Se an , a > 0, an , a 6= 1, bn , b > 0, allora logan bn → loga b. La dimostrazione del Teorema è svolta nell’Appendice. Come esempio diamo la dimostrazione della 1. Fissato ε > 0, si ha definitivamente |an − a| < ε e |bn − b| < ε. Perciò si definitivamente vale |an + bn − a − b| ≤ |an − a| + |bn − b| < 2ε, da cui l’asserto. Esempi 4.7.3 1. 1 1 1 3n − 1 − cos = 3 − − cos → 3 − 0 − 1 = 2. n n n n 2. 3n − 1 1 cos → 3 · 1 = 3. n n 3. tan 1 sin 1/n 0 = → = 0. n cos 1/n 1 4. Sia x > 0. Si ha x1/n → x0 = 1. µ ¶ 1 5. Sia a > 0, a 6= 1. Si ha loga 1 + → loga 1 = 0. n 4.7.2 Calcolo dei limiti in R Le dimostrazioni dei Teoremi enunciati in questo sottoparagrafo sono svolte in Appendice. 4.7. Calcolo dei limiti 93 Somma Teorema 4.7.4 Siano {an } e {bn } due successioni a valori reali. Valgono le seguenti implicazioni: an an an an → +∞ → +∞ → −∞ → −∞ e e e e bn bn bn bn →b → +∞ →b → −∞ =⇒ an + bn =⇒ an + bn =⇒ an + bn =⇒ an + bn → +∞ → +∞ → −∞ → −∞. Riassumiamo il Teorema nella seguente tabella, che estende la somma a R, con l’eccezione del caso +∞ − ∞ Tabella I +∞ + b = +∞, +∞ + (+∞) = +∞ −∞ + b = −∞, −∞ + (−∞) = −∞ Se an → +∞ e bn → −∞, la successione an + bn può avere qualsiasi comportamento, come mostrano gli esempi seguenti. Esempi 4.7.5 1. Sia an = n, bn = −n + x, ove x è un numero reale qualunque. Allora an + bn = x. 2. Sia an = n2 , bn = −n. Ricordando l’esempio 4.5.6.2, si ha an + bn = n2 − n → +∞. Se an = n e bn = −n2 , si ha an + bn → −∞. 3. Sia an = n2 e ( −n2 bn = −n se n è pari se n è dispari. La successione an + bn è irregolare, poiché la sottosuccessione dei pari è identicamente 0, mentre quella dei dispari diverge a +∞. Si dice che ∞−∞ è una forma di indecisione. 94 4. Successioni Prodotto Teorema 4.7.6 Siano {an } e {bn } due successioni a valori reali. Valgono le seguenti implicazioni: an an an an an → +∞ → +∞ → −∞ → +∞ → −∞ e e e e e bn bn bn bn bn → +∞ → −∞ → −∞ →b≷0 →b≷0 =⇒ =⇒ =⇒ =⇒ =⇒ an bn an bn an bn an bn an bn → +∞ → −∞ → +∞ → ±∞ → ∓∞. Riassumiamo il Teorema nella seguente tabella, che estende il prodotto a R, con l’eccezione del caso 0 · ∞. Tabella II se b ≷ 0, +∞ · +∞ = +∞, +∞ · b = ±∞, −∞ · b = ∓∞ +∞ · −∞ = −∞, −∞ · −∞ = +∞ Se an → 0 e bn → ±∞, la successione an bn può avere qualsiasi comportamento, come mostrano i seguenti esempi. Esempi 4.7.7 1. Sia an = 1/n e bn = n. Allora an bn = 1 → 1. 2. Sia an = 1/n e bn = n2 . Allora an bn = n → +∞. 3. Sia an = 1/n2 e bn = n. Allora an bn = 1/n → 0. 4. Sia an = 1/n2 per n pari e an = 1/n per n dispari; sia bn = n. Allora an bn oscilla, poiché an bn = 1/n per n pari e an bn = 1 per n dispari. Abbiamo cosı̀ la seconda forma di indecisione 0·∞ Quoziente Il comportamento al limite di an /bn deduce combinando lo studio del comportamento al limite di 1/bn con il Teorema 4.7.6 Teorema 4.7.8 Sia {bn } una successione a valori reali tale che bn 6= 0. Valgono le seguenti implicazioni: bn bn bn bn → 0+ =⇒ 1/bn → +∞ → 0− =⇒ 1/bn → −∞ → +∞ =⇒ 1/bn → 0+ → −∞ =⇒ 1/bn → 0− 4.7. Calcolo dei limiti 95 Si noti che se bn tende a 0, ma non è bn → 0+, né bn → 0−, allora 1/bn oscilla. In questo caso infatti, 1/bn è illimitata, ma non ha definitivamente segno positivo, né negativo. Riassumiamo il Teorema nella seguente tabella. Tabella III 1 = +∞, 0+ 1 =0+, +∞ 1 = −∞ 0− 1 = 0− −∞ Dalla forma di indecisione 0 · ∞ e dal Teorema 4.7.8 si ricavano le due forme di indecisione per il quoziente. ∞ , ∞ 0 0 Potenze Teorema 4.7.9 Siano {an } e {bn } due successioni a valori reali. Sia an > 0 e a > 0. Valgono le seguenti implicazioni: an an an an →a>1 →a>1 →a<1 →a<1 e e e e bn bn bn bn → +∞ =⇒ abnn → −∞ =⇒ abnn → +∞ =⇒ abnn → −∞ =⇒ abnn → +∞ → 0+ → 0+ → +∞. Se an → 1 e bn → +∞, oppure bn → −∞, la successione abnn può avere qualsiasi comportamento. Giustificheremo questa affermazione nel prossimo paragrafo. Riassumiamo il Teorema nella seguene tabella. Tabella IV se a > 1, a+∞ = +∞, a−∞ = 0+ se 0 < a < 1, a+∞ = 0+, a−∞ = +∞ Si ha la forma di indecisione 1∞ 96 4. Successioni Teorema 4.7.10 Siano {an } e {bn } due successioni a valori reali. Sia an > 0. Valgono le seguenti implicazioni: an → 0+ e bn → b > 0 =⇒ abnn → 0+ an → +∞ an → 0+ an → +∞ e e e bn → b > 0 bn → b < 0 bn → b < 0 =⇒ =⇒ =⇒ abnn → +∞ abnn → +∞ abnn → 0 + . Riassumiamo il Teorema nella seguente Tabella Tabella V se b > 0, se b < 0, 0+b = 0+, 0+b = +∞, +∞b = +∞ +∞b = 0+ Dal Teorema precedente è escluso il caso in cui an → 0+ e bn → 0 e il caso in cui an → +∞ e bn → 0. In tali casi infatti, la successione abnn può avere qualsiasi comportamento. Esempi 4.7.11 1. Sia an = 2−n . Per il Teorema 4.7.10 an → 0+ per n → +∞. Se bn = −1/n, si ha abnn = 2. √ √ 2. Sia an = 2−n e bn = −1/ n. Si ha abnn = 2 n → +∞, sempre per il Teorema 4.7.10. 3. Sia an = 2−n e sia bn = 1/n per n pari, bn = −1/n per n dispari. In questo caso abnn oscilla. √ 4. Le successioni an = 2n e bn = 1/n, oppure bn = 1/ n, forniscono, ragionando come nel caso 00 , esempi che mostrano che ∞0 è effettivamente una forma di indecisione. Abbiamo quindi altre due forme di indecisione 00 , ∞0 Il seguente Teorema completa lo studio dei limiti delle potenze. Teorema 4.7.12 Siano {an } e {bn } due successioni a valori reali. Sia an > 0. Valgono le seguenti implicazioni. a → 0+ a → 0+ a → +∞ a → +∞ e e e e bn bn bn bn → +∞ → −∞ → +∞ → −∞ =⇒ =⇒ =⇒ =⇒ abnn abnn abnn abnn → 0+ → +∞ → +∞ →0+. 4.7. Calcolo dei limiti 97 Riassumiamo il Teorema nella seguente Tabella. Tabella VI 0++∞ = 0 + , +∞+∞ = +∞, 0+−∞ = +∞ +∞−∞ = 0+ Logaritmi Teorema 4.7.13 Sia a > 0, a 6= 1. Sia bn 6= zioni. a>1 e bn → +∞ =⇒ a>1 e bn → 0+ =⇒ a<1 e bn → +∞ =⇒ a<1 e bn → 0+ =⇒ 0. Valgono le seguenti implicaloga bn loga bn loga bn loga bn → +∞ → −∞ → −∞ → +∞. Come prima, il Teorema può essere riassunto in una tabella. Tabella VII se a > 1, se a < 1, loga +∞ = +∞, loga +∞ = −∞, loga 0+ = −∞ loga 0+ = +∞ Il comportamento del logaritmo con base variabile si deduce dai Teoremi precedenti e dalla formula logan bn = log10 bn log10 an (4.7.14) Il termine a destra in 4.7.14 presenta i casi di indecisione del rapporto se ambedue le sucessioni tendono a 1, o a 0+, o a +∞, oppure se una delle due tende a 0+ e l’altra a +∞. Le Tabelle I–VII costituiscono la cosiddetta aritmetizzazione parziale dei simboli +∞, −∞, 0+, 0−. Assieme al Teorema 4.7.2, e alle sette forme di indecisione, esse danno un panorama esauriente del calcolo dei limiti delle successioni reali. Raccogliamo in una tabella le forme di indecisione incontrate. Tabella VIII. Le forme di indecisione ∞−∞ 0·∞ 1∞ 00 0 0 ∞0 ∞ ∞ 98 4. Successioni 4.8 Il numero e Il numero e, base dei logaritmi naturali o neperiani, è definito come il limite della successione ¶n µ 1 en = 1 + . (4.8.1) n Poiché {en } presenta il caso di indecisione 1∞ , la sua convergenza non discende dai teoremi del paragrafo precedente, ma deve essere dimostrata separatamente. Teorema 4.8.2 La successione {en } converge. Dimostrazione. La dimostrazione si articola in due punti. a) en è strettamente crescente. b) en è limitata superiormente. La convergenza di {en } seguirà allora dal Teorema 4.6.2. Dimostriamo dapprima che en /en−1 > 1 per ogni n ≥ 2. Si ha ¶n µ 1 µ ¶n µ ¶n−1 1+ en n+1 n−1 n =µ = ¶n−1 en−1 n n 1 1+ n−1 µ 2 ¶n µ ¶n n −1 1 1 − n2 n2 = = . n−1 1 1− n n (4.8.3) (4.8.4) Ricordiamo ora la diseguaglianza, dimostrata nel Lemma 1.6.1, (1 + ε)n > 1 + nε, (4.8.5) valida per ogni n ≥ 2 e ε > −1, ε 6= 0. Posto ε = −1/n2 , si ha da (4.8.3) e (4.8.4) µ ¶n 1 1 1− 2 1−n· 2 en n n = 1. = > 1 1 en−1 1− 1− n n Quindi la successione (4.8.1) è strettamente crescente. Per dimostrare il punto b) consideriamo la successione e∗n µ ¶n+1 1 = 1+ . n (4.8.6) 4.8. Il numero e 99 Dimostriamo che essa è strettamente decrescente. Infatti, ragionando come sopra, si ha per n ≥ 2 ¶n µ 1 µ ¶n µ ¶n+1 1 + e∗n−1 n n n−1 (4.8.7) = µ ¶n+1 = e∗n n−1 n+1 1 1+ n µ ¶n ¶n µ 2 n 1 1+ 2 n2 − 1 n −1 = = . (4.8.8) 1 n+1 1+ n n Per la diseguaglianza (4.8.5), ove si ponga ε = 1/(n2 − 1), si ha µ 1+ 1 2 n −1 ¶n >1+n· n2 1 n > 1 + 2. −1 n (4.8.9) Da (4.8.7), (4.8.8) e (4.8.9) segue e∗n−1 = e∗n µ 1+ 1 n2 − 1 1 1+ n ¶n > 1. Quindi {e∗n } è strettamente decrescente. Ne segue che {en } è limitata, poiché en = µ ¶n µ ¶n+1 1 1 1+ < 1+ = e∗n < e∗1 = 4. n n Definizione 4.8.10 Si pone µ e = lim n→+∞ 1 1+ n ¶n . Poiché en è crescente, si ha limn→+∞ en = e−. Corollario 4.8.11 Sia e∗n come in (4.8.6). Allora limn→+∞ e∗n = e+. Dimostrazione. Segue dal Teorema precedente e dal Teorema del confronto. Infatti, 0 ≤ e∗n − en = e∗n e∗1 < . n+1 n+1 Il limite è per eccesso, poiché e∗n è decrescente. (4.8.12) 100 4. Successioni La successione {en } converge ad e ‘lentamente’. Se si vuole approssimare e, l’errore En commesso arrestandosi al passo n è, per (4.8.12), En = e − en < e∗n − en < 4 . n+1 Ad esempio, per approssimare e alla terza cifra decimale, e quindi avere un errore dell’ordine di 10−4 , occorre calcolare en con n dell’ordine di 104 . L’approssimazione effettiva di e si effettua con altri metodi, a cui accenneremo nell’Appendice del capitolo sulle serie numeriche. Il numero e, chiamato anche costante di Nepero (dal nome del matematico John Napier, inventore dei logaritmi), è un numero irrazionale trascendente (ossia, come π, non è radice di nessun polinomio a coefficienti interi). Dalla diseguaglianza e1 < e < e∗1 ricaviamo 2 < e < 4. In realtà, le prime cifre decimali di e sono e = 2, 71828182845904 . . . In Analisi Matematica si assume abitualmente il numero e come base dei logaritmi. La scrittura log x starà sempre ad indicare il logaritmo di x in base e. Siamo in grado ora di costruire gli esempi che mostrano che 1∞ è effettivamente una forma di indecisione. Si considerino le successioni µ ¶n2 √ 1+ 1 µ ¶n2 µ ¶ n se n è pari 1 1 n √ 1+ , 1+ , an = ¶ n µ n n 1 1+ se n è dispari n La prima diverge a +∞, poiché µ ¶n2 ·µ ¶n ¸n 1 1 → e+∞ = +∞, 1+ = 1+ n n per la Tabella IV nel paragrafo precedente. Per la seconda si ha µ ¶√n ·µ ¶n ¸1/√n 1 1 1+ = 1+ → e0 = 1. n n La terza successione è chiaramente oscillante. Il numero e si può ottenere come limite di successioni la cui espressione generalizza quella di en . Lemma 4.8.13 Sia {xn } una successione a valori reali tale che xn → +∞, opppure tale che xn → −∞, per n → +∞. Allora µ ¶xn 1 lim 1+ = e. n→+∞ xn 4.8. Il numero e 101 Dimostrazione. Innanzi tutto notiamo che µ ¶k µ ¶−1 1 1 1+ = ek+1 1 + → e. k+1 k+1 (4.8.14) Fissato quindi ε > 0, esiste k0 tale che per ogni k ≥ k0 valgono le diseguaglianze µ ¶k µ ¶k+1 1 1 e−ε< 1+ < 1+ <e+ε (4.8.15) k+1 k Sia dapprima xn → +∞. Per ogni xn sia [xn ] il massimo intero che non supera xn . Si ha [xn ] ≤ xn < [xn ] + 1, da cui µ 1+ 1 [xn ] + 1 ¶[xn ] < µ ¶xn µ ¶[xn ]+1 1 1 1+ < 1+ . xn [xn ] Poiché [xn ] → +∞, definitivamente si ha [xn ] > k0 . La tesi in questo caso segue da (4.8.15) e dal Teorema del confronto 4.5.2. Supponiamo ora xn → −∞. Posto yn = −xn , si ha yn → +∞ e ¶xn µ ¶−yn µ ¶yn −1 µ ¶ µ 1 1 1 1 = 1− = 1+ 1+ →e 1+ xn yn yn − 1 yn − 1 per il risultato precedente. Teorema 4.8.16 Sia {xn } una successione a valori reali tale che |xn | → +∞. Allora µ ¶xn 1 lim 1+ = e. n→+∞ xn Dimostrazione. Fissato ε > 0 ad arbitrio, per il Lemma precedente valgono definitivamente ambedue le diseguaglianze ¯µ ¯ ¶|xn | ¯ ¯ 1 ¯ ¯ − e ¯ < ε, ¯ 1+ ¯ ¯ |xn | ¯µ ¯ ¶ −|x | ¯ ¯ n 1 ¯ ¯ − e ¯ < ε. ¯ 1− ¯ ¯ |xn | Per ogni n si ha xn = |xn |, oppure xn = − |xn |. Quindi la sottosuccessione corrispondente agli xn positivi tende ad e, come pure la sottosuccessione corrispondente agli xn negativi. Ne segue la convergenza della successione. Con l’ausilio del Teorema appena dimostrato si deducono alcuni limiti fondamentali in Analisi Matematica. Il primo limite presenta la forma di indecisione 0 1∞ , gli altri la forma . 0 102 4. Successioni Teorema 4.8.17 Sia {εn } una successione a valori reali tale che limn→+∞ εn = 0 e εn 6= 0. Sia a un numero reale. Allora 1/εn a) (1 + a · εn ) → ea . b) log(1 + a · εn ) → a. εn c) aεn − 1 → log a εn d) (1 + εn )a − 1 → a. εn (se a > 0). Dimostrazione. a) Anzitutto si noti che 1 + a · εn è definitivamente positivo, poiché εn → 0. Quindi l’espressione in a) e b) ha senso per n abbastanza grande. Se a = 0 l’asserto è ovvio. Sia a 6= 0, e si ponga xn = (aεn )−1 . Poiché εn → 0 si ha |xn | → +∞. Risulta quindi ·µ 1/εn (1 + a · εn ) = 1+ 1 xn ¶xn ¸a → ea . b) Passando ai logaritmi nella relazione di limite in a) si ha l’asserto per il punto 5 del Teorema 4.7.2. c) Poniamo σn = aεn − 1, di modo che εn = loga (1 + σn ). Si ha σn σn aεn − 1 = = log a. εn loga (1 + σn ) log(1 + σn ) Per il punto 3 del Teorema 4.7.2, si ha σn → 0. Per il punto b) appena dimostrato si ha l’asserto. d) Se a = 0 l’asserto è ovvio. Sia a 6= 0. Si ponga σn = a log(1 + εn ). Per il punto 5 del Teorema 4.7.2, σn → 0. Si ha (1 + εn )a − 1 eσn − 1 log(1 + εn ) =a · →a εn σn εn per i punti b) e c) precedenti. Esempi 4.8.18 1 1 µq ¶ 2 1. (cos 1/n) sin 1/n = 1 − sin2 1/n sin 1/n = 2 1 ¶ µ 2 1 2 sin 1/n → e−1/2 . 2 = 1 − · 2 sin 1/n 2 4.9. Infiniti e infinitesimi 103 µ ¶ 3 3 µ ¶ log 1 + sin sin 3 n n ·3→3 2. n log 1 + sin = · 3 3 n sin n n (si veda il Teorema 4.5). 3. n 4. ¡√ n √ 4.9 ¢ 101/n − 1 10 − 1 = → log 10. 1/n Ãr n2 + n − n = n ! 1 −1 n 1+ µ ¶1/2 1 1+ −1 1 n = → . 1 2 n Infiniti e infinitesimi Definizione 4.9.1 Sia {xn } una successione a valori reali. Si dice che xn è un infinitesimo se limn→+∞ xn = 0. Si dice che xn è un infinito se limn→+∞ xn = +∞, oppure limn→+∞ xn = −∞. Tra gli infiniti che ricorrono maggiormente in Analisi Matematica vi sono loga n, nb , ecn , ove a, b, c sono costanti positive. Analogamente, gli infinitesimi più ricorrenti sono i reciproci dei precedenti, log−a n, n−b , e−cn . Accanto ad c essi possono presentarsi infiniti del tipo log (log n), en , n!, nn , e gli infinitesimi che sono i loro reciproci. Prima di confrontare tra loro queste successioni, enunciamo un criterio utile a stabilire se una successione sia infinita o infinitesima. Teorema 4.9.2 (Criterio del rapporto per le successioni) Sia an > 0 per ogni n. Esista an+1 α = lim . n→+∞ an a) Se 0 ≤ α < 1, allora an → 0+. b) Se 1 < α ≤ +∞, allora an → +∞. Dimostrazione. a) Sia ε > 0 tale che α + ε < 1. Esiste n0 tale che per ogni n ≥ n0 si abbia an+1 /an < α + ε. Per tali valori di n si ha an+1 an an−1 an +1 · · · · · 0 · an0 an an−1 an−2 an0 < (α + ε) · (α + ε) · (α + ε) · · · (α + ε) an0 an+1 = n+1−n0 = (α + ε) Quindi n an0 −n0 0 < an < (α + ε) (α + ε) an0 → 0. 104 4. Successioni La tesi segue dal Teorema del confronto 4.5.2. b) Sia bn = 1/an . Allora lim n→+∞ bn+1 an = lim < 1. n→+∞ bn an+1 Per il punto a) bn → 0+ e quindi an → +∞. Se α = 1, in generale non si può dedurre nulla sul comportamento della successione. Si considerino ad esempio le due successioni an = n e an = 1/n, la prima infinita e la seconda infinitesima. Al tendere di n a +∞ per ambedue si ha an+1 /an → 1. Teorema 4.9.3 Sia b > 0 e c > 0. Allora ecn → +∞. nb (4.9.4) Dimostrazione. Per dimostrare il Teorema applichiamo il criterio del rapporto alla successione an = ecn /nb . Si ha an+1 ec(n+1) = · an ecn µ n n+1 ¶b → ec > 1, da cui (4.9.4). Il criterio del rapporto non basta per determinare il limite di an = nb / loga n. Infatti µ ¶b µ ¶a an+1 n+1 log n = · . (4.9.5) an n log(n + 1) Il primo fattore a destra in (4.9.5) tende a 1. Per il secondo fattore si ha log n log n = = log(n + 1) log n + log(1 + 1/n) 1 → 1. log(1 + 1/n) 1+ log n Prima di studiare il comportamento al limite del rapporto an = nb / loga n, dimostriamo una disuguaglianza sul logaritmo. Lemma 4.9.6 Per ogni x > −1 si ha log(1 + x) ≤ x. Dimostrazione. Per il Lemma 1.6.1 si ha, per ogni x > −1, x 6= 0, ³ x ´n x 1+ > 1 + n = 1 + x. n n Per il punto a) del Teorema 4.8.17 e per (4.9.7) si ha ³ x ´n ex = lim 1 + ≥ 1 + x. n→+∞ n (4.9.7) 4.9. Infiniti e infinitesimi 105 Quindi ex ≥ 1 + x, da cui x ≥ log(1 + x). Questa relazione vale anche per x = 0 con il segno di eguaglianza. Si può dimostrare che l’equazione log(1+x) = x, ovvero 1+x = ex , ammette l’unica soluzione x = 0. Si veda a questo proposito l’esempio 8.8.9.2 nel capitolo 8. Teorema 4.9.8 Sia a > 0 e b > 0. Allora nb → +∞. loga n Dimostrazione. Per il Lemma precedente si ha ³ ´ b log n = log nb/2a < log 1 + nb/2a ≤ nb/2a . 2a Quindi µ ¶a nb nb nb nb 2a ¢a > b/2 = nb/2 → +∞. =¡b ¢a = ¡ a b log n n log nb/2a 2a log n Definizione 4.9.9 Siano {xn } e {yn } due infiniti. Si dice che xn diverge più lentamente di yn , o che xn è un infinito di ordine inferiore rispetto a yn , se xn /yn → 0. Equivalentemente, si dice che yn diverge più rapidamente di xn , o che yn è un infinito di ordine superiore rispetto a xn . Si dice che xn e yn sono infiniti dello stesso ordine se esiste un numero reale β > 0 tale che |xn /yn | → β. Si ha l’analoga definizione per gli infinitesimi. Definizione 4.9.10 Siano {xn } e {yn }, yn 6= 0, due infinitesimi. Si dice che xn tende a 0 più rapidamente di yn , o che xn è un infinitesimo di ordine superiore rispetto a yn , se xn /yn → 0. Equivalentemente, si dice che yn tende a 0 più lentamente di xn , o che yn è un infinitesimo di ordine inferiore rispetto a xn . Si dice che xn e yn sono infinitesimi dello stesso ordine se esiste un numero reale β > 0 tale che |xn /yn | → β. Se xn tende a 0 più rapidamente di yn e yn tende a 0 più rapidamente di zn , allora xn tende a 0 più rapidamente di zn . Infatti, se xn /yn → 0 e yn /zn → 0, allora xn xn yn = · → 0. zn yn zn Analogamente, se xn e yn sono infinitesimi dello stesso ordine, e se yn e zn sono infinitesimi dello stesso ordine, allora xn e zn sono infinitesimi dello stesso ordine. Infatti, se |xn /yn | → β > 0 e |yn /zn | → γ > 0, allora ¯ ¯ ¯ ¯ ¯ ¯ ¯ xn ¯ ¯ xn ¯ ¯ yn ¯ ¯ ¯ = ¯ ¯ · ¯ ¯ → βγ > 0. ¯ zn ¯ ¯ yn ¯ ¯ zn ¯ Le stesse osservazioni si applicano agli infiniti. 106 4. Successioni Esempi 4.9.11 1. Dai Teoremi 4.9.3 e 4.9.8 segue che, per ogni a, b, c positivi, ecn diverge più rapidamente di nb , il quale diverge più rapidamente di loga n. Passando ai reciproci, e−cn tende a 0 più rapidamente di n−b , il quale tende a 0 più rapidamente di log−c n. 2. I due infiniti n e n + (−1)n hanno lo stesso ordine. Dal Teorema 4.5 segue che sin 1/n è infinitesimo dello stesso ordine di 1/n. Dal Teorema 4.8.17 segue che log(1+ a/n) è infinitesimo dello stesso ordine di 1/n (per a 6= 0). Deduciamo altri due confronti tra infiniti Teorema 4.9.12 Valgono i seguenti limiti nn n! → +∞, → +∞. n! en Dimostrazione. Sia an = nn /n!. Si ha (4.9.13) (n + 1)n (n + 1) an+1 (n + 1)n+1 n! 1 = · = · n an n (n + 1)! nn n+1 µ ¶n 1 = 1+ → e > 1. n Per il criterio del rapporto la prima relazione di limite è vera. Poniamo ora an = n!/en . Si ha an+1 (n + 1)! en n+1 = · n+1 = → +∞. an n! e e Quindi vale anche la seconda relazione di limite in 4.9.13. Definizione 4.9.14 Siano {xn } e {yn } due infinitesimi, tali che xn 6= 0 e yn 6= 0. Sia α un numero reale positivo. Si dice che xn è un infinitesimo di ordine α rispetto a yn se esiste β > 0 tale che |xn | α → β. |yn | (4.9.15) Una analoga definizione vale per gli infiniti. Esempi 4.9.16 1 1 1. 3/2 è un infinitesimo di ordine 3/2 rispetto a . Analogamente, n3/2 è n n un infinito di ordine 3/2 rispetto a n. 2. 1 − cos 1/n è un infinitesimo di ordine 2 rispetto a 1/n. Infatti µ ¶2 1 − cos 1/n 1 sin 1/2n 1 = → . 2 1/n 2 1/2n 2 Si noti che, dati due infinitesimi{xn } e {yn }, non esiste necessariamente α tale che valga la (4.9.15). Ad esempio, xn = e−n e yn = 1/n. 4.10. o piccolo e asintotico 4.10 107 o piccolo e asintotico Definizione 4.10.1 Siano {xn } e {yn } due successioni reali, e sia yn 6= 0. Si dice che xn è o piccolo di yn se xn → 0. yn In tal caso si scrive xn = o (yn ) . Esempi 4.10.2 1. Se a, b e c sono positivi, si ha ¡ ¢ ¡ ¢ loga n = o nb , e−cn = o 1/nb , 2. Si ha 1 − cos Infatti 1/n2 = o(1/n), √ n = o(n). 1 = o(1/n). n 1 − cos 1/n 1 1 − cos 1/n = · → 0. 1/n n 1/n2 per l’esempio 4.9.16.2. La scrittura o(1) sta ad indicare un generico infinitesimo. Ad esempio, 1/n = o(1), e−n = o(1), etc. La scrittura xn = zn + o(yn ) equivale a xn − zn = o(yn ). Se xn converge a x, allora xn − x → 0 e quindi xn = x + o(1). Definizione 4.10.3 Siano {xn } e {yn } due successioni reali tali che xn 6= 0 e yn 6= 0. Si dice che xn è asintotico a yn se xn → 1. yn In tal caso si scrive xn ∼ yn Ad esempio, n2 − 3n ∼ n2 , sin 1/n ∼ 1/n, log (1 + 1/n) ∼ 1/n, e2/n − 1 ∼ 2/n. La relazione ∼ è riflessiva, cioé xn ∼ xn , simmetrica, cioé xn ∼ yn se e solo se yn ∼ xn , transitiva, cioé xn ∼ yn e yn ∼ zn implicano xn ∼ zn . Infatti, xn xn yn = · → 1. zn yn zn 108 4. Successioni Se xn ∼ yn e se xn → α ∈ R, allora yn → α. Infatti yn · xn → α. yn = xn Si noti tuttavia che la relazione xn ∼ yn non implica che le due successioni siano regolari. Ad esempio, (−1)n + 1/n ∼ (−1)n , ma ambedue le successioni oscillano. Infine, introduciamo i simboli di O grande ed eguale ordine di grandezza, anche se essi sono meno frequentemente usati. Definizione 4.10.4 Siano {xn } e {yn } due successioni reali, e sia yn > 0. Si dice che che xn è O grande di yn se esiste una costante c tale |xn | ≤ c. yn (4.10.5) In tal caso si scrive xn = O(yn ). Siano xn 6= 0 e yn 6= 0. Si dice che xn e yn hanno eguale ordine di grandezza se esistono due costanti c > 0 e d > 0 tali che definitivamente ¯ ¯ ¯ xn ¯ 0 < d ≤ ¯¯ ¯¯ ≤ c. (4.10.6) yn In tal caso si scrive xn ³ yn . Due successioni asintotiche hanno chiaramente eguale ordine di grandezza, ma non vale l’implicazione opposta, come mostrato nel successivo esempio 4.10.7.3 Esempi 4.10.7 1. n sin n = O(n). In questo caso (4.10.5) vale con c = 1. Si noti che n sin n è irregolare. √ √ ¡ ¢ 2 2. e n +n ³ en . Infatti, n2 + n − n = n (1 + 1/n)1/2 − 1 → 1/2, da cui e √ n2 +n en =e √ n2 +n−n → e1/2 . 3. ((−1)n + 1/n) sin n ³ sin n. In questo esempio ambedue le successioni sono irregolari e non sono asintotiche. La (4.10.6) vale con c = 3/2 e d = 2/3 (per n > 1). Tra i vari simboli introdotti in questo paragrafo esistono le seguenti implicazioni, nessuna delle quali può essere invertita. ∼ =⇒ ³ =⇒ O o =⇒ O 4.11. Successioni in Rk 4.11 109 Successioni in Rk Sia {xn } una successione di punti dello spazio euclideo Rk , k ≥ 1. Poniamo xn = (x1n , x2n , . . . , xkn ) . (4.11.1) La successione {xn } individua k successioni reali, dipendenti da un doppio indice: la successione {x1n } delle prime coordinate, la successione {x2n } delle seconde coordinate, . . . , la successione {xkn } delle k-esime coordinate. Ad esempio, la successione ¶ µ 1 1 (4.11.2) xn = sin , cos n n individua le due successioni reali x1n = sin 1 , n x2n = cos 1 . n Viceversa, assegnate k successioni reali {x1n }, {x2n }, . . . , {xkn }, esse individuano la successione di punti (4.11.1). Questa osservazione permette, come vedremo, di ricondurre il calcolo dei limiti in Rk al calcolo dei limiti delle successioni reali. Innanzi tutto enunciamo esplicitamente la definizione di convergenza nel caso in cui lo spazio metrico sia Rk con la metrica euclidea. La successione (4.11.1) converge a un punto x = (x1 , x2 , . . . , xk ) ∈ Rk se per ogni ε > 0 esiste n0 tale che per ogni n ≥ n0 si abbia v u k uX kxn − xk = t (xjn − xj )2 < ε j=1 Lemma 4.11.3 Sia an = (a1 , a2 , . . . , ak ) un punto di Rk . Valgono le seguenti diseguaglianze q (4.11.4) max |aj | ≤ a21 + a22 + · · · a2k ≤ |a1 | + |a2 | + · · · + |ak | . j=1,...,k Dimostrazione. Dimostriamo dapprima la diseguaglianza di sinistra. Si ha, per ogni j = 1, . . . , k a2j ≤ a21 + a22 + · · · a2k . Passando alle radici quadrate si ha ottiene per ogni j = 1, . . . , k, q q |aj | = a2j ≤ a21 + a22 + · · · a2k . Dimostriamo ora la diseguaglianza di destra. Si ha 2 (|a1 | + |a2 | + · · · + |ak |) = a21 + a22 + · · · a2k + 2 |a1 | |a2 | + 2 |a1 | |a3 | + · · · + 2 |ak−1 | |ak | ≥ a21 + a22 + · · · a2k . 110 4. Successioni Passando alle radici quadrate si ottiene q q 2 |a1 | + |a2 | + · · · + |ak | = (|a1 | + |a2 | + · · · + |ak |) ≥ a21 + a22 + · · · a2k . Teorema 4.11.5 Sia {xn } una successione di punti di Rk . La successione converge a x = (x1 , x2 , . . . , xk ) ∈ Rk se e solo se xjn converge a xj per ogni j = 1, . . . , k Dimostrazione. Supponiamo dapprima xn → x per n → +∞. Per ogni ε > 0 esiste n0 tale che per ogni n ≥ n0 si ha kxn − xk < ε. Per la diseguaglianza di sinistra in (4.11.4), per ogni n ≥ n0 e per ogni j = 1, . . . , k si ha |xjn − xj | ≤ kxn − xk < ε. Quindi xjn → xj per n → +∞, per ogni j = 1, . . . , k. Viceversa, supponiamo xjn → xj per ogni j = 1, . . . , k. Per ogni ε > 0 ognuna delle seguenti diseguaglianze vale definitivamente |x1n − x1 | < ε, |x2n − x1 | < ε, . . . , |xkn − xk | < ε. (4.11.6) Quindi esiste n0 tale che per ogni n ≥ n0 tutte le diseguaglianze (4.11.6) valgono contemporaneamente. Dalla diseguaglianza di destra in (4.11.4) si ha, per ogni n ≥ n0 , k X kxn − xk ≤ |xjn − xj | < kε. j=1 Quindi xn → x. Esempi 4.11.7 1. Sia {xn } la successione in (4.11.2). Si ha xn → (0, 1) per n → +∞. 2. La successione dei punti xn = (1/n, (−1)n ) non converge, poiché la successione delle seconde coordinate non converge. In Rk sono definite tre operazioni: somma, prodotto per uno scalare e prodotto interno. Il calcolo dei limiti rispetto a queste tre operazioni è una immediata conseguenza del Teorema 4.11.5. Teorema 4.11.8 Siano {xn } e {y n } successioni in Rk . Sia {αn } una successione di numeri reali. Supponiamo che per n → +∞ si abbia xn → x, Allora a) xn + y n → x + y y n → y, αn → α ∈ R. 4.12. Classe limite 111 b) αn xn → αx c) (xn , y n ) → (x, y). Dimostrazione. Ci limitiamo a dimostrare, come esempio, il punto c), poiché la dimostrazione degli altri due punti è del tutto analoga. Sia xn come in (4.11.1), y n = (y1n , y2n , . . . , ykn ), x = (x1 , x2 , . . . , xk ), y = (y1 , y2 , . . . , yk ). Per il Teorema 4.11.5 si ha, al tendere di n a +∞, x1n → x1 , x2n → x2 , . . . , xkn → xk , y1n → y1 , y2n → y2 , . . . , ykn → yk . Applicando il Teorema 4.7.2 si ha (xn , y n ) = x1n y1n + x2n y2n + · · · + xkn ykn → x1 y1 + x2 y2 + · · · + xk yk = (x, y). 4.12 Classe limite Sia {xn } una successione di numeri reali e sia {xnk } una sua sottosuccessione. Anche se {xn } non è regolare, può accadere che la sottosuccessione ammetta limite, finito o infinito. Siamo cosı̀ condotti alla seguente definizione. Definizione 4.12.1 Sia {xn } una successione a valori reali. Un elemento α ∈ R si chiama valore limite della successione se esiste una sottosuccessione {xnk } tale che limk→+∞ xnk = α. L’insieme dei valori limite di {xn } si chiama classe limite della successione. Esempi 4.12.2 1. Sia xn = (−1)n . In questo caso la classe limite è {−1, 1}. Infatti x2k = 1 → 1 e x2k−1 = −1 → −1. Ogni altra sottosuccessione regolare tende a 1 oppure a −1. nπ 2. Sia xn = sin , con n ≥ 0. La classe limite è {0, 1, −1}. Infatti, per ogni 2 k ≥ 0 intero, si ha x4k = 0, x4k+1 = 1, x4k+2 = 0, x4k+3 = −1. Ogni altra sottosuccessione regolare converge a uno di questi valori limite. 3. Sia xn = n sin nπ . In questo caso 2 x4k = 0, x4k+1 = n, La classe limite è {−∞, 0, +∞}. x4k+2 = 0, x4k+3 = −n. 112 4. Successioni 4. L’insieme Q dei numeri razionali è numerabile, e quindi può essere disposto in successione. Sia {rn } la successione dei razionali. La sua classe limite è R. Per vedere ciò, ricordiamo che ogni numero reale x è punto di accumulazione della successione. Per il Teorema 4.3.5, esiste una sottosuccessione {rnk } tale che rnk → x per k → +∞. Inoltre anche +∞ e −∞ sono valori limite. Infatti, per ogni intero k > 0 si può definire induttivamente rnk in modo che rnk > k e n1 < n2 < n3 < · · · . Ovviamente rnk → +∞ per k → +∞. In modo analogo si costruisce una sottosuccessione divergente a −∞. Teorema 4.12.3 Sia {xn } una successione di numeri reali e sia E ⊆ R la sua classe limite. Allora a) E 6= ∅ b) E ∩ R è un chiuso c) E ha massimo e minimo (nell’insieme ordinato R). Dimostrazione. a) Se {xn } è limitata, la ©sua ªchiusura è compatta. Per il Corollario 4.3.6 esiste una sottosuccessione di xnj convergente. Quindi E = 6 ∅. Se {xn } è illimitata superiormente, possiamo definire induttivamente una sottosuccessione divergente a +∞. Infatti, esiste un indice n1 tale che xn1 > 1; esiste un indice n2 > n1 tale che xn2 > 2; esiste un indice n3 > n2 tale che xn3 > 3, etc. Chiaramente limk→+∞ xnk = +∞. Quindi +∞ ∈ E. In modo analogo si dimostra che −∞ ∈ E se {xn } è illimitata inferiormente. 0 b) Sia (E ∩ R) 6= ∅, e sia z un punto di accumulazione di E ∩ R. Sia yk ∈ E ∩ R convergente a z. Poiché ogni yk è limite di una sottosuccessione, esiste n1 tale che |xn1 − y1 | < 1; esiste n2 > n1 tale che |xn2 − y2 | < 1/2. Per induzione, per ogni intero positivo k esiste nk tale che |xnk − yk | < 1/k e nk > nk−1 . Si ha |z − xnk | ≤ |z − yk | + |yk − xnk | < |z − yk | + 1/k → 0. Quindi z è il limite della sottosuccessione {xnk }. c) Se {xn } è illimitata superiormente, come abbiamo già visto nella dimostrazione del punto a), +∞ ∈ E, e quindi E ha +∞ come massimo. Se {xn } è limitata superiormente, allora anche E è limitata superiormente. Infatti, nessun elemento α > sup xn può essere un valore limite della successione. Sia L = sup E. Poichè E ∩ R è un chiuso, per il Teorema 3.5.4 L ∈ E ∩ R. Quindi L è il massimo di E. L’esistenza del minimo si dimostra in modo analogo. 4.12. Classe limite 113 Definizione 4.12.4 Sia {xn } una successione di numeri reali e sia E la sua classe limite. Si chiama limite superiore (o massimo limite) della successione il massimo della classe limite. Si chiama limite inferiore (o minimo limite) della successione il minimo della classe limite. Per il limite superiore si usano le notazioni lim sup xn , limn→+∞ xn . n→+∞ Per il limite inferiore si usano le notazioni lim inf xn , n→+∞ limn→+∞ xn . Esempi 4.12.5 1. Negli esempi 4.12.2.1 e 4.12.2.2 si ha lim sup xn = 1, n→+∞ lim inf xn = −1. n→+∞ Negli esempi 4.12.2.3 e 4.12.2.4 si ha lim sup xn = +∞, n→+∞ lim inf xn = −∞. n→+∞ 2. Negli esempi 4.12.2 ha lim supn→+∞ xn = sup xn e lim inf n→+∞ xn = inf xn , ma in generale il limite superiore non coincide con l’estremo superiore e il limite inferiore non coincide con l’estremo inferiore. Ad esempio, sia xn = (−1)n (3 + 1/n), ove n ∈ N. Si ha lim sup xn = 3, lim inf xn = −3, n→+∞ 3. Sia xn = n→+∞ max xn = 7/2, min xn = −4. µ ¶n (−1)n 1+ . Allora n lim sup xn = e, n→+∞ lim inf xn = e−1 . n→+∞ 4. Sia xn = −n. Allora xn → −∞ e si ha −∞ = lim inf n→+∞ xn = lim supn→+∞ xn . Teorema 4.12.6 Sia {xn } una successione di numeri reali. a) Se lim supn→+∞ xn = L < +∞, allora, per ogni ε > 0 si ha definitivamente xn < L + ε. b) Se lim inf n→+∞ xn = ` > −∞, allora, per ogni ε > 0 si ha definitivamente xn > ` − ε. 114 4. Successioni Dimostrazione. Supponiamo, per assurdo, che a) sia falsa. Allora esiste ε > 0 tale che esistono infiniti indici nk tali che xnk ≥ L + ε. Se α è un valore limite della sottosuccessione {xnk }, si ha necessariamente α ≥ L + ε. Poiché α è anche un valore limite della successione originaria {xn }, L non può essere il limite superiore di {xn }, assurdo. In modo analogo si dimostra b). Dalla definizione 4.12.4 si ha che lim inf n→+∞ xn ≤ lim supn→+∞ xn . Ovviamente, detta E la classe limite di {xn }, l’eguaglianza E = {α} equivale a lim inf n→+∞ xn = lim supn→+∞ xn = α. Corollario 4.12.7 Si ha lim inf n→+∞ xn = lim supn→+∞ xn = α ∈ R se e solo se limn→+∞ xn = α. Dimostrazione. Se xn → α, per i Teoremi 4.3.4 e 4.4.11 ogni sottosuccessione deve tendere a α, per cui la classe limite E si riduce a {α}. Viceversa, sia E = {α}. Se α ∈ R, dal Teorema precedente si ha definitivamente α − ε < xn < α + ε, e quindi xn converge a α. Sia α = +∞. Se, per assurdo, xn non diverge a +∞, deve esistere M > 0 tale che esistono infiniti nj per cui xnj ≤ M . Sia β un valore limite © indici ª della sottosuccessione xnj . Allora β ≤ M . Poiché β è anche un valore limite della successione originaria {xn }, la classe limite deve contenere un elemento β 6= +∞, assurdo. Se α = −∞ si ragiona in modo analogo al caso precedente. 4.13 La condizione di Cauchy Sia (X, d) uno spazio metrico e sia {xn } una successione a valori in X convergente a p ∈ X. Per ogni ε > 0 esiste n0 tale che per ogni n ≥ n0 si ha d(xn , p) < ε/2. (4.13.1) Se m è un altro intero tale che m ≥ n0 , si ha d(xm , p) < ε/2. (4.13.2) Da queste due diseguaglianze si ottiene d(xn , xm ) ≤ d(xn , p) + d(xm , p) < ε. Quindi una successione convergente in uno spazio metrico soddisfa la seguente condizione, chiamata condizione di Cauchy: ∀ε > 0 ∃n0 ∀m, n ≥ n0 , d(xn , xm ) < ε. (C) Si noti che l’espressione della condizione condizione (C) non fa alcun riferimento al valore del limite di {xn }. Come abbiamo appena mostrato, in qualunque spazio metrico la condizione di Cauchy è necessaria per la convergenza di una successione. Tuttavia esistono spazi metrici in cui essa non è sufficiente per la convergenza. 4.13. La condizione di Cauchy 115 Esempi 4.13.3 1. Sia X = Q con la metrica√euclidea. Sia {xn } una qualunque successione di razionali convergente a 2. Essa è di Cauchy, in quanto convergente in R. Tuttavia essa non converge in Q. ¯ ¯ ¯1 1¯ 2. Per ogni m, n ∈ N poniamo d(n, m) = ¯¯ − ¯¯. È immediato verificare n m che (N, d) è uno spazio metrico. La successione xn = n di tutti gli elementi di N soddisfa la condizione di Cauchy. Infatti, per ogni ε > 0, sia n0 > 2/ε. Per ogni m, n ≥ n0 si ha ¯ ¯ ¯1 1¯ 1 1 2 < d(n, m) = ¯¯ − ¯¯ < + < ε. n m n m n0 Tuttavia, la successione {xn } non converge. Infatti, per ogni k ∈ N si ha ¯ ¯ ¯1 1 ¯¯ 1 ¯ lim d(xn , k) = lim ¯ − ¯ = > 0. n→+∞ n→+∞ k n k Definizione 4.13.4 Sia (X, d) uno spazio metrico e sia {xn } una successione a valori in X. Si dice che {xn } è una successione di Cauchy se essa soddisfa la condizione (C). Lo spazio (X, d) si dice completo se ogni successione di Cauchy è convergente. Lo spazio Q con la metrica euclidea e lo spazio N con la metrica definita nell’esempio 4.13.3.2 non sono spazi metrici completi. Teorema 4.13.5 Rk dotato della metrica euclidea è completo per ogni k ≥ 1. Dimostrazione. Sia {xn } una successione di Cauchy in Rk . Poniamo, per ogni n ≥ 1, En = {xn , xn+1 , xn+2 , xn+3 , . . .} Si ha E1 ⊇ E2 ⊇ · · · ⊇ En ⊇ En+1 ⊇ · · · (4.13.6) En è limitato per ogni n. Infatti, per la condizione (C), in cui scelga ε = 1, esiste n0 tale che per ogni r, s ≥ n0 si ha d(xr , xs ) < 1, ove abbiamo denotato con d la metrica euclidea. Ne segue, per ogni n ≥ n0 , diam En ≤ diam En0 = sup d(xr , xs ) ≤ 1. (4.13.7) r,s≥n0 Quindi En è limitato per ogni n ≥ n0 . Per il Teorema 3.5.13, En è limitato per ogni n ≥ 1. Consideriamo ora la successione delle chiusure E n di En . Per il Teorema 3.5.12, diam En = diam E n . Per il Teorema di Heine-Borel, gli insiemi En sono compatti. 116 4. Successioni Per il punto d) del Teorema 3.5.8, le relazioni di inclusione (4.13.6) valgono anche per E n . Si ha quindi E 1 ⊇ E 2 ⊇ · · · ⊇ E n ⊇ E n+1 ⊇ · · · . (4.13.8) Possiamo applicare il Teorema 3.6.11 e concludere che F = +∞ \ E n 6= ∅. n=1 Sia p ∈ F . Dimostriamo che limn→+∞ xn = p (per l’unicità del limite, questo dimostra implicitamente che F si riduce a un singleton). Fissiamo ε > 0 ad arbitrio e sia n0 tale che per ogni r, s ≥ n0 si abbia d(xr , xs ) < ε. Per n ≥ n0 si ha diam En ≤ diam En0 = sup d(xr , xs ) ≤ ε. (4.13.9) r,s≥n0 Quindi diam En = diam E n → 0. Poiché xn e p appartengono a E n , ne segue d(xn , p) ≤ diam E n → 0 per n → +∞. Gli spazi metrici compatti costituiscono un’altra importante classe di spazi metrici completi. Teorema 4.13.10 Sia (X, d) uno spazio metrico. Se X è compatto, allora è completo Dimostrazione. Sia {xn } una successione © diª Cauchy a valori in X. Per il Teorema 4.3.6 esiste una sottosuccessione xnj convergente a p ∈ X. Fissato ε > 0, esiste j0 tale che d(p, xnj ) < ε d(xn , xm ) < ε per j ≥ j0 per m, n ≥ nj0 Per n ≥ nj0 si ha d(p, xn ) ≤ d(p, xnj0 ) + d(xnj0 , xn ) < 2ε 4.14 4.14.1 Appendice Dimostrazione del Teorema 4.7.2 1. L’asserto riguardante il limite della somma è già stato dimostrato di seguito all’enunciato del Teorema 4.7.2. 4.14. Appendice 117 2. Sia ε > 0 fissato ad arbitrio e minore di 1. Definitivamente si ha |an − a| < ε e |bn − b| < ε. Quindi, definitivamente, |an bn − ab| ≤ |an − a| · |bn | + |a| · |bn − b| ≤ ε (|b| + ε) + |a| ε < ε (|a| + |b| + 1) . −1 3. Dimostriamo che b−1 . L’asserto sul quoziente segue allora n converge a b dal punto 2. Sia ε > 0 fissato ad arbitrio e tale che ε < |b| /2. Definitivamente si ha |bn − b| < ε. Allora, definitivamente, ¯ ¯ ¯ ¯ ¯ −1 ¯ ε 2ε ¯bn − b−1 ¯ = ¯ bn − b ¯ < ¯ bn b ¯ |b| (|b| − ε) < |b|2 . 4. Dimostriamo dapprima che aδn → 1 se δn → 0. Basta dimostrare questo asserto nel caso a > 1. Infatti, se a = 1 l’asserto è ovvio, se 0 < a < 1 si applica il punto 3 alla successione 1/aδn . Sia ε > 0 fissato ad arbitrio e sia m ≥ 2 un intero tale che 1 + mε > a. Definitivamente si ha |δn | < 1/m. Se δn > 0 si ha, per la diseguaglianza (4.8.5), 1 ≤ aδn < a1/m < (1 + mε) 1/m < 1 + ε. (4.14.1) Se δn = 0, si ha aδn = 1. Se δn = − |δn | < 0, si ha, passando ai reciproci in 4.14.1, −1/m −1 1 ≥ aδn > a−1/m > (1 + mε) > (1 + ε) > 1 − ε. ¯ ¯ Quindi, in ogni caso, definitivamente vale ¯1 − aδn ¯ < ε. b Dimostriamo ora che (an /a) n → 1. Per il punto 3 basta dimostrare l’asserto per b > 0. Definitivamente si ha bn < 2b. Si fissi ε > 0 tale che ε < 1 e sia δ > 0 un numero tale che n o 1/2b 1/2b δ < min (1 + ε) − 1, 1 − (1 − ε) . Definitivamente si ha a − aδ < an < a + aδ, da cui 2b 1 − ε < (1 − δ) < (1 − δ) bn < abnn a−bn < (1 + δ)bn < (1 + δ)2b < 1 + ε. Infine, per i risultati precedenti e il punto 2 si ha abnn = ab abn −b ³ a ´bn n a → ab 5. Si ha bn = b + xn ove xn → 0. Si ha ¡ ¢ loga bn = loga (b + xn ) = loga b + log 1 + b−1 xn → loga b. Il comportamento del logaritmo con base variabile si deduce dal punto 3, da (4.14.1) precedenti e dalla formula logan bn = log bn log an (4.14.2) 118 4.14.2 4. Successioni Dimostrazione dei Teoremi 4.7.4 e 4.7.6 I Teoremi 4.7.4 e 4.7.6 sono una immediata conseguenza della seguente Proposizione Proposizione 4.14.3 Siano {an } e {bn } due successioni reali. a) Se an → +∞ ed esiste c tale che definitivamte bn > c, allora an +bn → +∞. b) Se an → +∞ ed esiste c > 0 tale che definitivamente bn > c, allora an bn → +∞ Dimostrazione. a) Sia M > 0 arbitrario e sia n0 tale che per ogni n ≥ n0 si abbia an > M −c. Per tali valori di n si ha an +bn > M . Quindi an +bn → +∞. b) Sia M > 0 arbitrario e sia n0 tale che per ogni n ≥ n0 si abbia an > c−1 M . Per tali valori di n si ha an bn > M . Quindi an bn → +∞. 4.14.3 Dimostrazione del Teorema 4.7.8 Dimostriamo ora la prima e la terza implicazione del Teorema 4.7.8. Le altre due seguono da queste ponendo −bn al posto di bn . Sia bn → 0+. Sia M > 0 arbitrario e sia n0 tale che per ogni n ≥ n0 si abbia bn < 1/M . Per tali valori di n si ha anche 1/bn > M . Quindi 1/bn → +∞. Sia bn → +∞. Sia ε > 0 arbitrario e sia n0 tale che per ogni n ≥ n0 si abbia bn > 1/ε. Per tali valori di n si ha anche 1/bn < ε. Quindi 1/bn → 0+. 4.14.4 Dimostrazione dei Teoremi 4.7.9, 4.7.10, 4.7.12, 4.7.13 Dimostrazione del Teorema 4.7.9. Sia an → a > 1 e bn → +∞. Si fissi ε > 0 tale che a − ε > 1. Definitivamente si ha an > a − ε. Si fissi M > 0 ad arbitrio. Posto a − ε = 1 + δ, sia m > 0 un intero tale che 1 + mδ > M . Definitivamente vale bn > m. Si ha cosı̀, per n abbastanza grande, m abnn > (a − ε)bn > (1 + δ) > 1 + mδ > M . (4.14.4) Quindi abnn → +∞. Se an → a > 1 e bn → −∞, si ha abnn = 1 n a−b n (4.14.5) n con −bn → +∞. Quindi a−b → +∞ e, per (4.14.4) e il Teorema 4.7.6, abnn → n 0+. Le implicazioni per a < 1 si dimostrano in modo analogo. Dimostrazione del Teorema 4.7.10. Sia an → +∞ e bn → b > 0. Si fissi ε > 0 tale che b − ε > 0. Si fissi M > 0 ad arbitrio. Sia m un intero tale che m > M 1/(b−ε) . Definitivamente si ha an > m. Quindi si ha, per n abbastanza grande, abnn > mbn > mb−ε > M . 4.14. Appendice 119 Ne segue abnn → +∞. Se an → 0+ si ha a−1 n → +∞, per il Teorema 4.7.6. n Per la (4.14.5) e il risultato appena dimostrato si ha a−b → +∞, e quindi, per n bn il Teorema 4.7.6 nuovamente, an → 0+. Gli altri casi si dimostrano in modo analogo. Dimostrazione del Teorema 4.7.12. Sia an → 0+ e bn → +∞. Fissato ε > 0 tale che ε < 1, si ha definitivamente an < ε e quindi abnn < εbn → 0+ per il Teorema 4.7.9. Se an → 0+ e bn → −∞, dalla (4.14.5) e dal Teorema 4.7.6 si ha abnn → +∞. Gli altri casi si dimostrano in maniera analoga. Dimostrazione del Teorema 4.7.13. Sia a > 1 e bn → +∞. Per ogni M > 0 si ha definitivamente bn > aM , da cui loga bn > M . Quindi log bn → +∞. Sia a > 1 e bn → 0+. Per ogni M > 0 si ha definitivamente bn < a−M , da cui loga bn < −M . Quindi log bn → −∞. Le altre implicazioni si dimostrano in modo simile. Capitolo 5 Serie 5.1 Introduzione La somma a1 + a2 + · · · + ak di k numeri reali è definita per sommazioni successive. Prima si calcola a1 + a2 , poi (a1 + a2 ) + a3 , poi ancora ((a1 + a2 ) + a3 ) + a4 etc., fino al risultato finale ((. . . ((a1 + a2 ) + a3 ) + · · · ) + ak−1 ) + ak . Le parentesi possono essere omesse per la proprietà associativa della somma. Qualora si voglia dare senso alla somma di una infinità numerabile di numeri reali, a1 + a2 + a3 + · · · + an + an+1 + · · · (5.1.1) il procedimento descritto sopra non giunge mai a termine, ma produce una successione di ‘somme parziali’. Ciò suggerisce di definire la ‘somma di infiniti addendi’ mediante un passaggio al limite su questa successione di somme parziali, qualora tale limite esista. La nozione di serie, studiata in questo capitolo, rappresenta appunto la formalizzazione di questa idea. 5.2 Definizioni ed esempi +∞ Sia {an }n=1 una successione di numeri reali. Poniamo, per ogni k ∈ N, Ak = a1 + a2 + a3 + · · · + ak = k X an (5.2.1) n=1 Definizione 5.2.2 Sia {an } una successione di numeri reali e sia Ak definita come in (5.2.1). La successione {Ak } si chiama serie numerica (o semplicemente serie) di termine generale an . La quantità Ak viene chiamata somma parziale k-esima della serie. 121 122 5. Serie La serie di termine generale an viene indicata con il simbolo +∞ X an (5.2.3) n=1 Qualora non vi sia possibilità di equivoci, scriveremo semplicemente Spesso useremo anche il simbolo P an . a1 + a2 + a3 + · · · + an + · · · I termini an vengono anche chiamati addendi della serie. Definizione 5.2.4 Si dice che la serie (5.2.3) converge ad A ∈ R se lim Ak = A. k→+∞ Si dice che la serie diverge a +∞, oppure a −∞, se lim Ak = +∞, k→+∞ oppure lim Ak = −∞. k→+∞ Se una serie converge ad A, o diverge a +∞, oppure a −∞, si dice che la serie è regolare. In tal caso si pone, rispettivamente, +∞ X an = A, n=1 +∞ X an = +∞, n=1 +∞ X an = −∞. n=1 Il numero A, oppure +∞, oppure −∞, si chiama somma della serie. Se la serie non è regolare, si dice che è irregolare o oscillante. Esempi 5.2.5 1. Sia an = 1 . La serie n(n + 1) +∞ X 1 n(n + 1) n=1 si chiama serie di Mengoli. Dimostriamo che questa serie converge. Anzitutto si nota che 1 1 1 = − n(n + 1) n n+1 da cui Ak = k X 1 1 1 1 1 1 1 1 = 1 − + − + − + ··· + − n(n + 1) 2 2 3 3 4 k k + 1 n=1 =1− 1 → 1. k+1 5.2. Definizioni ed esempi 123 Quindi la serie di Mengoli converge e ed ha somma 1. Scriviamo +∞ X 1 = 1. n(n + 1) n=1 2. Sia an = q n , ove q è un qualsiasi numero reale. La serie +∞ X qn n=0 si chiama serie geometrica di ragione q. Al variare di q questa serie presenta tutti i caratteri possibili. Se q = 1 la serie diviene 1 + 1 + 1 + 1 + 1 + ··· per cui Ak = k + 1 → +∞. In questo caso la serie diverge a +∞. Sia q 6= 1. Per le somme parziali vale l’espresssione Ak = 1 + q + q 2 + · · · + q k = Se |q| < 1, la frazione in (5.2.6) converge a Ak → +∞. Se q = −1, la serie diviene 1 − q k+1 . 1−q (5.2.6) 1 . Se q > 1, si ha invece 1−q 1 − 1 + 1 − 1 + 1 − 1 + ··· e quindi Ak = 1 per k pari, Ak = 0 per k dispari. La serie in questo caso è oscillante. Se q < −1, (5.2.6) mostra che A2k → +∞ e A2k−1 → −∞. Anche in questo caso la serie oscilla. Riassumiamo i risultati sulla serie geometrica. +∞ se q ≥ 1 +∞ X 1 n se |q| < 1 q = 1−q n=0 oscilla se q ≤ −1 3. La serie +∞ X 1 n n=1 si chiama serie armonica. Dimostriamo che la serie armonica diverge a +∞. Innanzi tutto notiamo che Ak+1 = Ak + 1 > Ak , k+1 124 5. Serie e quindi le somme parziali costituiscono una successione strettamente crescente. Tale successione non può convergere, poiché non soddisfa la condizione di Cauchy. Infatti, per ogni k ≥ 1 si ha 1 1 1 + + ··· + k+1 k+2 2k 1 1 = . >k 2k 2 P+∞ Possiamo quindi concudere che Ak → +∞, ovvero n=1 A2k − Ak = 1 n = +∞. Terminiamo questo paragrafo con una semplice osservazione che sarà utilizzata varie volte nel seguito. P+∞ Sia c una costante diversa da 0. La serie n=1 can ha lo stesso carattere P+∞ delle serie n=1 an . Infatti k X can = c n=1 k X an . (5.2.7) n=1 P+∞ P+∞ In particolare, se n=1 can n=1 an converge ad A, oppure diverge a ±∞, converge a cA, oppure diverge a c · ±∞. Ad esempio +∞ X +∞ X 3 = 3, n(n + 1) n=1 5.3 n=1 − 1 = −∞. n La condizione di Cauchy per le serie Abbiamo dimostrato (Teorema 4.13.5) che R è uno spazio completo, cioè che la condizione di Cauchy è necessaria e sufficiente per la convergenza di una successione di numeri reali. Nel caso in cui la successione sia la successione delle somme parziali di una serie numerica, la condizione di Cauchy assume una forma particolare, che viene evidenziata nel seguente Teorema. Teorema 5.3.1 di Cauchy) Condizione necessaria e sufficiente afP(Criterio +∞ finché la serie n=1 an converga è che ∀ε > 0 ∃p0 ∀p ≥ p0 ∀q ≥ 0 ¯ p+q ¯ ¯X ¯ ¯ ¯ a ¯ < ε. ¯ ¯n=p n ¯ (C) Dimostrazione. Condizione necessaria e sufficiente per la convergenza della successione {Ak } è che per ogni ε > 0 esista p0 tale che per ogni k > h > p0 si abbia ¯ ¯ ¯ ¯ k h k ¯X ¯ ¯ X ¯ X ¯ ¯ ¯ ¯ |Ak − Ah | = ¯ an − an ¯ = ¯ an ¯ < ε. (5.3.2) ¯ ¯ ¯ ¯ n=1 n=1 n=h+1 5.3. La condizione di Cauchy per le serie 125 Mutiamo di nome agli indici, ponendo h = p − 1 e k = p + q, con q ≥ 0. La (5.3.2) diviene ¯ p+q ¯ ¯X ¯ ¯ ¯ |Ap+q − Ap−1 | = ¯ a ¯<ε ¯n=p n ¯ per ogni p ≥ p0 e q ≥ 0. La condizione (C) si chiama condizione di Cauchy per le serie. Come caso particolare, otteniamo una notevole condizione necessaria per la convergenza di una serie. Corollario 5.3.3 Se P+∞ n=1 an converge, allora an → 0 per n → +∞. Dimostrazione. Applichiamo il Teorema precedente. Poiché la serie converge, vale (C). In particolare, scegliendo q = 0, si ha ∀ε > 0 ∃p0 ∀p ≥ p0 |ap | < ε, cioè la tesi. La condizione an → 0 per n → +∞ è necessaria, ma non sufficiente per la convergenza di una serie. Ad esempio, il termine generale della serie armonica tenda a 0, ma la serie diverge. P+∞ Definizione 5.3.4 Si dice che una serie n=1 an converge assolutamente se converge la serie +∞ X |an | . n=1 L’interesse della nozione di convergenza assoluta di una serie risiede nel seguente Teorema. Teorema 5.3.5 Se una serie converge assolutamente, allora converge. P+∞ Dimostrazione. Supponiamo che la serie n=1 an converga assolutamente. Poiché (C) è necessaria per la convergenza, si ha ∀ε > 0 ∃p0 ∀p ≥ p0 ∀q ≥ 0 p+q X |an | < ε. (5.3.6) n=p Poiché ¯ p+q ¯ p+q ¯X ¯ X ¯ ¯ a ¯≤ |an | , ¯ ¯n=p n ¯ n=p P+∞ anche che la serie n=1 an soddisfa (C). Poiché (C) è sufficiente per la converP+∞ genza, n=1 an converge. 126 5. Serie La convergenza assoluta è sufficiente, ma non necessaria per la convergenza di una serie. Infatti, come vedremo più avanti, la serie +∞ X (−1)n n n=1 converge. La serie dei valori assoluti è la serie armonica, che diverge. P+∞ P+∞ Teorema 5.3.7 Siano n=1 an e n=1 bn due serie tali che an = bn definitivamente. Allora le due serie hanno lo stesso carattere. Dimostrazione. Sia r un intero tale che an = bn per ogni n > r. Poniamo Ak = k X an , Bk = n=1 k X bn . n=1 Per ogni k > r si ha Ak = Bk = r X an + k X n=1 n=r+1 r X k X bn + n=1 an bn n=r+1 Sottraendo termine a termine le due eguaglianze, si ha che Ak − Bk = r X an − n=1 r X bn (5.3.8) n=1 è costante per ogni k > r. Detta C la costante che appare a destra in (5.3.8), si ha definitivamente Ak = Bk + C. Le due successioni {Ak } e {Bk } hanno quindi lo stesso carattere. Il Teorema esprime una proprietà notevole, che sarà utilizzata varie volte P nel seguito: assegnata una serie an , possiamo modificarne un numero finito di termini, ad esempio ponendoli eguali a 0, o cambiandone il segno, a seconda della necessità. La serie risultante avrà lo stesso carattere delle serie originaria. Quindi: alterando un numero finito di termini di una serie, non se ne altera il carattere. Naturalmente, se la serie converge,Pla serie modificata non avrà la stessa P+∞ +∞ somma. Dalla (5.3) è chiaro che, se n=1 an = A e n=1 bn = B, allora A = B + C. 5.4. Serie a termini non negativi 5.4 127 Serie a termini non negativi P+∞ Sia n=1 an una serie numerica tale che an ≥ 0 per ogni n. Le sue somme parziali costituisono una successione monotona non decrescente, poiché Ak+1 − Ak = ak+1 ≥ 0. In forza del Teorema 4.6.2, Ak è regolare. Piú precisamente, la serie converge se la successione degli Ak è limitata superiormente, diverge a +∞ se la successione degli Ak è illimitata superiormente. Questa osservazione ci permette di dimostrare facilmente il Teorema del confronto per le serie a termini non negativi. P+∞ P+∞ Teorema 5.4.1 (del confronto per le serie) Siano n=1 an e n=1 bn due serie tali che per ogni n 0 ≤ an ≤ bn . (5.4.2) Allora P+∞ converge, anche n=1 an converge; P+∞ P+∞ b) se n=1 an diverge, anche n=1 bn diverge. a) se P+∞ n=1 bn Dimostrazione. Posto Ak = k X an , Bk = n=1 k X bn , n=1 dalla relazione (5.4.2) si ha Ak ≤ Bk per ogni k. Se Bk converge, esiste un numero M tale che Ak ≤ Bk ≤ M . Quindi Ak è limitata superiormente e perciò convergente. Viceversa, se Ak diverge, per ogni M si ha definitivamente M < Ak ≤ Bk . Quindi anche Bk diverge. Esempi 5.4.3 1. La serie +∞ X n=0 1 converge. Infatti, + 1) 2n (n an = La serie P+∞ n=0 bn 1 1 ≤ n = bn . + 1) 2 2n (n converge poiché è la serie geometrica di ragione 1/2. 128 5. Serie 2. La serie +∞ X 2 + sin n diverge. Infatti n n=1 an = e la serie P+∞ n=1 1 2 + sin n ≤ = bn , n n an è la serie armonica, che diverge. Osservazione. In forza del Teorema 5.3.7, il Teorema 5.4.1 continua a valere se la diseguaglianza (5.4.2) è verificata definitivamente, o se i termini sono definitivamente non negativi. Infatti, si possono alterare i termini an e bn (in numero finito) che non soddisfano le ipotesi, ad esempio ponendoli tutti eguali a 0. Il carattere delle serie non ne risulta alterato. Invece, a) e b) nel Teorema 5.4.1 non valgono se le due serie non hanno termini definitivamente positivi. Si veda l’Appendice per un controesempio. Corollario 5.4.4 Siano sitivi tali che P an e P bn due serie a termini definitivamente po- an ∼ bn . Allora le due serie hanno lo stesso carattere. Dimostrazione. Poiché bn /an → 1, definitivamente si ha 1 an ≤ bn ≤ 2an . 2 P Le serie di termini generali 12 an e 2an hanno lo stesso carattere di an . La tesi del Corollario segue quindi dal Teorema 5.4.1 e dall’osservazione precedente. Dalla dimostrazione del Corollario risulta chiaro che la tesi continua a valere se alla condizione an ∼ bn si sostituisce la più debole condizione an ³ bn . Esempi 5.4.5 µ ¶ µ ¶ 1 1 1 1. La serie log 1 + diverge, poiché log 1 + ∼ , termine gen n n n=1 nerale della serie armonica. ¶ µ +∞ X 1 2. La serie log 1 + 2 converge, poiché n n=1 +∞ X µ ¶ 1 1 1 log 1 + 2 ∼ 2 ∼ , n n n(n + 1) termine generale della serie di Mengoli. 5.5. Criteri della radice e del rapporto 5.5 129 Criteri della radice e del rapporto P an una serie tale che an > 0 Teorema 5.5.1 (Criterio della radice) Sia per ogni n. Esista α tale che √ α = lim n an . n→+∞ a) Se 0 ≤ α < 1, allora P an converge. P b) Se 1 < α ≤ +∞, allora an diverge. Dimostrazione. a) Sia 0 ≤ α < 1. Sia ε > 0 tale che α+ε < 1. Definitivamente si ha √ n an < α + ε, P n n ossia an < (α + ε) . La serie (α + ε) è la serie geometrica di ragione 0 < (α P + ε) < 1. Per il Teorema del confronto 5.4.1 (e l’osservazione successiva), an converge. P √ b) Sia α > 1. Definitivamente si ha n an > 1, da cui an > 1. La serie an diverge poiché an non tende a 0. Se α = 1, in generale non si può dire nulla sulla convergenza P+∞ o divergenza della serie. Come esempi si considerino la serie armonica n=1 1/n e la serie P+∞ 2 n=1 1/n . Si ha µ ¶1/n 1 1 = e− n log n → 1, n µ ¶1/n 2 1 = e− n log n → 1. n2 La prima serie diverge, mentre la seconda converge, in quanto 1/n2 ∼ 1/n(n+1), termine generale della serie di Mengoli. Esempi 5.5.2 µ ¶n2 ¶n +∞ µ X 3 3 1/n converge, poiché an = 1 − → e−3 < 1. 1. 1− n n n=4 ¶n2 µ ¶n +∞ µ X 3 3 1/n 2. 1+ diverge, poiché an = 1 + → e3 > 1. n n n=1 La divergenza di questa serie può anche essere dedotta dal fatto che il termine generale tende all’infinito, violando la condizione necessaria per la convergenza (si veda il Corollario 5.3.3) P an una serie tale che an > 0 Teorema 5.5.3 (Criterio del rapporto) Sia per ogni n. Esista α tale che an+1 . α = lim n→+∞ an 130 5. Serie a) Se 0 ≤ α < 1, allora P an converge. P b) Se 1 < α ≤ +∞, allora an diverge. Dimostrazione. a) Sia ε > 0 tale che α + ε < 1. Esiste n0 tale che per ogni n ≥ n0 si abbia an+1 /an < α + ε. Per tali valori di n si ricava an+1 an an−1 an +1 · · · · · 0 · an0 an an−1 an−2 an0 < (α + ε) · (α + ε) · (α + ε) · · · (α + ε) an0 an+1 = n+1−n0 = (α + ε) Quindi n an0 −n an < (α + ε) (α + ε) 0 an0 . P −n n Posto c = (α + ε) 0 an0 , la serie c (α + ε) converge, in quanto il suo termine generale è multiplo del termine generale di una serie geometrica convergente. La tesi segue dal Teorema del confronto. b) Sia α > 1. Esiste n0 tale che per ogni n ≥ n0 si ha an+1 /an > 1. Quindi an+1 an an−1 an +1 · · · · · 0 · an0 an an−1 an−2 an0 > an0 > 0. an+1 = Il termine generale non tende a 0 e quindi la serie diverge. Come nel caso del criterio della radice, se α = 1 non si può dire nulla sulla convergenza oP divergenza della serie.PCome esempi si considerino di nuovo +∞ +∞ 2 la serie armonica n=1 1/n . In ambedue i casi si ha n=1 1/n e la serie an+1 /an → 1. Esempi 5.5.4 1. +∞ n X x converge assolutamente qualunque sia x. Infatti, la convergenza n! n=0 per x = 0 è ovvia. Se x 6= 0, si ha ¯ ¯ ¯ an+1 ¯ n! |x|n+1 |x| ¯ ¯ ¯ an ¯ = (n + 1)! |x|n = n + 1 → 0. Dimostreremo nell’Appendice del capitolo 8 che +∞ n X x = ex n! n=0 La convergenza di questa serie è ‘rapida’, e può essere utilizzata per il calcolo di ex . 5.6. Criterio di condensazione 2. La serie 131 +∞ n2 X 2 diverge. Infatti n! n=0 2 an+1 n!2(n+1) 22n+1 = = → +∞. 2 an n+1 (n + 1)!2n Il criterio del rapporto per le serie, simile nelle ipotesi al criterio del rapporto per le successioni (Teorema 4.9.2), differisce da esso nella tesi. Il criterio del rapporto per le successioni è una condizione sufficiente affinché una successione positiva sia infinitesima o infinita. Il criterio del rapporto per le serie è una condizione sufficiente per la convergenza o la divergenza di una serie a termini positivi. Un esame della dimostrazione del criterio della radice e del criterio del rapporto mostra che le tesi di questi teoremi continuano a valere sotto ipotesi più deboli. P Teorema 5.5.5 Sia an una serie tale che an > 0 per ogni n. Se esiste α < 1 √ tale che definitivamente n an < α, oppure tale che definitivamente an+1 /an < √ α, allora la serie converge. Se definitivamente n an ≥ 1, oppure definitivamente an+1 /an ≥ 1, allora la serie diverge. √ L’ipotesi che esista α tale che definitivamente valga n an < α < 1 è ad esempio verificata se √ β = lim sup n an < 1. n→+∞ Infatti, fissato ε > 0 tale che β+ε < 1, per il Teorema 4.12.6 si ha definitivamente √ n a n < β + ε. Una analoga ossservazione vale per il rapporto. 5.6 Criterio di condensazione Teorema 5.6.1 (Criterio di condensazione) Sia an > 0 tale che an ≥ an+1 per ogni n ≥ 1. Allora, le due serie +∞ X n=1 an , +∞ X 2n a2n n=0 hanno lo stesso carattere. P+∞ Dimostrazione. Denotiamo con Ak le somme parziali di n=1 an e con Ck le P+∞ n n somme parziali di n=0 P 2n a2 . Supponiamo che 2 a2n converga. Poiché an è non crescente, si ha per ogni intero m ≥ 0 A2m+1 − A2m = a2m +1 + a2m +2 + . . . + a2m+1 ≤ 2m a2m . 132 5. Serie Per ogni k ≥ 1 sia m ≥ 0 un intero tale che k ≤ 2m+1 . Si ha Ak ≤ A2m+1 = A1 + (A2 − A1 ) + (A4 − A2 ) + (A8 − A4 ) + · · · + (A2m+1 − A2m ) ≤ a1 + 20 a1 + 2a2 + 4a4 + · · · + 2m a2m = a1 + Cm Poiché le somme parziali Cm sono limitate, anche Ak è limitata e quindi converge. P n Supponiamo ora che 2 a2n diverga. Poiché an è non crescente, P an A2m+1 − A2m = a2m +1 + a2m +2 + . . . + a2m+1 ¢ 1 ¡ m+1 ≥ 2m a2m+1 = 2 a2m+1 2 Per ogni k > 1 sia m ≥ 0 il massimo intero tale che k ≥ 2m+1 . Si ha Ak ≥ A2m+1 = A1 + (A2 − A1 ) + (A4 − A2 ) + (A8 − A4 ) + · · · + (A2m+1 − A2m ) ¢ 1 1¡ 1 ≥ a1 + 2a2 + 4a4 + 8a8 + · · · + 2m+1 a2m+1 = a1 + Cm+1 . 2 2 2 Per la scelta di m, se k → +∞ anche m → +∞, e quindi la divergenza di Cm implica quella di Ak . P n P La serie 2 a2n viene chiamata serie condensata della serie an . Come applicazione del criterio di condensazione determiniamo il carattere di una serie notevole, il cui termine generale dipende da un parametro reale p. I criteri presentati nei paragrafi precedenti non sono sufficienti per determinare il carattere di questa serie i tutti i casi. Corollario 5.6.2 Sia p un numero reale. La serie +∞ X 1 np n=1 (5.6.3) converge se p > 1, diverge se p ≤ 1. Dimostrazione. La serie condensata della serie (5.6.3) è +∞ X n=0 2n +∞ X 1 1 = , n(p−1) 2np 2 n=0 cioè la serie geometrica di ragione 1/2(p−1) . Se p > 1 si ha 1/2(p−1) < 1 e quindi la serie converge. Se p ≤ 1 si ha 1/2(p−1) ≥ 1 e quindi la serie diverge. Combinando il Corollario precedente con il Teorema del confronto e il criterio di condensazione, si determina il carattere di un’altra serie notevole, più generale della precedente. 5.6. Criterio di condensazione 133 Corollario 5.6.4 Siano p e q numeri reali. La serie +∞ X 1 p logq n n n=2 (5.6.5) ha il seguente carattere: ½ converge per ½ diverge per p > 1 e q qualunque p=1eq>1 p=1eq≤1 p < 1 e q qualunque Dimostrazione. Sia p > 1. Se q ≥ 0 si ha 1 1 ≤ p np logq n n e quindi la serie converge per il Corollario precedente ¡ ¢e il criterio del confronto. Se q < 0, posto p = 1 + δ, con δ > 0, si ha log−q n /nδ/2 → 0 per n → +∞. Ne segue che definitivamente vale la diseguaglianza log−q n < nδ/2 . Quindi 1 1 < 1+δ/2 , np logq n n da cui, di nuovo, si ha la convergenza della serie. Sia p = 1. Se q ≤ 0, si ha log−q n 1 ≥ n n e quindi la serie diverge, in quanto maggiorante della serie armonica. Se q > 0, applichiamo il criterio di condensazione. A meno di una moltiplicazione per una costante positiva, possiamo supporre che la base del logaritmo sia 2. La serie condensata ha termine generale 2m 1 1 = q. 2m logq2 2m m Per il Corollario precedente la serie converge per q > 1 e diverge per q ≤ 1. Infine, sia p < 1. Se q ≤ 0, si ha 1 1 log−q n > p > np n n e quindi la serie diverge. Se q > 0, posto p = 1−δ con δ > 0, si ha nδ/2 / logq n → +∞. Quindi, definitivamente, vale la diseguaglianza log−q n > n−δ/2 . Ne segue, definitivamente, 1 1 > 1−δ/2 , np logq n n da cui, di nuovo, la divergenza della serie. 134 5.7 5. Serie Criterio di Leibniz Per il Teorema 5.3.5, una serie assolutamente convergente è anche convergente. Questo Teorema, combinato con i criteri di convergenza per le serie a termini non negativi dei precedenti paragrafi, permette di dimostrare la convergenza di un’ampia classe di serie con termini di segno qualunque. Ad esempio, la serie X sin n n2 è assolutamente convergente, poiché ¯ ¯ ¯ sin n ¯ 1 ¯ ¯ ¯ n2 ¯ ≤ n2 . P Tuttavia, la divergenza assoluta, cioè la relazione |an | = +∞, non dà in generale alcuna informazione sul carattere della serie. P P Ad esempio, la serie (−1)n oscilla, ma diverge assolutamente. La serie (−1)n /n converge, ma diverge assolutamente. La convergenza di quest’ultima serie è una conseguenza del criterio di Leibniz, che si applica alle serie con termini di segno alternato. P+∞ Teorema 5.7.1 (Criterio di Leibniz) Sia n=1 (−1)n an tale che i) an > 0 per ogni n ii) an ≥ an+1 per ogni n iii) limn→+∞ an = 0. Allora la serie converge. Dimostrazione. Denotiamo con Am le somme parziali della serie, con A2k−1 le somme di indice dispari e con A2k le somme parziali di indice pari, k = 1, 2, 3, . . . Si ha A2k+1 = A2k−1 + a2k − a2k+1 . Per l’ipotesi ii) a2k −a2k+1 ≥ 0 e quindi A2k+1 ≥ A2k−1 . La successione {A2k−1 } è non decrescente. Analogamente, A2k+2 = A2k − a2k+1 + a2k+2 . Sempre per l’ipotesi ii), −a2k+1 + a2k+2 ≤ 0 e quindi A2k+2 ≤ A2k . successione {A2k } è non crescente. Inoltre La A1 ≤ A2k−1 = A2k − a2k < A2k ≤ A2 , poiché a2k > 0 per l’ipotesi i). Le successioni {A2k−1 } e {A2k } sono quindi convergenti, in quanto monotone e limitate. Poniamo S1 = lim A2k−1 , k→+∞ S2 = lim A2k . k→+∞ 5.8. Convergenza incondizionata 135 Si ha S2 − S1 = lim (A2k − A2k−1 ) = lim a2k = 0 k→+∞ k→+∞ per l’ipotesi iii). Quindi le successioni A2k e A2k−1 convergono allo stesso limite S, ossia S2 = S1 = S. Ne segue che la successione {Am } di tutte le somme parziali converge a S. Osservazione. Siano Am e S come nella dimostrazione del Teorema. La successione {A2k−1 } converge a S per difetto, mentre la successione {A2k } converge a S per eccesso. Si ha quindi per ogni k A2k+1 ≤ S ≤ A2k . Sia Em = |S − Am | l’errore commesso nel calcolo della somma della serie arrestandosi al passo m. Si ha E2k E2k−1 = = A2k − S ≤ A2k − A2k+1 = a2k+1 S − A2k−1 ≤ A2k − A2k−1 = a2k . Sia per m pari che dispari si ha dunque Em ≤ am+1 , cioè l’errore è minore del valore assoluto del primo termine trascurato. Esempi 5.7.2 +∞ X (−1)n converge. Infatti, le ipotesi i) – iii) sono chiaramente n n=1 1 1 soddisfatte da an = . In questo caso l’errore Em non supera . n m+1 1. La serie +∞ X (−1)n converge. Le ipotesi i) – iii) sono chiaramente sod1 + log n n=1 1 disfatte da an = . 1 + log n √ +∞ X n n (−1) 3. La serie converge. Le ipotesi i) e iii) sono ovviamente n + 1 n=1 soddisfatte. Per verificare la ii) si osserva che 2. La serie µ an+1 an ¶2 = n + 1 (n + 1)2 < 1, n (n + 2)2 da cui an+1 < an . 5.8 Convergenza incondizionata Sia a1 + a2 + a3 + a4 · · · + an + · · · 136 5. Serie una serie numerica. Accanto ad essa possiamo considerare una serie in cui si sia effettuata una permutazione dell’ordine degli addendi; ad esempio la seguente serie a1 + a3 + a2 + a5 + a7 + a4 + a9 + a11 + a6 + · · · , (5.8.1) in cui si scrivono due elementi di indice dispari seguiti da uno di indice pari. Si possono immaginare anche permutazioni più complesse, in cui si scambiano di posto gruppi con un numero variabile di addendi. In una somma finita si possono permutare gli addendi senza mutare il risultato della somma. Per studiare l’analoga proprietà per le serie, occorre innanzi tutto precisare il significato del termine ‘permutazione’ nel contesto di infiniti addendi. Definizione 5.8.2 Si chiama permutazione di N una qualsiasi applicazione biunivoca π : N → N. Data una serie a1 + a2 + a3 + a4 · · · + an · · · (5.8.3) e assegnata una permutazione π di N, si chiama serie permutata (o, semplicemente, permutazione) della serie (5.8.3) la serie aπ(1) + aπ(2) + aπ(3) + aπ(4) · · · + aπ(n) + · · · Ad esempio, la serie (5.8.1) è ottenuta dalla (5.8.3) mediante la permutazione 1 2 π: ↓ ↓ 1 3 3 ↓ 2 4 ↓ 5 5 ↓ 7 6 ↓ 4 7 ↓ 9 8 ↓ 11 9 ↓ 6 ... ↓ ... In generale, le somme parziali della permutazione di una serie possono dare luogo a una successione molto differente da quella delle somme parziali della serie originaria. Si consideri ad esempio la serie oscillante 1 − 1 + 1 − 1 + 1 − 1 + ··· Si consideri la serie permutata in cui si scrive 1 dal primo posto al decimo e −1 all’undicesimo, 1 dal dodicesimo posto al centesimo e −1 al centounesimo, 1 dal centoduesimo posto al millesimo, e −1 al milleunesimo, etc. Le sue somme parziali Ak sono asintotiche a k e di conseguenza divergono a +∞. In generale quindi, permutando gli addendi di una serie è possibile cambiarne il carattere. Esiste tuttavia una notevole classe di serie convergenti che possono essere permutate senza alterarne il carattere né la somma. Definizione 5.8.4 Una serie si dice incondizionatamente convergente se essa e tutte le sue serie permutate convergono. Le serie incondizionatamente convergenti hanno una semplice caratterizzazione. 5.9. Appendice 137 Teorema 5.8.5 Una serie è incondizionatamente convergente se e solo se è assolutamente convergente. In tal caso, tutte le serie permutate hanno la stessa somma. In particolare, una serie a termini positivi converge sempre alla stessa somma, comunque si permutino gli addendi. Per il Teorema appena enunciato, la serie −1 + 1 1 1 1 − + − + ··· 2 3 4 5 (5.8.6) converge, ma non incondizionatamente. Esistono quindi permutazioni che fanno mutare il carattere della serie. Inoltre, anche se una sua serie permutata converge, non è detto che converga alla stessa somma. Ad esempio, si può dimostrare che la somma della serie (5.8.6) è − log 2, e che la permutazione (5.8.1) converge a − 23 log 2. La dimostrazione del Teorema 5.8.5 è svolta (in forma più generale) nell’Appendice. 5.9 5.9.1 Appendice Somma di serie P P Definizione 5.9.1 Siano an e bn serie numeriche. Si chiama somma P delle due serie la serie (an + bn ). Siano Ak , Bk , e Ck le somme parziali della serie rispettivamente.Tra esse intercorre la relazione Ck = k X (an + bn ) = n=1 k X an + n=1 k X P an , P bn e bn = Ak + Bk . P (an + bn ) (5.9.2) n=1 Il seguente Teorema è conseguenza immediata di (5.9.2). P P Teorema 5.9.3 Se an eP bn sono regolari, e se non si presenta il caso di indecisione ∞ − ∞, anche (an + bn ) è regolare e si ha X (an + bn ) = X an + X bn . Il Teorema appena enunciato può essere utilizzato per dimostrare che il Corollario 5.4.4 non vale per due serie il cui termine generale non è definitivamente positivo. Consideriamo le due seguenti serie a termini di segno alterno +∞ X n=1 µ n (−1) (−1)n 1 √ + n n ¶ , +∞ X (−1)n √ . n n=1 138 5. Serie La seconda serie converge, per il criterio di Leibniz. La prima serie invece +∞ X (−1)n √ diverge, poiché essa è la somma della serie convergente e della serie n n=1 divergente +∞ X 1 . Tuttavia si ha n n=1 µ (−1)n 1 (−1)n √ + n n ¶ (−1)n ∼ √ . n Questo esempio mostra anche che l’ipotesi iii) del criterio di Leibniz non può essere sostituita dalla relazione di asintotico a un termine monotono decrescente. 5.9.2 Prodotto di serie P In generale, le somme an bn non sono il prodotto delle P parziali P della serie somme parziali di an e bn . La definizione della serie prodotto richiede un procedimento più elaborato. A titolo euristico, consideriamo le serie a0 + a1 x + a2 x2 + a3 x3 + · · · + an xn + · · · b0 + b1 x + b2 x2 + b3 x3 + · · · + bn xn + · · · ed eseguiamone il prodotto in modo puramente formale. Ordinando per potenze crescenti di x, si ottiene a0 b0 + x (a0 b1 + a1 b0 ) + x2 (a0 b2 + a1 b1 + a2 b0 ) + · · · + xn n X aj bn−j + · · · j=0 Siamo cosı̀ condotti alla seguente definizione. P+∞ P+∞ Definizione 5.9.4 Siano n=0 an e n=0 bn due serie numeriche. Si chiama P+∞ prodotto secondo Cauchy delle due serie la serie n=0 cn , ove cn = n X aj bn−j . j=0 P+∞ P+∞ Teorema 5.9.5 Siano n=0 an e n=0 bn due serie numeriche assolutamente P+∞ P+∞ convergenti e sia n=0 cn n=0 cn il loro prodotto secondo Cauchy. Allora converge assolutamente. Si ha inoltre +∞ X cn = n=0 +∞ X n=0 an · +∞ X bn . (5.9.6) n=0 Dimostrazione. Siano Ak , Bk e Ck le somme parziali delle tre serie. Osserviamo che k X n X X am bn . Ck = aj bn−j = n=0 j=0 0≤m+n≤k 5.9. Appendice 139 Quindi Ak Bk = k X am · m=0 = Ck + X k X X bn = n=0 am bn + X am bn (5.9.7) ∗ 0≤m+n≤k am bn . (5.9.8) ∗ P In (5.9.7) e (5.9.8) la somma ∗ 0 ≤ m ≤ k, am bn è estesa a tutti gli indici m e n tali che 0 ≤ n ≤ k, k < m + n ≤ 2k. Per ottenere la relazione (5.9.6) basta dimostrare che il secondo termine in (5.9.8) tende a 0 per k → +∞. In tal caso, infatti, lim Ck = lim Ak Bk = k→+∞ k→+∞ +∞ X an · n=0 +∞ X bn . n=0 Ragioniamo per k pari. Si ha ¯ ¯ ¯X ¯ ¯ ¯ a b m n¯ ≤ ¯ ∗ X |am bn | ≤ 2k X m=0 k≤m+n≤2k |am | 2k X |bn | n=k/2 + 2k X |am | 2k X 2k X |bn | → 0, n=k/2 |am | → 0 |bn | . (5.9.9) n=0 m=k/2 Per la convergenza assoluta delle due serie, le somme sono limitate. Per il criterio di Cauchy, 2k X P2k m=0 |am | e P2k n=0 |bn | per k → +∞. m=k/2 Per k dispari si ragiona allo stesso modo, sostituendo P+∞ (k − 1)/2 P+∞a k/2. Lo stesso ragionamento, applicato alle serie n=0 |an | e n=0 |bn |, dimostra la convergenza assoluta del prodotto secondo Cauchy. Se due serie convergono, ma ambedue non assolutamente, la serie prodotto può non convergere. Ad esempio, si consideri la serie +∞ X an = n=0 +∞ X (−1)n √ . n+1 n=0 Tale serie converge per P il criterio di Leibniz, ma non converge assolutamente. La serie prodotto di an con se stessa non converge. Infatti si ha cn = (−1)n n X j=0 √ 1 1 √ j+1 n+1−j 140 5. Serie e √ 1 1 1 1 1 √ √ ≥√ = . n+1 j+1 n+1−j n+1 n+1 Ne segue che cn non tende a zero, poiché |cn | = n X j=0 √ 1 1 1 √ ≥ (n + 1) = 1. n+1 j+1 n+1−j Si può però dimostrare, con ragionamenti non molto dissimili da quelli della dimostrazione del Teorema precedente, che se una delle due serie converge assolutamente e l’altra converge, allora il loro prodotto secondo Cauchy converge al prodotto delle somme delle due serie. 5.9.3 Proprietà associativa per le serie Dissociando i termini di una serie se ne può alterare il carattere, anche se la serie è regolare. Ad esempio, data la serie (banalmente convergente) 0 + 0 + 0 + 0 + · · · = (1 − 1) + (1 − 1) + (1 − 1) + · · · , dissociandone i termini si ottiene la serie oscillante 1 − 1 + 1 − 1 + 1 − 1 + ··· Inversamente, associando i termini P di una serie oscillante se ne può alterare il carattere. Tuttavia, se la serie an è regolare, si possono associare i termini senza mutarne il carattere. Infatti, siano Ak le somme parziali della serie P+∞ n=1 an . Associamo i termini della serie secondo una legge qualunque. Ad esempio (a1 + a2 ) + a3 + (a4 + a5 + a6 ) + (a7 + a8 ) + (a9 + a10 + a11 ) + · · · (5.9.10) Le somme parziali della nuova serie costituiscono una sottosuccessione di quelle della serie originaria. Infatti, le somme parziali della serie (5.9.10) sono A2 = (a1 + a2 ) A3 = (a1 + a2 ) + a3 A6 = (a1 + a2 ) + a3 + (a4 + a5 + a6 ) A8 = (a1 + a2 ) + a3 + (a4 + a5 + a6 ) + (a7 + a8 ) A11 = (a1 + a2 ) + a3 + (a4 + a5 + a6 ) + (a7 + a8 ) + (a9 + a10 + a11 ) .................. Poichè {Ak } è regolare, la sottosuccessione tende allo stesso limite. 5.9. Appendice 141 5.9.4 Permutazione dei termini di una serie P Teorema 5.9.11 (di Riemann) Sia an una serie numerica. P+∞ a) Se n=1 an converge assolutamente, allora la serie e ogni sua permutazione convergono alla stessa somma. P+∞ b) Se n=1 an converge, ma non assolutamente, comunque assegnati α e β tali che −∞ ≤ α ≤ β ≤ +∞, esiste una permutazione π tale che lim inf k→+∞ k X aπ(n) = α, n=1 lim sup k X k→∞ n=1 aπ(n) = β. Questo Teorema è chiaramente più generale del Teorema 5.8.5. Il punto b) afferma che una serie convergente, ma non assolutamente convergente, può essere permutata in modo che le sue somme parziali abbiano qualunque comportamemento prefissato. Dimostrazione. a) Innanzi tutto osserviamo che, assegnata una qualsiasi permutazione π : N → N, per ogni h esiste k ≥ h tale che {π(1), π(2), . . . , π(h)} ⊆ {1, 2, . . . , k} . Ne segue che +∞ X aπ(n) converge assolutamente, poiché n=1 h k +∞ X X ¯ ¯ X ¯aπ(n) ¯ ≤ |an | ≤ |an | . n=1 n=1 n=1 Per il criterioP di Cauchy, per ogni ε > 0 esiste p0 tale che per ogni p ≥ p0 e p+q ogni q ≥ 0 si ha n=p |an | < ε. Per ogni p ≥ p0 esiste r > p tale che {1, 2, . . . , p} ⊂ {π(1), π(2), . . . , π(r)} . Sia q > 0 tale che maxj=1,...,r π(j) = p + q. La differenza r X aπ(n) − n=1 p X an n=1 contiene solo addendi an con indice maggiore di p e minore o eguale a p + q. Si ha quindi ¯ ¯ p p+q r ¯X ¯ X X ¯ ¯ a − a ≤ |an | < ε. (5.9.12) ¯ n¯ π(n) ¯ ¯ n=1 n=1 n=p+1 Per p che tende a +∞, anche r tende a +∞ e quindi +∞ X n=1 aπ(n) = +∞ X n=1 an . 142 5. Serie P b) Possiamo eliminare da an gli addendi nulli, senza mutare il carattere della serie e delle sue permutazioni. Poniamo pn = |an | + an , 2 mn = |an | − an . 2 Consideriamo le due serie a termini non negativi X X pn , mn . (5.9.13) Esse non possono essere entrambe convergenti, altrimenti lo sarebbe la serie X X (pn + mn ) = |an | . D’altra parte, non possono essere una convergente e l’altra divergente, altrimenti sarebbe divergente la serie X X (pn − mn ) = an . Quindi le due serie in (5.9.13) sono ambedueP divergenti a +∞. Eliminati i termini nulli, gli addendi di pn sono tutti e soliPgli addendi P positivi di an nell’ordine in cui P si presentano, e gli addendi di −mn sono tutti e soli gli addendi negativi di an nell’ordine in cui si presentano. Siano {αj } e {βj } successioni di numeri reali tali che, per j → +∞, αj < βj , αj → α, βj → β. Sia k1 il primo intero tale che p1 + p2 + · · · + pk1 > β1 . P Un tale intero deve esistere, poiché pn = +∞. Definito k1 , sia h1 il primo intero tale che p1 + p2 + · · · + pk1 − m1 − m2 − · · · − mh1 < α1 . P Un tale intero deve esistere, poiché −mn = −∞. Sia ora k2 il primo intero maggiore di k1 tale che k1 X pn − n=1 h1 X mn + pk1 +1 + pk1 +2 + · · · + pk2 > β2 n=1 e sia h2 il primo intero il primo intero maggiore di h1 tale che k1 X n=1 pn − h1 X n=1 mn + k2 X pn − mh1 +1 − mh1 +2 − · · · − mh2 < α2 . n=k1 +1 Anche in questo caso k2 e h2 esistono, poiché le serie sono divergenti. 5.9. Appendice 143 Procedendo in questo modo, si costruiscono due successioni strettamente crescenti di interi kj e hj tali che k1 X pn − n=1 k1 X h1 X hj−1 mn + · · · − n=1 pn − n=1 h1 X X mn + n=1 kj X pn > βj (5.9.14) m n < αj . (5.9.15) n=kj−1 +1 n=hj−2 +1 mn + · · · + kj X pn − n=kj−1 +1 hj X n=hj−1 +1 Poiché kj è il primo indice successivo a kj−1 per cui vale (5.9.14), si ha anche k1 X n=1 Quindi pn − h1 X mn + · · · + pkj−1 +1 + · · · + pkj −1 ≤ βj . n=1 ¯ ¯ ¯ k1 ¯ hj−1 kj h1 X X X ¯X ¯ ¯ pn − mn + · · · − mn + pn − βj ¯¯ ≤ pkj . ¯ ¯n=1 ¯ n=1 n=hj−1 +1 n=kj−1 +1 Analogamente ¯ ¯ ¯ k1 ¯ kj hj h1 X X X ¯X ¯ ¯ pn − mn + · · · + pn − mn − αj ¯¯ ≤ mhj . ¯ ¯n=1 ¯ n=1 n=kj +1 n=hj−1 +1 P Poiché pkj → 0 e mhj → 0 (per la convergenza di an ), la serie p1 +· · ·+pk1 −m1 −· · ·−mh1 +pk1 +1 +· · ·+pk2 −mh1 +1 −· · ·−mh2 +pk2 +1 +· · · ha una sottosuccessione delle somme parziali (corrispondente agli indici hj ) che tende a α e una (corrispondente agli indici kj ) che tende a β. Per costruzione, α e β sono il limite superiore e inferiore delle somme parziali. Abbiamo cosı̀ costruito una permutazione della serie originaria con le proprietà desiderate. 5.9.5 Rappresentazione dei numeri reali come serie Sia α = a0 , a1 a2 . . . an . . . un numero reale positivo. Il troncamento n–esimo di α, definito nel capitolo 1, è il numero razionale α (n) n X aj . = a0 , a1 a2 . . . an = j 10 j=0 Nel paragrafo 1.5 abbiamo osservato che α = supn α(n) . D’altra parte, α(n) è la somma parziale n–esima della serie +∞ X aj . j 10 j=0 (5.9.16) 144 5. Serie Questa serie a termini non negativi converge per il criterio del confronto. Infatti, per j > 0 si ha aj · 10−j ≤ 9 · 10−j , termine generale (a meno del fattore moltiplicativo 9) della serie geometrica di ragione 1/10. Essendo la serie (5.9.16) a termini non negativi, la sua somma è l’estremo superiore delle somme parziali. Otteniamo cosı̀ la rappresentazione di un numero reale come serie: +∞ X aj α = sup α(n) = . j 10 n j=0 Possiamo identificare gli allineamenti decimali di periodo 9 con serie numeriche. Sia dato l’allineamento a0 , a1 a2 . . . an 9, con an 6= 9. Ad esso corrisponde la serie n +∞ X X aj 9 + . j j 10 10 j=0 j=n+1 Si ha +∞ X +∞ 9 9 X 1 9 1 1 = = n+1 · = n. j n+1 j 10 10 10 10 1 − 1/10 10 j=n+1 j=0 Quindi a0 , a1 a2 . . . an 9 = a0 + a1 a2 an 1 + 2 + ··· + n + n. 10 10 10 10 Capitolo 6 Limiti di funzioni 6.1 Introduzione Illustriamo il concetto di limite di una funzione con delle considerazioni intuitive su alcuni esempi. Esempi 6.1.1 1. Si consideri la funzione reale di variabile reale f (x) = x2 . Evidentemente, per valori di x prossimi a 0 i valori della funzione sono piccoli e prossimi a 0. 2. Si consideri la funzione reale di variabile reale, definita per x 6= 0, f (x) = sin x . x Quanto più x si approssima a 0, mantenendosi diverso da 0, tanto più i valori della funzione si approssimano a 1. 3. Si consideri la funzione reale di variabile reale, definita per x 6= 0, f (x) = − 1 . x2 Quanto più x è prossimo a 0, mantenendosi diverso da 0, tanto più i valori di − x12 si approssimano a −∞. 4. Si consideri la funzione reale di variabile reale, definita per x 6= 0, 2 f (x) = e−1/x . Quando x è prossimo a 0, mantenendosi diverso da 0, − x12 si approssima a −∞. Di conseguenza i valori dell’esponenziale si approssimano a 0. 145 146 6. Limiti di funzioni 5. Si consideri la funzione reale di variabile reale 1 f (x) = . x Quanto più x si approssima a +∞ tanto più i valori della funzione si approssimano a 0. 6. Si consideri la funzione f : R2 → R2 definita da f (x, y) = (x + y, x − y) . Quanto più (x, y) si approssima a (1, 1) tanto più il punto (x + y, x − y) si approssima al punto (2, 0). In sintesi possiamo dire che le funzioni di questi esempi sono definite in un insieme (di uno spazio metrico) di cui p è un punto di accumulazione. Negli esempi si ha rispettivamente p = 0, p = 0, p = 0, p = 0, p = +∞, p = (1, 1) . Al ‘tendere di x a p’ i valori f (x) ‘tendono a un limite `’. Negli esempi si ha rispettivamente ` = 0, ` = 1, ` = −∞, ` = 0, ` = 0, ` = (2, 0). Si noti che p non è necessariamente un punto in cui la funzione è definita (esempi 2, 3, 4), ma semplicemente un punto di accumulazione dell’insieme di definizione. Nel quinto esempio, la funzione è definita in R, di cui p = +∞ è un punto di accumulazione nella metrica d∗ su R, come dimostrato nel paragrafo 3.9. Ovviamente, f non è definita in +∞. Il concetto di limite, le cui prime formulazioni rigorose risalgono a Cauchy e Weierstrass, astrae e formalizza le considerazioni precedenti. 6.2 Limiti in spazi metrici Siano (X1 , d1 ) e (X2 , d2 ) due spazi metrici. Sia E ⊆ X1 un sottoinsieme non vuoto e sia p un punto di accumulazione di E. Sia f : E → X2 . Definizione 6.2.1 Si dice che f (x) tende a ` ∈ X2 per x che tende a p se: per ogni ε > 0 esiste δ > 0 tale che per ogni x ∈ E, tale che 0 < d1 (x, p) < δ, si ha d2 (f (x), `) < ε. La definizione si può scrivere in formula: ∀ε > 0 ∃δ ∀x ∈ E, 0 < d1 (x, p) < δ, si ha d2 (f (x), `) < ε. (6.2.2) Equivalentemente, f (x) tende a ` se per ogni ε > 0 esiste δ > 0 tale che per ogni x ∈ E ∩ B(p, δ), x 6= p, si ha f (x) ∈ B(`, ε). Il valore ` si chiama limite di f (x) per x che tende a p e si scrive lim f (x) = ` x→p oppure f (x) → ` per x → p. 6.2. Limiti in spazi metrici 147 L+ε L L-ε p-δ p p+δ limx→p f (x) = L Osservazioni. a) Nella formulazione della definizione di limite 6.2.1, il numero ε è positivo e arbitrariamente piccolo, mentre δ dipende da ε. In generale, diminuendo il valore di ε diminuisce anche il valore di δ. b) Come nel caso delle successioni, il limite, se esiste, è unico. Infatti, siano `1 6= `2 limiti di f (x) per x che tende a p. Sia ε tale che B(`1 , ε) ∩ B(`2 , ε) = ∅. Esiste δ1 tale che per ogni ogni x ∈ E, x ∈ B(p, δ1 ) e x 6= p, si ha f (x) ∈ B(`1 , ε). Analogamente, esiste δ2 tale che per ogni ogni x ∈ E, x ∈ B(p, δ2 ) e x 6= p, si ha f (x) ∈ B(`2 , ε). Sia δ = min(δ1 , δ2 ); se x ∈ B(p, δ) allora f (x) deve appartenere a B(`1 , ε) ∩ B(`2 , ε), assurdo. c) Come abbiamo già osservato nel paragrafo precedente, p non appartiene necessariamente a E; anche se vi appartenesse, il limite non dipende dal valore della funzione in x = p. In altri termini, alterando la definizione della funzione in x = p, l’esistenza e il valore del limite rimangono invariati. Ad esempio, consideriamo la funzione f : R → R definita da f (x) = x. Sia p = 0. Si ha banalmente lim x = 0. x→0 Infatti la condizione (6.2.2) è verificata: per ogni ε > 0, basta porre δ = ε. Alteriamo ora f ponendo ½ x se x 6= 0, fe(x) = 1 se x = 0. Di nuovo vale limx→0 fe(x) = 0. 148 6. Limiti di funzioni d) Come nel caso dei limiti di successioni, si ha f (x) → ` per x → p se solo se la funzione a valori reali positivi d2 (f (x), `) tende a 0 per x → p. Esempi 6.2.3 1. Sia f : R → R definita da f (x) = x2 .√ Sia p = 0. Dimostriamo che limx→0 f (x) = 0. Fissato ε > 0 sia δ = ε. Per 0 < |x − p| = |x| < δ si ha ¯ 2 ¯ ¯x − 0¯ = x2 < δ 2 = ε. 2. Sia di nuovo f (x) = x2 , ma sia p = 2. Dimostriamo che limx→2 f (x) = 4. Fissiamo ε > 0. Possiamo supporre ε < 1. Sia δ = ε/5. Per 0 < |x − 2| < δ si ha anche 0 < x + 2 < 4 + δ < 5. Quindi ¯ 2 ¯ ¯x − 4¯ = |x − 2| (x + 2) < 5δ = ε. 3. Sia f : R → R definita da f (x) = sin x. Sia p = 0. Dimostriamo che limx→0 f (x) = 0. Fissato ε > 0 sia δ = ε. Per 0 < |x| < δ si ha |sin x| < |x| < δ = ε. Analogamente si ha limx→0 cos x = 1. Infatti, fissato ε > 0 si ponga √ δ = ε. Si ha, per 0 < |x| < δ, |1 − cos x| = 1 − cos x < 1 − cos2 x = sin2 x < x2 < ε. 1 −3π −2π −π π f (x) = sin x x 2π 3π 6.2. Limiti in spazi metrici 149 sin x , definita per x 6= 0. Dimostriamo che limx→0 f (x) = 1. x Ricordiamo prima di tutto che per 0 < |x| < π/2 (diseguaglianze (4.5)) si ha sin x cos x < < 1. x √ Fissato ε > 0 (piccolo), sia δ = ε. Per 0 < |x| < δ si ha, per l’esempio precedente, 1 − cos x < ε, 4. Sia f (x) = da cui ¯ ¯ ¯ ¯ ¯1 − sin x ¯ = 1 − sin x < 1 − cos x < ε. ¯ x ¯ x In questo esempio, a differenza dei precedenti, la funzione f non è definita in p = 0. 5. Sia f : R2 → R2 definita da f (x, y) = (x + y, x − y). Sia p = (1, 1). Dimostriamo che lim f (x, y) = (2, 0). (x,y)→(1,1) Fissato ε > 0, sia δ = ε/4. Si ha per k(x, y) − (1, 1)k < δ |x − 1| ≤ k(x − 1, y − 1)k = k(x, y) − (1, 1)k < δ, |y − 1| ≤ k(x − 1, y − 1)k = k(x, y) − (1, 1)k < δ. Quindi ° ° °f (x, y) − (2, 0)° = k(x + y − 2, x − y)k ≤ |x + y − 2| + |x − y| ≤ (|x − 1| + |y − 1|) + (|x − 1| + |y − 1|) < 4δ = ε. xy . La funzione f è definita in ogni punto di R2 x2 + y 2 eccetto il punto (0, 0), ed assume valori in R. 6. Sia f (x, y) = p Sia p = (0, 0). Dimostriamo che lim (x,y)→(0,0) f (x, y) = 0. Si ha x2 + y 2 ± 2xy = (x ± y)2 ≥ 0 e quindi |xy| ≤ 1 2 ¡ 2 ¢ x + y 2 . Ne segue p x2 + y 2 ≤ p < x2 + y 2 . x2 + y 2 2 x2 + y 2 |f (x, y)| = p |xy| Fissato ε > 0, sia δ < ε. Per ogni (x, y) tale che k(x, y)k = da (6.2.4) si ottiene |f (x, y)| < ε. Anche in questo esempio la funzione non è definita in p. (6.2.4) p x2 + y 2 < δ, 150 6. Limiti di funzioni 7. La funzione f (x) = sgn x (signum, o segno, di x) è definita come ( x se x 6= 0 |x| sgn x = 0 se x = 0 Essa vale 1 per x > 0 e −1 per x < 0. Questa funzione non ammette limite per x → 0. Infatti, ogni intorno dell’origine contiene numeri positivi e numeri negativi. Scelto ε = 1/2, sgn x non appartiene a B(1, 1/2) per x < 0 e non appartiene a B(−1, 1/2) per x > 0. Quindi 1 e −1 non soddisfano la definizione di limite. Cosı̀ pure, il valore 0 non può essere il limite della funzione. Infine, se ` è un numero reale diverso da ±1 e da 0, qualsiasi intorno di `, non contenente 1, 0 e −1, non contiene nessun valore della funzione diverso da 0. 1 -1 f (x) = sgn x 6.3 Limiti infiniti e limiti all’infinito In questo paragrafo esaminiamo la definizione 6.2.1 di limite di una funzione nel caso in cui X1 o X2 , o entrambi, coincidano con R , e il punto di accumulazione p o il limite `, o entrambi, siano +∞ o −∞. Iniziamo dal caso in cui ` = ±∞. Tali valori sono elementi dello spazio metrico (R, d∗ ), descritto nel capitolo 3. Gli intorni di +∞ e di −∞ (privati di +∞ e −∞) nella metrica di d∗ sono, rispettivamente, gli insiemi (M, +∞) , (−∞, M ) , (6.3.1) ove M ∈ R. Una funzione f : E → R assume valori nell’intorno di +∞ (6.3.1) se f (x) > M (ovviamente, si ha f (x) 6= +∞, poiché la funzione è a valori reali ). Analogamente, f (x) assume valori nell’intorno (−∞, M ) se f (x) < M . La definizione di limite assume quindi la seguente forma nel caso dei limiti infiniti di una funzione a valori in R. Sia (X, d) uno spazio metrico, E ⊆ X un sottoinsieme non vuoto e p un punto di accumulazione di E. Sia f : E → R. 6.3. Limiti infiniti e limiti all’infinito 151 Definizione 6.3.2 Si dice che f (x) tende a +∞ per x che tende a p se: per ogni M esiste δ > 0 tale che per ogni x ∈ E, tale che 0 < d(x, p) < δ, si ha f (x) > M . In formula: ∀M ∃δ ∀x ∈ E, 0 < d(x, p) < δ, si ha f (x) > M. Analogamente, si dice che f (x) tende a −∞ per x che tende a p se: ∀M ∃δ ∀x ∈ E, 0 < d(x, p) < δ, si ha f (x) < M. Nel caso del limite +∞ il numero M può essere scelto positivo e grande a piacere. Il numero δ è positivo, dipende da M e decresce, in generale, al crescere di M . Nel caso del limite −∞ il numero M può essere scelto negativo con valore assoluto grande a piacere. M p-δ p+δ p limx→p f (x) = +∞ La notazione per i limiti infiniti è la stessa introdotta nel paragrafo precedente: lim f (x) = +∞ oppure f (x) → +∞ per x → p, lim f (x) = −∞ oppure f (x) → −∞ per x → p. x→p x→p Si noti che f (x) → +∞ per x → p se e solo se −f (x) → −∞ per x → p. Se X = R, la retta x = p viene chiamata asintoto verticale al grafico della funzione. Esempi 6.3.3 1 , definita per x 6= 0. Sia p = 0. Dimostriamo x2 che limx→0 f (x) = +∞. √ Fissato M > 0 sia δ = 1/ M . Per ogni x 6= 0 tale che |x| < δ si ha 1. Sia X = R, e sia f (x) = 1 1 > 2 = M. 2 x δ 152 6. Limiti di funzioni 2. Sia E = (0, +∞) ⊂ R e sia f : E → R definita da f (x) = log x. Dimostriamo che f (x) → −∞ per x → 0. Fissato M > 0, si ha log x < −M se e solo se x < e−M . Poniamo quindi δ = e−M . Per ogni x tale che 0 < x < e−M si ha log x < −M . Esaminiamo ora il caso in cui p = ±∞. Sia E ⊆ R un insieme illimitato superiormente. Per il Teorema 3.9.4, +∞ è un punto di accumulazione di E in R con la metrica d∗ . Analogamente, se E ⊆ R è un insieme illimitato inferiormente, −∞ è un punto di accumulazione di E. Nel primo caso ogni intervallo (M, +∞) contiene infiniti punti di E. Nel secondo caso ogni intervallo (−∞, M ) contiene infiniti punti di E. Chiaramente +∞ (rispettivamente −∞) non appartiene a E, poiché E ⊆ R. L+ε L L-ε M limx→+∞ f (x) = L Sia (X, d) uno spazio metrico. Sia E ⊆ R illimitato superiormente e sia f : E → X. Definizione 6.3.4 Si dice che f (x) tende a ` ∈ X per x che tende a +∞ se: ∀ε > 0 ∃M ∀x ∈ E, x > M, si ha d (f (x), `) < ε. Se f : E → X e E ⊆ R è illimitato inferiormente, si ha la definizione analoga. Definizione 6.3.5 Si dice che f (x) tende a ` per x che tende a −∞ se: ∀ε > 0 ∃M ∀x ∈ E, x < M, si ha d (f (x), `) < ε. Le notazioni in questo caso sono le seguenti lim f (x) = ` oppure f (x) → ` per x → +∞, lim f (x) = ` oppure f (x) → ` per x → −∞. x→+∞ x→−∞ Se X = R, la retta y = ` si chiama asintoto orizzontale al grafico della funzione. 6.3. Limiti infiniti e limiti all’infinito 153 Esempi 6.3.6 1 . Si ha f (x) → 0 per x x → +∞. Infatti, fissato ε > 0, si ponga M = 1/ε. Per ogni x > M si ha 1. Sia E = (0, +∞) e f : E → R definita da f (x) = 0< 1 1 < = ε. x M 1 → 0 per x → −∞. x In modo analogo si dimostra che 2. Sia f : R → R definita da f (x) = ex . Dimostriamo che f (x) → 0 per x → −∞. Fissato ε > 0, sia M = log ε (si noti che log ε < 0 per ε < 1). Per ogni x < log ε si ha ex < elog ε = ε 3. Sia E = (−∞, 0) e sia f : E → R2 definita da f (x) = (ex , 1/x). Dimostriamo che f (x) → (0, 0) per x → −∞. Fissato ε > 0, per gli esempi 1 e 2 precedenti, esiste M > 0 tale che per x < −M si ha contemporaneamente ¯ ¯ ¯1¯ ¯ ¯ < ε/2, ex < ε/2, ¯x¯ da cui ° ° °f (x)° = r e2x + 1 ε < √ < ε. 2 x 2 4. Sia f (x) = arctan x. Si ha lim arctan x = x→+∞ π , 2 π lim arctan x = − . 2 x→−∞ (6.3.7) Dimostriamo il primo limite in (6.3.7). Fissiamo ε, con 0 < ε < π/2. Sia M = tan(π/2 − ε). Per x > M si ha ³ ³π ´´ π π > arctan x > arctan M = arctan tan − ε = − ε. 2 2 2 Il secondo limite si dimostra in maniera analoga. 5. La definizione di limite per una successione rientra nella definizione precedente. Infatti, sia E = N ⊂ R. Una funzione f : N → X è una successione a valori in X. Se la successione f (n) converge a ` per n → +∞ secondo la definizione del capitolo 3, per ogni ε > 0 esiste n0 tale che per ogni n > n0 si ha definitivamente f (n) ∈ B(`, ε). Questa definizione coincide con la definizione 6.3.4 in cui si ponga M = n0 . 154 6. Limiti di funzioni N M limx→+∞ f (x) = +∞ Infine esaminiamo il caso in cui ambedue gli spazi metrici coincidono con R e sia p che ` sono infiniti. Sia E ⊆ R illimitato superiormente e sia f : E → R. Definizione 6.3.8 Si dice che f (x) tende a +∞ per x che tende a +∞ se: ∀N ∃M ∀x ∈ E, x > M, si ha f (x) > N. Si dice che f (x) tende a −∞ per x che tende a +∞ se: ∀N ∃M ∀x ∈ E, x > M, si ha f (x) < N. Anche in questo caso è chiaro che f (x) → +∞ se e solo se −f (x) → −∞. La definizione di limite infinito per x che tende a −∞ è analoga. Sia E ⊆ R illimitato inferiormente e sia f : E → R. Definizione 6.3.9 Si dice che f (x) tende a +∞ per x che tende a −∞ se: ∀N ∃M ∀x ∈ E, x < M, si ha f (x) > N. Si dice che f (x) tende a −∞ per x che tende a −∞ se: ∀N ∃M ∀x ∈ E, x < M, si ha f (x) < N. Le notazioni per i limiti infiniti all’infinito sono le seguenti lim f (x) = ±∞ oppure f (x) → ±∞ per x → +∞, lim f (x) = ±∞ oppure f (x) → ±∞ per x → −∞. x→+∞ x→−∞ 6.3. Limiti infiniti e limiti all’infinito 155 x y=e y=log x 1 1 Le funzioni ex e log x Esempi 6.3.10 1. Sia f : R → R definita da f (x) = ex . Si ha f (x) → +∞ per x → +∞. Infatti, fissato N > 0 sia M = log N . Per x > M si ha ex > elog N = N . In modo analogo si dimostra che e−x → +∞ per x → −∞. 2. Sia f : R → R definita da f (x) = x3 . Allora f (x) → +∞ per x → +∞ e f (x) → −∞ per x → −∞. Fissato N > 0 sia M = N 1/3 . Per x > M si ha x3 > N , mentre per x < −M si ha x3 < −N . 3. La parte intera [x] di un numero reale x è il massimo intero relativo che non supera x. Ad esempio, [1/2] = 0, [−1/2] = −1, [3/2] = 1, [−3/2] = −2. Dimostriamo che lim [x] = +∞, x→+∞ lim [x] = −∞. x→−∞ Innanzi tutto osserviamo che si ha sempre [x] ≤ x < [x]+1. Fissato N > 0 si ponga M = N + 1. Per x > M si ha [x] > x − 1 > N. Per x < −M si ha [x] ≤ x < −N − 1 < −N . 156 6. Limiti di funzioni 3 2 1 –4 –3 –2 –1 1 2 3 4 –1 –2 –3 –4 f (x) = [x] 6.4 Limiti di funzioni reali di variabile reale Sia E ⊆ R e sia x0 ∈ E 0 . In questo paragrafo consideriamo funzioni f : E → R e poniamo, come di consueto, la metrica euclidea in R. Nei casi più comuni E sarà un intervallo, eventualmente privato del punto x0 . Sia ` un numero reale. La definizione di limite 6.2.1 in questo caso diviene ∀ε > 0 ∃δ ∀x ∈ E, 0 < |x − x0 | < δ, si ha |f (x) − `| < ε. (6.4.1) La condizione |f (x) − `| < ε equivale a ` − ε < f (x) < ` + ε. Come nel caso dei limiti di successioni, f (x) può tendere a ` mantendosi maggiore, oppure minore di ` in un opportuno intorno di x0 (privato di x0 stesso). Definizione 6.4.2 Sia E ⊆ R, sia x0 ∈ E 0 e sia f : E → R. Si dice che la funzione tende a ` ∈ R per eccesso o dalla destra per x → x0 , se ∀ε > 0 ∃δ ∀x ∈ E, 0 < |x − x0 | < δ, si ha ` ≤ f (x) < ` + ε. Analogamente, si dice che la funzione tende a ` ∈ R per difetto o dalla sinistra per x → x0 , se ∀ε > 0 ∃δ ∀x ∈ E, 0 < |x − x0 | < δ, si ha ` − ε < f (x) ≤ `. 6.4. Limiti di funzioni reali di variabile reale 157 Se f (x) tende a ` dalla destra si scrive lim f (x) = ` + , x→x0 o anche f (x) → ` + per x → x0 . Se f (x) tende a ` dalla sinistra si scrive lim f (x) = ` − , x→x0 o anche f (x) → ` − per x → x0 . L’analoga definizione vale se f è definita in un insieme E ⊆ R illimitato superiormente e x → +∞, oppure in un insieme E illimitato inferiormente e x → −∞. Basta sostituire, nella definizione precedente, gli intorni di x0 con gli intorni di +∞ (cioé gli intervalli (M, +∞)) o di −∞ (cioé gli intervalli (−∞, M )). Lasciamo al lettore il semplice esercizio di formulare la definizione per questi limiti. Esempi 6.4.3 1. Sia f (x) = sin x . Si ha f (x) → 1− per x → 0. x 2. Sia f (x) = x2 . Si ha f (x) → 0+ per x → 0. 3. Sia f (x) = 1 . Si ha x lim x → +∞ 1 =0+ , x lim x → −∞ 1 =0−. x 4. Sia f (x) = x3 . Si ha f (x) → 0 per x → 0, ma il limite non è né per eccesso né per difetto. Infatti, f (x) > 0 per x > 0 e f (x) < 0 per x < 0. Sia, come sopra, f : E ⊆ R → R, e sia x0 ∈ E 0 . La condizione 0 < |x − x0 | < δ in (6.4.1) è equivalente alle due condizioni x0 < x < x0 + δ, x0 − δ < x < x 0 . Può accadere che f (x) non abbia limite per x → x0 , ma che esista ` tale che la condizione |f (x) − `| < ε sia verificata per x0 < x < x0 + δ, oppure per x0 − δ < x < x0 . In questo caso si ha una nozione di limite per x che tende a x0 dalla destra, o per x che tende a x0 dalla sinistra. Definizione 6.4.4 Sia f : E ⊆ R → R, e sia x0 ∈ E 0 . Sia ` ∈ R. Si dice che f (x) tende a ` per x che tende a x0 per eccesso o dalla destra se ∀ε > 0 ∃δ ∀x ∈ E, x0 < x < x0 + δ, si ha |f (x) − `| < ε. Si dice che f (x) tende a ` per x che tende a x0 per difetto, o dalla sinistra se ∀ε > 0 ∃δ ∀x ∈ E, x0 − δ < x < x 0 , si ha |f (x) − `| < ε. 158 6. Limiti di funzioni Se f (x) tende a ` per x che tende a x0 dalla destra si scrive lim f (x) = `, o anche f (x) → ` per x → x0 + . x→x0+ Se f (x) tende a ` per x che tende a x0 dalla sinistra si scrive lim f (x) = `, x→x0 − o anche f (x) → ` per x → x0 − . Gli intervalli [x0 , x0 + δ) e (x0 − δ, x0 ], benché non siano aperti, vengono rispettivamente chiamati intorni destri e sinistri di x0 . Esempi 6.4.5 1. Consideriamo la funzione f (x) = sgn x, introdotta nell’esempio 6.2.3.7. Si ha f (x) → −1 per x → 0 − , f (x) → 1 per x → 0 + . 2. Consideriamo la funzione f (x) = [x], introdotta nell’esempio 6.3.10.3. Per ogni n intero si ha f (x) → n − 1 per x → n − , f (x) → n per x → n + . 3. La funzione mantissa di x è definita per ogni x reale mediante la formula mant x = x − [x]. Essa vale ovviamente 0 in ogni intero. Per ogni intero n si ha f (x) → 1 per x → n − , f (x) → 0 per x → n + . 1 –4 –3 –2 –1 0 1 2 3 4 f (x) = mant x In modo analogo si definiscono i limiti infiniti per x → x0 − e x → x0 +. Basta sostituire, nella definizione 6.4.4, gli intorni di ` con gli intorni di +∞ (f (x) > M ) o di −∞ (f (x) < M ). Lasciamo al lettore il semplice esercizio di formulare la definizione per questi limiti. Le notazioni sono simili alle precedenti: lim f (x) = ±∞, o anche f (x) → ±∞ x→x0+ per x → x0 + . Analogamente lim f (x) = ±∞, x→x0 − o anche f (x) → ±∞ per x → x0 − . 6.4. Limiti di funzioni reali di variabile reale 159 Esempi 6.4.6 1. Sia f (x) = 1 , definita per x 6= 0. Sia x0 = 0. Si ha x lim x → 0+ 1 = +∞ , x lim x → 0− 1 = −∞. x 0 f (x) = 1 x 2. Sia f (x) = e1/x , definita per x 6= 0. Sia x0 = 0. Si ha e1/x → +∞ per x → 0+, 1 0 f (x) = e1/x e1/x → 0 per x → 0−. 160 6. Limiti di funzioni Dalle definizioni precedenti si ricava in modo ovvio la definizione delle scritture lim f (x) = `+, x→x0+ lim f (x) = `+, x→x0− lim f (x) = `−, x→x0+ lim f (x) = ` − . x→x0− ove ` ∈ R. A titolo di esempio, diamo la definizione del primo di questi limiti. Si dice che f (x) tende a ` per eccesso al tendere di x a x0 dalla destra se: per ogni ε > 0 esiste δ > 0 tale che per ogni x ∈ E, x0 < x < x0 + δ, si ha ` ≤ f (x) < ` + ε. Ad esempio: mant x → 0+ per x → 1+; mant x → 1− per x → 1−; e1/x → 0+ per x → 0−. Sia f : (a, x0 ) ∪ (x0 , b) → R. Se f (x) → ` (finito o infinito) per x → x0 , si ha immediatamente che f (x) → ` sia per x → x0 + che x → x0 −. Vale anche la proprietà inversa. Teorema 6.4.7 Sia f : (a, x0 ) ∪ (x0 , b) → R. Si ha limx→x0 f (x) = ` ∈ R se e solo se lim f (x) = lim f (x) = `. (6.4.8) x→x0 − x→x0 + Dimostrazione. Dimostriamo il Teorema supponendo ` ∈ R. La dimostrazione nel caso dei limiti infiniti è la stessa, sostituendo agli intorni di ` ∈ R gli intorni di +∞ o −∞. Supponiamo che valga (6.4.8). Per ogni ε > 0 esiste δ1 > 0 tale che per ogni x ∈ (a, b), tale che x0 < x < x0 + δ1 , si ha |f (x) − `| < ε. Analogamente, esiste δ2 > 0 tale che per ogni x ∈ (a, b), tale che x0 − δ2 < x < x0 , si ha |f (x) − `| < ε. Posto δ = min(δ1 , δ2 ), per ogni x ∈ (a, b), tale che 0 < |x − x0 | < δ, si ha |f (x) − `| < ε. 6.5 Segno, confronto. Sia f una funzione a valori reali. I concetti di funzione limitata, massimo, minimo (se esistono), estremo superiore e inferiore di f si definiscono, come per le successioni, per mezzo del coinsieme di f . Definizione 6.5.1 Sia (X, d) uno spazio metrico e sia E ⊆ X. Una funzione f : E ⊆ X → R si dice limitata in E (limitata superiormente, inferiormente) se f (E) è un insieme limitato (rispettivamente, limitato superiormente, inferiormente). Si dice che α è l’estremo superiore (che β è l’estremo inferiore) di f (x) su E se α (rispettivamente β) è l’estremo superiore (rispettivamente, inferiore) di f (E). Si dice f (x) ha massimo in E (che f (x) ha minimo in E) se f (E) ha massimo (rispettivamente, minimo). Il massimo M e il minimo m (se esistono) di f (x) in E vengono anche chiamati massimo assoluto e minimo assoluto della funzione in E. Ogni punto 6.5. Segno, confronto. 161 x0 ∈ E tale che f (x0 ) = M si chiama punto di massimo assoluto della funzione in E. Analogamente, ogni punto x0 ∈ E tale che f (x0 ) = m si chiama punto di minimo assoluto della funzione in E. Si ha ∀x ∈ E ∀x ∈ E f (x) ≤ f (x0 ) f (x) ≥ f (x0 ) se x0 è punto di massimo assoluto, se x0 è punto di minimo assoluto. Le notazioni per massimo, minimo, estremo superiore e inferiore di f (x) in E sono max f (x), min f (x), sup f (x), inf f (x). x∈E x∈E x∈E x∈E Qualora non ci sia possibilità di equivoci, si può omettere l’indicazione x ∈ E. Esempi 6.5.2 1. Sia f (x) = mant x e sia E = R. La funzione è limitata e si ha sup mant x = 1, inf mant x = min mant x = 0. La funzione non ha massimo. e → R, e sia E ⊆ E. e Il massimo e il minimo (se esistono), l’estremo 2. Sia f : E superiore e l’estremo inferiore della restrizione di f (x) al sottoinsieme E possono mutare al variare di E. Ad esempio, sia f (x) = ex , definita in e = R. Sia E = [0, +∞). Si ha E sup ex = +∞, x∈[0,+∞) inf x∈[0,+∞) ex = min x∈[0,+∞) ex = e0 = 1 . Sia ora E = (−∞, 0]. Si ha sup x∈(−∞,0] ex = max x∈(−∞,0] ex = e0 = 1, inf x∈(−∞,0] ex = 0. Sia f : E ⊆ X → R, ove (X, d) è uno spazio metrico. Se f (x) → ` ∈ R per x → p ∈ E 0 , allora esiste un intorno B(p, δ) tale che f (x) è limitata in B(p, δ) ∩ E. Infatti, fissato ε = 1, esiste δ tale che per ogni x ∈ B(p, δ) ∩ E, x 6= p, si ha ` − 1 < f (x) < ` + 1. In modo analogo si vede che, se f (x) → +∞ per x → p ∈ E 0 , esiste un intorno B(p, δ) tale che f (x) è illimitata superiormente su B(p, δ) ∩ E. Cosı̀ pure, se f (x) → −∞ per x → p ∈ E 0 , esiste un intorno B(p, δ) tale che f (x) è illimitata inferiormente su B(p, δ) ∩ E. Queste considerazioni valgono anche se p = ±∞, sostituendo a B(p, δ) gli intervalli (M, +∞) o (−∞, M ) rispettivamente. Sia (X, d) uno spazio metrico, sia E ⊆ X e p ∈ E 0 . Sia f : E ⊆ X → R. Nel seguito di questo paragrafo, e nei paragrafi successivi, dimostreremo ulteriori 162 6. Limiti di funzioni risultati sul comportamento di f (x) in un intorno di p, privato del punto p stesso. Dalla trattazione precedente appare chiaro, che per funzioni di variabile reale, o a valori reali, i casi in cui p o il limite ` siano infiniti non richiedono in realtà una discussione separata. Infatti, essi sono elementi dello spazio metrico R studiato nel capitolo 3. Il formalismo degli spazi metrici ci permette di trattare in modo unitario anche i casi infiniti. D’ora innanzi, nel caso in cui X = R e p = +∞, oppure p = −∞, è sottinteso che gli intorni di p (privati di p stesso) sono gli intorni nella metrica introdotta nel capitolo 3 in R. In altri termini, essi sono gli intervalli (−∞, M ) se p = −∞, e gli intervalli (M, +∞) se p = +∞. Analogamente, se f (x) tende a ` per x → p, il limite potrà essere sia un numero reale che ±∞. Se ` = ±∞, gli intorni di ` saranno gli intorni appena descritti. Il seguente Teorema è l’analogo, per i limiti di funzioni, del Teorema 4.5.1 Teorema 6.5.3 (di permanenza del segno) Sia (X, d) uno spazio metrico, sia E ⊆ X e p ∈ E 0 . Sia f : E ⊆ X → R una funzione tale che f (x) → ` per x → p. a) Se ` > 0, allora esiste un intorno B(p, δ) tale che f (x) > 0 per ogni x ∈ B(p, δ) ∩ E, x 6= p. b) Se ` < 0, allora esiste un intorno B(p, δ) tale che f (x) < 0 per ogni x ∈ B(p, δ) ∩ E, x 6= p. c) Se esiste un intorno B(p, δ), tale che f (x) ≥ 0 per ogni x ∈ B(p, δ) ∩ E, x 6= p, allora ` ≥ 0. d) Se esiste un intorno B(p, δ), tale che f (x) ≤ 0 per ogni x ∈ B(p, δ) ∩ E, x 6= p, allora ` ≤ 0. Dimostrazione. a) Sia ` ∈ R e sia ε > 0 tale che ` − ε > 0. Per la definizione di limite esiste δ > 0 tale che 0 < ` − ε < f (x) < ` + ε. per ogni x ∈ E tale che 0 < d(x, p) < δ. Quindi a) è vera. In modo analogo si dimostra b). Se ` = ±∞, la dimostrazione è analoga. c) Supponiamo ora che esista δ tale che f (x) ≥ 0 per ogni x ∈ E tale che 0 < d(x, p) < δ. Allora non può essere ` < 0. Altrimenti, per il punto b), esisterebbe δ1 tale che f (x) < 0 per ogni x ∈ E con 0 < d(x, p) < δ1 . Posto δ2 = min(δ, δ1 ), i punti x ∈ E tale che 0 < d(x, p) < δ2 dovrebbero soddisfare sia la condizione f (x) ≥ 0 che f (x) < 0, assurdo. Quindi c) è vera. In modo analogo si dimostra d). In modo analogo ai teoremi del confronto per le successioni si dimostrano i teoremi del confronto per le funzioni. 6.6. Limiti di successioni e limiti di funzioni 163 Teorema 6.5.4 (del confronto; limite finito) Siano f , g, h, tre funzioni definite in un sottoinsieme E di uno spazio metrico (X, d) a valori in R. Sia p ∈ E 0 . Supponiamo che i) limx→p f (x) = limx→p h(x) = ` ∈ R ii) esiste δ > 0 tale che per ogni x ∈ B(p, δ) ∩ E, x 6= p, si abbia f (x) ≤ g(x) ≤ h(x). (6.5.5) Allora si ha anche limx→p g(x) = `. Dimostrazione. Si fissi ε > 0. Esistono δ1 e δ2 tali che per ogni x ∈ E 0 < d(x, p) < δ1 =⇒ ` − ε < f (x) < ` + ε, 0 < d(x, p) < δ2 =⇒ ` − ε < h(x) < ` + ε. (6.5.6) (6.5.7) Posto δ3 = min(δ, δ1 , δ2 ), per x ∈ E, con 0 < d(x, p) < δ3 , valgono contemporaneamente (6.5.5), (6.5.6) e (6.5.7). Quindi, per tali valori di x si ha ` − ε < f (x) ≤ g(x) ≤ h(x) < ` + ε, da cui la tesi. Teorema 6.5.8 (del confronto; limite infinito) Siano f e g due funzioni definite in un sottoinsieme E di uno spazio metrico (X, d) a valori in R. Sia p ∈ E0. Esista δ > 0 tale che per ogni x ∈ B(p, δ) ∩ E, x 6= p, si abbia f (x) ≤ g(x). Allora a) se limx→p f (x) = +∞, si ha anche limx→p g(x) = +∞; b) se limx→p g(x) = −∞, si ha anche limx→p f (x) = −∞. Dimostrazione. Dimostriamo a). Per ogni M > 0 esiste δ1 > 0 tale che per ogni x ∈ E 0 < d(x, p) < δ1 =⇒ f (x) > M. Posto δ2 = min(δ, δ1 ), per ogni x ∈ B(p, δ2 ) ∩ E, x 6= p, si ha g(x) ≥ f (x) > M . In modo analogo si dimostra b). 6.6 Limiti di successioni e limiti di funzioni Abbiamo visto nell’esempio 6.3.6.5 che la nozione di limite per le successioni è un caso particolare della nozione generale di limite per funzioni tra spazi metrici. D’altra parte, i limiti di funzioni possono essere ricondotti a limiti di successioni, nel senso che verrà chiarito tra poco. Iniziamo con due esempi. Sia f (x) = x2 . Abbiamo visto (esempio 6.2.1) che f (x) → 0 per x → 0. Consideriamo una qualunque successione di numeri reali 164 6. Limiti di funzioni xn tale che xn → 0 per n → +∞. Calcolando la funzione nei valori xn si ottiene la nuova successione f (xn ) = x2n → 0 per n → +∞. sin x , definita per x 6= 0. Sappiamo che f (x) → 1 x (esempio 6.2.3) per x → 0. Data una qualunque successione di numeri xn 6= 0, tali che xn → 0, si ha pure (Teorema 4.5.7) Analogamente, sia f (x) = f (xn ) = sin xn → 1 per n → +∞. xn 1 f(x ) n f(x3) f(x2) f (xn ) = xn x3 x2 x 1 sin xn xn La situazione messa in luce da questi due esempi ha carattere del tutto generale. Teorema 6.6.1 Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici. Sia E ⊆ X1 e sia p ∈ E 0 . Sia f : E → X2 . Le due seguenti affermazioni sono equivalenti i) limx→p f (x) = `; ii) limn→+∞ f (xn ) = ` per ogni successione {xn } verificante le tre seguenti proprietà: xn 6= p, xn ∈ E, xn → p per n → +∞. (6.6.2) Dimostrazione. Supponiamo dapprima che valga i) e sia {xn } una successione di punti verificante (6.6.2). Si fissi ε > 0 e sia δ tale che d2 (f (x), `) < ε per ogni x ∈ B(p, δ) ∩ E, x 6= p. (6.6.3) Poiché xn → p, esiste n0 tale che per ogni n > n0 si ha xn ∈ B(p, δ). Quindi, per n > n0 i valori xn soddisfano (6.6.3), da cui d2 (f (x), `) < ε. Segue ii). 6.7. Calcolo dei limiti 165 Viceversa valga ii) per ogni successione che verifica le tre proprietà (6.6.2). Per assurdo, supponiamo che non valga i). Allora esiste ε > 0 tale che per ogni δ > 0 esiste un punto x soddisfacente (6.6.3), ma tale che d2 (f (x), `) ≥ ε. Assegnando a δ successivamente i valori 1, 1/2, 1/3, . . . , 1/n, . . ., si ottiene una successione di punti xn tale che xn ∈ B(p, δ) ∩ E, xn 6= p, ma tali che d2 (f (xn ), `) ≥ ε. Quindi la successione {xn } soddisfa le tre proprietà (6.6.2), ma f (xn ) non tende a `, contro l’ipotesi. L’equivalenza espressa dal teorema continua a sussistere se f è definita in un insieme E ⊆ R, p ∈ R e il limite di f (x) è per x → p+ oppure x → p−. In questo caso, la terza condizione in (6.6.2) va sostituita da xn → p+ oppure xn → p−, rispettivamente. Cosı̀ pure, l’equivalenza continua a valere se f (x) → `+ o f (x) → `−. In questo caso la ii) viene sostituita da f (xn ) → `+ o f (xn ) → `−, rispettivamente. 6.7 Calcolo dei limiti Il Teorema 6.6.1 permette di dedurre il calcolo dei limiti per funzioni a valori reali a partire dal calcolo dei limiti per successioni a reali. Teorema 6.7.1 Sia (X, d) uno spazio metrico e sia E ⊆ X. Sia p ∈ E 0 . Siano f, g : E → R. Sia lim f (x) = α, lim g(x) = β, x→p x→p ove α, β ∈ R. Allora a) limx→p [f (x) + g(x)] = α + β b) limx→p [f (x) · g(x)] = αβ c) limx→p f (x) α = g(x) β (g(x) 6= 0) d) limx→p f (x)g(x) = αβ (f (x) > 0) e) limx→p logg(x) f (x) = logβ α (f (x) > 0 e g(x) > 0, g(x) 6= 1), ove le operazioni sui limiti sono da interpretare secondo le tabelle di aritmetizzazione parziale I–VII del capitolo 4 per i simboli +∞ , −∞, 0+, 0−, e ove non si presentino le forme di indecisione della Tabella VIII. 166 6. Limiti di funzioni Dimostrazione. Dimostriamo ad esempio a). La dimostrazione degli altri punti è del tutto analoga. Sia {xn } una qualunque successione verificante le tre proprietà (6.6.2). Allora, per il Teorema precedente ((i)=⇒ ii)), si ha f (xn ) → α, g(xn ) → β per n → +∞. Se non si presentano forme di indecisione, si ha f (xn ) + g(xn ) → α + β per n → +∞. Ne segue, sempre per il Teorema 6.6.1 (l’affermazione ii) implica la i)), f (x) + g(x) → α + β per x → p. Come ulteriore applicazione del Teorema 6.6.1, si dimostrano per le funzioni i limiti notevoli analoghi a quelli del Teorema 4.8.17 per le successioni. La dimostrazione, come sopra, consiste nella riduzione dei limiti di funzione a limiti di successioni. Teorema 6.7.2 Sia (X, d) uno spazio metrico e sia E ⊆ X. Sia p ∈ E 0 . Sia ε(x) una funzione definita in E a valori in R tale che ε(x) 6= 0 e ε(x) → 0 per x → p. Sia a ∈ R. Allora, per x → p si ha: a) (1 + a · ε(x)) 1/ε(x) → ea b) log(1 + a · ε(x)) →a ε(x) c) aε(x) − 1 → log a ε(x) d) (1 + ε(x))a − 1 →a ε(x) (se a > 0). Si noti che, come caso particolare del punto a), si ha ¶x ¶x µ µ 1 1 lim = lim = e. 1+ 1+ x→+∞ x→−∞ x x Il Teorema 6.6.1 riconduce anche lo studio dei limiti di funzioni a valori in Rk allo studio dei limiti di successioni. Innanzi tutto osserviamo che una funzione f : E → Rk è individuata da k funzioni a valori reali fj : E → R, j = 1, 2, . . . , k. In altri termini f (x) = (f1 (x), f2 (x), . . . , fk (x)) . (6.7.3) Il seguente Teorema è l’analogo del Teorema 4.11.5 Teorema 6.7.4 Sia (X, d) uno spazio metrico e sia E ⊆ X. Sia p ∈ E 0 . Sia f : E → Rk della forma (6.7.3). Allora si ha lim f (x) = ` = (`1 , `2 , . . . , `k ) x→p (6.7.5) se e solo se lim fj (x) = `j , x→p per ogni j = 1, 2, , . . . , k. (6.7.6) 6.8. Infiniti, infinitesimi, o piccolo, asintotico 167 Dimostrazione. Sia {xn } una successione verificante le tre proprietà (6.6.2). Per il Teorema 6.6.1 la formula (6.7.5) vale se e solo se f (xn ) → ` per n → +∞. Per il Teorema 4.11.5 questa relazione di limite vale se e solo se fj (xn ) → `j per n → +∞, per ogni j = 1, 2, . . . , k. Di nuovo per il Teorema 6.6.1, queste k relazioni di limite equivalgono a (6.7.6). Il calcolo dei limiti in Rk segue dal precedente Teorema. Teorema 6.7.7 Sia (X, d) uno spazio metrico e sia E ⊆ X. Sia p ∈ E 0 . Siano f , g : E → Rk . Sia λ : E → R. Valga lim f (x) = α, x→p lim g(x) = β, x→p lim λ(x) = γ ∈ R. x→p Allora £ ¤ a) limx→p f (x) + g(x) = α + β b) limx→p λ(x) · f (x) = γα ¡ ¢ ¡ ¢ c) limx→p f (x), g(x) = α, β . Dimostrazione. I punti a), b) e c) seguono dal Teorema 6.7.4 precedente e dal calcolo dei limiti per funzioni a valori reali. Dimostriamo ad esempio c). Denotiamo con fj (x), gj (x), αj e βj le coordinate di f (x), g(x), α e β rispettivamente. Per ogni j si ha, al tendere di x a p, fj (x) → αj , gj (x) → βj . Per i punti a) e b) del Teorema 6.7.1, si ha, per x → p, k k X ¡ ¢ X ¡ ¢ f (x), g(x) = fj (x)gj (x) → αj βj = α, β . j=1 6.8 j=1 Infiniti, infinitesimi, o piccolo, asintotico La definizione di successione infinita e successione infinitesima si generalizza a fuzioni definite in uno spazio metrico e a valori reali. Definizione 6.8.1 Sia (X, d) uno spazio metrico e sia E ⊆ X. Sia p ∈ E 0 e sia f : E → R. Si dice che f (x) è un infinitesimo per x → p se limx→p f (x) = 0. Si dice che f (x) è un infinito per x → p se limx→p f (x) = +∞, oppure limx→p f (x) = −∞. Ad esempio, tutte le funzioni xα , con α reale positivo, sono infinitesimi per x tendente 0+ e infiniti per x tendente a +∞. Analogamente, le funzioni 1/xα , con α reale positivo, sono infiniti per x → 0+ e infinitesimi per x tendente a +∞. La funzione ex è un infinito per x → +∞ e un infinitesimo per x → −∞. La funzione log x è un infinito per x → +∞ e per x → 0+, ed è un infinitesimo per x → 1. 168 6. Limiti di funzioni Definizione 6.8.2 Sia (X, d) uno spazio metrico, sia E ⊆ X e sia p ∈ E 0 . Siano f, g : E → R. Se f e g sono ambedue infiniti per x → p si dice che f (x) tende all’infinito più lentamente di g(x) per x → p, o che f (x) è un infinito di ordine inferiore rispetto a g(x), se f (x) lim = 0. (6.8.3) x→p g(x) Se f e g sono ambedue infinitesimi per x → p, e g(x) 6= 0, si dice che f (x) tende a 0 più rapidamente di g(x) per x → p, o che f (x) è un infinitesimo di ordine superiore rispetto a g(x) , se lim x→p f (x) = 0. g(x) (6.8.4) Se f e g sono infiniti e vale (6.8.3), si dice equivalentemente che g è un infinito di ordine superiore rispetto a f . Se f e g sono infinitesimi e vale (6.8.3), si dice equivalentemente g è un infinitesimo di ordine inferiore rispetto a f . Definizione 6.8.5 Sia (X, d) uno spazio metrico, E ⊆ X e p ∈ E 0 . Siano f, g : E → R ambedue infinitesimi (oppure ambedue infiniti) per x → p. Sia g(x) 6= 0 e sia α > 0 un numero reale. Si dice che f (x) è un infinitesimo (rispettivamente, un infinito) di ordine α rispetto a g(x) per x → p se esiste β > 0 tale che |f (x)| lim α → β. x→p |g(x)| Se α = 1 si dice che f (x) e g(x) sono infinitesimi (rispettivamente, infiniti) dello stesso ordine. Ad esempio, sin x è infinitesimo dello stesso ordine √ di x per x → 0; 1 − cos x è infinitesimo di ordine 2 rispetto a x per x → 0; x è infinito di ordine 1/2 rispetto a x per x → +∞. Come nel caso delle successioni, per x → +∞ e a, b, c positivi, eax è un infinito di ordine superiore rispetto a xb che, a sua volta, è un infinito di ordine superiore rispetto a logc x. Teorema 6.8.6 Si ha, per ogni a, b, c positivi, eax = +∞, x→+∞ xb lim xb = +∞. c x→+∞ log x lim (6.8.7) Dimostrazione. Dimostriamo il primo limite in (6.8.7), utilizzando il limite per le corrispondenti successioni, dimostrato nel capitolo 4. Fissato M > 0, esiste n0 tale che per ogni n > n0 si ha ean > M ea . nb 6.8. Infiniti, infinitesimi, o piccolo, asintotico 169 Sia x > n0 . Indicando con [x] la parte intera di x, si ha eax ea[x] ea([x]+1) > = e−a > M. b b b x ([x] + 1) ([x] + 1) In maniera analoga si dimostra la seconda relazione di limite in (6.8.7). Le definizioni di o piccolo, asintotico, O grande ed eguale ordine di grandezza per funzioni sono pure analoghe a quelle per le successioni. Definizione 6.8.8 Sia (X, d) uno spazio metrico e sia E ⊆ X. Sia p ∈ E 0 e siano f, g : E → R. Sia g(x) 6= 0. Diciamo che f (x) è o piccolo di g(x) per x → p se f (x) lim = 0. x→p g(x) In tal caso si scrive f (x) = o (g(x)) . Esempi 6.8.9 1. Se a, b e c sono positivi, si ha per x → +∞ ¡ ¢ ¡ ¢ √ logc x = o xb , e−ax = o x−b , x = o (x) , sin x = o(x). 2. Per x → 0 si ha x2 = o(x), log |x| = o(x−b ), ove b > 0. 3. Con riferimento all’esempio 6.2.3.6, per (x, y) → (0, 0) xy = o (k(x, y)k) . La scrittura f (x) = h(x) + o (g(x)) per x → p equivale a f (x) − h(x) = o (g(x)). La scrittura o(1) indica un generico infinitesimo per x → p. In particolare, se f (x) → ` ∈ R per x → p, si ha f (x) = ` + o(1). Definizione 6.8.10 Sia (X, d) uno spazio metrico e sia E ⊆ X. Sia p ∈ E 0 e siano f, g : E → R, tali che f (x) 6= 0 e g(x) 6= 0. Si dice che f (x) è asintotica a g(x) per x → p se f (x) = 1. lim x→p g(x) In tal caso si scrive f (x) ∼ g(x) per x → p. 170 6. Limiti di funzioni Esempi 6.8.11 1. Per x → 0, si ha √ √ x3 + 3 x ∼ 3 x, sin x ∼ x, log (1 + x) ∼ x, 2. Per x → +∞ si ha √ x3 + x ∼ x3 , x2 + sin x ∼ x2 , ex − 1 ∼ x. log(1 + x) ∼ log x, [x] ∼ x. Come nel caso delle successioni, la relazione ∼ per x → p è riflessiva, cioè f (x) ∼ f (x), simmetrica, cioè f (x) ∼ g(x) se e solo se g(x) ∼ f (x), transitiva, cioè f (x) ∼ g(x) e g(x) ∼ h(x) implicano f (x) ∼ h(x). Sempre come nel caso delle successioni, se per x → p f (x) ∼ g(x) e f (x) → ` ∈ R, allora si ha anche g(x) → ` per x → p. Definizione 6.8.12 Sia (X, d) uno spazio metrico e sia E ⊆ X. Sia p ∈ E 0 e siano f, g : E → R, con g(x) > 0 Si dice che che f (x) è O grande di g(x) per x → p se esiste una costante c e un numero δ > 0 tali che per ogni x ∈ B(p, δ) ∩ E, x 6= p, si abbia |f (x)| ≤ c. (6.8.13) g(x) In tal caso si scrive f (x) = O(g(x)). Siano f (x) 6= 0 e g(x) 6= 0. Si dice che f (x) e g(x) hanno eguale ordine di grandezza per x → p se esistono due costanti c > 0 e d > 0 e un numero δ > 0 tali che per ogni x ∈ B(p, δ) ∩ E, x 6= p, si abbia ¯ ¯ ¯ f (x) ¯ ¯ ¯ ≤ c. 0<d≤¯ (6.8.14) g(x) ¯ In tal caso si scrive f (x) ³ g(x). Due funzioni asintotiche per x → p hanno anche eguale ordine di grandezza, ma non vale l’implicazione opposta. Esempi 6.8.15 1. x sin x = O(|x|) per x → ±∞. In questo caso (6.8.13) vale con c = 1 e x qualunque. 2. 1 x ³ per x → 2. La diseguaglianza (6.8.14) vale per ogni x 6= 2 x−2 x−2 tale che |x − 2| < 1, con c = 3 e d = 1. 3. x(1 + sin2 x) ³ x per x → ±∞. La diseguaglianza (6.8.14) vale per ogni x con d = 1 e c = 2. 6.9. Appendice 6.9 6.9.1 171 Appendice Classe limite di una funzione Nel capitolo 4 abbiamo introdotto la classe limite per le successioni a valori reali. Questa nozione si estende naturalmente alle funzioni, coerentemente con il Teorema 6.6.1 che pone in relazione i limiti funzionali e i limiti successionali. Sia (X, d) uno spazio metrico, E ⊆ X e p ∈ E 0 . Sia f : E → R. Consideriamo, come nel paragrafo 6.6, una qualunque successione tale che xn 6= p, xn ∈ E, xn → p per n → +∞. (6.9.1) Definizione 6.9.2 Si chiama valore limite di f (x) per x → p un qualunque elemento α ∈ R per cui esiste una successione {xn }, soddisfacente le tre proprietà (6.9.1), tale che lim f (xn ) = α. n→+∞ L’insieme dei valori limite si chiama classe limite di f (x) per x → p. Denoteremo usualmente con il simbolo Ep la classe limite di f (x) per x → p. Esempi 6.9.3 1 e sia p = 0. In questo caso la classe limite E0 è l’insieme x {−∞, +∞}. Infatti sia {xn } soddisfacente le tre proprietà (6.9.1) con 1 p = 0. Se xn → 0−, allora f (xn ) = → −∞. Se xn → 0+, allora xn 1 f (xn ) = → +∞. Se xn → 0, ma non tende a 0+ né a 0−, allora f (xn ) xn non ha limite. 1. Sia f (x) = 2. Sia f (x) = sin x e sia p = +∞. In questo caso la classe limite E+∞ coincide con l’intervallo [−1, 1]. Infatti, sia −1 ≤ α ≤ 1 e sia xn = arcsin α + 2nπ, con n ∈ N. La successione {xn } soddisfa ovviamente le tre proprietà (6.9.1) per n → +∞. Si ha sin (arcsin α + 2nπ) = sin (arcsin α) = α. 3. Sia f (x) = mant x, e sia p = +∞. In questo caso si ha E+∞ = [0, 1]. Per vedere ciò osserviamo in primo luogo che [0, 1) ⊂ E+∞ . Infatti, in modo analogo all’esempio precedente, sia α ∈ [0, 1) e poniamo xn = α + n. Si ha mant (α + n) = mant α = α. Sia ora xn = n−1/n. Questa successione soddisfa di nuovo le tre proprietà (6.9.1). Si ha ¶ µ ¶ µ 1 1 1 = mant 1 − = 1 − → 1. mant n − n n n Quindi 1 ∈ E+∞ . 172 6. Limiti di funzioni Si noti che, data una successione {xn } verificante le tre proprietà (6.9.1), ogni valore limite α della successione f (xn ) appartiene a Ep . Infatti, se α è un valore limite di f (xn ), esiste una sottosuccessione {xnk } tale che f (xnk ) tende a α. Tale sottosuccessione verifica necessariamente le proprietà (6.9.1). Teorema 6.9.4 Sia (X, d) uno spazio metrico, E ⊆ X e p ∈ E 0 . Sia f : E → R. Allora a) Ep 6= ∅ b) Ep ∩ R è chiusa c) Ep ha massimo e minimo (nell’insieme ordinato R). Dimostrazione. a) Sia {xn } una successione verificante le tre proprietà (6.9.1). Per il punto a) del Teorema 4.12.3 sulla classe limite delle successioni, la successione f (xn ) ha almeno un valore limite. Tale valore limite appartiene necessariamente a Ep , come osservato sopra. 0 b) Sia (Ep ∩ R) 6= ∅, e sia z un punto di accumulazione di Ep ∩ R. Sia α ∈ k © k ª Ep ∩ R convergente a z per k → +∞. Per ogni k esiste una successione xn verificante (6.9.1) tale che ∀k ¡ ¢ αk = lim f xkn n→+∞ ¯ ¡ 1 ¢ ¯ ¯ ¯ Quindi esiste ¯ ¡ 2n1¢ tale ¯che f xn1 − α1 < 1. Cosı̀ pure esiste esiste n2 > n1 tale che ¯f ¯xn¡2 −¢α2 ¯ <¯ 1/2. Per induzione, per ogni intero positivo k esiste nk tale che ¯f xknk − αk ¯ < 1/k e nk > nk−1 . © ª Si noti che anche la successione xknk soddisfa (6.9.1) al tendere di k a +∞. Si ha, per k → +∞, ¯ ¯ ¡ ¢¯ ¡ ¢¯ ¯z − f xkn ¯ ≤ |z − αk | + ¯αk − f xkn ¯ < |z − αk | + 1/k → 0. k k © ¡ ¢ª Quindi z è il limite della sottosuccessione f xknk . c) Se f (x) è illimitata superiormente in un intorno di p, allora esiste necessariamente xn 6= p, xn ∈ E e xn → p tale che f (xn ) → +∞. Quindi +∞ ∈ Ep . Se f (x) è limitata superiormente in un intorno B(p, δ), allora anche Ep è limitata superiormente. Infatti, nessun elemento α> sup f (x) x∈B(p,δ) può essere un valore limite della funzione per x → p. Sia L = sup Ep . Poiché Ep ∩ R è chiuso, L ∈ Ep ∩R per il Teorema 3.5.4. Quindi L è il massimo di Ep . L’esistenza del minimo si dimostra in modo analogo. 6.9. Appendice 173 Definizione 6.9.5 Sia (X, d) uno spazio metrico, E ⊆ X e p ∈ E 0 . Sia f : E → R e sia Ep la sua classe limite per x → p. Si chiama limite superiore (o massimo limite) della funzione per x → p il massimo della classe limite. Si chiama limite inferiore (o minimo limite) della funzione per x → p il minimo della classe limite. Per il limite superiore si usano le notazioni lim sup f (x), x→p limx→p f (x). Per il limite inferiore si usano le notazioni lim inf f (x), x→p limx→p f (x). Negli esempi 6.9.3 il limite superiore è rispettivamente +∞, 1, 1. Il limite inferiore è −∞, −1, 0. Le definizioni di valore limite, classe limite, limite superiore e inferiore e il teorema precedente continuano a sussistere per x → p+ oppure per x → p−. Teorema 6.9.6 Sia (X, d) uno spazio metrico, E ⊆ X e p ∈ E 0 . Sia f : E :→ R. a) Se lim supn→+∞ f (x) = L < +∞, allora, per ogni ε > 0 esiste δ > 0 tale che per ogni x ∈ B(p, δ) ∩ E, x 6= p, si ha f (x) < L + ε. b) Se lim inf n→+∞ f (x) = ` > −∞, allora, per ogni ε > 0 esiste δ > 0 tale che per ogni x ∈ B(p, δ) ∩ E, x 6= p, si ha f (x) > ` − ε. Dimostrazione. Ci limitiamo a dimostrare a), poiché la imostrazione di b) è del tutto simile. Se a) è falsa, esiste ε > 0 tale che per ogni δ > 0 esiste x ∈ B(p, δ) ∩ E tale che f (x) ≥ L + ε. Dando successivamente a δ i valori 1, 1/2 . . . , 1/n, . . . si ottiene una successione di punti xn soddisfacenti (6.9.1) e tali che f (xn ) ≥ L+ε. Allora esiste una sottosuccessione {f (xnk )} avente limite α ≥ L + ε, assurdo. Tenendo presente che limx→p f (x) = α se e solo se f (xn ) → α per ogni successione che soddisfa le proprietà (6.9.1), il seguente Corollario si dimostra come nel caso delle successioni. Corollario 6.9.7 Sia (X, d) uno spazio metrico, E ⊆ X e p ∈ E 0 . Sia f : E → R. Si ha lim sup f (x) = lim inf f (x) = α n→+∞ se e solo se f (x) → α per x → p. n→+∞ Capitolo 7 Continuità 7.1 Introduzione Le funzioni elementari dell’analisi, cioè funzioni quali potenze, radici, esponenziali, logaritmi, funzioni trigonometriche e loro inverse, funzioni ottenute dalle precedenti mediante operazioni aritmetiche o di composizione, ammettono limite eguale a f (p) per x → p, qualunque sia p nel loro insieme di definizione. Lo studio di tale proprietà, che non è limitata alle sole funzioni reali di variabile reale, si effettua in modo naturale nell’ambito degli spazi metrici. 7.2 Continuità in spazi metrici Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici, sia E ⊆ X1 un sottoinsieme non vuoto e sia p ∈ E. Definizione 7.2.1 Una funzione f : E → X2 si dice continua in p ∈ E se: per ogni ε > 0 esiste δ > 0 tale che per ogni x ∈ E, tale che d1 (x, p) < δ, si ha d2 (f (x), f (p)) < ε. La definizione 7.2.1 può anche anche essere scritta nel modo seguente: ∀ε > 0 ∃δ ∀x ∈ E, d1 (x, p) < δ, si ha d2 (f (x), f (p)) < ε. (7.2.2) Equivalentemente, f è continua in p ∈ E se per ogni ε > 0 esiste un intorno B(p, δ) tale che f (B(p, δ) ∩ E) ⊆ B(f (p), ε). (7.2.3) Osservazione. A differenza della definizione di limite (6.2.2), il punto p deve appartenere all’insieme di definizione E, ma non deve necessariamente essere di accumulazione per E. Poiché un punto p ∈ E è isolato oppure è di accumulazione, si ha che: a) se p è un punto isolato di E, allora ogni funzione f : E → X2 è continua in p. Infatti, per definizione di punto di isolato, esiste δ > 0 tale che B(p, δ) ∩ E = {p}. Ovviamente, f (p) ∈ B(f (p), ε), qualunque sia ε > 0. La (7.2.3) è perciò soddisfatta con δ = δ. 175 176 7. Continuità b) se p appartiene ad E ed è anche di accumulazione per E, allora f è continua in p se e solo se lim f (x) = f (p). (7.2.4) x→p Infatti, l’unica differenza tra la definizione di continuità (7.2.2) e la definizione di limite (6.2.2) nel capitolo 6 consiste nella clausola x 6= p contenuta nella definizione di limite. Quindi, se vale (7.2.2) a maggior ragione vale (7.2.4). Viceversa, se limx→p f (x) = f (p), allora per ogni ε > 0 esiste δ tale che per ogni x ∈ B(p, δ) ∩ E, x 6= p, si ha d2 (f (x), f (p)) < ε. Poiché, per x = p, si ha d2 (f (p), f (p)) = 0 < ε, vale anche (7.2.2). Esempi 7.2.5 √ 1. Sia X1 = X2 = E = R con la metrica euclidea. Sia f (x) = 3 x e sia p = 0. Scelto ad arbitrio ε > 0 basta porre δ = ε3 perché ogni punto x tale che |x| < δ soddisfi |f (x)| < ε. Quindi f è continua in p = 0. 2. Sia X1 = E = R2 e sia X2 = R, ambedue con la metrica euclidea. Sia x3 se (x, y) 6= (0, 0) 2 f (x, y) = x + y2 0 se (x, y) = (0, 0). Dimostriamo che f è continua in p = p (0, 0). Fissato ε > 0 basta porre δ = ε affinché ogni punto (x, y) tale che x2 + y 2 < δ soddisfi |f (x, y)| < ε. Infatti si ha, al di fuori dell’origine, |f (x, y)| = |x| p x2 ≤ |x| ≤ x2 + y 2 . x2 + y 2 Quindi limx→(0,0) f (x, y) = 0 = f (0, 0). 3. Sia (X1 , d1 ) uno spazio metrico discreto, e sia (X2 , d2 ) uno spazio metrico arbitrario. Sia f : X1 → X2 una qualunque funzione. Qualunque punto p ∈ X1 è isolato, e quindi f è continua in un qualsiasi punto di X1 . 4. Sia X1 = E = R e sia X2 = R3 , ambedue con la metrica euclidea. Sia p = 0. Sia f (x) = (sin x, cos x, x) . Per x → 0 si ha sin x = f1 (x) → 0, cos x = f2 (x) → 1, x = f3 (x) → 0. Quindi limx→0 f (x) = (0, 1, 0) = f (0), e la funzione è continua in p = 0. Dal Teorema 6.6.1 si ricava immediatamente che la continuità di una funzione in un punto può essere caratterizzata mediante i limiti successionali. 7.3. Continuità globale 177 Teorema 7.2.6 Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici e sia E ⊆ X1 . Sia p ∈ E ∩ E 0 . Una funzione f : E → X2 è continua in p se e solo se lim f (xn ) = f (p) n→+∞ per ogni successione {xn } verificante le due condizioni xn ∈ E e xn → p per n → +∞. (7.2.7) Questo Teorema segue in modo ovvio dal Teorema 6.6.1. Basta osservare che la condizione xn 6= p in (6.6.2) non è necessaria nel caso della continuità, come abbiamo notato sopra. Teorema 7.2.8 (di continuità della funzione composta) Siano (X1 , d1 ), (X2 , d2 ) e (X3 , d3 ) spazi metrici. Sia E ⊆ X1 , e sia p ∈ E. Sia f : E → X2 e sia g : X2 → X3 . Se f è continua in p e g è continua in f (p), allora la funzione composta g ◦ f : E → X3 è continua in p. Dimostrazione. La dimostrazione si basa sul Teorema precedente. Se p è isolato, ogni funzione è continua in p, come già osservato sopra. Sia quindi p di accumulazione. Sia {xn } una successione verificante le due condizioni (7.2.7). Per la continuità di f in p si ha f (xn ) → f (p) per n → +∞. Se f (p) è isolato in X2 , allora definitivamente deve essere f (xn ) = f (p) e quindi, definitivamente, g (f (xn )) = g (f (p)). Se f (p) è di accumulazione, poiché g è continua in f (p), si ha g (f (xn )) → g (f (p)) per n → +∞. In ambedue i casi si ha g (f (xn )) → g (f (p)) per n → +∞, da cui la tesi. . 7.3 Continuità globale Definizione 7.3.1 Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici e sia f : X1 → X2 . Si dice che f è (globalmente) continua in X1 se è continua in ogni punto p ∈ X1 . In seguito, nel caso di funzioni globalmente continue in sottoinsiemi E di spazi metrici assegnati, (X1 , d1 ) denoterà semplicemente l’insieme E dotato della metrica indotta. Ad esempio, se f : [a, b] → R è continua in [a, b], lo spazio metrico (X1 , d1 ) sarà l’intervallo [a, b] con la metrica euclidea indotta. Teorema 7.3.2 Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici, e sia f : X1 → X2 . La funzione f è continua in X1 se e solo se per ogni aperto A ⊆ X2 la controimmagine f −1 (A) è aperta in X1 . Dimostrazione. Sia A ⊆ X2 aperto e sia f continua in X1 . Dimostriamo che ogni punto p ∈ f −1 (A) è interno a f −1 (A). Sia q ∈ A tale che f (p) = q. Sia ε > 0 tale che B(q, ε) ⊆ A. Per (7.2.3) esiste δ > 0 tale che f (B(p, δ)) ⊆ B(q, ε). Quindi B(p, δ) ⊆ f −1 (B(q, ε)) ⊆ f −1 (A), 178 7. Continuità cioè p è interno a f −1 (A). Viceversa supponiamo che f −1 (A) sia aperto in X1 per ogni aperto A ⊆ X2 . Sia p ∈ X1 e sia q = f (p). Fissato ε > 0, poniamo A = B(q, ε). Per ipotesi f −1 (B(q, ε)) è aperto e quindi p è ad esso interno. Esiste quindi δ > 0 tale che B(p, δ) ⊆ f −1 (B(q, ε)). Ne segue f (B(p, δ)) ⊆ B(q, ε), cioè la continuità di f in p. La continuità di f in X1 può essere equivalentemente caratterizzata mediante le contrommagini dei chiusi. Corollario 7.3.3 Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici, e sia f : X1 → X2 . La funzione f è continua in X1 se e solo se per ogni chiuso F ⊆ X2 la controimmagine f −1 (F ) è chiusa in X1 . Dimostrazione. Il Corollario si dimostra ricordando che un insieme è chiuso se e solo se il suo complementare è aperto. Sia F ⊆ X2 chiuso, e sia A = F c . Allora A è aperto in X2 . Si ha ¡ ¢c f −1 (F ) = f −1 (Ac ) = f −1 (A) . La funzione f è continua se e solo se f −1 (A) è aperto e quindi se e solo se f −1 (F ) è chiuso. È bene osservare che nel caso in cui X1 sia un sottospazio metrico con la metrica indotta f −1 (A) deve essere aperto in tale metrica. Se, ad esempio, X1 = [a, b] ⊂ R, gli aperti di [a, b] nella metrica euclidea indotta sono le intersezioni di [a, b] con gli aperti R. Analogamente, gli intorni di p ∈ [a, b] sono le intersezioni degli intervalli (p − ε, p + ε) con [a, b]. Ad esempio, per valori piccoli di ε gli intorni di a sono gli intervalli [a, a + ε) = [a, b] ∩ (a − ε, a + ε). 7.4 Continuità delle funzioni a valori reali Teorema 7.4.1 Sia (X, d) uno spazio metrico, e siano f, g : X → R. Se f e g sono continue in p ∈ X allora sono continue in p anche le funzioni f + g, f − g, f /g (se g(p) 6= 0), f g (se f (p) > 0), logg f (se f (p) > 0, g(p) > 0, g(p) 6= 1). Dimostrazione. Se p è isolato l’asserto è ovvio. Se p è di accumulazione, la tesi segue dal Teorema 6.7.1. Si noti che se g(p) 6= 0 e p è di accumulazione, allora anche g(x) 6= 0 in un opportuno intorno di p. Infatti, g(x) deve avere lo stesso segno del suo limite g(p) in un opportuno intorno di p. Quindi f /g è definita in tale intorno. La stessa considerazione si applica alla funzione f g e a logg f . Il Teorema appena dimostrato, assieme al Teorema sulla composizione di funzione continue, permette di dimostrare la continuità delle funzioni elementari dell’analisi nel loro insieme di definizione. 7.4. Continuità delle funzioni a valori reali 179 1) Iniziamo osservando che la fuzione f (x) = x è banalmente continua in tutto R e che la fuzione f (x) = c, ove c è una qualsiasi costante, è pure banalmente continua (di fatto queste funzioni sono continue in ogni spazio metrico). Sono quindi continui su tutto R i monomi cxn , con n ∈ N, e di conseguenza tutti polinomi P (x) = c0 + c1 x + c2 x2 + · · · + cn xn . Sono pure continui i rapporti di polinomi il denominatore. P1 (x) in ogni punto che non annulla P2 (x) 2) Gli esponenziali sono continui in ogni punto. Infatti, sia f (x) = ax , ove a > 0 e a 6= 1. Sia x0 un qualsiasi numero reale. Per il Teorema 6.7.2 al tendere di x a x0 si ha ¡ ¢ ax − ax0 = ax0 ax−x0 − 1 ∼ (x − x0 )ax0 log a → 0. Quindi ax → ax0 per x → x0 . 3) Come conseguenza del punto precedente e del Teorema 7.4.1, sono continue in ogni punto le funzioni iperboliche sinh x = ex − e−x , 2 cosh x = ex + e−x , 2 tanh x = sinh x . cosh x y=cosh(x) 1 y=tanh(x) y=tanh(x) -1 y=sinh(x) Le funzioni iperboliche 4) Sia f (x) = log x, ove x > 0. Al tendere di x → x0 > 0 si ha, per il Teorema 6.7.2, µ ¶ x x − x0 x − x0 log x − log x0 = log = log 1 + ∼ → 0. x0 x0 x0 180 7. Continuità Quindi log x è continua in ogni punto x0 > 0. 5) Sia f (x) = xα , ove α ∈ R e α 6= 0. Questa funzione è definita per x > 0. Se α > 0 il suo insieme di definizione include anche lo 0: infatti, si pone in questo caso f (0) = 0. Sia x0 > 0. Si ha ¶ µµ ¶α ³ ´ x α log xx α 0 − 1 xα − xα = x − 1 = xα . 0 0 0 e x0 Per quanto appena visto, log Teorema 6.7.2, x → log 1 = 0 per x → x0 . Quindi, per il x0 α xα − xα 0 ∼ x0 α log x → 0. x0 Sia ora x0 = 0 e α > 0. Fissato ε > 0, sia δ = ε1/α . Per 0 ≤ x < δ si ha xα < ε, e quindi limx→0+ xα = 0. α>1 0<α<1 1 α<0 1 f (x) = xα 6) Sia α = m/n, con m e n interi non nulli, n > 0. La funzione xm/n è definita per ogni x > 0 come √ xm/n = n xm . (7.4.2) La radice a destra in (7.4.2) è definita anche per x < 0, eccetto il caso in cui n sia pari e m dispari. Per n dispari si ha p √ n xm = − n (−x)m , se m è dispari q √ m n xm = n (−x) , se m è pari. 7.4. Continuità delle funzioni a valori reali 181 Ad esempio √ 3 √ x = − 3 −x, √ 3 q x2 = 3 √ 5 2 (−x) , x3 = − q 5 3 (−x) . Se n è pari e m è pari si ha √ n Ad esempio √ 4 xm = q m n |x| . q x2 = 4 2 |x| = p |x|. In base a queste √ osservazioni, la continuità di xm/n in ogni punto x0 > 0 implica n la continuità di xm anche in x0 < 0. Se m/n > 0 le radici sono continue anche in x0 = 0. | x| |x| 3 3 x x Le funzioni p |x| e √ 3 x 7) Esaminiamo le funzioni trigonometriche. Per ogni x0 si ha µ ¶ µ ¶ x − x0 x + x0 sin x − sin x0 = 2 cos sin 2 2 (7.4.3) e l’espressione a destra in (7.4.3) tende a 0 per x → x0 . Analogamente, si ha, per x → x0 ¶ µ ¶ µ x − x0 x + x0 sin → 0. cos x − cos x0 = −2 sin 2 2 Quindi sin x e cos x sono continue in ogni punto. Di conseguenza, tan x è continua in ogni x0 6= π/2 + kπ, con k intero. 182 7. Continuità La continuità delle funzioni inverse delle funzioni trigonometriche sarà dimostrata più avanti, come caso particolare del Teorema di continuità della funzione inversa. Per studiare la continuità di funzioni a valori in Rk , notiamo il seguente Teorema, la cui dimostrazione è una ovvia conseguenza del Teorema 6.7.4. Teorema 7.4.4 Sia (X, d) uno spazio metrico e sia p ∈ X. Sia f : X → Rk . Posto f (x) = (f1 (x), f2 (x), . . . , fk (x)) , la funzione f è continua in p se e solo se fj : X → R è continua in p per ogni j = 1, 2, . . . , k. Applichiamo questo Teorema al caso in cui X = Rk , dotato della metrica euclidea, e alla funzione identica f (x) = x = (x1 , x2 , . . . , xk ) , che associa a ogni x ∈ Rk il punto x stesso. Ovviamente f è continua in Rk . In questo caso si ha f1 (x) = x1 , f2 (x) = x2 , . . . , fk (x) = xk . La funzione fj si chiama proiezione sull’asse j–esimo, o j–esima proiezione, ed è funzione continua di x. Ne segue che, per moltiplicazione e addizione, sono funzione continue di x tutti i monomi in k variabili e tutti i polinomi in k variabili; si veda il punto seguente. 8) Sia, per semplicità, k = 2. I monomi nelle due variabili x e y sono 1, x, y, x2 , xy, y 2 , x3 , x2 y, xy 2 , y 3 , . . . Il generico polinomio di grado n in due variabili è P (x, y) = c0,0 +c1,0 x+c0,1 y +c2,0 x2 +c1,1 xy +c0,2 y 2 +· · ·+c1,n−1 xy n−1 +c0,n y n P (x, y) è una funzione continua di (x, y), per quanto detto sopra. Sono pure continui i rapporti di due polinomi in tutti i punti che non annullano il denominatore. 9) Altri esempi di fuzioni continue, in una o più variabili reali, si ottengono componendo le funzioni studiate in questo paragrafo ed eseguendo operazioni su di esse. Ad esempio, sono continue in ogni punto del loro insieme di definizione le funzioni √ √ x+1 xy sin x sin (log x) , e , √ , log(2 + cos x), cosh x, , cos (x + y) . 1 + x2 + y 2 x−1 In generale possiamo affermare che tutte le funzioni elementari dell’analisi (in una o più variabili) sono continue nel loro insieme di definizione. 7.5. Il Teorema di Weierstrass 7.5 183 Il Teorema di Weierstrass Teorema 7.5.1 Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici. Sia f : X1 → X2 continua in X1 . Se X1 è compatto, allora anche f (X1 ) è compatto. Dimostrazione. Sia {Ai }i∈I , ove Ai ⊆ X2 per ogni i, una copertura aperta di f (X1 ). Si ha [ Ai . f (X1 ) ⊆ i∈I Di conseguenza X1 = f −1 µ[ ¶ Ai [ = i∈I f −1 (Ai ). (7.5.2) i∈I La prima eguaglianza in (7.5.2) vale perché X1 non può essere contenuto propriamente in suo sottoinsieme. Poniamo Vi = f −1 (Ai ). Per il Teorema 7.3.2, ogni insieme Vi è aperto e per (7.5.2) la famiglia {Vi }i∈I costituisce una copertura aperta di X1 . Esistono quindi n insiemi della famiglia, siano essi Vi1 , Vi2 , . . . , Vin , tali che X1 = n [ Vi k . k=1 ¡ ¢ Poiché f (Vik ) = f f −1 (Aik ) ⊆ Aik , segue che f (X1 ) = f µ[ n k=1 ¶ Vik = n [ f (Vik ) ⊆ k=1 n [ Ai k , k=1 Quindi la famiglia {Ai1 , Ai2 , . . . , Ain } è una sottocopertura finita di f (X1 ) estratta dalla copertura aperta {Ai }i∈I . Come conseguenza si ottiene il Teorema di Weierstrass. Corollario 7.5.3 (Teorema di Weierstrass) Sia (X, d) uno spazio metrico e sia f : X → R continua in X. Se X è compatto allora f (x) ha un punto di massimo e un punto di minimo assoluto in X. Dimostrazione. Poiché f (X) è un compatto, esso è chiuso e limitato. Sia L l’estremo superiore di f (X). Per la limitatezza di f (X) si ha L < +∞. Per la chiusura di f (X) e per il Teorema 3.5.4, L ∈ f (X). Quindi L è anche massimo assoluto della funzione. In maniera analoga si dimostra l’esistenza del minimo assoluto. Il Teorema di Weierstrass, originariamente dimostrato per funzioni continue f : [a, b] → R, si applica, ad esempio, a funzioni di due o più variabili reali. Ogni funzione continua in un cerchio chiuso in R2 e a valori reali ammette massimo e minimo. 184 7.6 7. Continuità Il Teorema di Darboux Se f : [a, b] → R è continua, per il Teorema di Weierstrass si ha f ([a, b]) ⊆ [m, M ], ove M e m sono il massimo e il minimo della funzione. In questo paragrafo dimostreremo che in realtà si ha f ([a, b]) = [m, M ]. Più in generale, dimostreremo che l’immagine di un qualunque intervallo mediante una funzione continua a valori in R è a sua volta un intervallo. Questa proprietà si basa sulla connessione degli intervalli. Teorema 7.6.1 Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici. Sia f : X1 → X2 continua in X1 . Se X1 è connesso, allora anche f (X1 ) è connesso. Dimostrazione. Supponiamo per assurdo che f (X1 ) non sia connesso. Allora esistono A e B non vuoti tali che A ∪ B = f (X1 ), A ∩ B = ∅, A ∩ B = ∅. Poniamo E = f −1 (A) e F = f −1 (B). Chiaramente E e F non sono vuoti. Si ha X1 = f −1 (f (X1 )) = f −1 (A ∪ B) = E ∪ F . Arriveremo all’assurdo dimostrando che E e F sono ¡separati. ¢ Dalla relazione A ⊆ A si deduce f −1 (A) ⊆ f −1 A . Poiché f è continua, ¡ ¢ f −1 A è chiuso per il Corollario 7.3.3. Ne segue ¡ ¢ E = f −1 (A) ⊆ f −1 A . Quindi ¡ ¢ ¡ ¢ E ∩ F = f −1 (A) ∩ F ⊆ f −1 A ∩ f −1 (B) = f −1 A ∩ B = ∅. In modo analogo si dimostra che E ∩ F = ∅. Corollario 7.6.2 (Teorema di Darboux) Sia I ⊆ R un intervallo di qualsiasi tipo, e sia f : I → R continua e non costante. Allora f (I) è un intervallo. In particolare, se I = [a, b] si ha f ([a, b]) = [m, M ] , ove M e m sono rispettivamente il massimo e il minimo assoluto di f (x) in [a, b]. Corollario 7.6.3 (Teorema dei valori intermedi) Sia f : [a, b] → R continua. Sia f (a) < f (b) (oppure f (b) < f (a)). Allora, per ogni y0 tale che f (a) < y0 < f (b) (rispettivamente, f (b) < y0 < f (a)), esiste x0 ∈ (a, b) tale che f (x0 ) = y0 . Dimostrazione. Sia ad esempio f (a) < f (b). Allora y0 ∈ (f (a), f (b)) ⊂ [m, M ] = f ([a, b]). Quindi deve esistere x0 ∈ (a, b) tale che f (x0 ) = y0 . 7.6. Il Teorema di Darboux 185 f(a) y0 f(b) a x0 b f (x) assume tutti i valori intermedi Questo Corollario asserisce che una funzione reale di variabile reale, continua in un intervallo, non può passare da un valore ad un altro senza assumere tutti i valori intermedi. Il grafico della funzione incontra tutte le rette orizzontali y = y0 , con y0 ∈ (f (a), f (b)). Da un punto di vista intuitivo, se si disegna manualmente il grafico di questa funzione, non si può staccare la penna dal foglio. Questo giustifica la denominazione di funzione ‘continua’. Corollario 7.6.4 (Teorema degli zeri) Sia f : [a, b] → R continua. Sia f (a) < 0 < f (b) (oppure f (b) < 0 < f (a)). Allora esiste x0 ∈ (a, b) tale che f (x0 ) = 0. Questo Corollario si può applicare per dimostrare l’esistenza di soluzioni per certe equazioni del tipo f (x) = 0 in opportuni intervalli. Ad esempio, sia f (x) = x5 − x4 + x3 − 2x2 + 3x − 1. Si ha f (0) = −1 e f (1) = 1, e quindi l’equazione f (x) = 0 deve avere almeno una soluzione x0 tale che 0 < x0 < 1. Si può approssimare ulteriormente x0 osservando che f (0, 4) vale circa (è minore di) −0.07 mentre f (0, 5) vale circa (è maggiore di) 0, 09. Quindi si ha 0.4 < x0 < 0.5. Ripetuti calcoli di questo tipo portano alla stima x0 = 0, 4418 . . . Come ulteriore esempio si consideri la funzione f (x) = x − 3 log x. Poiché f (x) → +∞ per x → 0+, per valori di x prossimi a 0 si ha f (x) > 0. D’altra parte, f (e) = e − 3 < 0, e quindi deve esistere x0 < e tale che f (x0 ) = 0. Poiché f (x) → +∞ per x → +∞, deve esistere un ulteriore valore x1 > e tale che f (x1 ) = 0. 186 7.7 7. Continuità Uniforme continuità Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici e sia f : X1 → X2 continua in X1 . Ciò significa che la (7.2.2), che esprime la continuità di f in p, è verificata in ogni punto. Riscriviamo dunque la definizione di continuità, mettendone in evidenza la validità in ogni punto p ∈ X1 . Si ha ∀p ∈ X1 ∀ε > 0 ∃δ ∀x ∈ X1 , d1 (x, p) < δ, si ha d2 (f (x), f (p)) < ε. (7.7.1) L’unica differenza rispetto alla (7.2.2) è l’apposizione della clausola: ∀p ∈ X1 . Da questa definizione risulta evidente che il numero δ dipende non solo dal valore di ε, ma anche che dal punto p. Chiariamo questo fatto con un esempio. Sia X1 = (0, +∞), X2 = R e sia f (x) = x2 . La funzione è continua in ogni punto p. Possiamo valutare δ per ogni ε > 0 e p > 0 assegnati. Si ha, per ogni x ∈ (p − δ, p + δ), ¯ ¯ ε > ¯x2 − p2 ¯ . (7.7.2) Questa diseguaglianza deve valere per anche x = p + δ/2 > p. Da (7.7.2) si ottiene ¯ ¯ δ ε > ¯x2 − p2 ¯ = (x + p) |x − p| > 2p = pδ. 2 Ne segue δ < ε/2p, che tende a 0 per p → +∞. Fissato ε > 0 non è quindi possibile trovare δ > 0, per quanto piccolo, dipendente solo da ε. Diversa è la situazione se si restringe f a un intervallo compatto. Sia ad esempio X1 = [0, b]. Si ha ¯ 2 ¯ ¯x − p2 ¯ = (x + p) |x − p| ≤ 2b |x − p| . ¯ ¯ Fissato ε > 0, basta porre δ = ε/2b per avere ¯x2 − p2 ¯ < ε per ogni x e p tali che |x − p| < δ. In questo caso δ dipende solo ε e non da p. Siamo cosı̀ condotti alla nozione di uniforme continuità. Definizione 7.7.3 Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici e sia f : X1 → X2 continua in X1 . Si dice che f è uniformemente continua in X1 se per ogni ε > 0 esiste δ tale che per ogni x, p ∈ X1 , tali che d1 (x, p) < δ, si ha d2 (f (x), f (p)) < ε. In formula: ∀ε > 0 ∃δ ∀x ∈ X1 ∀p ∈ X1 , d1 (x, p) < δ, si ha d2 (f (x), f (p)) < ε. (7.7.4) In altri termini, f è uniformemente continua in X1 se è continua in X1 e il numero δ dipende solo da ε e non dal punto p. Prefissato ε > 0, coppie di punti che distano tra loro per meno di δ = δ(ε) hanno immagini che distano tra loro per meno di ε, ovunque sia situata questa coppia di punti nello spazio metrico X1 . 7.7. Uniforme continuità 187 Teorema 7.7.5 (di Heine–Cantor) Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici e sia f : X1 → X2 continua in X1 . Se X1 è compatto allora f è uniformemente continua in X1 . Dimostrazione. La dimostrazione è per assurdo. Se (7.7.4) non vale, allora esiste ε > 0 tale che per ogni δ > 0 esiste una coppia di punti x, y ∈ X1 , tali che d1 (x, y) < δ, ma d2 (f (x), f (y)) ≥ ε. Diamo a δ i valori 1, 1/2, . . . , 1/n, . . .. Esistono x1 e y1 tali che d1 (x1 , y1 ) < 1, ma d2 (f (x1 ), f (y1 )) ≥ ε. Esistono x2 , y2 tali che d1 (x2 , y2 ) < 1/2, ma d2 (f (x2 ), f (y2 )) ≥ ε, etc. Esistono quindi due successioni {xn } ⊆ X1 e {yn } ⊆ X1 tali che per ogni n d1 (xn , yn ) < 1/n d2 (f (xn ), f (yn )) ≥ ε. (7.7.6) Poiché X1 è compatto, esiste una sottosuccessione {xnk } convergente a un punto z ∈ X1 , cioè d1 (xnk , z) → 0 per k → +∞. Si ha, per gli stessi indici nk , d1 (ynk , z) ≤ d1 (ynk , xnk ) + d1 (xnk , z) < 1 + d1 (xnk , z). nk Quindi anche la sottosucessione {ynk } converge a z. Poiché f è continua in ogni punto, e quindi anche in z, per Teorema 7.2.6 si ha f (xnk ) → f (z) e f (ynk ) → f (z) per k → +∞. Dalla diseguaglianza triangolare, d2 (f (xnk ), f (ynk )) ≤ d2 (f (xnk ), f (z)) + d2 (f (z), f (ynk )) , si deduce che d2 (f (xnk ), f (ynk )) → 0 per k → +∞. D’altra parte, per (7.7.6) si ha per ogni k d2 (f (xnk ), f (ynk )) ≥ ε, il che è assurdo. Come conseguenza del Teorema di Heine–Cantor, ogni funzione continua f : [a, b] → R è anche uniformemente continua. Il Teorema di Heine–Cantor è una condizione sufficiente, ma non necessaria, per l’uniforme continuità. Esistono infatti funzioni uniformemente continue definite in spazi metrici non compatti. Banalmente, la funzione identica f (x) = x è uniformemente continua in ogni spazio metrico, come pure le funzioni costanti. Un esempio non banale è fornito dalla funzione f (x) = log x ristretta a [1, +∞). Per ogni x > −1 vale la diseguaglianza log(1+x) ≤ x (Lemma 4.9.6). Quindi, dati due punti x, y ≥ 1, con x > y, si ha µ ¶ x x−y = log 1 + y y x−y ≤ x − y. ≤ y |log x − log y| = log Fissato ε > 0, basta scegliere δ = ε affinché |x − y| < δ implichi |log x − log y| < ε, per ogni x, y ∈ [1, +∞). 188 7.8 7. Continuità Punti di discontinuità Teorema 7.8.1 Sia f : (a, b) → R, e sia x0 ∈ (a, b). La funzione è continua in x0 se e solo se lim f (x) = lim f (x) = f (x0 ). x→x0 − x→x0 + Dimostrazione. Segue immediatamente dal Teorema 6.4.7. Se f (x) non è continua in x0 si dice che x0 è un punto di discontinuità. È opportuno tuttavia ampliare la nozione di punto di discontinuità al caso in cui f non sia necessariamente definita in x0 . 7.8.1 Discontinuità di prima specie Definizione 7.8.2 Sia f : (a, x0 ) ∪ (x0 , b) → R. Si dice che x0 è un punto di discontinuità di prima specie se esistono finiti lim f (x) x→x0 − e lim f (x) (7.8.3) x→x0 + ed essi sono diversi tra loro. Si noti che non è richiesto che la funzione sia definita in x0 . Esempi 7.8.4 1. Sia f (x) = mant x. Ogni punto x0 = n, con n intero, è un punto di discontinuità di prima specie. In questo caso f è definita in x0 = n e si ha lim f (x) = 0 = f (n), lim f (x) = 1. x→n+ x→n− Analogamente, f (x) = [x] ha una discontinuità di prima specie in tutti i punti con ascissa intera. 1 2. Sia f (x) = arctan , definita per x 6= 0. In questo caso x0 = 0 è un x punto di discontinuità di prima specie. Infatti, tenendo presente l’esempio 6.3.6.4, si ha lim arctan x→0− 1 π =− , x 2 lim arctan x→0+ π/2 -π/2 f (x) = arctan 1 x 1 π = . x 2 7.8. Punti di discontinuità 189 La quantità limx→x0 + f (x) − limx→x0 − f (x) si chiama anche salto della funzione in x0 . 7.8.2 Discontinuità di seconda specie Definizione 7.8.5 Sia f : (a, x0 ) ∪ (x0 , b) → R. Si dice che x0 è un punto di discontinuità di seconda specie se almeno uno dei due limiti lim f (x), x→x0 − lim f (x) x→x0 + non esiste o non è finito. Anche in questo caso non è richiesto che la funzione sia definita in x0 . Esempi 7.8.6 1. La funzione f (x) = 1/x, definita per x 6= 0, ha in x0 = 0 un punto di discontinuità di seconda specie. Infatti lim x→0− 1 = −∞, x lim x→0+ 1 = +∞. x 2. Sia f (x) = e1/x , definita per x 6= 0. Si ha lim e1/x = 0, x→0− lim e1/x = +∞. x→0+ Il punto x0 = 0 è un punto di discontinuità di seconda specie 1 3. Sia f (x) = sin , definita per x 6= 0. Si ha, per ogni intero n, x µ ¶ µ ¶ µ ¶ 1 2 2 f = 0 (n 6= 0), f = 1, f = −1. nπ π(4n + 1) π(4n − 1) Per il Teorema 6.6.1 la funzione non ammette limite né per x → 0+, né per x → 0−. La figura successiva illustra il comportamento di f (x) in un intorno di 0. 4. Sia ½ f (x) = x se x è razionale −x se x è irrazionale. Questa funzione è continua solo in x0 = 0. Ogni altro punto è un punto di discontinuità di seconda specie. La definizione precdente si adatta al caso in cui x0 sia uno degli estremi. Se f : (a, b) → R è tale che limx→a+ f (x) non esiste o è infinito, diremo ancora che a è un punto di discontinuità di seconda specie. Analoga definizione vale se la discontinuità è nell’estremo destro. Ad esempio, la funzione f (x) = sin 1/x1/2 , definita per x > 0, ha in x0 = 0 una discontinuità di seconda specie. Il suo comportamento per valori di x positivi e prossimi a 0 è oscillatorio e ricorda quello di sin 1/x. 190 7. Continuità 1/2π 1/π f (x) = sin 7.8.3 1 x Discontinuità eliminabili Definizione 7.8.7 Sia f : (a, x0 ) ∪ (x0 , b) → R. Si dice che x0 è un punto di discontinuità eliminabile se si verifica uno dei due seguenti casi: a) f non è definita in x0 ma esiste finito il limite lim f (x) = `; x→x0 (7.8.8) b) f è definita in x0 , esiste finito il limite (7.8.8), ma lim f (x) = ` 6= f (x0 ). x→x0 Esempi 7.8.9 1. Sia f (x) = sin x , definita per x 6= 0. Si ha x lim x→0 sin x = 1. x Il punto x0 = 0 è un punto di discontinuità eliminabile per f . 2 2. Sia f (x) = e−1/x , definita per x 6= 0. Poiché −1/x2 → −∞ per x → 0, si ha 2 lim e−1/x = 0. x→0 Il punto x0 = 0 è un punto di discontinuità eliminabile per f . 3. Negli esempi precedenti l’espressione analitica di f (x) non è definita in x0 . Sia ora ¡ ¢ f (x) = mant 1 − x2 , 7.8. Punti di discontinuità 191 funzione definita per¢ ogni x. Se 0 < |x| < 1, si ha 0 < (1 − x2 ) < 1 e ¡ quindi mant 1 − x2 ¡ = 1 − ¢x2 . Se x = 0 si ha mant 1 − x2 = mant 1 = 0. Ne segue ¡ ¢ ¡ ¢ lim mant 1 − x2 = lim 1 − x2 = 1 6= mant 1. x→0 x→0 Il punto x0 = 0 è un punto di discontinuità eliminabile per f (x). Se f ha in x0 un punto di discontinuità eliminabile, si può definire, o ridefinire, f (x) in x0 ponendo f (x0 ) = `. Si ottiene in tal modo una funzione continua in x0 . Si dice in tal caso che la funzione è stata prolungata per continuità in x0 . Ad esempio la funzione sin x x f (x) = 1 se x 6= 0 se x = 0 è prolungata per continuità in x0 = 0. La definizione precedente si adatta anche al caso in cui x0 sia un estremo di un intervallo in cui f è definita. Sia f : (x0 , b) → R. Diciamo che f ha una discontinuità eliminabile in x0 se si verificano a) o b) della definizione 7.8.7, sostituendo a limx→x0 f (x) il limite dalla destra limx→x0 + f (x). Analoga definizione vale se la discontinuità è nell’estremo destro. Esempi 7.8.10 1. La funzione ¡ √ ¢ f (x) = mant 1 − x , definita per x ≥ 0, ha una discontinuità eliminabile in x0 = 0. Infatti ¡ ¡ √ ¢ √ ¢ lim mant 1 − x = lim 1 − x = 1 6= mant 1 = 0. x→0+ x→0+ 2. La funzione f (x) = x log x, definita per x > 0, ha una discontinuità eliminabile in x0 = 0. Infatti si ha lim x log x = 0. x→0+ In questo caso si pone f (0) = 0. La funzione risulta cosı̀ prolungata per continuità in 0. 192 7. Continuità 1 y=mant(1-x1/2) f(0)=0 f (x) = mant (1 − √ 1 x), 0 ≤ x < 1 1 y=xlogx f (x) = x log x in prossimità di 0 7.9 Funzioni monotone Definizione 7.9.1 Sia I ⊆ R un intervallo e sia f : I → R. Si dice che la funzione è: a) monotona crescente in senso lato, o non decrescente, in I se ∀x, y ∈ I x < y =⇒ f (x) ≤ f (y) b) monotona crescente in senso stretto in I se ∀x, y ∈ I x < y =⇒ f (x) < f (y) c) monotona decrescente in senso lato, o non crescente, in I se ∀x, y ∈ I x < y =⇒ f (x) ≥ f (y) 7.9. Funzioni monotone 193 d) monotona decrescente in senso stretto in I se ∀x, y ∈ I x < y =⇒ f (x) > f (y) Esempi 7.9.2 1. Consideriamo le due funzioni, definite in R, f (x) = x e g(x) = [x]. La prima funzione è ovviamente monotona crescente in senso stretto. La seconda è monotona crescente in senso lato, ma non in senso stretto. 2. La funzione f (x) = sgn x (segno di x) è monotona crescente in senso lato, ma non in senso stretto in R. 3. La funzione f (x) = x3 è monotona crescente in senso stretto in R. La funzione f (x) = x2 è monotona decrescente in senso stretto in (−∞, 0], e monotona crescente in senso stretto in [0, +∞). 4. La funzione f (x) = 1/x è monotona decrescente in senso stretto sia in (−∞, 0) che in (0, +∞). 5. L’esponenziale ax = ex log a è monotona crescente in senso stretto in R se a > 1, monotona decrescente in senso stretto se 0 < a < 1. Chiaramente una funzione f (x) è monotona crescente in I, in senso stretto o lato, se e solo se −f (x) è monotona decrescente in senso stretto o lato in I. Teorema 7.9.3 Sia f : (a, b) → R (−∞ ≤ a < b ≤ +∞) monotona. Allora esistono i limiti di f (x) per x → a+ e x → b−. Precisamente: a) se f è monotona non decrescente, allora lim f (x) = inf f (x), x→a+ x∈(a,b) lim f (x) = sup f (x). x→b− x∈(a,b) b) se f è monotona non crescente, allora lim f (x) = sup f (x), x→a+ x∈(a,b) lim f (x) = inf f (x). x→b− x∈(a,b) Dimostrazione. Ci limitiamo a dimostrare il Teorema nel caso in cui a e b sono numeri reali. Le modificazioni da apportare sono ovvie nel caso in cui uno o ambedue gli estremi siano infiniti. a) Sia f non decrescente e dimostriamo che limx→b− f (x) = supx f (x). Se supx f (x) = +∞, fissato N > 0 esiste x0 tale che f (x0 ) > N . Posto x0 = b−δ, la monotonia implica che per ogni x, tale che x0 = b − δ < x < b, si abbia f (x) ≥ f (x0 ) > N, 194 7. Continuità da cui la tesi. Se supx f (x) = L < +∞, fissato ε > 0 esiste x0 tale che f (x0 ) > L−ε. Posto x0 = b − δ, la monotonia implica che per ogni x, tale che x0 = b − δ < x < b, si abbia L − ε < f (x0 ) ≤ f (x) ≤ L. La dimostrazione per x → a+ è analoga. b) Poiché −f (x) è non crescente se e solo se f (x) è non decrescente, b) segue da a). La funzione dell’esempio 7.8.6.4 ha un’infinità non numerabile di punti di discontinuità ed essi sono di seconda specie. Per le funzioni monotone la situazione è differente. Teorema 7.9.4 Sia f : (a, b) → R (−∞ ≤ a < b ≤ +∞) monotona. Allora f ha al più una infinità numerabile di punti di discontinuità ed essi sono tutti di prima specie. Dimostrazione. Dimostriamo dapprima che le discontinuità di una funzione monotona sono di prima specie. Supponiamo, per fissare le idee, che f sia non decrescente. Sia x0 ∈ (a, b) un punto di discontinuità. Poiché f (x) è monotona non decrescente sia in (a, x0 ) che in (x0 , b), esistono finiti i limiti per x → x0 − che per x → x0 +. Poniamo `1 = lim f (x), x→x0 − `2 = lim f (x). x→x0 + (7.9.5) Per ogni x, y tali che x < x0 < y si ha f (x) ≤ f (x0 ) ≤ f (y). Passando al limite per x che tende x0 − e y che tende a x0 +, si ottiene `1 ≤ f (x0 ) ≤ `2 . (7.9.6) I limiti sono diversi tra loro, altrimenti `1 = f (x0 ) = `2 , il che implicherebbe la continuità di f in x0 (Teorema 7.8.1). Dimostriamo ora che l’insieme dei punti di discontinuità è al più numerabile. Sia x0 un punto di discontinuità e consideriamo l’intervallo aperto (`1 , `2 ), ove `1 e `2 sono come in (7.9.5). Sia x00 > x0 un altro punto di discontinuità e sia (`01 , `02 ) l’analogo intervallo. Evidentemente `1 < `2 ≤ `01 < `02 . Quindi (`1 , `2 ) ∩ (`01 `02 ) = ∅. (7.9.7) Associamo a ogni punto x0 di discontinuità un numero razionale r(x0 ) ∈ (`1 , `2 ). Per (7.9.7), a punti di discontinuità diversi corrispondono razionali diversi. Quindi l’insieme dei punti di discontinuità è in corrispondenza biunivoca con un sottoinsieme dei razionali. Tale sottoinsieme è finito o numerabile per il Teorema 2.6.3. 7.9. Funzioni monotone 195 Osservazione. Se f è definita in un intervallo chiuso o semichiuso, le eventuali discontinuità agli estremi sono eliminabili. Sia ad esempio f : [a, b) → R monotona non decrescente. Se x0 = a è un punto di discontinuità, per il Teorema 7.9.3 esiste limx→a+ f (x). Tale limite deve essere finito, poiché f (x) ≥ f (a), e diverso da f (a). Quindi lim f (x) = ` > f (a). x→a+ Chiaramente un analogo ragionamento vale se x0 = b o se f è monotona non crescente. l'2=f(x'0) l'1 l2 f(x0) l1 f(a) a x0 x'0 b Discontinuità di una funzione monotona in [a, b) Sia I ⊆ R un intervallo e sia f : I → R una funzione continua, che supponiamo non costante. L’immagine J = f (I) è un intervallo, per il Teorema di Darboux. Se, oltre che continua, f è strettamente monotona, crescente o decrescente, allora f è chiaramente una applicazione biunivoca di I su J. Vale anche la proprietà inversa. Teorema 7.9.8 Sia I ⊆ R un intervallo e sia f : I → R una applicazione continua in I. Sia J = f (I). Se f applica biunivocamente I su J allora f è strettamente monotona. Dimostrazione. Supponiamo dapprima I = [a, b]. Sia, per fissare le idee, f (a) < f (b). Dimostriamo che f è monotona strettamente crescente. Sia x tale che a < x < b. Se, per assurdo, f (x) < f (a), avremmo f (x) < f (a) < f (b). Per il Teorema dei valori intermedi dovrebbe esistere x0 ∈ (x, b) tale che f (x0 ) = f (a), negando la biunivocità. Quindi deve essere f (a) < f (x). In modo analogo si dimostra che f (x) < f (b). Quindi f (a) < f (x) < f (b). Sia ora y tale che x < y < b. Applicando lo stesso ragionamento all’intervallo [x, b], otteniamo che f (x) < f (y) < f (b). Quindi f è monotona crescente in senso stretto. 196 7. Continuità Sia ora I un intervallo di tipo qualunque e siano a < b due punti di I. Supponiamo, per fissare le idee, f (a) < f (b). La restrizione di f a [a, b] è ancora continua e biunivoca tra [a, b] e f ([a, b]) e quindi è monotona strettamente crescente. Per lo stesso motivo, dati due punti x ≤ a < b ≤ y, la restrizione di f a [x, y] ⊇ [a, b] è strettamente monotona, e necessariamente crescente, dato che f (a) < f (b). Quindi deve essere f (x) < f (y) per ogni x < y. Il Teorema appena dimostrato, assieme all’osservazione che lo precede, caratterizza le funzioni continue e iniettive definite in un intervallo di R. 7.10 Continuità della funzione inversa Dati due spazi metrici (X1 , d1 ), (X2 , d2 ) e una funzione continua e biunivoca f : X1 → X2 , la funzione inversa f −1 : X2 → X1 non è necessariamente continua (si veda l’appendice per un controesempio). Tuttavia, i risultati del precedente paragrafo permettono di dimostrare la continuità di f −1 se X1 e X2 sono intervalli reali. Iniziamo con un Lemma. Lemma 7.10.1 Sia I ⊆ R un intervallo e sia f : I → R una funzione strettamente monotona. Allora f (I) è un intervallo se e solo se f è continua. Dimostrazione. Se f è continua allora f (I) è un intervallo, per il Teorema di Darboux. Viceversa, supponiamo che f (I) sia un intervallo e supponiamo, per assurdo, che x0 ∈ I sia un punto di discontinuità. Ragioniamo nel caso in cui x0 sia interno a I, poiché la dimostrazione si adatta facilmente al caso in cui x0 sia un estremo di I. Supponiamo anche, per fissare le idee, che f sia strettamente crescente. Per il Teorema 7.9.4, x0 è un punto di discontinuità di prima specie. Poniamo quindi `1 = lim f (x) < lim f (x) = `2 . x→x0 − x→x0 + Per ogni x1 < x0 < x2 si ha f (x1 ) < `1 ≤ f (x0 ) ≤ `2 < f (x2 ). Possiamo quindi concludere che: a) [`1 , `2 ] ⊂ [f (x1 ), f (x2 )]; b) [`1 , `2 ] non è contenuto in f (I), poiché f (x0 ) è l’unico valore della funzione appartenente a [`1 , `2 ]. D’altra parte, f (I) è un intervallo e quindi [f (x1 ), f (x2 )] ⊆ f (I), in contraddizione con a) e b). Se f non è monotona, può accadere che f (I) sia un intervallo anche se f non è continua. Ad esempio f (x) = mant x non è continua in R, ma f (R) = [0, 1). 7.11. Appendice 197 Teorema 7.10.2 Siano I e J intervalli in R. Sia f : I → J continua in I e biunivoca. Allora la funzione inversa f −1 : J → I è continua in J. Dimostrazione. Per il Teorema 7.9.8 f è strettamente monotona. Allora anche f −1 è strettamente monotona. Infatti sia, per fissare le idee, f strettamente crescente e sia y1 = f (x1 ) < y2 = f (x2 ). Allora non può essere x1 = f −1 (y1 ) ≥ x2 = f −1 (y2 ), altrimenti si avrebbe f (x1 ) ≥ f (x2 ). Poiché f −1 (J) = I è un intervallo, la continuità di f −1 segue dal Lemma precedente. Come conseguenza di questo Teorema sono continue in ogni punto del loro insieme di definizione le funzioni arctan x, 7.11 7.11.1 arcsin x, arccos x. Appendice Continuità della funzione inversa in spazi metrici Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici e sia f : X1 → X2 continua e biunivoca. La funzione inversa f −1 : X2 → X1 non è necessariamente continua. Sia ad esempio © ª X1 = [0, 2π) e X2 = (x, y) ∈ R2 : x2 + y 2 = 1 ambedue dotati della metrica euclidea indotta. Sia, per ogni θ ∈ [0, 2π), f (θ) = (cos θ, sin θ) . La funzione f applica biunivocamente X1 su X2 ed è continua, poiché ambedue le coordinate lo sono. La funzione inversa associa ad ogni vettore (x, y) della circonferenza trigonometrica l’angolo θ ∈ [0, 2π) formato (in senso antiorario) dall’asse delle ascisse con il vettore stesso. Tale funzione non è continua in (0, 0). Infatti, data una successione (xn , yn ) ∈ X2 convergente a (0, 0), i corrispondenti angoli θn convergono a 0 se yn > 0, mentre convergono a a 2π se yn < 0. Se X1 è compatto si può tuttavia dimostrare la continuità di f −1 . Teorema 7.11.1 Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici e sia f : X1 → X2 continua e biunivoca. Se X1 è compatto, allora f −1 è continua. Dimostrazione. Per il Corollario 7.3.3 applicato a f −1 , basta dimostrare che, per ogni chiuso F ⊆ X1 , la controimmagine ¡ −1 ¢−1 (F ) = f (F ) f è chiusa in X2 . Poiché X1 è compatto e F ⊆ X1 è chiuso, F è compatto. Per la continuità di f l’immagine f (F ) è compatta e quindi chiusa. 198 7. Continuità 7.11.2 Uniforme continuità. Funzioni lipschitziane e hölderiane. Come abbiamo notato, il Teorema di Heine–Cantor fornisce una condizione sufficiente, ma non necessaria, per l’uniforme continuità. Un’altra condizione sufficiente è la condizione di Lipschitz. Definizione 7.11.2 Siano (X1 , d1 ) e (X2 , d2 ) spazi metrici e sia f : X1 → X2 . Si dice che f soddisfa la condizione di Lipschitz (o che è lipschitziana) se esiste una costante K > 0 tale che per ogni x, y ∈ X1 si abbia d2 (f (x), f (y)) ≤ Kd1 (x, y). (7.11.3) Una funzione lipschitziana f è anche uniformemente continua. Infatti, fissato ε > 0, basta scegliere δ < ε/K perché ogni coppia di punti x, y ∈ X1 , aventi tra loro distanza minore di δ, verifichi d2 (f (x), f (y)) < ε. Abbiamo visto nel paragrafo 7.6 che la funzione log(1 + x) è lipschitziana in [1, +∞). Diamo altri, esempi limitandoci per semplicità a funzioni a valori reali. Esempi 7.11.4 1. Sia f : R2 → R un polinomio di primo grado, cioè della forma f (x, y) = ax + by + c ove a, b, c sono costanti. Si ha, per ogni coppia di punti (x, y) e (x0 , y0 ), |f (x, y) − f (x0 , y0 )| ≤ |a| |x − x0 | + |b| |y − y0 | ≤ (|a| + |b|) k(x, y) − (x0 , y0 )k . Quindi (7.11.3) vale con K = |a| + |b|. 2. Sia f (x) = sin x. Si ha ¯ ¶¯ ¯ µ ¶¯ µ ¯ x + y ¯¯ ¯¯ x − y ¯¯ |sin x − sin y| = 2 ¯¯cos sin ¯¯ ¯ 2 2 ¯ ¯ ¯ x − y ¯¯ ≤ 2 ¯¯sin ≤ |x − y| . 2 ¯ Quindi sin x è lipschitziana in R. Una generalizzazione della condizione di Lipschitz è la condizione di Hölder. Ci limitiamo per semplicità al caso reale. Definizione 7.11.5 Sia f : (a, b) → R. Sia α un numero reale, 0 < α ≤ 1. Si dice che f soddisfa la condizione di Hölder di ordine α (o che è α–hölderiana) se esiste una costante K > 0 tale che per ogni x, y ∈ (a, b) si abbia α |f (x) − f (y)| ≤ K |x − y| . (7.11.6) 7.11. Appendice 199 -1Una funzione α–hölderiana è uniformemente continua. Infatti, fissato ε > 1/α 0, basta scegliere δ < (ε/K) perché ogni coppia di punti x, y ∈ (a, b), aventi tra loro distanza minore di δ, verifichi |f (x) − f (y)| < ε. Un esempio di funzioni che soddisfano la condizione di Hölder di ordine α α in R è fornito dalle funzioni f (x) = |x| , con 0 < α ≤ 1. Per dimostrare ciò, osserviamo innanzi tutto che per ogni 0 ≤ t ≤ 1 vale la diseguaglianza α (1 + t) ≤ 1 + t ≤ 1 + tα . (7.11.7) Siano ora x e y reali, non entrambi nulli, e supponiamo ad esempio |x| ≥ |y|. Si ha, applicando (7.11.7) con t = |y|/|x|, ¯ y ¯´ α ³ ¯ ¯ α α α |x + y| ≤ (|x| + |y|) = |x| 1 + ¯ ¯ x ¯ y ¯α ´ ³ ¯ ¯ α α α ≤ |x| 1 + ¯ ¯ = |x| + |y| . x Quindi α α α α |x| = |x − y + y| ≤ |x − y| + |y| , α α α α α da cui |x| − |y| ≤ |x − y| . Scambiando i ruoli di x e y si ha |y| − |x| ≤ α |x − y| e quindi α α α ||x| − |y| | ≤ |x − y| . Quindi (7.11.6) vale con K = 1. Il prodotto di funzioni uniformemente continue non è in generale uniformemente continuo. Infatti, f (x) = x è uniformemente continua in R, mentre f (x)f (x) = x2 non lo è. Questo esempio mostra anche che il prodotto di funzioni lipschitziane in generale non è lipschitziano. Tuttavia, la composizione di funzioni uniformemente continue è uniformemente continua. Teorema 7.11.8 Siano (X1 , d1 ), (X2 , d2 ) e (X3 , d3 ) spazi metrici. Sia f : X1 → X2 uniformemente continua e g : X2 → X3 uniformemente continua. Allora g ◦ f è uniformemente continua. Dimostrazione. Per ogni ε > 0 esiste σ > 0 tale che per ogni y1 , y2 ∈ X2 , tali che d2 (y1 , y2 ) < σ, si abbia d2 (g(y1 ), g(y2 )) < ε. Per ogni σ > 0 esiste δ > 0 tale che per ogni x1 , x2 ∈ X1 , tali che d1 (x1 , x2 ) < δ, si abbia d2 (f (x1 ), f (x2 )) < σ. Quindi, da d1 (x1 , x2 ) < δ segue d3 (g(f (x1 )), g(f (x2 )) < ε. Capitolo 8 Calcolo differenziale 8.1 Introduzione Il problema della determinazione della tangente geometrica ad una curva piana condusse Newton e Leibniz a formulare i concetti fondamentali del calcolo differenziale nella seconda metà del secolo XVII. Un secolo e mezzo dopo, Louis Augustin Cauchy precisò la definizione di derivata mediante la nozione di limite, da lui formulata nel 1823. Sia f : (a, b) → R e sia x0 ∈ (a, b). Sia x0 + h, con h 6= 0, un altro punto di (a, b). Si chiama rapporto incrementale della funzione f , con punto iniziale x0 e incremento h della variabile indipendente, la quantità f (x0 + h) − f (x0 ) . h (8.1.1) Il significato geometrico del rapporto incrementale è evidente: esso costituisce il coefficiente angolare della retta passante per i punti del piano di coordinate ( x0 , f (x0 )) e (x0 + h, f (x 0 + h)). Tale retta è chiamata retta secante al grafico della funzione. Per ogni h fissato, la secante ha equazione y = f (x0 ) + f (x0 + h) − f (x0 ) (x − x0 ) . h (8.1.2) Se la funzione è derivabile (secondo la definizione che verrà precisata tra poco), al tendere di h a 0 il punto (x0 + h, f (x 0 + h)) tende al punto ( x0 , f (x0 )) e la retta secante ruota attorno al punto fisso ( x0 , f (x0 )), tendendo a disporsi in una posizione limite, che è appunto la tangente geometrica al grafico di f in ( x0 , f (x0 )). Da un punto di vista geometrico il rapporto incrementale rappresenta quindi la pendenza della retta secante. Da un punto di vista analitico esso rappresenta la velocità media (o il tasso medio) di variazione della quantità f (x) nell’intervallo [x0 , x0 + h] (o [x0 + h, x0 ], se h < 0). Qualora la funzione rappresenti una quantità fisica, il rapporto incrementale è la velocità media di variazione di questa quantità. Se, ad esempio, f (x) rappresenta lo spazio percorso da un punto mobile su una retta al tempo x, il rapporto incrementale rappresenta la 201 202 8. Calcolo differenziale velocità media del punto nell’intervallo di tempo suddetto. Se f (x) rappresenta la quantità di carica elettrica che passa per una sezione di filo ad un certo tempo x, il rapporto incrementale rappresenta l’intensità media di corrente etc. f(x0+h) P retta secante retta tangente Q f(x0) R x0+h x0 Retta secante e retta tangente 8.2 Derivata e differenziale Definizione 8.2.1 Sia f : (a, b) → R e sia x0 ∈ (a, b). Si dice che la funzione è derivabile in x0 se esiste finito il limite del rapporto incrementale per h → 0. Tale limite si indica con f 0 (x0 ) e si chiama derivata di f in x0 . Si ha dunque, se f è derivabile in x0 , f 0 (x0 ) = lim h→0 f (x0 + h) − f (x0 ) . h (8.2.2) Posto x = x0 + h, il rapporto incrementale assume la forma equivalente f (x) − f (x0 ) x − x0 (8.2.3) per ogni x ∈ (a, b) e x 6= x0 . Chiaramente, la relazione h → 0 equivale alla relazione x → x0 . Quindi (8.2.2) equivale a f 0 (x0 ) = lim x→x0 f (x) − f (x0 ) . x − x0 (8.2.4) Nel seguito useremo indifferentemente l’espressione (8.2.2) o la (8.2.4). Altri simboli per denotare la derivata della funzione y = f (x) in x0 sono i seguenti: Df (x0 ), df (x0 ), dx dy (x0 ), y 0 (x0 ). dx (8.2.5) Le funzioni elementari dell’analisi sono derivabili in tutti i punti del loro insieme di definizione, eccetto al più punti isolati, come vedremo più avanti. 8.2. Derivata e differenziale 203 Il significato geometrico della derivata appare evidente dalle considerazioni svolte nel primo paragrafo. Se il rapporto incrementale tende a un limite finito, il coefficiente angolare della secante tende al coefficiente angolare di una retta che interpreteremo come retta tangente al grafico in (x0 , f (x0 )). Definizione 8.2.6 Sia f : (a, b) → R derivabile in x0 ∈ (a, b). Si chiama retta tangente al grafico della funzione in ( x0 , f (x0 )) la retta y = f (x0 ) + f 0 (x0 ) (x − x0 ). Sia ad esempio f (x) = x2 e sia x0 un punto qualunque di R. Si ha f (x0 + h) − f (x0 ) (x0 + h)2 − x20 2x0 h + h2 = = h h h = 2x0 + h. 0 Passando ¡ ¢al limite per h → 0 si ottiene f (x0 ) = 2x0 . La tangente alla parabola 2 in x0 , x0 ha dunque equazione y = x20 + 2x0 (x − x0 ). Dal punto di vista analitico, la derivata rappresenta la velocità istantanea di variazione di f (x) in x0 . Ad esempio, se f è la legge del moto di un punto su una retta, f 0 (x0 ) rappresenta la velocità istantanea del punto al tempo x0 . Se f (x) rappresenta la quantità di carica elettrica che passa per una sezione di filo ad un certo tempo x, f 0 (x0 ) rappresenta l’intensità istantanea di corrente al tempo x0 . La derivata destra e la derivata sinistra in punto x0 si definiscono in modo naturale. Definizione 8.2.7 Sia f : [x0 , b) → R (oppure f : (a, x0 ] → R). Si dice che f è derivabile dalla destra in x0 (rispettivamente, dalla sinistra) se esiste finito il limite lim h→0+ f (x0 + h) − f (x0 ) h (rispettivamente, lim h→0− f (x0 + h) − f (x0 ) ). h (8.2.8) Tali limiti vengono chiamati rispettivamente derivata destra e derivata sinistra di f in x0 , e vengono denotati con uno dei simboli 0 f+ (x0 ), D+ f (x0 ) per la derivata destra 0 f− (x0 ), D− f (x0 ) per la derivata sinistra o con simboli analoghi a quelli in (8.2.5). I due rapporti incrementali in (8.2.8) vengono chiamati rapporto incrementale destro e sinistro, rispettivamente. È altresı̀ chiaro che f : (a, b) → R è derivabile in x0 ∈ (a, b) se e solo se è derivabile dalla destra e dalla sinistra e D+ f (x0 ) = D− f (x0 ) = Df (x0 ). 204 8. Calcolo differenziale Se f è derivabile dalla destra in x0 si dice semitangente destra al grafico in ( x0 , f (x0 )) la semiretta 0 y = f (x0 ) + f+ (x0 )(x − x0 ), x ≥ x0 . Analoga definizione sussiste per la semitangente sinistra. Definizione 8.2.9 Sia f : (a, b) → R. Diciamo che f è derivabile in (a, b) se f è derivabile in ogni punto x ∈ (a, b). Sia f : [a, b] → R. Diciamo che f è derivabile in [a, b] se f è derivabile in ogni punto interno ed esiste la derivata destra in a e la derivata sinistra in b. Se f è derivabile in un intervallo I, la funzione che associa ad ogni x ∈ I la derivata f 0 (x) viene chiamata funzione derivata. Ad esempio, abbiamo visto che f (x) = x2 è derivabile in R e che la sua funzione derivata è f 0 (x) = 2x. La nozione di derivabilità in un punto è più forte di quella di continuità. Si ha infatti il seguente risultato. Teorema 8.2.10 Sia f : [a, b] → R e sia x0 ∈ [a, b]. Se f è derivabile in x0 , allora f è continua in x0 . Dimostrazione. Poiché lim x→x0 si ha f (x) − f (x0 ) = f 0 (x0 ), x − x0 f (x) − f (x0 ) = f 0 (x0 ) + o(1). x − x0 Moltiplicando ambo i lati di questa eguaglianza per (x − x0 ) si ottiene f (x) − f (x0 ) = (x − x0 ) f 0 (x0 ) + (x − x0 ) o(1) (8.2.11) Al tendere di x a x0 il termine a destra in (8.2.11) tende a 0 e quindi f (x) → f (x0 ) per x → x0 . Osservazion¿. La derivabilità di f in un punto implica la continuità in quel punto, ma non vale l’implicazione inversa. Ad esempio, la funzione f (x) = |x| è continua in x0 = 0 ma non è ivi derivabile. Infatti si ha ½ f (x) − f (0) |x| 1 per x > 0 = = (8.2.12) −1 per x < 0 x x La funzione non è derivabile in 0 perché 1 = D+ f (0) 6= D− f (0) = −1. Se f : [a, b] → R è una funzione derivabile in x0 ∈ [a, b], allora vale la relazione (8.2.11). Poiché (x − x0 ) o(1) = o (x − x0 ) 8.3. Tangente verticale, punti angolosi, cuspidi 205 la formula (8.2.11) si riscrive come f (x) − f (x0 ) = (x − x0 ) f 0 (x0 ) + o (x − x0 ) . (8.2.13) Questa formula assume il nome di prima formula dell’incremento finito. Essa esprime l’incremento della funzione, al passaggio della variabile indipendente da x0 a x, come somma di due termini. Il primo termine è funzione lineare dell’incremento (x − x0 ), il secondo è un infinitesimo di ordine superiore rispetto a (x − x0 ). Riscrivendo la (8.2.13) come f (x) = f (x0 ) + (x − x0 ) f 0 (x0 ) + o (x − x0 ) , vediamo che, in un intorno di x0 , f (x) è approssimata dall’ordinata della tangente al grafico a meno di un infinitesimo di ordine superiore. Con riferimento alla figura del primo paragrafo, l’incremento della funzione è la lunghezza del segmento RP , il termine lineare (x − x0 ) f 0 (x0 ) è la lunghezza del segmento RQ e o (x − x0 ) è la lunghezza del segmento QP . Poniamo df = (x − x0 ) f 0 (x0 ). La quantità df si chiama il differenziale di f in x0 relativo all’incremento (x − x0 ). Nel simbolismo di Leibniz, gli incrementi ‘infinitesimi’ di una variabile, dipendente o indipendente, venivano indicati con la lettera d. Quindi df per l’incremento ‘infinitesimo’ della funzione, dx per l’incremento ‘infinitesimo’ della x. Il differenziale diventa df = f 0 (x0 )dx, da cui la notazione 8.3 df per la derivata. dx Tangente verticale, punti angolosi, cuspidi Abbiamo definito la derivata in x0 come limite finito del rapporto incrementale. Questo implica che la tangente al grafico in (x0 , f (x0 )) ha coefficiente angolare finito e quindi non può avere equazione x = x0 . Completiamo la definizione di tangente al grafico includendo il caso in cui il limite del rapporto incrementale è infinito. Definizione 8.3.1 Sia f : (a, b) → R e sia f continua in x0 ∈ (a, b). Si dice che il grafico di f ha in (x0 , f (x0 )) tangente verticale (o che x0 è un punto di tangente verticale) se si verifica una delle due relazioni: lim x→x0 f (x) − f (x0 ) = +∞ x − x0 oppure lim x→x0 f (x) − f (x0 ) = −∞. x − x0 (8.3.2) In tal caso la retta x = x0 si chiama tangente al grafico di f in (x0 , f (x0 )). 206 8. Calcolo differenziale Si noti che nella definizione precedente si richiede a priori che f sia continua in x0 . In questo modo si escludono casi come quello di sign x, che ha in x0 = 0 una discontinuità di prima specie ed è tale che il rapporto incrementale con punto iniziale 0 tende a +∞. Esempi 8.3.3 1. Sia f (x) = √ 3 x e sia x0 = 0. Si ha, per x → 0, √ 3 1 f (x) − f (x0 ) x = √ = → +∞. 3 x − x0 x x2 2. Sia f (x) = x log |x|, ove la funzione è prolungata per continuità in x = 0 ponendo f (0) = 0. Per x → 0 si ha f (x) − f (0) = log |x| → −∞. x In ambedue gli esempi precedenti la retta x = 0 è la tangente verticale in (0, 0). Sottolineiamo il fatto che, nel caso in cui valga (8.3.2), la funzione non è derivabile in x0 . La derivabilità equivale al fatto che il limite del rapporto incrementale è finito. Tangente verticale in (0, 0) Se f : [x0 , b) → R (oppure f : (a, x0 ] → R) e se il rapporto incrementale destro (rispettivamente, sinistro) tende a +∞ o a −∞, diremo che la semiretta x = x0 , y ≥ y0 , è la semitangente verticale destra (rispettivamente, sinistra) √ al grafico in (x0 , f (x0 )). Ad esempio, la funzione y = x, definita per x ≥ 0, ammette il semiasse positivo delle ordinate come semitangente verticale destra in (0, 0). Si ha infatti √ x 1 lim = lim √ = +∞. x→0+ x x→0+ x Definizione 8.3.4 Sia f : (a, b) → R e sia x0 ∈ (a, b). Si dice che il grafico di f ha in (x0 , f (x0 )) un punto angoloso (o che x0 è un punto angoloso) se si verifica uno dei seguenti casi: 8.3. Tangente verticale, punti angolosi, cuspidi 207 0 0 a) esistono f+ (x0 ) e f− (x0 ) ed esse sono diverse tra loro; 0 b) f è continua in x0 , esiste f+ (x0 ) e il rapporto incrementale sinistro tende a +∞ o a −∞; 0 c) f è continua in x0 , esiste f− (x0 ) e il rapporto incrementale destro tende a +∞ o a −∞. In un punto angoloso le semitangenti destra e sinistra esistono e formano un angolo non piatto e non nullo. Definizione 8.3.5 Sia f : (a, b) → R continua in x0 ∈ (a, b). Si dice che il grafico di f ha in (x0 , f (x0 )) una cuspide (o che x0 è un punto di cuspide) se f (x) − f (x0 ) = +∞ x − x0 e f (x) − f (x0 ) = −∞ x→x0 − x − x0 e lim x→x0 − lim x→x0 + f (x) − f (x0 ) = −∞, x − x0 oppure lim f (x) − f (x0 ) = +∞. x→x0 + x − x0 lim π -x y= /2 y= xπ /2 In una cuspide le semitangenti destra e sinistra sono ambedue verticali e formano un angolo nullo. Le funzioni f (x) = x arctan x1 e f (x) = |x| Esempi 8.3.6 1. Sia f (x) = |x| e sia x0 = 0. Il punto x0 = 0 è angoloso. Infatti, abbiamo 0 0 visto in (8.2) che f+ (0) = 1 e f− (0) = −1. Le semitangenti destra e sinistra sono le semirette y = x, con x ≥ 0, e y = −x, con x ≤ 0. 2. Sia ( f (x) = x arctan 0 1 x per x 6= 0 per x = 0 1 Questa funzione è ottenuta prolungando per continuità x arctan in x0 = x 0. Il punto x0 = 0 è angoloso. Infatti 1 π f (x) − f (0) = arctan → ± per x → 0 ± . x x 2 0 0 Quindi f+ (0) = π/2 e f− (0) = −π/2. Le semitangenti destra e sinistra sono le semirette y = xπ/2, con x ≥ 0, e y = −xπ/2, con x ≤ 0. 208 8. Calcolo differenziale 3. Sia f (x) definita come ½ f (x) = x √ x per x ≤ 0 per x > 0 Questa funzione presenta un punto angoloso in x0 = 0. Si ha infatti per x < 0 f (x) − f (0) 1 1 = per x > 0 √ x x 0 (0) = 1, mentre il rapporto incrementale destro tende a In questo caso f− +∞. La semitangente destra è la semiretta x = 0, con y ≥ 0, mentre la semitangente sinistra è la semiretta y = x, con x ≤ 0. p 4. Sia f (x) = |x|. Il punto x0 = 0 è di cuspide. Infatti 1 √ x f (x) − f (0) = x 1 −√ −x per x > 0 per x < 0 Ne segue f (x) − f (0) = +∞ x f (x) − f (0) = −∞ lim x→0− x lim x→0+ y=x1/2 y=x 8.4 cuspide nell'origine Regole di derivazione Teorema 8.4.1 Siano f e g due funzioni definite in [a, b] a valori in R, derivabili in x0 ∈ [a, b]. Siano c1 e c2 costanti. Allora sono derivabili in x0 le funzioni f (g(x) 6= 0) . c1 f + c2 g, f · g, g 8.4. Regole di derivazione 209 Si ha 0 (c1 f + c2 g) (x0 ) = c1 f 0 (x0 ) + c2 g 0 (x0 ) 0 (f · g) (x0 ) = f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ) µ ¶0 f f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 ) (x0 ) = g g(x0 )2 Dimostrazione. Iniziamo dalla somma. Si ha, per x → x0 , f (x) + g(x) − f (x0 ) − g (x0 ) f (x) − f (x0 ) g(x) − g(x0 ) = + → f 0 (x0 ) + g 0 (x0 ). x − x0 x − x0 x − x0 Ora la derivata del prodotto. Si ha, aggiungendo e sottraendo f (x0 )g(x), f (x) − f (x0 ) g(x) − g(x0 ) f (x)g(x) − f (x0 )g (x0 ) = g(x) + f (x0 ) . x − x0 x − x0 x − x0 Poiché g è derivabile in x0 , essa è ivi continua. Quindi g(x) → g(x0 ) per x → x0 . Ne segue, per x → x0 , f (x) − f (x0 ) g(x) → f 0 (x0 )g(x0 ) x − x0 g(x) − g(x0 ) f (x0 ) → f (x0 )g 0 (x0 ). x − x0 Mediante una simile manipolazione dimostriamo la formula per la derivata del quoziente. Si ha µ ¶ 1 f (x) f (x0 ) 1 f (x)g(x0 ) − f (x0 )g (x) − = x − x0 g(x) g(x0 ) x − x0 g(x)g(x0 ) Come prima si ha g(x) → g(x0 ) per x → x0 , poiché g è continua in x0 . Quindi g(x)g(x0 ) → g(x0 )2 . Inoltre si ha, per x → x0 , f (x)g(x0 ) − f (x0 )g (x) f (x) − f (x0 ) g(x) − g(x0 ) = g(x0 ) − f (x0 ) x − x0 x − x0 x − x0 → f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 ). Il Teoema è cosı̀ completamente dimostrato. Teorema 8.4.2 (di derivazione della funzione inversa) Siano I e J intervalli in R. Sia f : I → J continua in I e biunivoca. Sia f derivabile in x0 ∈ I e sia y0 = f (x0 ). Se f 0 (x0 ) 6= 0, allora la funzione inversa f −1 è derivabile in y0 e si ha 1 . Df −1 (y0 ) = Df (x0 ) 210 8. Calcolo differenziale Dimostrazione. Per ogni y ∈ J, y 6= y0 sia x tale che y = f (x). Si ha f −1 (y) − f −1 (y0 ) x − x0 = . y − y0 f (x) − f (x0 ) Poiché f −1 è continua, per y → y0 si ha x → x0 e, per la continuità di f , f (x) → f (x0 ). Quindi lim y→y0 f −1 (y) − f −1 (y0 ) 1 = 0 . y − y0 f (x0 ) Teorema 8.4.3 (di derivazione della funzione composta) Siano I, J ⊆ R intervalli. Sia f : I → J derivabile in x0 ∈ I. Sia g : J → R derivabile in y0 = f (x0 ). Allora la funzione composta g ◦ f è derivabile in x0 e si ha D (g ◦ f ) (x0 ) = g 0 (f (x0 )) f 0 (x0 ). Dimostrazione. Poiché g è derivabile in y0 si ha g(y) − g(y0 ) = g 0 (y0 ) + o(1) y − y0 ove o(1) → 0 per y → y0 . Moltiplicando ambo i lati per y − y0 si ottiene g(y) − g(y0 ) = (y − y0 ) (g 0 (y0 ) + o(1)) . (8.4.4) Poniamo y = f (x) e y0 = f (x0 ) in (8.4.4) e dividiamo per x − x0 . Si ottiene g (f (x)) − g(f (x0 )) f (x) − f (x0 ) 0 = (g (y0 ) + o(1)) . x − x0 x − x0 (8.4.5) Si osservi ora che o(1) è una funzione di y − y0 , infinitesima per y → y0 . Poiché f è continua in x0 (in quanto derivabile), si ha y = f (x) → y0 = f (x0 ) per x → x0 e quindi o(1) → 0 per x → x0 . Passando al limite per x → x0 in (8.4.5) si ottiene g (f (x)) − g(f (x0 )) → f 0 (x0 )g 0 (f (x0 )) . x − x0 Una funzione definita in un intervallo (−M, M ) si dice pari se f (x) = f (−x) per ogni x ∈ (−M, M ). Si dice dispari se f (x) = −f (−x) per ogni x ∈ (−M, M ). Ad esempio, la funzione f (x) = x2 è pari, mentre la funzione f (x) = x3 è dispari. Il grafico di una funzione pari è simmetrico rispetto all’asse delle ordinate, mentre il grafico di una funzione dispari è simmetrico rispetto all’origine. 8.5. Derivate delle funzioni elementari 211 Teorema 8.4.6 Sia f : (−M, M ) → R pari, oppure dispari. Sia f derivabile in x0 ∈ (−M, M ). Allora f è derivabile in −x0 e si ha f 0 (−x0 ) = −f 0 (x0 ) f 0 (−x0 ) = f 0 (x0 ) se f è pari se f è dispari. Dimostrazione. Si ha f (−x0 + h) − f (−x0 ) f (x0 − h) − f (x0 ) =∓ h −h ove vale il segno − se f è pari, il segno + se è dispari. Passando al limite per h → 0 si ha l’asserto. Corollario 8.4.7 Sia f : (−M, M ) → R derivabile in ogni punto x ∈ (−M, M ). Se f è pari la sua funzione derivata f 0 (x) è una funzione dispari. Se f è dispari la sua funzione derivata f 0 (x) è una funzione pari. 8.5 Derivate delle funzioni elementari Le funzioni elementari dell’analisi sono derivabili in ogni punto del loro insieme di definizione, con le possibili eccezioni di punti isolati. Qui di seguito ricaviamo la tabella di derivazione. 8.5.1 Potenze e radici Sia f (x) = c, ove c è una qualunque costante reale. In questo caso il rapporto incrementale è sempre nullo. Ne segue Dc = 0 Sia f (x) = xα , con x > 0. Si ha, per h → 0, µ ¶α h 1+ −1 α (x + h) − xα x = xα h µ h ¶α h 1+ −1 x α−1 =x h x → αxα−1 Quindi Dxα = αxα−1 α reale 212 8. Calcolo differenziale Se x = 0 e α > 1 si per h → 0+ hα = hα−1 → 0. h Se 0 < α < 1 il rapporto incrementale tende a +∞. Sia f (x) = xn con n > 0 intero e x reale qualunque. Lo stesso calcolo effettuato nel caso precedente mostra che n (x + h) − xn → nxn−1 h e la stessa formula vale per se n è un intero negativo e x 6= 0. Dxn = nxn−1 n intero In particolare si √ ha Dx = 1. √ Sia f (x) = n xm . Se x > 0 si ha n xm = xm/n e quindi, per il punto precedente, √ m m√ n D n xm = x(m/n)−1 = xm−n . n n Ad esempio si ha, per x > 0, √ √ 1 3 4 D x= √ , D x3 = √ . 2 x 44x √ Se n è dispari, la funzione f (x) = n xm è definita per ogni x 6= 0 e, se m/n > 0, √ è definita anche in x = 0. In particolare, n xm è una funzione pari se m è pari (m 6= 0), dispari se m è dispari. Quindi f è derivabile in x < 0 per il Teorema 8.4.6 e si ha q √ mn m√ n m−n D n xm = − (−x) = xm−n se m è pari, nq n √ mn m√ n m−n D n xm = (−x) = xm−n se m è dispari. n n Si ha quindi, se n è dispari e m intero qualunque D √ n xm = m√ n xm−n n m e n interi, n dispari Questa espressione vale anche in 0 se m > n. Ad esempio, si ha per ogni x 6= 0, √ √ √ 1 2 5√ 3 5 3 2 = √ 5 = x x x2 D3x= √ , D , D 3 5 2 3 3 3 x 5 x e l’ultima eguaglianza vale anche in x = 0. 8.5. Derivate delle funzioni elementari 213 √ m/n Siano ora n pari e m pari. In questo caso n xm = |x| e perciò la funzione è pari. Quindi, se x < 0, q √ mn m√ n m−n D n xm = − (−x) =− xm−n . n n Pertanto si ha D √ n xm = √ m n sgn x xm−n n m e n interi pari Questa espressione vale anche in x = 0 se m > n. Ad esempio si ha √ √ 1 sgn x 4 4 D x2 = sgn x x−2 = p , 2 2 |x| 8.5.2 √ √ D x4 = 2sgn x x2 = 2x. Esponenziali e funzioni iperboliche Sia f (x) = ax , con a > 0, a 6= 1. Sia x reale qualunque. Per h → 0 si ha ah − 1 ax+h − ax = ax → ax log a. h h Quindi, per ogni x Dax = ax log a In particolare Dex = ex Dal risultato precedente si deducono immediatamente le derivate delle funzioni iperboliche. Si ha ex − e−x 1 = Dex − 2 2 1 ex + e−x = Dex + D cosh x = D 2 2 D sinh x = D 1 −x ex + e−x De = 2 2 1 −x ex − e−x De = 2 2 Quindi D sinh x = cosh x, D cosh x = sinh x 214 8. Calcolo differenziale Infine, applicando la regola di derivazione del quoziente si ha D tanh x = D sinh x cosh2 x − sinh2 x = cosh x cosh2 x Ricordando che cosh2 x − sinh2 x = 1, si ottiene D tanh x = 8.5.3 1 = 1 − tanh2 x cosh2 x Logaritmi Sia f (x) = log x. Sia x > 0. Per h → 0 si ha ¶ µ h log 1 + log(x + h) − log x 1 1 x → . = h h x x x Per ogni x > 0 si ha dunque D log x = 8.5.4 1 x Funzioni trigonometriche Sia f (x) = sin x. Sia x un qualunque numero reale. Si ha, per h → 0, ¶ µ ¶ µ h h sin cos x + sin (x + h) − sin x 2 2 =2 h h µ ¶ h µ ¶ sin h 2 = cos x + h 2 2 → cos x. In modo analogo si ha, per h → 0, µ ¶ µ ¶ h h sin x + sin cos (x + h) − cos x 2 2 = −2 → − sin x. h h Quindi 8.5. Derivate delle funzioni elementari 215 D sin x = cos x, D cos x = − sin x La derivata di tan x si ottiene mediante la regola di derivazione del quoziente. Per ogni x 6= π/2 + kπ, ove k è un intero, si ha D tan x = D sin x sin2 x + cos2 x = cos x cos2 x da cui D tan x = 1 = 1 + tan2 x cos2 x Con calcoli analoghi si ottiene la derivata della cotangente D cot x = − 8.5.5 1 = −1 − cot2 x sin2 x Inverse delle funzioni trigonometriche La funzione x = arctan y è l’inversa della restrizione di y = tan x all’intervallo (−π/2, π/2). Poiché D tan x 6= 0 per ogni x ∈ (−π/2, π/2), possiamo applicare il Teorema di derivazione della funzione inversa. Si ha, per ogni y = tan x, D arctan y = 1 1 = . 1 + y2 1 + tan2 x Questa formula si scrive usualmente denotando con x la variabile indipendente dell’arcotangente. D arctan x = 1 1 + x2 La funzione x = arcsin y è l’inversa della restrizione di y = sin x all’intervallo [−π/2, π/2]. L’arcoseno è definito in [−1, 1], ma è derivabile solo nell’intervallo aperto (−1, 1), in quanto cos x = D sin x si annulla in ±π/2. Possiamo applicare il Teorema di derivazione della funzione inversa in ogni punto y ∈ (−1, 1). Tenendo conto che cos x è positivo in (−π/2, π/2), si ha D arcsin y = 1 1 1 =p . =p 2 cos x 1 − y2 1 − sin x Come prima la formula si scrive usualmente denotando con x la variabile indipendente dell’arcoseno. 216 8. Calcolo differenziale D arcsin x = √ 1 1 − x2 La funzione x = arccos y è l’inversa della restrizione di y = cos x all’intervallo [0, π]. Come l’arcoseno, essa è definita in [−1, 1], ma è derivabile solo nell’intervallo aperto (−1, 1), in quanto − sin x = D cos x si annulla in 0 e π. Si ha, come sopra D arccos y = − 1 1 1 = −√ = −p sin x 1 − cos2 x 1 − y2 Riscriviamo la derivata cambiando nome alla variabile indipendente. D arccos x = − √ 8.5.6 1 1 − x2 Derivate di funzioni composte Le derivate calcolate in precedenza, il Teorema di derivazione della funzione composta, e gli altri Teoremi dimostrati nel paragrafo 8.4, permettono di derivare tutte le funzioni elementari dell’analisi. Ad esempio D sin 1 1 1 = − 2 cos , x x x D arctan √ 1 x= √ , 2 x(1 + x) 3 3 Dex = 3x2 ex . Studiamo qui di seguito alcuni casi notevoli. Derivata della potenza di una funzione α Sia h(x) = (f (x)) , ove α è un numero reale non nullo e f è una funzione derivabile in (a, b), con f (x) > 0. La derivata si calcola notando che h è la funzione composta h = g ◦ f , ove g è la potenza g(y) = y α . Applicando il Teorema di derivazione della funzione composta, si ha l’espressione della derivata di h. α D (f (x)) = α (f (x)) α−1 Df (x) Ad esempio, per x ∈ (0, 1) si ha p 1 1 − 2x D x − x2 = D(x − x2 )1/2 = √ 2 x − x2 Se n è un intero non nullo (e f (x) 6= 0 se n < 0), si ha n n−1 D (f (x)) = n (f (x)) Ad esempio, D sinn x = n sinn−1 x cos x. Df (x) (8.5.1) 8.5. Derivate delle funzioni elementari 217 Derivata del modulo di una funzione La funzione |x| è derivabile in ogni punto x 6= 0. La sua derivata vale 1 se x > 0, −1 se x < 0. Quindi D |x| = sgn x, x 6= 0. Ne segue che, se f è derivabile in (a, b), la funzione |f (x)| è derivabile in tutti i punti x ∈ (a, b) in cui f (x) 6= 0. In tali punti si ha D |f (x)| = sgn (f (x)) Df (x)) ¯ ¯ Ad esempio, ¯ 12 x2 − x¯ è derivabile tranne che in x = 0 e in x = 2. Si ha ¯ ¯ µ ¶ ½ ¯1 2 ¯ 1 2 x − 1 se x < 0 oppure x > 2 ¯ ¯ D¯ x − x¯ = (x − 1) sgn x −x = 1 − x se 0 < x < 2 2 2 Non è difficile dimostrare che |f (x)| è derivabile anche nei punti in cui f (x) = 0, purché in tali punti si abbia anche f 0 (x) = 0. In tal caso si ha D |f (x)| = 0. Ad esempio, la derivata di |x|3 in x = 0 esiste e vale 0. Derivata logaritmica La derivata logaritmica di una funzione è la derivata del logaritmo della funzione stessa. Sia f (x) derivabile e positiva in (a, b), e consideriamo la funzione h(x) = log f (x). Essa è derivabile per il Teorema di derivazione della funzione composta e si ha D log f (x) = Df (x) f (x) Ad esempio, se f (x) = x2 + x + 2, si ha D log(x2 + x + 2) = 2x + 1 . +x+2 x2 Se f (x) = |cos x|, con x 6= π/2 + kπ, si ha D log |cos x| = −sgn (cos x) sin x = − tan x. |cos x| Analogamente, se f (x) = |x| si ha D log |x| = 1 x La derivata logaritmica esprime il tasso istantaneo di variazione di una quantità rapportato alla quantità stessa, cioè la sua variazione percentuale. Per questo motivo essa è di uso comune nelle applicazioni della matematica. 218 8. Calcolo differenziale Derivata di una funzione avente una funzione a esponente Sia h(x) = f (x)g(x) , ove f (x) > 0 e f e g sono derivabili in (a, b). La derivazione di h può essere ricondotta alla derivazione di una funzione composta. Infatti, basta scrivere h(x) nella forma h(x) = f (x)g(x) = eg(x) log f (x) . Derivando questa funzione composta si ha ¶ ³ ´ µ g(x) 0 g(x) 0 D f (x) = g (x) log f (x) + f (x) eg(x) log f (x) . f (x) Quindi ¡ ¢ D f (x)g(x) = µ ¶ g(x) 0 g 0 (x) log f (x) + f (x) f (x)g(x) f (x) Ad esempio, la derivata di xx vale Dxx = (log x + 1) xx . 8.6 Massimi e minimi relativi Definizione 8.6.1 Sia I ⊆ R un intervallo e sia f : I → R. Si dice che x0 è un punto di massimo relativo (o locale) di f (x) in I se esiste δ > 0 tale che per ogni x ∈ B(x0 , δ) ∩ I si ha f (x) ≤ f (x0 ). (8.6.2) Si dice x0 è un punto di minimo relativo (o locale) di f (x) in I se esiste δ > 0 tale che per ogni x ∈ B(x0 , δ) ∩ I si ha f (x) ≥ f (x0 ). (8.6.3) Se x0 è un punto di massimo relativo, f (x0 ) si chiama massimo relativo della funzione in I. Se x0 è un punto di minimo relativo, f (x0 ) si chiama minimo relativo della funzione in I. Il massimo e il minimo assoluti di f (x) in I (se esistono), sono anche massimi e minimi relativi, e i punti di massimo e minimo assoluti sono anche punti di massimo e minimo relativi. Si veda il paragrafo 6.5. Chiameremo collettivamente i massimi e minimi relativi in I estremi relativi della funzione in I. Analogamente il massimo e il minimo assoluto verranno chiamati estremi assoluti. I punti in cui vengono assunti i valori estremi relativi e quelli assoluti, vengono chiamati rispettivamente estremanti relativi ed estremanti assoluti. Se in (8.6.2) vale il segno < per x 6= x0 , si dice che x0 è un punto di massimo relativo forte. Analogamente, se in (8.6.3) vale il segno > per x 6= x0 , si dice 8.6. Massimi e minimi relativi 219 che x0 è un punto di minimo relativo forte. Se un estremante non è forte esso si dice debole. Una funzione può possedere estremi relativi in I senza possedere estremi assoluti, come apparirà chiaro dagli esempi. Si noti infine che la nozione di massimo e minimo relativo si può formulare in anche per funzioni definite in un qualunque spazio metrico, purché a valori in R. La definizione è esattamente la stessa. -1 0 f (x) = (1 − x2 )2 1 Esempi 8.6.4 1. Sia f (x) = (1 − x2 )2 . Questa funzione assume il minimo assoluto nei punti x = ±1, ma non ha massimo assoluto in R. Il punto x = 0 è un punto di massimo relativo. Tutti gli estremanti sono forti. 2. Sia f (x) = x3 − 3x. Il punto x = −1 è un punto di massimo relativo forte e il punto x = 1 è un punto di minimo relativo forte. Non ci sono estremanti assoluti. 3. Sia f (x) = [x]. Tutti i punti x ∈ / Z (gli interi relativi) sono sia punti di massimo che minimo relativo debole per f (x). I punti x ∈ Z sono punti di massimo relativo debole. Non ci sono estremanti assoluti. 4. La funzione f (x) = x non ha estremanti relativi né assoluti in R. La sua restrizione a un qualunque intervallo [a, b] ha un punto di minimo assoluto in x = a e un punto di massimo assoluto in x = b. 220 8. Calcolo differenziale 1 -1 f (x) = x3 − 3x √ 5. Sia f (x) = x + 2 sin x. Per ogni intero k, la funzione ammette massimo relativo, ma non assoluto, in 3π/4 + 2kπ, e minimo relativo, ma non assoluto, in −3π/4 + 2kπ. Per controllare questa affermazione si può utilizzare il successivo Corollario 8.8.8. Tutti gli estremanti di questa funzione sono forti. −3π/4 3π/4 f (x) = x + √ 2 sin x Teorema 8.6.5 (di Fermat) Sia f : (a, b) → R e sia x0 ∈ (a, b). Se x0 è un estremante relativo e se f è derivabile in x0 , allora f 0 (x0 ) = 0. Dimostrazione. Supponiamo, per fissare le idee, che x0 sia un punto di minimo relativo. Esiste δ > 0 tale che per ogni x ∈ (x0 − δ, x0 +δ) si abbia f (x) ≥ f (x0 ). 8.6. Massimi e minimi relativi 221 Se per x0 < x < x0 + δ si ha quindi f (x) − f (x0 ) ≥ 0. x − x0 (8.6.6) Il rapporto incrementale sinistro invece è non positivo. Se x0 − δ < x < x0 si ha f (x) − f (x0 ) ≤ 0. x − x0 (8.6.7) Poiché la funzione è derivabile in x0 , passando al limite per x → x0 + in (8.6.6) si ha f (x) − f (x0 ) f 0 (x0 ) = lim ≥ 0. x→x0 + x − x0 Analogamente, passando al limite per x → x0 − in (8.6.7) si ha f 0 (x0 ) = lim x→x0 − f (x) − f (x0 ) ≤ 0. x − x0 Quindi non può che essere f 0 (x0 ) = 0. Sottolineiamo che la condizione f 0 (x0 ) = 0 è necessaria, ma non sufficiente per l’esistenza di un estremante relativo. La funzione f (x) = x3 ha come derivata 3x2 , che si annulla in x = 0. Tale punto non è un estremante, poiché f (0) = 0, ma f (x) è negativa per x < 0, positiva per x > 0. Esempi 8.6.8 1. Sia f (x) = x2 . Tale funzione possiede un minimo assoluto in x = 0. La derivata è 2x che si annulla in 0. 2. Sia, come nell’esempio 8.6.4.1, f (x) = (1 − x2 )2 . Abbiamo notato che i punti 0 e ±1 sono estremanti. Si ha f 0 (x) = −4x(1 − x2 ) che si annulla appunto per x = 0 e x = ±1. 3. La derivata della funzione f (x) = x3 − 3x dell’esempio 8.6.4.2 vale 3x2 − 3 e si annulla nei punti x = 1 e x = √−1. Analogamente, la funzione x + 2 sin x dell’esempio 8.6.4.5 ha derivata √ f 0 (x) = 1 + 2 cos x, che si annulla nei punti ±3π/4 + 2kπ, ove k ∈ Z. 4. Per la validità del Teorema di Fermat è necessario che il punto x0 sia interno. Una funzione definita in [a, b] e ivi derivabile può avere un estremante in a o in b senza che la derivata (destra o sinistra, rispettivamente) sia nulla in tal punto. Ad esempio la restrizione di f (x) = x a [0, 1] ha minimo e massimo assoluti in x = 0 e x = 1 rispettivamente, ma f 0 (x) = 1 per ogni x. 222 8.7 8. Calcolo differenziale Teoremi di Rolle, Cauchy, Lagrange Teorema 8.7.1 (di Rolle) Sia f : [a, b] → R soddisfacente le seguenti ipotesi: i) f è continua in [a, b]; ii) f è derivabile in (a, b); iii) f (a) = f (b). Allora esiste z ∈ (a, b) tale che f 0 (z) = 0. Dimostrazione. Se f (x) è costante, per qualunque z ∈ (a, b) si ha f 0 (z) = 0. Supponiamo dunque che f (x) non sia costante. Poiché la funzione è continua in un intervallo compatto, per il Teorema di Weierstrass esiste un punto di massimo assoluto e uno di minimo assoluto in [a, b]. Almeno uno dei due estremanti deve essere interno, altrimenti, per l’ipotesi iii), la funzione sarebbe costante. Chiamiamo z questo estremante interno. Per l’ipotesi ii) la funzione è sicuramente derivabile in z. Per il Teorema di Fermat si ha f 0 (z) = 0. Teorema 8.7.2 (di Cauchy) Siano F : [a, b] → R e G : [a, b] → R due funzioni tali che: i) F e G sono continue in [a, b]; ii) F e G sono derivabili in (a, b). Allora esiste z ∈ (a, b) tale che [G(b) − G(a)] F 0 (z) = [F (b) − F (a)] G0 (z). (8.7.3) Dimostrazione. Poniamo f (x) = [G(b) − G(a)] F (x) − [F (b) − F (a)] G(x). (8.7.4) Evidentemente f continua in [a, b], derivabile in (a, b) e f 0 (x) = [G(b) − G(a)] F 0 (x) − [F (b) − F (a)] G0 (x). Inoltre, si verifica immediatamente che f (a) = f (b). Quindi f soddisfa le tre ipotesi del Teorema di Rolle. Di conseguenza esiste z ∈ (a, b) tale che f 0 (z) = 0. Dall’espressione (8.7) di f 0 si ricava la tesi. Se G(b) 6= G(a) e G0 (z) 6= 0, la (8.7.3) si può riscrivere nella forma F 0 (z) F (b) − F (a) = 0 . G(b) − G(a) G (z) (8.7.5) 8.7. Teoremi di Rolle, Cauchy, Lagrange 223 Teorema 8.7.6 (di Lagrange) Sia f : [a, b] → R soddisfacente le seguenti ipotesi: i) f è continua in [a, b]; ii) f è derivabile in (a, b). Allora esiste z ∈ (a, b) tale che f (b) − f (a) = f 0 (z). b−a (8.7.7) Dimostrazione. Questo Teorema è un corollario del Teorema di Cauchy, ove si ponga F (x) = f (x) e G(x) = x. f(b) f(z) f(a) a z b Il Teorema di Lagrange assume anche il nome di Teorema del valor medio. Da un punto di vista geometrico, esso afferma che, nelle ipotesi dichiarate sulla funzione f , esiste un punto interno z tale che il coefficiente angolare della tangente in (z, f (z)) è eguale al coefficiente angolare della retta per i punti (a, f (a)) e (b, f (b)). Ciò implica che la tangente in (z, f (z)) è parallela alla retta per (a, f (a)) e (b, f (b). Sia f : [x0 , x0 + h] → R, oppure f : [x0 + h, x0 ] → R, a seconda che sia h > 0 oppure h < 0. Supponiamo che f soddisfi le ipotesi del Teorema di Lagrange, cioè che sia continua nell’intervallo chiuso e derivabile nell’aperto. Esiste un punto z interno all’intervallo tale che (qualunque sia il segno di h) si abbia f (x0 + h) − f (x0 ) = f 0 (z). h Possiamo esprimere z nella forma z = x0 + θh, ove θ è un opportuno numero tale che 0 < θ < 1. Otteniamo cosı̀ la seconda formula dell’incremento finito f (x0 + h) − f (x0 ) = hf 0 (x0 + θh) . (8.7.8) La prima formula dell’incremento finito (8.2.13) fornisce una stima asintotica per x → x0 sotto ipotesi puntuali, cioè la derivabilità di f nel solo punto x0 . 224 8. Calcolo differenziale La seconda formula fornisce informazioni quantitative in ipotesi globali, cioè su tutto l’intervallo chiuso di estremi x0 e x0 + h. Posto x = x0 + h la (8.7.8) si può scrivere come f (x) = f (x0 ) + (x − x0 )f 0 (x0 + θ(x − x0 )) . (8.7.9) Esaminiamo ora alcune conseguenze del Teorema di Lagrange, rimandando al prossimo paragrafo la sua applicazione allo studio della monotonia di una funzione. Corollario 8.7.10 Sia I ⊆ R un intervallo e sia f : I → R, f derivabile in I. Se esiste una costante C tale che |f 0 (x)| ≤ C per ogni x ∈ I, allora |f (x1 ) − f (x2 )| ≤ C |x1 − x2 | . In particolare, f è uniformemente continua. Dimostrazione. Siano x1 , x2 ∈ I, con x1 < x2 . Possiamo applicare il Teorema di Lagrange all’intervallo [x1 , x2 ] ⊆ I. Si ha da (8.7.8) |f (x1 ) − f (x2 )| = |x1 − x2 | |f 0 (x1 + θ(x2 − x1 ))| ≤ C |x1 − x2 | . L’uniforme continuità è ora immediata. Fissato ε > 0, sia δ = ε/C. Da |x1 − x2 | < δ segue |f (x1 ) − f (x2 )| < ε. Nelle ipotesi del Corollario, f è lipschitziana in I secondo la definizione dell’appendice del capitolo 7. Teorema 8.7.11 Sia f : [x0 , x0 + δ] → R continua in [x0 , x0 + δ] e derivabile in (x0 , x0 + δ). Esista finito lim f 0 (x) = γ. x→x0 + Allora f è derivabile (dalla destra) in x0 e si ha 0 f+ (x0 ) = γ. Dimostrazione. Sia 0 < h < δ. Per la seconda formula dell’incremento finito si ha f (x0 + h) − f (x0 ) = f 0 (x0 + θh) , (8.7.12) h ove θ = θ(h) è un opportuno numero in (0, 1) dipendente da h. Per h → 0+ si ha x0 + θh → x0 + e quindi f 0 (x0 + θh) → γ. Ne segue lim h→0+ f (x0 + h) − f (x0 ) = γ. h 8.7. Teoremi di Rolle, Cauchy, Lagrange 225 In modo del tutto analogo si dimostra che se f : [x0 − δ, x0 ] → R è continua in [x0 − δ, x0 ] e derivabile in (x0 − δ, x0 ), e se esiste finito limx→x0 − f 0 (x) = γ, 0 allora f è derivabile dalla sinistra in x0 e f− (x0 ) = γ. Come esempio, si consideri la funzione ( 1 arctan se x > 0 f (x) = x π/2 se x = 0. Tale funzione è continua in [0, +∞). La sua derivata per x > 0 vale 1 =− . (8.7.13) 1 1 + x2 1+ 2 x 0 Per x → 0+ si ha f (x) → −1. Quindi f è derivabile dalla destra in x = 0 e 0 f+ (0) = −1. f 0 (x) = − 1 x2 1 Corollario 8.7.14 Sia f : [x0 − δ, x0 + δ] → R continua in [x0 − δ, x0 + δ] e derivabile in (x0 − δ, x0 + δ). Se x0 è un punto di discontinuità per f 0 (x), allora è necessariamente di seconda specie. Dimostrazione. Sia per assurdo x0 un punto di discontinuità eliminabile o di prima specie. Allora esistono finiti lim f 0 (x) = γ1 x→x0 + e lim f 0 (x) = γ2 . x→x0 − 0 0 Per il Teorema 8.7.11 si ha f+ (x0 ) = γ1 e f− (x0 ) = γ2 . Poiché per ipotesi esiste la derivata in x0 , si ha 0 0 γ1 = f+ (x0 ) = f 0 (x0 ) = f− (x0 ) = γ2 e quindi x0 non può essere un punto di discontinuità per f 0 (x), assurdo. Diamo un esempio di funzione con derivata discontinua in un punto. Sia ( 1 x2 cos se x 6= 0 f (x) = x 0 se x = 0 Chiaramente la funzione è continua per ogni x e derivabile per x 6= 0. La sua derivata in x 6= 0 vale 1 1 f 0 (x) = 2x cos + sin . x x Quindi f 0 (x) non ammette limite per x → 0. D’altra parte, f è derivabile in 0 e f 0 (0) = 0. Infatti f (x) − f (0) 1 = lim x cos = 0. x→0 x x La derivata ha una discontinuità di seconda specie in x0 = 0. Vedremo nel capitolo 10 che ogni funzione continua in un intervallo è una funzione derivata. Invece, come conseguenza del Corollario, funzioni quali sgn x, mant x e le funzioni monotone discontinue, non sono le funzioni derivate di alcuna funzione. lim x→0 226 8.8 8. Calcolo differenziale Crescere e decrescere Le due formule dell’incremento finito permettono di caratterizzare le funzioni monotone. Teorema 8.8.1 Sia I ⊆ R un intervallo e sia f : I → R derivabile in I. a) Condizione necessaria e sufficiente affinché f sia monotona non decrescente in I è che f 0 (x) ≥ 0 per ogni x ∈ I. b) Condizione necessaria e sufficiente affinché f sia monotona non crescente in I è che f 0 (x) ≤ 0 per ogni x ∈ I. Dimostrazione. Ci limitiamo a dimostrare a), poiché la dimostrazione di b) è del tutto analoga. Supponiamo f 0 (x) ≥ 0 e siano x1 , x2 ∈ I, tali che x1 < x2 . Possiamo applicare il Teorema di Lagrange all’intervallo [x1 , x2 ] ⊆ I. Esiste θ ∈ (0, 1) tale che f (x2 ) − f (x1 ) = (x2 − x1 )f 0 (x1 + θ(x2 − x1 )) ≥ 0 e quindi f è monotona non decrescente. Viceversa, sia f monotona non decrescente. Per assurdo, esista x0 ∈ I tale che f 0 (x0 ) < 0. Sia x ∈ I, x 6= x0 . Per la prima formula dell’incremento finito, µ ¶ o(x − x0 ) f (x) − f (x0 ) = (x − x0 ) f 0 (x0 ) + . (8.8.2) x − x0 Esiste δ > 0 tale che per 0 < |x − x0 | < δ si ha f 0 (x0 ) + o(x − x0 ) < 0. x − x0 Per questi valori di x, (8.8.2) implica che f (x)−f (x0 ) ha segno opposto a x−x0 . La funzione non può quindi essere non decrescente, assurdo. Corollario 8.8.3 (caratterizzazione delle funzioni costanti) Sia I ⊆ R un intervallo e sia f : I → R, derivabile in I. La funzione f è costante se e solo se f 0 (x) = 0 per ogni x ∈ I. Dimostrazione. Se f (x) è costante, ovviamente f 0 (x) = 0 per ogni x. Viceversa, sia f 0 (x) = 0 per ogni x ∈ I. Allora, per il Teorema precedente, f è allo stesso tempo monotona non crescente e non decrescente. Quindi è costante. Il Corollario vale per funzioni definite in un intervallo, ma non vale in generale se f non è definita in un intervallo. Esempi 8.8.4 1. Si definisca ½ f (x) = 1 2 se 0 ≤ x ≤ 1, se 2 ≤ x ≤ 3. Questa funzione ha derivata nulla in ogni punto del suo insieme di definizione, ma non è costante, poiché f (1) 6= f (2). 8.8. Crescere e decrescere 227 2. Sia f (x) = arctan x + arctan 1/x e sia x > 0. Si ha (si veda (8.7.13)) 1 1 + x2 1 1 D arctan = − , x 1 + x2 D arctan x = da cui f 0 (x) = 0. Quindi f (x) = C. Si può calcolare il valore della costante ponendo x = 1. Poiché arctan 1 = π/4, si ottiene ∀x > 0 arctan x + arctan 1 π = . x 2 (8.8.5) Consideriamo ora la stessa funzione per x < 0. La derivata è ancora nulla e quindi f (x) è costante anche sui negativi. Calcoliamo f (−1). Poiché arctan (−1) = −π/4, si ottiene ∀x < 0 arctan x + arctan 1 π =− . x 2 (8.8.6) 3. In modo del tutto analogo all’esempio precedente si può ottenere l’ovvia identità π ∀x ∈ [−1, 1] arcsin x + arccos x = . 2 La derivata di una funzione strettamente monotona può annullarsi in qualche punto. Ad esempio, f (x) = x3 è strettamente crescente in R, ma f 0 (0) = 0. La situazione è chiarita dal seguente Teorema. Teorema 8.8.7 Sia I ⊆ R un intervallo e sia f : I → R derivabile in I. a) Se f 0 (x) ≥ 0 e gli eventuali punti in cui f 0 (x) = 0 sono isolati, allora f è monotona strettamente crescente in I. b) Se f 0 (x) ≤ 0 e gli eventuali punti in cui f 0 (x) = 0 sono isolati, allora f è monotona strettamente decrescente in I. Dimostrazione. Ci limitiamo a dimostrare a), poiché la dimostrazione di b) è del tutto analoga. Poiché f 0 (x) non è mai negativa, la funzione è monotona non decrescente. Siano x1 , x2 ∈ I, tali che x1 < x2 . Si ha f (x1 ) ≤ f (x2 ). Supponiamo per assurdo che valga l’eguaglianza, cioè f (x1 ) = f (x2 ). Allora, per la monotonia, f (x1 ) = f (x) = f (x2 ) per ogni x ∈ [x1 , x2 ]. Quindi f 0 (x) = 0 in [x1 , x2 ], contro l’ipotesi che gli zeri della derivata siano isolati. Corollario 8.8.8 Sia f : (x0 − δ, x0 + δ) → R derivabile in (x0 − δ, x0 + δ). Sia f 0 (x0 ) = 0. a) Se f 0 (x) < 0 per x ∈ (x0 − δ, x0 ) e f 0 (x) > 0 per x ∈ (x0 , x0 + δ), allora x0 è un punto di minimo forte. 228 8. Calcolo differenziale b) Se f 0 (x) > 0 per x ∈ (x0 − δ, x0 ) e f 0 (x) < 0 per x ∈ (x0 , x0 + δ), allora x0 è un punto di massimo forte. Dimostrazione. Se vale l’ipotesi di a), per il Teorema 8.8.7, f (x) è monotona strettamente decrescente in (x0 − δ, x0 ] e monotona strettamente crescente in [x0 , x0 + δ). Quindi x0 è un punto di minimo forte. La dimostrazione di b) è analoga. Se la derivata mantiene lo stesso segno per x < x0 e per x > x0 allora f è strettamente monotona in (x0 −δ, x0 +δ). Il punto x0 , come vedremo in seguito, è un punto di flesso a tangente orizzontale. Esempi 8.8.9 1. Sia f (x) = x2n , ove n ∈ N. Si ha f 0 (x) = 2nx2n−1 . La derivata si annulla in x = 0 ed è negativa per x < 0, positiva per x > 0. Quindi 0 è un punto di minimo forte. Sia f (x) = x2n+1 , ove n ∈ N. Si ha f 0 (x) = (2n + 1)x2n . La derivata si annulla in x = 0, ma tale punto non è estremante, poiché f 0 (x) si mantiene positiva a destra e a sinistra di 0. La funzione è crescente. 2. Sia f (x) = log(1 + x) − x, definita per x > −1. Si ha f 0 (x) = 1 − 1. 1+x La derivata si annulla solo in x = 0. Per −1 < x < 0 si ha f 0 (x) > 0, mentre per x > 0 si ha f 0 (x) < 0. Quindi x = 0 è un punto di massimo forte. Ne segue, per ogni x > −1, x 6= 0, log(1 + x) < x. 1 -1 -1 f (x) = log(1 + x) − x 8.9. Teorema di De l’Hospital 8.9 229 Teorema di De l’Hospital 0 ∞ Il Teorema di De l’Hospital permette di studiare le forme di indecisione e 0 ∞ nel calcolo dei limiti. Ci limitiamo a enunciare il Teorema, la cui dimostrazione è svolta nell’Appendice. Teorema 8.9.1 (di De l’Hospital) Siano f : (a, b) → R e g : (a, b) → R due funzioni derivabili in (a, b), ove −∞ ≤ a < b ≤ +∞. Siano g(x) 6= 0 e g 0 (x) 6= 0 in (a, b). Siano verificate le seguenti ipotesi: f (x) 0 ∞ presenta il caso di indecisione oppure per x → a+ g(x) 0 ∞ (oppure per x → b−); i) il rapporto ii) limx→a+ f 0 (x) f 0 (x) = γ ∈ R (rispettivamente, lim =γ∈R) x→b− g 0 (x) g 0 (x) Allora: lim x→a+ f (x) =γ g(x) (rispettivamente, lim x→b− f (x) = γ) g(x) Esempi 8.9.2 1 − cos 2x 1. Calcoliamo limx→0 . Questo limite presenta la forma di indecix2 0 sione . Il rapporto delle derivate è 0 2 sin 2x →2 2x Quindi limx→0 per x → 0. 1 − cos 2x = 2. x2 x − log(1 + x) . Questo limite presenta la forma di 2. Calcoliamo limx→0 x2 0 indecisione . Il rapporto delle derivate è 0 1− Quindi limx→0 1 1 1 1+x = → 2x 2(1 + x) 2 1 x − log(1 + x) = . 2 x 2 per x → 0. 230 8. Calcolo differenziale 3. Calcoliamo limx→0+ x cot x. Questo limite presenta la forma di indecisione ∞ 0 · ∞, ma può essere ricondotto alla forma , scrivendo ∞ x cot x = cot x . 1 x Il rapporto delle derivate è 1 2 sin x2 = x →1 1 sin2 x − 2 x − per x → 0. Quindi limx→0+ x cot x = 1. π 4. Determiniamo l’ordine di infinitesimo per x → +∞ di −arctan x rispetto 2 1 all’infinitesimo . Si tratta si determinare per quale valore a > 0 il limite x lim x→+∞ π − arctan x 2 µ ¶ a 1 x esiste finito e diverso da 0. Passiamo al rapporto delle derivate. Esso è 1 − a+1 xa−1 1 + x2 = x ∼ . µ ¶a+1 2 a (1 + x ) a 1 −a x Il limite di tale rapporto per x → +∞ è finito e diverso da 0 se e solo se a = 1. Quindi l’ordine di infinitesimo è 1. 5. L’esistenza del limite del rapporto delle derivate è condizione sufficiente ma non necessaria per l’esistenza del limite del rapporto delle funzioni. Ad esempio, siano 1 f (x) = x2 sin , x Per x → 0 il rapporto g(x) = ex − 1. f (x) ha limite 0, poiché g(x) 1 1 x sin 1 x x = lim x lim x = lim x sin = 0. e − 1 x→0 x→0 e − 1 x→0 x x x2 sin 8.10. Derivate di ordine superiore 231 Invece, il rapporto delle derivate è 1 1 2x sin − cos f 0 (x) x x = g 0 (x) ex che non ammette limite per x → 0. 8.10 Derivate di ordine superiore Abbiamo notato che una funzione elementare dell’analisi è derivabile in tutto il suo insieme di definizione (con la possibile eccezione di punti isolati). Le funzioni derivate delle funzioni elementari sono ancora funzioni elementari e quindi a loro volta derivabili. Questa osservazione ci conduce alla definizione delle derivate successive di una funzione. Definizione 8.10.1 Sia I ⊆ R un intervallo e sia f : I → R una funzione derivabile in I. Sia x0 ∈ I. Si dice che la funzione f (x) è derivabile due volte in x0 se la funzione derivata f 0 : I → R è a sua volta derivabile in x0 . Si chiama derivata seconda della funzione in x0 la derivata di f 0 (x) in x0 . La derivata seconda di f in x0 si denota usualmente con f 00 (x0 ), oppure con un dei simboli d2 f D2 f (x0 ), (x0 ), y 00 (x0 ). dx2 In maniera analoga si definisce la derivata terza. Se f 00 (x) esiste in I ed è a sua volta derivabile in x0 , si dice che f è derivabile tre volte in x0 e la derivata della derivata seconda si chiama derivata terza di f in x0 . Essa viene indicata con uno dei simboli f 000 (x0 ), D3 f (x0 ), d3 f (x0 ), dx3 y 000 (x0 ). Per induzione possiamo ora definire la derivata n–esima di una funzione. Definizione 8.10.2 Sia I ⊆ R un intervallo, e sia f : I → R una funzione derivabile n − 1 volte in I. Sia x0 ∈ I. Se la derivata (n − 1)–esima è a sua volta derivabile in x0 , si dice che f è derivabile n volte in x0 e la derivata della derivata (n − 1)–esima si chiama derivata n–esima di f in x0 , o derivata di ordine n. La derivata n–esima in x0 viene indicata con uno dei simboli f (n) (x0 ), Dn f (x0 ), D(n) f (x0 ), dn f (x0 ), dxn y (n) (x0 ). In questo contesto, la derivata f 0 (x) viene chiamata derivata prima di f . Si pone anche, per ogni funzione f , f (0) (x) = f (x). 232 8. Calcolo differenziale Si noti che, come l’esistenza della derivata prima in x0 implica che la funzione sia definita in un intorno di x0 (in un intorno destro o sinistro di x0 per la derivata destra o sinistra), l’esistenza di f (n) (x0 ) implica l’esistenza di f (n−1) (x0 ) in un intorno di x0 (in un intorno destro o sinistro di x0 se x0 è un estremo di I). Esempi 8.10.3 1. Sia f (x) = xn , ove n è intero positivo. Si ha Dxn = xn−1 . Le derivate successive sono D2 xn = n(n − 1)xn−2 , D3 xn = n(n − 1)(n − 2)xn−3 , Dn xn = n! Le derivate di ordine maggiore di n sono tutte nulle. Di conseguenza, le derivate di ordine maggiore di n un polinomio di grado n sono tutte nulle. 2. Sia f (x) = ex . Si ha per ogni n > 0 intero f 0 (x) = ex , f 00 (x) = ex , . . . , f (n) (x) = ex , . . . In questo caso tutte le derivate coincidono con ex . Per ogni n ≥ 0 intero D n ex = ex 3. Sia f (x) = sin x. Si ha f 0 (x) = cos x, f 00 (x) = − sin x, f 000 (x) = − cos x, f (4) (x) = sin x = f (x) . La derivata quarta è quindi eguale alla funzione. Per ogni k ≥ 0 intero si ha perciò D(4k) sin x = sin x, D(4k+1) sin x = cos x, D(4k+2) sin x = − sin x, D(4k+3) sin x = − cos x . Analogamente, se f (x) = cos x, si ha f 0 (x) = − sin x, f 000 (x) = sin x, f 00 (x) = − cos x, f (4) (x) = cos x . Quindi, per ogni k ≥ 0 intero si ha D(4k) cos x = cos x, D(4k+2) cos x = − cos x, D(4k+1) cos x = − sin x, D(4k+3) cos x = sin x . 4. Le derivate di ordine superiore di sinh x e cosh x si calcolano tenendo presente che D sinh x = cosh x e D cosh x = sinh x. Per ogni intero k ≥ 0 si ha D(2k) sinh x = sinh x, D(2k+1) sinh x = cosh x, D(2k) cosh x = cosh x, D(2k+1) cosh x = sinh x . 8.10. Derivate di ordine superiore 233 5. Sia f (x) = log(1 + x). Si ha f 0 (x) = f 000 (x) = 1 , 1+x 2 (1 + x) f 00 (x) = − 1 2, (1 + x) 2·3 f (4) (x) = − 4, ... (1 + x) 3, Si ha cosı̀ per ogni n > 0 intero Dn log(1 + x) = (−1)n−1 (n − 1)! n . (1 + x) 6. Sia f (x) = (1 + x)α , ove α 6= 0 è un numero reale. Si ha f 0 (x) = α(1 + x)α−1 , f 00 (x) = α(α − 1)(1 + x)α−2 , f 000 (x) = α(α − 1)(α − 2)(1 + x)α−3 , . . . Per ogni intero k > 0 si ha dunque Dk (1 + x)α = α(α − 1)(α − 2) · · · (α − k + 1)(1 + x)α−k . (8.10.4) Se α = n ∈ N, l’espressione delle derivate (8.10.4) si annulla per k > n. Si pone µ ¶ α(α − 1)(α − 2) · · · (α − k + 1) α = . (8.10.5) k! k La quantità definita in (8.10.5) si chiama coefficiente binomiale di α su k. Se α = n ∈ N, tale espressione coincide con il noto coefficiente binomiale. Infatti, per n ≤ k si ha µ ¶ n n! n(n − 1)(n − 2) · · · (n − k + 1) = = . k k! (n − k)! k! 7. Calcoliamo le derivate di arctan x fino al terzo ordine. Si ha D arctan x = (1 + x2 )−1 2x D2 arctan x = − (1 + x2 )2 2(3x2 − 1) D3 arctan x = . (1 + x2 )3 8. Diamo un esempio di funzione derivabile una volta, ma non due volte in un punto. Sia f (x) = x |x|. Si ha f 0 (x) = 2x f 0 (x) = −2x se x > 0 se x < 0 Sia per x → 0+ che per x → 0− si ha f 0 (x) → 0. Per il Teorema 8.7.11 la derivata di f in 0 esiste e f 0 (0) = 0. Si ha quindi per ogni x reale f 0 (x) = 2 |x| che non è a sua volta derivabile in x = 0. 234 8.11 8. Calcolo differenziale Formula di Taylor Sia f : [a, b] → R e siano x e x0 due punti di [a, b]. Se f è derivabile in x0 la prima formula dell’incremento finito, f (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + o(x − x0 ), fornisce una approssimazione della funzione mediante un polinomio lineare che rappresenta l’ordinata della tangente al grafico in x0 . L’errore, o resto, tende a 0 più velocemente dell’incremento (x − x0 ). Supponiamo ora che f sia derivabile n volte in x0 . Ci chiediamo se f (x) possa essere approssimata, con un errore ancora più piccolo, mediante un polinomio di grado n, il cui grafico passa per (x0 , f (x0 )). La formula di Taylor, congiuntamente alle espressioni del resto, risponde a tale quesito. Definizione 8.11.1 Sia f : [a, b] → R derivabile n − 1 volte (n ≥ 1) in x0 ∈ [a, b]. Sia x ∈ [a, b]. Si chiama formula di Taylor arrestata all’ordine n, con punto iniziale x0 e incremento (x−x0 ) della variabile indipendente, l’espressione f 0 (x0 ) f 00 (x0 ) f 000 (x0 ) (x − x0 ) + (x − x0 )2 + (x − x0 )3 + · · · 1! 2! 3! f (n−1) (x0 ) + (x − x0 )n−1 + Tn (x − x0 ). (n − 1)! (8.11.2) f (x) = f (x0 ) + La quantità Tn (x − x0 ) si chiama resto n–esimo. Il polinomio pn−1 (x − x0 ) = n−1 X k=0 f (k) (x0 ) (x − x0 )k k! che appare a secondo membro della (8.11.2) si chiama polinomio di Taylor (n − 1)–esimo con centro in x0 . È evidente che, essendo Tn (x − x0 ) null’altro che la differenza tra f (x) e il polinomio di Taylor, la sostanza della formula di Taylor consiste nell’espressione di Tn (x − x0 ). Esistono varie forme del resto, ma noi ci limiteremo qui a due espressioni, che generalizzano la prima e la seconda formula dell’incremento finito. Teorema 8.11.3 (Formula di Taylor con resto di Peano) Sia f : [a, b] → R derivabile n − 1 volte in x0 ∈ [a, b]. Se esiste in x0 la derivata n–esima f (n) (x0 ), allora Tn (x − x0 ) = f (n) (x0 ) (x − x0 )n + o ((x − x0 )n ) . n! (8.11.4) Equivalentemente f (x) = n X f (k) (x0 ) k=0 k! (x − x0 )k + o ((x − x0 )n ) n = pn (x − x0 ) + o ((x − x0 ) ) (8.11.5) 8.11. Formula di Taylor 235 Dimostrazione. Dimostriamo il Teorema per induzione. Se n = 1 l’espressione (8.11.5) si riduce a f (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + o(x − x0 ), che ovviamente vale se f è derivabile in x0 . Supponiamo vera la (8.11.5) per ogni funzione derivabile n volte in x0 e dimostriamo che essa vale, con n + 1 al posto di n, per ogni funzione derivabile n + 1 volte in x0 . Poiché deve essere f (x)−pn+1 (x−x0 ) = o((x−x0 )n+1 ), dobbiamo dimostrare che n+1 X f (k) (x0 ) f (x) − (x − x0 )k k! k=0 lim = 0. (8.11.6) x→x0 (x − x0 )n+1 0 Poiché il limite in (8.11.6) presenta la forma di indecisione per x → x0 , 0 applichiamo il Teorema di De l’Hospital. Calcoliamo il rapporto delle derivate. La derivata del denominatore vale (n + 1)(x − x0 )n . La derivata del numeratore vale 2 00 3 f (x0 )(x − x0 ) − f (3) (x0 )(x − x0 )2 − 2! 3! 4 n + 1 (n+1) − f (4) (x0 )(x − x0 )3 − · · · − f (x0 )(x − x0 )n = 4! (n + 1)! f 0 (x) − f 0 (x0 ) − = f 0 (x) − n+1 X k=1 f (k) (x0 ) (x − x0 )k−1 . (k − 1)! (8.11.7) Denotiamo con g(x) la funzione f 0 (x). Evidentemente f (k) (x) = g (k−1) (x). L’espressione (8.11.7) della derivata del numeratore diviene g(x) − n+1 X k=1 n X g (k−1) (x0 ) g (j) (x0 ) (x − x0 )k−1 = g(x) − (x − x0 )j . (k − 1)! j! j=0 Poiché g è derivabile n volte in x0 , per l’ipotesi di induzione si ha g(x) − n X g (j) (x0 ) j=0 j! (x − x0 )j (n + 1)(x − x0 )n →0 per x → x0 . Per il Teorema di De l’Hospital possiamo concludere che (8.11.6) vale. Questo conclude la dimostrazione. Teorema 8.11.8 (Formula di Taylor con resto di Lagrange) Sia data f : [a, b] → R e siano x0 , x ∈ [a, b], ove x0 < x. Supponiamo che valgano le seguenti ipotesi: 236 8. Calcolo differenziale i) f è continua in [x0 , x]; ii) esistono le derivate di f fino all’ordine (n − 1) in [x0 , x), ed esse sono ivi continue; iii) esiste la derivata n− esima di f in (x0 , x). Allora f (n) (x0 + θ(x − x0 )) (x − x0 )n n! ove θ è un opportuno numero tale che 0 < θ < 1. Si ha quindi Tn (x − x0 ) = f (x) = n−1 X k=0 f (k) (x0 ) f (n) (x0 + θ(x − x0 )) (x − x0 )k + (x − x0 )n k! n! (8.11.9) f (n) (x0 + θ(x − x0 )) = pn−1 (x − x0 ) + (x − x0 )n . n! Lo stesso risultato vale se x < x0 , con le ovvie modifiche delle ipotesi. Dimostrazione. La tesi seguirà da una ripetuta applicazione del Teorema di Cauchy. Per ogni t ∈ [x0 , x] poniamo F (t) = f (t) − pn−1 (t − x0 ) e G(t) = (t − x0 )n . Definiamo F1 (t) = F 0 (t) = f 0 (t) − p0n−1 (t − x0 ), G1 (t) = G0 (t) = n(t − x0 )n−1 00 F2 (t) = F10 (t) = f 00 (t) − p00n−1 (t − x0 ), G2 (t) = G (t) = n(n − 1)(t − x0 )n−2 ........................ (n−1) Fn−1 (t) = F (n−1) (t) = f (n−1) (t) − pn−1 (t − x0 ), Gn−1 (t) = G(n−1) (t) = n!(t − x0 ). Si osservi ora che, in forza dell’esempio 8.10.3.1, le derivate di pn−1 (t − x0 ) calcolate per t = x0 coincidono con le derivate di f (t) in x0 . Ad esempio p0n−1 (t − x0 ) = f 0 (x0 ) + (t − x0 )f 00 (x0 ) + · · · + n−1 (t − x0 )n−2 , (n − 1)! da cui p0n−1 (0) = f 0 (x0 ), etc. Si ha cosı̀ F1 (x0 ) = 0, F2 (x0 ) = 0, G1 (x0 ) = 0 G2 (x0 ) = 0 ............... Fn−1 (x0 ) = 0, Gn−1 (x0 ) = 0. Sono verificate nell’intervallo [x0 , x] le ipotesi del Teorema di Cauchy per le funzioni F e G. Esiste quindi z1 ∈ (x0 , x) tale che F (x) − F (x0 ) F 0 (z1 ) F1 (z1 ) − F1 (x0 ) F (x) = = 0 = . G(x) G(x) − G(x0 ) G (z1 ) G1 (z1 ) − G1 (x0 ) 8.11. Formula di Taylor 237 Notiamo ora che nell’intervallo [x0 , z1 ] le funzioni F1 e G1 soddisfano a loro volta le ipotesi del Teorema di Cauchy. Esiste quindi z2 ∈ (x0 , z1 ) tale che F1 (z1 ) − F1 (x0 ) F 0 (z2 ) F2 (z2 ) − F2 (x0 ) = 10 . = G1 (z1 ) − G1 (x0 ) G1 (z2 ) G2 (z2 ) − G2 (x0 ) Continuando questo procedimento, dopo n − 1 passi si arriva all’eguaglianza F 0 (zn ) Fn−1 (zn−1 ) − Fn−1 (x0 ) = n−1 Gn−1 (zn−1 ) − Gn−1 (x0 ) G0n−1 (zn ) ove x0 < zn < zn−1 < · · · z1 < x. Si ha 0 (zn ) = f (n) (zn ), Fn−1 G0n−1 (zn ) = n!. Poiché F (x) F1 (z1 ) − F1 (x0 ) Fn−1 (x) − Fn−1 (x0 ) = = ······ = G(x) G1 (z1 ) − G1 (x0 ) Gn−1 (x) − Gn−1 (x0 ) si ottiene l’eguaglianza desiderata Tn (x − x0 ) f (x) − pn−1 (x − x0 ) f (n) (x0 + θ(x − x0 )) = = , n n (x − x0 ) (x − x0 ) n! ove si è posto zn = x0 + θ(x − x0 ). Per n = 1 il Teorema si riduce al Teorema di Lagrange e la formula (8.11.9) non è altro che la seconda formula dell’incremento finito. I resti di Peano e di Lagrange non sono le uniche espressioni note del resto della formula di Taylor. Nell’Appendice del capitolo 10 dimostreremo un’altra espressione del resto, la cosiddetta forma integrale. La formula di Taylor con resto di Peano fornisce uno sviluppo di f (x) mediante polinomi in (x − x0 ), con un errore che è o ((x − x0 )n ). Tale sviluppo è unico, nel senso precisato dal seguente Teorema. Teorema 8.11.10 (di unicità dello sviluppo) Sia f : [a, b] → R, e sia x0 ∈ [a, b]. Valgano ambedue le espressioni f (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + · · · + an (x − x0 )n + o ((x − x0 )n ) (8.11.11) f (x) = b0 + b1 (x − x0 ) + b2 (x − x0 )2 + · · · + bn (x − x0 )n + o ((x − x0 )n ) . (8.11.12) Allora: a0 = b0 , a1 = b1 , a2 = b2 , . . . , an = bn . Dimostrazione. Ragioniamo per assurdo. Se la tesi è falsa, esiste un primo indice k ≤ n tale che ak 6= bk . Sottraendo (8.11.12) da (8.11.11) si ha 0 = (ak − bk ) (x − x0 )k + (ak+1 − bk+1 ) (x − x0 )k+1 + · · · + (an − bn ) (x − x0 )n + o ((x − x0 )n ) . (8.11.13) 238 8. Calcolo differenziale Dividiamo ambo i membri di (8.11.13) per (x−x0 )k e portiamo a primo membro (ak − bk ). Otteniamo − (ak − bk ) = (ak+1 − bk+1 ) (x − x0 ) + (ak+2 − bk+2 ) (x − x0 )2 + · · · + (an − bn ) (x − x0 )n−k + o ((x − x0 )n ) . (x − x0 )k (8.11.14) Passando al limite per x → x0 vediamo che il secondo membro di (8.11.14) tende a 0. Quindi ak − bk = 0, assurdo. 8.12 1) Sia Esempi sulla formula di Taylor P (x) = c0 + c1 x + c2 x2 + · · · + cn xn un polinomio di grado n. Questa funzione è derivabile infinite volte e tutte le sue derivate di ordine maggiore di n sono nulle. Fissati due qualsiasi numeri x0 e x, possiamo scrivere la formula di Taylor con resto di Lagrange arrestata all’ordine n+1 con punto iniziale x0 e incremento (x − x0 ). Tuttavia tale resto è nullo, poiché P (n+1) (x) = 0 per ogni x. Quindi si ha 00 P 0 (x0 ) P (x0 ) P P (x) = P (x0 ) + (x − x0 ) + (x − x0 )2 + · · · + 1! 2! (n) (x0 ) (x − x0 )n , 2! cioè P (x) coincide con il suo polinomio di Taylor n–esimo. 2) Sia f (x) = sin x e x0 = π/4. Calcoliamo la formula di Taylor arrestata al terzo ordine con resto di Peano. Si ha 1 f (π/4) = sin π/4 = √ 2 1 f 0 (π/4) = cos π/4 = √ 2 1 f 00 (π/4) = − sin π/4 = − √ 2 1 f 000 (π/4) = − cos π/4 = − √ . 2 Quindi µ³ ¶ 1 ³ π´ 1 ³ π ´2 1 ³ π ´3 π ´3 1 − √ x− − √ x− +o x − . sin x = √ + √ x − 4 4 4 4 2 2 2 2 6 2 3) Sia f (x) = log(2 + x + x2 ) e sia x0 = −1. Calcoliamo la formula di Taylor arrestata al secondo ordine con resto di Peano. Si ha f 0 (x) = 1 + 2x , 2 + x + x2 f 00 (x) = 3 − 2x − 2x2 2, (2 + x + x2 ) 8.12. Esempi sulla formula di Taylor 239 da cui f (−1) = log 2, f 0 (−1) = −1/2, f 00 (−1) = 3/4. Quindi 1 3 2 log(2 + x + x2 ) = log 2 − (x + 1) + (x + 1)2 + o((x + 1) ). 2 8 Se x0 = 0 la formula di Taylor con resto di Peano assume il nome di formula di McLaurin e il relativo polinomio di Taylor si chiama polinomio di McLaurin. Nel seguito calcoliamo la formula di McLaurin con resto di Peano arrestata all’ordine n per alcune funzioni elementari, tenendo conto dell’espressione per le derivate di ordine superiore di tali funzioni calcolate nel paragrafo 8.10. Esponenziale e funzioni iperboliche Per ogni n la derivata n–esima di ex è ex stessa e quindi vale 1 in x = 0. Si ha ex = 1 + x x2 x3 xn + + + ··· + + o (xn ) . 1! 2! 3! n! Le derivate pari di sinh x coincidono con sinh x, e quindi sono nulle in x = 0, mentre le derivate dispari coincidono con cosh x e quindi valgono 1 in x = 0. Scriviamo la formula di McLaurin arrestata a un ordine dispari: sinh x = ¡ ¢ x x3 x5 x2n+1 + + + ··· + + o x2n+1 . 1! 3! 5! (2n + 1)! Ad esempio, per 2n + 1 = 3 si ha sinh x = x + x3 + o(x3 ). 3! Dato che il termine successivo è x5 /5! , in realtà l’o piccolo è o(x4 ). Analogamente, in x = 0 le derivate dispari del coseno iperbolico sono nulle, mentre le derivate pari valgono 1. Scrivamo la formla di McLaurin arrestata a un ordine pari: cosh x = 1 + ¡ ¢ x2 x4 x2n + + ··· + + o x2n . 2! 4! (2n)! Ad esempio, per 2n + 2 = 2 si ha cosh x = 1 + x2 + o(x2 ). 2! Anche in questo caso, dato che il termine successivo è x4 /4! , in realtà l’o piccolo è o(x3 ). Funzioni circolari Le derivate di ordine pari del seno sono ± sin x, e quindi nulle in x = 0. Le derivate dispari sono ± cos x e valgono ±1 in x = 0. Si ha sin x = ¡ ¢ x3 x5 x7 x2n+1 x − + − + · · · + (−1)n + o x2n+1 . 1! 3! 5! 7! (2n + 1)! 240 8. Calcolo differenziale Per 2n + 1 = 3 si ha x3 + o(x3 ). 1! Dato che il termine successivo è x5 /5! , anche in questo caso l’o piccolo è in realtà o(x4 ). In x = 0 le derivate le derivate dispari del coseno sono nulle, mentre le derivate pari valgono ∓1. Si ha ¢ ¡ x4 x6 x2n x2 + − + · · · + (−1)n + o x2n . cos x = 1 − 2! 4! 6! (2n)! sin x = x − Ad esempio, per 2n + 2 = 2 si ha x2 + o(x2 ). 2! Il termine successivo è x4 /4! e quindi l’o piccolo è in realtà o(x3 ). cos x = 1 − Logaritmo x > −1 Ricordando l’espressione delle derivate di log(1+x), si ottiene per x2 x3 x4 xn + − + · · · + (−1)n−1 + o (xn ) . 2 3 4 n Per n = 2 si ha ad esempio log(1 + x) = x − log(1 + x) = x − x2 + o(x2 ). 2 Potenze Sia α 6= 0 un numero reale non appartenente a N. Si ha per x > −1 µ ¶ µ ¶ µ ¶ α α 2 α n (1 + x)α = 1 + x+ x + ··· + x + o(xn ). 1 2 n Ad esempio, se α = 1/2 e n = 2 si ha √ 1 1 1 + x = 1 + x − x2 + o(x2 ). 2 8 Se α = n è intero positivo, (1 + x)n è un polinomio di grado n e quindi coincide con il suo polinomio di McLaurin n−esimo. Possiamo usare la formula di McLaurin per ricavare l’espressione della potenza n−esima di un binomio. Si ha infatti µ ¶ µ ¶ µ ¶ n n 2 n n (1 + x)n = 1 + x+ x + ··· + x 1 2 n n µ ¶ X n k x . = k k=0 b Ponendo ora x = ed eseguendo le semplificazioni, si ottiene la nota formula a n µ ¶ X n n−k k a b . (a + b)n = k k=0 8.12. Esempi sulla formula di Taylor 241 Inverse delle funzioni trigonometriche Ricaviamo la formula di McLaurin arrestata al terzo ordine dell’arcotangente. Tenendo conto che arctan 0 = 0 e dei calcoli svolti nell’esempio 8.10.3.7, si ottiene arctan x = x − x3 + o(x3 ) . 3 Si può dimostrare che per ogni intero n > 0 si ha arctan x = x − ¢ ¡ x5 x2n+1 x3 + + · · · + (−1)n + o x2n+1 . 3 5 2n + 1 Con semplici calcoli si ricava pure la formula arrestata al terzo ordine per arcsin x. x3 arcsin x = x + + o(x3 ). 6 Si può anche dimostrare che per ogni intero n > 0 vale la formula arcsin x = x + ¢ ¡ 1 x3 1 · 3 x5 1 · 3 · 5 · 7 · · · (2n − 1) x2n+1 + +···+ + o x2n+1 . 2 3 2·4 5 2 · 4 · 6 · 8 · · · 2n 2n + 1 Lo sviluppo di arccos x si ottiene da quello di arcsin x, osservando che arccos x = π 2 − arcsin x. Applicazioni del teorema di unicità dello sviluppo Si voglia scrivere la formula di McLaurin di sin x5 arrestata al quindicesimo ordine. Non è necessario eseguire quindici derivate. Infatti, posto z = x5 , si ha sin z = z − z3 + o(z 3 ). 6 Sostituendo a z il valore x5 si ottiene sin x5 = x5 − x15 + o(x15 ). 6 Per il Teorema di unicità dello sviluppo, questa espressione coincide con la formula di McLaurin arrestata al quindicesimo ordine. Calcoliamo ora la formula di McLaurin per log2 (1 + x) arrestata al terzo ordine. Si ha µ ¶2 x2 2 2 log (1 + x) = x − + o(x ) 2 ¸ · 4 ¡ 2 ¢2 x 2 2 2 2 3 + o(x ) + 2xo(x ) − x o(x ) . =x −x + 4 Si verifica immediatamente che il termine in parentesi quadrata è o(x3 ) e quindi la formula cercata è log2 (1 + x) = x2 − x3 + o(x3 ). 242 8. Calcolo differenziale Si noti che è bastato sviluppare log(1 + x) al secondo ordine e poi calcolare il quadrato di questo sviluppo. Sviluppando log(1 + x) al terzo ordine, si giunge al medesimo risultato. Infatti, passando al quadrato, i termini aggiuntivi danno luogo a infinitesimi di ordine superiore al terzo. In altri casi può essere invece necessario sviluppare fino al terzo ordine. 8.13 Convessità, concavità, flessi. Definizione 8.13.1 Sia I ⊆ R un intervallo e sia f : I → R. Si dice che f è convessa in I se per ogni terna di punti x1 < x < x2 di I si ha f (x) ≤ f (x1 ) + f (x2 ) − f (x1 ) (x − x1 ). x2 − x1 (8.13.2) f (x2 ) − f (x1 ) (x − x1 ). x2 − x1 (8.13.3) Si dice che f è concava in I se f (x) ≥ f (x1 ) + f(x1) f(x2) f(x) x1 x x2 Funzione strettamente convessa La diseguaglianza (8.13.2) ha un evidente significato geometrico: il grafico della funzione sta non al di sopra del segmento che unisce i punti (x1 , f (x1 )) e (x2 , f (x2 )). Infatti l’espressione a destra in (8.13.2) è l’ordinata della retta che congiunge tali punti. Se la funzione è concava il suo grafico sta non al di sotto del segmento. Evidentemente f è convessa se e solo se −f è concava. Se la diseguaglianza in (8.13.2) vale in senso forte, cioè con il segno < per ogni x1 < x < x2 , si dice che f è strettamente convessa in I. Analoga definizione vale per la concavità stretta. 8.13. Convessità, concavità, flessi. 243 Funzione concava ma non strettamente concava Esempi 8.13.4 1. La funzione f (x) = |x| è strettamente convessa in R, come pure le funzioni x2n con n ∈ N. 2. Ogni funzione lineare f (x) = mx + q è sia convessa che concava in R. 3. La funzione f (x) = sin x è strettamente concava in [0, π] e strettamente convessa in [π, 2π]. 4. La funzione che vale −(x + 1) per x ≤ −1, vale 0 per |x| < 1 e vale x − 1 per x ≥ 1 è convesssa, ma non strettamente convessa in R. 5. Si può dimostrare che f è convessa se e solo se il suo sopragrafo, cioè la regione di piano {(x, y) : x ∈ I, y ≥ f (x)}, è un insieme convesso nel senso usuale: il segmento che unisce due punti del sopragrafo è tutto contenuto nel sopragrafo stesso. In questo paragrafo studieremo le funzioni convesse (e concave) sotto l’ipotesi che esse siano derivabili due volte in I. Nell’Appendice accenneremo alle proprietà delle funzioni convesse senza questa ipotesi di derivabilità. Prima di caratterizzare la concavità e la convessità, riscriviamo la (8.13.2) in un modo equivalente ma più adatto ai nostri scopi. La diseguaglianza (8.13.2) equivale a (x2 − x1 ) (f (x) − f (x1 )) ≤ (f (x2 ) − f (x1 )) (x − x1 ). (8.13.5) Scriviamo ora x2 − x1 = (x2 − x) + (x − x1 ). La (8.13.5) diviene (x2 − x) (f (x) − f (x1 )) ≤ (x − x1 ) (f (x2 ) − f (x1 ) − f (x) + f (x1 )) = (x − x1 ) (f (x2 ) − f (x)) che a sua volta è equivalente a f (x2 ) − f (x) f (x) − f (x2 ) f (x) − f (x1 ) ≤ = . x − x1 x2 − x x − x2 (8.13.6) 244 8. Calcolo differenziale per ogni x1 < x < x2 . Analogamente, nel caso in cui f sia concava, (8.13.3) equivale a f (x) − f (x1 ) f (x2 ) − f (x) f (x) − f (x2 ) ≥ = . x − x1 x2 − x x − x2 Teorema 8.13.7 Sia I ⊆ R un intervallo e sia f : I → R una funzione derivabile due volte in I. Condizione necessaria e sufficiente affinché f sia convessa è che f 00 (x) ≥ 0 per ogni x ∈ I. Condizione necessaria e sufficiente affinché f sia concava è che f 00 (x) ≤ 0 per ogni x ∈ I. Dimostrazione. Dimostriamo l’asserto per le convessità. Supponiamo f convessa e dimostriamo che f 0 (x) è monotona non decrescente. Facendo tendere x a x1 in (8.13.6) si ottiene f 0 (x1 ) ≤ f (x2 ) − f (x1 ) . x2 − x1 (8.13.8) Facendo invece tendere x a x2 , sempre in (8.13.6), si ottiene f (x2 ) − f (x1 ) ≤ f 0 (x2 ). x2 − x1 (8.13.9) Da (8.13.8) e (8.13.9) si ottiene, per ogni x1 < x2 , f 0 (x1 ) ≤ f (x2 ) − f (x1 ) ≤ f 0 (x2 ). x2 − x1 (8.13.10) Abbiamo cosı̀ dimostrato che f 0 (x) è non decrescente. Ne segue f 00 (x) ≥ 0. Supponiamo ora che f 00 (x) ≥ 0 per ogni x. Dobbiamo dimostrare che vale la (8.13.6) per ogni x1 < x < x2 . Applichiamo il Teorema di Lagrange agli intervalli [x1 , x] e [x, x2 ]. Esistono z1 ∈ (x1 , x) e z2 ∈ (x, x2 ) tali che f (x) − f (x1 ) = f 0 (z1 ) x − x1 f (x2 ) − f (x) = f 0 (z2 ). x2 − x La derivata prima è non decrescente, poiché f 00 (x) ≥ 0. Quindi f 0 (z1 ) ≤ f 0 (z2 ). Ne segue (8.13.6). Non è difficile dedurre dai ragionamenti impiegati nella dimostrazione che f è strettamente convessa in I se e solo se f 00 (x) ≥ 0 per ogni x e i punti in cui f 00 (x) = 0 sono isolati. La convessità e la concavità possono anche essere caratterizzate mediante la posizione del grafico rispetto alla tangente in ogni x0 ∈ I. 8.13. Convessità, concavità, flessi. 245 Teorema 8.13.11 Sia I ⊆ R un intervallo e sia f : I → R derivabile due volte in I. Condizione necessaria e sufficiente affinché f sia convessa è che ∀ x0 , x ∈ I f (x) ≥ f (x0 ) + (x − x0 )f 0 (x0 ). (8.13.12) Condizione necessaria e suffciente affinché sia concava è che per ∀ x0 , x ∈ I f (x) ≤ f (x0 ) + (x − x0 )f 0 (x0 ). Dimostrazione. Dimostriamo l’asserto per la convessità. Supponiamo che valga la (8.13.12). Scriviamo la formula di Taylor con resto di Peano arrestata al secondo ordine con punto iniziale x0 . Si ha, per ogni x ∈ I, f (x) = f (x0 ) + (x − x0 )f 0 (x0 ) + ¡ ¢ (x − x0 )2 00 f (x0 ) + o (x − x0 )2 2 ovvero à f (x) − f (x0 ) − (x − x0 )f 0 (x0 ) = (x − x0 )2 ¡ ¢! o (x − x0 )2 1 00 f (x0 ) + . 2 (x − x0 )2 Sia per assurdo f 00 (x0 ) < 0. Allora esiste un intorno B(x0 , δ) di x0 (intorno destro o sinistro, se x0 è un estremo dell’intervallo) tale che per ogni x ∈ B(x0 , δ), x 6= x0 , si ha ¡ ¢ o (x − x0 )2 1 00 f (x0 ) + < 0. 2 (x − x0 )2 In tale intorno quindi, si ha f (x) < f (x0 ) − (x − x0 )f 0 (x0 ), contro l’ipotesi. Ne segue f 00 (x0 ) ≥ 0 per ogni x0 ∈ I e quindi la convessità di f per il Teorema precedente. Viceversa, sia f convessa. In questo caso sappiamo che f 0 (x0 ) ≥ 0 per ogni x0 ∈ I. Scriviamo la formula di Taylor con resto di Lagrange arrestata al secondo ordine con punto iniziale x0 . Per ogni x ∈ I esiste θ ∈ (0, 1) tale che f (x) = f (x0 ) + (x − x0 )f 0 (x0 ) + (x − x0 )2 00 f (x0 + θ(x − x0 )) 2 ossia f (x) − f (x0 ) − (x − x0 )f 0 (x0 ) = Quindi (8.13.12) vale. (x − x0 )2 00 f (x0 + θ(x − x0 )) ≥ 0. 2 246 8. Calcolo differenziale Funzione convessa e tangente al grafico Il significato della condizione (8.13.12) è evidente: f è convessa se e solo se il grafico della funzione sta al di sopra (non al di sotto) della tangente in qualunque punto x0 ∈ I. Analogamente, f è concava se e solo se il grafico della funzione sta al di sotto (non al di sopra) della tangente in qualunque punto x0 ∈ I. In altri termini, la tangente divide il piano in due semipiani e il grafico di una funzione convessa (concava) sta nel semipiano superiore (inferiore). Definizione 8.13.13 Sia f : (x0 − δ, x0 + δ) → R derivabile una volta in x0 . Si dice che x0 è un punto di flesso ascendente se f (x) ≤ f (x0 ) + (x − x0 )f 0 (x0 ) f (x) ≥ f (x0 ) + (x − x0 )f 0 (x0 ) per x ∈ (x0 − δ, x0 ] per x ∈ [x0 , x0 + δ). (8.13.14) (8.13.15) Si dice che x0 è un punto di flesso discendente se f (x) ≥ f (x0 ) + (x − x0 )f 0 (x0 ) f (x) ≤ f (x0 ) + (x − x0 )f 0 (x0 ) per x ∈ (x0 − δ, x0 ] per x ∈ [x0 , x0 + δ). Il punto (x0 , f (x0 )) viene chiamato flesso (ascendente o discendente) per il grafico della funzione. La tangente in un punto x0 divide il piano in due semipiani. Un punto di flesso ascendente (discendente) è un punto in cui il grafico, al passare di x da sinistra a destra di x0 , passa dal semipiano inferiore (superiore) al semipiano superiore (inferiore). Se x0 è un punto di tangente verticale, si dice che x0 è un punto di flesso a tangente verticale. In questo caso il grafico passa dal semipiano sinistro a quello √ 2n+1 x, destro rispetto alla tangente x = x0 . Ad esempio, ogni funzione f (x) = con n ∈ N, ha in x0 = 0 un punto di flesso a tangente verticale. Si ha una condizione necessaria, simile al Teoema di Fermat, affinché x0 sia punto di flesso per una funzione due volte derivabile in tal punto. Teorema 8.13.16 Sia f : (x0 − δ, x0 + δ) → R derivabile due volte in x0 . Se x0 è un punto di flesso, allora f 00 (x0 ) = 0. 8.13. Convessità, concavità, flessi. 247 Dimostrazione. Sia per assurdo f 00 (x0 ) 6= 0 e, per fissare le idee, sia f 00 (x0 ) < 0. Come nella dimostrazione del Teorema precedente, scriviamo formula di Taylor con resto di Peano arrestata al secondo ordine con punto iniziale x0 . Si ha à ¡ ¢! o (x − x0 )2 1 00 0 2 f (x) − f (x0 ) − (x − x0 )f (x0 ) = (x − x0 ) f (x0 ) + . 2 (x − x0 )2 Esiste δ1 < δ tale che per ogni x ∈ (x0 − δ1 , x0 + δ1 ), x 6= x0 , si abbia ¡ ¢ o (x − x0 )2 1 00 f (x0 ) + <0 2 (x − x0 )2 Quindi f (x) < f (x0 ) − (x − x0 )f 0 (x0 ) sia a destra che a sinistra di x0 , contro l’ipotesi che x0 sia un punto di flesso. La condizione f 00 (x0 ) = 0 è necessaria ma non sufficiente affinché x0 sia un punto di flesso. Ad esempio f 00 (x) = x4 è convessa in R, poiché f 00 (x) = 12x2 ≥ 0. Il punto x0 = 0 in cui si annulla la derivata seconda non è un punto di flesso. Se f è concava (rispettivamente, convessa) in (x0 − δ, x0 ] e convessa (rispettivamente, concava) in [x0 , x0 + δ), allora x0 è un punto di flesso ascendente (rispettivamente, discendente). Si ha cosı̀ una condizione sufficiente affinché x0 sia un punto di flesso. Corollario 8.13.17 Sia f : (x0 − δ, x0 + δ) → R derivabile due volte in (x0 − δ, x0 + δ). Sia f 00 (x0 ) = 0. a) Se f 00 (x) < 0 per x ∈ (x0 − δ, x0 ) e f 00 (x) > 0 per x ∈ (x0 , x0 + δ), allora x0 è un punto di flesso ascendente. b) Se f 00 (x) > 0 per x ∈ (x0 − δ, x0 ) e f 00 (x) < 0 per x ∈ (x0 , x0 + δ), allora x0 è un punto di flesso discendente. Dimostrazione. Ad esempio, nel caso a) f è concava in (x0 − δ, x0 ] e convessa in [x0 , x0 + δ). Se f : (x0 − δ, x0 + δ) → R è derivabile in questo intervallo e se f 0 (x0 ) = 0, la condizione f 0 (x) > 0 per x ∈ (x0 − δ, x0 ) ∪ (x0 , x0 + δ), (8.13.18) implica che x0 sia un punto di flesso ascendente. Infatti, in questo caso la tangente è la retta y = f (x0 ) e la funzione è monotona strettamente crescente. Quindi (8.13.18) implica f (x) ≤ f (x0 ) per x ∈ (x0 − δ, x0 ], f (x) ≥ f (x0 ) per x ∈ [x0 , x0 + δ), ovvero (8.13.14) e (8.13.15). Se invece f 0 (x0 ) = 0 e la derivata è negativa negli altri punti di (x0 − δ, x0 + δ), lo stesso ragionamento mostra che x0 è un punto 248 8. Calcolo differenziale di flesso discendente. Questi punti di flesso vengono chiamati punti di flesso a tangente orizzontale. Ad esempio, le funzioni f (x) = x2n+1 , con n ∈ N, hanno in x0 = 0 un punto di flesso ascendente a tangente orizzontale. Flessi ascendenti Flessi discendenti Sottolineiamo che il termine ‘ascendente’ non si riferisce alla monotonia della funzione, ma al passaggio dalla concavità alla convessità. Analoga osservazione vale per il termine ’discendente’. Flesso a tangente orizontale e flesso a tangente verticale 8.14. Asintoti obliqui 8.14 249 Asintoti obliqui Definizione 8.14.1 Sia f : (a, +∞) → R (oppure f : (−∞, a) → R). Si dice che la retta y = mx + q è un asintoto obliquo al grafico di f per x → +∞ (o per x → −∞) se lim [f (x) − mx − q] = 0, x→+∞ (rispettivamente, lim [f (x) − mx − q] = 0) x→−∞ (8.14.2) Si noti che se m = 0 la retta si riduce ad un asintoto orizzontale. f (x) = x arctan x3 Esempi 8.14.3 1 1. Sia f (x) = x + , definita per x 6= 0. Oltre ad ammettere la retta x = 0 x come asintoto verticale, il grafico di questa funzione ammette la retta y = x come asintoto obliquo, sia per x → +∞ che per x → −∞. 2. Sia f (x) = x arctan x3 . Il grafico di questa funzione ammette la retta π π y = x come asintoto obliquo per x → +∞ e la retta y = − x come 2 2 asintoto obliquo per x → −∞. Infatti, ricordando l’identità (8.8.5), si ha per x → +∞ x arctan x3 − π 1 x x = −x arctan 3 ∼ − 3 → 0. 2 x x Analogamente, ricordando (8.8.6), si ha per x → −∞ x arctan x3 + 1 x π x = −x arctan 3 ∼ − 3 → 0. 2 x x Teorema 8.14.4 Sia f : (a, +∞) → R. Condizione necessaria e sufficiente affinché la retta y = mx + q sia asintoto obliquo al grafico di f per x → +∞ è che: 250 8. Calcolo differenziale i) esista finito limx→+∞ f (x) = m; x ii) esista finito limx→+∞ [f (x) − mx] = q. Se f : (−∞, a) → R, le analoghe condizioni sono necessarie e sufficienti affinché y = mx + q sia asintoto obliquo al grafico di f per x → −∞. Dimostrazione. Le condizioni sono necessarie. Sia y = mx+q asintoto obliquo per x → +∞. Si ha, per x → +∞, f (x) − mx − q → 0 (8.14.5) da cui f (x) q − m − → 0. x x Poiché q/x tende a 0, deve necessariamente verificarsi la i). Ovviamente (8.14.5) implica ii). Le condizioni sono sufficienti. Supponiamo che valga i) e che la differenza f (x) − mx tenda a q. Allora, ovviamente, f (x) − mx − q → 0 per x → +∞. Sia f derivabile in (a, +∞) e tenda a ±∞ per x → +∞. Supponiamo che esista limx→+∞ f 0 (x) = γ. Allora, per il Teorema di De l’Hospital, anche f (x)/x tende a γ. Abbiamo quindi il seguente Corollario. Corollario 8.14.6 Sia f : (a, +∞) → R derivabile in tale intervallo. Sia f (x) → ±∞ per x → +∞. Condizione sufficiente affinché la retta y = mx + q sia asintoto obliquo al grafico di f per x → +∞ è che: i) esista finito limx→+∞ f 0 (x) = m; ii) esista finito limx→+∞ [f (x) − mx] = q. Se limx→+∞ f 0 (x) = ±∞, allora non esiste asintoto obliquo per x → +∞. La medesima proposizione vale per gli asintoti obliqui per x → −∞. Esempi 8.14.7 1. Sia f (x) = 2x + tanh x + e−x . Applichiamo il Corollario per x → +∞. Si ha 1 f 0 (x) = 2 + − e−x → 2. cosh2 x Inoltre, sempre per x → +∞ f (x) − 2x = tanh x + e−x → 1. Quindi la retta y = 2x + 1 è asintoto obliquo per x → +∞. Non esistono invece asintoti obliqui per x → −∞, poiché f 0 (x) → −∞ per x → −∞. 8.15. Appendice 2. Sia f (x) = x + 251 sin x2 . Il limite della derivata non esiste, poiché x f 0 (x) = 1 + 2 cos x2 − sin x2 x2 non ammette limite per x → +∞ né per x → −∞. Tuttavia possiamo vedere direttamente che f (x) − x = sin x2 →0 x per x → ±∞. Quindi y = x è asintoto obliquo sia per x → +∞ che per x → −∞. Possiamo dedurre questo risultato anche dal Teorema 8.14.4. Si ha, sia per x → +∞ che per x → −∞, sin x2 f (x) =1+ →1=m x x2 sin x2 f (x) − x = →0=q x f (x) = x + 8.15 8.15.1 sin x2 x Appendice Dimostrazione del Teorema di De l’Hospital Dimostriamo la tesi nel caso che il limite sia per x → a+. La dimostrazione per x → b− è del tutto simile. Sia dapprima −∞ ≤ γ < +∞. Si fissi un numero reale v1 > γ, e sia u tale che γ < u < v1 . Esiste c ∈ (a, b) tale che per ogni x ∈ (a, c) si abbia f 0 (x) < u. g 0 (x) 252 8. Calcolo differenziale Si fissi x ∈ (a, c). Poiché g(y) → 0 oppure g(y) → ±∞ per y → a+, esiste c1 , con a < c1 < x, tale che per ogni a < y < c1 si ha g(x) 6= g(y). Possiamo applicare il Teorema di Cauchy all’intervallo [y, x]. Esiste z ∈ (y, x) tale che f (x) − f (y) f 0 (z) = 0 < u. (8.15.1) g(x) − g(y) g (z) Questa diseguaglianza vale per ogni x ∈ (a, c) e ogni y ∈ (a, c1 ) , ove c1 < x. Distinguiamo ora i due casi. 0 a) Supponiamo che si abbia la forma di indecisione e passiamo al limite 0 per y → a+ in (8.15.1). Si ottiene la diseguaglianza f (x) ≤ u < v1 , g(x) (8.15.2) valida per ogni x ∈ (a, c). ∞ b) Supponiamo ora che si abbia la forma di indecisione . Sia, per ogni x ∞ fissato in (a, c), · ¸· ¸−1 f (x) g(x) ψ(y) = −1 −1 f (y) g(y) Evidentemente ψ(y) → 1 per y → a. Da (8.15.1) si ottiene f (y) ψ(y) < u, g(y) ossia lim sup y→a+ f (y) ≤u g(y) Esiste quindi c2 < c1 tale che per ogni y ∈ (a, c2 ) si ha f (y) < v1 . g(y) (8.15.3) Tenendo conto di (8.15.2) e (8.15.3), vediamo che, in ambedue i casi, fissato un numero qualsiasi v1 > γ esiste c2 > a tale che ∀x ∈ (a, c2 ) f (x) < v1 . g(x) (8.15.4) Se −∞ < γ ≤ +∞ si dimostra allo stesso modo che, fissato un qualsiasi numero reale v2 < γ, esiste c3 > a tale che ∀x ∈ (a, c3 ) Per l’arbitrarietà di v1 e v2 si ha: se γ = −∞ (8.15.4) implica limx→a+ f (x) > v2 . g(x) f (x) = −∞; g(x) (8.15.5) 8.15. Appendice 253 se γ = +∞ (8.15.5) implica limx→a+ f (x) = +∞; g(x) se −∞ < γ < +∞, (8.15.4) e (8.15.5) assieme implicano limx→a+ 8.15.2 f (x) = γ. g(x) Convessità Le funzioni convesse (e quelle concave) in un intervallo possiedono notevoli proprietà di regolarità. Teorema 8.15.6 Se f è convessa in un intervallo (a, b) (senza ulteriori ipotesi sulla funzione) allora f possiede derivata destra e sinistra in ogni punto di (a, b). Dimostrazione. Infatti, riscriviamo la (8.13.2) come f (x) − f (x1 ) f (x2 ) − f (x1 ) ≤ , x − x1 x2 − x1 (8.15.7) valida per ogni x1 < x < x2 . Questa diseguaglianza implica che il rapporto incrementale destro con punto iniziale x1 è monotono non decrescente. Inoltre, è anche limitato inferiormente poiché, se x0 < x1 < x, la (8.15.7) diviene f (x0 ) − f (x1 ) f (x) − f (x1 ) ≤ . x0 − x1 x − x1 Quindi esiste finito per ogni x1 lim x→x1+ f (x) − f (x1 ) 0 (x1 ) = f+ x − x1 In modo analogo si vede che esiste la derivata sinistra in ogni punto di (a, b). Infatti, sempre per x1 < x < x2 , la condizione (8.13.2) di convessità si può scrivere equivalentemente come f (x) ≤ f (x2 ) + f (x1 ) − f (x2 ) (x − x2 ), x1 − x2 da cui f (x) − f (x2 ) f (x1 ) − f (x2 ) ≥ . x − x2 x1 − x2 Da qui si vede che il rapporto incrementale sinistro con punto iniziale x2 è non decrescente e che (ragionando in modo a analogo al caso precedente) è limitato superiormente. Ne segue che esiste finito per ogni x2 lim x→x2− f (x) − f (x2 ) = f− (x2 ). x − x2 Corollario 8.15.8 Se f è convessa in un intervallo (a, b) allora è continua in (a, b). 254 8. Calcolo differenziale Dimostrazione. Infatti f è continua da destra e da sinistra in ogni punto di (a, b). Teorema 8.15.9 Sia f è convessa in un intervallo (a, b). Allora f è derivabile in (a, b) eccetto un insieme al più numerabile di punti angolosi. Dimostrazione. Passiamo al limite in (8.15.7) per x → x1 + e ricordiamo che il rapporto incrementale sinistro è monotono non decrescente, per cui f (x2 ) − f (x1 ) ≤ f− (x2 ). x2 − x1 Otteniamo, per ogni x1 < x2 , 0 0 f+ (x1 ) ≤ f− (x2 ). (8.15.10) In (8.15.7) facciamo ora tendere x1 a x− e, successivamente, x2 a x+. Si ottiene per ogni x 0 0 f− (x) ≤ f+ (x). (8.15.11) Combinando (8.15.10) e (8.15.11) si ha, per ogni x1 < x2 , 0 0 0 0 f− (x1 ) ≤ f+ (x1 ) ≤ f− (x2 ) ≤ f+ (x2 ). (8.15.12) 0 Poniamo, per ogni x ∈ (a, b), F (x) = f+ (x) − f 0 (x). Evidentemente f è derivabile in x e solo se F (x) = 0. Se, per assurdo, l’insieme dei punti in cui F (x) > 0 non è numerabile, esiste [c, d] ⊂ (a, b) tale che E = {x ∈ [c, d] : F (x) > 0} non è numerabile. Per ogni n > 0 intero poniamo En = {x ∈ [c, d] : F (x) > 1/n} . Poiché ∪+∞ n=1 En = E, esiste n tale che En è infinito. Siano c < x1 < x2 < · · · < xk < d k punti di En . Per j = 1 . . . k si ha 0 F (xj ) = f+ (xj ) − f 0 (xj ) > 1/n. . Per (8.15.12) si ha 0 0 0 0 0 0 0 f+ (a) ≤ f− (x1 ) ≤ f+ (x1 ) ≤ f− (x2 ) ≤ f+ (x2 ) ≤ · · · ≤ f+ (xk ) ≤ f− (d). Quindi 0 0 f− (c) − f+ (c) ≥ k X ¡ j=1 ¢ k 0 0 f+ (xj ) − f− (xj ) > . n Facendo tendere k a +∞ si arriva all’assurdo. 8.15. Appendice 8.15.3 255 Estremanti e punti di flesso La formula di Taylor con resto di Peano implica una condizione sufficiente, basata sulle derivate successive, affinché un punto x0 sia un estremante o un punto di flesso, Teorema 8.15.13 Sia f : (a, b) → R derivabile n ≥ 2 volte in x0 . Sia f 0 (x0 ) = f 00 (x0 ) = · · · = f (n−1) (x0 ) = 0. Sia f (n) (x0 ) 6= 0. a) Se n è pari, x0 è un estremante. Precisamente, x0 è punto di minimo se f (n) (x0 ) > 0, di massimo se f (n) (x0 ) < 0. b) Se n è dispari, x0 è un punto di flesso a tangente orizzontale, ascendente se f (n) (x0 ) > 0, discendente se f (n) (x0 ) < 0. Dimostrazione. Si ha per ogni x ∈ (a, b) f (n) (x0 ) + o ((x − x0 )n ) n! µ (n) ¶ f (x0 ) o ((x − x0 )n ) n = (x − x0 ) + . n! (x − x0 )n f (x) − f (x0 ) = (x − x0 )n Esiste δ > 0 tale che per |x − x0 | < δ, x 6= x0 , il segno di f (n) (x0 ) o (((x − x0 )n ) + n! (x − x0 )n coincide con il segno di f (n) (x0 ). Per n pari si ha, per tali x, f (x) − f (x0 ) ≷ 0 (n) a seconda che f (x0 ) ≷ 0. Se invece n è dispari, f (x) − f (x0 ) cambia di segno al passaggio di x da sinistra a destra di x0 . Teorema 8.15.14 Sia f : (a, b) → R derivabile n ≥ 3 volte in x0 . Sia f 00 (x0 ) = f 000 (x0 ) = · · · = f (n−1) (x0 ) = 0. Sia f (n) (x0 ) 6= 0. Allora a) Se n è dispari, x0 è un punto di flesso. Precisamente x0 è un punto di flesso ascendente se f (n) (x0 ) > 0, discendente se f (n) (x0 ) < 0. b) Se n è pari, x0 non è un punto di un flesso. Dimostrazione. Si ragiona come nel Teorema precedente. Si ha per ogni x ∈ (a, b) f (n) (x0 ) + o ((x − x0 )n ) . n! Come prima esiste δ > 0 tale che per |x − x0 | < δ, x 6= x0 , il segno del termine di sinistra è il segno di f (n) (x0 ) se n è pari, mentre cambia passando da sinistra a destra di x0 se n è dispari. f (x) − f (x0 ) − f 0 (x0 )(x − x0 ) = (x − x0 )n 256 8.15.4 8. Calcolo differenziale Serie di Taylor Se una funzione f : (a, b) → R è derivabile infinite volte in x0 , si può scrivere la sua formula di Taylor arrestata a qualunque n. Il polinomio di Taylor n−esimo pn (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + f 00 (x0 ) f (n) (x0 ) (x − x0 )2 + · · · + (x − x0 )n 2! n! è la somma parziale n−esima della serie +∞ (k) X f (x0 ) k! k=0 (x − x0 )k . Tale serie si chiama serie di Taylor di f con centro in x0 . È naturale chiedersi se tale serie converga e se converga a f (x), almeno per x abbastanza prossimo a x0 . Lo studio delle serie di Taylor, e delle serie di potenze in generale, esula dallo scopo di queso testo. Tuttavia, possiamo ottenere alcuni risultati in maniera elementare per le serie di McLaurin (con centro in x0 = 0) di alcune funzioni studiate nel paragrafo 8.12. Iniziamo con la funzione esponenziale ex . Il suo polinomio di McLaurin n−esimo è n X xn pn (x) = . n! k=0 Scrivendo la formula di McLaurin con resto di Lagrange, si ha che per ogni x e ogni n esiste θn ∈ (0, 1) tale che ex − n X xk k=0 k! = eθn x xn+1 . (n + 1)! Poiché, per ogni x fissato, eθn x xn+1 → 0 (n + 1)! per n → +∞, possiamo asserire che per ogni x vale l’eguaglianza ex = +∞ k X x k=0 k! . Esaminiamo ora la funzione sin x. Il suo polinomio di McLaurin di grado 2n + 1 è n X x2k+1 . p2n+1 (x) = (−1)k (2k + 1)! k=0 Per ogni x e ogni n esiste θn ∈ (0, 1) tale che sin x − p2n+1 (x) = ± sin(θn x) 2n+2 x . (2n + 2)! 8.15. Appendice 257 Il segno + o − dipende dalla parità di n. Anche in questo caso ± sin(θn x) 2n+2 x →0 (2n + 2)! per n → +∞. Quindi per ogni x sin x = +∞ X x2k+1 . (2k + 1)! (−1)k k=0 In maniera analoga si vede che per ogni x cos x = +∞ X (−1)k k=0 x2k . (2k)! Le stesse osservazioni si applicano alle funzioni sinh x e cosh x. Si ha per ogni x sinh x = +∞ X x2k+1 , (2k + 1)! cosh x = k=0 +∞ X x2k . (2k)! k=0 Si può dimostrare che per ogni −1 < x ≤ 1 log(1 + x) = n X (−1)k−1 k=1 xk . k (8.15.15) Questa formula invece non vale per x > 1, dato che per tali x la serie di McLaurin non converge. Notiamo la formula, ottenuta da (8.15.15) con x = 1, log 2 = − +∞ X (−1)k k=1 k . Capitolo 9 Primitive 9.1 Introduzione Definizione 9.1.1 Sia I ⊆ R un intervallo e sia f : I → R. Si dice che una funzione ϕ : I → R è una primitiva di f in I se ϕ è derivabile in I e ϕ0 (x) = f (x) per ogni x ∈ I. Esempi 9.1.2 1. Sia f (x) = cos x. La funzione ϕ(x) = sin x + C è una primitiva di f in R, qualunque sia il valore della costante C. x2 + C, per ogni valore della 2 costante C, è una primitiva di f in [0, 1). Tuttavia tale funzione non è una primitiva di mant x nell’intervallo chiuso [0, 1], né su qualunque intervallo contenente propriamente [0, 1). 2. Sia f (x) = mant x. La funzione ϕ(x) = Il secondo esempio mostra che una funzione può essere primitiva della restrizione di f a un intervallo I, ma non della restrizione di f a un intervallo contenente propriamente I. In generale, non è detto che una funzione ammetta primitiva in un intervallo. Infatti, se f ammette primitiva in I, allora f è una funzione derivata e quindi deve possedere le proprietà delle funzioni derivate. In particolare, le discontinuità di f in I possono essere solo di seconda specie, per il Corollario 8.7.14. Ad esempio, nessuna funzione ϕ può essere la primitiva di mant x in un intervallo che contenga un punto ad ascissa intera. Infatti, la discontinuità della mantissa in tali punti è di prima specie. Evidentemente, se ϕ è una primitiva di f in I, anche ϕ + C, ove C è una costante arbitraria, è una primitiva di f in I. Nel prossimo capitolo vedremo che ogni funzione continua in I ammette ivi primitiva. Per il momento ci limitiamo a notare che le formule per le derivate ottenute nel paragrafo 8.5 permettono di dedurre le primitive di alcune funzioni elementari. Ad esempio, xn ammette 259 260 9. Primitive xn+1 1 + C, ammette come primitiva log |x| + C, etc. D’altra n+1 x parte, si può dimostrare che esistono funzioni elementari dell’analisi, come come primitiva ex , x sin x , x log(1 + x) x la cui primitiva non è una funzione elementare dell’analisi. I prossimi paragrafi saranno dedicati allo studio di alcune classi di funzioni la cui primitiva può essere espressa in termini elementari. 9.2 Regole di integrazione indefinita Teorema 9.2.1 Sia I ⊆ R un intervallo e sia f : I → R. Supponiamo che f ammetta una primitiva ϕ in I. Allora, tutte e sole le primitive di f in I sono le funzioni ϕ(x) + C, ove C è una costante arbitraria. Dimostrazione. Se Dϕ(x) = f (x) per ogni x ∈ I, evidentemente D (ϕ(x) + C) = Dϕ(x) = f (x), qualunque sia la costante C. Viceversa, supponiamo che ϕ1 sia un’altra primitiva di f in I. Allora, per ogni x ∈ I D(ϕ1 − ϕ)(x) = f (x) − f (x) = 0. Per il Corollario 8.8.3 (caratterizzazione delle funzioni costanti) esiste una costante C tale che ϕ1 (x) − ϕ2 (x) = C per ogni x ∈ I. La generica primitiva di f in I, ammesso che esista, viene usualmente indicata con il simbolo Z f (x)dx. (9.2.2) Il simbolo in (9.2.2) si chiama integrale indefinito di f (x). A sua volta, la funzione f (x) viene chiamata funzione integranda. Per definizione si ha, per ogni x ∈ I, Z D f (x)dx = f (x) Z ϕ0 (x)dx = ϕ(x) + C. (9.2.3) Ad esempio, Z xn+1 x dx = + C, n+1 n Z 1 dx = log |x| + C, x Z 1 dx = arctan x + C. 1 + x2 9.2. Regole di integrazione indefinita 261 Se f1 e f2 ammettano primitiva in I e se c1 e c2 sono costanti reali, anche c1 f1 + c2 f2 ammette primitiva in I e si ha Z Z Z (c1 f1 (x) + c2 f2 (x)) dx = c1 f1 (x)dx + c2 f2 (x)dx + C. (9.2.4) La (9.2.4) si verifica immediatamente per derivazione. Ammettiamo per il momento il risultato menzionato precedentemente, cioè che ogni funzione continua in un intervallo ha primitiva in questo intervallo. Abbiamo allora le formule di integrazione per parti e per sostituzione. Teorema 9.2.5 (di integrazione per parti) Sia I ⊆ R un intervallo e siano f : I → R e g : I → R derivabili in I con derivata continua. Allora per ogni x ∈ I vale la formula Z Z 0 f (x)g (x)dx = f (x)g(x) − f 0 (x)g(x)dx + C. (9.2.6) Dimostrazione. Poiché (f g)0 (x) = f 0 (x)g(x) + f (x)g 0 (x), si ha, passando alle primitive, Z Z Z 0 0 (f g) (x)dx = f (x)g(x)dx + f (x)g 0 (x)dx + C. Dato che Z (f g)0 (x)dx = f (x)g(x) + C, segue la tesi. Il termine g 0 (x) in (9.2.6) si chiama fattore differenziale, mentre f (x) si chiama fattore finito. Esempi 9.2.7 R 1. Si voglia calcolare arctan xdx in I = R. Poniamo f (x) = arctan x e g 0 (x) = 1, ossia g(x) = x. Si ha Z Z x arctan xdx = x arctan x − dx + C. 1 + x2 Si riconosce immediatamente che una primitiva di x è la funzione 1 + x2 1 log(1 + x2 ). Quindi 2 Z 1 arctan xdx = x arctan x − log(1 + x2 ) + C. 2 262 9. Primitive 2. Dimostriamo, integrando per parti, che Z 1 cos2 xdx = (sin x cos x + x) + C. 2 (9.2.8) Poniamo f (x) = cos x e g 0 (x) = cos x, di modo che g(x) = sin x. Dalla (9.2.6) si ha Z Z cos2 xdx = sin x cos x + sin2 xdx + C = Z Z 2 = sin x cos x + (1 − cos x)dx + C = sin x cos x + x − cos2 xdx + C, da cui (9.2.8). In modo del tutto analogo si dimostra che Z 1 sin2 xdx = − (sin x cos x − x) + C. 2 3. Il Teorema di integrazione per parti permette di calcolare ricorsivamente alcuni integrali dipendenti da un parametro intero n ≥ 0, una volta che sia noto il primo o i primi integrali. Ad esempio, si voglia calcolare per ogni intero n ≥ 0 Z In = xn ex dx. Assumendo ex come fattore differenziale si ha Z n x In = x e − n xn−1 ex dx + C = xn ex − nIn−1 + C. (9.2.9) Questa formula permette di calcolare In a partire da I0 = ex + C. Ad esempio ¡ ¢ I3 = x3 ex − 3I2 = x3 ex − 3 x2 ex − 2I1 + C = x3 ex − 3x2 ex + 6xex − 6I0 + C = x3 ex − 3x2 ex + 6xex − 6ex + C. Formule del tipo (9.2.9), che esprimono In in funzione dell’integrale (o degli integrali) precedenti si chiamano formule di ricorrenza. 4. Un esempio notevole di integrale che si calcola per ricorrenza è il seguente. Sia, per ogni n ≥ 1 Z 1 In = n dx. (1 + x2 ) Z 1 Ovviamente I1 = dx = arctan x + C. Consideriamo l’identità 1 + x2 1 1 x2 . − n = n−1 2 (1 + x2 )n (1 + x ) (1 + x2 ) 9.2. Regole di integrazione indefinita 263 Integrando ambo i lati si ottiene Z In = In−1 − x2 dx. (1 + x2 )n (9.2.10) Il secondo integrale a destra in (9.2.10) si calcola per parti, assumendo come fattore differenziale x(1 + x2 )−n . Si ha Z Z 1 x2 x dx + dx = − n−1 n−1 + C (1 + x2 )n 2(n − 1) 2(n − 1) (1 + x2 ) (1 + x2 ) x 1 =− n−1 + 2(n − 1) In−1 + C. 2(n − 1) (1 + x2 ) Otteniamo cosı̀ la formula di ricorrenza In = − x 2(n − 1) (1 + n−1 x2 ) + 2n − 3 In−1 + C. 2n − 2 che riconduce il calcolo di In a quello di I1 . Teorema 9.2.11 (di integrazione per sostituzione) Siano I e J intervalli in R. Sia f : I → R continua in I e sia x = x(t) : J → I una funzione derivabile con derivata continua in J. Posto Z ϕ(x) = f (x)dx , Z ψ(t) = f (x(t)) x0 (t)dt , si ha per ogni t ∈ J ϕ(x(t)) = ψ(t) + C. (9.2.12) Se x(t) è anche biunivoca, detta t = t(x) : I → J la funzione inversa, si ha ϕ(x) = ψ(t(x)) (9.2.13) Dimostrazione. Deriviamo la funzione composta ϕ(x(t)). Si ha d [ϕ(x(t))] = ϕ0 (x(t))x0 (t) = f (x(t)) x0 (t). dt e quindi ϕ(x(t)) è una primitiva di f (x(t)) x0 (t) in J, da cui (9.2.12). Se x(t) è anche biunivoca, si ha x(t(x)) = x e quindi (9.2.13) segue da (9.2.12). La formula (9.2.12) significa che, se vogliamo calcolare la primitiva di una funzione della forma f (x(t)) x0 (t), basta calcolare la primitiva della funzione f (x), salvo poi tornare alla variabile t ponendo x = x(t) nella primitiva trovata. Analogamente, la formula (9.2.13) significa che, se vogliamo calcolare la primitiva di f (x), possiamo calcolare la primitiva di f (x(t)) x0 (t), salvo poi tornare alla variabile x ponendo t = t(x) nella primitiva trovata. In questo secondo caso la sostituzione x = x(t) deve essere biunivoca. 264 9. Primitive Lo studente apprezzerà il simbolismo dell’integrale indefinito: l’eguaglianza dx = x0 (t)dt esplicita il differenziale dx rispetto alla variabile t, fornendo l’espressione della nuova funzione integranda. Esempi 9.2.14 1. Calcoliamo per ogni t reale Z (sin t)4 cos tdt. ψ(t) = In questo caso poniamo x = sin t, che non è ovviamente biunivoca. Si ha dx = x0 (t)dt = cos tdt. Quindi Z x5 ϕ(x) = x4 dx = + C. 5 Applicando (9.2.12) si ottiene Z sin5 t (sin t)4 cos tdt = + C. 5 2. Calcoliamo per ogni t ∈ (−1, 1) Z √ ψ(t) = t2 dt. 1 − t6 Poniamo x = t3 , da cui dx = 3t2 dt. Si ha Z 1 1 1 √ ϕ(x) = dx = arcsin x + C. 3 3 1 − x2 Da (9.2.12) si ottiene ψ(t) = 1 arcsin t3 + C. 3 3. Calcoliamo per ogni x reale Z ϕ(x) = ex dx 1 + ex per ogni x reale. Poniamo ex = t, ossia x = log t, che è biunivoca da R+ dt a R. In questo caso dx = x0 (t)dt = , da cui t Z 1 ψ(t) = dt = log |1 + t| + C. 1+t Per (9.2.13) si ha Z ϕ(x) = ex dx = log(1 + ex ) + C. 1 + ex 9.3. Primitive delle funzioni razionali fratte 265 4. Calcoliamo per ogni x > 0 Z √ sin xdx ϕ(x) = Poniamo x = t2 , da cui dx = 2tdt. Il calcolo dell’integrale si riduce al calcolo di Z 2 t sin tdt. Integrando per parti si ha Z Z t sin tdt = −t cos t + cos tdt + C = −t cos t + sin t + C. Quindi Z sin 9.3 √ √ √ √ xdx = −2 x cos x + 2 sin x + C. Primitive delle funzioni razionali fratte Una funzione razionale fratta è una funzione del tipo R(x) = P (x) , Q(x) ove P e Q sono polinomi. R(x) è definita in tutti i punti che non annullano il denominatore. Nel seguito denotiamo con con grA(x) il grado di un polinomio A(x). In questo paragrafo mostreremo come calcolare la primitiva di una qualunque funzione razionale fratta nel suo campo di esistenza. In particolare vedremo che la primitiva di una funzione razionale fratta lineare di funzioni ¯ è combinazione ¯ razionali fratte, di funzioni del tipo log ¯ax2 + bx + c¯ e di funzioni del tipo arctan(ax2 + bx + c). Se grQ(x) = 0, ossia R(x) = P (x) = n X ck xk , k=0 la primitiva è a sua volta un polinomio che si calcola immediatamente: Z X n ck xk dx = k=0 = n X k=0 n X k=0 Z ck xk dx + C ck k+1 x + C. k+1 266 9. Primitive Se grP (x) ≥ grQ(x), esiste un polinomio P ∗ (x), con grP ∗ (x) < grQ(x), tale che P − P ∗ è divisibile per Q. Quindi esiste un polinomio A(x) tale che P (x) P ∗ (x) = A(x) + . Q(x) Q(x) Ne segue Z P (x) dx = Q(x) Z Z A(x) + P ∗ (x) dx + C. Q(x) Di conseguenza, d’ora in avanti supporremo sempre che il grado di P sia minore di quello di Q. Supporremo anche che P e Q non abbiano fattori comuni. 9.3.1 Caso in cui il grado del denominatore è 1 o 2 Se il grado di Q è 1, allora f (x) è della forma R(x) = a x−b per opportune costanti a e b. Quindi Z Z a R(x)dx = = a log |x − b| + C. x−b Supponiamo ora che il grado di Q sia 2. Allora f (x) è della forma R(x) = ax + b a 2x + p 1 pa − 2b = − . x2 + px + q 2 x2 + px + q 2 x2 + px + q ove a, b, p e q sono opportune costanti. Quindi Z Z Z a 2x + p pa − 2b dx R(x)dx = dx − +C 2 2 2 x + px + q 2 x + px + q Z pa − 2b dx a + C. = log(x2 + px + q) − 2 2 x2 + px + q Siamo quindi ricondotti al calcolo di Z x2 dx . + px + q (9.3.1) Esaminamo il discriminante del denominatore. Se p2 − 4q > 0, il trinomio x2 + px + q ha due radici distinte reali c1 e c2 . Possiamo scrivere la frazione in nella forma µ ¶ 1 1 1 1 = − . (x − c1 )(x − c2 ) c1 − c2 x − c1 x − c2 Ne segue Z 1 1 dx = log |x − c1 | − log |x − c2 | + C. (x − c1 )(x − c2 ) c1 − c2 c1 − c2 9.3. Primitive delle funzioni razionali fratte 267 Se p2 − 4q = 0, allora x2 + px + q = (x + p/2)2 . In questo caso Z dx 1 + C. =− (x + p/2)2 x + p/2 Se p2 − 4q < 0, si ha ¡ ¢ x2 + px + q = q − p2 /4 à ! 2 (x + p/2) +1 . q − p2 /4 p Poniamo, per semplicità di scrittura, k = q − p2 /4. L’integrale (9.3.1) diviene Z 1 dx , µ ¶2 k2 x + p/2 +1 k che si calcola con la sostituzione (x + p/2) /k = t. Dato che dx = kdt, siamo ricondotti all’integrale Z 1 dt 1 = arctan t + C. 2 k t +1 k In definitiva Z dx 1 =p arctan x2 + px + q q − p2 /4 à x + p/2 p q − p2 /4 ! + C. (9.3.2) Esempi 9.3.3 P (x) x3 + x = 2 . In questo esempio il grado del numeratore è maggiore Q(x) x −1 di quello del denominatore. Si ha x3 + x = (x2 − 1)x + 2x, da cui 1. Sia x3 + x 2x =x+ 2 , 2 x −1 x −1 Z Z Z 3 ¯ ¯ 2x x2 x +x dx = xdx + dx + C = + log ¯x2 − 1¯ + C x2 − 1 x2 − 1 2 2x Si noti che, anziché integrare 2 direttamente, lo si può prima scomx −1 porre come 1 1 2x = + , x2 − 1 x+1 x−1 e poi effettuare l’integrazione. 2. Sia 1 1 P (x) = 2 = . Si ha Q(x) x −x−6 (x − 3)(x + 2) Z dx 1 1 = log |x − 3| − log |x + 2| + C. x2 − x − 6 5 5 268 9. Primitive 3. Sia P (x) 1 = 2 . In questo caso Q(x) (x − 1) Z dx 1 2 = − x − 1 + C. (x − 1) 4. Sia f (x) = (9.3.2) 9.3.2 1 . Il discriminante del denominatore è −3. Si ha da x2 + x + 1 µ ¶ Z dx 2 2x + 1 √ √ = arctan + C. x2 + x + 1 3 3 Casi fondamentali Come vedremo nel possimo sottoparagrafo, i casi fondamentali a cui si riconduce l’integrazione delle funzioni razionali fratte sono, con una eventuale sostituzione lineare, i tre seguenti: Z dx (9.3.4) (x − a)n Z dx (9.3.5) n , (x2 + px + q) Z x 0 (9.3.6) n dx . (x2 + px + q) ove n è un intero positivo, a , p e q sono numeri reali e p2 − 4q < 0. L’integrale (9.3.4) è di calcolo immediato. Si ha Z dx = log |x − a| + C, x−a Z 1 dx + C se n ≥ 2. n =− (n − 1)(x − a)n−1 (x − a) Per il calcolo dell’integrale (9.3.5) si effettua la sostituzione x + p/2 p = t. q − p2 /4 Posto k = (9.3.7) p q − p2 /4, si ottiene l’integrale Z 1 dt . 2n−1 k (1 + t2 )n (9.3.8) Questo integrale è stato studiato nell’esempio 9.2.7.4, ove si è mostrato come effettuarne il calcolo per ricorrenza. L’integrale (9.3.6) si calcola pure mediante la sostituzione (9.3.7). Si ottiene l’integrale Z Z p 1 t dt dt − 2n−1 . (9.3.9) k 2n−2 (1 + t2 ) 2k (1 + t2 )n 9.3. Primitive delle funzioni razionali fratte 269 Il secondo integrale in (9.3.9) è del tipo (9.3.8), appena visto. Per il primo integrale si ha Z t 1 dt = log(1 + t2 ) + C, 2 1+t 2 Z t 1 se n ≥ 2. n dt = − n−1 + C (1 + t2 ) 2(n − 1) (1 + t2 ) 9.3.3 Caso generale Iniziamo con un risultato che si deduce dal Teorema fondamentale dell’Algebra, la cui dimostrazione esula dallo scopo di questo testo e sarà svolta nei corsi di Algebra. Teorema 9.3.10 Sia Q(x) un polinomio di grado n sul campo reale. Allora Q(x) si può scrivere come prodotto ¡ ¡ ¢m1 ¢mk Q(x) = a0 (x − a1 )n1 · · · (x − ah )nh x2 + p1 x + q1 · · · x2 + pk x + qk (9.3.11) ove: a) a0 a1 , . . . , ah , p1 , . . . , pk e q1 , . . . , qk sono numeri reali univocamente determinati. Gli aj , per j ≥ 1, sono a due a due distinti e i trinomi sono a due a due distinti. Inoltre, ciascun trinomio ha discriminante negativo; b) n1 , . . . , nh e m1 , . . . , mk sono numeri interi positivi univocamente determinati tali che n1 + · · · + nh + 2m1 + · · · + 2mk = n. Il numero nj si chiama molteplicità della radice aj . Il numero mj è la molteplicità del trinomio x2 + pj x + qj Vedremo che rapporto P (x)/Q(x) si può scrivere come combinazione lineare di funzioni razionali fratte dei tre tipi fondamentali studiati nel precedente sottoparagrafo. Iniziamo con degli esempi. Esempi 9.3.12 1. Si voglia calcolare Z dx . x2 (x2 − 1) In questo caso Q(x) ha le radici 1 e −1 con molteplicità 1 e la radice 0 con molteplicità 2. Si possono trovare quattro costanti a, b, c e d tali che 1 x2 (x2 − 1) = a b c d + + + . 2 x x x−1 x+1 (9.3.13) Infatti, riduciamo le frazioni a secondo membro a minimo comun denominatore ed eseguiamo la somma. La precedente eguaglianza equivale a 1 x2 (x2 − 1) = a(x2 − 1) + bx(x2 − 1) + cx2 (x + 1) + dx2 (x − 1) . x2 (x2 − 1) 270 9. Primitive Eguagliando i coefficienti dei termini di egual grado al numeratore, si arriva al sistema b + c + d = 0, a + c − d = 0, b = 0, − a = 1. Le soluzioni sono a = −1, b = 0, c = 1/2, d = −1/2. Tutti gli integrali da calcolare rientrano nel caso (9.3.4). Si ottiene ¯ ¯ Z ¯x − 1¯ dx 1 1 ¯ ¯ = + log ¯x + 1¯ + C x2 (x2 − 1) x 2 2. Si voglia calcolare Z x4 − 1 dx. + x + 1)2 x(x2 In questo caso Q(x) ha la radice 0 con molteplicità 1, mentre il trinomio irriducibile x2 + x + 1 ha molteplicità 2. Cerchiamo delle costanti a, b, c, r e s tali che x4 − 1 a bx + c rx + s = + 2 + 2 . 2 2 2 x(x + x + 1) x (x + x + 1) x +x+1 Come nell’esempio precedente, riduciamo le frazioni a secondo membro a minimo comun denominatore ed eseguiamo la somma. Eguagliando il numeratore della somma a x4 − 1 si ha x4 − 1 = (a + r)x4 + (2a + s + r)x3 + (3a + s + r + b)x2 + (2a + s + c)x + a. Eguagliando i coefficienti dei termini di egual grado si ottiene il sistema 1 = a + r, 0 = 2a + s + r, 0 = 3a + s + r + b, 0 = 2a + s + c, −1 = a, che ha l’unica soluzione a = −1, b = 1, c = 2, r = 2, s = 0. Quindi Z x4 − 1 dx = − 2 x(x + x + 1)2 Z dx + x Z x+2 dx + (x2 + x + 1)2 Z 2xdx + C. x2 + x + 1 Il primo integrale a secondo membro è del tipo (9.3.4). Il secondo e terzo integrale si riconducono ai casi (9.3.5) e (9.3.6). Infatti il denominatore è una potenza di x2 + x + 1, che ha discriminante p2 − 4q = −3 < 0. La sostituzione (9.3.7) assume la forma 2x + 1 √ = t. 3 9.4. Primitive di funzioni razionali fratte in un argomento 271 Come si intuisce dagli esempi, l’integrazione indefinita di una funzione razionale fratta si riduce al calcolo di integrali dei tipi (9.3.4), (9.3.5) e (9.3.6). Precisiamo tale affermazione nel seguente Teorema. La dimostrazione è svolta in Appendice. Teorema 9.3.14 (di decomposizione) Siano P (x) e Q(x) due polinomi tali P (x) che grP (x) < grQ(x). Sia Q(x) della forma (9.3.11). Allora il rapporto Q(x) si esprime in maniera unica come combinazione lineare dei seguenti addendi: 1 1 1 1 , ,..., , ove j = 1, . . . , h, , n n −1 n −2 j j j (x − aj ) (x − aj ) (x − aj ) x − aj 1 1 1 mj , mj −1 , m −2 , . . . 2 2 2 (x + pj x + qj ) (x + pj x + qj ) (x + pj x + qj ) j 1 ......, 2 , ove j = 1, . . . , k, x + pj x + qj x x x , mj , m −1 m −2 , . . . 2 j (x + pj x + qj ) (x2 + pj x + qj ) (x2 + pj x + qj ) j 1 ......, 2 , ove j = 1, . . . , k. x + pj x + qj Nei paragrafi successivi studiamo le principali classi di integrali indefiniti che, con opportune sostituzioni, si possono ricondurre a integrali di funzioni razionali fratte. La trattazione che segue non vuole, né può, essere esaustiva, bensı̀ solo una indicazione di come si possa affrontare il problema della integrazione indefinita per mezzo di funzioni elementari. 9.4 Primitive di funzioni razionali fratte in un argomento Sia f (t) una funzione derivabile con derivata continua in un intervallo I. Sia, come nel paragrafo precedente, R(x) = P (x) Q(x) ove P e Q sono polinomi. Il calcolo della primitiva Z R (f (t)) f 0 (t)dt si ottiene integrando per sostituzione. Infatti, posto x = f (t), si ha dx = f 0 (t)dt. Il calcolo viene cosı̀ ricondotto a quello di Z R(x)dx. Illustriamo alcuni casi notevoli con degli esempi 272 9. Primitive Esempi 9.4.1 1. Si voglia calcolare Z 1 + sin t cos tdt. 1 + sin2 t Posto x = sin x, da cui dx = cos tdt, si ottiene l’integrale Z Z Z dx x 1+x dx = + dx + C 1 + x2 1 + x2 1 + x2 1 = arctan x + log(1 + x2 ) + C. 2 Quindi Z 1 + sin t 1 cos t dt = arctan (sin t) + log(1 + sin2 t) + C. 2 sin2 t + 1 2. Si voglia calcolare Z Z ¡ ¢ tan3 t ¡ ¢ 1 + tan2 t dt. tan3 tdt = 2 1 + tan t ¡ ¢ Posto x = tan t, da cui dx = 1 + tan2 t dt, siamo ricondotti al calcolo di Z Z Z x3 x = xdx − + C. 1 + x2 1 + x2 Si ottiene Z tan3 tdt = ¡ ¢ 1 1 tan2 t − log 1 + tan2 t + C. 2 2 3. In maniera analoga si calcolano integrali del tipo Z Z Z R(cos t) sin tdt, R(sinh t) cosh tdt, R(cosh t) sinh tdt, Z Z R(et ) t R(et )dt = e dt, etc. et 9.5 Primitive di funzioni razionali fratte in più argomenti Una funzione razionale fratta in n variabili R(x1 , x2 , . . . , xn ) è il rapporto R(x1 , x2 , . . . , xn ) = P (x1 , x2 , . . . , xn ) , Q(x1 , x2 , . . . , xn ) ove P e Q sono polinomi in x1 , x2 , . . . , xn . Ad esempio R(x, y, z) = x+y+z . x2 + y 2 + z 2 In questo paragrafo indicheremo come si calcola la primitiva di una funzione razionale fratta i cui argomenti sono particolari tipi di funzioni. 9.5. Primitive di funzioni razionali fratte in più argomenti 9.5.1 273 Primitive di R(cos t, sin t) In questo caso si utilizzano le note identità che esprimono sin t e cos t in funzione di tan t/2: t t 2 tan 1 − tan2 2 , cos t = 2 . sin t = t t 1 + tan2 1 + tan2 2 2 Quindi t t t Z Z 2 tan 1 − tan2 1 + tan2 2 2 2 R(cos t, sin t)dt = R , dt . (9.5.1) t 1 + tan2 x t 1 + tan2 1 + tan2 2 2 2 Si opera la sostituzione x = tan t 2 (9.5.2) µ ¶ 1 t da cui dx = 1 + tan2 dt. In forza di (9.2.13) siamo ricondotti al calcolo 2 2 della primitiva di una funzione razionale fratta in x, cioè ¶ µ Z 1 − x2 2 2x , dx. R 1 + x2 1 + x2 1 + x2 9.5.2 Primitive di R(cos2 t, sin2 t, tan t) Questo caso differisce dal precedente, in quanto le funzioni seno e coseno appaiono solo a potenza pari, oppure sotto forma di tangente. Conviene utilizzare le identità tan2 t 1 sin2 t = cos2 t = . 2 , 1 + tan t 1 + tan2 t Posto x = tan t, (9.5.3) Z ¡ ¢ si ha dx = 1 + tan2 t dt. L’integrale R(cos2 t, sin2 t, tan t)dt diviene µ Z R ¶ x2 1 1 , ,x dx 1 + x2 1 + x2 1 + x2 che è l’integrale di una funzione razionale fratta in x. Esempi 9.5.4 1. Si voglia calcolare ottiene Z Z dt . cos t + sin t Operando la sostituzione (9.5.2) si ¯ ¯ √ ¯¯ √ ¯¯ 1 1 2 ¯ ¯ √ √ log − 1 + 2 − log − 1 − 2¯ + C. dx = ¯x ¯ ¯x −x2 + 2x + 1 2 2 274 9. Primitive Quindi Z ¯ ¯ tan2 1 1 ¯ dt = √ log ¯ ¯ tan2 cos t + sin t 2 t 2 t 2 √ ¯¯ 2¯ √ ¯ + C. − 1 − 2¯ −1+ In modo analogo si calcolano gli integrali della forma Z dt a cos t + b sin t + c Z 2. Si voglia calcolare cos2 t + tan t dt. Operando la sostituzione (9.5.3) si sin4 t ottiene l’integrale Z 1 1 (x−1 + x−3 + x−4 )dx = log |x| − x−2 − x−3 + C. 2 3 Quindi Z 9.5.3 cos2 t + tan t 1 1 dt = − log | cot t| − cot2 t − cot3 t + C. 4 2 3 sin t ¡ q√ ¢ q√ q√ Primitive di R x, 1 xp1 , 2 xp2 , . . . , n xpn Supponiamo che le frazioni pi /qi siano irriducibili e che qi > 0 per ogni i = 1, . . . , n. Sia q il minimo comune multiplo di q1 , q2 , . . . , qn . Poniamo ki = √ q q√ q/qi , di modo che i xpi = xpi ki . Si applica la formula (9.2.12) operando la sostituzione x = tq , (9.5.5) da cui dx = qtq−1 Z dt. ¡ q√ ¢ q√ q√ L’integrale R x, 1 xp1 , 2 xp2 , . . . , n xpn dx diviene Z q ¡ ¢ R tq , tp1 k1 , tp2 k2 , . . . , tpn kn tq−1 dt che è l’integrale di una funzione razionale fratta in t. 9.5.4 r³ µ r³ ´p1 r³ ´p 2 ´pn ¶ q1 q2 qn ax+b ax+b ax+b Primitive di R x, , ..., cx+d cx+d cx+d Supponiamo ad−bc 6= 0, altrimenti le frazioni sotto radice sono eguali a costanti. Come prima, supponiamo qi > 0 e che tutte le frazioni pi /qi , per i = 1 . . . n, siano irriducibili. Denotiamo con q il minimo comune multiplo dei qi . Poniamo ki = q/qi , di modo che s sµ µ ¶p ¶p k q ax + b i ax + b i i qi = , i = 1, . . . , n. cx + d cx + d 9.5. Primitive di funzioni razionali fratte in più argomenti 275 Si opera la sostituzione ax + b = tq , da cui cx + d t x= tq d − b . −tq c + a (9.5.6) q−1 2 dt. L’integrale (−tq c + a) sµ à sµ ¶ p sµ ¶p ¶p ! Z ax + b 1 q2 ax + b 2 ax + b n q1 qn R x, , ,..., dx cx + d cx + d cx + d Si ha dx = q (ad − bc) (9.5.7) si riconduce all’integrale di una funzione razionale fratta, cioè a µ Z q (ad − bc) R tq d − b p1 k1 p2 k2 ,t ,t , . . . , tp n k n −tq c + a ¶ t q−1 (−tq c dt 2. + a) Esempi 9.5.8 1. Si voglia calcolare Z √ 3 dx x2 − √ . x In questo caso si ha q1 = 3, q2 = 2, p1 = 2, p1 = 1. Il minimo comune denominatore è q = 6. Con la sostituzione x = t6 si ottiene l’integrale Z Z Z Z t5 t2 dt 6 dt = 6 dt = 6 (t + 1) dt + 6 +C 4 3 t −t t−1 t−1 = 3t2 + 6t + 6 log |t − 1| + C. Quindi Z √ 3 ¯√ ¯ √ √ 3 6 6 √ = 3 x + 6 x + 6 log ¯ x − 1¯ + C. − x dx x2 2. Si voglia calcolare Z 1 x−1 r x+1 dx. x−1 Si ha ad − bc = −2, p = 1, q = 2. La sostituzione è t2 + 1 x+1 = t2 , da cui x = 2 . x−1 t −1 Si ha dx = − 4t 2 dt. (t2 − 1) Z −2 Sostituendo si ottiene ¯ ¯ ¯t − 1¯ t2 ¯ ¯ + C. = −2t − log ¯ t2 − 1 t + 1¯ 276 9. Primitive Quindi Z 1 x−1 r r x+1 dx = −2 x−1 ¯q ¯ ¯ x+1 − 1 ¯ ¯ ¯ x−1 x+1 ¯ + C. − log ¯¯ q ¯ x−1 x+1 ¯ x−1 + 1¯ Osservazione. Per applicare la formula (9.2.12) dobbiamo verificare la biunivocità della sostituzione operata. Se q è dispari, tutti i qi sono dispari e la funzione (9.5.5) applica biunivocamente R su R. Se q è pari, almeno uno dei qi è pari. Sia, per fissare le idee, q1 pari.√ Poiché abbiamo suppoq sto pi¡/qi √ irriducibile, p1 è dispari. Ne segue che 1 xp1 , e quindi la funzio¢ √ q1 q√ q n ne R x, xp1 , 2 xp2 , . . . , xpn , è definita per x > 0. La funzione (9.5.5) in questo caso applica biunivocamente l’insieme dei reali positivi su sé stesso. Analoghe osservazioni valgono per l’integrale (9.5.7). 9.5.5 ³ p ´ Primitive di R x, ±x2 + px + q Supponiamo che il determinante del trinomio ±x2 + px + q non sia nullo, altrimenti si ha una funzione razionale fratta in x. Operiamo una sostituzione che riduca la radice p ±x2 + px + q (9.5.9) √ √ alla forma t2 ± 1 oppure 1 − t2 . 2 p a) Valga nella radice (9.5.9) il segno +. Se p /4 − q < 0, posto k = q − p2 /4, la consueta sostituzione x + p/2 =t k √ ¢ R¡ p trasforma la radice in k t2 + 1. L’integrale x, ±x2 + px + q dx diviene Z ³ ´ p k R kt − p/2, k t2 + 1 dt. (9.5.10) Se p2 /4 − q > 0, posto k = p p2 /4 − q, la sostituzione x + p/2 =t k √ trasforma la radice in k t2 − 1. L’integrale diviene Z ³ ´ p k R kt − p/2, k t2 − 1 dt (9.5.11) (9.5.12) b) Valga nella radice (9.5.9) p il segno −. In questo caso si ha necessariamente p2 /4 + q > 0. Posto k = p2 /4 + q, con la sostituzione x − p/2 =t k 9.5. Primitive di funzioni razionali fratte in più argomenti √ la radice si trasforma k 1 − t2 . L’integrale corrispondente è Z ³ ´ p k R kt + p/2, k 1 − t2 dt. 277 (9.5.13) Per il calcolo di questi integrali vi sono varie sostituzioni possibili, che riducono la funzione integranda a una funzione razionale fratta. In (9.5.10), tenendo conto che cosh2 t − sinh2 t = 1, la sostituzione t = sinh u, dt = cosh udu, riduce l’integranda a una fuzione razionale fratta nelle funzioni iperboliche, e quindi in eu . Analogamente, in (9.5.12) si può operare la sostituzione t = cosh u, dt = sinh udu. In (9.5.13) la sostituzione t = sin u, dt = cos udu, riduce l’integranda a una funzione razionale fratta nelle funzioni circolari. √ Senza passare per le funzioni iperboliche, nell’integrale (9.5.12) si può porre t2 − 1 = u − t, che, risolta rispetto a t, dà t= Quindi p Poiché dt = u 1 + . 2 2u t2 − 1 = (9.5.14) u 1 − . 2 2u 1 1 − 2 , siamo ricondotti al calcolo di una primitiva del tipo 2 2u ¶ µ Z 1 u 1 u2 − 1 u + , − du. R1 2 2u 2 2u 2u2 L’analoga sostituzione p t2 + 1 = u − t razionalizza l’integrale (9.5.10). In (9.5.13) si possono √ usare le funzioni circolari, come già notato, oppure operare la sostituzione 1 − t2 = u(1 − t). Risolvendo rispetto a t si ha t= da cui Si ha dt = tipo p u2 − 1 u2 + 1 1 − t2 = 2u . 1 + u2 4u du e quindi siamo ricondotti al calcolo di una primitiva del (1 + u2 )2 µ 2 ¶ Z u −1 2u 4u R1 , du. 1 + u2 1 + u2 (1 + u2 )2 Le sostituzioni menzionate sopra sono solo alcune delle possibili sostituzioni per calcolare queste primitive. La scelta della sostituzione migliore, in questo come pure negli altri tipi di integrali, dipende in generale dalla forma della funzione integranda. 278 9. Primitive Esempi 9.5.15 Z √ 1. Si voglia calcolare diventa Z 1 + x2 dx. Con la sostituzione x = sinh u l’integrale x2 ¶ Z µ 1 cosh u +C 1+ du = u − 2 sinh u sinh u p 1 + sinh2 u =u− +C sinh u cosh2 u du = sinh2 u Per calcolare questa espressione in x dobbiamo procurarci l’espressione della funzione inversa di x = sinh u. Risolvendo rispetto a u l’equazione µ ¶ 1 u 1 sinh u = e − u =x 2 e si ottiene ³ ´ p u = log x + 1 + x2 . Quindi la primitiva cercata è ³ ´ √1 + x2 p log x + 1 + x2 + + C. x Z √ 2. Si voglia calcolare x x2 − 4x + 3 dx. In questo caso p2 /4 − q = 1. L’integrale (9.5.12) è Z (t + 2) p t2 − 1dt. Usiamo la sostituzione (9.5.14). L’integrale diviene ¶µ ¶µ ¶ Z µ u 1 u 1 1 1 + +2 − − 2 du 2 2u 2 2u 2 2u che è di integrazione elementare. Una volta eseguito √ questo calcolo, per ottenere la primitiva originaria, occorre sostituire t2 − 1 + t a u e, successivamente, x − 2 a t. Z √ 2 −x + 2x + 15 3. Calcoliamo dx. In questo caso p2 /4 + q = 16. L’inte3 (x − 1) grale (9.5.13) è Z √ 1 1 − t2 dt. 4 t3 √ La sostituzione 1 − t2 = u(1 − t) conduce al calcolo di Z u2 2 3 du. (u2 − 1) 9.6. Integrali binomi 9.6 279 Integrali binomi Si chiama integrale binomio un integrale indefinito della forma Z xm (a + bxn )p dx, (9.6.1) ove m, n e p sono numeri razionali e a 6= 0, b 6= 0. Si dimostra che questi integrali si possono calcolare in termini finiti se e solo se uno dei tre seguenti numeri m+1 m+1 p, , +p n n è intero. a) Se p è intero, l’integrale binomio è del tipo già studiato nel sottoparagrafo 9.5.3. m+1 r b) Se è intero, posto p = , ove r e s sono interi, si opera la n s sostituzione µ ¶1/n ts − a b µ s ¶−1+1/n s−1 st t −a dx = dt. nb b x= Si ha µ m n p x (a + bx ) = ts − a b (9.6.2) ¶m/n tr . L’integrale (9.6.1) diviene s nb µ Z r+s−1 t ts − a b ¶ m+1 n −1 dt che è l’integrale di una funzione razionale fratta. m+1 r c) Se + p è intero, posto p = , ove r e s sono interi, si opera la n s sostituzione µ x= ts − b a ¶−1/n s dx = − ts−1 na (9.6.3) µ ts − b a ¶−1−1/n Si ha µ m n p m+np x (a + bx ) = x (b + ax −n p ) = ts − b a ¶− m n −p tr . 280 9. Primitive L’integrale (9.6.1) diviene s − na µ Z t r+s−1 ts − b a ¶− m+1 n −p−1 dt che è l’integrale di una funzione razionale fratta. Esempi 9.6.4 1. Calcoliamo Z √ q x 3 √ 3 − 4 4 x dx. In questo caso m = 1/2, n = 1/4 e p = 1/3. Si ha (m + 1)/n = 6 e siamo perciò nel caso b). La sostituzione (9.6.2) riconduce l’integrale a Z ¡ ¢5 3 t3 t3 − 3 dt 5 4 che è l’integrale di un polinomio. Una volta calcolato questo integrale si ritorna a una funzione in x ricavando t da (9.6.2). 2. Calcoliamo Z ¡ √ √ ¢−2/3 3 x 1+2 x dx. In questo caso m = 1/3, n = 1/2, p = −2/3. Si ha (m + 1)/n + p = 2, e quindi siamo nel caso c). Operando la sostituzione (9.6.3) arriviamo all’integrale Z dt 6 3 (2 − t3 ) che è l’integrale di una funzione razionale fratta. 9.7 9.7.1 Appendice Decomposizione di una funzione razionale fratta In questa Appendice dimostriamo il Teorema 9.3.14 di decomposizione di una funzione razionale fratta. Tenendo presente la (9.3.11), la dimostrazione segue da una applicazione ripetuta dei due lemmi seguenti. Lemma 9.7.1 Siano P (x) e Q(x) due polinomi tali che gr P (x) < gr Q(x). Sia Q(x) = (x − a)n R(x). ove n ≥ 1 e R(a) 6= 0. Posto Q1 (x) = (x − a)n−1 R(x), si possono trovare in maniera unica una costante κ e un polinomio P1 (x) tali che a) gr P1 (x) < gr Q1 (x) 9.7. Appendice b) 281 κ P (x) P1 (x) = . + Q(x) (x − a)n Q1 (x) Dimostrazione. Determiniamo κ in modo che P (x) − κR(x) P (x) κ = − (x − a)n R(x) (x − a)n R(x) (x − a)n P (a) . Si ha P (a) − R(a) κR(a) = 0 e quindi esiste un unico polinomio P1 (x) tale che sia della forma desiderata. Poiché R(a) 6= 0, poniamo κ = P (x) − κR(x) = (x − a)P1 (x). (9.7.2) Ne segue κ P1 (x) κ P1 (x) P (x) = + = + . n n−1 n Q(x) (x − a) (x − a) R(x) (x − a) Q1 (x) Dato che i gradi di P (x) e R(x) sono minori di gr Q(x), per (9.7.2) si ha 1 + gr P1 (x) ≤ max (gr P (x), gr R(x)) < gr Q(x) = 1 + gr Q1 (x). Lemma 9.7.3 Siano P (x) e Q(x) due polinomi tali che gr P (x) < gr Q(x). Sia Q(x) = (x2 + px + q)n R(x). ove p2 − 4q < 0, n ≥ 1 e R(x) non è divisibile per (x2 + px + q). Posto Q1 (x) = (x2 + px + q)n−1 R(x), si possono trovare in maniera unica due costanti α e β e un polinomio P1 (x) tali che a) gr P1 (x) < gr Q1 (x) b) P (x) αx + β P1 (x) = 2 + . n Q(x) (x + px + q) Q1 (x) Dimostrazione. La dimostrazione di questo Lemma in realtà è la stessa del Lemma precedente, purché sipoperi nel campo complesso e si considerino le radici −p ± i q − 4p2 complesse coniugate . Possiamo tuttavia evitare il formalismo 2 complesso. Innanzi tutto, posto x+p t= p , 4q − p2 il polinomio Q assume la forma (con un piccolo abuso di notazioni) Q(t) = (t2 + 1)n R(t), 282 9. Primitive ove R(t) non è divisibile per (t2 + 1). Determiniamo due costanti α e β in modo che P (t) − (αt + β) R(t) P (t) αt + β = 2 − 2 2 n n (t + 1) R(t) (t + 1) R(t) (t + 1)n abbia le proprietà desiderate. Separando le potenze pari di t da quelle dispari, i polinomi P (t) e R(t) si possono scrivere come P (t) = P+ (t2 ) + tP− (t2 ) R(t) = R+ (t2 ) + tR− (t2 ) ove P+ , P− , R+ , R− sono polinomi nella variabile t2 . Quindi £ ¤ P (t) − (αt + β) R(t) = P+ (t2 ) − βR+ (t2 ) − αt2 R− (t2 ) £ ¤ + t P− (t2 ) − αR+ (t2 ) − βR− (t2 ) . (9.7.4) I polinomi nelle parentesi quadrate sono ambedue polinomi in t2 . Posto t2 = u, cerchiamo α e β in modo che ambedue i polinomi P+ (u) − βR+ (u) − αuR− (u), P− (u) − αR+ (u) − βR− (u) siano divisibili per (u + 1). Otteniamo il sistema ½ −αR− (−1) + βR+ (−1) = P+ (−1) αR+ (−1) + βR− (−1) = P− (−1) 2 2 il cui determinante è −R+ (−1) − R− (−1). Tale espressione è diversa da 0, altrimenti sia R+ (u) che R− (u) sarebbero divisibili per (u + 1) e quindi R(t) sarebbe divisibile per (t2 + 1). Dette α e β le soluzioni, si ha P+ (u) − βR+ (u) − αuR− (u) = (u + 1)A(u) P− (u) − αR+ (u) − βR− (u) = (u + 1)B(u) ¡ ¢ e quindi P (t) − (αt + β) R(t) = (t2 + 1) A(t2 ) + tB(t2 ) = (t2 + 1)P1 (t). Ne segue P (t) − (αt + β) R(t) P1 (t) P1 (t) = 2 = . (t2 + 1)n R(t) (t + 1)n−1 R(t) Q1 (t) Ovviamente 2 + gr P1 (t) ≤ max (gr P (t), gr R(t)) < gr Q(t) = 2 + gr Q1 (t). Capitolo 10 Integrale di Riemann 10.1 Introduzione La teoria dell’integrazione risponde a due problemi: il calcolo dell’area sottesa dal grafico di una funzione f (x) e la determinazione della primitiva di f (x). Newton e Leibniz concepirono l’integrale essenzialmente come calcolo dell’inversa della derivata, e definirono l’area mediante la differenza dei valori della primitiva agli estremi dell’intervallo. Nella trattazione di Cauchy l’area viene definita indipendentemente, mediante approssimazione con plurirettangoli. In questo capitolo esponiamo la teoria di Riemann, che generalizza l’integrale di Cauchy, originariamente formulato per le sole funzioni continue. Ulteriori generalizzazioni, specialmente quella di Lebesgue, sono oggetto dei programmi dei corsi successivi di Analisi Matematica. 10.2 Somme superiori e inferiori Definizione 10.2.1 Sia [a, b] un intervallo chiuso e limitato. Una partizione P di [a, b] è un insieme di n + 1 punti a = x0 < x1 < x2 < · · · < xn = b. Una partizione P = {x0 , x1 , . . . , xn } suddivide l’intervallo [a, b] in n intervalli [xj , xj+1 ], ciascuno dei quali ha ampiezza xj+1 − xj , per ogni j = 0, 1, . . . , n − 1. Sia f : [a, b] → R una funzione limitata. Data una qualunque partizione P , a maggior ragione f è limitata su ciascuno degli intervalli [xj , xj+1 ]. Poniamo, per ogni j = 0, 1, . . . , n − 1, Lj = sup f (x), xj ≤x≤xj+1 `j = inf xj ≤x≤xj+1 f (x). Definizione 10.2.2 Sia f : [a, b] → R una funzione limitata e sia P una partizione di [a, b]. Si chiama somma superiore (relativa alla partizione P ) la 283 284 10. Integrale di Riemann quantità S(P ) = n−1 X Lj (xj+1 − xj ) . j=0 Si chiama somma inferiore (relativa alla partizione P ) la quantità s(P ) = n−1 X `j (xj+1 − xj ) . j=0 Se f (x) ≥ 0 per ogni x ∈ [a, b], le somme inferiori rappresentano l’area dell’unione dei rettangoli di base [xj , xj+1 ] e altezza `j . Tale figura viene chiamata plurirettangolo inscritto. Le somme superiori rappresentano l’area dell’unione dei rettangoli di base [xj , xj+1 ] e altezza Lj . Tale figura viene chiamata plurirettangolo circoscritto. Sempre nel caso in cui f (x) ≥ 0, è evidente dal significato geometrico che, assegnate due qualunque partizioni P1 e P2 di [a, b], vale la diseguaglianza s(P1 ) ≤ S(P2 ). (10.2.3) Se f (x) ha segno qualunque si ha s(P ) ≤ S(P ) per ogni partizione P , poiché `j ≤ Lj per ogni j. Tuttavia, la diseguaglianza (10.2.3) non è più immediata per due partizioni diverse. Per dimostrare la validità della diseguaglianza della (10.2.3) nel caso generale, iniziamo con la seguente definizione. Definizione 10.2.4 Data una partizione P , si dice che un partizione P ∗ è un raffinamento di P se P ⊂ P ∗ , ossia se ogni punto di P è anche un punto di P ∗ . Date due partizioni P1 e P2 , si chiama comune raffinamento di P1 e P2 la partizione P ∗ = P1 ∪ P2 . a=x0 x1 x2 x3 Plurirettangolo inscritto x4 x5=b 10.2. Somme superiori e inferiori a=x0 x2 x1 285 x3 x4 x5=b Plurirettangolo circoscritto Un raffinamento di P è quindi ottenuto introducendo nuovi punti nella partizione. Mostriamo che questa operazione fa sı̀ che le somme inferiori crescano e le somme superiori descrescano. Lemma 10.2.5 Sia P ∗ un raffinamento di P . Allora s(P ) ≤ s(P ∗ ), S(P ) ≥ S(P ∗ ). Dimostrazione. Dimostriamo l’asserto per le somme inferiori, poiché il ragionamento per le somme superiori è del tutto analogo. Supponiamo che P ∗ contenga esattamente un punto in più di P . Sia x∗ tale punto. Esiste k, 0 ≤ k ≤ n − 1, tale che xk < x∗ < xk+1 . La somma s(P ∗ ) ha gli stessi addendi di s(P ), ad eccezione dell’addendo `k (xk+1 − xk ). Al suo posto s(P ∗ ) ha i due addendi `∗1 (x∗ − xk ) + `∗2 (xk+1 − x∗ ) ove `∗1 = inf xk ≤x≤x∗ f (x), `∗2 = inf x∗ ≤x≤xk+1 f (x). Ovviamente `∗1 ≥ `k e `∗2 ≥ `k . Quindi s(P ∗ ) − s(P ) = `∗1 (x∗ − xk ) + `∗2 (xk+1 − x∗ ) − `k (xk+1 − xk ) ≥ `k (x∗ − xk ) + `k (xk+1 − x∗ ) − `k (xk+1 − xk ) = 0. Se P ∗ contiene m punti in più di P , ripetendo il precedente ragionamento m volte si ottiene la tesi. 286 10. Integrale di Riemann Teorema 10.2.6 Sia f : [a, b] → R una funzione limitata e siano P1 e P2 partizioni di [a, b]. Allora s(P1 ) ≤ S(P2 ). Dimostrazione. Sia P ∗ = P1 ∪ P2 . Per il Lemma precedente si ha s(P1 ) ≤ s(P ∗ ) ≤ S(P ∗ ) ≤ S(P2 ). 10.3 L’integrale di Riemann Sia A l’insieme di tutte le somme inferiori e B l’insieme di tutte le somme superiori. In forza del Teorema 10.2.6, ogni elemento di B è un maggiorante di A e ogni elemento di A è un minorante di B. In particolare, A è limitato superiormente e B è limitato inferiormente. Definizione 10.3.1 Sia f : [a, b] → R una funzione limitata. integrale inferiore di f in [a, b] la quantità Z b f (x)dx = sup s(P ). Si chiama P a Si chiama integrale superiore di f in [a, b] la quantità Z b f (x)dx = inf S(P ). a P In forza del Lemma 10.2.6 si ha Z b Z b f (x)dx ≤ f (x)dx, a a ma l’integrale superiore e quello inferiore possono non coincidere per una arbitraria funzione limitata f . Consideriamo infatti la funzione di Dirichlet ½ 0 se x ∈ [0, 1] è irrazionale f (x) = 1 se x ∈ [0, 1] è razionale. Data una qualunque partizione P , si ha `j = 0 e Lj = 1 per ogni j, poiché ogni intervallo contiene punti razionali e punti irrazionali. Ne segue s(P ) = 0 e Pn−1 S(P ) = j=0 (xj+1 − xj ) = 1. L’integrale superiore vale quindi 1 e l’integrale inferiore vale 0. Definizione 10.3.2 Sia f : [a, b] → R una funzione limitata. Si dice che f è integrabile secondo Riemann (o Riemann–integrabile, o anche R–integrabile) in [a, b] se Z b Z b f (x)dx = f (x)dx. a a 10.3. L’integrale di Riemann 287 Il comune valore viene indicato con Z b f (x)dx a e viene chiamato integrale (di Riemann) di f in [a, b], o anche integrale di f esteso a [a, b]. La funzione f , che appare sotto il segno di integrale, viene chiamata funzione integranda. T a b Il trapezoide T Se f : [a, b] → R limitata. Supponiamo f (x) ≥ 0 per ogni x ∈ [a, b]. Si chiama trapezoide (sotteso dal grafico di f ) la regione piana T = {(x, y) : a ≤ x ≤ b, 0 ≤ y ≤ f (x)} . (10.3.3) Poiché f (x) ≥ 0 per ogni x, le somme inferiori e superiori sono tutte non negative. Se f è integrabile secondo Riemann in [a, b], si ha necessariamente Rb f (x)dx ≥ 0. In questo caso il significato geometrico dell’integrale è evidente: a esso è l’area del trapezoide T . Si pone quindi per definizione Z b area (T ) = f (x)dx. a Rb Se T è una figura geometrica elementare si può dimostrare che a f (x)dx coincide con l’area di T definita nella geometria. Questo apparirà chiaro dal Teorema fondamentale del calcolo. Per ora R b ci limitiamo all’ovvia osservazione che, se f (x) = C per ogni x ∈ [a, b], si ha a f (x)dx = C(b − a). Definizione 10.3.4 Si denota con R[a, b] l’insieme di tutte le funzioni f : [a, b] → R limitate e R–integrabili in [a, b] Teorema 10.3.5 Sia f : [a, b] → R una funzione limitata. Condizione necessaria e sufficiente affinché f ∈ R[a, b] è che ∀ε > 0 ∃P ∗ S(P ∗ ) − s(P ∗ ) < ε. (10.3.6) 288 10. Integrale di Riemann Dimostrazione. Poniamo Z b I1 = f (x)dx,. Z I2 = a b f (x)dx. a Per definizione I1 è l’estremo superiore delle somme inferiori e I2 è l’estremo inferiore delle somme superiori. Quindi, fissato ε > 0, esistono una partizione P1 e una partizione P2 tali che I1 − ε ε < s(P1 ) ≤ I1 ≤ I2 ≤ S(P2 ) < I2 + . 2 2 Posto P ∗ = P1 ∪ P2 , si ha per il Lemma 10.2.5 I1 − ε ε < s(P ∗ ) ≤ I1 ≤ I2 ≤ S(P ∗ ) < I2 + . 2 2 Per tale partizione si ha quindi S(P ∗ ) − s(P ∗ ) < I2 − I1 + ε. (10.3.7) Se f è Riemann integrabile in [a, b] si ha I1 = I2 e quindi S(P ) − s(P ) < ε. Viceversa valga (10.3.6). Poiché s(P ∗ ) ≤ I1 ≤ I2 ≤ S(P ∗ ) si ha 0 ≤ I2 − I1 < S(P ∗ ) − s(P ∗ ) < ε. Per l’arbitrarietà di ε si ha I1 = I2 . 10.4 Proprietà dell’integrale Teorema 10.4.1 (di linearità dell’integrale) Siano f1 , f2 ∈ R[a, b]. Siano c1 , c2 ∈ R. Allora c1 f1 + c2 f2 ∈ R[a, b] e si ha Z b Z b Z b (c1 f1 (x) + c2 f2 (x)) dx = c1 f1 (x)dx + c2 f2 (x)dx. (10.4.2) a a a Dimostrazione. Denotiamo con s(P, f ) e S(P, f ) le somme inferiori e superiori relative a una funzione f . Poniamo Z b Z b I1 = f1 (x)dx, I2 = f2 (x)dx. a a Per il Teorema 10.3.5, per ogni ε > 0 esistono due partizioni P1 e P2 tali che, per k = 1, 2, (S(Pk , fk ) − Ik ) + (Ik − s(Pk , fk )) = S(Pk , fk ) − s(Pk , fk ) < ε/2. Si ha quindi ε − + I1 ≤ s(P1 , f1 ) ≤ S(P1 , f1 ) ≤ I1 + 2 ε − + I2 ≤ s(P2 , f2 ) ≤ S(P2 , f2 ) ≤ I2 + 2 ε 2 ε 2 (10.4.3) (10.4.4) 10.4. Proprietà dell’integrale 289 Posto P = P1 ∪ P2 , per il Lemma 10.2.5 le diseguaglianze (10.4.3) e (10.4.4) continuano a valere con P al posto di P1 e P2 . Sommando queste diseguaglianze (con P al posto di P1 e P2 ) si ha −ε + I1 + I2 ≤ s(P, f1 ) + s(P, f2 ) ≤ S(P, f1 ) + S(P, f2 ) ≤ I1 + I2 + ε. (10.4.5) Sia P = {x0 , x1 , . . . , xn }. Osserviamo che Lj = `j = sup (f1 (x) + f2 (x)) ≤ xj ≤x≤xj+1 inf (f1 (x) + f2 (x)) ≥ xj ≤x≤xj+1 sup xj ≤x≤xj+1 inf xj ≤x≤xj+1 f1 (x) + f1 (x) + sup xj ≤x≤xj+1 inf xj ≤x≤xj+1 f2 (x) = L1j + L2j , f2 (x) = `1j + `2j . Ne segue S(P, f1 + f2 ) = n−1 X Lj (xj+1 − xj ) ≤ j=0 n−1 X L1j (xj+1 − xj ) + j=0 n−1 X L1j (xj+1 − xj ) j=0 ˙ = S(P, f1 ) + S(P, f2 ), e, allo stesso modo, ˙ s(P, f1 + f2 ) ≥ s(P, f1 ) + s(P, f2 ). Da (10.4.5) si ottiene −ε + I1 + I2 ≤ s(P, f1 + f2 ) ≤ S(P, f1 + f2 ) ≤ I1 + I2 + ε. Poiché ε è arbitrario si ha che f1 + f2 è Riemann-integrabile in [a, b] e che Z Z b a Z b (f1 (x) + f2 (x)) dx = b f1 (x)dx + a f2 (x)dx. a Notiamo ora che, per ogni funzione f limitata in [a, b] e per ogni partizione P , si ha s(P, −f ) = −S(P, f ) S(P, −f ) = −s(P, f ). Quindi, se fk (con k = 1, 2) è Riemann-integrabile in [a, b], lo è anche −fk e Z Z b − fk (x)dx = a b −fk (x))dx. a Possiamo perciò supporre c1 e c2 non negativi. Si ha s(P, c1 f1 ) = c1 s(P, f1 ) S(P, c1 f1 ) = c1 S(P, f1 ). 290 10. Integrale di Riemann Quindi c1 f1 è Riemann integrabile e Z Z b b c1 f1 (x)dx = c1 f1 (x)dx. a (10.4.6) a In modo analogo si ha Z Z b b c2 f2 (x)dx = c2 f2 (x)dx. a a Abbiamo notato nel paragrafo 10.3 che una funzione R-integrabile e non negativa ha integrale non negativo. Dal Teorema precedente segue immediatamente la proprietà di monotonia dell’integrale, nel senso precisato dal seguente Corollario. Corollario 10.4.7 (Teorema di monotonia) Siano f, g ∈ R[a, b]. Se f (x) ≤ g(x) per ogni x ∈ [a, b], allora Z Z b b f (x)dx ≤ g(x)dx. a a Dimostrazione. Si ha g − f ∈ R[a, b] e Z Z b g(x)dx − a Z b b f (x)dx = a (g(x) − f (x)) dx ≥ 0. a Teorema 10.4.8 (di additività) Sia f : [a, b] → R limitata. Le seguenti affermazioni sono equivalenti: a) f ∈ R[a, b]; b) ∀c ∈ (a, b) f ∈ R[a, c] e f ∈ R[c, b]. Se vale una di queste due affermazioni, allora Z Z b f (x)dx = a Z c f (x)dx + a b f (x)dx. (10.4.9) c Dimostrazione. a) =⇒ b) Sia f ∈ R[a, b]. Dimostriamo che f ∈ R[a, c] e f ∈ R[c, b]. Per il Teorema 10.3.5, per ogni ε > 0 esiste una partizione P di [a, b] tale che S(P ) − s(P ) < ε. Possiamo supporre che c appartenga a P . Altrimenti raffiniamo la partizione aggiungendovi tale punto; le somme superiori non crescono e le inferiori non decrescono, di modo che vale ancora la diseguaglianza precedente. 10.4. Proprietà dell’integrale 291 Sia P1∗ la partizione di [a, c] ottenuta restringendo P ai soli punti xj tali che xj ∈ [a, c]. Sia P2∗ la partizione di [c, b] ottenuta restringendo P ai soli punti xj tali che xj ∈ [c, b]. Si ha s(P ) = s(P1∗ ) + s(P2∗ ) S(P ) = S(P1∗ ) + S(P2∗ ), da cui (10.4.10) (10.4.11) S(P1∗ ) − s(P1∗ ) + S(P2∗ ) − s(P2∗ ) = S(P ) − s(P ) < ε, A maggior ragione S(Pk∗ ) − s(Pk∗ ) < ε, per k = 1, 2. Sempre per il Teorema 10.3.5, b) vale. b) =⇒ a). Fissato ε > 0 esistono partizioni P1∗ di [a, c] e P2∗ di [c, b] tali che S(Pk∗ ) − s(Pk∗ ) < ε, per k = 1, 2. (10.4.12) Detta P la partizione di [a, b] ottenuta unendo i punti di P1∗ e P2∗ , valgono le relazioni (10.4.10) e (10.4.11). Ne segue S(P ) − s(P ) < 2ε, e quindi a). Si osservi ora che (10.4.12) implica Z c Z c −ε + f (x)dx ≤ s(P1∗ ) ≤ S(P1∗ ) ≤ f (x)dx + ε a Z −ε + c da cui, sommando, Z c Z −2ε+ f (x)dx+ a a b Z f (x)dx ≤ s(P2∗ ) ≤ S(P2∗ ) ≤ b f (x)dx + ε c Z b f (x)dx ≤ s(P, f ) ≤ S(P, f ) ≤ c Z c f (x)dx+ a Poiché si ha anche Z s(P, f ) ≤ f (x)dx ≤ S(P, f ), a si ha (10.4.9) per l’arbitrarietà di ε. T1 a T2 c I trapezoidi T1 e T2 f (x)dx+2ε. c b b b 292 10. Integrale di Riemann Rb Se f (x) ≥ 0 in [a, b], l’integrale c f (x)dx rappresenta l’area del trapezoide Rb Rc (10.3.3), mentre a f (x)dx e c f (x)dx rappresentano le aree degli analoghi trapezoidi T1 e T2 con base [a, c] e [c, b], rispettivamente. Si ha T = T1 ∪ T2 , mentre T1 ∩ T2 consiste di un segmento, la cui area è nulla (questa affermazione sarà dimostrata nel prossimo paragrafo). Il Teorema 10.4.8 afferma che Area(T ) = Area(T1 ) + Area(T2 ). Se f (x) non ha segno costante, l’integrale di Riemann di f non rappresenta più l’area della regione delimitata dal grafico e dall’asse delle ascisse. L’area di questa regione si ottiene invece come integrale di |f (x)|. Tuttavia, bisogna prima dimostrare che |f (x)| è Riemann integrabile in [a, b] se lo è f . Teorema 10.4.13 Sia f ∈ R[a, b]. Allora |f (x)| ∈ R[a, b] e si ha ¯Z ¯ Z ¯ b ¯ b ¯ ¯ f (x)dx¯ ≤ |f (x)| dx ¯ ¯ a ¯ a (10.4.14) Dimostrazione. Sia fissi ε > 0 e sia P una partizione tale che S(P, f ) − s(P, f ) < ε. Per ogni j = 0, . . . n − 1, denotiamo con `˜j e L̃j l’estremo inferiore e quello superiore di |f | nell’intervallo [xj , xj+1 ] e, al solito, con `j e Lj l’estremo inferiore e quello superiore di f nello stesso intervallo. ¯ ¯ Per ogni t, s ∈ [xj , xj+1 ] si ha chiaramente ¯|f (t)| − |f (s)|¯ ≤ |f (t) − f (s)|, da cui ¯ ¯ L̃j − `˜j = sup ¯|f (t)| − |f (s)|¯ ≤ sup |f (t) − f (s)| = Lj − `j . t,sε[xj ,xj+1 ] t,sε[xj ,xj+1 ] Ne segue S(P, |f |) − s(P, |f |) ≤ S(P, f ) − s(P, f ) < ε. Quindi |f | ∈ R[a, b] per il Teorema 10.3.5. Evidentemente − |f (x)| ≤ f (x) ≤ |f (x)|. Per il Teorema di monotonia, Z Z b − |f (x)| dx ≤ a Z b b f (x)dx ≤ a |f (x)| dx , a che equivale a (10.4.14) Le funzioni 1 (f (x) + |f (x)|) 2 1 f− (x) = (f (x) − |f (x)|) . 2 f+ (x) = si chiamano rispettivamente parte positiva e parte negativa di f . Per quanto appena dimostrato, se f è integrabile in [a, b], anche f+ e f− lo sono. 10.5. Classi di funzioni integrabili f(x) 293 |f(x)| a b a b f (x) e |f (x)| f-(x) f+(x) a b a b Parte negativa e positiva di f (x) 10.5 Classi di funzioni integrabili In questo paragrafo dimostriamo che una funzione limitata in [a, b] è Riemann integrabile se è continua, oppure ha un numero finito di discontinuità, oppure è monotona. Teorema 10.5.1 Sia f : [a, b] → R continua. Allora f ∈ R[a, b]. Dimostrazione. Dimostriamo che se f è continua allora vale (10.3.6). Si fissi ε > 0 ad arbitrio. Poiché f è uniformemente continua in [a, b], per il Teorema di Heine–Cantor esiste δ > 0 tale che per ogni coppia di punti t, s ∈ [a, b], con |t − s| < δ, si ha |f (t) − f (s)| < δ. Sia P una partizione tale che max 0≤j≤n−1 (xj+1 − xj ) < δ. (10.5.2) 294 10. Integrale di Riemann Dobbiamo valutare S(P ) − s(P ) = n−1 X Lj (xj+1 − xj ) − j=0 = n−1 X n−1 X `j (xj+1 − xj ) j=0 (Lj − `j ) (xj+1 − xj ) . j=0 Per il teorema di Weierstrass, per ogni j esistono due punti tj , sj ∈ [xj , x+1 ] tali che f (tj ) = f (sj ) = max f (x) = Lj min f (x) = `j . xj ≤x≤x+1 xj ≤x≤x+1 Si ha |tj − sj | ≤ xj+1 − xj < δ per (10.5.2). Quindi Lj − `j = f (tj ) − f (sj ) < ε. Ne segue n−1 X (Lj − `j ) (xj+1 − xj ) < n−1 X j=0 ε (xj+1 − xj ) = ε j=0 n−1 X (xj+1 − xj ) j=0 = ε(b − a) che è arbitrario assieme ad ε. Come conseguenza del Teorema precedente e del Teorema 10.4.8, otteniamo la seguente estensione. Teorema 10.5.3 Sia f : [a, b] → R limitata. Se f ha un numero finito di discontinuità, allora f ∈ R[a, b]. Dimostrazione. Supponiamo dapprima che f abbia un solo punto di discontinuità in a. Fissiamo ε > 0 ad arbitrio. Poiché f è continua, e quindi integrabile in [a + ε, b], esiste una partizione P = {a + ε < x1 < · · · < xn < b} di [a + ε, b] tale che S(P ) − s(P ) < ε. Per quanto riguarda l’intervallo [a, a + ε], osserviamo che, detti L e ` gli estremi inferiore e superiore di f (x) in tutto [a, b], si ha evidentemente sup f (x) ≤ L, inf a≤x≤a+ε a≤x≤a+ε f (x) ≥ `. Aggiungendo a P il punto a, otteniamo una partizione P ∗ di [a, b]. Si ha s(P ∗ ) = s(P ) + ε inf f (x) ≥ s(P ) + ε` sup f (x) ≤ S(P ) + εL a≤x≤a+ε S(P ∗ ) = S(P ) + ε a≤x≤a+ε 10.5. Classi di funzioni integrabili 295 e quindi S(P ∗ ) − s(P ∗ ) ≤ S(P ) − s(P ) + ε (L − `) < ε(L − ` + 1). Per il Teorema 10.3.5, f ∈ R[a, b]. In modo analogo si ragiona se vi è un unico punto di discontinuità in b. Se vi è un unico punto di discontinuità t interno, f è R–integrabile in [a, t] e [t, b] e quindi in [a, b], per il Teorema 10.4.8. Infine, se ci sono m punti di discontinuità a ≤ t1 < · · · < tm ≤ b, si fissano m − 1 punti cj tale che tj < cj < tj+1 , per ogni j = 1, . . . , m − 1. Per quanto appena dimostrato, f è Riemann integrabile in ogni intervallo [cj , cj+1 ] e quindi in [a, b] = [a, c1 ] ∪ [c1 , c2 ] ∪ · · · ∪ [cn−1 , b]. Si può dimostrare che condizione necessaria e sufficiente affinché f sia R-integrabile in [a, b] è che l’insieme dei punti di discontinuità abbia misura nulla secondo Lebesgue. Noi ci limitiamo a dimostrare l’integrabilità delle funzioni monotone, che possono avere una infinità numerabile di punti di discontinuità. Si noti che una funzione monotona in [a, b] è necessariamente limitata. Se, ad esempio, f (x) è non decrescente, si ha f (a) ≤ f (x) ≤ f (b) per ogni x ∈ [a, b]. Teorema 10.5.4 Sia f : [a, b] → R monotona. Allora f ∈ R[a, b]. Dimostrazione. Supponiamo, per fissare le idee, che f sia monotona non decrescente. Sia P una generica partizione di [a, b]. Per la monotonia si ha `j = f (xj ), Lj = f (xj+1 ), per ogni j = 0, 1, . . . , n − 1. Quindi S(P ) − s(P ) = n−1 X (Lj − `j ) (xj+1 − xj ) j=0 = n−1 X (f (xj+1 ) − f (xj+1 )) (xj+1 − xj ). j=0 Fissato ε > 0 ad arbitrio, scegliamo P in modo che xj+1 − xj < ε, per ogni j = 0, 1, . . . , n − 1. Si ha quindi n−1 X j=0 (f (xj+1 ) − f (xj+1 )) (xj+1 − xj ) < ε n−1 X (f (xj+1 ) − f (xj )) j=0 = ε (f (x1 ) − f (x0 ) + f (x2 ) − f (x1 ) − f (x2 ) + · · · + f (xn )) = ε (f (b) − f (a)) . 296 10. Integrale di Riemann Poiché ε è arbitrario, segue la tesi. Sappiamo che una funzione non negativa e R–integrabile in [a, b] possiede integrale non negativo. Si consideri ora il seguente esempio. Si fissi x0 ∈ [a, b] e sia f : [a, b] → R tale che f (x) = 0 se x 6= x0 , ma tale che f (x0 ) > 0. Una funzione di questo tipo è Riemann-integrabile in [a, b], poiché possiede una sola Rb discontinuità. Inoltre a f (x)dx = 0, perché tutte le somme inferiori sono nulle. Il trapezoide T si riduce in questo caso a un segmento, che possiede area nulla. Rb Esistono quindi funzioni R–integrabili tali che f (x) ≥ 0, a f (x)dx = 0, ma f non è identicamente nulla. Il seguente Teorema mostra che questo fenomeno non può accadere per una funzione continua. Teorema 10.5.5 (di annullamento) Sia f : [a, b] → R continua in [a, b]. Sia f (x) ≥ 0 per ogni x ∈ [a, b]. Se Z b f (x)dx = 0, a allora f (x) = 0 per ogni x ∈ [a, b]. Dimostrazione. Per assurdo esista x0 ∈ [a, b] tale che f (x0 ) > 0. Supponiamo, per fissare le idee, x0 interno. Poiché f è continua, esiste δ > 0 tale che per ogni x ∈ [x0 − δ, x0 + δ] si ha f (x) ≥ 12 f (x0 ). Si ha, poiché f (x) ≥ 0 in [a, b], Z b Z x0 −δ Z x0 +δ Z b f (x)dx = f (x)dx + f (x)dx + f (x)dx a a Z x0 −δ x0 +δ Z x0 +δ ≥ f (x)dx ≥ x0 −δ x0 −δ x0 +δ 1 f (x0 )dx 2 = δf (x0 ) > 0, contro l’ipotesi che l’integrale sia nullo, assurdo. 10.6 Integrale esteso a un intervallo orientato Rb Nella definizione del simbolo a f (x)dx si è finora supposto a < b, cioè l’integrale è esteso a un intervallo orientato concordemente all’orientazione dell’asse delle ascisse. Per conferire maggiore flessibilità formale al simbolo di integrale, introduciamo l’integrale esteso a un intervallo orientato negativamente, o esteso a un singolo punto. Definizione 10.6.1 Sia f : [a, b] → R limitata e Riemann integrabile in [a, b]. Poniamo: Z a Z b f (x)dx = − f (x)dx a Zb a f (x)dx = 0. a 10.6. Integrale esteso a un intervallo orientato 297 RIla Teorema di linearità 10.4.1 continua ovviamente a valere per il simbolo b f (x)dx. Il Teorema di monotonia vale con diseguaglianza invertita. Il Teorema 10.4.8 continua a valere, ma richiede una semplice verifica. Teorema 10.6.2 Sia f ∈ R[α, β] → R. Siano a, b, c tre punti qualsiasi di [α, β], disposti in qualunque ordine e non necessariamente distinti. Si ha Z b Z c Z b f (x)dx = f (x)dx + f (x)dx. (10.6.3) a a c Dimostrazione. La dimostrazione di (10.6.3) si conduce esaminando tutti i casi possibili. Sia ad esempio c < a < b. Si ha Z b Z a Z b f (x)dx = f (x)dx + f (x)dx, c c a da cui Z Z b a Z b f (x)dx = a f (x)dx − c Z = f (x)dx c Z c f (x)dx + a b f (x)dx. c Gli altri casi si verificano in modo analogo. Il Teorema 10.4.13 vale in forma diversa. Teorema 10.6.4 Siano f, g ∈ R[α, β] → R, e siano a, b ∈ [α, β], disposti in qualunque ordine e non necessariamente distinti. Allora ¯Z ¯ ¯Z ¯ ¯ b ¯ ¯ b ¯ ¯ ¯ ¯ ¯ f (x)dx¯ ≤ ¯ |f (x)| dx¯ . (10.6.5) ¯ ¯ a ¯ ¯ a ¯ Dimostrazione. Se a = b la tesi è ovvia. Se a < b, (10.6.5) non è altro che (10.4.14). Se b < a, si applica il Teorema 10.4.13 all’intervallo [b, a]. Si ottiene ¯Z ¯ ¯Z ¯ Z a ¯ b ¯ ¯ a ¯ ¯ ¯ ¯ f (x)dx¯ = ¯ f (x)dx¯¯ ≤ |f (x)| dx ¯ ¯ a ¯ b b ¯Z ¯ ¯ b ¯ ¯ ¯ =¯ |f (x)| dx¯ . ¯ a ¯ Corollario 10.6.6 Sia f ∈ R[α, β] → R, e siano a, b ∈ [α, β], disposti in qualunque ordine e non necessariamente distinti. Se |f (x)| ≤ g(x) per ogni x, allora ¯Z ¯ ¯Z ¯ ¯ b ¯ ¯ b ¯ ¯ ¯ ¯ ¯ f (x)dx¯ ≤ ¯ g(x)dx¯ . (10.6.7) ¯ ¯ a ¯ ¯ a ¯ 298 10. Integrale di Riemann Dimostrazione. Se a = b la tesi è ovvia. Se a < b ¯Z ¯ Z ¯Z ¯ Z b ¯ b ¯ ¯ b ¯ b ¯ ¯ ¯ ¯ f (x)dx¯ ≤ |f (x)| dx ≤ g(x)dx = ¯ g(x)dx¯ . ¯ ¯ a ¯ ¯ ¯ a a a Se a > b la tesi continua a valere, poiché (10.6.7) non dipende dall’ordine di a e b. 10.7 Il Teorema fondamentale del calcolo integrale Definizione 10.7.1 Sia f ∈ [a, b] → R, limitata e R–integrabile in [a, b]. Per ogni x ∈ [a, b] poniamo Z x F (x) = f (t)dt. (10.7.2) a La funzione F cosı̀ definita si chiama funzione integrale di f in [a, b]. Teorema 10.7.3 Sia f ∈ [a, b] → R, limitata e R–integrabile in [a, b]. La funzione integrale F (x) gode delle seguenti proprietà a) F è continua in [a, b]. b) Se f è continua in x0 ∈ [a, b], allora F è derivabile in x0 e si ha F 0 (x0 ) = f (x0 ). (10.7.4) Dimostrazione. a) Dimostriamo che F è uniformemente continua. Per ogni x, y ∈ [a, b] si ha, tenendo conto di (10.6.3), ¯Z x ¯ ¯Z x ¯ Z y Z a ¯ ¯ ¯ ¯ ¯ ¯ ¯ |F (x) − F (y)| = ¯ f (t)dt − f (t)dt ¯ = ¯ f (t)dt + f (t)dt¯¯ a a a y ¯Z x ¯ ¯ ¯ = ¯¯ f (t)dt ¯¯ . y Poniamo L = supx∈[a,b] |f (x)|. Per (10.6.5) e per il Corollario 10.6.6 (con g(x) = L) si ha ¯Z x ¯ ¯Z x ¯ ¯Z x ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯≤¯ ¯≤¯ ¯ f (t)dt |f (t)| dt Ldx ¯ ¯ ¯ ¯ ¯ ¯ y y y = L|x − y|. Fissato ε > 0 ad arbitrio, sia δ = ε/M . In tal caso, |x − y| < δ implica |F (x) − F (y)| < ε. b) Il rapporto incrementale di F relativo al punto iniziale x0 si può scrivere come "Z # Z x0 x0 +h 1 F (x0 + h) − F (x0 ) = f (t)dt − f (t)dt h h a a Z 1 x0 +h = f (t)dt. h x0 10.7. Il Teorema fondamentale del calcolo integrale 299 Si può inoltre scrivere f (x0 ) = 1 h Z x0 +h f (x0 )dt. x0 Per (10.6.5) si ha ¯ ¯ ¯¯ Z x0 +h ¯ ¯ ¯ ¯1 ¯ F (x0 + h) − F (x0 ) ¯ ¯=¯ ¯ − f (x ) (f (t) − f (x )) dt ¯ 0 0 ¯ ¯ ¯ ¯ h h x0 ¯Z ¯ ¯ 1 ¯¯ x0 +h ¯ ≤ |f (t) − f (x0 )| dt ¯ . ¯ ¯ |h| ¯ x0 (10.7.5) Poiché f è continua in x0 , fissato ε > 0 esiste δ > 0 tale che |f (t) − f (x0 )| < ε per ogni t tale che |t − t0 | < δ, si ha |t − t0 | < δ. Sia h tale che |h| < δ, h 6= 0. Per ogni t ∈ [x0 , x0 + h] (o t ∈ [x0 + h, x0 ]) si ha allora |t − t0 | < δ. Ne segue che l’integranda in (10.7.5) è minore di ε. Per il Corollario 10.6.6, ¯Z ¯Z ¯ ¯ ¯ ¯ 1 ¯¯ x0 +h 1 ¯¯ x0 +h ¯ ¯ |f (t) − f (x0 )| dt ¯ ≤ εdt ¯ = ε ¯ ¯ ¯ ¯ ¯ ¯ |h| x0 |h| x0 e quindi la tesi. Se c ∈ [a, b] è fissato, si può definire, in analogia a (10.7.2), la funzione integrale a partire dal punto c. Si pone cioè, per ogni x ∈ [a, b], Z x Fc (x) = f (t)dt. (10.7.6) c La funzione Fc differisce dalla funzione F = Fa per una costante. Infatti Z x Z c F (x) = Fa (x) = f (t)dt = f (t)dt + Fc (x). a a Quindi a) e b) del Teorema 10.7.3 valgono anche per Fc . Se f : [a, b] → R è continua per ogni x ∈ [a, b], per il punto b) del Teorema precedente la funzione F (x) è derivabile in [a, b] con funzione derivata f (x). Si ha quindi il risultato anticipato nel capitolo 9. Corollario 10.7.7 (Esistenza della primitiva di una funzione continua) Sia f : [a, b] → R continua in [a, b]. La funzione integrale (10.7.2) è una primitiva di f in [a, b]. Segue immediatamente il risultato principale di questo paragrafo. Teorema 10.7.8 (Teorema fondamentale del calcolo integrale) Sia f : [a, b] → R continua in [a, b]. Sia ϕ una qualunque primitiva di f in [a, b]. Allora Z b f (t)dt = ϕ(b) − ϕ(a). a (10.7.9) 300 10. Integrale di Riemann Dimostrazione. Poiché anche la funzione integrale F (x) è una primitiva, esiste una costante C tale che per ogni x ∈ [a, b] Z x f (t)dt = ϕ(x) + C. (10.7.10) a Posto x = a in (10.7.10), si ha 0 = ϕ(a) + C, ossia C = −ϕ(a). Posto x = b, si ottiene (10.7.9). Il Teorema fondamentale del calcolo integrale asserisce che, una volta calcolata con qualsivoglia metodo una primitiva di f in [a, b], l’integrale di Riemann di f in [a, b] si calcola come differenza dei valori della primitiva agli estremi dell’intervallo. La differenza ϕ(b) − ϕ(a) viene usualmente indicata con il simbolo b [ϕ(x)]a . Il Teorema 10.7.8 vale anche in ipotesi più generali. Ne daremo una estensione nell’Appendice. Notiamo il seguente Corollario. Corollario 10.7.11 (Teorema della media) Se f : [a, b] → R è continua in [a, b], esiste z ∈ (a, b) tale che 1 b−a Z b f (t)dt = f (z). (10.7.12) a Dimostrazione. Sia ϕ una primitiva di f in [a, b]. Per il Teorema di Lagrange esiste z ∈ (a, b) tale che ϕ(b) − ϕ(a) = (b − a)f (z). La tesi segue da (10.7.9). La quantità a sinistra in (10.7.12) viene chiamata media di f in [a, b]. Sia f (t) ≥ 0 in [a, b] e riscriviamo (10.7.12) nella forma Z b f (t)dt = f (z)(b − a). (10.7.13) a Il significato geometrico del Teorema della media è chiaro: l’area del trapezoide relativo a f (t) è eguale all’area di un rettangolo di base [a, b] e altezza f (z). Esempi 10.7.14 Z π/2 1. Calcoliamo sin xdx. Una primitiva di sin x è ϕ(x) = − cos x. Si ha 0 Z π/2 0 Z π/2 sin xdx = [− cos x]0 =1 1 (x3 + x)dx. Si ha 2. Calcoliamo 0 Z 0 1 · (x3 + x)dx = x4 x2 + 4 2 ¸1 = 0 3 4 10.7. Il Teorema fondamentale del calcolo integrale Z 301 1 3. Calcoliamo arctan xdx. La primitiva dell’arcotangente è stata calcola0 ta nell’esempio 9.2.7.1. Risulta ¸1 · Z 1 1 2 arctan xdx = x arctan x − log(1 + x ) 2 0 0 π 1 = − log 2. 4 2 Z 2 x3 ex dx. La primitiva è stata calcolata nell’esempio 9.2.7.4. 4. Calcoliamo Si ha 0 Z 2 0 ¤2 £ x3 ex dx = x3 ex − 3x2 ex + 6xex − 6ex 0 = 2e2 + 6. Il Teorema di integrazione per parti 9.2.5 fornisce la seguente formula per l’integrale di Riemann: Z b Z b b 0 f (x)g (x)dx = [f (x)g(x)]a − f 0 (x)g(x)dx, a a valida se f e g hanno derivata continua [a, b]. L’applicazione del Teorema 9.2.11, di integrazione per sostituzione, richiede qualche commento. Sia f : I → R continua e sia x = x(t) : [a, b] → I una funzione derivabile. Non si richiede che la funzione x(t) sia iniettiva né che sia suriettiva. Poniamo, come nel paragrafo 9.2, Z ϕ(x) = f (x)dx, Z ψ(t) = f (x(t)) x0 (t)dt. Sappiamo che ψ(t) = ϕ(x(t)) + C. Poniamo x(a) = c e x(b) = d. Si noti che Z b può essere sia c < d che c ≥ d. Se si vuole calcolare f (x(t)) x0 (t)dt, si ottiene a dal Teorema fondamentale del calcolo integrale Z b f (x(t)) x0 (t)dt = ψ(b) − ψ(a) a = ϕ(d) − ϕ(c) Z d = f (x)dx. c Se c ≥ d quest’ultimo integrale va interpretato come nella definizione 10.6.1. Quindi non occorre, una volta calcolata ϕ(x), ricalcolare per sostituzione ψ(t). Possiamo semplicemente calcolare la differenza dei valori di ϕ(x) in x(b) = d e in x(a) = c. 302 10. Integrale di Riemann Supponiamo ora che x(t) applichi biunivocamente [a, b] su [c, d]. Per fissare le idee, sia x(t) crescente, in modo che x(a) = c e x(b) = d. Anche la funzione inversa t(x) è crescente e ψ(t(x)) = ϕ(x). Si ha inoltre d = t(b), c = t(a). Si Z d voglia calcolare f (x)dx. Si ha c Z d f (x) dx = ϕ(d) − ϕ(c) c = ψ(b) − ψ(a) Z b = f (x(t)) x0 (t)dt. a Anche in questo caso non occorre, una volta calcolata ψ(t), risostituire t(x) a t. Esempi 10.7.15 Z π (sin t)4 cos tdt. Per il calcolo della primitiva si pone, come 1. Calcoliamo π/2 nell’esempio 9.2.14.1, x = sin t, da cui dx = cos tdt. In questo caso x(a) = x(π/2) = 1 e x(b) = x(π) = 0. Si ha Z π Z 0 1 (sin t)4 cos tdt = x4 dx = − . 5 π/2 1 Z 1 ex dx. Per il calcolo della primitiva mediante sostitux −1 1 + e zione si veda l’esempio 9.2.14.3. Posto t = ex , si ha Z 1 Z e ex dt dx = = log(1 + e) − log(1 + e−1 ). x −1 1 + e e−1 1 + t 2. Calcoliamo 10.8 Integrali impropri L’integrale di Riemann è definito per funzioni limitate in intervalli compatti. Queste restrizioni costituiscono una severa limitazione alle applicazioni del calcolo integrale. Con l’integrale di Lebesgue si ottiene una teoria soddisfacente che supera queste restrizioni. Tuttavia, anche nell’ambito della teoria di Riemann, la nozione di integrale improprio (o generalizzato) offre una estensione della nozione di integrale sufficiente per le applicazioni più comuni. 10.8.1 Integrali impropri di prima specie Sia f : (a, b] → R e supponiamo f limitata e Riemann integrabile in ogni intervallo del tipo [x, b], ove a < x < b. Non si richiede che f sia limitata in tutto (a, b], né che sia definita in a. La funzione Z b f (t)dt x 10.8. Integrali impropri 303 è definita per ogni x ∈ (a, b]. Essa non è altro che l’opposto della funzione integrale Fb (x) definita in (10.7.6). Quindi Z b −Fb (x) = f (t)dt. x T a b Trapezoide illimitato Definizione 10.8.1 Sia f : (a, b] → R, e supponiamo f limitata e Riemann integrabile in [x, b], per ogni a < x < b. Si dice che f ammette integrale improprio Rb di prima specie in [a, b] se esiste finito limx→a+ x f (t)dt. In tal caso si pone Z x→a+ Z b lim f (t)dt = x b f (t)dt. (10.8.2) a Il limite in (10.8.2), se esiste finito, si chiama integrale improprio di prima specie di f in [a, b] e si indica con il medesimo simbolo dell’integrale di Riemann. Questo non può dare luogo a equivoci. Infatti, se f ∈ R[a, b], in virtù della continuità della funzione integrale (punto a) del Teorema 10.7.3, il limite di −Fb (x) per x → a+ esiste ed è eguale all’integrale di Riemann di f in [a, b]. Se f (x) ≥ 0 in (a, b], l’integrale improprio di prima specie, se esiste, ha il significato di area del trapezoide illimitato T = {(x, y) : a < x ≤ b, 0 ≤ y ≤ f (x)} . Quindi, anche se il trapezoide T è illimitato, la sua area può essere finita. Si definisce analogamente l’integrale improprio di una funzione f : [a, b) → R, limitata e Riemann integrabile in ogni intervallo [a, x], ove a < x < b. In questo 304 10. Integrale di Riemann caso diremo cheR f ammette integrale improprio di prima specie in [a, b] se esiste x finito limx→b− a . Si pone di nuovo Z lim f (t)dt = x→b− Si noti che Rx Z x a b f (t)dt. a = Fa (x) = F (x). a Studiamo ora l’esistenza dell’integrale improprio di prima specie per una famiglia notevole di funzioni elementari. Sia, per ogni λ ∈ R, fλ (t) = 1 , (t − a)λ ove a < t ≤ b. Evidentemente, queste funzioni sono continue e quindi R–integrabili in ogni intervallo del tipo [x, b]. Si ha Z b x b [log |t − a|]x dt " #x = 1 1 (t − a)λ 1−λ λ−1 (t − a) se λ = 1 se λ 6= 1. a Se λ = 1 si ha per x → a+ Z b x dt = log |b − a| − log |x − a| → +∞ (t − a)λ e perciò f1 (t) non ammette integrale improprio in [a, b]. Se λ 6= 1, si ha Z b x " # 1 dt 1 1 − = . λ−1 (t − a)λ 1 − λ (b − a)λ−1 (x − a) Per x → a+ si ha Z Z b x b x dt 1 1 → (t − a)λ 1 − λ (b − a)λ−1 dt → +∞ (t − a)λ se λ < 1, se λ > 1. 1 ammettono integrale improprio in [a, b] se e (t − a)λ 1 solo se λ < 1. In maniera del tutto analoga si dimostra che le funzioni (b − t)λ ammettono integrale improprio in [a, b] se e solo se λ < 1. In conclusione, le funzioni 10.8. Integrali impropri 10.8.2 305 Integrali impropri di seconda specie Gli integrali impropri di seconda specie estendono la nozione di integrale agli intervalli illimitati. Come nel caso precedente, l’estensione è basata sull’esistenza del limite finito della funzione integrale Z x Fa (x) = f (t)dt. a Definizione 10.8.3 Sia f : [a, +∞) → R, limitata e Riemann integrabile in ogni intervallo [a, x], ove a < x < +∞. Si dice che f ammette integrale improprio di seconda specie in [a, +∞) se esiste finito limx→+∞ Fa (x). In tal caso poniamo Z Z x lim Fa (x) = lim x→∞ x→+∞ +∞ f (t)dt = a f (t)dt. (10.8.4) a Il limite in (10.8.2), se esiste finito, si chiama integrale improprio di seconda speciedi f in [a, +∞). Se f (x) ≥ 0 in [a, +∞), l’integrale improprio di seconda specie, se esiste, ha il significato di area del trapezoide illimitato T = {(x, y) : a ≤ x < +∞, 0 ≤ y ≤ f (x)} . T a Trapezoide illimitato In maniera analoga si definisce l’integrale improprio di seconda specie per una funzione f : (−∞, a] → R, limitata e Riemann integrabile in ogni intervallo [x, a]. In questo caso diremo che f ammette R a integrale improprio di seconda specie in (−∞, a] se esiste finito limx→−∞ x f (t)dt. Si pone Z a Z a lim −Fa (x) = lim f (t)dt = f (t)dt. x→−∞ x→−∞ x −∞ Come nel sottoparagrafo precedente, si può determinare agevolmente l’esistenza dell’integrale improprio per una famiglia notevole di funzioni elementari. Sia a > 0 e poniamo, per ogni µ reale, gµ (t) = 1 , tµ ove 0 < a ≤ t. 306 10. Integrale di Riemann Si ha Z a Z x x [log t]a dt · ¸x = 1 1 tµ 1 − µ tµ−1 a se µ = 1 se µ 6= 1. x dt = log x − log a → +∞ per x → +∞, e g1 non è integrabile in a t senso improprio in [a, +∞). Se µ 6= 1 si ha · ¸ Z x 1 1 1 dt = − , µ 1 − µ xµ−1 aµ−1 a t Quindi per cui, al tendere di x a +∞, Z x dt 1 = se µ > 1, µ µ−1 t (µ − 1)a a Z x dt → +∞ se µ < 1. µ a t 1 In conclusione, le funzioni µ ammettono integrale improprio in [a, +∞), ove t a > 0, se e solo se µ > 1. In maniera del tutto analoga si dimostra che le 1 funzioni ammettono integrale improprio in (−∞, a], con a < 0, se e solo (−t)µ se µ > 1. 10.8.3 Criteri del confronto Una volta stabilita l’esistenza o meno dell’integrale improprio delle funzioni elementari considerate nel precedente paragrafo, l’esistenza degli integrali impropri di funzioni più generali si studia per mezzo di criteri del confronto. Le dimostrazioni sono svolte in Appendice. Teorema 10.8.5 (del confronto per gli integrali impropri di I specie) Siano f, g : (a, b] → R limitate e Riemann integrabili in ogni intervallo del tipo [x, b], ove a < x < b. a) Se |f (t)| ≤ g(t) per ogni t ∈ (a, b] e se esiste l’integrale improprio di priRb ma specie a g(t)dt, allora esiste l’integrale improprio di prima specie Rb f (t)dt. a b) Se 0 ≤ f (x) ≤ g(t) per ogni t ∈ [a, +∞) e se non esiste l’integrale improprio Rb di prima specie a f (t)dt, allora non esiste l’integrale improprio di prima Rb specie a g(t)dt. Ovviamente, l’analogo Teorema vale per funzioni definite in [a, b), limitate e Riemann integrabili in ogni intervallo del tipo [a, x], ove a < x < b. Pure analogo è l’enunciato del criterio del confronto per gli integrali impropri di seconda specie. 10.8. Integrali impropri 307 Teorema 10.8.6 (del confronto per gli integrali impropri di II specie) Siano f, g : [a, +∞) → R limitate e Riemann integrabili in ogni intervallo del tipo [a, x], ove a < x < +∞. a) Se |f (t)| ≤ g(t) per ogni t ∈ [a, +∞) e se esiste l’integrale improprio di R +∞ seconda specie a g(t)dt, allora esiste l’integrale improprio di seconda R +∞ specie a f (t)dt. b) Se 0 ≤ f (t) ≤ g(t) per ogni t ∈ [a, +∞) e se non esiste l’integrale improprio R +∞ di seconda specie a f (t)dt, allora non esiste l’integrale improprio di R +∞ seconda specie a g(t)dt. Il criterio del confronto per gli integrali del tipo le ovvie modifiche. Ra −∞ f (t)dt si enuncia con Esempi 10.8.7 sin 1/t √ , definita e continua per t > 0. Questa funzione ammette t integrale improprio di prima specie in [0, 1] per il punto a) del Teorema 10.8.5. Infatti si ha, per ogni t ∈ (0, 1], ¯ ¯ ¯ sin 1/t ¯ ¯ √ ¯ ≤ √1 = g(t). ¯ t ¯ t 1. Sia f (t) = 1 La funzione g(t) = √ ammette integrale improprio di prima specie in t [0, 1] per quanto stabilito nel precedente paragrafo 1 + t2 , definita e continua per t 6= 2. Questa funzione non 2−t ammette integrale improprio di prima specie in [0, 2] per il punto b) del Teorema 10.8.5. Infatti, per ogni t ∈ [0, 2) si ha 2. Sia g(t) = 1 + t2 1 ≥ = f (t) 2−t 2−t che non ammette integrale improprio in [0, 2]. sin t , definita e continua per t 6= 0. Questa funzione ammett2 te integrale improprio di seconda specie in [1, +∞) per il punto a) del Teorema 10.8.6. Infatti si ha, per ogni t ∈ [1, +∞), ¯ ¯ ¯ sin t ¯ 1 ¯ ¯ ¯ t2 ¯ ≤ t2 = g(t) 3. Sia f (t) = che ammette integrale improprio di prima specie in [1, +∞). 308 10. Integrale di Riemann arctan t √ , definita e continua per ogni t > 0. Questa funzione t non ammette integrale improprio di seconda specie in [1, +∞) per il punto b) del Teorema 10.8.6. Infatti si ha, per t ≥ 1, 4. Sia g(t) = arctan t arctan 1 π √ √ ≥ = √ = f (t) t t 4 t che non ammette integrale improprio in [1, +∞). Osservazione. Per l’applicabilità dei Teoremi del confronto per gli integrali impropri è sufficiente che l’ipotesi |f (t)| ≤ g(t) nel caso a), 0 ≤ f (t) ≤ g(t) nel caso b), valga solo in un opportuno intervallo (a, a + ε) o [M, +∞) (oppure (b − ε, b), o (−∞, M ]). Infatti, possiamo scrivere Z Z b x Z a+ε f (t)dt = b f (t)dt + x f (t)dt a+ε Rb e il secondo addendo è costante rispetto a x. Quindi limx→a+ x f (t)dt esiste R a+ε se e solo se esiste limx→a+ x f (t)dt. Gli altri casi si trattano in maniera del tutto analoga. Di conseguenza, se f (t) e g(t) hanno segno costante in un intorno destro di a Rb e f (t) ∼ g(t) per x → a+, l’integrale improprio di prima specie a f (t)dt esiste Rb se e solo se esiste l’integrale improprio di prima specie a f (t)dt. Infatti, la relazione ∼ implica che esistono due costanti c1 e c2 tali che in un opportuno intervallo (a, a + ε) si abbia c1 g(t) ≤ f (t) ≤ c2 g(t) per ogni t ∈ (a, a + ε). Poiché f (t) e g(t) hanno segno costante (che possiamo supporre positivo) in (a, a + ε) possiamo applicare il Teorema del confronto 10.8.5 a tale intervallo. La stessa osservazione vale per gli integrali impropri di seconda specie. Siano f, g : [a, +∞) → R due funzioni R–integrabili in ogni intervallo [a, M ] e aventi segno costante in un intorno di +∞. Se f (t) ∼ g(t) per t → +∞ l’integrale R +∞ R +∞ f (t)dt esiste se e solo se esiste a g(t)dt. a Esempi 10.8.8 Z π/2 1. Studiamo l’esistenza di t − t3 sin4/3 t 0 t − t3 sin 4/3 t ∼ e quindi l’integrale proposto esiste. dt. Si ha per t → 0+ t t4/3 = 1 t1/3 10.8. Integrali impropri 309 Z +∞ 2 2. Studiamo l’esistenza di 0 t − arctan t dt. Si ha per t → +∞ t3 + t + 1 t2 − arctan t t2 1 ∼ 3 ∼ 3 t +t+1 t t e quindi l’integrale proposto non esiste. 10.8.4 Integrali impropri di terza specie a1 a2 Vengono chiamati integrali impropri di terza specie integrali estesi a intervalli I, limitati o illimitati, contenenti n punti, a1 , . . . , an nel cui intorno la funzione integranda non è necessariamente limitata. L’integranda si suppone tuttavia limitata e R–integrabile in ogni sottointervallo compatto di I non contenente nessuno dei punti aj . Illustriamo questo concetto iniziando dai casi più semplici. a) Sia f : (a, b) → R limitata e R–integrabile in ogni intervallo del tipo [x, y], ove a < x < y < b. Fissato c ∈ (a, b), se esistono ambedue gli integrali impropri di prima specie Z c Z b f (t)dt, f (t)dt, a c si dice che f ammette integrale improprio in [a, b] e si pone Z b Z c Z b f (t)dt = f (t)dt + f (t)dt. a a c Si osservi che questa definizione non dipende dal punto c scelto. Infatti se d è un altro punto in (a, b) si ha, per ogni a < x < y < b Z c Z d Z c f (t)dt = f (t)dt + f (t)dt, Z x y x d f (t)dt = c d Z Z f (t)dt + c y f (t)dt. d 310 10. Integrale di Riemann Quindi Z Z c lim x→a+ x→a+ x Z y lim x Z y f (t)dt, (10.8.9) f (t)dt. (10.8.10) d Z d f (t)dṫ + y→b− c c f (t)dt + f (t)dṫ = lim y→b− Z d f (t)dt = lim d c Rc Rd L’integrale di prima specie a f (t)dt esiste se e solo se esiste l’integrale a f (t)dt. Rb Rb Cosı̀ pure, c f (t)dt esiste se e solo se esiste d f (t)dt. Sommando termine a termine (10.8.9) e (10.8.10), si ha Z Z c Z b f (t)dt + a c Z d f (t)dt = b f (t)dt + f (t)dt. a d Questa osservazione rimane valida, con gli opportuni cambiamenti, anche nei casi successivi. b) Sia f :(a, +∞) → R, limitata e R–integrabile in ogni intervallo [x, y] , ove a < x < y < +∞. Fissato un punto c ∈ (a, +∞), se esistono ambedue gli integrali impropri Z c Z +∞ f (t)dt, f (t)dt, a c si dice che f ammette integrale improprio in [a, +∞) e si pone Z Z +∞ f (t)dt = a Z c +∞ f (t)dt + a f (t)dt. c Come nel caso precedente, questa definizione non Z dipende dal punto c. Del tutto a analoga è la definizione degli integrali del tipo f (t)dt, ove f : (−∞, a) → R −∞ è limitata e R–integrabile in ogni intervallo [x, y] , con −∞ < x < y < a. Esempi 10.8.11 Z 1. L’integrale 1 −1 √ dt esiste. Infatti 1 − t2 1 f (t) ∼ p 2 (1 + t) f (t) ∼ p 1 2 (1 − t) per t → −1, per t → 1. Z c √ e quindi esistono ambedue gli integrali −1 < c < 1). −1 dt e 1 − t2 Z 1 √ c dt (ove 1 − t2 10.8. Integrali impropri Z 311 1 2. L’integrale dt 1/3 (1 − t) 0 log(1 + t) non esiste. Infatti sia 0 < c < 1. Si ha 1 f (t) ∼ t 1 f (t) ∼ 1/3 (1 − t) log 2 Z 1 Quindi c esiste. (1 − t) Z ∞ √ 3 3. L’integrale 0 per t → 1. Z dt 1/3 per t → 0, log(1 + t) 0 dt (1 − t) 1/3 log(1 + t) non e−t dt esiste. Infatti arctan t 1 3 f (t) ∼ √ c esiste, mentre per t → 0, t q f (t) ∼ 3 2 −t πe Z ≤ Ct−2 c e quindi ambedue gli integrali −∞ −∞ < c < 0). √ 3 per t → +∞ et dt , arctan t Z 0 c √ 3 et dt esistono (ove arctan t c) Sia f : (−∞, +∞) → R, limitata e R–integrabile in ogni [x, y], ove −∞ < x < y < +∞. Fissato un punto c, se esistono ambedue gli integrali Z Z c f (t)dt, −∞ +∞ f (t)dt, (10.8.12) c si dice che f ammette integrale improprio in (−∞, +∞) e si pone Z Z +∞ f (t)dt = −∞ Z c +∞ f (t)dt + −∞ f (t)dt. c Esempi 10.8.13 Z +∞ dt esiste. Infatti, sia per t → +∞ che per 2 + 1 + cos t t −∞ −2 t → −∞, si ha f (t) ∼ t . Ambedue gli integrali in (10.8.12) esistono. Z +∞ dt 2. L’integrale non esiste. Infatti il secondo integrale in (10.8.12) t+t e −∞ esiste, poiché f (t) ∼ e−t per t → +∞. Tuttavia il primo non esiste, poiché f (t) ∼ 1/t per t → −∞. 1. L’integrale 312 10. Integrale di Riemann Supponiamo ora I = (α, β) ⊆ R. Sia f una funzione a valori reali definita in (α, β), con l’eccezione al più di n valori a1 < a2 < . . . < an . Supponiamo f limitata e R–integrabile in ogni intervallo compatto che non contenga nessuno dei punti aj , per j = 1, . . . , n. Se esistono tutti gli integrali impropri Z Z a1 Z a2 f (t)dt, α a1 Z an f (t)dt, . . . , β f (t)dt, an−1 f (t)dt, an si dice che f ammette integrale improprio in I e si pone Z Z β a1 f (t)dt = α f (t)dt + α n−1 X Z aj+1 j=1 Z β f (t)dt + αj f (t)dt. an Esempi 10.8.14 1. Studiamo l’esistenza dell’integrale √ Z +∞ 3 0 t−1 dt. (t2 + 1) log t Si ha in questo caso a1 = 0 , a2 = 1, a3 = +∞. Si hanno le seguenti relazioni 1 ≤ Ct−1/2 per t → 0 + , f (t) ∼ − log t √ 3 t−1 1 f (t) ∼ = q per t → 1, 2(t − 1) 2 3 2 (t − 1) 1 1 f (t) ∼ ≤ 5/3 per t → +∞. t5/3 log t t Esistono quindi gli integrali impropri Z 1 Z f (t)dt, +∞ f (t)dt 1 0 e di conseguenza esiste l’integrale proposto. 2. Studiamo l’esistenza dell’integrale Z +∞ p −2 1 |t(1 − t2 )| dt. 10.9. Appendice 313 In questo caso a1 = −1, a2 = 0, a3 = 1, a4 = +∞. Si ha 1 1 f (t) ∼ √ 2 |1 + t|1/2 per t → −1, f (t) ∼ 1 1 f (t) ∼ √ 2 |1 − t|1/2 per t → 1, f (t) ∼ t−3/2 1 1/2 |t| per t → 0, per t → +∞. Esistono quindi gli integrali impropri Z Z −1 −2 Z 0 f (t)dt, f (t)dt, −1 Z 1 +∞ f (t)dt, 0 f (t)dt. 1 L’integrale proposto esiste. 10.9 10.9.1 Appendice Estensione del Teorema fondamentale del calcolo integrale Teorema 10.9.1 Sia f ∈ R[a, b] e sia ϕ : [a, b] → R continua in [a, b] e derivabile eccetto al più in n punti t1 , . . . , tn . Sia inoltre ϕ0 (t) = f (t) per ogni t 6= tj , j = 1, . . . , n. Allora Z b f (t)dt = ϕ(b) − ϕ(a). (10.9.2) a Dimostrazione. Sia ε > 0 fissato ad arbitrio e sia P = {x0 , x1 , . . . , xn } una partizione tale che S(P ) − s(P ) < ε. Possiamo supporre che i punti tj appartengano alla partizione. Si ha ϕ(b) − ϕ(a) = n−1 X (ϕ(xj+1 ) − ϕ(xj )) . (10.9.3) j=0 Per il Teorema di Lagrange esiste zj ∈ (xj , xj+1 ) tale che ϕ(xj+1 ) − ϕ(xj ) = (xj+1 − xj )ϕ0 (zj ) = (xj+1 − xj )f (zj ) per ogni j = 0, . . . , n − 1. Evidentemente si ha `j ≤ f (zj ) ≤ Lj . Da (10.9.3) segue s(P ) ≤ ϕ(b) − ϕ(a) ≤ S(P ). Quindi ¯Z ¯ ¯ b ¯ ¯ ¯ f (t)dt − (ϕ(b) − ϕ(a))¯ ≤ S(P ) − s(P ) < ε. ¯ ¯ a ¯ 314 10. Integrale di Riemann 1/2 1/2 1 -1/2 f (t) = mant t − 1 2 Studiamo un esempio notevole che sarà utilizzato più avanti per dimostrare la formula di Stirling. La funzione f (t) = mant t − 1/2 ovviamente ha gli stessi punti di discontinuità della mantissa. Invece, la funzione ϕ(t) = 1 2 (mant t − 1/2) 2 (10.9.4) è continua ovunque in R. Infatti, per ogni m ∈ Z si ha ϕ(m) = 1/8 e 1 lim t→m− 2 µ ¶2 µ ¶2 1 1 1 1 mant t − = = lim mant t − . 2 8 x→m+ 2 2 Inoltre ϕ è derivabile in tutti punti non interi e si ha chiaramente ϕ0 (t) = f (t), per ogni t ∈ / Z. Possiamo quindi applicare il Teorema 10.9.1 ad ogni intervallo [a, b]. Si ha ¶ Z bµ ib 1h 1 2 . dt = (mant t − 1/2) mant t − 2 2 a a 1/8 1 ϕ(t) = 10.9.2 1 2 2 (mant t − 1/2) Formula di Taylor con resto integrale Dimostriamo un’ulteriore espressione per il resto Tn della formula di Taylor. Benché in questo caso si richiedano ipotesi più forti di quelle richieste per resto di Lagrange, la formula di Taylor con resto integrale è utile per le generalizzazioni a funzioni a valori vettoriali. Teorema 10.9.5 Sia f : [a, b] → R e siano x0 , x ∈ [a, b], ove x0 < x. Supponiamo che f sia derivabile n volte con derivata n−esima continua in [x0 , x] . 10.9. Appendice 315 Allora vale la formula (8.11.2) con Z (x − x0 )n 1 Tn (x − x0 ) = (1 − t)n−1 f (n) (x0 + t(x − x0 ))dt. (n − 1)! 0 Dimostrazione. Poniamo h = x − x0 e sia, per ogni t ∈ [0, 1], F (t) = n−1 X k=0 (1 − t)k hk (k) f (x0 + th). k! Si ha F (1) − F (0) = f (x0 + h) − n−1 X k=0 hk (k) f (x0 ). k! Poiché F è derivabile con derivata continua in [0, 1], si ha anche Z 1 F (1) − F (0) = F 0 (t)dt. (10.9.6) 0 Derivando F (t) e, successivamente, operando manipolazioni algebriche elementari sulle sommatorie, si ottiene F 0 (t) = − n−1 X k=1 n−1 X (1 − t)k hk+1 hk (1 − t)k−1 (k) f (x0 + th) + f (k+1) (x0 + th) (k − 1)! k! k=0 = hn (1 − t)n−1 f (n) (x0 + th). (n − 1)! La tesi segue da (10.9.2). 10.9.3 Confronto e esistenza degli integrali impropri I Teoremi 10.8.5 e 10.8.6 hanno dimostrazioni del tutto analoghe. Ci limitiamo a dimostrare il primo. Dimostrazione. a) Siano f e g come nelle ipotesi del Teorema 10.8.5, parte a). Sia {xn } una successione di punti tale che a < xn < b per ogni n e xn → a+ per Rb n → +∞. Poiché x g(t)dt ammette limite finito per x → a+, per ogni ε > 0 esiste n0 tale che per ogni m, n ≥ n0 ¯ ¯Z xm ¯ ¯¯Z b Z b ¯ ¯ ¯ ¯ ¯ ¯ ¯=¯ g(t)dt g(t) − g(t)dt ¯ < ε. ¯ ¯ ¯ ¯ xn xm xn Per tali valori di m e n si ha ¯Z ¯ ¯Z ¯ ¯Z x m ¯ Z b ¯ b ¯ ¯ xn ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ f (t)dt − f (t)dt = f (t)dt ≤ |f (t)| dt ¯ ¯ ¯ ¯ ¯ ¯ ¯ xm ¯ xn xm xn ¯Z x m ¯ ¯ ¯ ≤ ¯¯ g(t)dt¯¯ < ε. xn 316 10. Integrale di Riemann Rb Quindi la successione xn f (t)dt converge per n → +∞. Se {yn } è un’altra successione tale che a < yn < b per ogni n, e yn → a+ per n → +∞, si ha come sopra ¯Z ¯ ¯Z ¯ ¯ ¯¯Z b Z b Z b ¯ ¯ xn ¯ ¯ b ¯ ¯ ¯ ¯ ¯ ¯ f (t)dt − f (t)dt¯ ≤ ¯ g(t)dt¯¯ = ¯ g(t) − g(t)dt¯ → 0 ¯ ¯ yn ¯ ¯ ¯ xn yn yn xn Rb Rb per n → +∞. Quindi yn f (t)dt e xn f (t)dt convergono allo stesso limite. Ne Rb segue che a f (t)dt esiste. b) Siano f e g come nelle ipotesi del Teorema, parte b). Poiché f e g sono Rb Rb non negative, le funzioni x f (t)dt e x g(t)dt sono non crescenti quindi ambeRb due ammettono limite per x → a+. Poiché a f (t)dt non esiste, necessariamente Rb limx→a+ x f (t)dt = +∞. D’altra parte Z Z b b f (t)dt ≤ x da cui limx→a+ Rb x g(t)dt x g(t)dt = +∞. Se esiste l’integrale improprio di |f (t)|, per il Teorema appena dimostrato esiste quello di f (t). Viceversa, se esiste l’integrale improprio di f (t) non è detto che esista quello di |f (t)|. Si consideri il seguente esempio. Sia f (t) = mant t−1/2 e sia ϕ(t) la funzione R +∞ in (10.9.4). Esiste l’integrale improprio 1 f (t)t−1 dt ma non quello del suo valore assoluto. Infatti si ha, integrando per parti, · ¸x Z x Z x f (t) ϕ(t) ϕ(t) dt = + dt t t t2 1 1 1 Z x ϕ(x) 1 ϕ(t) = − + dt. x 8 t2 1 ϕ(t) è una t funzione continua per t 6= 0, e per ogni ogni t ∈ [1, x] non intero, si ha L’integrazione per parti è giustificata dal Teorema 10.9.1. Infatti D f (t) ϕ(t) ϕ(t) = − 2 . t t t Poiché |ϕ(t)| ≤ 1/8, per x → +∞ si ha che R +∞ Quindi esiste 1 f (t)t−1 dt. D’altra parte Z 1 n ϕ(x) → 0 e che x Z x 1 ϕ(t) dt converge. t2 n−1 n−1 X 1 Z k+1 |f (t)| 1X 1 dt ≥ |mant t − 1/2| dt = t k+1 k 2 k+1 k=1 k=1 10.9. Appendice 317 che diverge per n → +∞. Lo stesso ragionamento può essere utilizzato per mostrare che esiste l’integrale improprio Z +∞ sin t dt t 1 ma non quello del suo modulo. Infatti, · ¸x Z x Z x sin t cos t cos t dt = − + dt. t t t2 1 1 1 (10.9.7) Chiaramente il termine a destra in (10.9.7) tende a un limite finito per x → +∞. D’altra parte Z nπ 1 10.9.4 Z (k+1)π n−1 n−1 X |sin t| 1 2X 1 dt ≥ |sint| = . t (k + 1) π kπ π k+1 k=1 k=0 Formula di Wallis Teorema 10.9.8 (Formula di Wallis) Vale la seguente formula 1 n→+∞ 2n + 1 lim µ 2 · 4 · 6 · · · · · 2n 1 · 3 · 5 · · · · · (2n − 1) ¶2 = π . 2 (10.9.9) Dimostrazione. Per ogni k ≥ 0 intero poniamo Z π/2 Ik = sink xdx. 0 Calcoliamo Ik , ove k > 1, integrando per parti. Si ha £ ¤π/2 Ik = − cos x sink−1 x 0 + (k − 1) Z π/2 = (k − 1) Z π/2 0 Z π/2 sink−2 xdx − (k − 1) 0 cos2 x sink−2 xdx sink xdx. 0 Ne segue la formula ricorsiva Ik = k−1 Ik−2 . k Il calcolo di Ik è quindi ricondotto al calcolo di Z π/2 I0 = dx = 0 Z I1 = π , 2 π/2 sin dx = 1, 0 (10.9.10) 318 10. Integrale di Riemann a seconda che k sia pari o dispari. Supponiamo dapprima k = 2n. Iterando n volte la formula ricorsiva (10.9.10) si ottiene (2n − 1) · (2n − 3) · · · · · 3 · 1 I0 (2n) · (2n − 2) · · · · · 4 · 2 (2n − 1) · (2n − 3) · · · · · 3 · 1 π . = (2n) · (2n − 2) · · · · · 4 · 2 2 I2n = Se invece k = 2n + 1 si ha, con lo stesso procedimento, (2n) · (2n − 2) · · · · · 4 · 2 I1 (2n + 1) · (2n − 1) · · · · · 3 · 1 (2n) · (2n − 2) · · · · · 4 · 2 = . (2n + 1) · (2n − 1) · · · · · 3 · 1 I2n+1 = Ne segue I2n+1 1 = I2n 2n + 1 µ 2 · 4 · 6 · · · · · 2n 1 · 3 · 5 · · · · · (2n − 1) ¶2 2 . π (10.9.11) Si osservi ora che Ik+1 < Ik per ogni k ≥ 0. Tenendo conto di (10.9.10) si ha 2n + 1 I2n+2 I2n+1 I2n = < < = 1. 2n + 2 I2n I2n I2n Quindi limn→+∞ I2n+1 /I2n = 1. La tesi segue ora da (10.9.11). La formula di Wallis verrà utilizzata più avanti per dimostrare la formula di Stirling. A tal fine è opportuno riformulare la (10.9.9) in modo diverso. Notiamo anzitutto che 2 · 4 · 6 · · · · · 2n = 2n (1 · 2 · 3 · · · · · n) = 2n n! (2n − 1) · (2n − 3) · · · · · 3 · 1 = (2n)! (2n)! = n . 2 · 4 · 6 · · · · · (2n) 2 n! Quindi la (10.9.9) diviene 2 22n (n!) 1 lim √ = n→+∞ 2n + 1 2n! r π . 2 Passando ai logaritmi si ottiene à lim n→+∞ 2n log 2 + 2 n X k=1 2n X 1 log k log k − log(2n + 1) − 2 k=1 ! = 1 π log . 2 2 (10.9.12) 10.9. Appendice 10.9.5 319 Somme e integrali. Formula di Eulero Esiste unaR notevole relazione tra le somme parziali della serie x l’integrale 1 f (t)dt. P+∞ n=1 f (k) e Teorema 10.9.13 (di Eulero) Sia f : [0, +∞) → R, derivabile con derivata continua in [0, +∞). Allora, per ogni n ∈ N vale la seguente formula di Eulero n X Z n f (k) = f (t)dt + 1 k=1 1 (f (1) + f (n)) + 2 Z n (mant t − 1/2) f 0 (t)dt. (10.9.14) 1 Dimostrazione. Per ogni k ≥ 0 intero e per ogni t ∈ [k, k + 1) si ha mant t − 1/2 = t − k − 1/2. Integrando per parti si ottiene Z Z k+1 k+1 0 (mant t − 1/2) f (t)dt = k (t − k − 1/2) f 0 (t)dt k Z k+1 = [(t − k − 1/2) f (t)]k = 1 (f (k + 1) + f (k)) − 2 k+1 − Z f (t)dt k k+1 f (t)dt. k Sommando per k da 0 a n − 1 si ha Z n 1 Z n n−1 n−1 1X 1X (mant t − 1/2) f (t)dt = f (k + 1) + f (k) − f (t)dt 2 2 1 k=1 k=1 Z n n X 1 = f (k) − (f (1) + f (n)) − f (t)dt, 2 1 0 k=1 che equivale alla (10.9.14). Una P+∞conseguenza interessante è un criterio di convergenza per le serie del tipo n=1 f (k). Corollario 10.9.15 Sia f : [1, +∞) → R, derivabile con derivata continua in [1, +∞). Siano f e |f 0 |Pintegrabili in senso improprio in [1, +∞) e sia f (n) → 0 +∞ per n → +∞. Allora, n=1 f (k) converge e si ha +∞ X n=1 Z +∞ f (k) = 1 1 f (t)dt + f (1) + 2 Z +∞ (mant t − 1/2) f 0 (t)dt. 1 Dimostrazione. Si ha |(mant t − 1/2) f 0 (t)| ≤ 1 0 |f (t)| 2 (10.9.16) 320 10. Integrale di Riemann R +∞ e quindi 1 (mant t − 1/2) f 0 (t)dt esiste. Passando al limite per n → +∞ in (10.9.14) si ottiene la (10.9.16) La formula di Eulero può essere utilizzata anche per stimare il comportamento asintotico di somme parziali di serie divergenti. Poniamo ad esempio f (x) = 1/x. La (10.9.14) diviene Z n n X 1 1 (mant t − 1/2) = log n + − dt. k 2n t2 1 k=1 Sia Z +∞ γ= 1 Si ha Z 1 poiché n Z +∞ (mant t − 1/2) dt t2 n µ ¶ 1 , =γ+O 2n (mant t − 1/2) dt = γ − t2 ¯Z ¯ ¯ ¯ Quindi (mant t − 1/2) dt. t2 +∞ n ¯ Z (mant t − 1/2) ¯¯ 1 +∞ dt 1 = . ¯≤ 2 2 t2 t 2n n µ ¶ n X 1 1 1 = log n + +γ+O . k 2n 2n k=1 La costante γ prende il nome di costante di Eulero-Mascheroni. Il suo valore è γ = 0.5772 . . . Un’altra applicazione notevole della (10.9.14) consiste in una semplice dimostrazione della formula di Stirling, che svolgeremo nel prossimo sottoparagrafo. 10.9.6 Formula di Stirling Teorema 10.9.17 (Formula di Stirling) Per ogni intero n ≥ 1 intero vale la formula √ n! = nn e−n 2πn eθn /12n (10.9.18) ove |θn | ≤ 1. Dimostrazione. Dimostriamo la (10.9.18) in forma logaritmica, ovvero n X 1 θn 1 log n + log 2π + . (10.9.19) 2 2 12n k=1 Rx Scriviamo la (10.9.14) con f (t) = log t, ricordando che 1 log tdt = x log x − x. Si ha Z n n X 1 (mant t − 1/2) dt. (10.9.20) log k = n log n − n + 1 + log n + 2 t 1 k=1 log k = n log n − n + 10.9. Appendice 321 L’esistenza dell’integrale Z +∞ σ= 1 (mant t − 1/2) dt t (10.9.21) è stata dimostrata nella sottosezione 10.9.3. La (10.9.20) si può scrivere come Z +∞ n X 1 (mant t − 1/2) log k = n log n − n + 1 + log n + σ − dt. (10.9.22) 2 t n k=1 Procediamo alla valutazione di Z +∞ (mant t − 1/2) dt. t n (10.9.23) La generica primitiva di mant t − 1/2 (eccetto che nei punti interi) è la funzione 1 2 ϕ(t) + C = (mant t − 1/2) + C. 2 Scegliamo C = −1/12. Questa scelta della costante permette di ottenere agevolmente la migliore stima dell’integrale in (10.9.23). Integrando per parti si ha · ¸+∞ Z +∞ Z +∞ (mant t − 1/2) ϕ(t) − 1/12 ϕ(t) − 1/12 dt = + dt t t t2 n n n Z +∞ ϕ(t) − 1/12 1 + dt. =− 24n t2 n Poiché maxt |ϕ(t) − 1/12| = 1/8 − 1/12 = 1/24, si ha la stima ¯Z +∞ ¯ Z +∞ ¯ |ϕ(t) − 1/12| (mant t − 1/2) ¯¯ 1 ¯ dt¯ ≤ + dt ¯ t 24n t2 n n Z +∞ 1 1 dt ≤ + 24n 24 n t2 1 = . 12n Equivalentemente, possiamo scrivere Z +∞ (mant t − 1/2) θn dt = , ove |θn | ≤ 1. t 12n n (10.9.24) Rimane ora da calcolare l’integrale σ. Utilizziamo a tal fine la formula di Wallis nella forma equivalente (10.9.12). Le due sommatorie che appaiono a sinistra in (10.9.12) si esprimono mediante (10.9.20). Risulta 2 n X k=1 log k − 2n X log k = k=1 = −2n log 2 + 1 + 1 n log + 2 2 2 Z 1 n (mant t − 1/2) dt − t Z 1 2n (mant t − 1/2) dt. t 322 10. Integrale di Riemann Quindi n X 2n X 1 log k − log(2n + 1) − 2n log 2 + 2 log k = 2 k=1 k=1 Z n Z 2n 1 n (mant t − 1/2) (mant t − 1/2) = 1 + log +2 dt − dt 2 4n + 2 t t 1 1 (10.9.25) Poiché lim n→+∞ µ Z 2 1 n (mant t − 1/2) dt − t Z 1 2n ¶ (mant t − 1/2) dt = σ, t il termine in (10.9.25) tende a 1 − 12 log 4 + σ per n → +∞. In forza di (10.9.12) si ha quindi 1 σ = −1 + log 2π. (10.9.26) 2 Riunendo le formule (10.9.22), (10.9.24) e (10.9.26) si ottiene la (10.9.19).