1 I teoremi di Rolle e Lagrange In questa sezione si discute alcuni teoremi del calcolo differenziale che risalgono all’epoca in cui si gettava i fondamenti di tale teoria, non nel senso di fondamenti logici rigorosi, bensı́nel senso di fatti fondamentali e caratteristici delle funzioni studiate. In effetti, le dimostrazioni in senso rigoroso di taluni di questi fatti arrivavono con un secolo di ritardo rispetto l’epoca in cui erano giá ben noto ai fondatori del calcolo infinitesimale. Elenchiamo taluni di questi fatti: 1. Il teorema del valore intermediato: se f (x) é una funzione continua sull’intervallo chiuso [a, b] e tale che f (a) < 0 ed f (b) > 0 allora esiste c con a < c < b tale che f (c) = 0. 2. Il teorema della esistenza di massimi e minimi per funzioni continue su intervalli chiusi e limitati: se f (x) é una funzione continua sull’intervallo [a, b] allora esistono punti cm e cM con a ≤ cm ≤ b ed a ≤ cM ≤ b tale che f (x) assume il suo valore minimo nel punto cm e assume il suo valore massimo in cM . 3. Teorema di Rolle: se f (x) é continua sull’intervallo CHIUSO [a, b] ed é differenziabile (derivabile) sull’intervallo aperto ]a, b[= {x | a < x < b}, e se f (a) = f (b), allora esiste un punto c con a < c < b tale che f 0 (c) = 0. 4. Teorema di Lagrange: Se f (x) é continua sull’intervallo chiuso [a, b] ed é differenziabile sull’intervallo aperto ]a, b[, allora esiste un punto c con a < c < b tale per cui vale f 0 (c) = f (b) − f (a) . b−a Il primo fatto é ovvio (o almeno lo era per i fondatori del calcolo infinitesimale) se si considera la definizione intuitiva di funzione continua, ossia, una funzione di cui si puó tracciare il grafico senza togliere il gesso dalla lavagna (o la matita dalla carta). Anche il secondo fatto sembra ovvio in questo senso intuitivo: il grafico dovrebbe stare dentro un striscia orizzontale che sia la piú sottile possibile, ed allora il bordo inferiore di tale striscia definisce in minimo della funzione, e ogni punto dove il bordo inferiore della striscia incontra il grafico della funzione corrisponde ad un punto del tipo (cm , f (cm ) con cm come nella tesi. Si nota che non é affatto detto che cm (o cM ) sia unico. Lo stesso “ragionamento si applica pure al bordo superiore della striscia ed i punti cM in cui f (x) assume i suoi valori massimi. Ora il teorema di Rolle é pure esso quasi ovvio: basta scegliere un punto c interiore all’intervallo in cui f (x) assume il suo valore massimo (o minimo). Diciamo che (c, f (c) sia un massimo con a < c < b. Allora ogni quoziente incrementale in c calcolata per un punto x a sinistra di c dará x − c < 0 ed f (x) − f (c) < 0 poiché per ipotesi f (c) é un massimo per il valori di f (x), e dunque lim− x→c f (x) − f (c) ≤ 0. x−c 1 Nota che tale limite esiste per l’ipotesi che f (x) sia differenziabile sull’intervallo a < x < b. Ma per x > c si avrá x − c > 0 ed f (x) − f (c) < 0 onde lim+ x→c f (x) − f (c) ≥ 0. x−c Di nuovo il limite unilaterale da destra esiste per l’ipotese di differenziabilitá di f . Ma visto che addirittura il limite delle quozienti incrementali esiste in c, i due limiti unilaterali devono essere uguali, e questo é possibile solo se sono entrambi uguali ad 0. Per quanto riguarda il Teorema di Lagrange, a primo acchito esso sembra ostico e poco intuitivo. Peró, quando si interpreta il suo enunciato in termini geometrici, tutto diventa chiaro, sebbene non subito ovvio. In effetti (f (b) − f (a))/(b − a) non é altro che il coefficiente angolare della corda che congiunge i punti terminali (a, f (a)) ed (b, f (b)) del grafico della funzione y = f (x). In modo simile f 0 (c) é il coefficiente angolare della tangente alla grafica di f (x) nel punto (c, f (c)). Quindi, la tesi del Teorema di Lagrange dice che c’é sempre un punto c tra a e b in cui la tangente alla curva in c, f (c)) risulta parallela alla corda che congiunge i punti terminali. In questa ottica geometrica, poi, si nota che il Teorema di Lagrange é una generalizzazione del Teorema di Rolle, ossia che il Teorema di Rolle corrisponde al caso del Teorema di Lagrange in cui la corda che congiunge i punti terminali del grafico di f (x) é orizzontale. In effetti questa osservazione geometrica ci dá spunto per la dimostrazione del teorema di Lagrange. Possiamo ridurre il Teorema di Lagrange ad un’applicazione del (giá dimostrato) Teorema di Rolle tramite introduzione della funzione “misteriosa f (b) − f (a) (x − a) + f (a) . g(x) = f (x) − b−a Il mistero si scioglie subito quando si nota l’interpretazione geometrica di g(x) come la distanza (segnata) tra il grafico di f (x) e il grafico della corda che congiunge i punti terminali del grafico di f (x). Infatti, con tale interpretazione della funzione g(x) é ovvio che g(a) = g(b) = 0 (e chi preferisce una verifica algebrica di questi uguaglianze puó verifcarle subito dalla definizione di g(x)). Inoltre g(x) risulta differenziabile sull’intervallo aperto a < x < b per che f (x) lo é per ipotesi e la funzione che descrive la corda lo é pure, essendo ottentuta dalla funzione x da un cambio di variabile lineare. Dunque Rolle ci garantisce un punto c in cui g 0 (c) = 0 e traducendo questo in termini di f ci procura la tesi che si voleva dimostrare. Dunque, abbiamo dimostrato il Teorema di Rolle, e poi con esso abbiamo dimostrato il Teorema di Lagrange. Ma nella dimostrazione di Rolle abbiamo usato l’esistenza di un minimo o massimo per una funzione definita su un intervallo chiuso [a, b], il che é appunto il contenuto del punto 2) del nostro elenco di risultati fondamentali e classici. In effetti, la dimostrazione di 2) dipende dall’assiome del limite superiore minimo, il sup di un sotto-insieme limitato e 2 non-vuoto dei numeri reali, e coninvolge ragionamenti di un tipo diverso da quelli prettamente geometrici usati finora. Dimostriamo l’esistenza di un massimo, ma prima stabiliamo un lemma che si chiama il Teorema di Bolzano–Weierstraß. Definizione. Un numero p di un insieme di X ⊂ R si chiama un punto di accumulazione di X se ogni intervallo aperto di R che contiene p contiene un punto di X diverso da p. In effetti, si dimostra facilmente, che ogni intervallo aperto che contiene un punto di accumulazione p di X, contiene un infinitá di punti di X diversi da p. (Basta scegliere un intorno I1 ⊂ [p − 1, p + 1] di p e sceglie un primo punto x1 con x1 6= p ed x1 ∈ X, poi scegliere un secondo intorno I2 ⊂ [p − 1/2, p + 1/2] di p che non contiene x1 , ed un punto x2 ∈ I2 ∩ X, x2 6= p. Si continua in questo modo, scegliendo In ⊂ [p − 1/n, p + 1/n] come un intorno di p che con contiene nessuno dei punti x1 , . . . , xn−1 giá construiti, e pigliando xn 6= p, con xn ∈ In . Allora per costruzione la successione {xn } converge a p. Inoltre ogni intorno di p contiene un intervallo del tipo [p − , p + ] per qualche > 0, e dunque contiene tutti gli xn tale che 1/n < , il che é chiaramente un insieme infinito. Teorema 1 (Teorema di Bolzano–Weierstraß). Sia I = [a, b] un intervallo chiuso di R, e sia S un suo sottoinsieme infinito. Allora S possiede un punto di accumulazione in I. Dimostrazione. Poiché S é infinito, si ha che o [a, (a + b)/2] contiene un numero infinito di punti si S oppure [(a + b)/2, b] contiene un numero infinito di punti di S. Sia a1 il punto terminale a sinistra del intervallo I1 che contiene un numero infinito di punti di S e sia b1 il suo punto terminale a destra. (Se entrambi dei mezzo-intervalli contengono un numero infinito di punti, si sceglie, per concretezza, quello a sinistra.) Si ripete il ragionamente appena detto con l’intervallo I1 = [a1 , b1 ] per ottenere un nuovo intervallo I2 = [a2 , b2 ] di lunghezza (b − a)/4 che contiene un numero infinito di punti di S, e si va avanti cosı́, ottenendo una successione di intervalli “annidati {In = [an , bn ]} con (bn − an ) = (b − a)/2n . Chiaramene ogni an < b ed ogni bn > a. Inoltre si ha che a ≤ a1 ≤ · · · ≤ an ≤ · · · < b e b ≥ b1 ≥ . . . bn ≥ · · · a. Dunque, per l’assiome del limite superiore, esiste il supn {an }. Poniamo c = supn {an }. Allora, per ogni n si ha b ≥ c ≥ an . Un ragionamente analogo con i bn e inf n {bn } mostra che a ≤ inf {bn } ≤ bn ≤ bn−1 ≤ · · · ≤ b1 ≤ b n per ogni n, e si vede senza difficoltá (Esercizio!) che c = supn {an } = inf n {bn } Inoltre, c é un punto di accumulazione di S. Infatti, sia J un qualsiasi intorno 3 di c. Io sostengo che J ∩ [a, b] ⊃ [an , bn ] per n sufficientemente elevato. Infatti, in quanto J é intorno di c, si sa che esiste > 0 tale che ]c − , c + [⊂ J, ma per n tale che (b − a)/2n < /4, si ha che In ⊂ [c − , c + ] ⊂ J. Ma per costruzione In = [an , bn ] contiene un infinitá di punti di S, e dunque, a maqggior ragione, anche J ne contiene un infinitá, come si voleva dimostrare. É interessante che le dimostrazioni dei fatti 1) e 2), che, a priori sembrano piú ovvie dei Teoremi di Rolle e di Lagrange, richiedono ragionamenti meno semplici, ed addirittura piuttosto delicati, almeno se uno vuol qualcosa in piú che un dichiarazione della loro ovvietá. Per stabilire il Teorema del Valore Intermediato, dimostriamo un lemma, anche esso degno di un nome: il Lemma del Permanenza del Segno. Lemma 1 (Permanenza del Segno). Si f (x) continua nel punto x0 e sia f (x0 ) > 0. Allora f (x) > 0 per ogni x sufficientemente vicino ad x0 . Piú precisamente, esiste δ > 0 tale che f (x) > 0 qualora |x − x0 | < δ. Dimostrazione. Basta prendere = f (x0 )/2 nella definizione di limite: Per tale esiste un δ > 0 tale che |f (x) − f (x0 )| < = f (x0 )/2 qualora |x − x0 | < δ. Ma questo vuole dire esattamente che 3f (x0 ) f (x0 ) < f (x) < 2 2 per tali x, e questo stabilisce la tesi poiché per ipotesi f (x0 ) > 0. 4