NOTE SULLE FUNZIONI CONVESSE DI UNA VARIABILE REALE ROBERTO GIAMBÒ 1. D EFINIZIONI E PRIME PROPRIET À In queste note saranno presentate alcune proprietà principali delle funzioni convesse di una variabile reale, partendo dalla loro definizione. La prima cosa da osservare è che la convessità può essere definita senza far ricorso ad ipotesi di regolarità sulla funzione, come ad esempio la derivabilità, anche se vedremo che la convessità implica di per sé un certo grado di regolarità della funzione. Vedremo poi condizioni equivalenti alla convessità che sussistono sotto ipotesi più forti di regolarità sulla funzione. Definizione 1.1. Sia f : I ! R una funzione reale definita in un intervallo I ✓ R. Allora f si dice convessa in I se, 8x1 , x2 2 I, x1 6= x2 , (1) f ((1 t)x1 + tx2 ) (1 t)f (x1 ) + tf (x2 ), 8t 2 (0, 1). Se la proprietà espressa dalla relazione (1) vale con il verso della disuguaglianza ” ”, la funzione si dice concava1. Osservazione 1.2. La proprietà (1) esprime la condizione geometrica che, comunque scelti due punti distinti x1 , x2 2 I, i punti del grafico di f (x) tra x1 ed x2 non si trovano sopra il segmento di retta secante il grafico stesso, di estremi (x1 , f (x1 )) e (x2 , f (x2 )). Date: Versione del 18 settembre 2013. 1 Nel resto di queste note, ci occuperemo solo delle funzioni convesse. Osservando che f è concava se e solo se f è convessa, risultati e considerazioni analoghi a quelli che vedremo valgono, con opportune modifiche, anche per le funzioni concave. F IGURA 1. Un esempio di funzione non convessa (ma neanche concava!). Pur esistendo segmenti secanti che non hanno punti sotto il grafico di f (x) – in verde, nella figura – esiste almeno un esempio di segmento secante tale per cui il grafico di f (x) ha dei punti sopra tale retta – in rosso, nella figura. 1 2 R. GIAMBÒ F IGURA 2. Gli esempi dell’Osservazione 1.3. Una funzione convessa non è necessariamente derivabile ovunque (vedi esempio a sinistra), e nemmeno ovunque continua (vedi esempio a destra). Quindi, è immediato constatare che la condizione di convessità si esprime equivalentemente come segue: (2) f (x) f (x1 ) + f (x2 ) x2 f (x1 ) (x x1 x1 ), 8x1 , x2 2 I, x1 < x2 , 8x 2 (x1 , x2 ). Osservazione 1.3. Una funzione convessa non è necessariamente derivabile in tutto il dominio: si consideri ad esempio f (x) = |x| (vedi Figura 2). Inoltre, se l’intervallo di definizione contiene punti di frontiera, la funzione può anche non essere continua in tali punti: si consideri ad esempio la funzione g(x) : [0, 1] ! R, 8 <1, x 2 {0, 1}, g(x) = :0, x 2 (0, 1). Vedremo però tra poco che la convessità implica almeno la continuità nei punti interni del dominio (Corollario 1.5). Preso x1 < x2 , osserviamo che la condizione (2) è equivalente alla seguente (3) f (x) x f (x1 ) f (x2 ) x1 x2 f (x1 ) , x1 8x, x1 , x2 2 I, x1 < x < x2 f (x2 ) , x2 8x, x1 , x2 2 I, x1 < x < x2 . oppure, permutando x1 e x2 nella (2), (4) f (x) x f (x2 ) x2 f (x1 ) x1 Per l’arbitrarietà dei punti scelti, la condizione (3) esprime la proprietà che, fissato x0 , l’applicazione f (x) f (x0 ) x 7! x x0 che manda x nel rapporto incrementale di f in x0 , calcolato in x, è crescente a destra di x0 (cioè per x > x0 ). Analogamente, la condizione (4) esprime la proprietà che la medesima applicazione è crescente a sinistra di x0 . Ricordando che le funzioni monotone ammettono sempre limiti laterali, questo significa che i limiti laterali del rapporto incrementale di una funzione convessa esistono sempre. FUNZIONI CONVESSE 3 Inoltre, usando di nuovo la (2), si ha, per x 2 (x1 , x2 ), (x2 x1 )f (x) (x2 x1 )f (x1 )+(f (x2 ) f (x1 ))(x x1 ) = (x2 x)f (x1 )+(x x1 )f (x2 ) ) (x2 x1 )f (x) (x2 x)f (x) + (x ) (x2 x)(f (x) x)f (x1 ) + (x f (x1 )) (x x1 )f (x2 ) x1 )(f (x2 ) f (x)), da cui la proprietà (sostituendo x con x0 ) (5) f (x1 ) x1 f (x0 ) f (x2 ) x0 x2 f (x0 ) , x0 8x0 , x1 , x2 2 I, x1 < x0 < x2 che esprime la proprietà che l’applicazione rapporto incrementale di f in x0 assume a sinistra di x0 valori non superiori di quelli che assume a destra. Quindi, se il punto x0 è interno all’intervallo I di definizione della funzione, il limite destro del rapporto incrementale di f in x0 (che esiste, per quanto detto poco fa) è limitato dal basso da un qualunque valore del rapporto incrementale per x < x0 , e dunque è finito. Analogamente, il limite sinistro del rapporto incrementale di f in x0 è limitato dall’alto da un qualunque valore del rapporto incrementale per x > x0 , e dunque è finito anch’esso. La seguente proposizione riassume quanto appena dimostrato. Proposizione 1.4. Sia f : I ! R convessa. Allora, se x0 è un punto interno ad I, esistono la derivata destra e sinistra di f in x0 , e si ha f+0 (x0 ) f 0 (x0 ). Se x0 è un punto di frontiera per I, il limite del rapporto incrementale per x ! x0 esiste sempre, ma può non essere finito. Dalla proposizione 1.4 discende immediatamente il seguente Corollario 1.5. Una funzione convessa f : I ! R è continua nei punti interni ad I. Dimostrazione. Si usa un argomento analogo a quello necessario per provare che una funzione derivabile è continua. Sia x0 un punto interno ad I: esistendo allora le derivate laterali di f 0 in x0 possiamo dire che, ad esempio, lim+ x!x0 f (x) x f (x0 ) = f+0 (x0 ) 2 R x0 e quindi (6) f (x) f (x0 ) = f+0 (x0 )(x x0 ) + q(x)(x x0 ), con limx!x+0 q(x) = 0. Passando al limite per x ! x+ f (x) = 0 nella (6) si ottiene limx!x+ 0 f (x0 ). Analogamente si ragiona a sinistra di x0 . ⇤ Osservazione 1.6. Si noti che la Proposizione 1.4 non ci dice che f è derivabile nei punti interni di I: le derivate laterali, infatti, possono non coincidere (si ripensi nuovamente all’esempio f (x) = |x|, per x0 = 0). Tuttavia, è possibile dimostrare il seguente risultato: se f : I ! R è convessa, allora l’insieme dei punti in cui f non è derivabile è al più numerabile. La dimostrazione di questo fatto si trova in appendice a queste note. 4 R. GIAMBÒ Esercizio 1.7. Se f : I ! R è una funzione convessa (non necessariamente derivabile su tutto I) che ammette un minimo relativo, allora si provi che esso è anche il minimo assoluto di f . 2. C ONVESSIT À E DERIVABILIT À Supponiamo ora che f una funzione reale definita in un intervallo aperto (a, b) ✓ R (non necessariamente limitato), e che f (x) sia derivabile in tutti i punti di (a, b). Allora è possibile caratterizzare la proprietà di convessità di f in (a, b) in due modi diversi. Vediamoli. Teorema 2.1. Sia f (x) : (a, b) ! R derivabile. Allora, le seguenti tre proprietà sono equivalenti: (a) f (x) è convessa in (a, b); (b) f 0 (x) è crescente in (a, b); (c) f (x) f (x0 ) + f 0 (x0 )(x x0 ), 8x, x0 2 (a, b). Dimostrazione. Dimostreremo che (a) , (c) e che (b) , (c). Si noti che la (c) esprime la nota condizione che il grafico di f (x) non si trova mai al di sotto della tangente al grafico stesso in un qualunque suo punto. (a) ) (c): Dalla condizione (3) si ottiene, passando al limite nel primo membro per x ! x+ 1 , che 0 f (x1 )(x2 x1 ) f (x2 ) f (x1 ) se x1 < x2 per cui, rinominando x1 e x2 come x0 e x rispettivamente, si ottiene la (c) nel caso x0 < x. Dalla (4) si ottiene invece, passando sempre nel primo membro al limite per x ! x2 , che f 0 (x2 )(x2 x1 ) f (x2 ) f (x1 ) se x1 < x2 , da cui, rinominando x1 e x2 come x e x0 rispettivamente, si ottiene la condizione (c) per x < x0 . (c) ) (a): Sia x1 < x2 , e x0 2 (x1 , x2 ). Sia t(x) la retta tangente al grafico di f in x0 (quindi t(x) = f (x0 ) + f 0 (x0 )(x x0 )) e sia s(x) la secante da x1 a x2 (per cui s(x) = f (x1 ) + f (x2 ) f (x1 ) (x x1 )). Allora s(x1 ) = f (x1 ) per costruzione, e f (x1 ) t(x1 ) per l’ipotesi (c), x2 x1 da cui s(x1 ) t(x1 ). Analogamente s(x2 ) t(x2 ). Ma s(x) e t(x) sono rette, dunque se s t in x1 e in x2 , dovrà essere s(x) t(x), 8x 2 [x1 , x2 ] e dunque anche s(x0 ) t(x0 ). Ma t(x0 ) = f (x0 ) per costruzione, dunque abbiamo provato che s(x0 ) f (x0 ), cioè che in x0 il grafico della f non sta sopra la retta secante. Per l’arbitrarietà di x0 , tale proprietà vale per qualunque x0 2 (x1 , x2 ), comunque scelti i punti x1 < x2 , per cui la f è convessa. (b) ) (c): Sia x > x0 . Dal teorema di Lagrange 9⇠ 2 (x0 , x) tale che f (x)x fx0(x0 ) = f 0 (⇠) f 0 (x0 ), dove nell’ultima disuguaglianza si sfrutta l’ipotesi (b), ottenendo la (c) quando x > x0 . Si ragiona analogamente quando x < x0 . (c) ) (b): Dall’ipotesi si ottiene, considerando due punti x1 e x2 : FUNZIONI CONVESSE 5 f (x1 ) f (x2 ) + f 0 (x2 )(x1 x2 ) f (x2 ) f (x1 ) + f 0 (x1 )(x2 x1 ). Sommando membro a membro e semplificando si ha (f 0 (x2 ) f 0 (x1 ))(x1 x2 ) 0, ⇤ da cui il fatto che, quando x1 < x2 , f 0 (x1 ) f 0 (x2 ). Esercizio 2.2. Sia f : (a, b) ! R una funzione convessa e derivabile, e sia x0 un punto critico per f . Si provi che x0 è un punto di minimo globale. Come corollario del Teorema 2.1 si ottiene una ben nota caratterizzazione delle funzioni convesse nel caso in cui esse siano derivabili due volte. Corollario 2.3. Sia f : (a, b) ! R derivabile due volte. Allora f è convessa in (a, b) se e solo se f 00 (x) 0, 8x 2 (a, b). Dimostrazione. Per ipotesi f è derivabile quindi, dal Teorema 2.1, f è convessa se e solo se f 0 (x) è crescente. D’altra parte, essendo f 0 (x) derivabile una volta per ipotesi, il criterio di monotonia per funzioni derivabili ci dice che f 0 (x) è crescente se e solo se (f 0 )0 (x) 0, cioè se e solo se f 00 (x) 0. ⇤ 3. C ONVESSIT À STRETTA Iniziamo con il definire il concetto di convessità stretta. Una funzione qualunque f : I ! R definita in un intervallo I ✓ R, è detta strettamente convessa in I se la disuguaglianza (1) è stretta, indipendentemente dalla scelta dei due punti distinti x1 , x2 2 I. Analogamente si definiscono le funzioni strettamente concave. Osservazione 3.1. Se f : (a, b) ! R è derivabile allora la convessità stretta è equivalente a dire che f 0 (x) è strettamente crescente in (a, b), ed entrambe le condizioni sono equivalenti a dire che (7) f (x) > f (x0 ) + f 0 (x0 )(x x0 ), 8x, x0 2 (a, b), x 6= x0 . L’argomento da usare per provare l’equivalenza di queste tre proprietà è lo stesso di quello usato nel Teorema 2.1, con opportune modifiche. Si noti in particolare che, per provare l’analogo di (a))(c), occorre prima enunciare l’analogo della (3) nel caso di stretta convessità, che è f (x) f (x1 ) f (x2 ) f (x1 ) (8) < , 8x, x1 , x2 2 I, x1 < x < x2 x x1 x2 x1 ed osservare che, nel passaggio al limite per x ! x+ 1 , si ha (9) f (x) x f (x1 ) x1 inf x>x1 f (x) x f (x1 ) f (x) = lim x!x1 x1 x f (x1 ) = f+0 (x1 ), x1 6 R. GIAMBÒ dove la prima uguaglianza nella (9) dipende dal fatto che il rapporto incrementale è una funzione monotona (vedi Proposizione 1.4). Perciò, usando (8) e (9) si ottiene la condizione con la disuguaglianza stretta, cioè la (7) nel caso x > x0 . Analogamente si ragiona nel caso x < x0 , usando l’analogo della (4) nel caso di stretta convessità. Il resto dell’argomento può essere ripetuto come nel Teorema 2.1, usando le disuguaglianze strette in luogo di quelle larghe. Esercizio 3.2. Sia f : (a, b) ! R è strettamente convessa e derivabile. Si provi che f ammette al più un punto critico. Usare l’esercizio 2.2 per provare che se questo punto esiste, esso è (l’unico) punto di minimo assoluto per f . Osservazione 3.3. Sia f : (a, b) ! R derivabile due volte. Se la derivata seconda è strettamente positiva, f 00 (x) > 0, allora f 0 è strettamente crescente e quindi f è strettamente convessa (vedi Osservazione 3.1). Ma questa è solo una condizione sufficiente, non necessaria, per avere f strettamente convessa: si prenda ad esempio f (x) = x4 che è due volte derivabile e strettamente convessa, ma la cui derivata seconda si annulla per x = 0. Usando però il criterio di monotonia stretta di una funzione, se f : (a, b) ! R è due volte derivabile, si può provare che la convessità stretta equivale alla condizione seguente: f 00 (x) 0 in (a, b) e non esiste alcun intervallo contenuto in (a, b) nel quale f 00 (x) si annulla identicamente. A PPENDICE A. D ERIVABILIT À DI FUNZIONI CONVESSE In questa sezione dimostreremo il Teorema enunciato nell’Osservazione 1.6. Teorema A.1. Se f : I ! R è convessa, allora l’insieme dei punti in cui f non è derivabile è al più numerabile. Dimostrazione. Anzitutto, senza perdità di generalità si può supporre che I sia un intervallo aperto. Sia allora g(x) = f+0 (x) f 0 (x) l’applicazione che associa ad un punto la differenza tra le derivate laterali calcolate in quel punto (le quali esistono grazie alla Proposizione 1.4), differenza che per la convessità di f è non negativa. Si proverà che l’insieme A = {x 2 I : g(x) > 0} è al più numerabile. Dividiamo la dimostrazione in passi. (1) Fissato un qualunque intervallo chiuso e limitato [a, b] ⇢ I, e un qualunque n 2 N positivo, allora l’insieme ⇢ 1 n Aa,b = x 2 [a, b] : g(x) > n contiene un numero finito di punti. Infatti, fissati [a, b] ed n, supponiamo per assurdo che esista una successione infinita xj 2 Ana,b , e ordiniamo gli xj in modo tale che la successione sia strettamente crescente. Detto k un numero intero tale che (10) k > n(f 0 (b) f+0 (a)), FUNZIONI CONVESSE 7 consideriamo l’insieme di punti {xj }j=1,...,k . Allora, la convessità implica che f+0 (a) f 0 (x1 ) f+0 (x1 ) f 0 (x2 ) f+0 (x2 ) . . . f 0 (xk ) f+0 (xk ) f 0 (b), e quindi da ciò segue che (11) 0 f (b) f+0 (a) k X (f+0 (xk ) 0 f (xk )) = j=1 k X g(xj ) > k/ n, j=1 dove nell’ultima disuguaglianza si è sfruttato il fatto che g(xj ) > 1/n. Dal confronto tra (10) e (11) si ottiene una contraddizione. (2) Fissato un qualunque intervallo chiuso e limitato [a, b] 2 I, l’insieme Aa,b = {x 2 [a, b] : g(x) > 0} è al più numerabile. Infatti si osserva subito che Aa,b = 1 [ Ana,b n=1 e dunque è unione numerabile di insiemi finiti, per cui è al più numerabile. A questo punto siamo in grado di provare l’ultimo passo, e cioè (3) l’insieme A = {x 2 I : g(x) > 0} è al più numerabile. Basta osservare che un qualunque intervallo aperto I può essere visto come unione numerabile di intervalli chiusi e limitati (ad esempio, se I = (a, b), allora I = 1 1 [1 ]). Poiché su ciascuno di questi intervalli chiusi l’insieme dei punti n=1 [a + n , b n tali che f non è derivabile è al più numerabile, allora anche A, che è l’unione di tutti questi insiemi di punti in cui f non è derivabile, sarà al più numerabile. ⇤ Esercizio A.2. Sfruttando un argomento simile a quello usato nella dimostrazione del Teorema A.1, mostrare che, data una funzione monotona f : I ! R, l’insieme dei punti in cui f non è continua è al più numerabile.