NOTE SULLE FUNZIONI CONVESSE DI UNA VARIABILE REALE In

NOTE SULLE FUNZIONI CONVESSE DI UNA VARIABILE REALE
ROBERTO GIAMBÒ
1. D EFINIZIONI E PRIME PROPRIET À
In queste note saranno presentate alcune proprietà principali delle funzioni convesse di
una variabile reale, partendo dalla loro definizione. La prima cosa da osservare è che la
convessità può essere definita senza far ricorso ad ipotesi di regolarità sulla funzione, come
ad esempio la derivabilità, anche se vedremo che la convessità implica di per sé un certo
grado di regolarità della funzione. Vedremo poi condizioni equivalenti alla convessità che
sussistono sotto ipotesi più forti di regolarità sulla funzione.
Definizione 1.1. Sia f : I ! R una funzione reale definita in un intervallo I ✓ R. Allora f
si dice convessa in I se, 8x1 , x2 2 I, x1 6= x2 ,
(1)
f ((1
t)x1 + tx2 )  (1
t)f (x1 ) + tf (x2 ),
8t 2 (0, 1).
Se la proprietà espressa dalla relazione (1) vale con il verso della disuguaglianza ” ”, la
funzione si dice concava1.
Osservazione 1.2. La proprietà (1) esprime la condizione geometrica che, comunque scelti
due punti distinti x1 , x2 2 I, i punti del grafico di f (x) tra x1 ed x2 non si trovano sopra il
segmento di retta secante il grafico stesso, di estremi (x1 , f (x1 )) e (x2 , f (x2 )).
Date: Versione del 18 settembre 2013.
1
Nel resto di queste note, ci occuperemo solo delle funzioni convesse. Osservando che f è concava se e solo
se f è convessa, risultati e considerazioni analoghi a quelli che vedremo valgono, con opportune modifiche,
anche per le funzioni concave.
F IGURA 1. Un esempio di funzione non convessa (ma neanche concava!).
Pur esistendo segmenti secanti che non hanno punti sotto il grafico di f (x)
– in verde, nella figura – esiste almeno un esempio di segmento secante tale
per cui il grafico di f (x) ha dei punti sopra tale retta – in rosso, nella figura.
1
2
R. GIAMBÒ
F IGURA 2. Gli esempi dell’Osservazione 1.3. Una funzione convessa non
è necessariamente derivabile ovunque (vedi esempio a sinistra), e nemmeno
ovunque continua (vedi esempio a destra).
Quindi, è immediato constatare che la condizione di convessità si esprime equivalentemente come segue:
(2)
f (x)  f (x1 ) +
f (x2 )
x2
f (x1 )
(x
x1
x1 ),
8x1 , x2 2 I, x1 < x2 , 8x 2 (x1 , x2 ).
Osservazione 1.3. Una funzione convessa non è necessariamente derivabile in tutto il dominio: si consideri ad esempio f (x) = |x| (vedi Figura 2). Inoltre, se l’intervallo di definizione contiene punti di frontiera, la funzione può anche non essere continua in tali punti: si
consideri ad esempio la funzione g(x) : [0, 1] ! R,
8
<1, x 2 {0, 1},
g(x) =
:0, x 2 (0, 1).
Vedremo però tra poco che la convessità implica almeno la continuità nei punti interni del
dominio (Corollario 1.5).
Preso x1 < x2 , osserviamo che la condizione (2) è equivalente alla seguente
(3)
f (x)
x
f (x1 )
f (x2 )

x1
x2
f (x1 )
,
x1
8x, x1 , x2 2 I, x1 < x < x2
f (x2 )
,
x2
8x, x1 , x2 2 I, x1 < x < x2 .
oppure, permutando x1 e x2 nella (2),
(4)
f (x)
x
f (x2 )
x2
f (x1 )
x1
Per l’arbitrarietà dei punti scelti, la condizione (3) esprime la proprietà che, fissato x0 ,
l’applicazione
f (x) f (x0 )
x 7!
x x0
che manda x nel rapporto incrementale di f in x0 , calcolato in x, è crescente a destra di x0
(cioè per x > x0 ). Analogamente, la condizione (4) esprime la proprietà che la medesima
applicazione è crescente a sinistra di x0 . Ricordando che le funzioni monotone ammettono
sempre limiti laterali, questo significa che i limiti laterali del rapporto incrementale di una
funzione convessa esistono sempre.
FUNZIONI CONVESSE
3
Inoltre, usando di nuovo la (2), si ha, per x 2 (x1 , x2 ),
(x2 x1 )f (x)  (x2 x1 )f (x1 )+(f (x2 ) f (x1 ))(x x1 ) = (x2 x)f (x1 )+(x x1 )f (x2 )
) (x2
x1 )f (x)  (x2
x)f (x) + (x
) (x2
x)(f (x)
x)f (x1 ) + (x
f (x1 ))  (x
x1 )f (x2 )
x1 )(f (x2 )
f (x)),
da cui la proprietà (sostituendo x con x0 )
(5)
f (x1 )
x1
f (x0 )
f (x2 )

x0
x2
f (x0 )
,
x0
8x0 , x1 , x2 2 I, x1 < x0 < x2
che esprime la proprietà che l’applicazione rapporto incrementale di f in x0 assume a sinistra
di x0 valori non superiori di quelli che assume a destra. Quindi, se il punto x0 è interno
all’intervallo I di definizione della funzione, il limite destro del rapporto incrementale di f
in x0 (che esiste, per quanto detto poco fa) è limitato dal basso da un qualunque valore del
rapporto incrementale per x < x0 , e dunque è finito. Analogamente, il limite sinistro del
rapporto incrementale di f in x0 è limitato dall’alto da un qualunque valore del rapporto
incrementale per x > x0 , e dunque è finito anch’esso. La seguente proposizione riassume
quanto appena dimostrato.
Proposizione 1.4. Sia f : I ! R convessa. Allora, se x0 è un punto interno ad I, esistono la
derivata destra e sinistra di f in x0 , e si ha f+0 (x0 ) f 0 (x0 ). Se x0 è un punto di frontiera
per I, il limite del rapporto incrementale per x ! x0 esiste sempre, ma può non essere
finito.
Dalla proposizione 1.4 discende immediatamente il seguente
Corollario 1.5. Una funzione convessa f : I ! R è continua nei punti interni ad I.
Dimostrazione. Si usa un argomento analogo a quello necessario per provare che una funzione derivabile è continua. Sia x0 un punto interno ad I: esistendo allora le derivate laterali
di f 0 in x0 possiamo dire che, ad esempio,
lim+
x!x0
f (x)
x
f (x0 )
= f+0 (x0 ) 2 R
x0
e quindi
(6)
f (x)
f (x0 ) = f+0 (x0 )(x
x0 ) + q(x)(x
x0 ),
con limx!x+0 q(x) = 0. Passando al limite per x ! x+
f (x) =
0 nella (6) si ottiene limx!x+
0
f (x0 ). Analogamente si ragiona a sinistra di x0 .
⇤
Osservazione 1.6. Si noti che la Proposizione 1.4 non ci dice che f è derivabile nei punti
interni di I: le derivate laterali, infatti, possono non coincidere (si ripensi nuovamente all’esempio f (x) = |x|, per x0 = 0). Tuttavia, è possibile dimostrare il seguente risultato:
se f : I ! R è convessa, allora l’insieme dei punti in cui f non è derivabile è al più
numerabile. La dimostrazione di questo fatto si trova in appendice a queste note.
4
R. GIAMBÒ
Esercizio 1.7. Se f : I ! R è una funzione convessa (non necessariamente derivabile su
tutto I) che ammette un minimo relativo, allora si provi che esso è anche il minimo assoluto
di f .
2. C ONVESSIT À E DERIVABILIT À
Supponiamo ora che f una funzione reale definita in un intervallo aperto (a, b) ✓ R (non
necessariamente limitato), e che f (x) sia derivabile in tutti i punti di (a, b). Allora è possibile
caratterizzare la proprietà di convessità di f in (a, b) in due modi diversi. Vediamoli.
Teorema 2.1. Sia f (x) : (a, b) ! R derivabile. Allora, le seguenti tre proprietà sono
equivalenti:
(a) f (x) è convessa in (a, b);
(b) f 0 (x) è crescente in (a, b);
(c) f (x) f (x0 ) + f 0 (x0 )(x x0 ), 8x, x0 2 (a, b).
Dimostrazione. Dimostreremo che (a) , (c) e che (b) , (c). Si noti che la (c) esprime la
nota condizione che il grafico di f (x) non si trova mai al di sotto della tangente al grafico
stesso in un qualunque suo punto.
(a) ) (c):
Dalla condizione (3) si ottiene, passando al limite nel primo membro per x ! x+
1 , che
0
f (x1 )(x2 x1 )  f (x2 ) f (x1 ) se x1 < x2 per cui, rinominando x1 e x2 come x0 e
x rispettivamente, si ottiene la (c) nel caso x0 < x. Dalla (4) si ottiene invece, passando
sempre nel primo membro al limite per x ! x2 , che f 0 (x2 )(x2 x1 ) f (x2 ) f (x1 ) se
x1 < x2 , da cui, rinominando x1 e x2 come x e x0 rispettivamente, si ottiene la condizione
(c) per x < x0 .
(c) ) (a):
Sia x1 < x2 , e x0 2 (x1 , x2 ). Sia t(x) la retta tangente al grafico di f in x0 (quindi
t(x) = f (x0 ) + f 0 (x0 )(x x0 )) e sia s(x) la secante da x1 a x2 (per cui s(x) = f (x1 ) +
f (x2 ) f (x1 )
(x x1 )). Allora s(x1 ) = f (x1 ) per costruzione, e f (x1 ) t(x1 ) per l’ipotesi (c),
x2 x1
da cui s(x1 ) t(x1 ). Analogamente s(x2 ) t(x2 ). Ma s(x) e t(x) sono rette, dunque se
s t in x1 e in x2 , dovrà essere s(x) t(x), 8x 2 [x1 , x2 ] e dunque anche s(x0 ) t(x0 ).
Ma t(x0 ) = f (x0 ) per costruzione, dunque abbiamo provato che s(x0 ) f (x0 ), cioè che in
x0 il grafico della f non sta sopra la retta secante. Per l’arbitrarietà di x0 , tale proprietà vale
per qualunque x0 2 (x1 , x2 ), comunque scelti i punti x1 < x2 , per cui la f è convessa.
(b) ) (c):
Sia x > x0 . Dal teorema di Lagrange 9⇠ 2 (x0 , x) tale che f (x)x fx0(x0 ) = f 0 (⇠) f 0 (x0 ),
dove nell’ultima disuguaglianza si sfrutta l’ipotesi (b), ottenendo la (c) quando x > x0 . Si
ragiona analogamente quando x < x0 .
(c) ) (b):
Dall’ipotesi si ottiene, considerando due punti x1 e x2 :
FUNZIONI CONVESSE
5
f (x1 )
f (x2 ) + f 0 (x2 )(x1
x2 )
f (x2 )
f (x1 ) + f 0 (x1 )(x2
x1 ).
Sommando membro a membro e semplificando si ha
(f 0 (x2 )
f 0 (x1 ))(x1
x2 )  0,
⇤
da cui il fatto che, quando x1 < x2 , f 0 (x1 )  f 0 (x2 ).
Esercizio 2.2. Sia f : (a, b) ! R una funzione convessa e derivabile, e sia x0 un punto
critico per f . Si provi che x0 è un punto di minimo globale.
Come corollario del Teorema 2.1 si ottiene una ben nota caratterizzazione delle funzioni
convesse nel caso in cui esse siano derivabili due volte.
Corollario 2.3. Sia f : (a, b) ! R derivabile due volte. Allora f è convessa in (a, b) se e
solo se f 00 (x) 0, 8x 2 (a, b).
Dimostrazione. Per ipotesi f è derivabile quindi, dal Teorema 2.1, f è convessa se e solo
se f 0 (x) è crescente. D’altra parte, essendo f 0 (x) derivabile una volta per ipotesi, il criterio
di monotonia per funzioni derivabili ci dice che f 0 (x) è crescente se e solo se (f 0 )0 (x) 0,
cioè se e solo se f 00 (x) 0.
⇤
3. C ONVESSIT À STRETTA
Iniziamo con il definire il concetto di convessità stretta. Una funzione qualunque f : I !
R definita in un intervallo I ✓ R, è detta strettamente convessa in I se la disuguaglianza (1)
è stretta, indipendentemente dalla scelta dei due punti distinti x1 , x2 2 I. Analogamente si
definiscono le funzioni strettamente concave.
Osservazione 3.1. Se f : (a, b) ! R è derivabile allora la convessità stretta è equivalente a
dire che f 0 (x) è strettamente crescente in (a, b), ed entrambe le condizioni sono equivalenti
a dire che
(7)
f (x) > f (x0 ) + f 0 (x0 )(x
x0 ),
8x, x0 2 (a, b), x 6= x0 .
L’argomento da usare per provare l’equivalenza di queste tre proprietà è lo stesso di quello
usato nel Teorema 2.1, con opportune modifiche. Si noti in particolare che, per provare l’analogo di (a))(c), occorre prima enunciare l’analogo della (3) nel caso di stretta convessità,
che è
f (x) f (x1 )
f (x2 ) f (x1 )
(8)
<
, 8x, x1 , x2 2 I, x1 < x < x2
x x1
x2 x1
ed osservare che, nel passaggio al limite per x ! x+
1 , si ha
(9)
f (x)
x
f (x1 )
x1
inf
x>x1
f (x)
x
f (x1 )
f (x)
= lim
x!x1
x1
x
f (x1 )
= f+0 (x1 ),
x1
6
R. GIAMBÒ
dove la prima uguaglianza nella (9) dipende dal fatto che il rapporto incrementale è una
funzione monotona (vedi Proposizione 1.4). Perciò, usando (8) e (9) si ottiene la condizione
con la disuguaglianza stretta, cioè la (7) nel caso x > x0 . Analogamente si ragiona nel caso
x < x0 , usando l’analogo della (4) nel caso di stretta convessità. Il resto dell’argomento può
essere ripetuto come nel Teorema 2.1, usando le disuguaglianze strette in luogo di quelle
larghe.
Esercizio 3.2. Sia f : (a, b) ! R è strettamente convessa e derivabile. Si provi che f
ammette al più un punto critico. Usare l’esercizio 2.2 per provare che se questo punto esiste,
esso è (l’unico) punto di minimo assoluto per f .
Osservazione 3.3. Sia f : (a, b) ! R derivabile due volte. Se la derivata seconda è strettamente positiva, f 00 (x) > 0, allora f 0 è strettamente crescente e quindi f è strettamente
convessa (vedi Osservazione 3.1). Ma questa è solo una condizione sufficiente, non necessaria, per avere f strettamente convessa: si prenda ad esempio f (x) = x4 che è due volte
derivabile e strettamente convessa, ma la cui derivata seconda si annulla per x = 0. Usando
però il criterio di monotonia stretta di una funzione, se f : (a, b) ! R è due volte derivabile,
si può provare che la convessità stretta equivale alla condizione seguente: f 00 (x) 0 in (a, b)
e non esiste alcun intervallo contenuto in (a, b) nel quale f 00 (x) si annulla identicamente.
A PPENDICE A. D ERIVABILIT À DI FUNZIONI CONVESSE
In questa sezione dimostreremo il Teorema enunciato nell’Osservazione 1.6.
Teorema A.1. Se f : I ! R è convessa, allora l’insieme dei punti in cui f non è derivabile
è al più numerabile.
Dimostrazione. Anzitutto, senza perdità di generalità si può supporre che I sia un intervallo
aperto. Sia allora g(x) = f+0 (x) f 0 (x) l’applicazione che associa ad un punto la differenza
tra le derivate laterali calcolate in quel punto (le quali esistono grazie alla Proposizione 1.4),
differenza che per la convessità di f è non negativa. Si proverà che l’insieme
A = {x 2 I : g(x) > 0}
è al più numerabile. Dividiamo la dimostrazione in passi.
(1) Fissato un qualunque intervallo chiuso e limitato [a, b] ⇢ I, e un qualunque n 2 N
positivo, allora l’insieme
⇢
1
n
Aa,b = x 2 [a, b] : g(x) >
n
contiene un numero finito di punti.
Infatti, fissati [a, b] ed n, supponiamo per assurdo che esista una successione infinita xj 2 Ana,b , e ordiniamo gli xj in modo tale che la successione sia strettamente
crescente. Detto k un numero intero tale che
(10)
k > n(f 0 (b)
f+0 (a)),
FUNZIONI CONVESSE
7
consideriamo l’insieme di punti
{xj }j=1,...,k .
Allora, la convessità implica che
f+0 (a)  f 0 (x1 )  f+0 (x1 )  f 0 (x2 )  f+0 (x2 )  . . .  f 0 (xk )  f+0 (xk )  f 0 (b),
e quindi da ciò segue che
(11)
0
f (b)
f+0 (a)
k
X
(f+0 (xk )
0
f (xk )) =
j=1
k
X
g(xj ) > k/ n,
j=1
dove nell’ultima disuguaglianza si è sfruttato il fatto che g(xj ) > 1/n. Dal confronto
tra (10) e (11) si ottiene una contraddizione.
(2) Fissato un qualunque intervallo chiuso e limitato [a, b] 2 I, l’insieme
Aa,b = {x 2 [a, b] : g(x) > 0}
è al più numerabile.
Infatti si osserva subito che
Aa,b =
1
[
Ana,b
n=1
e dunque è unione numerabile di insiemi finiti, per cui è al più numerabile.
A questo punto siamo in grado di provare l’ultimo passo, e cioè
(3) l’insieme A = {x 2 I : g(x) > 0} è al più numerabile.
Basta osservare che un qualunque intervallo aperto I può essere visto come unione
numerabile di intervalli chiusi e limitati (ad esempio, se I = (a, b), allora I =
1
1
[1
]). Poiché su ciascuno di questi intervalli chiusi l’insieme dei punti
n=1 [a + n , b
n
tali che f non è derivabile è al più numerabile, allora anche A, che è l’unione di tutti
questi insiemi di punti in cui f non è derivabile, sarà al più numerabile.
⇤
Esercizio A.2. Sfruttando un argomento simile a quello usato nella dimostrazione del Teorema A.1, mostrare che, data una funzione monotona f : I ! R, l’insieme dei punti in cui
f non è continua è al più numerabile.