1
Note di “Derivate ed Integrali”
Versione 1.0
Lamberto Lamberti & Corrado Mascia
parte II
Integrale, derivate, teoremi sulle derivate, analisi locale, analisi globale
16 Ottobre 2002
2
Indice
1
2
3
4
5
L’integrale
1.1 Aree ed integrali . . . . . . . . . . .
1.2 Definizione analitica dell’integrale
1.3 Proprietà dell’integrale . . . . . . .
1.4 Integrale con estremi variabili . . .
1.5 Scheda riassuntiva . . . . . . . . .
.
.
.
.
.
Derivate, derivate e derivate
2.1 Definizione di derivata . . . . . . . .
2.2 Prime formule di derivazione . . . .
2.3 Regole fondamentali di derivazione
2.4 Derivate successive . . . . . . . . . .
2.5 ∗ Derivate parziali . . . . . . . . . . .
2.6 Scheda riassuntiva . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5
5
10
14
18
20
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
25
27
30
33
39
41
43
Teoremi sulle derivate
3.1 Teorema di Lagrange . . . . . . . . . . . . .
3.2 Conseguenze del Teorema di Lagrange . . .
3.3 Teorema fondamentale del calcolo integrale
3.4 Scheda riassuntiva . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
45
45
48
53
58
Analisi locale
4.1 Punti stazionari . . . . . .
4.2 Punti di singolarità . . . .
4.3 Comportamento asintotico
4.4 Scheda riassuntiva . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
61
61
65
67
71
Analisi globale
5.1 Problemi quotidiani . . . . . . . . . . .
5.2 A caccia di massimi e minimi assoluti
5.3 Concavità e convessità . . . . . . . . .
5.4 Scheda riassuntiva . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
73
73
74
77
82
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
.
.
.
.
4
INDICE
Tabella delle derivate
funzione f
derivata prima f 0
funzione f
derivata prima f 0
costante
0
xα
αxα−1
sin x
cos x
cos x
− sin x
ex
ex
ln x
1
x
tan x
1
= 1 + tan2 x
2
cos x
cot x
ax
ax ln a
arctan x
arcsin x
sinh x
√
1
1 − x2
cosh x
arccos x
cosh x
−
1
= −1 − cot2 x
2
sin x
1
1 + x2
−√
1
1 − x2
sinh x
Capitolo 1
L’integrale
1.1
Aree ed integrali
L’idea intuitiva di “area” di una regione del piano è il numero di quadrati unitari
contenuti all’interno della regione. Da questa visione naı̈f dell’area seguono alcune
proprietà elementari:
(i) l’area è un numero positivo, che dipende dall’unità di misura adottata (metri quadrati, centimetri quadrati,. . . );
(ii) figure congruenti, cioè sovrapponibili con un movimento rigido, hanno la stessa
area;
(iii) l’area di un rettangolo è il prodotto delle lunghezze dei lati;
(iv) se una regione A contiene una regione B allora l’area di A è maggiore o uguale a
quella di B;
(v) se una regione è divisa in più parti disgiunte, l’area del tutto è data dalla somma
delle aree delle singole parti.
Grazie alle proprietà elencate, le regioni decomponibili in rettangoli, dette plurirettangoli, hanno come area la somma delle aree (prodotto dei lati) dei rettangoli che le
compongono. Inoltre, per ogni regione E, scelti due plurirettangoli R0 e R00 tali che
R0 ⊆ E ⊆ R00 , riesce
A(R0 ) ≤ A(E) ≤ A(R00 ),
dove A(E) indica l’area di E.
Il valore A(E) può essere individuato se si conoscono due successioni di plurirettangoli
Rn0 ed Rn00 tali che
Rn0 ⊆ E ⊆ Rn00 ,
lim A(Rn0 ) = n→∞
lim A(Rn00 )
n→∞
Tale procedimento si chiama metodo di esaustione ed è quello usato per l’area di numerose regioni considerate in geometria euclidea (cerchi, ellissi, ecc.).
5
6
CAPITOLO 1. L’INTEGRALE
Figura 1.1: La regione E e due plurirettangoli approssimanti
Il procedimento appena descritto è particolarmente interessante al fine di dare
una definizione rigorosa di area di una regione del piano. Infatti, non è assolutamente chiaro se ad un qualsiasi sottoinsieme del piano sia possibile associare un
numero, per l’appunto l’area, in modo che siano soddisfatte le proprietà suscritte.
Un insieme per cui sia possibile determinare le successioni di plurirettangoli Rn0
ed Rn00 con le proprietà appena dette si chiama insieme misurabile, e il valore di
lim A(Rn0 ) = lim A(Rn00 ) è l’area dell’insieme. Il fatto sorprendente è che esistono
n→∞
n→∞
insiemi non misurabili!
Area di un sottografico
Consideriamo una funzione f : [a, b] → R non negativa: la regione
R = {(x, y) | a ≤ x ≤ b,
0 ≤ y ≤ f (x)}
è detta sottografico di f relativamente all’intervallo [a, b]. La nozione analitica di
integrale nasce dall’esigenza di definire rigorosamente e calcolare l’area A di un sottografico.
Definizione 1.1.1 (Integrale di una funzione non negativa).
Sia f definita in [a, b] e non negativa. L’area del sottografico di f in [a, b] si chiama integrale
della funzione f : [a, b] → R sull’intervallo [a, b] e si indica con
Z
b
f (x) dx
a
A questo punto ci sono due problemi fondamentali.
– Determinare una classe di funzioni per cui l’integrale abbia senso. In altre parole,
determinare una classe di funzioni il cui sottografico abbia un’area ben definita.
1.1. AREE ED INTEGRALI
7
– Determinare una maniera operativa per calcolare il valore dell’integrale per lo meno
in qualche caso di funzione f particolarmente semplice.
Partiamo prima dal secondo problema e seguiamo la strategia del metodo di esaustione. Per costruire i plurirettangoli approssimanti
• si divide l’intervallo [a, b] in più sotto–intervalli tramite una scelta di punti
a = x0 < x1 < . . . < xn = b;
• si approssima l’area del sottografico relativo a ciascuno di tali intervalli con quella
di due rettangoli, R0 e R00 , che hanno come base il sotto–intervallo e come altezze
il minimo e il massimo che la funzione prende in tale sotto–intervallo.
Assegnata una funzione f (x), continua in [a, b], indichiamo con
P = {x0 , x1 , . . . , xn }
dove a = x0 < x1 < . . . < xn = b
mi = min f (x)
Mi = max f (x)
[xi−1 ,xi ]
[xi−1 ,xi ]
∆xi = xi − xi−1 .
L’insieme P , che determina la suddivisione di [a, b] in sottointervalli, è detto essere una
partizione di [a, b], dato che [a, b] =
date da
A(R0 ) =
n
X
n
S
[xi−1 , xi ]. Le aree dei plurirettangoli R0 e R00 sono
i=1
mi ∆xi ,
A(R00 ) =
i=1
n
X
Mi ∆xi .
i=1
Aumentando il numero di punti di sottointervalli e facendo in modo che le lunghezze
∆xi = xi+1 − xi tendano a zero man mano che si aumenta il numero di punti, si ottiene la successione di plurirettangoli richiesta. Il valore comune del limite delle aree
dei plurirettangoli contenuti e di quelli contenenti la regione è l’integrale richiesto.
Partiamo da qualche esempio.
I. Nel caso di f (x) = costante = γ, il calcolo è banale: il sottografico è un rettangolo e quindi
Z
b
γ dx = γ(b − a).
a
Anche il procedimento tramite la suddivisione in sottointervalli porta allo stesso risultato: scelti
i punti x0 , . . . , xn , si ha sempre e comunque mi = Mi = γ, quindi
0
00
A(R ) = A(R ) =
n
X
γ∆xi = γ(b − a).
i=1
Dato che A(R0 ) ≤
Rb
a
f (x) dx ≤ A(R00 ), si ottiene la conclusione.
II. L’integrale della funzione f (x) = x, come sappiamo dalla geometria elementare, ha il valore
Z
b
a
1
1
x dx = (b − a)(b + a) = (b2 − a2 ).
2
2
8
CAPITOLO 1. L’INTEGRALE
Verifichiamo il risultato a partire dall’approssimazione tramite plurirettangoli. Dividiamo l’intervallo [a, b] in n parti di uguale lunghezza tramite i punti
dove h =
a < a + h < a + 2h < . . . < a + nh = b
b−a
.
n
Ponendo xk = a + kh,
mk =
min x = xk−1 = a + (k − 1)h,
[xk−1 ,xk ]
Mk = max x = xk = a + kh,
[xk−1 ,xk ]
i plurirettangoli hanno aree
A(Rn0 )
= ah + (a + h)h + . . . + (a + (n − 1)h)h = h
n−1
X
(a + kh) = hna + h
k=0
n
X
A(Rn00 ) = (a + h)h + (a + 2h)h + . . . + (a + nh)h = h
2
(a + kh) = hna + h
k=1
Tenuto conto che
n−1
P
k=
k=0
n(n−1)
2
e
n
P
k=
k=1
n(n+1)
,
2
n−1
X
k,
k=0
n
X
2
k
k=1
riesce
n(n − 1)
n(n − 1)
= (b − a)a + (b − a)2
2
2n2
n(n
+
1)
n(n
+ 1)
A(Rn00 ) = hna + h2
= (b − a)a + (b − a)2
,
2
2n2
A(Rn0 ) = hna + h2
quantità che hanno evidentemente lo stesso limite
lim A(Rn0 ) = lim A(Rn00 ) = (b − a)a +
n→+∞
n→+∞
(b − a)2
b2 − a2
=
.
2
2
III. Per misurare l’area del sottografico della parabola y = x2 , non abbiamo formule nell’archivio delle figure geometriche elementari. Per semplicità, supponiamo 0 ≤ a < b e costruiamo le
somme su sotto intervalli come fatto prima, cioè scegliamo la partizione a, a+h, a+2h, . . . , a+
(n − 1)h, a + nh = b dove h = (b − a)/n. In questo caso, ponendo xk = a + kh,
mk =
min x2 = (a + (k − 1)h)2 ,
[xk−1 ,xk ]
Mk = max x2 = (a + kh)2 ,
[xk−1 ,xk ]
da cui segue
A(Rn0 ) = a2 h + (a + h)2 h + (a + 2h)2 h + . . . + (a + (n − 1)h)2 h,
A(Rn00 ) = (a + h)2 h + (a + 2h)2 h + . . . + (a + nh)2 h.
1.1. AREE ED INTEGRALI
9
Svolti i quadrati e tenuto presente che h =
(
A(Rn0 )
2
= h na + 2ah
b−a
n ,
n−1
X
si ottiene
k+h
2
k=0
n−1
X
)
k
2
k=0
n−1
X
X
2a(b − a)
(b − a)2 n−1
= (b − a) a +
k
+
k2 ,
3
n2
n
k=0
k=0
(
2
(
A(Rn00 ) = h na2 + 2ah
n
X
k + h2
k=1
(
2
= (b − a) a +
Dato che
n
P
k=1
k = 12 n(n + 1) e
n
P
k=1
n
X
)
)
k2
k=1
n
2a(b − a) X
n
(b − a)2 X
k+
k2 .
3
n
k=1
k=1
n2
)
k 2 = 16 n(n + 1)(2n + 1), sostituendo
n−1
(n − 1)(2n − 1)
= (b − a) a + a(b − a)
+ (b − a)2
,
n
6n2
n+1
(n + 1)(2n + 1)
A(Rn00 ) = (b − a) a2 + a(b − a)
+ (b − a)2
.
n
6n2
A(Rn0 )
2
Quindi
lim A(Rn0 ) = lim A(Rn00 ) = (b − a)a2 + a(b − a)2 +
n→+∞
n→+∞
cioè
Z
b
a
(b − a)3
b3 − a3
=
,
3
3
1
x2 dx = (b3 − a3 ).
3
La formula ottenuta è nota come formula di Archimede per l’area del segmento parabolico,
cioè del sottografico della parabola x2 relativamente all’intervallo [0, H], area calcolata da
Archimede come un terzo dell’area del rettangolo di estremi (0, 0)−(H, H 2 ), quindi 13 H H 2 .
Il caso precedente su [a, b] si tratta, ovviamente, per differenza.
∗
Somma di potenze dei primi n interi. Nel calcolo dell’integrale delle funzioni x e x2 si sono usate le
formule
n
n
X
X
1
1
k = n(n + 1).
e
k 2 = n(n + 1)(2n + 1),
2
6
k=1
k=1
ma come si dimostrano? La somma
n
P
(k + 1)2 si può riscrivere in due modi diversi
k=1
n
X
(k + 1)2 = 22 + 32 + · · · + (n + 1)2 =
n
X
k 2 + (n + 1)2 − 1
k=1
k=1
oppure
n
X
k=1
(k + 1)2 =
n
X
k=1
(k 2 + 2k + 1) =
n
X
k=1
k2 + 2
n
X
k=1
k + n.
10
CAPITOLO 1. L’INTEGRALE
Figura 1.2: Un plurirettangolo per l’integrale di x2
Uguagliando le due espressioni, si ha
n
X
k 2 + (n + 1)2 − 1 =
k=1
n
X
k2 + 2
k=1
n
X
k+n
⇒
(n + 1)2 − 1 = 2
k=1
In modo simile si ricava la formula esplicita per
k = n2 + n, cioè la conclusione.
n
P
k 2 : scriviamo
(k + 1)3 in due modi diversi:
P
n
P
k
k=1
k 3 + (n + 1)3 − 1 =
k=1
Risolvendo rispetto a
n
X
k + n.
k=1
Sviluppando il binomio a primo membro, si ricava 2
n
X
n
X
(k + 1)3 =
k=1
n
X
k=1
k3 + 3
k=1
n
X
k2 + 3
k=1
n
X
k + n.
k=1
P
k 2 e utilizzando la formula per k k,
"
#
n
n
X
X
1
n(n + 1)(2n + 1)
k2 =
(n + 1)3 − 1 − 3
k−n =
.
3
6
P
k
k=1
k=1
Con la stessa strategia si può ricavare una formula esplicita per
n
P
k=1
k p per p ∈ N.
1.2 Definizione analitica dell’integrale
Nel precedente paragrafo, abbiamo considerato l’area di un sottografico come una
quantità data intuitivamente e la abbiamo rappresentata come limite di aree di plurirettangoli. Invertiamo ora il procedimento: partiamo dalla costruzione di plurirettangoli
(opportuni) e dimostriamo che le loro aree tendono ad un limite quando la lunghezza
1.2. DEFINIZIONE ANALITICA DELL’INTEGRALE
11
dei sottointervalli tende a zero. Il valore di questo limite dà la definizione di integrale.
È importante notare che la definizione di integrale è indipendente dal segno della funzione stessa e che l’equivalenza integrale=area del sottografico vale solo per funzioni
positive.
Data f : [a, b] → R continua, dividiamo l’intervallo tramite una partizione P ,
indicandone i punti con a = x0 < x1 < x2 < . . . < xn−1 < xn = b.
L’ampiezza δ della partizione P è il valore massimo delle lunghezze dei sottointervalli: δ = max{∆x1 , . . . , ∆xn } dove ∆xi := xi − xi−1 .
In ogni intervallo [xi−1 , xi ] scegliamo un punto ξi e formiamo la somma
F :=
n
X
f (ξi )∆xi ≡ f (ξ1 )∆x1 + f (ξ2 )∆x2 + · · · + f (ξn )∆xn .
i=1
Teorema 1.2.1 (Esistenza dell’integrale per funzioni continue).
Data una funzione f : [a, b] → R continua, la somma F tende ad un valore
limite per δ → 0 dove δ è l’ampiezza della partizione.
Tale limite è indipendente dalla scelta di xi , ξj .
Definizione 1.2.2 (Integrale di una funzione continua).
Il valore limite di F per δ → 0 si chiama integrale di f nell’intervallo [a, b] e si indica1 con
Z
b
f (x) dx.
a
La lettera usata per indicare la variabile di integrazione è del tutto indifferente: al posto di
Rb
Rb
Rb
f (x) dx, si può scrivere f (t) dt o f (u) du. Gli estremi dell’intervallo di integrazione a
a
a
a
e b influiscono sul valore dell’integrale per un’assegnata f . Perciò bisogna evitare scritture
Rx
Rb
come f (x) dx o f (a) da in cui la stessa lettera è usata per la variabile di integrazione e
a
a
per uno degli estremi dell’intervallo.
Nella definizione di integrale, non viene fatta nessuna richiesta di positività della
funzione. Se l’integrando f è positivo nell’intervallo [a, b], l’integrale si identifica con
l’area del sottografico di f in [a, b]. Se f è negativa in tutto o in parte dell’intervallo, l’unico effetto è di rendere alcuni fattori f (ξi ) negativi, invece di positivi. Questo corrisponde ad assegnare alla regione limitata dalla parte della curva sotto l’asse
delle x un’area negativa. L’integrale sarà quindi la somma di termini positivi e negativi, in
corrispondenza delle zone in cui la curva è sopra o sotto l’asse x.
1
Notazione di Leibnitz per l’integrale. Il simbolo dell’integrale è una modifica del simbolo di
somma indicato da una lunga S come si usava al tempo di Leibnitz. Il passaggio al limite da una
suddivisione finita in porzioni di lunghezza ∆xi è indicato dall’uso della lettera d invece di ∆.
12
CAPITOLO 1. L’INTEGRALE
Dimostrazione dell’esistenza dell’integrale per funzioni lipschitziane
Dimostriamo il Teorema sotto l’ipotesi aggiuntiva che la funzione f sia lipschitziana:
|f (x) − f (y)| ≤ L|x − y|
∀ x, y ∈ [a, b].
Decomponiamo [a, b] come [a, b] = [x0 , x1 ] ∪ [x1 , x2 ] ∪ . . . ∪ [xn−1 , xn ] e poniamo
P = {x0 , x1 , . . . , xn }
dove a = x0 < x1 < . . . < xn = b
mi = min f (x)
Mi = max f (x)
[xi−1 ,xi ]
[xi−1 ,xi ]
∆xi = xi − xi−1 .
Costruiamo le somme
s(P ) =
n
X
mi ∆xi ,
S(P ) =
i=1
n
X
Mi ∆xi
i=1
dette somme integrali inferiori e superiori.2
Passo 1. Tutte le somme integrali inferiori sono minori o uguali a tutte le somme integrali
superiori. In particolare, sup s(P ) ≤ inf S(P ), dove l’estremo superiore e l’estremo inferiore
P
P
sono presi rispetto a tutte le possibili partizioni P dell’intervallo [a, b].
È evidente che le somme inferiori sono minori uguali delle somme superiori costruite in corrispondenza della stessa decomposizione. Meno ovvio è che tale relazione si
conservi anche se le due somme sono riferite a decomposizioni diverse. Il fenomeno si
riconosce tramite il seguente ragionamento:
– date P1 e P2 due partizioni di [a, b], sia P ∗ = P1 ∪ P2 la partizione determinata dai
punti che figurano in P1 o in P2 ;
– riesce (evidentemente) s(P1 ) ≤ s(P ∗ ) ≤ S(P ∗ ) ≤ S(P2 );
– ne segue che s(P1 ) ≤ S(P2 ).
Passo 2. Per ogni partizione P0 di ampiezza δ, vale la stima S(P0 ) − s(P0 ) ≤ Lδ(b − a).
In particolare, sup s(P ) = inf S(P ), dove l’estremo superiore e l’estremo inferiore sono presi
P
P
rispetto a tutte le possibili partizioni P dell’intervallo [a, b].
Infatti, per una qualsiasi partizione P0 , vale
S(P0 ) − s(P0 ) =
n
X
i=1
(Mi − mi )∆xi =
n
X
|Mi − mi |∆xi
i=1
Siano αi e βi , rispettivamente, un punto di massimo ed uno di minimo della funzione
f in [xi−1 , xi ], allora
|Mi − mi | = |f (αi ) − f (βi )| ≤ L|αi − βi | ≤ Lδ.
2
Queste due somme integrali sono amici già conosciuti nel paragrafo iniziale. Lı̀ rappresentavano le
aree di plurirettangoli approssimanti. Qui la situazione è analoga a patto di tener conto delle questioni
collegate al segno di f .
1.2. DEFINIZIONE ANALITICA DELL’INTEGRALE
13
Sostituendo questa stima nella relazione precedente, si ottiene
0 ≤ inf S(P ) − sup s(P ) ≤ S(P0 ) − s(P0 ) ≤ Lδ
P
P
n
X
∆xi = Lδ(b − a).
i=1
Tenuto conto che possiamo scegliere P0 con δ arbitrariamente piccolo, ne segue la
conclusione.
Passo 3. Sia ` := sup s(P ) = inf S(P ). Scelti i punti ξi ∈ [xi−1 , xi ], le somme integrali
F =
n
P
P
P
f (ξi )∆xi tendono ad ` al tendere di δ a 0.
i=1
Fissata la partizione P e scelti ξi ∈ [xi−1 , xi ], si ha, per costruzione, mi ≤ f (ξi ) ≤ Mi ,
cioè s(P ) ≤ F ≤ S(P ) e quindi
|F − `| ≤ S(P ) − s(P ) ≤ Lδ(b − a)
che porta in un soffio alla conclusione.
Per dimostrare il Teorema supponendo solamente la continuità della funzione f
occorre passare per un altro risultato (il Teorema di Heine-Cantor) che garantisce
l’uniforme continuità della f . Come dovrebbe intuirsi dai passaggi per il caso lipschitziano, l’uniforme continuità gioca il suo ruolo nella stima (in modo uniforme,
appunto!) della differenza f (αi )−f (βi ). Avete intuito? Bene. Vi siete persi? Datevi
tempo... capirete.
Si possono integrare funzioni non continue?
Puó accadere che le somme integrali convergano anche se la funzione f non è continua dappertutto, ad esempio se essa ha solo discontinuità di salto in uno o in più punti. Ad esempio,
+1
R
sgn (x) dx = 0. Quindi l’integrale può avere senso anche per alcune funzioni che ab-
−1
biano delle discontinuità. La costruzione delle somme integrali é la stessa descritta per le funzioni continue con l’unica modifica di sostituire a ciascun massimo e minimo, rispettivamente,
l’estremo superiore e l’estremo inferiore:
mi =
inf
[xi−1 ,xi ]
f (x)
Mi =
sup f (x)
[xi−1 ,xi ]
Definizione 1.2.3 (Funzioni integrabili).
Una funzione f : [a, b] → R limitata si dice integrabile3 in [a, b] se la somma F tende ad un valore
limite per δ → 0, dove δ è l’ampiezza della partizione, e tale limite è indipendente dalla scelta di xi , ξj .
Equivalentemente, si può dire che una funzione è integrabile se sup s(P ) = inf S(P ) dove,
come sempre, P rappresenta una partizione di [a, b].
Alla luce della Definizione 1.2.3, il Teorema 1.2.1 si può enunciare nella forma: tutte le
funzioni continue in [a, b] sono integrabili in [a, b].
3
L’integrale che abbiamo definito qui è noto come integrale di Riemann per distinguerlo dai altri
concetti di integrale.
14
1.3
CAPITOLO 1. L’INTEGRALE
Proprietà dell’integrale
Le proprietà fondamentali dell’integrale discendono direttamente dalla sua definizione come limite di somme integrali.
Additività. Per ogni a < c < b e per ogni funzione integrabile f
b
Z
c
Z
f (x) dx =
a
f (x) dx +
b
Z
a
f (x) dx.
c
(1.1)
Per una dimostrazione analitica, dati a < c < b, scegliamo la partizione in modo che il punto c
appaia come un punto della divisione stessa, diciamo c = xm (con m che varia con n). Allora
n
X
m
X
f (ξi )∆xi =
i=1
n
X
f (ξi )∆xi +
i=1
f (ξi )∆xi ,
i=m+1
dove la prima somma a membro destro corrisponde ad una partizione dell’intervallo [a, c] in
m sottointervalli, e la seconda somma ad una partizione dell’intervallo [c, b] (in n − m sotto
intervalli). Per δ → 0, otteniamo la regola (1.1).
Per ora abbiamo definito ab f (x) dx solo per a < b. Per a = b o a > b, definiamo
l’integrale in modo che sia preservata la regola dell’additività: per c = a, deve valere
R
b
Z
Z
f (x) dx =
a
f (x) dx +
Z
da cui segue
Z
f (x) dx,
a
a
a
b
a
f (x) dx := 0
a
(coerente con l’interpretazione in termini di aree). Per b = a in (1.1)
0=
Z
a
f (x) dx =
c
Z
f (x) dx +
a
f (x) dx
c
a
a
Z
da cui segue la definizione
Z
a
f (x) dx := −
Z
c
f (x) dx
a < c,
a
c
dove il membro destro ha il significato precedentemente definito.
Il significato geometrico è che l’area sotto la curva y = f (x) va contata come
negativa se la direzione di percorrenza dall’estremo inferiore di integrazione
al superiore è decrescente in x.
Linearità. Per ogni α, β ∈ R e per ogni coppia di funzioni f, g integrabili
α
Z
b
a
f (x) dx + β
Z
b
a
g(x) dx =
Z
b
a
[αf (x) + βg(x)] dx.
(1.2)
1.3. PROPRIETÀ DELL’INTEGRALE
15
La dimostrazione è conseguenza della linearità della somma:
"
α
n
X
#
"
f (ξi )∆xi + β
i=1
n
X
#
g(ξi )∆xi =
n
X
i=1
[αf (ξi ) + βg(ξi )] ∆xi
i=1
La regola (1.2) ci permette di integrare combinazioni lineari di due o più funzioni che
possono essere integrate individualmente. Ad esempio per una funzione quadratica
f (x) = Ax2 + Bx + C con A, B, C ∈ R
Z
b
2
Ax + Bx + C dx = A
b
Z
a
Z
2
x dx + B
a
b
x dx +
a
Z
b
C dx
a
A 3
B
(b − a3 ) + (b2 − a2 ) + C(b − a).
3
2
=
Monotonı́a. Per ogni coppia di funzioni f, g integrabili
f ≥g
in [a, b]
b
Z
=⇒
f (x) dx ≥
a
Z
b
g(x) dx.
a
(1.3)
Infatti, dalla costruzione dell’integrale segue che
f ≥0
Z
⇒
in [a, b]
b
f (x) dx ≥ 0.
a
dato che l’integrale è ottenuto come limite di somme di termini che, nel caso di una funzione
non negativa, sono tutti non negativi. Dalla linearità dell’integrale,
Z
b
f (x) dx −
Z
a
b
Z
b
g(x) dx =
a
(f (x) − g(x)) dx ≥ 0.
a
Dalla proprietà di monotonia dell’integrale discende una proprietà utile, che è, sostanzialmente, una “disuguaglianza triangolare per integrali”:
Z
Zb
b
f (x) dx ≤ |f (x)| dx.
a
(1.4)
a
Rb
Rb
a
a
Infatti, dato che ±f ≤ |f |, riesce ± f (x) dx ≤
|f (x)| dx, e, con un minimo di memoria/atten-
zione alla definizione del modulo, segue la conclusione.
Teorema della media integrale
Sia f una funzione continua in un intervallo [a, b]. Per il teorema di Weierstrass, esistono due costanti M, m ∈ R tali che m ≤ f (x) ≤ M per ogni x ∈ [a, b]. Per la monotonia
dell’integrale, vale la stima
m(b − a) =
Z
b
a
m dx ≤
Z
b
a
f (x) dx ≤
Z
b
a
M dx = M (b − a)
(1.5)
16
CAPITOLO 1. L’INTEGRALE
Questa formula è intuitivamente ovvia: se f é non negativa e pensiamo all’integrale
come area, le quantità M (b − a) e m(b − a) rappresentano le aree di un rettangolo
circoscritto ed inscritto nel sottografico di f .
La formula (1.5) può anche essere riscritta nella forma
m ≤ µ :=
1 Zb
f (x) dx ≤ M.
b−a a
(1.6)
dove µ è la media integrale di f in [a, b].
Teorema 1.3.1 (Teorema della Media Integrale).
Sia f : [a, b] → R una funzione continua in [a, b]. Allora esiste un valore
ξ ∈ [a, b] tale che
1 Zb
f (ξ) =
f (x) dx.
b−a a
Nel caso di f (x) ≥ 0, il teorema equivale ad affermare che esiste un rettangolo di
base [a, b] ed una altezza f (ξ) conveniente che ha la stessa area del sottografico (cosa
del tutto evidente).
Dimostrazione del Teorema della Media Integrale. La dimostrazione è conseguenza immediata del Teorema dei valori intermedi. Infatti, come si è visto, la media µ di f in [a, b], definita in
(1.6), è sempre compresa tra il massimo M e il minimo m della funzione f nell’intervallo. Per il
teorema di Weierstrass esistono due punti x1 e x2 , tali che f (x1 ) = m e f (x2 ) = M . Applicando
all’intervallo delimitato da x1 e x2 il Teorema dei valori intermedi, si ottiene la conclusione.
Il Teorema 1.3.1 vale anche nel caso in cui b < a (ovviamente sempre sotto l’ipotesi
di continuitá della funzione f ).
Controesempio. Nel caso in cui la funzione f non sia continua in tutto [a, b], non è
detto che valga la conclusione. Ad esempio se si considera la funzione f (x) = sgn x in
1.3. PROPRIETÀ DELL’INTEGRALE
17
[−1, 2], si ha
Z 2
1
1
1
sgn (x) dx = (−1 + 2) = ,
2 − (−1) −1
3
3
che non fa parte dell’immagine della funzione sgn x.
µ=
Il nome “media integrale” discende dal fatto che il valore µ è l’erede naturale della “media
aritmetica”. Dato un numero finito di quantità f1 , f2 , . . . , fn si chiama media aritmetica il
valore
f1 + f2 + . . . + fn
.
n
Nella costruzione dell’integrale di una funzione in un intervallo, se consideriamo intervalli di
lunghezza ∆xi pari a (b − a)/n per ogni i, otteniamo come valore approssimante la quantità
n
X
f (xi )∆xi = (b − a)
i=1
f (x1 ) + f (x2 ) + · · · + f (xn )
.
n
Quindi la media aritmetica di f (x1 ), . . . , f (xn ) è pari a
n
f (x1 ) + · · · + f (xn )
1 X
=
f (xi )∆xi .
n
b − a i=1
Passando al limite, si ottiene proprio la media integrale!
Alle volte è utile considerare una media “pesata”, ossia
µ=
p1 f1 + p2 f2 + · · · + pn fn
,
p1 + p2 + · · · + pn
dove i pesi pi sono quantità positive. Ad esempio, se p1 , . . . , pn sono i pesi di particelle che
si trovano nelle posizioni f1 , . . . , fn dell’asse x, allora µ rappresenta la posizione del centro di
gravità (baricentro). Nel caso in cui tutti i pesi pi coincidano, la quantità µ coincide con la
media aritmetica. Per una funzione f , possiamo definire la media integrale pesata della funzione f
sull’intervallo [a, b] come
Rb
f (x)p(x) dx
µp = a R b
a p(x) dx
dove la funzione peso p è positiva in [a, b] (la positività di p garantisce che il denominatore
della media sia nonnullo).
Teorema 1.3.2 (Teorema Generalizzato della Media Integrale).
Sia f : [a, b] → R continua in [a, b] e sia p : [a, b] → R continua tale che p(x) > 0.
Allora esiste ξ ∈ [a, b] tale che
Rb
f (x)p(x) dx
f (ξ) = a R b
.
a p(x) dx
Dimostrazione. La dimostrazione è analoga a quella del Teorema della media integrale. Basta
infatti osservare che m ≤ f (x) ≤ M implica mp(x) ≤ f (x)p(x) ≤ M p(x), e, integrando in [a, b],
Z
b
m
a
p(x) dx ≤
Z
b
a
f (x)p(x) dx ≤ M
Z
b
p(x),
a
da cui si deduce che la media integrale pesata appartiene all’insieme immagine f ([a, b]).
18
CAPITOLO 1. L’INTEGRALE
1.4
Integrale con estremi variabili
L’integrale è una funzione degli estremi di integrazione a e b. Per studiare questa
dipendenza, supponiamo l’estremo inferiore fissato al valore a e indichiamo l’estremo
superiore (variabile) con x: quindi, consideriamo la funzione integrale
φ(x) =
Z
x
f (t) dt.
a
La funzione φ è un integrale indefinito della funzione f . Si parla di un integrale indefinito e non dell’integrale indefinito per sottolineare il fatto che si sarebbe potuto
scegliere di fissare l’estremo inferiore a ad un valore diverso.
Formare l’integrale indefinito di una funzione data è una maniera importante per
generare nuovi tipi di funzioni. Ad esempio,
φ(x) =
x
Z
1
dt
t
1
x > 0.
Tale funzione si dimostra essere uguale alla funzione inversa di ex , cioè alla funzione
ln x. La formula precedente può quindi essere considerata la definizione analitica del
logaritmo naturale. Oppure provate, ad esempio, a considerare
φ(x) =
Z
x
[t]dt
0
essendo [t] la funzione parte intera, disegnando il grafico di φ(x).
Parlare dell’integrale indefinito φ(x) non significa certamente conoscerne esplicitamente l’espressione. Sono rarissime le funzioni delle quali si conoscono integrali
indefiniti in forma esplicita. Si conoscono gli integrali indefiniti di tutte quelle funzioni delle quali.... si conoscono gli integrali su qualsiasi intervallo. Ad esempio si
conoscono gli integrali indefiniti dei polinomi. Pur non conoscendo esplicitamente
la φ(x) si possono riconoscere sue proprietà importanti e utili.
Dalla proprietà
Ra
a
f (x)dx = 0 ne deriva che φ(a) = 0. Inoltre si può vedere che
f continua
φ continua.
=⇒
In effetti, si può mostrare qualcosa di più: se f è continua in [a, b], la funzione φ è una
funzione lipschitziana. Infatti, la continuità di f implica la continuità della funzione
|f |. Quindi, per il Teorema di Weierstrass, esiste una costante M > 0 tale che |f (u)| ≤
M per ogni u ∈ [a, b]. Allora,
se x < y,
se x > y,
Z
|φ(x) − φ(y)| = y
f (u) du ≤
x
Z
|φ(x) − φ(y)| = −
y
x
Z
y
|f (u)| du ≤ M (y − x);
x
Z
f (u) du ≤
y
x
|f (u)| du ≤ M (x − y).
1.4. INTEGRALE CON ESTREMI VARIABILI
19
Quindi
|f (u)| ≤ M
|φ(x) − φ(y)| ≤ M |x − y|.
=⇒
In realtà, l’unica ipotesi che serve per garantire la lipschitzianità dell’integrale indefinito φ è l’integrabilità e la limitatezza della funzione f .
Esempio. Consideriamo la funzione f (x) = sgn x che è continua tratti (ha un punto di salto in
x = 0). Chi è la funzione
Z
x
sgn (t) dt?
φ(x) =
0
Dato che
x>0
⇒
Z
x
Z
sgn (t) dt =
φ(x) =
0
x<0
⇒
x
Z
0
1 dt = x
0
Z
sgn (t) dt =
φ(x) =
x
x
(−1) dt = −x,
0
la funzione φ(x) è la funzione modulo:
Z
φ(x) =
x
sgn (t) dt = |x|.
0
Figura 1.3: Gli integrali indefiniti di sgn (x) e di x
20
1.5
CAPITOLO 1. L’INTEGRALE
Scheda riassuntiva
Aree ed integrali
L’area di una regione decomponibile in rettangoli, detta plurirettangolo, è la somma
delle aree dei rettangoli che lo compongono; inoltre, per ogni regione E, scelti due
plurirettangoli R0 e R00 tali che R0 ⊆ E ⊆ R00 , riesce
A(R0 ) ≤ A(E) ≤ A(R00 ),
dove A(E) indica l’area di E. Quindi, il valore A(E) può essere individuato se si
conoscono due successioni di plurirettangoli Rn0 ed Rn00 tali che
Rn0 ⊆ E ⊆ Rn00 ,
lim A(Rn0 ) = lim A(Rn00 )
n→∞
n→∞
(Attenzione! È stato commesso un abuso: non c’è nessuna garanzia che A(E) abbia senso per
E qualsiasi!)
Area di un sottografico
Data f : [a, b] → R non negativa: il sottografico di f nell’intervallo [a, b]. è la regione
R = {(x, y) | a ≤ x ≤ b,
0 ≤ y ≤ f (x)}
Definizione 1.1.1. Sia f definita in [a, b] e non negativa. L’area del sottografico di f in
[a, b] si chiama integrale della funzione f sull’intervallo [a, b] e si indica con
Z
b
f (x) dx
a
Assegnata una funzione f (x), continua in [a, b], indichiamo con
P = {x0 , x1 , . . . , xn }
dove a = x0 < x1 < . . . < xn = b
mi = min f (x)
Mi = max f (x)
∆xi = xi − xi−1 .
[xi−1 ,xi ]
[xi−1 ,xi ]
L’insieme P è una partizione di [a, b]. Le aree dei plurirettangoli R0 e R00 sono date da
0
A(R ) =
n
X
mi ∆xi ,
n
X
00
A(R ) =
i=1
Mi ∆xi .
i=1
Le successioni di plurettangoli approssimanti dall’esterno e dall’interno si ottengono
aumentando il numero di punti di sottointervalli e facendo in modo che le lunghezze
∆xi = xi+1 − xi tendano a zero man mano che si aumenta il numero di punti.
I. f (x) = costante = γ > 0 in [a, b].
Per qualsiasi scelta di x0 , . . . , xn , si ha
A(R0 ) = A(R00 ) = γ(b − a)
⇒
Z
b
a
γ dx = γ(b − a).
1.5. SCHEDA RIASSUNTIVA
II. f (x) = x in [a, b] con a ≥ 0.
21
Scegliendo xk = a + kh per k = 0, . . . , n dove h = (b − a)/n,
A(Rn0 ) = (b − a)a + (b − a)2
avendo tenuto conto di
n−1
P
k=0
k=
n(n − 1)
2n2
n(n−1)
2
lim A(Rn0 )
n→+∞
=
III. f (x) = x2 in [a, b] con 0 ≤ a < b.
e
n
P
A(Rn00 ) = (b − a)a + (b − a)2
k=
k=1
n(n+1)
.
2
lim A(Rn00 )
n→+∞
n(n + 1)
,
2n2
Passando al limite,
b2 a2
=
−
=
2
2
Z
b
x2 dx.
a
Con gli stessi xk di II,
n−1
(n − 1)(2n − 1)
+ (b − a)2
,
n
6n2
n+1
(n + 1)(2n + 1)
A(Rn00 ) = (b − a) a2 + a(b − a)
+ (b − a)2
.
n
6n2
A(Rn0 ) = (b − a) a2 + a(b − a)
n
P
avendo tenuto conto di
k=1
n
P
k = 21 n(n + 1) e
lim A(Rn0 )
n→+∞
=
k=1
k 2 = 16 n(n + 1)(2n + 1). Quindi
lim A(Rn00 )
n→+∞
b 3 a3 Z b 2
=
−
=
x dx
3
3
a
Definizione analitica dell’integrale
Sia f : [a, b] → R continua. Dividiamo [a, b] tramite una partizione P = {x0 , x1 , . . . , xn }
dove a = x0 < x1 < . . . < xn−1 < xn = b. Scegliamo un punto ξi ∈ [xi−1 , xi ] per ogni i e
formiamo la somma (qui ∆xi := xi − xi−1 )
F :=
n
X
f (ξi )∆xi ≡ f (ξ1 )∆x1 + f (ξ2 )∆x2 + · · · + f (ξn )∆xn .
i=1
ampiezza δ della partizione P :
δ = max{∆x1 , . . . , ∆xn }.
Teorema 1.2.1. (Esistenza dell’integrale per funzioni continue).
Data f : [a, b] → R continua, la somma F tende ad un valore limite per δ → 0 e tale limite è
indipendente dalla scelta di xi , ξj .
Definizione 1.2.2 (Integrale di una funzione continua).
Il valore limite di F per δ → 0 si chiama integrale di f nell’intervallo [a, b] e si indica con
Z
b
a
f (x) dx.
22
CAPITOLO 1. L’INTEGRALE
L’integrale è somma di termini positivi e negativi, in corrispondenza delle zone in cui
la curva è sopra o sotto l’asse x.
La dimostrazione del Teorema 1.2.1 passa per la definizione di:
somme integrali inferiori e superiori :
n
X
s(P ) =
mi ∆xi ,
S(P ) =
i=1
dove P = {x0 , x1 , . . . , xn } è una partizione, mi =
n
X
Mi ∆xi
i=1
min f (x) e Mi = max f (x). Il punto
[xi−1 ,xi ]
[xi−1 ,xi ]
chiave è dimostrare che sup s(P ) = inf S(P ), dove l’estremo superiore e l’estremo inferiore
P
P
sono scelti su tutte le partizioni possibili.
Si possono integrare funzioni non continue? L’integrale può avere senso anche per alcune
funzioni che abbiano delle discontinuità: la costruzione è la stessa a patto di definire
mi =
inf
[xi−1 ,xi ]
f (x)
Mi =
sup f (x)
[xi−1 ,xi ]
Definizione 1.2.3 (Funzioni integrabili).
Una funzione f : [a, b] → R limitata è integrabile in [a, b] se la somma F tende ad un valore limite
per δ → 0, dove δ è l’ampiezza della partizione, e tale limite è indipendente dalla scelta di xi , ξj .
Proprietà dell’integrale
Additività. Per ogni a < c < b e per ogni funzione integrabile f
Z
b
f (x) dx =
c
Z
f (x) dx +
b
f (x) dx.
c
a
a
Z
Rb
Per definire f (x) dx nel caso a ≥ b in modo che sia preservata l’additività,
a
Z
a
f (x) dx := 0
a
Z
e
b
f (x) dx := −
Z
a
f (x) dx
b < a.
b
a
Linearità. Per ogni α, β ∈ R e per ogni coppia di funzioni f, g integrabili
α
Z
b
f (x) dx + β
Z
b
g(x) dx =
b
[αf (x) + βg(x)] dx.
a
a
a
Z
Monotonı́a. Per ogni coppia di funzioni f, g integrabili
f ≥g
in [a, b]
=⇒
Z
b
f (x) dx ≥
a
Da questa proprietà discende
Z
Zb
b
f (x) dx ≤ |f (x)| dx.
a
a
Z
b
a
g(x) dx.
1.5. SCHEDA RIASSUNTIVA
23
Teorema della media integrale
Teorema 1.3.1 (Teorema della Media Integrale).
Sia f : [a, b] → R una funzione continua in [a, b]. Allora esiste un valore ξ ∈ [a, b] tale che
1 Zb
f (ξ) =
f (x) dx.
b−a a
Il termine a secondo membro è la media integrale di f in [a, b].
Controesempio. Se f non è continua in [a, b] la conclusione può non valere: ad esempio, f (x) = sgn x in [−1, 2],
Teorema 1.3.2 (Teorema Generalizzato della Media Integrale).
Sia f : [a, b] → R continua in [a, b] e sia p : [a, b] → R continua tale che p(x) > 0.
Allora esiste ξ ∈ [a, b] tale che
Rb
f (x)p(x) dx
f (ξ) = a R b
.
a p(x) dx
Integrale con estremi variabili
Fissato il valore a, consideriamo la funzione integrale
φ(x) =
Z
x
f (t) dt.
a
La funzione φ è un integrale indefinito della funzione f .
f continua
=⇒
φ continua.
In effetti, vale di più: se f è limitata in [a, b], φ è una funzione lipschitziana.
24
CAPITOLO 1. L’INTEGRALE
Capitolo 2
Derivate, derivate e derivate
Il concetto di derivata è suggerito dalla nozione intuitiva di retta tangente al grafico di
una funzione y = f (x) in un punto P = (x, f (x)). La retta tangente è caratterizzata
dal passaggio per il punto P (assegnato) e dalla sua pendenza, individuata dall’angolo
α che la retta forma con l’asse x. Come si può determinare l’angolo α a partire dalla
descrizione analitica della funzione f ? La conoscenza del punto P , cioè del valore
della funzione f nel punto x non è sufficiente, dato che per un punto passano infinite
rette. D’altra parte, non serve nemmeno conoscere il comportamento della funzione
f dappertutto: è sufficiente conoscere la funzione in un intorno qualsiasi del punto,
anche piccolo.1 In effetti, dietro la definizione rigorosa di retta tangente si nasconde un
procedimento di limite.
Il problema di calcolare la direzione tangente, o di “derivazione”, ha interessato i
matematici fin dal sedicesimo secolo per risolvere problemi di ottimizzazione, cioè per
determinare massimi e minimi in problemi provenienti dalla geometria, dalla meccanica e dall’ottica.Un secondo problema fondamentale che ha portato al concetto di
“derivata” è quello di formulare in modo matematicamente preciso il concetto intuitivo di velocità istantanea in un moto arbitrario non uniforme. Iniziamo da quest’ultimo
problema.
La derivata come velocità
Consideriamo un punto che si muova lungo l’asse y. Il moto del punto è noto se si
conosce ad ogni istante t la posizione y, cioè se si conosce la funzione y = f (t). Se
la funzione f è lineare, ossia f (t) = ct + b, si parla di moto uniforme con velocità c. La
velocità c è il rapporto tra la distanza percorsa nell’intervallo di tempo [t, s] e la durata
1
Questa affermazione si può esprimere dicendo che la retta tangente individua una proprietà locale della funzione f , dato che dipende solo dal comportamento della funzione f “vicino” al punto
(x, f (x)). Al contrario si parla di proprietà globali per proprietà che dipendono dal comportamento in
tutto l’insieme di definizione.
25
26
CAPITOLO 2. DERIVATE, DERIVATE E DERIVATE
di questo intervallo:
f (s) − f (t)
.
s−t
Il moto è uniforme perchè la velocità è costante (non dipende dalla scelta degli istanti t
e s).
(t)
Se il moto non è uniforme, la quantità f (s)−f
esprime la velocità media del punto
s−t
nell’intervallo di tempo [t, s]. Se la velocità media tende ad un limite finito per s → t, il
valore del limite è detto velocità istantanea:
c=
velocità istantanea:
v(t) = lim
s→t
f (s) − f (t)
.
s−t
Se il limite non esiste, la velocità istantanea non è definita.
Un esempio semplice è il moto di un corpo in caduta libera, cioè sottoposto
alla sola forza di gravità. Sperimentalmente si ottiene che la distanza percorsa al tempo t da un corpo, lasciato cadere da fermo al tempo t = 0, è
proporzionale a t2 ; si rappresenta quindi con una funzione della forma
y = f (t) = at2
(a > 0).
La velocità v all’istante t si ottiene quindi calcolando il limite seguente
v(t) = lim
s→t
f (s) − f (t)
as2 − at2
= lim
= lim a(s + t) = 2at.
s→t
s→t
s−t
s−t
Quindi la velocità di un corpo in caduta libera cresce in modo proporzionale al
tempo.
Nello studio del moto di un punto è utile osservare anche la variazione di velocità.
Il procedimento è simile al precedente. L’accelerazione media è il rapporto tra la variazione di velocità nell’intervallo di tempo [t, s] e la durata dell’intervallo, cioè è data
da (v(s) − v(t))/(s − t). L’accelerazione (istantanea) a è il limite dell’accelerazione media
per s → t, cioè
accelerazione istantanea:
a(t) = lim
s→t
v(s) − v(t)
.
s−t
Nel caso di moto uniforme f (t) = ct + b,
⇒
v(t) = c
a(t) = lim
s→t
c−c
= 0,
s−t
cioè l’accelerazione è nulla; nel caso del corpo in caduta libera f (t) = at2 ,
v(t) = 2at
⇒
cioè il moto è uniformente accelerato.
a(t) = lim
s→t
2as − 2at
= 2a,
s−t
2.1. DEFINIZIONE DI DERIVATA
2.1
27
Definizione di derivata
Data una funzione y = f (x), consideriamo il problema di determinare la retta tangente
al grafico della funzione nel punto P = (x, f (x)). L’idea è la seguente: dato un secondo
punto P1 = (x1 , f (x1 )) sul grafico di f , per P e P1 passa un’unica retta, detta retta
secante. Se, muovendo P1 verso P , la retta secante tende ad una posizione limite, tale
retta limite è la retta tangente. Formuliamo ora il processo geometrico di limite che
abbiamo appena visto in modo analiticamente rigoroso. Siano P = (x, f (x)) e P1 =
(x1 , f (x1 )), il coefficiente angolare della retta secante2 per P e P1 è
rapporto incrementale:
m(P, P1 ) =
f (x1 ) − f (x)
.
x1 − x
(x)
Il rapporto f (xx11)−f
è detto rapporto incrementale. Le differenze f (x1 ) − f (x) e x1 − x
−x
si indicano rispettivamente anche con ∆f e ∆x e corrispondono agli incrementi della
variabile dipendente e di quella indipendente.
Definizione 2.1.1 Sia f : [a, b] → R. La funzione f si dice derivabile in x ∈ [a, b] se esiste
finito il limite
f (x1 ) − f (x)
lim
.
(2.1)
x1 →x
x1 − x
Se esiste, il limite si indica con f 0 (x) e si dice derivata (prima) della funzione f in x. Se la
funzione f è derivabile in tutti i punti dell’intervallo I, si dice che f è derivabile in I.
Figura 2.1: Il grafico di una funzione con tangente e secanti.
Per la derivata si usano anche altri simboli (l’importante è capirsi!)
df
dy
= Df =
= ẏ = · · · ,
dx
dx
e il limite (2.1) può essere scritto in maniere equivalenti
f0 =
lim
x →x
1
2
f (x1 ) − f (x)
f (x + h) − f (x)
∆f
= lim
= lim
= ···
∆x→0 ∆x
h→0
x1 − x
h
Si ricordi che il coefficiente angolare m della retta passante per i punti di coordinate (x, y) e (x1 , y1 )
è dato da m = (y1 − y)/(x1 − x).
28
CAPITOLO 2. DERIVATE, DERIVATE E DERIVATE
Determinare una derivata vuol dire fare (con successo) un limite: i limiti si fanno
nei punti interni ad un intervallo di definizione. Negli estremi si fanno al più limiti sinistri o limiti destri. In punti isolati non si fanno neanche i limiti..., quindi
non si parlerà mai di derivata, cosa del resto suggerita dall’idea di cercare la retta tangente: q
chi penserebbe di fare la tangente in un singolo punto? Ad esempio,
√
la funzione x − x è definita nel maxi intervallo [1, +∞) e nel povero singolo
punto x0 = 0. Sarà derivabile nel punto x0 = 0 ? È una domanda priva di senso!
Dato che la derivata f 0 dipende dal punto di derivazione, la f 0 è essa stessa una
funzione, il cui insieme di definizione è contenuto nell’insieme di definizione della
funzione f (non è detto che i due domini di definizione coincidano).
La definizione analitica di derivata è chiara: si tratta semplicemente del limite di
una funzione opportuna, il rapporto incrementale. Meno chiaro è come si possa calcolare esplicitamente la funzione derivata. In generale, non è possibile calcolare tale
funzione semplicemente ponendo l’incremento h = 0, dato che questo vorrebbe dire
“dividere per zero”!
Partiamo da due casi proprio semplici:
f (x) = c
f (x) = x
f 0 (x) = lim
=⇒
h→0
f 0 (x) = lim
=⇒
h→0
c−c
= 0,
h
(x + h) − x
h
= lim = 1.
h→0
h
h
Nel caso di f (x) = x2 , si ha
(x + h)2 − x2
2xh + h2
= lim
= lim 2x + h = 2x.
h→0
h→0
h→0
h
h
√
Consideriamo f (x) = x per x ≥ 0. Il rapporto incrementale è
√
√
√
√ √
√
x+h− x
x+h− x x+h+ x
1
√
=
√ =√
√
h
h
x+h+ x
x+h+ x
f 0 (x) = lim
Passando al limite per h → 0 si ottiene
√
lim
h→0
x+h−
h
√
x
=


+∞







x = 0,
1
√
2 x
x > 0.
Nel punto√x = 0 la funzione ha una singolarità. Pur essendo definita e continua,√la
funzione x non è derivabile in x = 0. In questo caso, la retta tangente al grafico di x
nel punto x = 0 è verticale.
Ci sono funzioni non derivabili con comportamenti ben diversi da questo. Ad esempio
(
f (x) = |x|
e
g(x) =
x sin
0
1
x
x 6= 0,
x=0
2.1. DEFINIZIONE DI DERIVATA
29
Figura 2.2: Le funzioni x2 e
√
x e le loro derivate.
sono entrambe continue, ma non derivabili in 0. Per la funzione f , la non derivabilità in 0 è
dovuta al fatto che i limiti destro e sinistro del rapporto incrementale esistono finiti ma non
coincidono (il rapporto incrementale ha una discontinuità di salto in 0)
lim
x→0+
|h|
|h|
= 1 6= −1 = lim
.
−
h
h
x→0
Nel grafico, un comportamento di questo genere si traduce nella presenza di un punto angoloso.
Nel caso della funzione g, il rapporto incrementale ha l’espressione
g(h) − g(0)
h sin(1/h) − 0
1
=
= sin
.
h
h
h
Come si è già visto, questa funzione non ha limite (né destro né sinistro) per h → 0. In termini
di grafico (controllare di persona!), questa funzione ha delle variazioni sempre più rapide di
pendenza man mano che ci sia avvicina ad x = 0.
Prime conseguenze della derivabilità
1. Derivabilità ⇒ Continuità. Se una funzione f è derivabile in x0 , allora è anche continua in x0 . Infatti la continuità della funzione f nel punto x0 è equivalente all’affermazione x→x
lim (f (x) − f (x0 )) = 0, e, dato che
0
f (x) − f (x0 ) =
f (x) − f (x0 )
(x − x0 ),
x − x0
passando al limite per x → x0 si ottiene la conclusione.
2. Equazione della retta tangente. Data f : [a, b] → R, sia x0 ∈ [a, b] un punto in cui f è
derivabile, la retta tangente è, per definizione, la retta passante per il punto (x0 , f (x0 )),
il cui coefficiente angolare è pari a f 0 (x0 )
retta tangente:
y = f (x0 ) + f 0 (x0 )(x − x0 ).
30
CAPITOLO 2. DERIVATE, DERIVATE E DERIVATE
Fissato il punto x0 , il polinomio di primo grado in x a secondo membro può essere
visto come un’approssimazione della funzione f vicino al punto x0 .
Nel sostituire la funzione con la sua retta tangente l’errore Rx0 , è pari a
Rx0 (x) = f (x) − f (x0 ) − f 0 (x0 )(x − x0 ).
Per x → x0 , l’errore che si commette tende a zero, cioè
lim Rx0 (x) = lim (f (x) − f (x0 ) − f 0 (x0 )(x − x0 )) = 0.
x→x0
x→x0
(2.2)
Ma (attenzione!) lo stesso è vero per qualsiasi altra retta per il punto (x0 , f (x0 )), infatti
lim (f (x) − f (x0 ) − m(x − x0 )) = 0
x→x0
∀m ∈ R.
Quindi la proprietà (2.2) non è granché indicativa! Il fatto fondamentale è che per Rx0 vale
lim
x→x0
Rx0 (x)
f (x) − f (x0 ) − f 0 (x0 )(x − x0 )
= lim
= 0.
x→x0
x − x0
x − x0
(2.3)
Questa condizione è più restrittiva della precedente (perché?) e, tra le funzioni lineari, è verificata solo da quella che rappresenta la retta tangente ad f in x0 . Tutte le proprietà interessanti
che si deducono dalla derivata di una funzione, in sostanza, provengono dalla (2.3). In effetti,
in maniera equivalente, avremmo potuto dire che una funzione è derivabile in x0 se esiste un
valore ` ∈ R per cui vale
f (x) − f (x0 ) − `(x − x0 )
lim
= 0.
x→x0
x − x0
Il valore ` è pari a f 0 (x0 ). Da questo punto di vista la derivabilità di una funzione descrive la
proprietà di una funzione di potere essere “ben approssimata” con una funzione affine, cioé
del tipo y = mx + q, nell’intorno di un punto x0 .
2.2 Prime formule di derivazione
Polinomi e potenze
Si è già visto che valgono le regole di derivazione
(c)0 = 0,
(x)0 = 1,
(x2 )0 = 2x.
Per un generico polinomio di grado 2, f (x) = ax2 + bx + c si può procedere in modo
analogo. Il rapporto incrementale è
f (x + h) − f (x)
a(x + h)2 + b(x + h) + c − ax2 − bx − c
=
= 2ax + b + h.
h
h
Quindi, passando al limite per h → 0, si ottiene
(ax2 + bx + c)0 = lim 2ax + b + h = 2ax + b.
h→0
2.2. PRIME FORMULE DI DERIVAZIONE
31
In modo simile è possibile derivare un qualsiasi polinomio. Calcoliamo prima di tutto
la derivata della funzione f (x) = xn dove n ∈ N. Il rapporto incrementale si può
scrivere come
f (x1 ) − f (x)
xn − xn
= 1
= xn−1
+ xn−2
x + · · · + xn−1 ,
1
1
x1 − x
x1 − x
dato che xn1 − xn = (x1 − x)(xn−1
+ xn−2
x + · · · + xn−1 ) per ogni x1 , x ∈ R. Passando
1
1
al limite per x1 → x, ciascuno dei termini tende a xn−1 e quindi, dato che si tratta di n
termini, si ottiene
(xn )0 = nxn−1
∀n ∈ N,
(2.4)
(per n = 1, 2 si ottengono le relazioni già note per x e x2 ).
Una volta noto che è possibile calcolare esplicitamente la derivata di un qualsiasi
polinomio, è naturale chiedersi se sia possibile fare lo stesso per funzioni razionali.
Partiamo dal caso più semplice: f (x) = 1/x
1
1
−
f (x1 ) − f (x)
x − x1
1
= x1 x =
=−
.
x1 − x
x1 − x
x1 x(x1 − x)
x1 x
Quindi passando al limite x1 → x, si ottiene la formula
0
1
x
=−
1
.
x2
Allo stesso modo è possibile trattare funzioni del tipo f (x) =
1
1
xβ
con β ∈ N:
1
− xβ
xβ − xβ1
f (x1 ) − f (x)
xβ−1 + xβ−2
x + · · · + xβ−1
xβ
1
= β
= 1
=− 1
.
x1 − x
x1 − x
x1 xβ (x1 − x)
xβ1 xβ
Passando al limite per x1 → x, si ottiene
x
−β 0
1
≡
xβ
0
=−
β
xβ+1
≡ −βx−β−1
∀β ∈ N.
(2.5)
Vedremo più avanti come si possa calcolare la derivata di una generica funzione razionale.
Le formule (2.4) e (2.5) si possono sintetizzare nell’unica formula
(xα )0 = αxα−1
∀ α ∈ Z.
Dimostriamo che è possibile scegliere α ∈ Q ottenendo ancora la formula (2.6).
Supponiamo la funzione f (x) = xα con α = p/q con p e q interi (q 6= 0). Consideriamo, per semplicità, il caso p, q > 0. Il rapporto incrementale è
p/q
x − xp/q
xα1 − xα
= 1
.
x1 − x
x1 − x
(2.6)
32
CAPITOLO 2. DERIVATE, DERIVATE E DERIVATE
1/q
Ponendo x1
= ξ1 e x1/q = ξ, otteniamo
xα1 − xα
ξp − ξp
ξ1p−1 + ξ1p−2 ξ + · · · + ξ p−1
.
= 1q
=
x1 − x
ξ1 − ξ q
ξ1q−1 + ξ1q−2 ξ + · · · + ξ q−1
Passando al limite per x1 → x, cioè per ξ1 → ξ, si ottiene
xα1 − xα
ξ p−1 + ξ1p−2 ξ + · · · + ξ p−1
p
p p −1
p ξ p−1
= lim 1q−1
= ξ p−q = x q ,
=
q−2
q−1
q−1
x1 →x x1 − x
ξ1 →ξ ξ
qξ
q
q
+ ξ1 ξ + · · · + ξ
1
lim
cioè la formula (2.6) per α razionale positivo.
In generale si può dimostrare che (2.6) vale per ogni α ∈ R, cioè
(xα )0 = αxα−1
∀ α ∈ R.
(2.7)
Funzioni trigonometriche
Grazie alle formule di addizione è possibile scrivere i rapporti incrementali di sin x e
cos x come
sin(x + h) − sin x
sin x cos h + cos x sin h − sin x
=
h
h
cos h − 1
sin h
= sin x
+ cos x
,
h
h
cos(x + h) − cos x
cos x cos h − sin x sin h − cos x
=
h
h
cos h − 1
sin h
= cos xx
− sin x
.
h
h
Passando al limite per h → 0 e ricordando che lim cos hh−1 = 0 e lim sinh h = 1, si deducono
h→0
h→0
le formule
(sin x)0 = cos x
e
(cos x)0 = − sin x.
Figura 2.3: Le funzioni sin x e ln x e le loro derivate.
2.3. REGOLE FONDAMENTALI DI DERIVAZIONE
33
Esponenziale e logaritmo
Come ultimo esempio, consideriamo le funzioni ex e ln x. Nel caso dell’esponenziale,
il rapporto incrementale è
ex+h − ex
eh − 1
f (x + h) − f (x)
=
= ex
.
h
h
h
eh −1
h→0 h
Passando al limite per h → 0 e usando il limite notevole lim
= 1,
(ex )0 = ex ,
che esprime una proprietà notevole dell’esponenziale (con base e): la derivata di ex è la
stessa funzione ex . In altri termini, la funzione f (x) = ex risolve l’equazione (differenziale) f 0 = f .
Il rapporto incrementale del logaritmo naturale si riscrive come
f (x + h) − f (x)
ln(x + h) − ln x
1
x+h
=
= ln
h
h
h
x
!
!
1
h
= ln 1 +
.
h
x
Quindi, ponendo t = h/x (x è fissato) e usando il limite notevole lim ln(1+t)
= 1,
t
t→0
f (x + h) − f (x)
1
h
lim
= lim ln 1 +
h→0
h→0 h
h
x
!
1 ln(1 + t)
1
= .
t→0 x
t
x
= lim
2.3 Regole fondamentali di derivazione
Come nel caso degli integrali, dalla definizione dell’operazione di derivazione, discendono alcune regole basilari che permettono di derivare una classe ampia di funzioni, a
partire da una classe più ristretta di derivate note.
Linearità. Dati α, β ∈ R e f, g derivabili, allora anche αf + βg è derivabile e
φ(x) = αf (x) + βg(x)
=⇒
φ0 (x) = αf 0 (x) + βg 0 (x).
Per la dimostrazione di questa proprietà basta osservare che il rapporto incrementale della
funzione φ si può riscrivere come
φ(x + h) − φ(x)
αf (x + h) + βg(x + h) − αf (x) − βg(x)
=
h
h
f (x + h) − f (x)
g(x + h) − g(x)
=α
+β
,
h
h
e passare al limite per h → 0, applicando le proprietà note dei limiti.
34
CAPITOLO 2. DERIVATE, DERIVATE E DERIVATE
Ad esempio, la derivata di un polinomio p(x) = an xn + an−1 xn−1 + · · · + a0 si
può calcolare senza bisogno di passare per il limite del rapporto incrementale, ma
semplicemente usando la linearità della derivazione e la formula (xk )0 = kxk−1 :
(p(x))0 = an (xn )0 + an−1 (xn−1 )0 + · · · + a1 (x)0 + (a0 )0
= nan xn−1 + (n − 1)an−1 xn−2 + · · · + a1 .
Derivata di un prodotto e di un rapporto.
Derivata di un prodotto. Siano f, g derivabili, allora anche f g è derivabile e
φ(x) = f (x)g(x)
=⇒
φ0 (x) = f (x)g 0 (x) + f 0 (x)g(x).
Per quanto bizzaro possa sembrare, questa è la maniera corretta di derivare un prodotto di
funzioni. Per convincersi (cioè per dimostrare la formula), scriviamo il rapporto incrementale
φ(x + h) − φ(x)
f (x + h)g(x + h) − f (x)g(x)
=
h
h
g(x + h) − g(x) f (x + h) − f (x)
= f (x + h)
+
g(x),
h
h
(si è aggiunto e sottratto a numeratore la quantità f (x + h)g(x)). Per h → 0, la conclusione.
Ad esempio, per calcolare la derivata della funzione φ(x) = x sin x,
(x sin x)0 = x(sin x)0 + (x)0 sin x = x cos x + sin x,
avendo usato le formule di derivazione per x e sin x.
Derivata di un rapporto. Se f e g sono derivabili (g 6= 0), allora anche il rapporto f /g è
derivabile e
f (x)
f 0 (x)g(x) − f (x)g 0 (x)
0
φ(x) =
=⇒ φ (x) =
.
g(x)
[g(x)]2
Se l’altra formula pareva folle, questa non ne parliamo... Ma è un fatto della vita: per derivare
un rapporto, bisogna procedere in questo modo. La dimostrazione discende, ovviamente, dal
rapporto incrementale per la funzione rapporto. Niente di sorprendente. La strategia è di
riscrivere questo rapporto incrementale in modo che compaiano quelli delle funzioni f e g:
1 f (x + h) f (x)
f (x + h)g(x) − f (x)g(x + h)
φ(x + h) − φ(x)
=
−
=
h
h g(x + h)
g(x)
hg(x)g(x + h)
f (x + h)g(x) − f (x)g(x) + f (x)g(x) − f (x)g(x + h)
=
hg(x)g(x + h)
f (x + h) − f (x)
g(x + h) − g(x)
1
=
g(x) − f (x)
.
g(x)g(x + h)
h
h
Per h → 0, si ottiene la conclusione.
2.3. REGOLE FONDAMENTALI DI DERIVAZIONE
35
Ad esempio, la derivata di f (x) = tan x è data da
sin x 0 (sin x)0 cos x − sin x(cos x)0
=
cos x
cos2 x
cos x cos x − sin x(− sin x)
cos2 x + sin2 x
1
=
=
=
.
2
2
cos x
cos x
cos2 x
(tan x)0 =
Anche per derivare funzioni razionali basta applicare la formula di derivazione del
rapporto. Ad esempio,
x2
x+1
!0
2x(x + 1) − x2 · 1
x(x + 2)
=
=
.
2
(x + 1)
(x + 1)2
Analogamente per funzioni razionali generali.
Abbiamo sviluppato un certo numero di regole per derivare una classe ampia di
funzioni: polinomi, funzioni razionali, alcune funzioni trigonometriche, alcune funzioni esponenziali... Vogliamo ora estendere ulteriormente le classi di funzioni di cui
sappiamo calcolare esplicitamente la derivata. √In particolare vogliamo sapere come
2
derivare funzioni composte (ad esempio, ex , 1 + sin2 x, . . .) e funzioni inverse (ad
esempio, arcsin x, arccos x, arctan x, . . .).
Derivata di una funzione composta. Siano g, h derivabili, allora la funzione composta f = h ◦ g è derivabile e vale la formula3
f 0 (x) = h0 (g(x)) g 0 (x).
(derivata di funzione composta)
(2.8)
Quindi per derivare una funzione composta, bisogna derivare ciascuna funzione e fare
il prodotto di ciascun termine, calcolato nel valore opportuno. Usare concretamente
questa regola è molto più semplice di quel che possa sembrare. Vediamo, ad esempio,
2
come calcolare la derivata di f (x) = ex .
i. Riconosciamo la struttura di funzione composta:
f (x) = h(g(x))
dove
g(x) = x2 ,
h(s) = es .
ii. Dato che g(x) = x2 e h(s) = es , si ha g 0 (x) = 2x e h0 (s) = es .
iii. Ora basta fare il prodotto delle derivate, calcolando la funzione h0 in s = g(x) = x2 :
D ex
2
2
= 2xex .
√
√
Analogamente, dato che D(sin x) = cos x e D( s) = 1/(2 s),
D
3
√
cos x
1 + sin x = √
.
2 1 + sin x
In inglese, questa regola è comunemente nota come chain rule.
36
CAPITOLO 2. DERIVATE, DERIVATE E DERIVATE
Se la funzione è composta da più di due funzioni, si itera il procedimento:
D (h(g(f (x))))) = h0 (g(f (x))) · g 0 (f (x)) · f 0 (x).
Ad esempio,
1
sin x cos x
1 + sin x = √
· 2 sin x · cos x = √
.
2
2 1 + sin x
1 + sin2 x
q
D
2
C’è un unico modo per imparare l’uso concreto di questa formula ed è di riempire
un buon numero di fogli di derivate di funzioni composte, possibilmente con l’occhio
vigile di qualcuno che controlli l’esattezza del procedimento.
Per dimostrare la formula (2.8), scriviamo il rapporto incrementale

0



∆f
∆h
=
=
∆h ∆g
∆x
∆x 


∆g ∆x
dove
se
∆g = 0,
se
∆g 6= 0,
(2.9)
∆x = x2 − x1
∆f = f (x2 ) − f (x1 )
∆h = h(g(x2 )) − h(g(x1 ))
∆g = g(x2 ) − g(x1 ).
Se, per x2 vicino ad x1 , si ha ∆g 6= 0, la conclusione segue da
∆f
∆h ∆g
∆h
∆g
= lim
= lim
lim
= h0 (g(x1 )) g 0 (x1 ),
∆x→0 ∆x
∆x→0 ∆g ∆x
∆g→0 ∆g ∆x→0 ∆x
lim
dato che ∆g → 0 quando ∆x → 0. Se in ogni intorno di x1 ci sono punti per cui ∆g = 0,
necessariamente la derivata di g in x1 deve essere nulla (come si dimostra?), e quindi vale
la conclusione, dato che entrambe le rappresentazioni di ∆f /∆x in (2.9) tendono a zero per
∆x → 0.
Applicando la formula di derivazione di funzioni composte (2.8) è possibile ottenere le formule per le derivate di
xα
(α ∈ R)
ax
e
(a > 0).
b
Per entrambe è utile osservare che eb ln a = eln a = ab . Questa maniera di scrivere un
esponenziale in base diversa da e tramite un esponenziale con base e è estremamente
utile. A eterna memoria, riscriviamo la formula
ab = eb ln a
∀ a > 0, b ∈ R.
(2.10)
Usando la formula (2.10),
α
α ln x
D(x ) = D(e
α α ln x αxα
)= e
=
= α xα−1
x
x
∀α ∈ R.
2.3. REGOLE FONDAMENTALI DI DERIVAZIONE
37
Analogamente,
D(ax ) = D(ex ln a ) = ex ln a ln a = ax ln a
∀ a > 0.
Derivata di una funzione inversa.
Una conseguenza della formula di derivazione di funzione composta è la formula
della derivata dell’inversa di una funzione. La prima domanda naturale da porsi è: se
la funzione f è invertibile e derivabile, lo è anche la funzione inversa? La risposta è immediata se si pensa a come si ottiene il grafico della funzione inversa a partire da quello
della funzione originale e se si ricorda il significato geometrico della derivabilità. La
funzione f è derivabile in x se in tale punto il grafico ammette tangente e tale retta tangente non è verticale (quando la tangente al grafico è verticale, il rapporto incrementale
tende ad ∞). Il grafico di f −1 si può ottenere da quello della f tramite un ribaltamento
attorno alla bisettrice del primo e del terzo quadrante. In questa operazione di ribaltamento, rette orizzontali diventano verticali e viceversa. Quindi un punto in cui la
tangente al grafico di f è orizzontale (cioè f 0 (x) = 0), corrisponde, nel grafico di f −1 ,
ad un punto in cui la tangente è verticale e viceversa. Questo significa che:
la funzione inversa f −1 è derivabile nel punto y = f (x) se e solo se f 0 (x) 6= 0.
Figura 2.4: Una funzione e la sua inversa, con le relative tangenti.
Ad esempio, funzioni f derivabili con f 0 (x) > 0 dappertutto, hanno sempre inversa
derivabile in ogni punto del loro insieme di definizione. Come si può calcolare la
derivata della funzione inversa f −1 ? Dato che f (f −1 (x)) = x, applicando la formula di
derivazione delle funzioni composte e derivando membro a membro,
f (f −1 (x)) = x
=⇒
f 0 (f −1 (x))(f −1 )0 (x) = 1.
Esplicitando (f −1 )0 (x), si ottiene la
formula di derivazione della funzione inversa :
(f −1 )0 (x) =
1
f 0 (f −1 (x))
.
(2.11)
38
CAPITOLO 2. DERIVATE, DERIVATE E DERIVATE
Verifichiamo questa formula, calcolando di nuovo la derivata della funzione f (x) =
ln x (in precedenza la formula si è ottenuta in modo diverso). In questo caso
f (x) = ex
f −1 (x) = ln x
)
f 0 (f −1 (x)) = eln x = x
⇒
⇒
(ln x)0 =
1
.
x
Ovviamente non sarebbe una grande idea aver dimostrato questa formula se ci portasse a formule già note. Consideriamo le inverse delle funzioni trigonometriche e
calcoliamone
(chi non ne ricordasse le definizioni,
vada a rivederle). Dato
√ le derivate
√
2
2
che cos x = 1 − sin x per x ∈ [−π/2, π/2] e sin x = 1 − cos x per x ∈ [0, π], si ha
f (x) = sin x


f −1 (x) = arcsin x

f (x) = cos x
f
−1
(x) = arccos x


⇒
f 0 (f −1 (x)) = cos(arcsin x) =
⇒
(arcsin x)0 = √
⇒
1
1 − x2
√
1 − x2
∀x ∈ (−1, 1),
√
f 0 (f −1 (x)) = − sin(arccos x) = − 1 − x2

⇒ (arccos x)0 = − √
1
1 − x2
∀x ∈ (−1, 1).
Per quanto riguarda la funzione arctan x, è utile ricordare che
D(tan x) =
cos2 x + sin2 x
1
=
= 1 + tan2 x.
2
cos x
cos2 x
Quindi
f (x) = tan x


f −1 (x) = arctan x

⇒
f 0 (f −1 (x)) = 1 + tan2 (arctan x) = 1 + x2
⇒
(arctan x)0 =
1
.
1 + x2
Ultima, ma non ultima, la formula della derivata di f −1 (x) = loga x con a > 0 qualsiasi:
f (x) = ax
f
−1
(x) = loga x


⇒
f 0 (f −1 (x)) = aloga x ln a = x ln a
⇒
(loga x)0 =

1
.
x ln a
Ora siamo soddisfatti: sappiamo derivare un numero di funzioni molto ampio.
2.4. DERIVATE SUCCESSIVE
2.4
39
Derivate successive
L’operazione di derivazione porta da una funzione f ad una nuova funzione f 0 , la
funzione derivata. E’ naturale chiedersi se questa funzione derivata f 0 possa essere a
sua volta derivata.
Definizione 2.4.1 (Derivate seconda).
Sia f : [a, b] → R derivabile in [a, b] e sia x ∈ [a, b]. Se esiste finito il limite
f 0 (x + h) − f 0 (x)
,
h→0
h
(2.12)
lim
la funzione f è derivabile due volte in x, il limite si indica con f 00 (x) e si chiama derivata
seconda di f in x.
Come sempre, se f è derivabile due volte in tutti i punti dell’intervallo I, si dice che f è
derivabile due volte in I.
Per la derivata seconda si usano anche le notazioni
f 00 =
d2 f
d2 y
2
=
D
f
=
= ···,
dx2
dx2
Analogamente, nel caso di una funzione derivabile due volte, è possibile domandarsi se esista la derivata terza f 000 . Iterando il procedimento si può parlare di derivata
n−esima, che si indica4 con f (n) . Qualche volta si indica la funzione f come la sua
derivata 0−esima: f (0) ≡ f .
Se la variabile indipendente è interpretata come il tempo t e il valore f (t) rappresenta la posizione al tempo t di un punto, il significato fisico della derivata seconda
è la rapidità di cambiamento della velocità, cioè l’accelerazione.
La maniera operativa di calcolare derivate successive è semplicemente di iterare le
formule note per la derivazione. Ad esempio,
f (x) = x3 + x
⇒
f 0 (x) = 3x2 + 1
⇒
f 00 (x) = 6x
⇒
f 000 (x) = 6.
Le derivate di ordine superiore al terzo della funzione f (x) = x3 + x esistono e sono
tutte nulle. In generale, un polinomio p di grado n è infinitamente derivabile (cioè
ammette derivate di qualsiasi ordine), e le sue derivate di ordine maggiore o uguale
ad n + 1 sono tutte nulle. Anche le funzioni sin x e cos x sono infinitamente derivabili:
D(sin x) = cos x, D2 (sin x) = − sin x, D3 (sin x) = − cos x, D4 (sin x) = sin x
D(cos x) = − sin x, D2 (cos x) = − cos x, D3 (cos x) = sin x, D4 (cos x) = cos x.
4
Simboli equivalenti sono
f (n) ≡ Dn f ≡
dn f
dn y
=
.
dxn
dxn
40
CAPITOLO 2. DERIVATE, DERIVATE E DERIVATE
Le derivate successive ripetono lo stesso schema in modo periodico, ossia
D2n−1 (sin x) = (−1)n+1 cos x,
D2n−1 (cos x) = (−1)n sin x,
D2n (sin x) = (−1)n sin x,
D2n (cos x) = (−1)n cos x,
∀n ∈ N.
Pensando al caso di polinomi e funzioni trigonometriche, si potrebbe essere indotti a
credere che tutte le funzioni siano infinitamente derivabili. Un esempio di funzione
che
sia derivabile due volte in un punto, ma non tre volte è f (x) = x5/2 . Infatti f 00 (x) =
√
15
x che, come sappiamo, non è derivabile in zero.
4
Esperimento al calcolatore. Chiedete a Gnuplot di disegnare il grafico delle funzioni
f (x) = x4 ,
f 0 (x) = 4x3 ,
f 00 (x) = 12x2 ,
f 000 (x) = 24x
tramite i comandi
gnuplot> set xrange [-1:1]
gnuplot> plot x**4,4*x**3,12*x**2,24*x
e riflettete sui legami che intercorrono tra i loro grafici...
Figura 2.5: I grafici di y = x4 , y 0 = 4x3 , y 00 = 12x2 , y 000 = 24x.
Notazioni. Comunemente sono usate le notazioni (k ∈ N)
C(I) ≡ C 0 (I) := {funzioni continue in I}
C 1 (I) := {funzioni derivabili in I e con f 0 ∈ C(I)}
C k (I) := {funzioni derivabili k volte in I e con f (k) ∈ C(I)}
C ∞ (I) := {funzioni infinitamente derivabili in I}.
2.5.
∗
DERIVATE PARZIALI
41
Ognuno dei simboli precedenti indica un insieme di funzioni. Gli insiemi di funzioni hanno più struttura di quel che si potrebbe immaginare a prima vista: è
possibile sommare, moltiplicare funzioni, ottenendo nuove funzioni. A partire
da questa osservazione, si sviluppano molti rami estremamente interessanti della
matematica, ma, come spesso accade, il tempo è tiranno...
Primo cenno alle equazioni differenziali. Tramite il concetto di derivata è possibile definire delle funzioni. Ad esempio, le funzioni trigonometriche possono essere
caratterizzate tramite equazioni differenziali: dalle regole di derivazione di sin x e cos x,
f (x) = sin x
o f (x) = cos x
=⇒
f 00 + f = 0.
La relazione (in cui la funzione f è l’incognita del problema)
f 00 + f = 0
(2.13)
è detta equazione differenziale, dato che è un’equazione che coinvolge le derivate della funzione incognita f . L’equazione differenziale (2.13) è nota come equazione dell’oscillatore armonico, e compare in modo naturale quando si studiano fenomeni oscillatori o fenomeni ondosi, come le vibrazioni di una sbarra o le onde di superficie
dell’acqua. In particolare è facile verificare che tutte le funzioni della forma f (x) =
A cos x + B sin x con A, B ∈ R sono soluzioni dell’equazione (2.13).
2.5
∗
Derivate parziali
Molto spesso le funzioni con cui si tratta non dipendono da una sola variabile indipendente x, ma da più di una. Ad esempio, da quante variabili dipende xa ? Da una... e se
pensassimo anche a variabile? Allora sono due: x e a. In effetti, nella prima risposta
abbiamo immaginato a come un parametro fissato, nella seconda abbiamo accettato
una sua possibile variazione. In generale, una funzione di due variabili è un oggetto
del tipo f = f (x, y). Qui la variabile indipendente è la coppia (x, y) che apparterrà
ad un appropriato insieme (dominio di definizione). Se si tiene costante la variabile
y, cioè la si considera un parametro fissato, e si fa variare solo la variabile x, si ottiene
una funzione di una variabile. E’ possibile domandarsi se questa funzione sia o meno
derivabile.
Definizione 2.5.1 La funzione f è derivabile parzialmente rispetto ad x nel punto (x, y)
se esiste il limite
f (x + h, y) − f (x, y)
.
lim
h→0
h
Il valore del limite si indica con uno dei simboli seguenti
∂f
(x, y) = fx (x, y) = Dx f (x, y).
∂x
42
CAPITOLO 2. DERIVATE, DERIVATE E DERIVATE
Analogamente, f è derivabile parzialmente rispetto ad y nel punto (x, y) se esiste
∂f
f (x, y + k) − f (x, y)
(x, y) = fy (x, y) = Dy f (x, y) = lim
.
k→0
∂y
h
Per indicare le derivate parziali si usa il simbolo ∂ (“d storto”) per ricordare che ci
sono molte direzioni di derivabilità e che l’informazione che si ottiene con una singola
derivata è una informazione parziale. Questa è coerenza.
Se f è derivabile rispetto ad x e rispetto ad y, il vettore ∇f (x, y) = (fx (x, y), fy (x, y))
è detto gradiente di f (nel punto (x, y))5 .
Per il calcolo concreto delle derivate parziali, si possono usare le stesse regole di
derivazione di funzioni da R in R, basta ricordarsi di considerare costanti le variabili
rispetto a cui non si deriva. Ad esempio,
f (x, y) = x2 + y 2
f (x, y) = x3 y + y 2
=⇒
=⇒
fx (x, y) = 2x, fy (x, y) = 2y,
fx (x, y) = 3x2 y, fy (x, y) = x3 + 2y.
Analogamente al caso di funzioni da R in R, è possibile definire le derivate successive
di una funzione f . Una funzione di due variabili ammette (al più) due derivate prime
(cioè fx e fy ) e (al più) quattro derivate seconde:
fxx =
∂2f
,
∂x2
fxy =
∂2f
,
∂x∂y
fyx =
∂2f
,
∂y∂x
fyy =
∂2f
.
∂y 2
Ad esempio, consideriamo la funzione f (x, y) = x3 y + y 2 . Allora
fxx = 6x,
fxy = 3x2 ,
fyx = 3x2 ,
fyy = 2.
Guarda caso le derivate fxy e fyx coincidono... Questa proprietà è vera “quasi sempre”!
Chiaramente è possibile definire anche le derivate terze, quarte, . . . .
5
Il simbolo ∇ si legge “nabla”.
2.6. SCHEDA RIASSUNTIVA
2.6
43
Scheda riassuntiva
Definizione 2.1.1 (Derivabilità).
La funzione f è derivabile in x ∈ [a, b] se esiste finito il limite
f 0 (x) = xlim
→x
derivata (prima):
1
f (x1 ) − f (x)
.
x1 − x
Se f è derivabile in tutti i punti di I, f è derivabile in I.
df
dy
Notazioni equivalenti: f 0 =
= Df =
= ẏ = · · ·
dx
dx
Esempi:
La funzione
√
(c)0 = 0,
(x)0 = 1,
√
1
( x)0 = √
2 x
(x2 )0 = 2x,
x 6= 0.
x non è derivabile in x = 0.
Prime conseguenze della derivabilità
1. Derivabilità ⇒ Continuità.
2. Equazione della retta tangente: y = f (x0 ) + f 0 (x0 )(x − x0 ).
(
Due funzioni continue, non derivabili in 0:
f (x) = |x| e g(x) =
x sin
0
1
x
x 6= 0,
x=0
Prime formule di derivazione
(xα )0 = αxα−1
(sin x)0 = cos x
(cos x)0 = − sin x
(ex )0 = ex
(ln x)0 =
1
.
x
Regole fondamentali di derivazione
Linearità:
φ(x) = αf (x) + βg(x)
Prodotto:
φ(x) = f (x)g(x)
Rapporto:
φ(x) =
Funzione composta:
f (x)
g(x)
=⇒
=⇒
φ0 (x) = αf 0 (x) + βg 0 (x).
=⇒
φ0 (x) = f (x)g 0 (x) + f 0 (x)g(x).
φ0 (x) =
f (x) = h(g(x))
⇒
f 0 (x)g(x) − f (x)g 0 (x)
.
[g(x)]2
f 0 (x) = h0 (g(x)) g 0 (x).
Con questa formula si calcolano le derivate di xα (α ∈ R) e ax (a > 0), passando per la
(utilissima!) formula ab = eb ln a per ogni a > 0, b ∈ R.
La funzione inversa f −1 è derivabile in x se e solo se f 0 (f −1 (x)) 6= 0 e vale
44
CAPITOLO 2. DERIVATE, DERIVATE E DERIVATE
(f −1 )0 (x) =
Funzione inversa:
1
f 0 (f −1 (x))
.
Derivate di alcune funzioni inverse:
(ln x)0 =
1
,
x
(arcsin x)0 = √
(arctan x)0 =
1
,
1 − x2
1
,
1 + x2
(arccos x)0 = − √
(loga x)0 =
1
,
1 − x2
1
.
x ln a
Derivate successive
Definizione 2.4.1 (derivata seconda). Se f 0 è derivabile, f è derivabile due volte
Per la funzione f 00 , derivata seconda, si usano le notazioni
f 00 =
d2 f
d2 y
2
=
D
f
=
= ···,
dx2
dx2
Iterando il procedimento si può parlare di derivata n−esima.
Comunemente si scrive (k ∈ N)
C(I) ≡ C 0 (I) := {funzioni continue in I}
C 1 (I) := {funzioni derivabili in I e con f 0 ∈ C(I)}
C k (I) := {funzioni derivabili k volte in I e con f (k) ∈ C(I)}
C ∞ (I) := {funzioni infinitamente derivabili in I}.
Capitolo 3
Teoremi sulle derivate
3.1
Teorema di Lagrange
Dato che il rapporto incrementale è determinato dai valori della funzione in due punti
distinti, esso riflette proprietà della funzione “in grande”. Invece, la derivata, che si
ottiene con un procedimento di limite, riflette solo proprietà “in piccolo”. E’ molto utile
poter dedurre proprietà globali della funzione (cioè “in grande”) a partire da proprietà
locali (cioè “in piccolo”) date dalla derivata prima della funzione. Lo strumento più
utile per questa operazione è il teorema di Lagrange (o teorema del valor medio del calcolo
differenziale).1
Vediamo qual è il contenuto del Teorema di Lagrange dal punto di vista grafico.
Consideriamo il rapporto incrementale
∆f
f (x2 ) − f (x1 )
=
,
∆x
x2 − x1
e supponiamo che la funzione f sia derivabile in tutti i punti dell’intervallo chiuso
(x1 , x2 ). Sappiamo che il rapporto incrementale rappresenta il coefficiente angolare
della retta passante per i punti (x1 , f (x1 )) e (x2 , f (x2 )). Immaginiamo di traslare parallelamente questa secante, allora esisterà un posizione per cui la traslata è tangente al
grafico di f in un qualche punto di coordinate (ξ, f (ξ)), con ξ tra x1 e x2 . Per questo
(x1 )
valore intermedio ξ vale la relazione f 0 (ξ) = f (xx22)−f
.
−x1
Teorema 3.1.1 (Teorema di Lagrange).
Sia f continua in [x1 , x2 ] e derivabile in (x1 , x2 ).
Allora esiste ξ ∈ (x1 , x2 ) tale che
f 0 (ξ) =
f (x2 ) − f (x1 )
.
x2 − x1
1
Nei testi americani, spesso il Teorema di Lagrange è denominato “mean value theorem of differential
calculus” o “intermediate value theorem”.
45
46
CAPITOLO 3. TEOREMI SULLE DERIVATE
Figura 3.1: Il teorema di Lagrange
Un modo equivalente di enunciare la tesi del teorema è affermare che esiste θ ∈ (0, 1) per cui
f 0 (x1 + θ(x2 − x1 )) =
f (x2 ) − f (x1 )
.
x2 − x1
Le due formulazioni sono equivalenti dato che il punto intermedio ξ può sempre essere scritto
nella forma ξ = x1 + θ(x2 − x1 ) per θ ∈ (0, 1) opportuno. Oppure, sostituendo x1 con x e x2 con
x + h, possiamo scrivere
f (x + h) − f (x)
= f 0 (x + θh),
h
θ ∈ (0, 1).
Controesempio 1. “Datemi un punto (interno) di non derivabilità, e vi darò un controesempio.” Se la funzione f non è derivabile in tutti i punti dell’intervallo aperto (x1 , x2 ),
non è detto che valga la conclusione del Teorema di Lagrange: può capitare che nessuna parallela della secante che congiunge gli estremi del grafico sia tangente al grafico
stesso. Consideriamo la funzione f (x) = |x| nell’intervallo [−1, 1]. Questa funzione è
derivabile per ogni x 6= 0 e si ha
(
D(|x|) =
ma, dato che
−1
+1
−1 ≤ x < 0,
0 < x ≤ 1,
f (1) − f (−1)
1−1
=
= 0 6= D(|x|)
1 − (−1)
2
∀x,
la conclusione del Teorema non vale.
Si noti che, mentre è necessaria la derivabilità in tutti i punti interni all’intervallo [x1 , x2 ], cioè
in tutti i punti di (x1 , x2 ), non è necessaria la derivabilità agli estremi dell’intervallo. Ad esempio il
√
Teorema è applicabile alla funzione f (x) = x in [0, 1]. Verifichiamo direttamente la tesi:
√
√
1
1− 0
1
f (1) − f (0)
⇐⇒
ξ= .
= 1 = √ = f 0 (ξ)
=
1−0
4
1−0
2 ξ
Il Teorema di Lagrange è conseguenza del seguente risultato.
3.1. TEOREMA DI LAGRANGE
47
Teorema 3.1.2 (Teorema di Rolle).
Sia φ continua in [x1 , x2 ] e derivabile in (x1 , x2 ).
Se φ(x1 ) = φ(x2 ), allora esiste ξ ∈ (x1 , x2 ) tale che φ0 (ξ) = 0.
Geometricamente, il Teorema di Rolle afferma che, se φ(x1 ) e φ(x2 ) coincidono allora il grafico di φ ha tangente orizzontale in un punto interno dell’intervallo (x1 , x2 ).
Dimostrazione del Teorema di Rolle. Sia ` = φ(x1 ) = φ(x2 ). Dato che la funzione φ è continua
in [x1 , x2 ], per il Teorema di Weierstrass, esistono sia il massimo M che il minimo m di φ in
[x1 , x2 ]. Chiaramente, m ≤ ` ≤ M .
Se M = m, deve essere φ(x) = M in tutto l’intervallo [x1 , x2 ], quindi φ0 (x) = 0 in tutti i
punti dell’intervallo.
Se M 6= m, almeno uno dei due valori deve essere diverso da `. Supponiamo che sia
M 6= ` (l’altro caso si tratta in modo simile). Allora M > ` ed esiste ξ ∈ [x1 , x2 ] tale che
φ(ξ) = M . Inoltre visto che φ(x1 ) = φ(x2 ) = ` 6= M , ξ 6= x1 , x2 , ossia ξ ∈ (x1 , x2 ). Dato che
φ(x) ≤ M = φ(ξ) per ogni x ∈ [x1 , x2 ],
φ(x) − φ(ξ)
x−ξ


 ≤0
∀ x > ξ,

 ≥0
∀ x < ξ,
Passando al limite per x → ξ da destra e da sinistra e, sapendo che i limiti destro e sinistro
esistono e coincidono, si ha
φ(x) − φ(ξ)
φ(x) − φ(ξ)
φ0 (ξ) = lim
≤ 0 e φ0 (ξ) = lim
≥0
x−ξ
x−ξ
x→ξ +
x→ξ −
da cui 0 ≤ φ0 (ξ) ≤ 0, e quindi φ0 (ξ) = 0.
Dimostrazione del Teorema di Lagrange. Data f , definiamo la funzione (ausiliaria) φ
f (x2 ) − f (x1 )
(x − x1 ),
x2 − x1
che rappresenta la distanza verticale tra il punto (x, f (x)) del grafico della funzione e la retta
secante passante per i suoi estremi. La funzione φ soddisfa le ipotesi di regolarità del Teorema
di Rolle (cioè è continua in [x1 , x2 ] e derivabile in (x1 , x2 )). Inoltre
φ(x) := f (x) − f (x1 ) −
f (x2 ) − f (x1 )
(x1 − x1 ) = 0,
x2 − x1
f (x2 ) − f (x1 )
φ(x2 ) = f (x2 ) − f (x1 ) −
(x2 − x1 ) = 0.
x2 − x1
Quindi esiste un valore ξ ∈ (x1 , x2 ) tale che φ0 (ξ) = 0. Dato che
φ(x1 ) = f (x1 ) − f (x1 ) −
φ0 (x) = f 0 (x) −
f (x2 ) − f (x1 )
x2 − x1
si deduce che
φ0 (ξ) = f 0 (ξ) −
cioè la conclusione.
x ∈ (x1 , x2 ),
f (x2 ) − f (x1 )
= 0,
x2 − x1
48
CAPITOLO 3. TEOREMI SULLE DERIVATE
3.2
Conseguenze del Teorema di Lagrange
a. Funzioni monotòne
Sia f derivabile in (a, b). Allora
f 0 (x) > 0 ∀ x ∈ (a, b)
=⇒
(strettamente) crescente in (a, b).
f
Infatti, supponiamo f 0 (x) > 0 per ogni x ∈ (a, b) e siano x1 , x2 in (a, b) tali che x1 < x2 . Per il
Teorema di Lagrange, esiste ξ ∈ (x1 , x2 ) ⊂ (a, b) tale che
f (x2 ) − f (x1 ) = f 0 (ξ)(x2 − x1 ).
Dato che f 0 (ξ) > 0 per ipotesi, ne segue f (x2 ) > f (x1 ).
Analogamente si dimostra che
f 0 (x) < 0 ∀ x ∈ (a, b)
=⇒
(strettamente) decrescente in (a, b).
f
Se invece dell’informazione f 0 (x) > 0 o f 0 (x) < 0, si ha l’informazione più debole
f 0 (x) ≥ 0 o f 0 (x) ≤ 0, la conclusione va sostituita con le analoghe proprietà di monotonı́a deboli (nondecrescente/noncrescente).
Consideriamo, come esempio, la funzione
f (x) =
1
,
1 + x2
e studiamone la monotonı́a. Da quanto si è appena detto, basta studiare il segno della derivata prima di questa funzione. Inoltre, visto che f è una funzione razionale,
sappiamo calcolare esplicitamente l’espressione di f 0
1
1 + x2
Dato che
0
f (x)
0
=−
2x
,
(1 + x2 )2


 <0
∀ x > 0,


∀ x < 0,
>0
la funzione è crescente in (−∞, 0] ed è decrescente [0, +∞). (Per disegnare un grafico della funzione f si può sfruttare anche che f (0) = 1, f ≥ 0 e che f è una funzione
pari).
1
x.
Vediamo un secondo esempio (potentemente istruttivo!). Consideriamo la funzione f (x) =
Dato che la derivata di questa funzione è
f 0 (x) = −
1
<0
x2
∀x 6= 0,
3.2. CONSEGUENZE DEL TEOREMA DI LAGRANGE
49
Figura 3.2: Grafico di 1/(1 + x2 ) e della sua derivata
concludiamo che la funzione f è decrescente... Se però calcoliamo la differenza del valore della
funzione in 1 e in −1, otteniamo una contraddizione: f (1) − f (−1) = 1 + 1 > 0. Cosa sta succedendo? Bisogna stare attenti al fatto che le conclusioni sulla monotonı̀a delle funzioni seguono
dal Teorema di Lagrange che vale su intervalli, cioè su insiemi “senza buchi” (si dicono insiemi
connessi). Se togliamo dall’enunciato del Teorema l’ipotesi di “assenza di buchi”, la conclusione non è più vera.2 Nel caso della funzione 1/x stiamo applicando il Teorema all’insieme
(−∞, 0) ∪ (0, +∞) che invece ha un buco: non contiene il punto 0. Ecco l’errore. Quindi la
funzione f (x) = 1/x NON è decrescente in R \ {0}! Possiamo invece correttamente applicare
i risultati sulla monotonı̀a alle semirette (−∞, 0) e (0, ∞) separatamente e concludere che x1 è
decrescente in (−∞, 0) ed è decrescente in (0, +∞).
b. Funzioni a derivata nulla.
Una seconda conseguenza del Teorema di Lagrange è la seguente:
f 0 (x) = 0 ∀ x ∈ (a, b)
=⇒
f
costante in (a, b).
Infatti, per ogni coppia di valori x1 , x2 ∈ (a, b), esiste un valore ξ, compreso tra i due, per cui
f (x2 ) − f (x1 ) = f 0 (ξ)(x2 − x1 ). Dato che f 0 (x) = 0 per ogni x ∈ (a, b), si avrà, in particolare,
f 0 (ξ) = 0, cioè
f (x2 ) − f (x1 ) = f 0 (ξ)(x2 − x1 ) = 0
=⇒
f (x2 ) = f (x1 ).
Si noti che, anche qui, ha un ruolo fondamentale il fatto che si lavori su intervalli. Ad
esempio, la funzione f definita da
(
f (x) =
2
0
1
x ∈ [0, 1],
x ∈ [2, 3],
Da cui il noto modo di dire, attribuito a N. Barbecue, “Non tutti i Teoremi riescono col buco”...
50
CAPITOLO 3. TEOREMI SULLE DERIVATE
è derivabile nel suo insieme di definizione [0, 1] ∪ [2, 3] e la sua derivata è ovunque
nulla, ma la funzione si guarda bene dall’essere costante.
In vari casi stiamo notando come la proprietà di connessione di un insieme sia una
proprietà importante. Non è questa la sede per approfondire di più la questione.
Sottolineiamo soltanto che la scelta di lavorare principalmente con funzioni definite in intervalli (o semirette) permette di trarre alcune conclusioni che non sarebbero valide nel caso di funzioni definite in insiemi qualsiasi. E’ compito del lettore
attento individuare dove sia possibile estendere i risultati a casi più generali, e
dove il lavorare su intervalli sia indispensabile.
c. Lipschitzianità di funzioni a derivata limitata
La derivabilità di una funzione ne implica la continuità. Vediamo ora un’altra proprietà
nella stessa linea di pensiero. Sia f derivabile in [a, b] e supponiamo inoltre che f 0 sia
limitata in [a, b], cioè supponiamo
∃ M > 0 tale che
|f 0 (x)| ≤ M
∀ x ∈ [a, b].
Per ogni coppia di valori x1 , x2 ∈ [a, b], dal Teorema di Lagrange segue che
|f (x2 ) − f (x1 )| = |f 0 (ξ)(x2 − x1 )| ≤ M |x2 − x1 |.
Quindi
una funzione derivabile con derivata limitata è lipschitziana.
Se f ∈ C 1 ([a, b]), la derivata prima, essendo continua in un intervallo chiuso e limitato,
è anche limitata per il Teorema di Weierstrass. Quindi tutte le funzioni in C 1 ([a, b])
sono lipschitziane.
d. Approssimazione lineare
Un’ulteriore applicazione interessante del Teorema di Lagrange è la stima dell’errore
che si commette approssimando una funzione con la sua tangente in un punto. Sia f
derivabile in [a, b]. Supponiamo di riuscire a calcolare esplicitamente il valore della funzione f e della sua derivata prima f 0 in un punto assegnato x0 ∈ [a, b]. Si può pensare
che il valore della funzione f in un qualsiasi altro punto sia dato approssimativamente
dal valore della funzione lineare che definisce la tangente al grafico di f in x0 , cioè
f (x) ≈ f (x0 ) + f 0 (x0 )(x − x0 ).
Questo corrisponde ad approssimare il grafico della funzione f con quello della sua
tangente. E’ chiaro da questa costruzione che l’errore commesso sarà tanto più piccolo
quanto più piccola è la distanza |x−x0 |. E’ possibile stimare l’errore che commettiamo facendo questa approssimazione? Consideriamo un esempio concreto. Vogliamo calcolare, in
3.2. CONSEGUENZE DEL TEOREMA DI LAGRANGE
51
modo approssimato, il valore di sin(1/10). Dato che 1/10 è ragionevolmente vicino a 0,
possiamo pensare di approssimare la funzione sin x con la sua tangente in x = 0, cioè
sin(x) ≈ x. Calcolando in x = 0, 1 otteniamo l’approssimazione richiesta
sin (0, 1) ≈ 0, 1.
Il problema fondamentale è: qual è l’ordine di grandezza dell’errore commesso? In
altri termini, è possibile stimare la grandezza della differenza | sin (0, 1) − 0, 1|?
Torniamo al caso generale. Supponiamo di lavorare con una funzione f che sia derivabile due volte nell’intervallo [a, b] e supponiamo che la derivata seconda f 00 sia limitata,
cioè esista M > 0 tale che |f 00 | ≤ M . Dato x0 ∈ [a, b], vogliamo stimare il valore assoluto
della quantità
Rx0 (x) = f (x) − f (x0 ) − f 0 (x0 )(x − x0 ).
Applicando il Teorema di Lagrange otteniamo l’espressione
Rx0 (x) = f 0 (ξ)(x − x0 ) − f 0 (x0 )(x − x0 ) = (f 0 (ξ) − f 0 (x0 ))(x − x0 ),
dove ξ è un punto compreso tra x e x0 . Applicando il Teorema di Lagrange all’incremento f 0 (ξ) − f 0 (x0 ) otteniamo
Rx0 (x) = f 00 (η)(ξ − x0 )(x − x0 ),
dove η è un punto compreso tra ξ e x0 . Quindi il valore assoluto dell’errore Rx0 (x) è
stimato da
|Rx0 (x)| = |f 00 (η)||ξ − x0 ||x − x0 | ≤ M |x − x0 |2 ,
(3.1)
dove si è usata la limitatezza della derivata seconda f 00 e il fatto che |ξ − x0 | ≤ |x − x0 |.
Nel caso-modello di f (x) = sin x, x0 = 0 e x = 1/10, si ha
1 R0
≤
10
1
,
100
dove si è usato che |f 00 (x)| = | − sin x| ≤ 1 e |x − x0 | = 1/10. Quindi
0.09 < sin(0.1) < 0.11
e. Derivabilità tramite il limite della derivata
In alcune situazioni, capita di lavorare con funzioni definite tramite formule diverse in diversi
intervalli. Consideriamo come caso modello una funzione della forma
f (x) =


 f1 (x)
`

 f (x)
2
x < x0 ,
x = x0 ,
x > x0 ,
dove ` ∈ R, e f1 , f2 sono funzioni note. La domanda naturale è se la funzione f sia derivabile
nel punto x0 oppure no. Come abbiamo già visto, la derivabilità implica la continuità, quindi,
prima di tutto, deve essere verificata la condizione
lim f1 (x) = ` = lim f2 (x).
x→x−
0
x→x+
0
52
CAPITOLO 3. TEOREMI SULLE DERIVATE
Se questa condizione non è verificata, la funzione non è continua in x0 e quindi, a maggior
ragione, non è neanche derivabile in x0 . Nel caso in cui la funzione sia continua in x0 , per
stabilirne la derivabilità occorre calcolare il limite del rapporto incrementale in x0 . Dato che la
funzione f è definita da espressioni diverse a seconda che ci si trovi a destra o a sinistra di x0 ,
è sensato calcolare il limite del rapporto incrementale da destra e da sinistra.3 Per definizione,
la funzione f è derivabile in x0 se e solo se questi limiti esistono e coincidono, ossia se e solo se
lim
x→x−
0
f2 (x) − `
f1 (x) − `
= lim
.
x − x0
x − x0
x→x+
0
La derivata in x0 è il valore comune di questi due limiti.
In molte situazioni le f1 e f2 sono funzioni derivabili in tutto il loro insieme di definizione
ed è possibile calcolare esplicitamente la funzione derivata. Invece di calcolare il limite del
rapporto incrementale, può essere più semplice calcolare le derivate f10 e f20 nei rispettivi domini
e calcolare il limite di queste funzioni derivate. Quale informazione dà questa procedura?
Proposizione 3.2.1 Dato x0 ∈ R e r > 0, sia f continua in x0 e derivabile in
(x0 − r, x0 + r) \ {x0 } e supponiamo che esistano finiti il limite destro e sinistro
lim f 0 (x) = `± . Allora f è derivabile in x0 se e solo se `+ = `− .
x→x±
0
Dimostrazione. Grazie al Teorema di Lagrange è possibile scrivere il rapporto incrementale
come

0

se x < x0 ,
(x < ξ− < x0 )
 f (ξ− )
f (x) − f (x0 )
=

x − x0
 f 0 (ξ )
se x > x0 ,
(x0 < ξ+ < x)
+
dove ξ± sono punti opportuni tra x e x0 . Passando al limite per x → x0 da sinistra, dato che il
limite sinistro della derivata f 0 esiste ed è uguale ad `− ,
lim
x→x−
0
f (x) − f (x0 )
= lim f 0 (ξ− ) = `− .
x − x0
x→x−
0
Analogamente per il limite destro. Quindi, nelle ipotesi della Proposizione 3.2.1, i limiti destro
e sinistro del rapporto incrementale esistono e sono uguali, rispettivamente, a `+ e `− . A questo
punto, la conclusione è evidente.
Ad esempio, studiamo la derivabilità in 0 della funzione f (x) = x|x|. Dato che
(
x|x| =
−x2
x2
x < 0,
x ≥ 0,
la funzione è certamente derivabile per x 6= 0 e
(
D (x|x|) =
3
−2x
2x
x < 0,
x > 0.
Se esiste il limite destro del rapporto incrementale di una funzione f in x0 , si dice che f è derivabile
da destra in x0 . Analogamente per il limite sinistro. Per indicare il limite destro/sinistro del rapporto
incrementale (qualora esistano), cioè per indicare la derivata destra/sinistra si usa il simbolo D± f (x0 ), o
varianti.
3.3. TEOREMA FONDAMENTALE DEL CALCOLO INTEGRALE
53
Ne segue che
lim −2x = lim 2x = 0,
x→0−
x→0+
la funzione è derivabile in 0.
Consideriamo, invece, la funzione e−|x| . In questo caso
(
−|x|
e
=
ex
e−x
x < 0,
x ≥ 0.
La funzione è derivabile per x 6= 0 e
−|x|
D e
In questo caso
(
=
ex
−e−x
x < 0,
x > 0.
lim ex = 1 6= −1 = lim −e−x ,
x→0−
x→0+
e quindi la funzione non è derivabile in 0.
E’ importante sottolineare che la verifica della derivabilità in x0 tramite il calcolo del limite
della derivata a destra e a sinistra di x0 è lecita solo quando la derivata ammetta limiti destro e
sinistro in x0 . Quando questi limiti non esistano, il criterio non è più valido. La funzione può
essere derivabile o può non esserlo.
Ad esempio, consideriamo la funzione
(
x2 sin
0
f (x) =
1
x
x 6= 0,
x = 0.
Per x 6= 0, la derivata prima f 0 di questa funzione è
1
f (x) = 2x sin
x
0
1
.
x
− cos
Per x → 0, il primo dei due termini è infinitesimo, mentre il secondo non ammette limite, quindi
non esiste lim f 0 (x). La Proposizione 3.2.1 non è applicabile. Per studiare la derivabilità in
x→0±
zero, calcoliamo direttamente il limite del rapporto incrementale
1
h2 sin(1/h) − 0
= lim h sin
h→0
h→0
h−0
h
lim
= 0.
Quindi la funzione è derivabile in 0 e f 0 (0) = 0.
3.3
Teorema fondamentale del calcolo integrale
Torniamo al problema di determinare formule di derivazione e consideriamo il caso
delle funzioni integrali. Sia f ∈ C([a, b]) (cioè una funzione continua in [a, b]). Fissato
α ∈ [a, b], definiamo la funzione φ come segue
φ(x) =
Z
x
α
f (t) dt
x ∈ [a, b].
54
CAPITOLO 3. TEOREMI SULLE DERIVATE
Abbiamo già visto che questa funzione è continua (è anche lipschitziana). Per studiarne la derivabilità, consideriamo il suo rapporto incrementale
 x+h
x

Z
φ(x + h) − φ(x)
1 Z
1 Z x+h
= 
f (t) dt − f (t) dt =
f (t) dt
h
h α
h
x
α
(l’ultima uguaglianza è conseguenza delle proprietà di additività dell’integrale). Dato
che la funzione f è continua, è possibile applicare il Teorema della Media Integrale per
riscrivere il rapporto incrementale come
φ(x + h) − φ(x)
= f (ξ)
h
(ξ
compreso tra x e x + h).
Passando al limite per h → 0 e notando che, dato che f è continua e ξ → x, lim f (ξ) =
h→0
f (x), si deduce
φ(x + h) − φ(x)
= lim f (ξ) = f (x).
h→0
h→0
h
Abbiamo quindi dimostrato il seguente risultato.
φ0 (x) = lim
Teorema 3.3.1 (Teorema Fondamentale del Calcolo Integrale – Prima parte).
Sia f ∈ C([a, b]), α ∈ [a, b]. e φ(x) =
φ0 (x) = f (x).
Zx
f (t) dt per x ∈ [a, b]. Allora φ è derivabile in [a, b] e
α
Questo risultato è estremamente interessante sotto molti punti di vista.
Una prima conseguenza (pratica) notevole è che, dato che siamo in grado di calcolarne la
derivata, possiamo dedurre molte proprietà qualitative importanti anche per una funzione che
non sia espressa direttamente tramite funzioni elementari, ma come integrale di una funzione
elementare. Ad esempio consideriamo la funzione
funzione degli errori:
1
Erf(x) = √
2π
Z
x
2 /2
e−t
dt,
0
(a meno di costanti moltiplicative). Chiaramente questa funzione è ben definita su tutto R (la
2
funzione e−x è continua in tutto R e quindi integrabile su ogni intervallo).
Dal Teorema Fondamentale del Calcolo (I parte), deduciamo che
1
2
D (Erf(x)) = √ e−x /2 > 0.
2π
Quindi le rette tangenti al grafico di questa funzione hanno sempre coefficiente angolare positivo. Tra non molto vedremo come questa informazione si traduca nel fatto che la Erf(x) è
crescente (e quindi invertibile).
Inoltre, il Teorema 3.3.1 risolve un problema interessante:
3.3. TEOREMA FONDAMENTALE DEL CALCOLO INTEGRALE
55
Figura 3.3: La funzione degli errori (sbagliata?)
data f , trovare una funzione F che risolva l’equazione F 0 = f .
L’equazione F 0 = f è un’equazione differenziale in cui il dato è la funzione f e l’incognita
è la funzione F . Una soluzione F di questa equazione si dice primitiva di f . Il Teorema
fondamentale del calcolo afferma che se f ∈ C([a, b]) il problema F 0 = f ammette
almeno una soluzione (data dalla funzione integrale φ), cioè esiste sempre almeno una
primitiva. Da questo punto di vista si può intepretare l’operazione di integrazione come
l’operazione inversa della derivazione.
Teorema 3.3.2 (Teorema Fondamentale del Calcolo Integrale – Seconda parte).
Sia f definita in [a, b] e siano F e G due sue primitive. Allora esiste c ∈ R tale che
F (x) − G(x) = c
per ogni
x ∈ [a, b].
Dimostrazione del Teorema Fondamentale (II parte). La dimostrazione è molto semplice.
Calcoliamo la derivata della funzione differenza F − G:
(F (x) − G(x))0 = F 0 (x) − G0 (x) = f (x) − f (x) = 0.
Per quanto già visto (Sezione 3.2(b)), la differenza F − G deve essere costante.
Quindi, se
f ∈ C([a, b]), l’equazione F 0 = f è completamente risolta: tutte le soluzioni sono della
forma
Z x
f (t) dt + c
c ∈ R.
α
La classe delle primitive della funzione f si indica con
Z
f (x) dx,
56
CAPITOLO 3. TEOREMI SULLE DERIVATE
e si chiama integrale indefinito di f . Si noti bene che l’integrale indefinito di una
funzione indica una classe di funzioni, e non una singola funzione.
Sintetizziamo i due risultati enunciati in un’unico Teorema.
Teorema 3.3.3 (Teorema Fondamentale del Calcolo Integrale).
Data f ∈ C([a, b]), le soluzioni dell’equazione differenziale F 0 = f sono tutte e
sole della forma
F (x) =
Z x
α
α ∈ [a, b] e
con
f (t) dt + c,
c ∈ R.
Se si cerca una primitiva F di una funzione f con la richiesta aggiuntiva che la
funzione F valga in un punto assegnato x0 un valore dato y0 , cioè se si vuole risolvere
(
dati f ∈ C([a, b]), x0 ∈ [a, b], y0 ∈ R, trovare F tale che
F 0 (x) = f (x),
F (x0 ) = y0 ,
(3.2)
la soluzione F esiste, è unica ed è data da
F (x) = y0 +
Z
x
f (t) dt.
x0
Il problema (3.2) rientra nella classe dei problemi di Cauchy per equazioni differenziali.
Primitive e calcolo degli integrali definiti.
Il Teorema fondamentale del calcolo ha una conseguenza interessante che riguarda il
calcolo esplicito di integrali definiti. Fino ad adesso, data una funzione f continua
abbiamo visto che ha senso parlare del suo integrale definito nell’intervallo [a, b]
Z
b
f (t) dt.
a
(3.3)
Abbiamo anche calcolato il valore di questo integrale definito per scelte particolari
della funzione f . Il calcolo era basato sulla costruzione dell’integrale tramite somme
approssimanti e sul fatto che queste somme approssimanti, grazie ad alcune proprietà
delle funzioni che abbiamo considerato, possono essere riscritte in una forma che permette di passare al limite ed ottenere il valore esplicito dell’integrale. Concretamente
questa strategia di calcolo non è affatto conveniente.
Supponiamo ora di voler calcolare (3.3) e supponiamo di conoscere già (per altre
vie) una primitiva della funzione f , cioè una funzione F tale che F 0 = f . Sappiamo
che anche la funzione integrale definita da
φ(x) =
Z
x
a
f (t) dt.
3.3. TEOREMA FONDAMENTALE DEL CALCOLO INTEGRALE
57
è una primitiva di f e, quindi, per il Teorema Fondamentale del Calcolo (II parte),
differisce da F per una costante, cioè φ(x) = F (x) + c per qualche c ∈ R. La costante c
può essere determinata, calcolando in x = a:
0 = φ(a) = F (a) + c
c = −F (a).
=⇒
Si deduce quindi che φ(x) = F (x) − F (a) e quindi
Z
b
f (t) dt = φ(b) = F (b) − F (a).
a
Quindi, se si conosce una primitiva F della funzione f , l’integrale definito di f in [a, b] è
uguale alla differenza dei valori della primitiva in b e in a, cioè
F0 = f
=⇒
Z
b
f (t) dt = F (b) − F (a).
a
b
h
ib
La differenza F (b) − F (a) si indica anche con F (x) , o F (x) .
a
a
Ad esempio, abbiamo visto che
b
1
x2 dx = (b3 − a3 ).
3
a
Per dimostrare questa formula, siamo passati per una rappresentazione (non banale)
della somma dei quadrati dei primi n numeri interi. Grazie a quanto abbiamo appena
notato, per calcolare lo stesso oggetto, basta determinare una primitiva della funzione
x2 . Dato che D(x3 ) = 3x2 ,
1 3
x = x2 ,
D
3
quindi una primitiva di x2 è x3 /3. Otteniamo perciò
Z
b
Z
x2 dx =
a
1 3 b
1
1
1
x = b3 − a3 = (b3 − a3 ).
a
3
3
3
3
Più in generale, dato che
D
vale la formula
b
1
xn+1 = xn ,
n+1
b
1
1
xn+1 =
(bn+1 − an+1 ).
a
n+1
n+1
a
Nello stesso modo possiamo ottenere formule di integrazione per altre funzioni. Ad
esempio,
Z
xn dx =
Z
b
a
b
sin x dx = − cos x = cos a − cos b.
a
Attenzione! L’integrazione esplicita tramite una primitiva nota è una scorciatoia
notevole rispetto al calcolo del limite delle somme approssimanti, ma è una “fortuna occasionale”. Esistono tante funzioni per cui non è possibile determinare una
primitiva in forma elementare. Non bisogna perciò mai confondere la definizione
di integrale definito (che ha senso per ogni funzione continua) e il calcolo tramite
una primitiva nota (che si può realizzare solo in alcuni casi).
58
3.4
CAPITOLO 3. TEOREMI SULLE DERIVATE
Scheda riassuntiva
Teorema di Lagrange
Teorema 3.1.1 (Teorema di Lagrange).
Sia f continua in [x1 , x2 ] e derivabile in (x1 , x2 ). Allora esiste ξ ∈ (x1 , x2 ) tale che
f 0 (ξ) =
f (x2 ) − f (x1 )
.
x2 − x1
Graficamente, esiste un posizione per cui la traslata della retta per i punti (x1 , f (x1 )) e
(x2 , f (x2 )) è tangente al grafico di f in (ξ, f (ξ)).
Controes. 1. La funzione f (x) = |x| in [−1, 1] è derivabile per x 6= 0 e
f (1) − f (−1)
6= D(|x|)
1 − (−1)
Teorema 3.1.2 (Teorema di Rolle).
Sia φ continua in [x1 , x2 ] e derivabile in (x1 , x2 ). Se φ(x1 ) = φ(x2 ), allora esiste ξ ∈ (x1 , x2 )
tale che φ0 (ξ) = 0.
Geometricamente, il Teorema di Rolle afferma che il grafico di φ ha tangente orizzontale in un punto interno dell’intervallo (x1 , x2 ).
Conseguenze del Teorema di Lagrange
a. Funzioni monotòne
f 0 (x) > 0 ∀ x ∈ (a, b)
f 0 (x) < 0 ∀ x ∈ (a, b)
=⇒
=⇒
f
crescente in (a, b).
decrescente in (a, b).
f
Analogamente
f 0 (x) ≥ 0 ∀ x ∈ (a, b)
f 0 (x) ≤ 0 ∀ x ∈ (a, b)
=⇒
=⇒
debolmente crescente in (a, b).
f
f
debolmente decrescente in (a, b).
b. Funzioni a derivata nulla.
f 0 (x) = 0 ∀ x ∈ (a, b)
=⇒
f
costante in (a, b).
c. Lipschitzianità di funzioni a derivata limitata
Una funzione derivabile con derivata limitata è lipschitziana.
In particolare, le funzioni in C 1 ([a, b]) sono lipschitziane.
d. Approssimazione lineare
3.4. SCHEDA RIASSUNTIVA
59
Se esiste M > 0 tale che |f 00 | ≤ M in [a, b], allora
|Rx0 (x)| = |f 00 (η)||ξ − x0 ||x − x0 | ≤ M |x − x0 |2 ,
dove Rx0 (x) = f (x) − f (x0 ) − f 0 (x0 )(x − x0 ).
e. Derivabilità tramite il limite della derivata
Proposizione 3.2.1.
Dato x0 ∈ R e r > 0, sia f continua in x0 e derivabile in
(x0 − r, x0 + r) \ {x0 } e supponiamo che esistano finiti il limite destro e sinistro
lim f 0 (x) = `± . Allora f è derivabile in x0 se e solo se `+ = `− .
x→x±
0
Se il limite della derivata a destra e a sinistra di x0 non esistono, il criterio non è applicabile:
la funzione può essere derivabile o può non esserlo.
Teorema fondamentale del calcolo integrale
Teorema 3.3.1 (Teorema Fondamentale del Calcolo Integrale – Prima parte).
Sia f ∈ C([a, b]), α ∈ [a, b] e φ(x) =
Zx
f (t) dt per x ∈ [a, b]. Allora φ è derivabile in [a, b] e
α
φ0 (x) = f (x).
Teorema 3.3.2 (Teorema Fondamentale del Calcolo Integrale – Seconda parte).
Sia f definita in [a, b] e siano F e G due sue primitive. Allora esiste c ∈ R tale che F (x) −
G(x) = c per ogni x ∈ [a, b].
Problema: data f , trovare una funzione F che risolva l’equazione F 0 = f .
Una funzione F tale che F 0 = f è una primitiva di f . Le primitive di f si indicano con
Z
f (x) dx
integrale indefinito di f
Teorema 3.3.3 (Teorema Fondamentale del Calcolo Integrale).
Data f ∈ C([a, b]), le soluzioni dell’equazione differenziale F 0 = f sono tutte e sole della forma
F (x) =
Z
x
con α ∈ [a, b] e c ∈ R.
f (t) dt + c
α
Primitive e calcolo degli integrali definiti. Se si conosce una primitiva F della funzione f , l’integrale definito di f in [a, b] è uguale alla differenza dei valori della primitiva in b e in a:
Z b
0
F =f
=⇒
f (t) dt = F (b) − F (a).
a
60
CAPITOLO 3. TEOREMI SULLE DERIVATE
Capitolo 4
Analisi locale
Grazie ai concetti di limite e di derivazione è possibile analizzare con relativa precisione una classe ampia di funzioni, in modo da determinarne proprietà qualitative
importanti. In genere si distinguono le proprietà locali da quelle globali. Una proprietà
di una funzione f è locale se dipende dal comportamento della funzione nell’intorno
di un punto x. Continuità e derivabilità in x sono proprietà locali. Una proprietà di
una funzione f è globale se vale in tutto l’insieme di definizione della f . Ad esempio le
funzioni ex , arctan x, x3 , . . . sono funzioni globalmente monotòne crescenti e pertanto
(globalmente) invertibili. L’obiettivo di questo capitolo è di approfondire l’uso della
derivazione per determinare proprietà locali di funzioni. Torneremo più avanti sulle
proprietà globali.
4.1
Punti stazionari
Data f : I → R, un punto x0 ∈ I è punto di massimo di f se vale
f (x) ≤ f (x0 )
∀ x ∈ I.
Il valore f (x0 ) = max f (x) è il massimo della funzione f in I. Analogamente per i
x∈I
minimi.
L’esistenza di un valore massimo o di un valore minimo per una funzione è una
proprietà globale della funzione. E’ utile introdurre un analogo locale del concetto di
massimo e di minimo.
Definizione 4.1.1 (Massimo e minimo relativo)
Il punto x0 ∈ I è un punto di massimo relativo e il valore f (x0 ) è un massimo relativo di
f se esiste un intorno del punto x0 tale che tutti i valori della funzione in quell’intorno sono
minori o uguali a f (x0 ), cioè
∃δ > 0
tale che
f (x) ≤ f (x0 )
Analogamente per il minimo relativo.
61
∀x ∈ I,
|x − x0 | < δ.
62
CAPITOLO 4. ANALISI LOCALE
Un punto x0 che sia o di massimo relativo o di minimo relativo è un punto di estremo
relativo.
Se un punto x0 è un punto isolato dell’insieme di definizione di f , allora è sempre
un punto di massimo e di minimo relativo! Colpo di scena!
Se una funzione ha un massimo o un minimo relativo in corrispondenza di un punto x0 in cui la funzione è derivabile e tale punto è interno all’insieme di definizione,
necessariamente deve essere
f 0 (x0 ) = 0.
Dimostrazione. La dimostrazione è ovvia pensando alla necessaria posizione orizzontale della
retta tangente. Per una dimostrazione analitica, sia x0 un punto di massimo relativo interno e
supponiamo f derivabile in x0 . Dato che f (x) ≤ f (x0 ) per ogni x ∈ (x0 − δ, x0 + δ) ⊂ I
f (x) − f (x0 )
x − x0


 ≤0
∀ x0 < x < x0 + δ,

 ≥0
∀ x0 − δ < x < x0 ,
Passando al limite per x → x0 si deduce f 0 (x0 ) = 0 (si ragiona come per la dimostrazione del
Teorema 3.1.2).
Nel caso in cui il punto non sia interno al dominio, non vale la conclusione. Ad
esempio, se f : [a, b] → R è derivabile in a e a è un punto di massimo relativo, si
deduce solamente che f 0 (a) ≤ 0. Conclusioni analoghe si possono trarre per l’estremo
destro e per i punti di minimo.
Risolvere l’equazione f 0 (x) = 0 permette di determinare i possibili candidati a punti
di minimo o massimo relativo interno in cui f è derivabile (chiaramente, è possibile che
un estremo relativo cada in un punto in cui la funzione non è derivabile).
Definizione 4.1.2 (Punto stazionario).
Se f 0 (x) = 0, allora si dice che x è un punto stazionario1 o critico della funzione f .
Equivalentemente, si possono immaginare i punti critici di f come i valori x per cui
la tangente al grafico di f in (x, f (x)) è orizzontale.
Esercizio. Determinare i punti critici della funzione f (x) = x7 + 14x4 + 1.
Soluzione. La derivata di f è f 0 (x) = 7x3 (x3 + 8), quindi
f 0 (x) = 0
⇐⇒
x3 = 0 o x3 + 8 = 0
⇐⇒
x ∈ {0, −2}.
La funzione f ha due punti stazionari: x = 0 e x = −2.
1
Il termine stazionario è ereditato dalla cinematica. In quel contesto la funzione f gioca il ruolo della
posizione di una particella al tempo x e f 0 (x) è la sua velocità. Un punto in cui la derivata è nulla
corrisponde ad un istante di arresto.
4.1. PUNTI STAZIONARI
63
Classificazione dei punti stazionari
Si è detto che se x0 è un punto di massimo o di minimo relativo interno, necessariamente f 0 (x0 ) = 0. Il viceversa non è vero: esistono punti x0 tali che f 0 (x0 ) = 0, ma che
non sono né punti di massimo relativo, né punti di minimo relativo. Ad esempio, la
funzione f (x) = x3 è strettamente crescente (quindi non ha né punti di massimo né
punti di minimo in R), ma f 0 (x) = 3x2 si azzera nel punto x = 0.
Un modo per individuare quando un punto stazionario sia anche punto di massimo
o di minimo è tramite il segno della derivata prima alla destra e alla sinistra del punto
in questione. Supponiamo f derivabile in (x0 − δ, x0 + δ) con δ > 0. Allora
f 0 (x)


 ≥0
x 0 − δ < x < x0 ,
≤0
x0 < x < x0 + δ,


=⇒
x0
punto di massimo relativo.
=⇒
x0
punto di minimo relativo.
Analogamente, per il minimo, vale
0
f (x)


 ≤0
x 0 − δ < x < x0 ,
≥0
x0 < x < x0 + δ,


Queste affermazioni seguono dal legame tra monotonia e segno di f 0
f 0 (x) ≥ 0 ∀ x ∈ (a, b)
f 0 (x) ≤ 0 ∀ x ∈ (a, b)
=⇒
=⇒
f
f
debolmente crescente in (a, b),
debolmente decrescente in (a, b),
che abbiamo già visto come conseguenze del Teorema di Lagrange.
Esercizio. Determinare i punti critici della funzione f (x) = x2 (3x2 − 8x + 6) e dire
quali di essi sono punti di massimo o di minimo.
Soluzione. La derivata prima della funzione è
f 0 (x) = 2x(3x2 − 8x + 6) + x2 (6x − 8) = 12x(x2 − 2x + 1) = 12x(x − 1)2 .
I punti critici sono x = 0 e x = 1; il punto x = 0 è punto di minimo, mentre il punto
x = 1 non è né di massimo né di minimo.
Sia x0 un punto critico di f . Per riconoscere se f 0 cambia segno traversando x0 ,
basta considerare il segno di f 00 , qualora esista. Quindi
f 0 (x0 ) = 0,
f 00 (x0 ) > 0
=⇒
x0
punto di minimo relativo;
f 0 (x0 ) = 0,
f 00 (x0 ) < 0
=⇒
x0
punto di massimo relativo.
Nota bene! Si tratta solo di condizioni sufficienti: ad esempio, la funzione f (x) = x4
ha un punto di minimo in 0, ma f 00 (0) = 0.
64
∗
CAPITOLO 4. ANALISI LOCALE
Alcuni esempi raffinati
In genere, si immagina il grafico di una funzione vicino al punto di minimo come se valgano
le ipotesi scritte in precedenza, cioè con f 0 (x) ≤ 0 per x0 − δ < x < x0 e f 0 (x) ≥ 0 per
x0 < x < x0 + δ. Esistono però anche situazioni in cui una funzione alla sinistra del punto di
minimo non è decrescente e alla destra non è crescente. Scetticismo? Ecco un esempio:

 x2 2 − sin 1
f (x) =
x

x 6= 0,
0
x = 0.
Figura 4.1: Il grafico della funzione f
La funzione f è derivabile in tutto R e
f (x) ≥ 0
∀ x ∈ R,
f (x) = 0
⇐⇒
x = 0.
Quindi il punto x = 0 è punto di minimo assoluto, e quindi di minimo relativo. Necessariamente f 0 (0) = 0 (come si può ottenere anche tramite il calcolo del limite del rapporto
incrementale). La derivata prima di f nei punti x 6= 0 è
f 0 (x) = 2x 2 − sin
quindi, per x ≈ 0, si ha f 0 (x) ≈ cos
1
x
1
x
1
,
x
+ cos
, che assume valori sia positivi che negativi.
L’esempio appena presentato proviene da una variante della funzione sin(1/x). La proprietà fondamentale di questa funzione (e della sua “discendenza”) è di avere un numero infinito di oscillazioni che si accumulano vicino al punto x = 0. Tipicamente, questa eventualità
sfugge alla prima intuizione. E’ proprio questo fatto che fa della funzione sin(1/x) un esempio
fondamentale.
Cogliamo l’occasione per far notare un’altra sottigliezza. Sappiamo che se g 0 (x) > 0 in un
intervallo, necessariamente la funzione g è crescente. Cosa succede se g 0 (x0 ) > 0 nel solo punto
x0 ? La possibilità di tracciare la retta tangente (che è crescente) suggerirebbe il fatto che la
funzione g sia crescente, per lo meno in un intorno di x0 . Invece questa affermazione è falsa!
Consideriamo la funzione g(x) = 12 x + f (x), essendo f (x) la precedente funzione, cioè
(
g(x) =
1
2x
0
+ x2 2 − sin
1
x
x 6= 0,
x = 0,
4.2. PUNTI DI SINGOLARITÀ
65
Anche questa funzione è derivabile dappertutto e si ha
(
0
g (x) =
Quindi g 0 (0) =
1
2
1
2
1
2
+ cos
1
x
+ 2x 2 − sin
1
x
x 6= 0,
x = 0,
> 0, ma in ogni intorno di x = 0 cadono punti in cui la derivata è negativa: si
tratta dei punti in cui cos x1 è uguale a −1. Quindi non è vero che la funzione g è crescente in un
intorno dell’origine.
Si noti che se g 0 fosse stata continua, g 0 (x0 ) > 0 avrebbe implicato g 0 (x) > 0 in un intorno di
x0 e quindi la monotonia in tale intorno.
4.2
Punti di singolarità
In generale il termine “singolarità” è usato in modo vago e con significati diversi. Qui,
per punti di singolarità ci riferiamo ad una di queste situazioni:
(a) valori x che non sono nell’insieme di definizione di f , ma che sono sul
bordo (ad esempio, se f : (a, b] → R, il punto a);
(b) punti dell’insieme di definizione in cui f non è continua;
(c) punti in cui f è continua, ma non derivabile.
Nel seguito, indichiamo sempre con x0 il punto di singolarità.
Asintoti verticali. Sia nel caso (a) che nel caso (b), si calcola il limite
lim f (x).
x→x0
Nel caso in cui il limite sia +∞ o −∞, la funzione ha in x = x0 un
asintoto verticale. Lo stesso è vero nel caso in cui sia il limite destro che il limite sinistro tendano a +∞ o −∞, ma con segni opposti. In generale, zeri del denominatore
di una funzione razionale (che non siano anche zeri del numeratore), corrispondono a
punti di asintoto verticale.
Le situazioni in cui il limite non esista o non esista finito o esistano i limiti destro e
sinistro, ma con valori diversi, danno luogo a discontinuità evidenti.
Punti angolosi e cuspidi. Consideriamo il caso (c), quindi supponiamo x0 tale che la
funzione f sia continua in x0 , ma non derivabile. Se esistono finiti i limiti destro e
sinistro della derivata prima
lim± f 0 (x) = `± ,
x→x0
66
CAPITOLO 4. ANALISI LOCALE
dato che f non è derivabile in x0 , deve essere `+ 6= `− . Un punto di questo genere si
chiama punto angoloso (o spigolo). Per disegnarlo correttamente è possibile tracciare
le rette tangenti destra e sinistra, cioè le rette di equazione
y = f (x0 ) + `± (x − x0 ).
Nel caso in cui i limiti destro e sinistro siano ±∞ si possono avere due situazioni
differenti. Se entrambi sono +∞ (o −∞), cioè se
lim f 0 (x) = +∞
x→x±
0
(−∞),
il punto x0 è un punto a tangente verticale. Se invece i limiti destro e sinistro sono ±∞,
ma con segni opposti, il punto x0 è una√cuspide del grafico di f . Per un esempio di
3
cuspide, si consideri la funzione f (x) = x2 . In questo caso
2
lim± f 0 (x) = lim± √
= ±∞.
x→0
x→0 3 3 x
Ovviamente sono possibili comportamenti analoghi a quelli descritti, ma misti: ad
esempio, è possibile che una funzione abbia la derivata prima che tende ad un valore
dato da destra e che diverge da sinistra, o tutte le varianti che la mente è in grado di
inventare. Fate voi.
Un altro esempio. Consideriamo a mo’ d’esempio, la funzione
1
x
f (x) = arctan
x 6= 0.
Il punto x = 0 è un punto di singolarità del grafico in cui la funzione non è definita. E’
Figura 4.2: Il grafico di arctan
1
x
immediato verificare che
π
1
=−
x
2
lim− arctan
x→0
1
π
=
x
2
e
lim+ arctan
x→0
4.3. COMPORTAMENTO ASINTOTICO
67
Inoltre
1
→ −1 per x → 0± .
2
1+x
Quindi la funzione f ha una tangente destra ed una tangente sinistra (diverse) in x = 0
e, vicino a 0, si comporta come la funzione g
f 0 (x) = −
(
g(x) =
− π2 − x
π
−x
2
x < 0,
x > 0.
4.3 Comportamento asintotico
Se la funzione f è definita in insiemi illimitati, è interessante studiarne il comportamento per x → ∞. Con un abuso di notazione, si può parlare di studio della funzione
nell’intorno di +∞ (o di −∞).
Sia f una funzione definita su una semiretta f : [a, +∞) → R con a ∈ R. In questo
caso si vuole stabilire cosa succeda per x → +∞, cioè determinare il comportamento
asintotico per x → +∞. Considerazioni analoghe valgono per il caso di semirette del
tipo (−∞, a], per R, e per tutte le varianti di domini illimitati che l’immaginazione (e
la realtà matematica) è in grado di produrre.
Sia f : [a, +∞) → R. La prima operazione sensata è il calcolo del limite per x →
+∞. Se tale limite esiste finito, cioè se
∃ lim f (x) = ` ∈ R,
x→+∞
si dice che la funzione f tende asintoticamente ad `, oppure che f ha un asintoto
orizzontale (di equazione y = `) per x → +∞. Per disegnare più correttamente il
grafico può essere interessante studiare il segno della funzione f (x) − `, che indica se
il grafico della funzione f sia al di sopra o al di sotto dell’asintoto.
Ad esempio, consideriamo la funzione
f (x) =
2x2
x2 + 1
x ∈ [1, +∞).
In questo caso,
2x2
= 2,
x→+∞ x2 + 1
lim
quindi la funzione ha l’asintoto orizzontale di equazione y = 2. Studiamo il segno della
funzione f (x) − `
2x2
2
f (x) − ` = 2
−2=− 2
< 0,
x +1
x +1
quindi la funzione f tende a y = 2 dal basso.
Invece, la funzione
2x2 sin x
f (x) = 2
x +1
x ∈ [1, +∞),
68
CAPITOLO 4. ANALISI LOCALE
Figura 4.3: Il grafico di f (x) =
2x2
x2 +1
non ha limite per x → +∞ e quindi non ha asintoto orizzontale.
Nel caso in cui il limite della funzione f esista, ma sia ±∞ è possibile che la funzione
tenda asintoticamente ad un asintoto obliquo, ossia è possibile che esistano a, b ∈ R tali
che
lim [f (x) − (ax + b)] = 0.
(4.1)
x→+∞
Questa proprietà indica che il grafico della funzione f si avvicina al grafico della retta
y = ax + b per x → +∞. Il problema è: come determinare (qualora esistano) le costanti a e
b? Supponiamo che valga (4.1), allora
f (x)
f (x) − ax
= lim
+ a = a.
x→+∞ x
x→+∞
x
lim
Una volta noto a, è possibile determinare b (qualora esista) calcolando
lim [f (x) − ax] = b.
x→+∞
Quindi, per determinare la presenza di un asintoto obliquo
(i) calcolare lim f (x): se il limite esiste finito, c’è un asintoto orizzontale
x→+∞
(fine dello studio a +∞), se il limite non esiste, non c’è né asintoto obliquo,
né asintoto orizzontale (fine dello studio a +∞), se il limite è +∞ o −∞ si
va al punto (ii);
(ii) calcolare lim f (x)/x: se il limite esiste finito, il suo valore è a e si va
x→+∞
al punto (iii), se il limite non esiste o se vale ±∞, non c’è asintoto obliquo
(fine dello studio a +∞);
(iii) calcolare lim [f (x) − ax]: se il limite esiste finito, il suo valore è b, la
x→+∞
funzione ha asintoto obliquo di equazione y = ax + b, se il limite non esiste
o se vale ±∞, non c’è asintoto obliquo (fine dello sudio a +∞).
4.3. COMPORTAMENTO ASINTOTICO
69
Consideriamo ad esempio la funzione
f (x) =
3x2 − 1
x+1
x ∈ [0, +∞).
Si ha
3x2 − 1
= +∞,
x→+∞
x→+∞ x + 1
3x2 − 1
f (x)
= lim
= 3 =: a,
lim
x→+∞ x(x + 1)
x→+∞ x
3x2 − 1
−1 − 3x
− 3x = lim
= −3 =: b.
lim f (x) − 3x = lim
x→+∞ x + 1
x→+∞
x→+∞ x + 1
lim f (x) = lim
Quindi la funzione ha un asintoto obliquo di equazione y = 3x − 3. Anche in questo caso, per
disegnare un grafico più preciso, si può studiare il segno della funzione
f (x) − (ax + b) =
3x2 − 1
2
− (3x − 3) =
>0
x+1
x+1
∀ x > −1.
Visto che la differenza è positiva il grafico della funzione tende a quello dell’asintoto dall’alto.
Figura 4.4: Il grafico di f (x) =
3x2 −1
x+1
Dopo il punto (i), se esiste finito lim f 0 (x), allora a è uguale al valore di questo
x→+∞
limite e si può proseguire direttamente dal punto (iii). Se invece il limite di f 0 non
esiste, bisogna necessariamente seguire il procedimento esposto sopra. Ad esempio,
sin(x2 )
per f (x) = x +
, si ha
x
f 0 (x) = 1 + 2 cos(x2 ) −
sin(x2 )
,
x2
che non ammette limite per x → +∞, ma è facile vedere che la funzione ha un asintoto
obliquo per x → +∞ di equazione y = x.
70
CAPITOLO 4. ANALISI LOCALE
Altri profili asintotici
In alcune situazioni particolari, può capitare che una data funzione f tenda asintoticamente ad
una funzione nota, che non sia un polinomio di primo grado. Consideriamo, ad esempio,
f (x) =
x3 + 1
.
x−2
Grazie all’algoritmo di divisione di polinomi, possiamo riscrivere questa funzione come
f (x) = x2 + 2x + 4 +
9
.
x−2
Da questa espressione è immediato vedere che
lim (f (x) − (x2 + 2x + 4)) = 0,
x→±∞
e quindi il grafico di f tende asintoticamente alla parabola y = x2 + 2x + 4.
Riconsideriamo la funzione
f (x) =
2x2 sin x
x2 + 1
x ∈ [1, +∞).
2
Dato che x2x
2 +1 → 2 per x → +∞, è sensato immaginare che questa funzione “assomigli” alla
funzione f (x) = 2 sin x per x → +∞. Calcoliamo la differenza tra f (x) e 2 sin x e vediamo se è
infinitesima:
2x2 sin x
2 | sin x|
2
− 2 sin x =
≤
→0
2
2
x +1
1+x
1 + x2
per x → +∞.
Quindi
2x2 sin x
= 2 sin x + h(x)
con
lim h(x) = 0.
x→+∞
x2 + 1
In generale se siamo in grado di riscrivere la funzione f nella forma
f (x) =
f (x) = g(x) + h(x)
con g funzione di cui si conosce il grafico e h → 0 per x → ∞, il grafico della funzione f
tende verso quello della funzione g. Non esiste alcuna strategia generale per determinare una
decomposizione di questo genere.
4.4. SCHEDA RIASSUNTIVA
4.4
71
Scheda riassuntiva
Punti stazionari
Data f : I → R, un punto x0 ∈ I è punto di massimo di f se f (x) ≤ f (x0 ) per ogni
x ∈ I. Il valore f (x0 ) = max f (x) è il massimo della funzione f in I. Analogamente per
x∈I
i minimi.
Definizione 4.1.1 (Massimo e minimo relativo).
Il punto x0 ∈ I è un punto di massimo relativo se esiste δ > 0 tale che f (x) ≤ f (x0 ) per
ogni x ∈ I con |x − x0 | < δ. Il valore f (x0 ) è un massimo relativo di f . Analogamente per il
minimo relativo. Un punto x0 di massimo o minimo relativo è un punto di estremo relativo.
Se una funzione ha un massimo o un minimo relativo in x0 in cui la funzione è
derivabile e tale punto è interno all’insieme di definizione, allora f 0 (x0 ) = 0.
Definizione 4.1.2 (Punto stazionario).
Se f 0 (x) = 0, allora si dice che x è un punto stazionario o critico della funzione f .
Classificazione dei punti stazionari
Per individuare quando un punto x0 stazionario sia anche punto di massimo o di
minimo (per f derivabile in (x0 − δ, x0 + δ) con δ > 0)
0
f (x)


 ≥0
x 0 − δ < x < x0 ,
≤0
x0 < x < x0 + δ,


0
f (x)


 ≤0
x 0 − δ < x < x0 ,
≥0
x0 < x < x0 + δ,


=⇒
x0
punto di massimo relativo.
=⇒
x0
punto di minimo relativo.
In maniera simile, si può considerare il segno di f 00 , qualora esista:
f 0 (x0 ) = 0,
f 00 (x0 ) > 0
=⇒
x0
punto di minimo relativo;
f 0 (x0 ) = 0,
f 00 (x0 ) < 0
=⇒
x0
punto di massimo relativo.
Nota bene! Si tratta solo di condizioni sufficienti (ad esempio, x4 in x0 = 0. . . )
Punti di singolarità
Asintoti verticali. Se x→x
lim f (x) vale +∞ o −∞, la funzione ha in x = x0 un asinto0
to verticale. Lo stesso è vero nel caso in cui sia il limite destro che il limite sinistro
tendano a +∞ o −∞, ma con segni opposti.
72
CAPITOLO 4. ANALISI LOCALE
Zeri del denominatore di una funzione razionale (che non siano zeri del numeratore), corrispondono a punti di asintoto verticale.
Punti angolosi e cuspidi.
Sia f continua in x0 ma non derivabile in x0 .
Se esistono finiti i limiti lim± f 0 (x) = `± , il punto x0 si chiama punto angoloso (o
x→x0
spigolo). Per disegnarlo, si possono tracciare le tangenti destra e sinistra y = f (x0 ) +
`± (x − x0 ).
Se i limiti destro e sinistro di f 0 sono ±∞ si possono avere due situazioni:
– se lim± f 0 (x) = +∞ (−∞), il punto x0 è un punto a tangente verticale;
x→x0
– se i limiti destro e sinistro sono ±∞, ma con segni opposti, il punto x0 è una
cuspide.
Comportamento asintotico
La funzione f ha un asintoto orizzontale (di equazione y = `) per x → +∞ se
lim f (x) = ` ∈ R,
x→+∞
La funzione f ha un asintoto obliquo (di equazione y = ax + b) per x → +∞ se
lim [f (x) − (ax + b)] = 0
x→+∞
per qualche
a, b ∈ R.
Per determinare la presenza di un asintoto orizzontale od obliquo:
(i) calcolare lim f (x): se esiste finito, c’è un asintoto orizzontale; se non
x→+∞
esiste, non c’è asintoto; se il limite è +∞ o −∞ si va a (ii);
(ii) calcolare lim f (x)/x: se esiste finito, il suo valore è a e si va a (iii), se il
x→+∞
limite non esiste o se vale ±∞, non c’è asintoto obliquo;
(iii) calcolare lim [f (x) − ax]: se esiste finito, il suo valore è b, la funzione
x→+∞
ha asintoto obliquo di equazione y = ax + b; se il limite non esiste o se vale
±∞, non c’è asintoto obliquo.
Dopo (i), se esiste finito lim f 0 (x), allora a è uguale al valore di questo limite e si prosegue da
x→+∞
(iii). Se il limite di f 0 non esiste, bisogna seguire il procedimento esposto sopra.
Altri profili asintotici. In generale, se f (x) = g(x) + h(x) con h che tende a 0 per x → ∞,
il grafico della funzione f tende verso quello della funzione g. Non esiste alcuna strategia
generale per determinare una decomposizione di questo genere.
Capitolo 5
Analisi globale
5.1
Problemi quotidiani
Per iniziare, presentiamo alcuni problemi che conducono allo studio di proprietà globali di funzioni opportune. Quanto meno per avere un’idea della motivazione di quel
che diremo dopo.
Problema 1. Abbiamo già considerato il problema di determinare il cilindro di volume
V = k = costante con superficie totale S minima, con l’obiettivo (malcelato) di diventare ricchi grazie all’uso della matematica, applicando il risultato alla costruzione
di scatole di fagioli, o, più in generale, di confezioni cilindriche con minima spesa di
materiali. La speranza si era presto infranta quando ci siamo resi conto che per via
elementare non riuscivamo a determinare il minimo della funzione S, cioè a risolvere
il problema (r =raggio della base del cilindro)
k
determinare il minimo di S(r) = 2π r +
πr
!
2
r > 0.
Torniamo al problema con la conoscenza delle derivate e studiamo la monotonı̀a della
funzione:
!
!
dS
k
4π 3
k
= 2π 2r − 2 = 2 r −
.
dr
πr
r
2π
Perciò S 0 (r) ≥ 0 se e solo se r ≥ r∗ dove r∗ = (k/2π)1/3 . Quindi la funzione S è decrescente in (0, r∗ ) ed è crescente in (r∗ , ∞). Ne segue che il punto di minimo richiesto
esiste ed è proprio r = r∗ . Problema risolto, corriamo in fabbrica!
Problema 2. Vogliamo dimostrare la disequazione
xp − 1 ≥ p(x − 1)
∀p > 1,
∀x ≥ 0.
Fissiamo p > 1 e consideriamo la funzione
F (x) = xp − 1 − p(x − 1)
73
x ≥ 0.
74
CAPITOLO 5. ANALISI GLOBALE
Dato che F 0 (x) = p(xp−1 − 1) ne segue che F 0 (x) < 0 per x ∈ [0, 1) e F 0 (x) > 0 per
x ∈ (1, +∞). Quindi la funzione F è decrescente in [0, 1) e crescente in (1, +∞) e x = 1
è un punto di minimo. Ne segue che
F (x) ≥ F (1) = 0,
da cui la conclusione.
Problema 3. Siano a1 , a2 , . . . , an ∈ R assegnati. Supponiamo di voler determinare
x ∈ R tale che sia minima la quantità
n
X
(ai − x)2 .
(5.1)
i=1
Possiamo immaginare che i valori ai provengano da misurazioni di un fenomeno sotto
osservazione e che si stia cercando un valore medio per questi valori, che minimizzi
l’errore commesso misurato dal valore in (5.1). Dato che si cerca un punto di minimo,
consideriamo la funzione F (x) =
n
P
(ai − x)2 e calcoliamone la derivata. Si ha
i=1
n
X
n
X
n
1X
x = 2n x −
ai −
ai .
F (x) = −2 (ai − x) = −2
n i=1
i=1
i=1
i=1
0
"
n
X
#
La funzione F è quindi decrescente alla sinistra di (
n
P
"
#
ai )/n e crescente alla destra. Il
i=1
valore
x=
n
1X
ai
n i=1
è il punto di minimo (e coincide con la media aritmetica di a1 , . . . , an ).
Allo stesso modo, dati a1 , a2 , . . . , an ∈ R, se si vuole minimizzare
n
P
λi (ai − x)2 dove
i=1
λ1 , . . . , λn > 0 sono pesi (positivi), bisogna scegliere x uguale alla media pesata degli ai :
n
P
λi ai
x = i=1
.
n
P
λi
i=1
5.2 A caccia di massimi e minimi assoluti
Come abbiamo visto nel paragrafo precedente, in molte situazioni ci si trova a dover
determinare il minimo o il massimo di una funzione assegnata. Ricordiamo ancora
una volta che se f : I → R è una funzione, un punto x0 ∈ I è punto di massimo se vale
f (x) ≤ f (x0 )
∀ x ∈ I.
5.2. A CACCIA DI MASSIMI E MINIMI ASSOLUTI
75
Il valore f (x0 ) = max f (x) è il massimo di f in I. Analogamente per i minimi.
x∈I
Talvolta per distinguere in modo più chiaro il massimo e il minimo dagli analoghi
concetti locali (massimi e minimi relativi), si parla di massimo assoluto e di minimo
assoluto.
Chiaramente un massimo (assoluto) è, a maggior ragione, un massimo relativo.
Non è difficile immaginare funzioni che ammettano massimi relativi che non sono
massimi assoluti.
Consideriamo ad esempio la funzione f (x) = x4 − x2 è tale che
f (0) = 0,
f (x) ≤ 0
∀x ∈ (−1, 1),
e quindi 0 è un punto di massimo relativo, ma non è di massimo assoluto dato che
lim f (x) = +∞.
x→±∞
Abbiamo già detto che le soluzioni di f 0 (x) = 0 (cioè i punti critici di f ) permettono
di determinare i possibili candidati a punti di minimo o massimo relativo interno derivabile. Chiaramente, è possibile che un estremo relativo cada in un punto in cui la
funzione non è derivabile.
A questo punto possiamo definire una strategia per individuare il massimo ed il
minimo di una funzione continua in un intervallo [a, b] (per il Teorema di Weierstrass,
massimo e minimo di f esistono):
? determinare l’insieme S dei punti stazionari in (a, b);
? determinare l’eventuale insieme N dei punti in cui f non è derivabile;
? calcolare la funzione:
(i) in S,
(ii) in N ,
(iii) negli estremi dell’intervallo a e b.
? individuare il più grande e il più piccolo tra i valori calcolati.
Esercizio. Determinare il massimo ed il minimo assoluti della funzione f (x) =
(x2 − 5x + 7)ex per x ∈ [0, 2].
Soluzione. La funzione f è derivabile in tutto l’intervallo considerato. Per determinare i punti singolari:
f 0 (x) = (2x − 5)ex + (x2 − 5x + 7)ex = (x2 − 3x + 2)ex = (x − 2)(x − 1)ex .
Quindi f 0 (x) = 0 se e solo se x = 1 o x = 2. L’insieme dei punti critici interni è
S = {1}. Dato che f (0) = 7 < f (2) = e2 < f (1) = 3e, si ha
min f (x) = f (0) = 7,
x∈[0,2]
che è quanto richiesto dall’esercizio.
max f (x) = f (1) = 3e,
x∈[0,2]
76
CAPITOLO 5. ANALISI GLOBALE
Spesso è utile conoscere il massimo del modulo di una funzione assegnata f , cioè
risolvere il problema
data f : [a, b] → R
continua,
calcolare max |f (x)|.
x∈[a,b]
In questo caso, si può procedere come detto sopra, o, alternativamente, determinare il
massimo ed il minimo della funzione f in [a, b] e poi sfruttare la relazione (evidente?)
n
o
max |f (x)| = max | max f (x)|, | min f (x)| .
x∈[a,b]
x∈[a,b]
x∈[a,b]
Esercizio. Data f (x) = |x2 − 1|, calcolare
max{|f (x)| : x ∈ [−1, 2]}
Soluzione. Il minimo ed il massimo della funzione x2 − 1 in [−1, 2] sono, evidentemente, −1, raggiunto in x = 0 e 3 in x = 2. Quindi
n
o
max |x2 − 1| = max | − 1|, |3| = 3.
x∈[−1,2]
Un buon esercizio è determinare il massimo di |x2 − 1| in [−1, 2] usando la strate-
Figura 5.1: Il grafico di f (x) = |x2 − 1|
gia (punti critici/punti non derivabili/estremi) direttamente sulla funzione con il
modulo.
La ricerca del minimo di |f (x)| è banale (vale 0) nel caso in cui la funzione f si annulli in
qualche punto. Se invece non ci sono zeri di f , vale
n
o
min |f (x)| = min | max f (x)|, | min f (x)| .
x∈[a,b]
x∈[a,b]
x∈[a,b]
Ad esempio, per la funzione considerata prima, |x2 − 1| in [−1, 2], ci sono due zeri x = ±1 e
quindi min |x2 − 1| = 0.
x∈[−1,2]
Nel caso in cui si studi una funzione f continua, ma definita su un dominio illimitato (ad esempio, f : [a, +∞) → R), le ipotesi del Teorema di Weierstrass non sono
5.3. CONCAVITÀ E CONVESSITÀ
77
soddisfatte e quindi non è detto che esistano il massimo ed il minimo della funzione.
Comunque ha senso domandarsi: quanto valgono l’estremo superiore e l’estremo inferiore?
Nel caso in cui siano finiti, si tratta di massimo o di minimo? La strategia per risolvere questo problema è simile a quanto appena visto. Il punto che bisogna modificare è quello
relativo al calcolo della funzione negli estremi dell’intervallo. In questo caso almeno
uno degli estremi dell’intervallo sarà +∞ o −∞ e le espressioni f (+∞) e f (−∞), in
generale, non hanno senso, ma vanno sostituite con lim f (x). Vediamo la procedura
x→±∞
in un esempio.
Esercizio. Determinare l’estremo superiore e l’estremo inferiore della funzione
2
f (x) = e−x in R e dire se si tratta di massimo e minimo.
2
Soluzione. La funzione è derivabile su tutto R e la derivata vale f 0 (x) = −2xe−x .
Quindi c’è un unico punto critico x = 0 in cui la funzione vale f (0) = 1. Inoltre
2
2
lim e−x = lim e−x = 0.
x→−∞
x→+∞
Confrontando i valori deduciamo che
2
inf e−x = 0
x∈R
2
sup e−x = f (0) = 1.
x∈R
Dato che l’estremo superiore fa parte dell’insieme immagine, l’estremo superiore è massimo. Invece l’estremo inferiore non è minimo, perchè la funzione f è
2
strettamente positiva: e−x > 0 per ogni x ∈ R.
Analogamente nel caso di funzioni continue definite in insiemi non chiusi, cioè
f : (a, b) → R oppure f : [a, b) → R, o varianti, non si applica il Teorema di Weierstrass. Anche in questi casi, per determinare l’estremo superiore/inferiore bisogna
considerare i limiti agli estremi.
5.3
Concavità e convessità
Fino a questo punto, abbiamo individuato quali proprietà siano fornite dalla derivata
prima. Che indicazioni dà la derivata seconda? Per rispondere a questo angosciante interrogativo, introduciamo la nozione di convessità, che riguarda le funzioni il cui grafico
si trova al di sotto di quello delle sue corde.
Definizione 5.3.1 Una funzione f : [a, b] → R è convessa in [a, b] se
f (tx + (1 − t)y) ≤ tf (x) + (1 − t)f (y)
∀ x, y ∈ [a, b]
Una funzione per cui valga la disuguaglianza opposta si dice concava.
∀ t ∈ (0, 1).
(5.2)
78
CAPITOLO 5. ANALISI GLOBALE
Figura 5.2: Una funzione convessa ed una non convessa.
Dalla definizione segue che se f è concava, allora −f è convessa, e viceversa.
Quindi studiare la convessità è sufficiente per comprendere anche la concavità.
Cerchiamo di capire il significato geometrico della condizione (5.2). Fissiamo x = x̄
e y = ȳ con x̄ < ȳ. Per t ∈ (0, 1), definiamo z(t) := tx̄ + (1 − t)ȳ ∈ (x̄, ȳ). Scriviamo la
retta che passa per (x̄, f (x̄)) e (ȳ, f (ȳ)):
Φ(x) = f (x̄) +
f (ȳ) − f (x̄)
(x − x̄),
ȳ − x̄
e calcoliamo questa funzione in z(t). Dato che
f (ȳ) − f (x̄)
(tx̄ + (1 − t)ȳ − x̄)
ȳ − x̄
f (ȳ) − f (x̄)
= f (x̄) +
(1 − t)(ȳ − x̄)
ȳ − x̄
= f (x̄) + (f (ȳ) − f (x̄))(1 − t) = tf (x̄) + (1 − t)f (ȳ),
Φ(z(t)) = f (x̄) +
la condizione (5.2), si può riscrivere come
f (z(t)) ≤ Φ(z(t))
∀ x, y ∈ [a, b]
∀ t ∈ (0, 1).
Questa scrittura ha un interpretazione in termini di grafico immediata: una funzione f
è convessa, se per ogni scelta di x e y nel dominio di definizione, il grafico di f è al di sotto della
retta secante che congiunge i punti (x, f (x)) e (y, f (y)) nell’intervallo di estremi x e y.
Proposizione 5.3.2 Una funzione f : [a, b] → R è convessa in [a, b] se e solo se
f (z) − f (x)
f (y) − f (x)
f (y) − f (z)
≤
≤
z−x
y−x
y−z
per ogni x, y, z tali che a ≤ x < z < y ≤ b.
(5.3)
5.3. CONCAVITÀ E CONVESSITÀ
79
La dimostrazione di questa proprietà si ottiene semplicemente riscrivendo in termini di rapporti incrementali la formula (5.2). I dettagli sono lasciati alla buona volontà
del lettore.
La proprietà (5.3) può essere interpretata graficamente in termini di monotonı́a
delle pendenza delle secanti. Quando la funzione è derivabile, questa proprietà di
monotonia diviene una richiesta di monotonia della funzione derivata prima. Nel caso
in cui la funzione f sia derivabile due volte, la monotonı́a della f 0 può essere tradotta
in termini di segno della derivata seconda f 00 .
Teorema 5.3.3 (Teorema di Convessità).
Sia f : [a, b] → R. Allora
(i) se f è derivabile una volta, f convessa in [a, b] se e solo se f 0 è debolmente
crescente in [a, b];
(ii) se f è derivabile due volte, f è convessa in [a, b] se e solo se f 00 ≥ 0 in [a, b].
Per le funzioni concave, vale un risultato analogo sostituendo a “f 0 crescente” la
frase “f 0 debolmente decrescente” e a “f 00 ≥ 0” la frase “f 00 ≤ 0”.
La dimostrazione verrà data più avanti.
Anche il Teorema di Convessità ha un’interpretazione geometrica: se la funzione f
è derivabile e convessa, il suo grafico è sempre al di sopra della retta tangente in qualsiasi suo
punto. Infatti, scriviamo la differenza tra f e la retta tangente in (x0 , f (x0 ))
Rx0 (x) = f (x) − f (x0 ) − f 0 (x0 )(x − x0 ),
con l’obiettivo di dimostrare che se f è convessa, la funzione Rx0 (x) è positiva. Applichiamo il teorema di Lagrange e riscriviamo Rx0 (x) come
Rx0 (x) = f 0 (ξ)(x − x0 ) − f 0 (x0 )(x − x0 ) = (f 0 (ξ) − f 0 (x0 ))(x − x0 ).
Se x > x0 allora ξ > x0 e quindi, essendo f 0 crescente, f 0 (ξ) > f 0 (x0 ). Ne segue che
il termine a destra è positivo perché prodotto di termini positivi. Se x < x0 allora
ξ < x0 e, sempre per la monotonı́a di f 0 , f 0 (ξ) < f 0 (x0 ). Questa volta i due termini sono
entrambi negativi, ma comunque il loro prodotto è positivo.
Riassumendo, per la convessità abbiamo tre interpretazioni:
– il grafico di f è sotto il grafico della secante;
– le pendenze delle secanti sono monotone;
– il grafico della funzione è al di sopra di quello della tangente.
In corrispondenza abbiamo varie maniere analitiche per studiare la convessità di
una funzione. Quelle più semplici da utilizzare concretamente sono quelle contenute
nel Teorema di Convessità e che fanno ricorso alle derivate della funzione. In particolare, la caratterizzazione delle funzioni convesse derivabili due volte è estremamente
comoda perché riduce il problema alla risoluzione di una disequazione: f 00 (x) ≥ 0.
80
CAPITOLO 5. ANALISI GLOBALE
Definizione 5.3.4 Un punto x0 tale che f sia convessa alla destra di x0 e concava alla sinistra,
o viceversa, si chiama punto di flesso.
Grazie al Teorema 5.3.3, se f 00 a segno opposto alla destra e alla sinistra di x0 ,
necessariamente x0 è un punto di flesso.
Ad esempio, consideriamo la funzione f (x) = sin x. La sua derivata seconda è
f 00 (x) = − sin x, quindi tutti punti della forma x = kπ per k ∈ Z sono punti di
1
flesso. Per la funzione f (x) = 1+x
2 , si ha
f 0 (x) = −
2x
(1 + x2 )2
=⇒
f 00 (x) =
2(3x2 − 1)
,
(1 + x2 )3
√
e quindi i√punti di flesso
di
f
sono
x
=
±1/
3. La √funzione f è convessa in
√
√
(−∞, −1/ 3) e in (1/ 3, +∞) e concava in (−1/ 3, 1/ 3).
La convessità è utile per determinare l’esistenza di minimi di una funzione. Infatti,
vale la seguente implicazione
f
convessa,
f 0 (x0 ) = 0
=⇒
x0
punto di minimo.
La dimostrazione è lasciata per esercizio. Analogamente, per le funzioni concave ed
i punti di massimo. Chiaramente se la convessità è solo locale (cioè in un intorno del
punto x0 ), x0 è punto di minimo relativo.
Dimostrazione del Teorema di Convessità.
(i) Supponiamo che f sia convessa, allora vale la (5.3). Quindi, passando al limite per z → x+
si ottiene
f (y) − f (x)
f 0 (x) ≤
.
y−x
Analogamente, passando al limite nella (5.3) per z → y − ,
f (y) − f (x)
≤ f 0 (y).
y−x
Ne segue che f 0 (x) ≤ f 0 (y) per ogni x ≤ y.
Viceversa, supponiamo che la funzione f 0 sia crescente e dimostriamo la (5.2) studiando la
funzione differenza
F (t) := tf (x) + (1 − t)f (y) − f (tx + (1 − t)y),
t ∈ [0, 1],
con x, y fissati. Consideriamo il caso y < x (l’altro è analogo). Calcolando la derivata di F e
applicando il Teorema di Lagrange (Teorema 3.1.1) si deduce che esiste ξ ∈ (y, x) tale che
h
i
F 0 (t) = f (x) − f (y) − f 0 (tx + (1 − t)y)(x − y) = f 0 (ξ) − f 0 (tx + (1 − t)y) (x − y).
5.3. CONCAVITÀ E CONVESSITÀ
81
Dato che, per t ∈ [0, 1], il punto tx + (1 − t)y descrive l’intervallo [y, x], esiste t∗ tale che t∗ x +
(1 − t∗ )y = ξ. Inoltre, dato che f 0 è debolmente crescente, f 0 (tx + (1 − t)y) ≤ f 0 (ξ) per t ∈ [0, t∗ ]
e f 0 (tx + (1 − t)y) ≥ f 0 (ξ) per t ∈ [t∗ , 1]. Perciò:
F 0 (t) ≥ 0
per t ∈ [0, t∗ ]
e
F 0 (t) ≤ 0
per t ∈ [t∗ , 1].
Se ne deduce che il minimo assoluto della funzione F è assunto in uno degli estremi t = 0 o
t = 1 e, dato che F (0) = F (1) = 0, si ottiene F (t) ≥ 0 per ogni t ∈ [0, 1], cioè la (5.2).
∗
Continuità delle funzioni convesse.
Una funzione convessa in un intervallo è necessariamente continua nei punti interni:
f : [a, b] → R
convessa
⇒
f
è continua in
(a, b).
Dimostrazione. Fissato x ∈ (a, b), scegliamo y ∈ (x, b) che successivamente faremo tendere ad x stesso. Tenuto conto della convessità, i rapporti incrementali
verificano
f (y) − f (a)
f (y) − f (x)
≤
y−a
y−x
e
f (y) − f (x)
f (b) − f (x)
≤
,
y−x
b−x
da cui segue
f (y) − f (a)
f (b) − f (x)
(y − x) ≤ f (y) − f (x) ≤
(y − x).
y−a
b−x
La seconda delle due disequazioni è estremamente utile: quando y → x, il termine
a destra tende ad 0. Ora occorre una stima dal basso. Il problema della prima
disequazione è che la dipendenza da y è sia nel termine y − x (che ci fa comodo)
(a)
che nel rapporto incrementale f (y)−f
. Il problema è: siamo in grado di controly−a
lare il valore del rapporto incrementale
incrementale
f (y)−f (a)
y−a
f (y)−f (a)
y−a
per y ≈ x? Dato che il rapporto
è crescente in y, riesce
f (y) − f (a)
f (x) − f (a)
≤
.
x−a
y−a
Quindi, per y > x,
f (b) − f (x)
f (x) − f (a)
(y − x) ≤ f (y) − f (x) ≤
(y − x).
x−a
b−x
Passando al limite y → x+ , ne segue che
lim f (y) − f (x) = 0.
y→x+
In maniera analoga si deduce che lim f (y) = f (x).
y→x−
E’ vero o è falso che una funzione convessa in [a, b] è continua in tutto l’intervallo [a, b]?
82
CAPITOLO 5. ANALISI GLOBALE
5.4
Scheda riassuntiva
Problemi quotidiani
k
Pb.1. Determinare il minimo di S(r) = 2π r +
πr
2
Dato che S 0 (r) =
4π
r2
k
2π
r3 −
!
per r > 0.
, la funzione S è decrescente in (0, r∗ ) ed è crescente in (r∗ , ∞)
dove r∗ = (k/2π)1/3 . Ne segue che il punto di minimo è in r = r∗ .
Pb.2. Dimostrare la disequazione xp − 1 ≥ p(x − 1)
∀p > 1,
∀x ≥ 0.
Fissato p > 1, la funzione F (x) = xp −1−p(x−1)
x ≥ 0 è decrescente in [0, 1) e crescente
in (1, +∞) e x = 1 è un punto di minimo. Ne segue che F (x) ≥ F (1) = 0, da cui la conclusione.
Pb.3. Dati a1 , a2 , . . . , an ∈ R, determinare x ∈ R tale che F (x) =
Dato che
F 0 (x)
= 2n x −
destra. Il valore x =
1
n
Pn
1
n
i=1 ai
n
P
n
P
ai , F è decrescente alla sinistra di (
i=1
(ai − x)2 sia minimo.
i=1
n
P
ai )/n e crescente alla
i=1
è il punto di minimo.
A caccia di massimi e minimi assoluti
Per distinguere in modo più chiaro il massimo e il minimo dai massimi e minimi
relativi, si parla di massimo assoluto e di minimo assoluto.
Strategia per individuare il massimo ed il minimo di f continua in [a.b]
? determinare l’insieme S dei punti stazionari in (a, b);
? determinare l’eventuale insieme N dei punti in cui f non è derivabile;
? calcolare la funzione in S, in N e negli estremi dell’intervallo a e b.
? individuare il più grande e il più piccolo tra i valori calcolati.
Per determinare il massimo del modulo di una funzione f
n
o
max |f (x)| = max | max f (x)|, | min f (x)| .
x∈[a,b]
x∈[a,b]
x∈[a,b]
Nel caso di una funzione f continua, ma definita su un dominio illimitato o non chiuso
ha senso domandarsi: quanto valgono l’estremo superiore e l’estremo inferiore? La strategia
per risolvere questo problema è simile a quanto appena visto. Il punto che bisogna
modificare è quello relativo al calcolo della funzione negli estremi dell’intervallo.
5.4. SCHEDA RIASSUNTIVA
83
Concavità e convessità
Definizione 5.3.1.
Una funzione f : [a, b] → R è convessa in [a, b] se
f (tx + (1 − t)y) ≤ tf (x) + (1 − t)f (y)
∀ x, y ∈ [a, b]
∀ t ∈ (0, 1).
Una funzione per cui valga la disuguaglianza opposta si dice concava.
Geometricamente, f è convessa, se per ogni x e y, il grafico di f è al di sotto della retta
secante che congiunge i punti (x, f (x)) e (y, f (y)) nell’intervallo di estremi x e y.
Proposizione 5.3.2. Una funzione f : [a, b] → R è convessa in [a, b] se e solo se
f (y) − f (x)
f (y) − f (z)
f (z) − f (x)
≤
≤
z−x
y−x
y−z
∀ x, y, z
tali che
≤ x < z < y ≤ b.
La Proposizione 5.3.2 esprime il fatto che, se f è convessa, le pendenze delle secanti
sono monotone.
Teorema 5.3.3 (Teorema di Convessità).
Sia f : [a, b] → R. Allora
(i) se f è derivabile una volta, f convessa in [a, b] se e solo se f 0 è debolmente crescente in [a, b];
(ii) se f è derivabile due volte, f è convessa in [a, b] se e solo se f 00 ≥ 0 in [a, b].
Per le funzioni concave, vale un risultato analogo sostituendo a “f 0 crescente” la
frase “f 0 debolmente decrescente” e a “f 00 ≥ 0” la frase “f 00 ≤ 0”.
Dal Teorema 5.3.3 discende un’ulteriore interpretazione geometrica della convessità: se la funzione f è derivabile e convessa, il suo grafico è sempre al di sopra della retta
tangente in qualsiasi suo punto.
Definizione. Un punto x0 tale che f sia convessa alla destra di x0 e concava alla sinistra,
o viceversa, si chiama punto di flesso.
Grazie al Teorema 5.3.3, se f 00 a segno opposto alla destra e alla sinistra di x0 ,
necessariamente x0 è un punto di flesso.
La convessità è utile per determinare l’esistenza di minimi di una funzione:
f
convessa,
f 0 (x0 ) = 0
=⇒
x0
punto di minimo.
Analogamente, per le funzioni concave ed i punti di massimo.
∗
Continuità delle funzioni convesse.
Una funzione convessa in un intervallo è necessariamente continua nei punti interni:
f : [a, b] → R
convessa
⇒
f
è continua in
(a, b).