Registro delle lezioni di Analisi Matematica I Universit`a di

Registro delle lezioni di Analisi Matematica I
Università di Firenze - Facoltà di Ingegneria
Corso di Laurea in Ingegneria Informatica
A.A. 2000/2001 - Prof. Massimo Furi
Avvertenza: sono riportati nei dettagli soltanto quei concetti svolti a lezione la cui
impostazione differisce da quella dei testi di riferimento (Spiegel e Ayres).
1 - Lun. 18/9/00
Concetto (euristico) di insieme. Esempi. Vari modi per rappresentare un insieme. Unione
e intersezione di due insiemi. Sottoinsiemi di un insieme. Insieme vuoto. Complementare
di un insieme (rispetto ad un universo assegnato). Leggi di De Morgan. Differenza tra
due insiemi. Cenni sull’unione e sull’intersezione di infiniti insiemi.
2 - Lun. 18/9/00
Richiami sui numeri naturali (N), interi (Z), razionali (Q) e reali (R). Primi cenni sui
numeri complessi (C). Cenni sul concetto di operazione binaria. Esempi di intervalli in
R. Richiami sulle proprietà fondamentali dei numeri reali. Richiami sul significato dei
simboli di minore e di minore o uguale. Il valore assoluto di un numero.
Esercizi assegnati [Spiegel, cap. 1]: 2, 3, 4, 5, 6, 9.
3 - Mar. 19/9/00
Proprietà fondamentali del valore assoluto: |ab| = |a||b|; |a + b| ≤ |a| + |b|. Ulteriore
proprietà del valore assoluto: | |b| − |a| | ≤ |a − b|. Distanza tra due punti a, b ∈ R: |b − a|.
Potenza ad esponente naturale di un numero reale. Potenza ad esponente intero. Radice
n-esima aritmetica di un numero positivo. Potenza ad esponente razionale. Cenni sulle
potenze ad esponente reale. Proprietà fondamentali delle potenze: ax ay = ax+y ; (ax )y =
axy ; ax bx = (ab)x . Ulteriori proprietà delle potenze: ax /ay = ax−y ; (a/b)x = ax /bx .
4 - Mar. 19/9/00
Definizione di logaritmo di un numero b > 0 in base a > 0, a 6= 1 (loga b). Proprietà
fondamentali dei logaritmi: loga(bc) = loga b+loga c; loga b logb c = loga c. Ulteriori proprietà
dei logaritmi: loga bc = c loga b; loga (b/c) = loga b − loga c. Definizione di intervallo (è un
sottoinsieme di R con la proprietà che se ci stanno due punti, ci stanno anche tutti i punti
intermedi).
1
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Osservazione. L’insieme vuoto e l’insieme costituito da un sol punto sono intervalli (si
chiamano intervalli banali). L’insieme R dei numeri reali è un intervallo (non banale).
Intervalli limitati e non limitati. Intervalli aperti. Intervalli chiusi. Intervalli né aperti né
chiusi (chiusi a sinistra e aperti a destra, aperti a sinistra e chiusi a destra).
Osservazione. L’intersezione di due intervalli è un intervallo (eventualmente vuoto o
costituito da un sol punto).
Insiemi numerabili (sono quelli che si possono mettere in corrispondenza biunivoca con i
numeri naturali). Cenni sulla numerabilità dei razionali. Cenni sulla non numerabilità dei
reali. Intorni di un punto. Intorni forati di un punto. Punti di accumulazione.
Definizione. L’insieme dei punti di accumulazione di un insieme A ⊂ R si denota con A0
e si chiama derivato di A. I punti di A che non sono di accumulazione si dicono isolati.
Definizione. Un insieme si dice chiuso se contiene tutti i suoi punti di accumulazione.
Ossia, A è chiuso se A ⊃ A0 .
Esercizi assegnati [Spiegel, cap. 1]: 11, 12, 13, 18, 20.
5 - Mer. 20/9/00
Maggioranti e minoranti di un insieme. Insiemi limitati superiormente [inferiormente].
Insiemi limitati. Proprietà di Archimede. Massimo [minimo] di un insieme. Estremo
superiore [inferiore] di un insieme. Proprietà di Dedekind dei numeri reali (ogni insieme
limitato superiormente [inferiormente] ammette estremo superiore [inferiore]).
Definizione. Un sottoinsieme A di R si dice compatto se è limitato e chiuso.
Osservazione. L’insieme Q dei razionali non gode della proprietà di Dedekind. Si può
provare, infatti, che in Q l’insieme {x ∈ Q : x > 0, x2 < 2} non ammette estremo
√
superiore (in R l’estremo superiore è 2).
6 - Mer. 20/9/00
Principio di Bolzano-Weierstrass. Ogni sottoinsieme limitato e infinito di R ammette
almeno un punto di accumulazione.
Numeri algebrici e numeri trascendenti. Principio di induzione. Introduzione ai numeri
complessi. Parte reale e parte immaginaria di un numero complesso. Coniugato di un
numero complesso.
Esercizi assegnati [Spiegel, cap. 1]: 21, 24, 26.
2
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
7 - Gio. 21/9/00
Piano complesso. Modulo e argomento di un numero complesso. Forma trigonometrica
dei numeri complessi.
Teorema. Il prodotto di due numeri complessi ha per modulo il prodotto dei moduli e per
argomento la somma degli argomenti.
Esercizio. Dedurre dal teorema precedente che il modulo del rapporto di due numeri
complessi è il rapporto dei moduli e l’argomento è la differenza degli argomenti.
Osservazione. In generale arctang(b/a) non coincide con l’argomento di a + ib (a meno
che la parte reale non sia positiva).
Formula di De Moivre per la potenza n-esima di un numero complesso. Formula di De
Moivre per la radice n-esima di un numero complesso. Richiami sui polinomi. Polinomi a
coefficienti complessi.
Teorema Fondamentale dell’Algebra. In campo complesso ogni polinomio di grado
positivo ammette almeno una radice.
8 - Gio. 21/9/00
Concetto di funzione (o applicazione) tra due insiemi (è una legge, f : X → Y , che ad
ogni elemento x di un insieme X, detto dominio di f , associa un unico elemento f (x) di
un insieme Y , detto codominio). Funzioni reali (quando il codominio è un sottoinsieme
dei reali, che per semplicità supporremo coincidere con R). Funzioni reali di variabile
reale (sono funzioni reali il cui dominio è un sottoinsieme dei reali). Funzioni iniettive
(f : X → Y è iniettiva se per ogni y ∈ Y esiste al più un x ∈ X tale che f (x) = y o,
equivalentemente, se da x1 , x2 ∈ X, x1 6= x2 segue f (x1 ) 6= f (x2 ) ). Funzioni suriettive
(f : X → Y è suriettiva se per ogni y ∈ Y esiste almeno un x ∈ X tale che f (x) = y ).
Per indicare che f associa ad un generico elemento x ∈ X l’elemento f (x) ∈ Y , talvolta si
usa la notazione f : x 7→ f (x). Ad esempio, la funzione f : R → R definita da f (x) = x2 si
denota anche f : x 7→ x2 .
Esercizi assegnati [Spiegel, cap. 1]: 27, 28, 29, 30, 31.
9 - Ven. 22/9/00
Esercizio. Provare che la somma di un numero razionale e di un numero irrazionale è un
numero irrazionale.
3
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Funzioni biiettive, dette anche corrispondenze biunivoche (sono le funzioni sia iniettive sia
suriettive). Maggiorante (o limitazione superiore) di una funzione reale (non necessariamente di variabile reale). Minorante di una funzione reale. Funzioni limitate superiormente [inferiormente]. Funzioni limitate. Estremo superiore [inferiore] di una funzione reale.
Massimo [minimo] assoluto di una funzione reale. Punto di massimo [minimo] assoluto
di una funzione reale (è un elemento del dominio in cui la funzione assume il suo valore
massimo).
10 - Ven. 22/9/00
Il grafico di una funzione f : X → Y è l’insieme delle coppie ordinate (x, y) che soddisfano
la relazione y = f (x), detta equazione del grafico.
Osservazione. Il grafico di una funzione reale di variabile reale può essere pensato come
un sottoinsieme del piano cartesiano.
È una vecchia consuetudine definire una funzione scrivendone l’equazione del grafico; ossia,
scrivendo l’equazione y = f (x) a cui devono soddisfare le coppie (x, y) del grafico di f .
Ad esempio, per denotare la funzione che ad ogni x ∈ R associa x2 si può scrivere y = x2 .
L’immagine di una funzione f : X → Y è l’insieme costituito dagli elementi y ∈ Y per i
quali esiste un x ∈ X tale che y = f (x). Tale insieme si chiama anche immagine di X
tramite f e si denota con uno dei seguenti simboli: Im(f ), f (X). Più in generale, dato un
sottoinsieme A di X, l’immagine di A (tramite f ) è l’insieme
f (A) = {y ∈ Y : y = f (x) per almeno un x ∈ A} .
Osservazione. Una funzione è suriettiva se e solo se la sua immagine coincide col suo
codominio.
Restrizione di una funzione ad un sottoinsieme del dominio (data f : X → Y e dato un
sottoinsieme A di X, se si pensa f definita soltanto per gli elementi di A, si dice f è stata
ristretta ad A).
Osservazione. Il grafico della restrizione ad un insieme A di una funzione f : X → Y
è un sottoinsieme del grafico di f . Più precisamente, è l’insieme delle coppie (x, y) del
grafico di f che hanno x ∈ A.
Definizione. Data una funzione iniettiva f : X → Y , la sua funzione inversa, denotata
f −1 : Im(f ) → X, è quella legge che ad ogni y dell’immagine di f associa l’unico elemento
x ∈ X tale che f (x) = y.
4
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Osservazione. L’immagine [il dominio] di una funzione inversa coincide col dominio
[l’immagine] della funzione che viene invertita.
Richiami sui polinomi di una e di due variabili. Equazioni algebriche (sono equazioni che
si ottengono uguagliando a zero un polinomio).
Definizione. Una funzione f (reale di variabile reale) si dice algebrica se esiste un polinomio di due variabili P (x, y) con la proprietà che ogni coppia (x, y) del grafico di f verifica
l’equazione algebrica P (x, y) = 0 (si dice che f è una funzione implicita dell’equazione
P (x, y) = 0). Le funzioni (reali di variabile reale) non algebriche si dicono trascendenti.
Esercizio. Provare che le funzioni polinomiali sono algebriche.
Funzioni razionali (si ottengono facendo il rapporto di due polinomi).
Osservazione. I polinomi sono funzioni razionali.
Esercizio. Provare che le funzioni razionali sono algebriche.
Funzioni irrazionali (sono le funzioni algebriche non razionali).
Esercizio. Provare che la funzione
√
x è algebrica (irrazionale).
Esercizi assegnati [Spiegel, cap. 2]: 1, 2, 3.
11 - Lun. 25/9/00
Una panoramica sulle principali funzioni trascendenti (funzioni esponenziali, logaritmiche,
trigonometriche, trigonometriche inverse, iperboliche, iperboliche inverse).
Definizione. La parte intera di un numero x ∈ R, denotata con [x] o con int x, è il più
grande intero minore o uguale ad x (i.e. [x] := max Z ∩ (−∞, x] ).
Definizione. Una funzione reale di variabile reale f : A → R si dice crescente [decrescente ]
se da x1 , x2 ∈ A e x1 < x2 segue f (x1 ) ≤ f (x2 ) [f (x1 ) ≥ f (x2 )]. Se l’ultima disuguaglianza
vale in senso stretto, allora si dice che la funzione è strettamente crescente [strettamente
decrescente ]. Le funzioni crescenti o decrescenti si dicono monotòne (l’accento tonico cade
sull’ultima sillaba). Se una funzione monotona è addirittura strettamente crescente o
strettamente decrescente, allora si chiama strettamente monotona.
Osservazione. Le funzioni strettamente monotone sono iniettive, pertanto invertibili.
Osservazione.
L’inversa di una funzione strettamente crescente [decrescente] è
strettamente crescente [decrescente].
5
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
12 - Lun. 25/9/00
Definizione. Sia f : A → R una funzione reale di variabile reale e sia x0 un punto di
accumulazione per il dominio A di f (non occorre che x0 appartenga ad A). Si dice che
f (x) tende ad un numero reale l per x che tende ad x0 , e si scrive f (x) → l per x → x0 ,
se per ogni ² > 0 esiste δ > 0 tale che da 0 < |x − x0 | < δ e x ∈ A segue |f (x) − l| < ².
Notazione. Per indicare che f (x) → l per x → x0 si usa anche dire che il limite per x
che tende ad x0 di f (x) è uguale a l, e si scrive
lim f (x) = l.
x→x0
Teorema (fondamentale dei limiti finiti). Siano f, g: A → R due funzioni reali di variabile
reale e sia x0 un punto di accumulazione per A. Se f (x) → a e g(x) → b per x → x0 ,
allora (per x → x0 ), si ha:
1) f (x) + g(x) → a + b;
2) f (x)g(x) → ab;
3) f (x)/g(x) → a/b, nell’ipotesi b 6= 0.
Ipotesi semplificativa. Da ora in avanti, a meno che non sia altrimenti specificato, per
motivi di semplicità supporremo che i punti del dominio di ogni funzione (reale di variabile
reale) che prenderemo in considerazione siano anche di accumulazione per il dominio stesso.
Ciò è vero, ad esempio, se una funzione è definita in un intervallo non banale (o, più in
generale, in un insieme costituito dall’unione, finita o infinita, di intervalli non banali).
Definizione. Una funzione reale di variabile reale f : A → R si dice continua in un punto
x0 ∈ A se
lim f (x) = f (x0 ).
x→x0
In caso contrario f è detta discontinua in x0 , o che ha una discontinuità in x0 . Se f è
continua in ogni punto del suo dominio A, allora si dice semplicemente che è una funzione
continua.
Osserviamo che la suddetta definizione (basata sul concetto di limite) è ben posta perché
abbiamo supposto (come ipotesi semplificativa) che ogni punto x0 del dominio A di f sia
anche di accumulazione. È importante inoltre notare che, sempre in base alla suddetta
definizione, non ha senso affermare che una funzione è discontinua (o continua) in un punto
in cui non è definita.
Esercizio. Provare che la funzione f (x) = x è continua.
Dal teorema fondamentale dei limiti segue immediatamente il seguente
6
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Corollario. Una funzione ottenuta tramite somma, prodotto e quoziente di funzioni
continue è una funzione continua.
Si osservi che in virtù del suddetto Corollario si può affermare che le funzioni razionali,
essendo rapporto di polinomi, sono continue (compresa la funzione f (x) = 1/x, anche se
in alcuni testi di analisi matematica si asserisce il contrario).
Esercizi assegnati [Spiegel, cap. 2]: 5, 6.
13 - Mar. 26/9/00
Teorema. Le funzioni esponenziali, logaritmiche, trigonometriche, trigonometriche
inverse, iperboliche e iperboliche inverse sono continue.
Osserviamo che se x0 non è un punto di accumulazione per il dominio A di una funzione
f : A → R, allora non ha senso parlare di limite per x che tende ad x0 di f (x). Pertanto,
nel caso che x0 sia un punto isolato per A, la definizione di continuità che abbiamo precedentemente dato, essendo basata sul concetto di limite, è priva di significato. Per vari
motivi che non stiamo a menzionare, è conveniente assumere, per definizione, che ogni
funzione sia continua nei punti isolati del suo dominio. Ciò è in accordo con la seguente
nuova definizione di continuità (valida per ogni punto del dominio):
Definizione. Una funzione f : A → R si dice continua in un punto x0 ∈ A se per ogni
² > 0 esiste δ > 0 tale che da |x − x0 | < δ e x ∈ A segue |f (x) − f (x0 )| < ².
Esempio. Il dominio della funzione
f (x) =
√
cos x − 1
è costituito soltanto da punti isolati (i punti in cui cos x = 1). Pertanto, f è continua.
Esercizio. Provare che se una funzione è continua in un insieme A, allora è continua
anche la sua restrizione ad un qualunque sottoinsieme di A.
Definizione. Siano f : A → R e g: B → R due funzioni reali di variabile reale. La
composizione di f con g, denotata g◦f , è quell’applicazione (detta anche funzione composta)
che ad ogni x ∈ A tale che f (x) ∈ B associa il numero g(f (x)). Il dominio della funzione
composta g◦f è il sottoinsieme
f −1 (B) = {x ∈ A : f (x) ∈ B}
di A, detto immagine inversa (o retroimmagine, o preimmagine) di B (tramite f ).
Teorema. Siano f : A → R e g: B → R due funzioni reali di variabile reale. Se f è
continua in x0 ∈ A e g è continua in y0 = f (x0 ) ∈ B, allora g◦f è continua in x0 .
7
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Tenendo conto che, per definizione, una funzione è continua quando lo è in ogni punto del
suo dominio, dal precedente teorema segue immediatamente il seguente
Corollario. La composizione di due funzioni continue è una funzione continua.
14 - Mar. 26/9/00
Esercizio. Sia A un sottoinsieme limitato superiormente di R. Provare che almeno una
delle due seguenti affermazioni risulta verificata:
1) supA ∈ A (e quindi supA = maxA);
2) supA è un punto di accumulazione per A.
Suggerimento. Osservare che se si fissa un intorno (supA − r, supA + r) di supA, allora
supA−r non è un maggiorante per A, mentre supA+r lo è. Di conseguenza, se la proprietà
1) non è verificata, il suddetto intorno deve contenere almeno un elemento di A distinto
da supA.
Esercizio. Sia A un sottoinsieme limitato e chiuso di R. Provare che A ammette massimo
e minimo.
Suggerimento. Dedurre dall’esercizio precedente che supA ∈ A. Procedere in modo
analogo con infA.
Primo Teorema di Weierstrass. Sia f : A → R una funzione continua in un sottoinsieme limitato e chiuso A ⊂ R. Allora l’immagine di f è un insieme limitato e chiuso. In
particolare f ammette massimo e minimo assoluti.
Esempi (relativi alle ipotesi del Primo Teorema di Weierstrass). La funzione f (x) = x2
è continua nell’intervallo chiuso [0, +∞) ma non ha massimo. La funzione f (x) = x
è continua nell’intervallo limitato (0, 1) ma (in tale intervallo) non ha né massimo, né
minimo. La funzione f (x) = x − [x] nell’intervallo chiuso e limitato [0, 1] non ha massimo.
Secondo Teorema di Weierstrass. Sia f : J → R una funzione continua in un intervallo
J ⊂ R. Allora l’immagine di f è un intervallo. In particolare, se f assume valori sia
positivi sia negativi, esiste un punto del dominio in cui si annulla (quindi l’equazione
f (x) = 0 ammette almeno una soluzione).
Esempi (relativi alle ipotesi del Secondo Teorema di Weierstrass). La funzione f (x) = 1/x
è continua nell’insieme R\{0} in cui è definita, ma la sua immagine non è un intervallo
(perché assume valori sia negativi, sia positivi, ma non si annulla). La funzione f (x) = [x]
è definita in R (che è un intervallo) ma la sua immagine non è un intervallo.
Talvolta gli insiemi limitati e chiusi di R di chiamano i compatti (di R) e gli intervalli i
connessi di R. I due teoremi di Weierstrass possono essere quindi riformulati affermando
8
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
che le funzioni continue mandano compatti in compatti e connessi in connessi.
Applicazioni del Secondo Teorema di Weierstrass per provare l’esistenza di soluzioni di
equazioni del tipo f (x) = 0.
Cenni sul metodo numerico delle bisezioni per la ricerca di soluzioni di equazioni del tipo
f (x) = 0.
Esercizi assegnati [Spiegel, cap. 2]: 10, 11.
15 - Mer. 27/9/00
Teorema (di continuità per le funzioni monotone). Sia f : A → R una funzione monotona.
Se l’immagine di f è un intervallo, allora f è continua (non occorre che sia definita in un
intervallo).
Come immediata conseguenza del precedente risultato si ottiene il
Teorema (di continuità della funzione inversa). Sia f : J → R una funzione strettamente
monotona in un intervallo. Allora f −1 : f (J) → R è una funzione continua.
Dimostrazione. La funzione f −1 è strettamente crescente o decrescente, a seconda che sia
strettamente crescente o decrescente la f . La sua immagine, inoltre, coincide col dominio
J della f , che per ipotesi è un intervallo. Pertanto, per il precedente teorema, f −1 è
continua.
16 - Mer. 27/9/00
Ulteriori definizioni del concetto di limite: f (x) → l, +∞, −∞, ∞ per x → x0 , +∞, −∞,
∞.
Definizione. Il limite destro [sinistro] per x → x0 di una funzione f : A → R, detto anche
−
limite per x → x+
0 [x0 ] di f , è (quando ha senso) il limite per x → x0 della restrizione di
f all’insieme A ∩ (x0 , +∞) [A ∩ (−∞, x0 )].
Ovviamente, perché abbia senso parlare di limite destro [sinistro] per x → x0 di una
funzione definita in A, occorre che x0 sia un punto di accumulazione per l’insieme
A ∩ (x0 , +∞)
[A ∩ (−∞, x0 )] .
In questo caso si dice che x0 è un punto di accumulazione destro [sinistro] per A.
9
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
+
Osservazione. Supponiamo che abbiano senso i limiti per x → x−
0 e per x → x0 di f (x).
Allora f (x) → γ = l, +∞, −∞, ∞ se e solo se
lim f (x) = lim f (x) = γ.
x→x−
0
x→x+
0
Un modo unitario per definire i vari concetti di limite è il seguente:
“ si dice che una funzione f (x) tende a γ per x → α se per ogni intorno U di γ esiste un
intorno forato V di α tale che se x ∈ V (e x sta nel dominio di f ) allora f (x) ∈ U ”.
Ovviamente, la suddetta definizione di limite risulta chiara solo se si precisa cosa sono gli
intorni (e gli intorni forati) di α e di γ, dove α e γ possono essere o un numero reale a ∈ R,
o uno dei due simboli a− e a+ (con a ∈ R), o uno dei simboli −∞, +∞, ∞. Gli intorni di
un punto a, ricordiamo, sono gli intervalli aperti di centro a, mentre gli intorni forati di
a non sono altro che gli intorni privati del punto a stesso. Gli intorni di a− , detti anche
intorni sinistri di a, sono gli intervalli aperti con secondo estremo a (in questo caso gli
intorni e gli intorni forati sono la stessa cosa). In modo analogo si definiscono gli intorni
(forati e non forati) di a+ . Gli intorni (e gli intorni forati) di −∞ [+∞] sono le semirette
sinistre [destre] aperte (ossia, quelle del tipo (−∞, k) [(k, +∞)], con k ∈ R). Infine, gli
intorni di ∞ sono gli insiemi
{x ∈ R : |x| > k} = (−∞, −k) ∪ (k, +∞)
costituiti dai complementari degli intervalli [−k, k], con k > 0.
Quando si afferma che il limite per x → α di una funzione f : A → R ha senso, significa che
α è un punto di accumulazione per A, ossia che ogni intorno forato di α contiene (infiniti)
punti di A. Pertanto, un limite può aver senso anche quando non esiste.
Per non appesantire troppo il discorso, data f : A → R, nei teoremi che enunceremo, ogni
qual volta appare l’espressione f (x), sarà sempre sottinteso che x appartiene al dominio
A di f . Cosı̀, ad esempio, scriveremo semplicemente “ 0 < |x − x0 | < δ implica |f (x) − l| <
² ” invece di “ 0 < |x − x0 | < δ e x ∈ A implica |f (x) − l| < ² ”, oppure scriveremo
“ supx<α f (x) ” al posto di “ supx<α, x∈A f (x) ”.
Per motivi che risulteranno chiari in seguito (quando faremo il teorema del limite per
funzioni monotone), i simboli −∞ e +∞ verranno talvolta denotati rispettivamente con
∞+ e ∞− . In questo caso diremo anche che gli intorni di −∞ e di +∞ sono intorni destri
e sinistri di ∞, rispettivamente. In un certo senso è come se i due “estremi” della retta
reale si toccassero all’infinito per riunirsi in un unico punto: il punto all’infinito.
Esercizi assegnati [Spiegel, cap. 2]: 12, 13, 15.
10
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
17 - Gio. 28/9/00
Da ora in avanti, con la notazione R intenderemo l’insieme dei numeri reali estesi, ossia
l’insieme costituito dai numeri reali con l’aggiunta dei simboli −∞ e +∞. In R, per quanto
riguarda la relazione d’ordine, si fa la convenzione che ogni numero reale sia maggiore di
−∞ e minore di +∞. Si definiscono inoltre le seguenti operazioni (a è un arbitrario numero
reale e ∞ sta per −∞ o +∞): −∞ + a = −∞, +∞ + a = +∞, (−∞) + (−∞) = −∞,
(+∞) + (+∞) = +∞, a(±∞) = ±∞, se a > 0 e a(±∞) = ∓∞ se a < 0, a/∞ = 0,
a/0 = ∞ se a 6= 0, ∞/0 = ∞. Ogni eventuale definizione di (+∞) + (−∞), 0/0, 0 · ∞ e
∞/∞ porterebbe a delle incoerenze, e quindi non conviene farlo.
Riportiamo alcuni esempi per mostrare come non sia conveniente dare un senso alle
espressioni ∞ − ∞, 0/0, 0 · ∞ e ∞/∞ (dette anche forme indeterminate):
(∞ − ∞)
(∞ − ∞)
(0 · ∞)
(0 · ∞)
(0/0)
(0/0)
(∞/∞)
(∞/∞)
x−x→0
x2 − x → +∞
x(1/x) → 1
x2 (1/x) → 0
x/x → 1
x2 /x → 0
x/x → 1
x2 /x → +∞
per
per
per
per
per
per
per
per
x → +∞;
x → +∞;
x → 0;
x → 0;
x → 0;
x → 0;
x → +∞;
x → +∞.
Teorema (fondamentale dei limiti generalizzato). Siano f1 ed f2 due funzioni reali di
variabile reale. Supponiamo che, nei reali estesi, f1 (x) → γ1 e f2 (x) → γ2 , per x → α.
Allora, per x → α (e quando ha senso), si ha:
1) f1 (x) + f2 (x) → γ1 + γ2 ;
2) f1 (x)f2 (x) → γ1 γ2 ;
3) f1 (x)/f2 (x) → γ1 /γ2 .
Teorema (della permanenza del segno). Sia f una funzione reale di variabile reale e sia
c ∈ R. Supponiamo che f (x) tenda a γ ∈ R per x → α. Se γ > c [γ < c], allora un intorno
forato di α risulta (quando ha senso) f (x) > c [f (x) < c]. In particolare, se γ 6= 0, in un
conveniente intorno forato di α la funzione f (x) ha lo stesso segno di γ.
Teorema (del confronto dei limiti). Siano f e g due funzioni reali tali che f (x) ≤ g(x).
Supponiamo che per x → α si abbia f (x) → λ e g(x) → µ, con λ, µ ∈ R. Allora λ ≤ µ.
18 - Gio. 28/9/00
Teorema dei carabinieri. Siano f , g ed h tre funzioni reali tali che f (x) ≤ g(x) ≤ h(x).
Supponiamo che per x → α si abbia f (x) → γ e h(x) → γ. Allora anche g(x) → γ per
11
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
x → α.
Esercizio. Provare che una funzione tende a zero (per x → α) se e solo se tende a zero il
suo valore assoluto.
Applichiamo il teorema dei carabinieri per provare che la funzione sen x è continua. Si
tratta di mostrare che, fissato x0 ∈ R, sen x → sen x0 per x → x0 , o, equivalentemente
(per il teorema della somma dei limiti), che (sen x−sen x0 ) → 0 per x → x0 . Dalle formule
di prostaferesi si ottiene
sen x − sen x0 = 2 cos(
x − x0
x + x0
) sen(
).
2
2
Quindi
x − x0
x + x0
)|| sen(
)|.
2
2
Pertanto, essendo | cos α| ≤ 1 e | sen α| ≤ |α|, si ottiene
0 ≤ | sen x − sen x0 | = 2| cos(
0 ≤ | sen x − sen x0 | ≤ |x − x0 |.
Poiché le due funzioni f (x) := 0 e h(x) := |x − x0 | tendono a 0 (per x → x0 ), tende a zero
anche g(x) := | sen x − sen x0 |.
Corollario (del teorema dei carabinieri). Siano f e g due funzioni reali di variabile reale.
Supponiamo che f sia limitata e che g(x) → 0 per x → α. Allora f (x)g(x) → 0 per
x → α.
Per affermare che una funzione f tende a zero per x → α, si usa dire che è infinitesima
(per x → α), o che è un infinitesimo (spesso si omette di aggiungere “per x → α”, quando
risulta evidente dal contesto). Il precedente corollario può essere quindi enunciato cosı̀:
“Il prodotto di una funzione limitata per una infinitesima è una funzione infinitesima”.
Esempio. La funzione f (x) = x2 sen(1/x) è infinitesima per x → 0. Infatti x2 → 0 per
x → 0 e sen(1/x) è una funzione limitata (si osservi che il teorema fondamentale dei limiti
non è applicabile in questo caso, visto che sen(1/x) non ammette limite per x → 0).
Teorema del carabiniere. Siano f e g due funzioni tali che f (x) ≤ g(x). Supponiamo
che per x → α si abbia f (x) → +∞ [g(x) → −∞]. Allora anche g(x) → +∞ [f (x) → −∞].
Esempio. La funzione g(x) = x + sen x → +∞ per x → +∞. Si può infatti minorare col
“carabiniere” f (x) = x − 1, che tende a +∞ per x → +∞ (il teorema fondamentale dei
limiti non è applicabile in questo caso: sen x non ha limite per x → +∞).
Teorema (di unicità del limite). Il limite di una funzione, se esiste, è unico (nei reali
estesi).
12
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Esercizi assegnati [Spiegel, cap. 2]: 16, 17.
19 - Ven. 29/9/00
Teorema (di cambiamento di variabile per i limiti). Sia f una funzione tale che
lim f (x) = γ.
x→α
Se g(t) → α per t → β e g(t) 6= α in un intorno forato di β, allora
lim f (g(t)) = γ.
t→β
I due limiti fondamentali:
sen x
= 1 (esercizio 2.16);
lim
x→0 x
lim
x→±∞
µ
1
1+
x
¶x
= e = 2.71828182845...
Alcuni limiti notevoli (deducibili dai limiti fondamentali):
1 − cos x
= 1/2
x→0
x2
log(1 + x)
=1
lim
x→0
x
(1 + x)α − 1
lim
=α
x→0
x
lim
lim (1 + x)1/x = e
x→0
ex − 1
=1
x→0
x
log x
lim
=1
x→1 x − 1
lim
20 - Ven. 29/9/00
Prima di formulare il seguente teorema ricordiamo che i simboli ∞+ e ∞− denotano,
rispettivamente, i numeri reali estesi −∞ e +∞. In questo modo il limite per x → −∞
viene pensato come un limite destro, e per x → +∞ come un limite sinistro. Si fa inoltre
la convenzione che le disuguaglianze x < ∞ e x > ∞ significhino x < +∞ e x > −∞,
rispettivamente (entrambe sono quindi verificate per ogni x ∈ R). Ricordiamo ancora che
la variabile di una funzione, ovunque appaia in un enunciato, sta sempre nel dominio,
anche se, per semplicità di linguaggio, ciò non è esplicitamente affermato.
Teorema (del limite per le funzioni monotone). Sia f : A → R una funzione crescente
[decrescente] e sia α ∈ R ∪ {∞}. Allora (quando ha senso) risulta
·
¸
lim f (x) = sup f (x)
lim f (x) = inf f (x)
x<α
x→α−
x→α−
x<α
·
¸
lim f (x) = sup f (x)
lim f (x) = inf f (x)
x→α+
x>α
x→α+
x>α
13
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Come applicazione del teorema del limite per funzioni monotone, mostriamo che
limx→+∞ arctang x = π/2. Allo scopo ricordiamo che la funzione arcotangente è l’inversa della restrizione della tangente all’intervallo (−π/2, π/2). Essendo la tangente, in
tale intervallo, una funzione strettamente crescente, anche l’arcotangente risulta strettamente crescente. Di conseguenza, ricordandosi che l’immagine di una funzione inversa
coincide col dominio della funzione che viene invertita, si ha
lim arctang x = sup arctang x = sup(−π/2, π/2) = π/2.
x→∞−
x<∞
Definizione. Una funzione reale di variabile reale si dice continua a tratti in un intervallo
[a, b] se è definita ed è continua in [a, b] tranne un numero finito di punti in ciascuno dei
quali esistono finiti i due limiti sinistro e destro.
Teorema (di cambiamento di variabile per i limiti di funzioni continue). Sia f una
funzione continua in un punto x0 . Se g(t) → x0 per t → α, allora f (g(t)) → f (x0 ) per
t → α (non occorre assumere g(t) 6= x0 ).
Esercizi assegnati [Spiegel, cap. 2]: 20, 21.
21 - Lun. 2/10/00
Definizione. Una successione in un insieme X è un’applicazione a: N → X. Se X è un
sottoinsieme di R, la successione si dice reale (o di numeri reali).
Data una successione a: N → X, per motivi di tradizione e di semplicità, l’immagine di un
generico n ∈ N si denota col simbolo an , invece che con a(n). Il valore an associato ad n
si chiama il termine n-esimo della successione o l’elemento di indice n. I numeri naturali
sono detti gli indici della successione.
Vari
–
–
–
–
modi di indicare una successione a: N → X:
a: N → X (è quello più corretto ma il meno usato);
a1 , a2 , ..., an ,... (elencando i termini);
{an }n∈N (specificando che il dominio è N );
{an } (è il più sintetico ed è usato quando risulta chiaro dal contesto che rappresenta
una successione).
Osservazione. Attenzione a non fare confusione tra i termini di una successione (che
sono sempre infiniti) e i suoi valori assunti, che possono essere anche in numero finito. Ad
esempio, la successione {an = (−1)n } assume solo i valori 1 e −1 ma, ciascuno, infinite
volte.
14
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Da ora in avanti, a meno che non sia diversamente specificato, ci occuperemo di successioni di numeri reali. In questo caso vale la convenzione che abbiamo adottato per le
funzioni reali: per semplicità, a meno che non sia dichiarato diversamente, si assume che
il codominio coincida con R.
Osserviamo che +∞ è un punto di accumulazione per N (in senso generalizzato); pertanto,
data una successione {an }, ha senso parlare di limite per n → +∞ di an (la definizione di
limite e i teoremi connessi discendono da quelli già visti per le funzioni reali di variabile
reale). Il limite per n → +∞ di una successione {an } si denota col simbolo
lim an
n→+∞
o più semplicemente con lim an . Quest’ultima notazione, particolarmente sintetica, è
giustificata dal fatto che +∞ è l’unico punto di accumulazione per N.
Rivediamo la definizione di limite data per le funzioni, adattandola al caso particolare
delle successioni.
Definizione. Si dice che una successione {an } tende (o converge) ad l ∈ R, e si scrive
an → l (per n → +∞), se per ogni ² > 0 esiste un indice n̄ tale che per n > n̄ si ha
|an − l| < ². Si dice che {an } tende (o diverge) a +∞ (si scrive an → +∞) se per ogni
k ∈ R esiste un indice n̄ tale che per n > n̄ si ha an > k. Analogamente an → −∞ se per
ogni k ∈ R esiste n̄ tale che per n > n̄ si ha an < k. Si dice infine che {an } diverge (o
tende) all’infinito se |an | → +∞.
Esempio. Consideriamo la successione {(1 + 1/n)n }. Poiché la funzione di variabile reale
(1 + x)1/x tende al numero e per x → 0, dal teorema di cambiamento di variabile per i
limiti (ponendo x = 1/n) si ottiene {(1 + 1/n)n } → e per n → +∞.
Definizione. Una successione {an } si dice convergente se ammette limite finito, divergente
se il limite è ∞ (quindi anche +∞ o −∞) e indeterminata negli altri casi (quando non
ammette limite). Una successione convergente, divergente a −∞ o divergente a +∞ si
dice regolare.
Teorema (fondamentale dei limiti delle successioni). Siano {an } e {bn } due successioni
tali che an → α e bn → β (dove α, β ∈ R). Allora, quando ha senso, si ha:
1) an + bn → α + β;
2) an bn → αβ;
3) an /bn → α/β.
22 - Lun. 2/10/00
I concetti di successione limitata, limitata superiormente e limitata inferiormente sono
15
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
casi particolari di quelli già definiti per le funzioni reali di variabile reale; pertanto, non
verranno ripetuti.
Notazione. Data una successione {an }, analogamente a quanto si è visto per le funzioni reali, col simbolo sup an si denota l’estremo superiore della successione (ossia, dell’immagine della successione). Analogamente, inf an rappresenta l’estremo inferiore di
{an }.
La nozione di successione monotona (monotona crescente, strettamente crescente, ecc.) è
un caso particolare di quella già introdotta per le funzioni reali di variabile reale.
Esercizio. Provare che una successione {an } è crescente se e solo se an ≤ an+1 , per ogni
n ∈ N.
Il seguente risultato è un’immediata conseguenza del teorema del limite per funzioni
monotone.
Teorema (del limite per successioni monotone). Se {an } è una successione monotona,
allora è regolare. Precisamente si ha lim an = sup an se {an } è crescente e lim an = inf an
se è decrescente. In particolare se {an }, oltre ad essere monotona, è anche limitata, allora
è convergente.
Esercizi assegnati [Spiegel, cap. 3]: 1, 2, 4, 7, 8, 9, 10, 11, 12, 13, 14.
23 - Mar. 3/10/00
Definizione. Si dice che una successione {an } sta definitivamente in un insieme A ⊂ R
se esiste un indice n̄ per il quale si ha an ∈ A per ogni n > n̄. Si dice che soddisfa
definitivamente una data disequazione (con incognita n ∈ N) se esiste un n̄ con la proprietà
che tale disequazione è soddisfatta per tutti gli n maggiori di n̄. Si osservi che una
successione {an } converge ad l ∈ R se e solo se sta definitivamente in ogni intorno di l.
Analogamente {an } diverge a +∞ (risp. −∞, ∞) se sta definitivamente in ogni intorno
di +∞ (risp. −∞, ∞).
Esercizio. Definire la nozione di successione definitivamente crescente [decrescente,
strettamente crescente, strettamente decrescente].
Sia {an } una successione in R e sia λ un numero reale. Ricordiamo che λ è un maggiorante
per {an } se an ≤ λ per ogni n ∈ N. Diremo che λ è un maggiorante definitivo per {an }, se
an ≤ λ definitivamente. Ossia se esiste un n̄ ∈ N per il quale si ha an ≤ λ per ogni n > n̄
(chiaramente ogni maggiorante è anche un maggiorante definitivo). Il compito di definire
il concetto di minorante definitivo è lasciato per esercizio allo studente.
16
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Osservazione. L’insieme dei maggioranti definitivi di una successione limitata è una
semiretta destra.
Esempi:
– l’insieme dei maggioranti definitivi di {−1/n} è [0, +∞);
– l’insieme dei maggioranti definitivi di {(−1)n } è [1, +∞);
– l’insieme dei maggioranti definitivi di {1/n} è (0, +∞).
Sia {an } una successione in R. Se {an } è l’imitata superiormente, il suo massimo limite,
detto anche limite superiore, è l’estremo inferiore dei maggioranti definitivi di {an }. Se
{an } non è limitata superiormente, per definizione, il suo massimo limite è +∞. In modo
analogo si introduce il concetto di minimo limite, o limite inferiore (i dettagli sono lasciati
allo studente).
In base agli esempi visti, si osservi che, in generale, è sbagliato affermare che il massimo
limite è il più piccolo dei maggioranti definitivi. L’insieme dei maggioranti definitivi,
infatti, potrebbe non ammettere minimo.
Il massimo [minimo] limite di una successione si denota con uno dei seguenti simboli:
lim an ,
n→∞
lim an ,
lim sup an
[ lim an ,
n→∞
lim an ,
lim inf an ].
Ricordiamo che il limite di una successione può non esistere, mentre il massimo e minimo
limite esistono sempre; e questo, come si vedrà in seguito quando faremo le serie di potenze,
è un notevole vantaggio.
Teorema. Data una successione {an }, si ha lim an ≤ lim an . Inoltre an → γ ∈ R se e
solo se liman = liman = γ.
In generale non è vero che il limite superiore del prodotto di due successioni è uguale al
prodotto dei limiti superiori. Tuttavia, si potrebbe dimostrare che se due successioni sono
non negative e una delle due ammette limite, allora il limite superiore del loro prodotto
coincide col prodotto dei limiti superiori (ovviamente, quando ha senso; ossia tranne il
caso 0 · ∞).
24 - Mar. 3/10/00
Data una successione {an }, l’espressione
∞
X
an
n=1
17
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
si legge “serie (o somma) per n che va da 1 a +∞ di an ” e rappresenta, in modo sintetico,
il
n
X
lim
ak .
n→+∞
k=1
In altri termini, posto Sn = a1 + a2 + ... + an , per definizione si ha
∞
X
an = lim Sn .
n→+∞
n=1
La successione {Sn } si dice successione delle somme parziali (o delle ridotte) della serie,
mentre an è detto il termine generale. Il carattere della serie è, per definizione, il carattere
della successione {Sn }. In altre parole: se {Sn } converge, si dice che converge la serie; se
{Sn } diverge, la serie diverge; se il limite di {Sn } non esiste, la serie è indeterminata. Il
limite S (finito o infinito) di {Sn }, quando esiste, si dice somma della serie e si scrive
S=
∞
X
an .
n=1
Talvolta, invece di sommare a partire da n = 1, si parte da un indice n0 ∈ Z (anche
negativo). Scriveremo allora
∞
X
an .
n=n0
Teorema. Condizione necessaria affinché una serie sia convergente è che il termine
generale tenda a zero.
P
Dimostrazione. Sia ∞
n=n0 an una serie convergente. Ciò significa, per definizione, che la
successione {Sn } delle somme parziali converge ad un numero (finito) S. Osserviamo che
an = Sn − Sn−1 e che (oltre ad Sn ) anche Sn−1 converge ad S (infatti, se |Sn − S| < ² per
n > n̄, allora |Sn−1 − S| < ² per n > n̄ + 1). Si ha allora
lim an = lim (Sn − Sn−1 ) = S − S = 0 .
n→∞
n→∞
P
La suddetta condizione non è sufficiente. Proveremo infatti che la serie ∞
n=1 1/n (detta
armonica) non è convergente, sebbene il suo termine generale sia infinitesimo.
P
Definizione. Una serie ∞
n=n0 an è detta geometrica se il rapporto an+1 /an è costante
(ossia, non dipende da n). In tal caso il rapporto si chiama ragione della serie.
Teorema. Una serie geometrica converge se e solo se la sua ragione è in valore assoluto
minore di uno. Inoltre, denotato con a il primo termine e con q ∈ (−1, 1) la ragione, la
somma è a/(1 − q).
18
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
P
n
Dimostrazione. Sia ∞
n=0 aq una serie geometrica e denotiamo con Sn la sua somma
parziale n-esima. Se q = 1, si ha Sn = na, e quindi la serie diverge (a meno che a non
sia zero). Si può quindi supporre q 6= 1. Moltiplicando per 1 − q entrambi i membri
dell’uguaglianza
Sn = a + aq + aq 2 + · · · + aq n−1 ,
si ha
Sn (1 − q) = (a + aq + aq 2 + · · · + aq n−1 )(1 − q) =
a − aq + aq − aq 2 + aq 2 − · · · − aq n = a − aq n .
Pertanto, avendo supposto q 6= 1, si ottiene
Sn =
a(1 − q n )
.
1−q
Se |q| < 1, si ha q n → 0 e, di conseguenza, Sn → a/(1 − q). Se q = 1, abbiamo già visto
che la serie diverge (quando non è una finta serie). Se q > 1, la successione {q n } diverge
a +∞, e quindi anche Sn → +∞. Se q = −1, la serie è indeterminata, perché {(−1)n }
non ammette limite. Infine, se q < −1, la successione {q n } diverge all’infinito, e quindi
diverge all’infinito anche {Sn }.
A titolo di esempio, consideriamo il numero decimale periodico 3, 17̄ = 3, 17777... Si può
scrivere
7
7
7
3, 17̄ = 3, 1 + 0, 07 + 0, 007 + 0, 0007 + . . . = 3, 1 + 2 + 3 + 4 + . . .
10
10
10
Ovvero
La serie
pertanto
∞
P∞
n=2
31 X 7
.
+
3, 17̄ =
10
10n
n=2
7/10n
è geometrica, di ragione 1/10 e il suo primo termine è 7/100. Si ha
3, 17̄ =
7/100
143
31
+
.
=
10 1 − 1/10
45
In modo analogo si prova che ogni numero decimale periodico è razionale e se ne determina
la frazione generatrice.
Esercizi assegnati [Spiegel, cap. 3]: 16, 17, 20, 21, 25, 26, 30.
25 - Mer. 4/10/00
Definizione. Sia f : A → R una funzione reale di variabile reale e sia x0 ∈ A ∩ A0 . Si dice
che f è derivabile in x0 se esiste ed è finito il limite, per x → x0 , della funzione
f (x) − f (x0 )
x − x0
19
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
detta rapporto incrementale di f in x0 . Tale limite, quando esiste ed è finito, si chiama
derivata di f in x0 e si denota con uno dei seguenti simboli:
f 0 (x0 ),
Df (x0 ),
df
(x0 ),
dx
Dx0 f,
Df (x)|x=x0 .
Mostriamo, ad esempio, che la funzione f (x) = x2 è derivabile in ogni punto x0 ∈ R e
risulta f 0 (x0 ) = 2x0 . Si ha infatti
f (x) − f (x0 )
x→x0
x − x0
(x + x0 )(x − x0 )
lim
x→x0
x − x0
lim
=
=
lim
x→x0
x2 − x20
=
x − x0
lim (x + x0 ) = 2x0 .
x→x0
Definizione. Una funzione f : A → R si dice derivabile se è derivabile in ogni punto del
suo dominio. Ovviamente, perché questo accada, è necessario (ma non sufficiente) che
ogni punto del dominio A di f sia di accumulazione (ciò è vero, ad esempio, quando A è
un intervallo o, più in generale, unione di intervalli).
Esercizio. Provare che se f : R → R è costante, allora è derivabile in ogni punto x e
f 0 (x) = 0.
Esercizio. Provare che la funzione f (x) = x è derivabile in ogni punto e si ha f 0 (x) = 1
per ogni x ∈ R.
Teorema. Una funzione f : A → R è derivabile in x0 ∈ A ∩ A0 se e solo se esiste una
funzione ϕ: A → R continua in x0 e tale che
f (x) − f (x0 ) = ϕ(x)(x − x0 ),
∀x ∈ A.
In questo caso il numero ϕ(x0 ) coincide con f 0 (x0 ).
Dal suddetto teorema segue immediatamente che se una funzione è derivabile in un punto,
allora in tale punto è anche continua.
Sia f : A → R derivabile in x0 e sia ϕ: A → R continua in x0 e tale che
f (x) − f (x0 ) = ϕ(x)(x − x0 ),
∀x ∈ A.
Si ha
ϕ(x0 + h) = ϕ(x0 ) + ²(h) = f 0 (x0 ) + ²(h) ,
dove la funzione ²(h) := ϕ(x0 + h) − ϕ(x0 ) è continua e nulla per h = 0. Si può dunque
concludere che se f è derivabile in x0 , allora
f (x0 + h) = f (x0 ) + f 0 (x0 )h + ²(h)h ,
20
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
per ogni h ammissibile, ossia tale che x0 + h ∈ A. Tale uguaglianza, come vedremo meglio
in seguito, si chiama formula di Taylor del primo ordine di f in x0 (col resto nella forma
di Peano).
26 - Mer. 4/10/00
Interpretazione geometrica della derivata (vedere Spiegel).
Definizione. Data una funzione reale di variabile reale f , consideriamo un punto (x0 , y0 )
del suo grafico (ossia, supponiamo che x0 stia nel dominio di f e che y0 sia uguale a
f (x0 ) ). Se f è derivabile in x0 , la retta tangente al grafico della f in (x0 , y0 ) è la retta
passante per (x0 , y0 ) con coefficiente angolare f 0 (x0 ). Ossia, è la retta di equazione y−y0 =
f 0 (x0 )(x − x0 ).
Teorema. Le funzioni sen x, cos x, ex , log x sono derivabili e D sen x = cos x, D cos x =
− sen x, Dex = ex , D log x = 1/x.
Teorema (fondamentale delle derivate). Siano f e g due funzioni derivabili in un punto
x0 . Allora, quando ha senso, si ha
(f + g)0 (x0 ) = f 0 (x0 ) + g 0 (x0 )
(f g)0 (x0 ) = f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 )
f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 )
.
(f /g)0 (x0 ) =
g(x0 )2
A titolo di esempio, dimostriamo il suddetto teorema nel caso del prodotto. Denotiamo
con A il dominio comune ad f e g e supponiamo che abbia senso la derivata di f g in
x0 ; ossia supponiamo che x0 ∈ A ∩ A0 . Per ipotesi si ha f (x) = f (x0 ) + ϕ(x)(x − x0 ) e
g(x) = g(x0 ) + ψ(x)(x − x0 ) per ogni x ∈ A, dove ϕ, ψ: A → R sono continue in x0 . Quindi
f (x)g(x) = f (x0 )g(x0 ) + [ϕ(x)g(x0 ) + f (x0 )ψ(x) + ϕ(x)ψ(x)(x − x0 )](x − x0 ).
Pertanto
(f g)(x) − (f g)(x0 ) = α(x)(x − x0 ),
dove la funzione
α(x) = ϕ(x)g(x0 ) + f (x0 )ψ(x) + ϕ(x)ψ(x)(x − x0 )
è continua in x0 (essendo somma e prodotto di funzioni continue in x0 ). Questo prova che
f g è derivabile in x0 e
(f g)0 (x0 ) = α(x0 ) = ϕ(x0 )g(x0 ) + f (x0 )ψ(x0 ) = f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ).
21
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Esercizio. Usando la regola della derivata del quoziente provare che
D tang x = 1 + tang2 x = 1/ cos2 x.
Esercizi assegnati [Spiegel, cap. 4]: 1, 2, 3.
27 - Gio. 5/10/00
Teorema (della derivata di una funzione composta). Siano f : A → R e g: B → R due
funzioni derivabili rispettivamente in x0 e in y0 = f (x0 ). Allora, quando ha senso (ossia,
quando x0 è di accumulazione per il dominio f −1 (B) di g ◦f ), la funzione composta g ◦f
è derivabile in x0 e si ha
(g◦f )0 (x0 ) = g 0 (y0 )f 0 (x0 ) = g 0 (f (x0 ))f 0 (x0 ).
In altre parole, la derivata della composizione è il prodotto delle derivate (nei punti
corrispondenti).
Dimostrazione. Per ipotesi si ha
f (x) = f (x0 ) + ϕ(x)(x − x0 ),
g(y) = g(y0 ) + ψ(y)(y − y0 ),
∀x ∈ A,
∀y ∈ B,
con ϕ: A → R e ψ: B → R continue in x0 e y0 rispettivamente. Osserviamo ora che se x
appartiene al dominio di g◦f , il numero f (x) sta nel dominio B di g. Sostituendo quindi,
nella seconda uguaglianza, f (x) al posto di y e tenendo conto che f (x0 ) = y0 , si ottiene
g(f (x)) − g(f (x0 )) = ψ(f (x))(f (x) − f (x0 )) = ψ(f (x))ϕ(x)(x − x0 ),
per ogni x nel dominio f −1 (B) della funzione composta. Questo prova che g◦f è derivabile
in x0 , visto che ψ(f (x))ϕ(x) è continua in x0 essendo composizione e prodotto di funzioni
continue (la f e la ϕ sono continue in x0 e la ψ in y0 = f (x0 )). Si ha infine
(g◦f )0 (x0 ) = ψ(f (x0 ))ϕ(x0 ) = ψ(y0 )ϕ(x0 ) = g 0 (y0 )f 0 (x0 ).
Teorema (della derivata di una funzione inversa). Sia f : J → R una funzione strettamente
monotona in un intervallo. Se f è derivabile in un punto x0 ∈ J e f 0 (x0 ) 6= 0, allora f −1
è derivabile in y0 = f (x0 ) e
(f −1 )0 (y0 ) =
1
1
= 0 −1
.
f 0 (x0 )
f (f (y0 ))
Dimostrazione. Essendo f derivabile in x0 , esiste ϕ: J → R continua in x0 e tale che
f (x) − f (x0 ) = ϕ(x)(x − x0 ) per ogni x ∈ J. Poiché (per definizione di funzione inversa)
22
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
risulta f −1 (y) ∈ J per ogni y ∈ f (J), ponendo nella suddetta uguaglianza f −1 (y) al posto
di x (e tenendo conto che x0 = f −1 (y0 ) ), si ottiene
f (f −1 (y)) − f (f −1 (y0 )) = ϕ(f −1 (y))(f −1 (y) − f −1 (y0 ));
che possiamo scrivere nella forma
y − y0 = ϕ(f −1 (y))(f −1 (y) − f −1 (y0 )).
Di conseguenza, se y 6= y0 , si ha necessariamente ϕ(f −1 (y)) 6= 0, ed avendo inoltre
supposto ϕ(f −1 (y0 )) = ϕ(x0 ) = f 0 (x0 ) 6= 0, si ottiene l’uguaglianza
f −1 (y) − f −1 (y0 ) =
1
ϕ(f −1 (y))
(y − y0 ),
∀y ∈ f (J).
Osserviamo ora che f −1 : f (J) → R è continua, visto che è monotona ed ha per immagine
l’intervallo J. Risulta quindi continua in y0 anche la funzione 1/(ϕ◦f −1 ). Questo prova
che f −1 è derivabile in y0 e
(f −1 )0 (y0 ) =
1
ϕ(f −1 (y
0 ))
=
1
f 0 (x
0)
.
Come applicazione del teorema della derivata di una funzione inversa, mostriamo che
arctang x è derivabile e si ha
1
.
D arctang x =
1 + x2
Fissato un punto y0 ∈ R, dal suddetto teorema segue
D arctang y0 =
1
1
,
=
D tang x0
1 + tang2 x0
dove x0 = arctang y0 . Dunque
D arctang y0 =
1
1+
tang2 (arctang y
0)
=
1
.
1 + y02
Esercizio. Mediante il teorema della derivata di una funzione inversa determinare le
derivate di arcsen x e di arccos x.
Definizione. Data una funzione f : A → R, la sua derivata (laterale) destra [sinistra]
in x0 è (quando esiste) la derivata in x0 della restrizione di f all’insieme A ∩ [x0 , +∞)
[A ∩ (−∞, x0 ] ]. Tale derivata si indica con D+ f (x0 ) [D− f (x0 )] o con f+0 (x0 ) [f−0 (x0 )].
Osservazione. Supponiamo che in un punto x0 abbiano senso le due derivate laterali di
una funzione. Allora la funzione è derivabile in x0 se e solo se tali derivate esistono e
coincidono. In tal caso le tre derivate, sinistra, destra e bilaterale sono uguali.
23
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Un punto si dice angoloso per una funzione se in tal punto la funzione è derivabile sia a
sinistra sia a destra ma le derivate laterali sono diverse.
28 - Gio. 5/10/00
Se f : A → R è derivabile in ogni punto di A, allora la funzione che ad ogni x ∈ A associa
il numero f 0 (x) si chiama derivata (o derivata prima) di f e si denota con uno dei seguenti
simboli:
df
.
f 0 , Df,
dx
La derivata della derivata di una funzione f si chiama derivata seconda di f e si indica
con f 00 , con D2 f o con
µ ¶
d2 f
d df
= 2.
dx dx
dx
In generale, la derivata della derivata (n − 1)-esima di f si chiama derivata n-esima e si
denota con f (n) , con Dn f o con
µ
¶
dn f
d dn−1 f
= n.
dx
dx
dx
Definizione. Una funzione f si dice di classe C 0 se è continua. Si dice di classe C 1 (o che
appartiene alla classe C 1 ) se è derivabile e la sua derivata è di classe C 0 . Per induzione,
f è (di classe) C n , n ∈ N, se è derivabile e la sua derivata prima è C n−1 . Si dice infine
che f è (di classe) C ∞ se è C n per ogni n ∈ N. Per indicare che f è di classe C n [C ∞ ] si
scrive f ∈ C n [f ∈ C ∞ ].
Abbiamo visto che le funzioni derivabili sono anche continue, pertanto, se f è C 1 , essendo
derivabile, è anche di classe C 0 . Più in generale vale il seguente
Lemma. Se f è C n allora è anche C n−1 .
Dimostrazione. Indichiamo con Pn la proposizione “ C n ⇒ C n−1 ”. Abbiamo appena
osservato che P1 è vera. Procediamo per induzione: supponiamo, per ipotesi induttiva,
che sia vera Pn−1 e deduciamo da tale ipotesi che è vera anche Pn . Supponiamo quindi
che f sia C n , ossia che f 0 sia C n−1 . Dall’ipotesi induttiva si deduce che f 0 è anche C n−2 ,
e quindi f è C n−1 (per definizione di C n−1 ).
Per meglio comprendere il concetto di funzione di classe C n , osserviamo che se f ∈ C n ,
allora f 0 , essendo di classe C n−1 , è ancora derivabile e la sua derivata, f 00 , è di classe C n−2 ,
e cosı̀ via fino ad arrivare alla derivata n-esima di f , che deve esistere e risultare continua.
In altre parole, possiamo affermare che f è C n se (e solo se) è derivabile n volte e la sua
derivata n-esima è continua (una dimostrazione rigorosa di tale affermazione richiede il
principio di induzione).
24
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Teorema (di regolarità delle funzioni combinate). La somma, il prodotto, il quoziente e
la composizione di funzioni di classe C n , quando (e dove) ha senso, è ancora una funzione
di classe C n .
Dimostrazione.
(Somma) Sia Pn la proposizione “ f, g ∈ C n ⇒ (f + g) ∈ C n ”. Dal teorema della derivata
della somma si ha (f + g)0 = f 0 + g 0 , e questo implica immediatamente che P1 è vera.
Assumiamo vera Pn−1 e dimostriamo che allora è vera anche Pn . Supponiamo quindi che
f, g ∈ C n (ovvero che f 0 , g 0 ∈ C n−1 ) e mostriamo che (f + g) ∈ C n (ossia che (f + g)0 ∈
C n−1 ). Poiché (f + g)0 = f 0 + g 0 , dall’ipotesi induttiva si ha (f + g)0 ∈ C n−1 , che per
definizione significa (f + g) ∈ C n .
(Prodotto) Analogamente alla dimostrazione precedente denotiamo con Pn la proposizione
“ f, g ∈ C n ⇒ f g ∈ C n ”. Dal teorema della derivata del prodotto si ha (f g)0 = f 0 g +g 0 f , e
questo implica che P1 è vera. Assumiamo (per ipotesi induttiva) vera Pn−1 e supponiamo
che f, g ∈ C n . Vogliamo provare che il prodotto f g è di classe C n , ovvero che la funzione
(f g)0 , che coincide con f 0 g + g 0 f , è di classe C n−1 . Questo segue facilmente dal lemma
precedente, dall’ipotesi induttiva, e da quanto già provato per la somma.
(Quoziente) La dimostrazione è simile alle due precedenti ed è lasciata per esercizio allo
studente.
(Composizione) La dimostrazione è basata sulla formula della derivata di una funzione
composta: (g◦f )0 (x) = g 0 (f (x))f 0 (x). Questa ci dice che (g◦f )0 è prodotto e composizione
di funzioni di una classe inferiore di un’unità rispetto a quella di appartenenza di f e
g. Come per i casi precedenti, si può procedere per induzione, provando che P1 è vera
e riducendo la veridicità della proposizione Pn = “ f, g ∈ C n ⇒ g ◦f ∈ C n ” a quella di
Pn−1 .
Definizione. Una funzione f : [a, b] → R si dice (di classe) C 0 a tratti se è continua a
tratti. Per induzione, f si dice C n a tratti se è derivabile tranne un numero finito di punti
e la sua derivata è C n−1 a tratti. Si dice C ∞ a tratti se è C n a tratti per ogni n ∈ N.
Esercizi assegnati [Spiegel, cap. 4]: 4, 5, 9.
29 - Ven. 6/10/00
Teorema. Le funzioni xα , ax , loga x, senh x, cosh x sono derivabili e risulta Dxα =
αxα−1 , Dax = ax loga, D loga x = 1/(x loga), D senh x = cosh x, D cosh x = senh x.
Definizione. Un punto x0 ∈ R si dice interno ad un sottoinsieme A di R se esiste un
intorno (x0 − δ, x0 + δ) di x0 contenuto in A. Si dice che x0 è di frontiera per A se ogni
suo intorno interseca sia l’insieme A sia il suo complementare (ossia, se non è né interno
25
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
ad A né interno al complementare di A).
Definizione. Sia f : A → R una funzione reale di variabile reale. Un punto x0 ∈ A si dice
di minimo [di massimo ] relativo (o locale) per f in A se esiste un intorno U di x0 tale
che f (x) ≥ f (x0 ) [f (x) ≤ f (x0 )] per ogni x ∈ U ∩ A. Un punto di minimo o di massimo
relativo per f (in A) si dice estremante per f (in A).
Teorema di Fermat. Sia f : A → R una funzione reale di variabile reale e sia x0 ∈ A.
Supponiamo che siano soddisfatte le seguenti tre ipotesi:
1) x0 è interno ad A;
2) f è derivabile in x0 ;
3) x0 è un punto estremante per f in A.
Allora f 0 (x0 ) = 0.
Dimostrazione. Supponiamo per assurdo che f 0 (x0 ) 6= 0. Ad esempio supponiamo f 0 (x0 ) >
0. Per ipotesi esiste ϕ: A → R, continua in x0 e tale che f (x) − f (x0 ) = ϕ(x)(x − x0 )
per ogni x ∈ A. Essendo ϕ(x0 ) = f 0 (x0 ) > 0, esiste un intorno V di x0 in cui ϕ(x) > 0.
Quindi, in tale intorno, f (x) < f (x0 ) per x < x0 e f (x) > f (x0 ) per x > x0 . Ne segue
che x0 non può essere né un punto di minimo né un punto di massimo, contraddicendo
l’ipotesi 3). Pertanto non può essere f 0 (x0 ) > 0. In maniera analoga si prova che non può
essere f 0 (x0 ) < 0. Dunque f 0 (x0 ) = 0.
Osserviamo che, in base al Teorema di Fermat, i punti estremanti di una funzione f : A → R
vanno cercati tra le seguenti tre categorie:
1) punti di frontiera;
2) punti in cui la funzione non è derivabile;
3) punti in cui si annulla la derivata.
Nessuna delle suddette tre condizioni ci assicura che un punto sia estremante. Tuttavia,
se il punto è estremante, almeno una delle tre deve necessariamente essere soddisfatta.
30 - Ven. 6/10/00
Teorema di Rolle. Sia f : [a, b] → R una funzione soddisfacente le seguenti condizioni:
1) f è continua in [a, b];
2) f è derivabile in (a, b);
3) f (a) = f (b).
Allora esiste un punto c ∈ (a, b) tale che f 0 (c) = 0.
Dimostrazione. Poiché f è continua in un insieme limitato e chiuso, per il Primo Teorema
di Weierstrass ammette minimo e massimo assoluti. Esistono cioè (almeno) due punti
c1 , c2 ∈ [a, b] per i quali risulta f (c1 ) ≤ f (x) ≤ f (c2 ) per ogni x ∈ [a, b]. Se uno dei due
punti, ad esempio c = c1 , è interno all’intervallo [a, b], allora, essendo f derivabile in tal
26
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
punto, dal Teorema di Fermat segue f 0 (c) = 0 (e la tesi, in questo caso, è dimostrata). Se,
invece, nessuno dei due punti è interno ad [a, b], allora sono entrambi di frontiera per [a, b],
e quindi, per l’ipotesi 3) si ha f (c1 ) = f (c2 ). Pertanto, essendo f (c1 ) ≤ f (x) ≤ f (c2 ), la
funzione risulta costante e, di conseguenza, la derivata è nulla in ogni punto c ∈ (a, b).
Esempio. La funzione f (x) = |x| è continua in [−1, 1] e f (−1) = f (1), ma la sua derivata
non si annulla mai in (−1, 1). Come mai?
Esempio. La funzione f (x) = x−[x] è definita in [0, 1], è derivabile in (0, 1) e f (0) = f (1).
Tuttavia la sua derivata non si annulla mai in (0, 1). Come mai?
Esempio. La funzione f (x) = x è derivabile in [0, 1] (quindi anche continua), sebbene la
sua derivata non si annulli mai in (0, 1). Come mai?
Il seguente risultato è un’importante estensione del Teorema di Rolle.
Teorema di Lagrange (o del valor medio). Sia f : [a, b] → R una funzione soddisfacente
le seguenti condizioni:
1) f è continua in [a, b];
2) f è derivabile in (a, b).
Allora esiste un punto c ∈ (a, b) tale che
f 0 (c) =
f (b) − f (a)
.
b−a
Dimostrazione. Definiamo una nuova funzione
ϕ(x) := f (x) − kx ,
determinando la costante k in modo che ϕ soddisfi (in [a, b]) le ipotesi del Teorema di
Rolle. È immediato verificare che l’unica costante che rende ϕ(a) = ϕ(b) è
k=
f (b) − f (a)
.
b−a
Per teorema di Rolle esiste c ∈ (a, b) tale che ϕ0 (c) = 0, e la tesi segue immediatamente
osservando che ϕ0 (x) = f 0 (x) − k.
Dati due arbitrari punti a, b ∈ R, l’intervallo che ha per estremi tali punti si chiama
segmento di estremi a e b e si denota con ab. In altre parole: ab = [a, b] se a < b, ab = {a}
se a = b e ab = [b, a] se a > b.
Corollario. Sia f derivabile in un intervallo J. Allora, dati a, b ∈ J, esiste un punto
c ∈ ab per il quale risulta f (b) − f (a) = f 0 (c)(b − a).
Esercizi assegnati [Spiegel, cap. 4]: 21, 22, 23.
27
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
31 - Lun. 9/10/00
Diamo ora alcune importanti conseguenze del Teorema di Lagrange.
Corollario. Sia f : J → R derivabile in un intervallo J e tale f 0 (x) ≥ 0 [f 0 (x) ≤ 0] per
ogni x ∈ J. Allora f è crescente [decrescente] in J.
Dimostrazione. Siano x1 , x2 ∈ J tali che x1 < x2 . Per il Teorema di Lagrange esiste un
c ∈ (x1 , x2 ) per cui f (x2 )−f (x1 ) = f 0 (c)(x2 −x1 ). Poiché f 0 (c) ≥ 0, si ha f (x1 ) ≤ f (x2 ).
Esercizio. Sia f : J → R derivabile in un intervallo J. Provare che la condizione “f 0 (x) ≥
0, ∀x ∈ J” non è soltanto sufficiente, ma anche necessaria affinché f sia crescente in J.
Suggerimento. Osservare che se f è crescente, allora
f (x) − f (x0 )
≥ 0,
x − x0
∀ x, x0 ∈ J ,
e quindi, per il teorema del confronto dei limiti . . .
Corollario. Sia f : J → R derivabile in un intervallo J e tale f 0 (x) > 0 [f 0 (x) < 0] per
ogni x ∈ J. Allora f è strettamente crescente [strettamente decrescente] in J.
Dimostrazione. È analoga a quella del precedente corollario.
Esercizio. Sia f : J → R derivabile in un intervallo J. Mostrare, con un esempio, che la
condizione f 0 (x) > 0 (pur essendo sufficiente) non è necessaria affinché f sia strettamente
crescente in J.
Non è difficile provare che una condizione necessaria e sufficiente affinché una funzione
f : J → R, derivabile in un intervallo J, sia strettamente crescente è che siano soddisfatte
le seguenti due condizioni:
– f 0 (x) ≥ 0 per ogni x ∈ J;
– in ogni sottointervallo non banale di J esiste almeno un punto c in cui f 0 (c) > 0.
Corollario. Sia f : J → R derivabile in un intervallo J e tale f 0 (x) = 0 per ogni x ∈ J.
Allora f è costante in J.
Dimostrazione. È analoga a quella del precedente corollario.
Osservazione. Nei tre precedenti corollari, l’ipotesi che f sia definita in un intervallo
non può essere rimossa. Ad esempio, per quanto riguarda l’ultimo dei tre, si osservi che
la funzione f (x) = |x|/x è derivabile nel suo dominio R\{0}, ha derivata nulla, ma non è
costante (lo è in ogni sottointervallo del dominio).
Corollario. Sia f : J → R continua in un intervallo J e derivabile in J\{x0 }, con x0 ∈ J.
Supponiamo che esista finito il limite per x → x0 di f 0 (x). Allora f è derivabile in x0 ed
28
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
f 0 risulta continua in x0 . In altre parole si ha
f 0 (x0 ) = lim f 0 (x) .
x→x0
Dimostrazione. Consideriamo il rapporto incrementale
f (x) − f (x0 )
,
x − x0
dove x ∈ J. Per il Teorema di Lagrange esiste un punto c(x) interno al segmento di estremi
x e x0 tale che
f (x) − f (x0 )
= f 0 (c(x)) .
x − x0
Poiché c(x) → x0 per x → x0 e c(x) 6= x0 per x 6= x0 (si osservi infatti che 0 < |c(x)−x0 | <
|x − x0 |), dal teorema di cambiamento di variabile per i limiti segue
lim f 0 (c(x)) = lim f 0 (x) ,
x→x0
x→x0
e la tesi è pertanto dimostrata.
Esempio. La funzione
½
x2 sen(1/x) se x 6= 0
0
se x = 0
è derivabile nel punto x = 0 (per provarlo basta applicare la definizione di derivata), ma
non esiste il limite per x → 0 di f 0 (x). Pertanto, f è derivabile ma non è di classe C 1 (si
osservi che è addirittura di classe C ∞ in R\{0}).
f (x) =
Esempio. La derivata della funzione
½
x3 sen(1/x)
f (x) =
0
se x 6= 0
se x = 0
ammette limite (uguale a zero) per x → 0. Pertanto, f è derivabile (anche) in x = 0, è di
classe C 1 e f 0 (0) = 0.
32 - Lun. 9/10/00
Il seguente risultato è un’utile generalizzazione del Teorema di Lagrange.
Teorema di Cauchy. Siano f, g: [a, b] → R due funzioni soddisfacenti le seguenti
condizioni:
1) f e g continue in [a, b];
2) f e g derivabili in (a, b);
3) g 0 (x) 6= 0 per ogni x ∈ (a, b).
29
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Allora esiste un punto c ∈ (a, b) tale che
f (b) − f (a)
f 0 (c)
=
.
0
g (c)
g(b) − g(a)
Esercizio. Provare il Teorema di Cauchy determinando (analogamente a quanto visto
per il teorema di Lagrange) la costante k in modo che la funzione
ϕ(x) := f (x) − kg(x)
verifichi (in [a, b]) le ipotesi del Teorema di Rolle.
Si osservi che dal Teorema di Cauchy, nel caso particolare in cui g(x) = x, si ottiene il
Teorema di Lagrange.
Ricordiamo che una funzione si dice infinitesima per x → α se tende a zero per x → α.
Analogamente, diremo che una funzione è infinita (per x → α) se tende all’infinito (per
x → α). I teoremi di de l’Hôpital (o l’Hospital, o l’Hôpital, o L’Hospital, o L’Hôpital, a
seconda dei testi) sono utili strumenti per il calcolo del limite del rapporto di due funzioni
entrambe infinitesime o infinite per x → α. In altre parole, rappresentano un artificio
(anche se non l’unico) per determinare il limite delle cosiddette forme indeterminate 0/0
e ∞/∞. Uno dei teoremi di de l’Hôpital riguarda il rapporto di due infinitesimi per
x → x0 , un altro il rapporto di due infiniti per x → x0 , un altro ancora il rapporto di due
infinitesimi per x → +∞, e cosı̀ via fino ad esaurire tutta la casistica. A titolo di esempio
enunciamo (e proviamo) quello riguardante il rapporto di due infinitesimi per x → x0 .
Dopo, per il gusto della sintesi, daremo un enunciato che li comprende tutti.
Teorema di de l’Hôpital per la forma 0/0 quando x → x0 .
Siano f e g due funzioni infinitesime per x → x0 e derivabili in un intorno forato di x0 .
Supponiamo che in tale intorno sia definito il rapporto f 0 (x)/g 0 (x) (ossia, supponiamo
g 0 (x) 6= 0). Allora, se esiste il limite (finito o infinito) per x → x0 di f 0 (x)/g 0 (x), risulta
lim
x→x0
f 0 (x)
f (x)
.
= lim 0
g(x) x→x0 g (x)
Dimostrazione. Poiché f e g tendono a zero per x → x0 , è possibile definirle in x0 (o
ridefinirle, nel caso siano già definite), rendendole continue anche in tal punto. Allo scopo,
infatti, è sufficiente (ed è necessario) porre f (x0 ) = g(x0 ) = 0. Si ha quindi
lim
x→x0
f (x) − f (x0 )
f (x)
= lim
.
g(x) x→x0 g(x) − g(x0 )
Fissato x 6= x0 (nell’intorno forato in cui è definito il rapporto f 0 (x)/g 0 (x) ), per il Teorema
di Cauchy esiste un punto c(x) interno al segmento x x0 di estremi x e x0 per il quale risulta
f 0 (c(x))
f (x) − f (x0 )
= 0
.
g(x) − g(x0 )
g (c(x))
30
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Poiché c(x) → x0 per x → x0 e c(x) 6= x0 per x 6= x0 (si osservi infatti che 0 < |c(x)−x0 | <
|x − x0 |), dal teorema di cambiamento di variabile per i limiti segue
lim
x→x0
f 0 (c(x))
f 0 (x)
=
lim
,
g 0 (c(x)) x→x0 g 0 (x)
e la tesi è pertanto dimostrata.
Teorema di de l’Hôpital (caso generale).
Siano f, g: A → R due funzioni (entrambe) infinitesime o (entrambe) infinite per x → α.
Supponiamo che il rapporto f 0 (x)/g 0 (x) sia definito in un intorno forato di α e che tale
rapporto tenda ad un limite (finito o infinito) per x → α. Allora si ha
f 0 (x)
f (x)
= lim 0
.
x→α g (x)
x→α g(x)
lim
Osservazione. La condizione espressa dal Teorema di de l’Hôpital è solo sufficiente.
Infatti, ad esempio
f (x)
2x + cos x
=
g(x)
3x + sen x
tende a 2/3 per x → +∞, mentre f 0 (x)/g 0 (x) non ammette limite per x → +∞.
Notiamo che ci sono casi in cui l’uso del Teorema di de l’Hôpital non porta a nulla. Ad
esempio basta considerare
√
x2 + 1
.
lim
x→+∞
x
Applicazioni del Teorema di de l’Hôpital al calcolo di alcuni limiti come, ad esempio,
xn
=0 e
x→+∞ ex
lim
lim
x→+∞
log x
= 0.
x
√
Dal secondo dei due suddetti limiti si deduce facilmente il limite della successione { n n}.
Infatti, per il teorema di cambiamento di variabile nei limiti, se esiste il limx→+∞ x1/x , in
particolare esiste anche limn→+∞ n1/n (ed è uguale). Si ha
lim x1/x = lim exp (
e, di conseguenza,
√
n
x→+∞
x→+∞
log x
) = exp 0 = 1
x
n → 1.
Esercizi assegnati [Spiegel, cap. 4]: 30, 31.
33 - Mar. 10/10/00
Definizione. Sia f : A → R una funzione reale il cui dominio contenga una semiretta
destra (ossia, un intorno di +∞). Una retta y = mx + q si dice asintoto destro (o asintoto
per x → +∞) per f , se
lim (f (x) − (mx + q)) = 0.
x→+∞
31
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Se il coefficiente angolare m è uguale a zero, l’asintoto si dice orizzontale, altrimenti si
dice obliquo. Un’analoga definizione vale per il concetto di asintoto sinistro (i dettagli
sono lasciati per esercizio allo studente).
Esempio. Consideriamo la funzione f (x) = 2x − 1 + sen x/x. Dalla definizione di asintoto
segue subito che la retta y = 2x − 1 è l’asintoto destro (e anche sinistro) per f . Infatti, la
funzione sen x/x, che coincide con la differenza f (x) − (2x − 1), tende a zero per x → ∞
(è il prodotto di una funzione limitata per una infinitesima).
Esempio. La funzione f (x) = x2 non ammette asintoto destro. Infatti, la differenza tra
x2 e un polinomio di primo grado è un polinomio di secondo grado, e non può quindi
tendere a zero per x → +∞.
Esercizio. Provare che l’asintoto destro (sinistro) di una funzione, se esiste, è unico.
Osservazione. Se f (x) → c ∈ R per x → +∞, allora la retta y = c è l’asintoto destro
per f .
Osservazione. Se f (x) = mx + q + g(x), dove g(x) → 0 per x → +∞, allora y = mx + q
è l’asintoto destro per f .
Definizione. Una retta x = x0 si dice asintoto verticale per una funzione f : A → R se
f (x) → ∞ per x → x0 .
Osserviamo che l’informazione “ x = x0 è un asintoto verticale per f ” non dice molto sul
comportamento di f (x) in un intorno di x0 . Per disegnare il grafico di f , infatti, occorre
+
conoscere i due limiti per x → x−
0 e per x → x0 di f (x). Pertanto se, ad esempio, in uno
studio di funzione, elencando i limiti importanti, si è già affermato che f (x) → +∞ per
+
x → x−
0 e f (x) → −∞ per x → x0 , è inutile aggiungere poi che x = x0 è un asintoto
verticale per f , non si danno certo ulteriori informazioni.
Teorema. Condizione necessaria e sufficiente affinché y = mx + q sia l’asintoto destro
[sinistro] per una funzione reale di variabile reale f è che
f (x)
=m
x→+∞ x
e
f (x)
lim
=m
x→−∞ x
e
lim
·
lim (f (x) − mx) = q.
x→+∞
¸
lim (f (x) − mx) = q .
x→−∞
Si può provare che se una funzione ammette asintoto destro ed esiste il limite per x → +∞
della sua derivata, allora questo coincide col coefficiente angolare dell’asintoto. Non è detto
comunque che se una funzione ammette asintoto per x → +∞, debba necessariamente
esistere il limite per x → +∞ della sua derivata. Ad esempio, l’asintoto destro di f (x) =
32
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
x + sen(x2 )/x è la retta y = x, ma non esiste il limite per x → +∞ di f 0 (x). Può anche
capitare che una funzione non abbia asintoto destro ma la derivata ammetta limite finito
per x → +∞. Un esempio di quest’ultimo caso è dato da log x.
Definizione. Una funzione reale definita in un intervallo si dice convessa [concava ] se il
segmento (la corda) che congiunge due punti qualunque del suo grafico sta sopra [sotto] il
grafico.
Teorema. Sia f : J → R derivabile in un intervallo J. Allora f è convessa [concava] se e
solo se la retta tangente ad un punto qualunque del suo grafico sta sotto [sopra] il grafico.
Teorema. Sia f : J → R derivabile due volte in un intervallo J. Allora f è convessa
[concava] se e solo se f 00 (x) ≥ 0 [f 00 (x) ≤ 0] per ogni x in J.
34 - Mar. 10/10/00
Definizione. Un punto x0 del dominio di una funzione f si dice di flesso (per f ) se in
un suo semi-intorno la funzione è convessa e nell’altro semi-intorno è concava (ossia se
esistono un intorno destro e un intorno sinistro di x0 con concavità discordi: da una parte
la funzione è convessa e dall’altra è concava).
In base al precedente teorema, se una funzione è di classe C 2 , una condizione che assicura
che in un punto x0 del dominio si abbia un flesso è che la derivata seconda cambi segno
in x0 (da una parte positiva e dall’altra negativa).
Esempi:
1) la funzione f (x) = x + x3 ha un flesso nel punto x = 0, perché in tale punto
(appartenente al dominio) f 00 (x) cambia segno;
2) la funzione f (x) = x + x4 non ha un flesso nel punto x = 0, perché la sua derivata
seconda è positiva in un intorno forato di x = 0, e quindi non esiste un semi-intorno
di x = 0 in cui la funzione è concava;
3) la funzione f (x) = 1/x non ha un flesso in x = 0 perché, pur cambiando segno in
x = 0 la sua derivata seconda, il punto non sta nel dominio della funzione.
Studio di alcune funzioni elementari come, ad esempio,
f (x) = xe−x
e
f (x) = x − x3 .
Esercizi assegnati [Spiegel, cap. 4]: 33, 34.
33
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
35 - Mer. 11/10/00
Studio completo della funzione
f (x) =
e della sua restrizione ad un intervallo.
x2 + 2x
|x| − 1
36 - Mer. 11/10/00
Una partizione di un intervallo limitato e chiuso [a, b] è un insieme finito p = {x0 , x1 , . . . xn }
di punti di [a, b] con la seguente proprietà:
x0 = a < x1 < x2 < . . . < xn−1 < xn = b .
Gli intervalli
J1 = [x0 , x1 ], J2 = [x1 , x2 ], . . . , Jn = [xn−1 , xn ]
si dicono intervalli (parziali) della partizione. Una scelta di punti nella partizione p è un
insieme finito s = {c1 , c2 , . . . cn } di punti di [a, b] tali che
c 1 ∈ J1 , c 2 ∈ J2 , . . . , c n ∈ Jn .
Una coppia α = (p, s) costituita da una partizione p di [a, b] e da una scelta s di punti in
p si dice una partizione puntata.
Sia ora assegnata una funzione f : [a, b] → R. Ad ogni partizione puntata α = (p, s) di
[a, b] possiamo associare il numero
Sf (α) =
n
X
f (ci )∆xi ,
i=1
dove ∆xi = xi − xi−1 denotano le ampiezze degli intervalli Ji della partizione p e ci i punti
della scelta s. Si ha cosı̀ una funzione reale (di variabile non reale) Sf : P → R definita
nell’insieme P delle partizioni puntate di [a, b].
Intuitivamente l’integrale (classico) in [a, b] della funzione f è, quando esiste, il valore
limite che si ottiene facendo tendere a zero le ampiezze ∆xi degli intervalli delle possibili
partizioni puntate. Diremo infatti che il numero I è l’integrale di f in [a, b] se, fissato un
“errore” ² > 0, esiste un δ > 0 tale che, comunque si assegni una partizione puntata α
con intervalli parziali di ampiezza minore di δ, la somma Sf (α) sopra definita dista da I
meno di ². In altre parole, denotando con |α| la massima ampiezza degli intervalli della
partizione puntata α (|α| si legge “parametro di finezza di α”), l’integrale I di f in [a, b]
è il limite per |α| → 0 della sommatoria Sf (α). Si scrive
lim Sf (α) = I
|α|→0
34
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
e, ripetiamo, significa che per ogni ² > 0 esiste δ > 0 tale che se |α| < δ allora |Sf (α)−I| <
². Diremo che la funzione f è integrabile (in [a, b]) secondo Cauchy quando tale limite
esiste finito (si invita lo studente a verificarne l’unicità). Detto limite si denota con uno
dei seguenti simboli:
Z b
Z b
f,
f (x) dx ,
a
a
il primo dei quali si legge “integrale tra a e b di f ” e il secondo “integrale tra a e b di f (x) in
dx ”. La f si chiama “funzione integranda” e la variabile x che appare nella seconda delle
due notazioni si dice “variabile di integrazione”. Detta variabile, non intervenendo nella
definizione di integrale, potrà anche essere omessa (come nella prima delle due notazioni)
o essere indicata con una qualunque altra lettera. Ad esempio, l’integrale tra a e b di f si
può scrivere anche
Z b
Z b
f (t) dt o
f (s) ds .
a
a
Talvolta però la variabile di integrazione, per evitare ambiguità, non potrà essere omessa.
È il caso, ad esempio, di un integrale del tipo
Z b
f (x, y)dx ,
a
dove f : R2 → R è una funzione di due variabili, che in questo caso viene pensata funzione
della sola variabile x fissando un qualunque valore della y (si dice funzione parziale). In
tale integrale il simbolo dx sta ad indicare che delle due funzioni parziali l’integranda è
quella di variabile x (pensando y come un parametro assegnato). Riguardo a tale integrale,
si osservi che
Z
b
f (x, y)dx ,
a
essendo un numero per ogni assegnato valore della y, rappresenta una funzione della sola
variabile y.
Esercizi assegnati [Spiegel, cap. 4]: 35, 36.
37 - Gio. 12/10/00
Definizione. Un sottoinsieme A di R si dice trascurabile, o di misura nulla secondo
Lebesgue (si legge “lebeg”), se fissato un arbitrario ² > 0 si può ricoprire A con una
famiglia (al più) numerabile di intervalli di lunghezza complessiva (intesa come serie delle
lunghezze) minore o uguale ad ².
Osserviamo che gli insiemi finiti, cosı̀ come gli insiemi numerabili, sono trascurabili. Per
vederlo, fissato ², è sufficiente coprire il primo punto con un intervallo di ampiezza ²/2,
il secondo con un intervallo di ampiezza ²/4, e cosı̀ via dividendo per due, ad ogni passo,
35
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
l’ampiezza del precedente intervallo. La lunghezza complessiva degli intervalli è data dalla
P
n
serie ∞
n=1 ²/2 , la cui somma è ², essendo una serie geometrica di ragione 1/2 e primo
termine ²/2.
Teorema (di integrabilità). Una funzione f : [a, b] → R è integrabile (secondo Cauchy) in
[a, b] se e solo se è limitata e l’insieme dei suoi punti di discontinuità è trascurabile.
Una prima conseguenza del teorema di integrabilità è che la somma, il prodotto e la
composizione di funzioni integrabili è ancora integrabile (il quoziente potrebbe essere una
funzione non limitata, e quindi non integrabile). Facciamo notare, inoltre, che se una
funzione è continua in un intervallo compatto [a, b], allora è anche integrabile, essendo
limitata per il Primo Teorema di Weierstrass, ed avendo un insieme vuoto (quindi trascurabile) di punti di discontinuità. Più in generale, se una funzione ha un numero finito (o
un’infinità numerabile) di punti di discontinuità, allora, purché sia limitata, è integrabile
(la limitatezza, questa volta, non è assicurata). Si potrebbe dimostrare che le funzioni monotone in un intervallo compatto [a, b] hanno al massimo un’infinità numerabile di punti di
discontinuità. Quindi anch’esse, essendo limitate (visto che ammettono massimo e minimo
agli estremi dell’intervallo [a, b]), sono integrabili secondo Cauchy.
Teorema (proprietà di linearità dell’integrale definito). Siano f, g: [a, b] → R due funzioni
integrabili e λ una costante. Allora si ha
Z b
Z b
Z b
(f (x) + g(x)) dx = f (x) dx + g(x) dx (additività),
a
a
a
Z b
Z b
λf (x) dx = λ f (x) dx (omogeneità).
a
a
Teorema (proprietà di monotonia dell’integrale definito). Siano f, g: [a, b] → R integrabili
e tali che f (x) ≤ g(x) per ogni x ∈ [a, b]. Allora
Z b
Z b
f (x) dx ≤ g(x) dx .
a
a
Esercizio. Provare che (analogamente alla ben nota disuguaglianza che afferma che “il
valore assoluto di una sommatoria è minore o uguale alla sommatoria dei valori assoluti”)
per l’integrale si ha
¯Z b
¯ Z b
¯
¯
¯ f (x)dx¯ ≤ |f (x)|dx .
¯
¯
a
a
Suggerimento. Partire dalla disuguaglianza −|f (x)| ≤ f (x) ≤ |f (x)| e applicare la
proprietà di monotonia degli integrali.
36
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Sia f : J → R una funzione reale definita in un intervallo. Supponiamo che f sia localmente
integrabile; ossia integrabile in ogni sottointervallo compatto di J. Dati due arbitrari punti
a, b ∈ J, è conveniente definire
e
Z
Z
b
f (x) dx = 0 se
b
a
a = b,
a
f (x) dx = −
Z
a
f (x) dx
se
a > b.
b
Teorema (di additività rispetto all’intervallo). Sia f : J → R localmente integrabile in un
intervallo J. Allora, dati tre arbitrari punti a, b, c ∈ J, si ha
Z
b
f (x) dx =
a
Z
c
f (x) dx +
a
Z
b
f (x) dx .
c
Primo teorema della media per gli integrali.
integrabile. Allora la media di f in [a, b], ossia
Sia f : [a, b] → R una funzione
Rb
af (x)dx
,
b−a
è un numero compreso tra l’estremo inferiore e l’estremo superiore di f . In particolare,
se f è continua, allora (per il Secondo Teorema di Weierstrass) esiste un punto c ∈ [a, b]
per il quale si ha
Z b
f (x)dx = f (c)(b − a) .
a
Secondo teorema della media per gli integrali. Siano f, g: [a, b] → R due funzioni
integrabili. Supponiamo che g(x) non cambi segno in [a, b]. Allora (quando ha senso) la
media ponderata di f in [a, b] (con peso g), ossia
Rb
af (x)g(x)dx
,
Rb
ag(x)dx
è un numero compreso tra l’estremo inferiore e l’estremo superiore di f . Inoltre, se f è
continua, esiste un punto c ∈ [a, b] per il quale si ha
Z
b
f (x)g(x)dx = f (c)
a
Z
b
g(x)dx ,
a
incluso il caso in cui l’integrale di g sia zero.
37
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
38 - Gio. 12/10/00
Definizione. Sia f : A → R una funzione reale di variabile reale. Si dice che una funzione
derivabile F : A → R è una primitiva di f se F 0 (x) = f (x) per ogni x ∈ A.
Una conseguenza del Teorema di Lagrange è che se due primitive di una stessa funzione
sono definite in un intervallo, allora, la loro differenza è costante (essendo zero la derivata
della differenza). Pertanto, data una funzione f definita in un intervallo e data una
sua primitiva F , ogni altra primitiva di f si ottiene da F aggiungendo un’opportuna
costante. Ossia, l’insieme delle primitive di f si esprime nella forma F (x) + c, con c
costante arbitraria. È bene notare che tale affermazione è falsa se viene rimossa l’ipotesi che
il dominio di f sia un intervallo. Si osservi, ad esempio, che le due funzioni F (x) = log |x|
e G(x) = log |x| + x/|x| hanno la stessa derivata (f (x) = 1/x) ma non differiscono per una
costante (il loro dominio, R\{0}, non è un intervallo).
Teorema (fondamentale del calcolo integrale). Sia f una funzione continua in un
intervallo J e sia c ∈ J. Allora la funzione F : J → R definita da
Z x
f (t)dt
F (x) =
c
è una primitiva di f. Ossia, F è derivabile, e per ogni x ∈ J si ha F 0 (x) = f (x).
La seguente importante conseguenza del teorema fondamentale del calcolo integrale fornisce un utilissimo metodo per il calcolo di alcuni integrali (per gli altri non rimane che
rivolgersi ai metodi numerici).
Formula fondamentale del calcolo integrale. Sia f : J → R continua in un intervallo
J. Se G: J → R è una primitiva di f , allora, fissati a, b ∈ J, si ha
Z b
f (x)dx = G(b) − G(a) .
a
Notazione. Data una funzione G: A → R e due punti a, b ∈ A, col simbolo [G(x)]ba si
denota la differenza G(b) − G(a). La formula fondamentale del calcolo integrale può essere
quindi scritta nel seguente modo:
Z b
f (x)dx = [G(x)]ba .
a
Esercizi sul calcolo di alcuni integrali definiti (mediante la formula fondamentale del calcolo
integrale).
Esercizi assegnati [Spiegel, cap. 5]: 1, 2, 6.
38
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
39 - Ven. 13/10/00
Sia f : J → R una funzione definita in un intervallo J ⊂ R. Col simbolo
Z
f (x) dx ,
detto integrale indefinito di f (x) in dx, si denota l’insieme delle primitive di f . Poiché il
dominio di f è un intervallo, se F è una primitiva di f , si ha
Z
f (x) dx = F (x) + c ,
dove c ∈ R è un’arbitraria costante. Se il dominio di una funzione f : A → R non è un
intervallo (come nel caso di f (x) = 1/x), col simbolo
Z
f (x) dx ,
si intenderà (tacitamente) l’insieme delle primitive della restrizione di f ad un qualunque
sottointervallo del dominio e, di conseguenza, se F è una di queste primitive, sarà ancora
valido scrivere
Z
f (x) dx = F (x) + c .
Ad esempio, scriveremo
Z
1
dx = log |x| + c ,
x
sottointendendo di avere scelto uno dei due intervalli (−∞, 0) o (0, +∞) che compongono
il dominio R\{0} della funzione f (x) = 1/x.
Calcolo di alcuni integrali indefiniti elementari:
Z
Z
xα+1
α
+ c (α 6= −1) ,
x−1 dx = log |x| + c ,
x dx =
α+1
Z
Z
Z
sen x dx = − cos x + c ,
cos x dx = sen x + c ,
ex dx = ex + c ,
Z
Z
senh x dx = cosh x + c ,
1
dx = arctang x + c ,
1 + x2
Z
Z
cosh x dx = senh x + c ,
√
1
dx = arcsen x + c .
1 − x2
40 - Ven. 13/10/00
Esercizi sullo studio del dominio di alcune funzioni integrali e calcolo della loro derivata:
39
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
ϕ(x) =
Z
−2x2
0
sen t
dt ,
1 − t2
ϕ(x) =
Z
x2
x
cos t
dt ,
t
ϕ(x) =
Z
x2
−x
cos t
dt .
t
Sia f : J → R una funzione derivabile in un intervallo J ⊂ R. Consideriamo due punti x0
e x0 + h del dominio J di f . L’incremento che subisce la funzione f passando dal punto
x0 al punto x0 + h è il numero ∆f = f (x0 + h) − f (x0 ). Per il Teorema di Lagrange
possiamo scrivere ∆f = f 0 (c)h, dove c è un opportuno punto del segmento di estremi x0
e x0 + h (ricordiamo che tale punto è addirittura interno al segmento se h 6= 0). Il difetto
dell’incremento ∆f (che dovremmo a rigore scrivere ∆f (x0 , h) o ∆f (x0 )(h) o ∆fx0 (h),
perché dipende sia dal punto iniziale x0 sia dall’incremento h della variabile indipendente
x) è che non è facile da valutare perché, tranne casi particolari, non è noto il punto c.
Tuttavia, se l’incremento ∆f (x0 )(h) ci interessa soltanto per valori piccoli di h (come, ad
esempio, per il calcolo degli errori), al posto dell’incremento vero è preferibile utilizzare un
incremento “virtuale” che, pur avendo il difetto di non essere vero (a meno che il grafico
di f non sia una retta), ha il duplice pregio di essere facile da calcolare e di approssimare
bene l’incremento vero. Tale incremento virtuale, detto differenziale di f (nel punto x0 e
relativo all’incremento h), è cosı̀ definito:
df (x0 )(h) = f 0 (x0 )h .
Riguardo alla facilità del calcolo di df (x0 )(h), osserviamo che, quando risulta noto il
punto iniziale x0 , df (x0 )(h) si ottiene con una semplice moltiplicazione. Riguardo al fatto
di approssimare bene l’incremento vero ∆f (x0 )(h) per piccoli valori di h, facciamo notare
che, per definizione di derivata, (se f 0 (x0 ) 6= 0) il rapporto
∆f (x0 )(h)
df (x0 )(h)
tende ad uno al tendere a zero di h. Ciò significa che l’errore relativo
∆f (x0 )(h) − df (x0 )(h)
df (x0 )(h)
tende a zero per h che tende a zero (ossia, è tanto più trascurabile quanto più piccolo è
l’incremento h della variabile indipendente).
Osserviamo ora che la variabile indipendente x, passando dal punto x0 al punto x0 + h,
subisce un incremento ∆x(x0 )(h) = h, e quindi il suo incremento vero coincide con quello
virtuale (infatti, essendo uguale ad 1 la derivata di x, si ha dx(x0 )(h) = 1 · h). Pertanto,
fissando il punto x0 , si ha l’uguaglianza
df (x0 )(h) = f 0 (x0 )dx(x0 )(h) ,
40
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
valida per ogni valore di h. Dato che la suddetta uguaglianza è vera per ogni h, possiamo
scrivere
df (x0 ) = f 0 (x0 )dx(x0 ),
intendendo che df (x0 ), come funzione di h (x0 fissato), coincide col prodotto del numero
f 0 (x0 ) per la funzione dx(x0 ) (ancora di h).
A questo punto possiamo fare un’ulteriore semplificazione nelle notazioni: il differenziale di
x in x0 (come funzione di h) non dipende dal punto x0 in cui viene considerato. Pertanto,
la notazione dx(x0 ) è ridondante e possiamo tranquillamente scrivere dx al posto di dx(x0 ),
senza che sia necessario specificare il punto in cui tale differenziale viene considerato. In
altre parole, l’incremento virtuale dx(x0 )(h) è uguale ad h qualunque sia il punto iniziale
x0 e qualunque sia l’incremento h della variabile, e questo incremento, ricordiamo, coincide
con quello vero ∆x(x0 )(h) = (x0 + h) − x0 . In definitiva, dato un generico x nel dominio
di f , da ora in avanti scriveremo
df (x) = f 0 (x)dx ,
intendendo che l’incremento virtuale (ossia il differenziale) della funzione f in un generico
punto x coincide col prodotto del numero f 0 (x) per l’incremento virtuale (o anche vero)
della variabile x. Intuitivamente ciò significa che quando l’incremento della variabile x,
invece di essere un numero finito, è un “numero infinitesimo”, anche l’incremento della funzione f è un infinitesimo e coincide col prodotto del numero (finito) f 0 (x) per l’infinitesimo
dx. Tale affermazione, poco chiara nell’ambito della teoria dei numeri reali, diventerebbe
rigorosa nella moderna teoria dei numeri iper-reali. Tra le due teorie, tuttavia, dal punto
di vista cronologico, c’è un secolo di distanza (la prima del XIX e la seconda del XX), e la
seconda, tuttora in ebollizione, deve essere ancora ben digerita dai matematici (figuriamoci
da chi la matematica la usa soltanto!).
Esercizi assegnati [Spiegel, cap. 5]: 8, 9.
41 - Lun. 16/10/00
Tenendo conto della parentela tra il differenziale di una funzione e la sua derivata, sono
di immediata verifica le seguenti proprietà:
1) d(f (x) + g(x)) = df (x) + dg(x);
2) d(f (x)g(x)) = g(x)df (x) + f (x)dg(x);
3) d(f (x)/g(x)) = (g(x)df (x) − f (x)dg(x))/g(x)2 ;
4) d(g(f (x))) = g 0 (f (x))dg(x).
Formula di integrazione per parti per l’integrale indefinito. Siano f e g due funzioni derivabili in un intervallo J. Allora gli integrali (indefiniti) delle funzioni f (x)g 0 (x)
41
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
e g(x)f 0 (x) sono legati dalla seguente relazione:
Z
Z
f (x)g 0 (x)dx = f (x)g(x) − g(x)f 0 (x)dx .
Dimostrazione. La relazione da dimostrare è un’uguaglianza tra due insiemi: il primo è
costituito dalle primitive di f g 0 e il secondo dalle funzioni esprimibili come differenza tra
f g ed una qualunque primitiva di gf 0 . Mostriamo prima che se H è una primitiva di gf 0 ,
allora f g − H è una primitiva di f g 0 . Si ha infatti (f g − H)0 (x) = f (x)g 0 (x) + f 0 (x)g(x) −
g(x)f 0 (x) = f (x)g 0 (x). In modo analogo si prova che se K è una primitiva di f g 0 , allora
questa è la differenza tra la funzione f g e una primitiva di gf 0 . Basta infatti scrivere
K = f g − (f g − K).
Osservazione. Con i differenziali la formula di integrazione per parti può essere scritta
nel modo seguente:
Z
Z
f (x)dg(x) = f (x)g(x) − g(x)df (x) .
I termini f (x) e g(x) si chiamano fattori finiti, mentre dg(x) e df (x) sono i cosiddetti
fattori differenziali.
Esercizi su alcuni integrali indefiniti, tra i quali
Z
Z
Z
x
x sen xdx ,
e cos xdx ,
x log xdx ,
Z
cos2 xdx .
42 - Lun. 16/10/00
Formula di integrazione per sostituzione per gli integrali indefiniti. Sia f una
funzione definita su un intervallo I e sia ϕ: J → I una funzione derivabile su un intervallo
J, a valori nel dominio I di f . Allora, se F è una primitiva di f , la funzione G(t) =
F (ϕ(t)) è una primitiva di f (ϕ(t))ϕ0 (t). Vale quindi la relazione
Z
Z
f (x)dx = f (ϕ(t))ϕ0 (t)dt (modulo x = ϕ(t)),
il cui significato è il seguente: ogni funzione del secondo insieme si ottiene da una del
primo con la sostituzione x = ϕ(t).
Nella formula di integrazione per sostituzione il termine ϕ0 (t)dt rappresenta il differenziale
di ϕ(t). Si potrà quindi scrivere
Z
Z
f (x)dx = f (ϕ(t))dϕ(t) (modulo x = ϕ(t)),
42
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
mettendo cosı̀ in risalto come si possa ricondurre il calcolo di un integrale del secondo tipo
ad uno del primo: in pratica, per calcolare il secondo integrale, basta trovare una primitiva
F (x) di f (x) e sostituire poi ϕ(t) al posto della variabile x, e per far ciò l’invertibilità di
ϕ non è necessaria. Più problematico è invece il calcolo di un integrale del primo tipo
riconducendolo ad uno del secondo. Il motivo è che, dopo aver effettuato la sostituzione
x = ϕ(t) ed aver calcolato una primitiva G(t) di f (ϕ(t))ϕ0 (t), per trovarne una di f (x)
occorre ricavare t in funzione di x dalla relazione x = ϕ(t) (che costituisce l’equazione del
grafico di ϕ). Ciò è possibile (almeno teoricamente) se si suppone ϕ: J → I strettamente
monotona e suriettiva.
Esercizi assegnati [Spiegel, cap. 5]: 15, 17.
43 - Mar. 17/10/00
Esercizi sull’integrale indefinito.
Decomposizione di una funzione razionale in frazioni semplici.
44 - Mar. 17/10/00
Esercizi sugli integrali di funzioni razionali.
Cenno sui metodi numerici per il calcolo degli integrali definiti (rettangoli, trapezi e
Simpson).
Esercizi assegnati [Spiegel, cap. 5]: 18, 19.
45 - Mer. 18/10/00
Formula di integrazione per parti per gli integrali definiti. Siano f e g due
funzioni C 1 in un intervallo J. Allora, fissati a, b ∈ J, vale la seguente formula:
Z b
Z b
b
f (t)dg(t) = [f (t)g(t)]a −
g(t)df (t).
a
Dimostrazione. Posto
ϕ(x) =
Z
a
x
a
f (t)g 0 (t)dt − [f (t)g(t)]xa +
Z
x
g(t)f 0 (t)dt,
a
basta provare che ϕ(b) = 0. Questo segue immediatamente dal fatto che ϕ(a) = 0 e
ϕ0 (x) = 0 per ogni x ∈ [a, b].
Osservazione (utile per comprendere le ipotesi della formula di integrazione per sostituzione). Supponiamo che la composizione f (ϕ(t)) di due funzioni sia ben definita per ogni
43
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
t appartenente ad un segmento di estremi α, β ∈ R. Allora, se ϕ è continua, la funzione
f (x) è necessariamente ben definita per ogni x appartenente al segmento di estremi ϕ(α)
e ϕ(β). Tale segmento, infatti, per il Secondo Teorema di Weierstrass, è contenuto nell’immagine ϕ(αβ) di αβ, e tale immagine, a sua volta, se si vuole che sia ben definita in
αβ la funzione f (ϕ(t)), deve essere contenuta nel dominio di f (x).
Formula di integrazione per sostituzione (o di cambiamento di variabile) per
gli integrali definiti. Sia f una funzione continua e sia ϕ un’applicazione di classe C 1 .
Allora, fissati due punti α e β nel dominio di ϕ, purché f (ϕ(t)) sia definita per t ∈ αβ, si
ha
Z
Z
ϕ(β)
β
f (x)dx =
ϕ(α)
f (ϕ(t))ϕ0 (t)dt .
α
Dimostrazione. Consideriamo la funzione g: αβ → R definita da
Z ϕ(s)
Z s
g(s) =
f (x)dx −
f (ϕ(t))ϕ0 (t)dt .
ϕ(α)
α
Occorre provare che g(β) = 0. Dalla definizione di g(s) si ricava immediatamente g(α) = 0.
Derivando si ha
g 0 (s) = f (ϕ(s))ϕ0 (s) − f (ϕ(s))ϕ0 (s) = 0 ,
∀s ∈ αβ.
Quindi g è costante e, conseguentemente, g(β) = g(α) = 0.
Si ricorda che una funzione f : A → R si dice periodica di periodo T > 0 (o T -periodica) se
per ogni x ∈ A si ha x + T ∈ A e f (x) = f (x + T ).
Esercizio. Provare che se f : R → R è T -periodica, allora l’integrale
Z a+T
f (x) dx
a
non dipende da a.
Esercizio. Calcolare
Più in generale, dato n ∈ N, calcolare
Z
100
[x]dx .
0
Z
n
[x]dx .
0
46 - Mer. 18/10/00
Ricordiamo che, per semplicità di linguaggio, diremo che una funzione è localmente integrabile se è integrabile in ogni sottointervallo compatto del suo dominio. Ovviamente, le
funzioni continue sono localmente integrabili.
44
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Abbiamo visto che se una funzione è integrabile (secondo Cauchy) in un intervallo compatto [a, b], allora deve essere necessariamente limitata in tale intervallo. Supponiamo ora
che una funzione f sia definita in un intervallo non compatto (a, b] e che in tale intervallo
risulti localmente integrabile (ad esempio, f potrebbe essere continua in (a, b], ma non
definita in a). Il fatto che f possa non essere definita in a non costituisce un problema:
è sempre possibile estenderla assegnandole un arbitrario valore f (a) (ad esempio, si può
porre f (a) = 0). Comunque, che si estenda o no, i casi sono due: o f è limitata o non
lo è. Nel primo caso non ci sono problemi: si potrebbe dimostrare, infatti, che ogni sua
estensione è integrabile secondo Cauchy e l’integrale non dipende dal valore f (a) scelto.
Se invece f è non limitata, nessuna sua estensione ad [a, b] potrà eliminare tale difetto
(per fissare le idee si pensi ad una f continua in (a, b] che tende all’infinito per t → a+ ).
In questo secondo caso si usa dire che f ha una singolarità in a e l’integrale
Z
b
f (x)dx
a
non è definito secondo Cauchy. Per questa ragione viene detto improprio, e il suo valore
(quando esiste nei reali estesi) è cosı̀ definito:
Z
b
f (x)dx = lim
c→a+
a
Z
b
f (x)dx .
c
Se tale limite è finito, diremo che l’integrale (di f in [a, b]) è convergente, se vale +∞ o
−∞ diremo che è divergente (a +∞ o a −∞, rispettivamente). Se il limite non esiste,
l’integrale improprio si dirà indeterminato.
Analogamente, se una funzione f è localmente integrabile in [a, b), ma non limitata,
definiamo
Z b
Z c
f (x)dx = lim
f (x)dx .
c→b−
a
a
Come per il caso della singolarità in a, tale integrale potrà essere convergente, divergente
o indeterminato.
Esempio. L’integrale improprio
Z
1
0
1
dx ,
xα
α > 0,
converge se 0 < α ≤ 1 e diverge se α > 1.
Consideriamo ora una funzione f localmente integrabile in un intervallo [a, b] privato
di un punto interno x0 . Si pensi, ad esempio, ad una funzione continua in [a, b]\{x0 }
ma non definita in x0 . Se f è limitata, non ci sono problemi: basta definirla in un
modo qualunque nel punto x0 , e la nuova funzione risulterà integrabile secondo Cauchy
45
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
(e l’integrale indipendente dal valore assegnato in x0 ). Se invece f non è limitata (ossia,
se x0 è una singolarità per f ), allora l’integrale tra a e b di f è improprio e si definisce
riconducendosi ai casi precedentemente visti:
Z b
Z x0
Z b
f (x)dx =
f (x)dx + f (x)dx ,
a
a
x0
purché non si abbia la forma indeterminata ∞ − ∞.
Ovviamente si possono presentare casi di funzioni con più di una singolarità in [a, b]. Se
queste sono in numero finito, è sufficiente spezzare l’integrale nella somma di integrali con
singolarità in uno solo dei due estremi di integrazione, riconducendosi cosı̀ ai due casi già
trattati.
Esercizi assegnati [Spiegel, cap. 5]: 20, 21.
47 - Gio. 19/10/00
Sia f : [a, +∞) → R una funzione localmente integrabile. Poiché l’intervallo [a, +∞) non è
limitato, l’integrale
Z +∞
f (x)dx
a
non ha senso secondo Cauchy (si osservi infatti che ogni partizione dell’intervallo di integrazione non può avere parametro di finezza finito). Tale integrale si dice improprio e il
suo valore (quando esiste, finito o infinito) si definisce nel modo seguente:
Z +∞
Z c
f (x)dx = lim
f (x)dx .
a
c→+∞ a
In altre parole, l’integrale tra a e +∞ di f non è altro che il limite per c → +∞ della
funzione integrale
Z c
F (c) := f (x)dx .
a
Se tale limite è finito, diremo che l’integrale è convergente, se vale +∞ o −∞ diremo che è
divergente (a +∞ o a −∞, rispettivamente). Se il limite non esiste, l’integrale improprio
si dirà indeterminato.
Osservazione. Sia f : [a, +∞) → R una funzione localmente integrabile. Supponiamo
f (x) ≥ 0 per ogni x ≥ a. Allora la funzione integrale
Z c
F (c) := f (x)dx
a
è crescente. Pertanto, per il teorema del limite per le funzioni monotone, l’integrale di f
in [a, +∞) converge o diverge a +∞. In ogni caso, nei reali estesi è ben definito.
46
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Criterio del confronto (per gli integrali impropri su una semiretta destra). Siano
f, g: [a, +∞) → R due funzioni localmente integrabili e tali che
0 ≤ f (x) ≤ g(x) ,
∀x ≥ a .
Allora, nei reali estesi, si ha
Z
+∞
f (x)dx ≤
a
Z
+∞
g(x)dx .
a
In particolare, se converge l’integrale di g, converge anche l’integrale di f , e se diverge
l’integrale di f , diverge anche l’integrale di g.
Dimostrazione. Poiché f e g sono non negative, le due funzioni integrali
Z c
Z c
F (c) = f (x)dx e G(c) = g(x)dx
a
a
sono crescenti e, conseguentemente, per entrambe esiste (finito o infinito) il limite per
c → +∞. Dall’ipotesi “ f (x) ≤ g(x) per x ≥ a ” si ottiene F (c) ≤ G(c) per ogni c ≥ a, e
la tesi segue immediatamente dal teorema del confronto dei limiti.
Criterio del confronto asintotico (per gli integrali impropri su una semiretta destra).
Siano f, g: [a, +∞) → R due funzioni localmente integrabili e positive. Se
f (x)
= λ < +∞
x→+∞ g(x)
lim
e se converge (in [a, +∞)) l’integrale di g, converge anche l’integrale di f . Di conseguenza,
se il limite λ (oltre ad essere finito) è diverso da zero, allora i due integrali hanno lo stesso
carattere.
Dimostrazione. Per il teorema della permanenza del segno esiste un x̄ ≥ a tale che
f (x)/g(x) < λ + 1 per x ≥ x̄; da cui segue, essendo g(x) > 0, che f (x) < (λ + 1)g(x) per
x ≥ x̄. Quindi, per il criterio del confronto, si ha
Z +∞
Z +∞
f (x)dx ≤ (λ + 1)
g(x)dx
x̄
x̄
e, di conseguenza, se converge l’integrale di g, converge anche l’integrale di f . Supponiamo
ora che il limite λ (oltre che essere finito) sia positivo. Allora g(x)/f (x) → 1/λ < +∞; pertanto, per quanto appena provato, se converge l’integrale di f , converge anche l’integrale
di g, e gli integrali hanno dunque lo stesso carattere.
Facciamo notare che il criterio del confronto asintotico può anche essere usato come criterio
di divergenza (sempre nell’ipotesi che le funzioni in esame siano positive). Supponiamo
47
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
infatti che f (x)/g(x) → λ < +∞ e che l’integrale di f sia divergente. Allora l’integrale
di g non può convergere, perché altrimenti convergerebbe anche l’integrale di f . Quindi,
visto che l’integrale di una funzione positiva non può essere indeterminato, l’integrale di
g deve necessariamente divergere.
Criterio della convergenza assoluta (per gli integrali impropri su una semiretta destra). Sia f : [a, +∞) → R una funzione localmente integrabile. Se converge (in [a, +∞))
l’integrale del valore assoluto di f , allora converge anche l’integrale di f .
Dimostrazione. Definiamo le funzioni f+ , f− : [a, +∞) → R nel seguente modo:
f+ (x) =
f− (x) =
|f (x)| + f (x)
= max{f (x), 0} ,
2
|f (x)| − f (x)
= max{−f (x), 0} ,
2
e osserviamo che
f (x) = f+ (x) − f− (x),
|f (x)| = f+ (x) + f− (x),
0 ≤ f+ (x) ≤ |f (x)|,
0 ≤ f− (x) ≤ |f (x)|.
Poiché l’integrale di |f (x)| è convergente, per il criterio del confronto convergono anche gli
integrali di f+ (x) e di f− (x). Pertanto, dal teorema del limite della somma, si ottiene
Z +∞
Z +∞
Z +∞
f− (x)dx ,
f+ (x)dx −
f (x)dx =
a
a
a
e questo prova che
Z
esiste ed è finito.
+∞
f (x)dx
a
Analogamente a come si è definito l’integrale improprio su una semiretta destra, data una
funzione localmente integrabile f : (−∞, b] → R, il suo integrale improprio, che denoteremo
col simbolo
Z
b
f (x)dx,
è il limite per c → −∞ della funzione
−∞
F (c) =
Z
b
f (x)dx.
c
È evidente che per gli integrali impropri su una semiretta sinistra valgono ancora, con
ovvie modifiche, i criteri del confronto, del confronto asintotico e dell’assoluta convergenza
(si invita lo studente a formularne gli enunciati).
48
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Consideriamo ora una funzione f localmente integrabile su tutta la retta reale. Col simbolo
Z +∞
f (x)dx,
−∞
detto integrale improprio (o generalizzato) di f in R, si denota, quando ha senso in R, la
somma
Z +∞
Z x0
f (x)dx +
f (x)dx ,
−∞
x0
dove x0 è un qualunque punto di R. Lasciamo allo studente il compito di verificare che la
definizione è ben posta (ossia, non dipende da x0 ∈ R). Diremo che l’integrale di f in R è
convergente se sono convergenti entrambi i suddetti integrali; che è divergente se uno dei
due integrali diverge e l’altro converge; che è indeterminato se la somma dei due integrali
si presenta nella forma ∞ − ∞ o se è indeterminato uno dei due integrali.
I criteri del confronto, del confronto asintotico, e della convergenza assoluta, con le opportune modifiche, valgono anche per gli integrali impropri di una funzione non limitata in
un intervallo limitato. Lasciamo allo studente il compito di formularne gli enunciati.
Esercizio. Determinare, in funzione di α > 0, il carattere dei seguenti integrali impropri:
Z
b
a
dx
,
(x − a)α
Z
b
a
dx
.
(b − x)α
Sia f una funzione localmente integrabile in un intervallo J, limitato o non limitato. Denotiamo con α e β l’estremo inferiore e l’estremo superiore di J, rispettivamente. Ovviamente
α può essere −∞, cosı̀ come β può essere +∞. In ogni caso, proprio o improprio che sia,
l’integrale di f in J verrà indicato con
Z
o più semplicemente con
Z
Diremo che f è sommabile (in J) se
Z
β
f (x)dx
α
f (x)dx < +∞ .
J
J
|f (x)|dx < +∞ .
In particolare, tutte le funzioni integrabili (nel senso di Cauchy) in un intervallo compatto
[a, b] sono sommabili.
Esempio. La funzione f (x) = 1/xα è sommabile in [a, +∞), a > 0, se e solo se α > 1.
49
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Esempio. La funzione f (x) = 1/xα è sommabile in (0, b], b > 0, se e solo se α < 1.
48 - Gio. 19/10/00
Sia f : J → R una funzione di classe C n in un intervallo. Consideriamo due arbitrari punti
a, b ∈ J. Dalla formula fondamentale del calcolo integrale si ottiene
Z b
f (b) = f (a) + f 0 (t)dt,
a
che possiamo scrivere nella forma
f (b) = f (a) +
Z
b
a
f 0 (t)d(t − b).
Integrando per parti si ha
0
f (b) = f (a) + [f (t)(t −
b)]ba
−
Quindi
f (b) = f (a) + f 0 (a)(b − a) +
Con un’ulteriore integrazione per parti si ottiene
Z
Z
b
a
f 00 (t)(t − b)dt .
b
a
(b − t)f 00 (t)dt .
f 00 (a)
(b − a)2 +
2
f (b) = f (a) + f 0 (a)(b − a) +
Z
b
a
(b − t)2 (3)
f (t)dt.
2
Continuando ad integrare per parti si ha infine
f (b) = f (a) +
f 00 (a)
f (n−1) (a)
f 0 (a)
(b − a) +
(b − a)2 + . . . +
(b − a)n−1 + Rn−1 ,
1!
2!
(n − 1)!
dove
Rn−1 =
Z
b
a
(b − t)n−1 (n)
f (t)dt.
(n − 1)!
La suddetta uguaglianza si chiama formula di Taylor di ordine n − 1 col resto Rn−1
espresso in forma integrale. Lo scopo della formula è quello di esprimere il valore di f in
un punto b tramite informazioni riguardanti il comportamento della funzione in un punto
iniziale a. In generale non sarà possibile valutare con esattezza il valore in b conoscendo
soltanto ciò che accade in a. Tuttavia, nella suddetta formula, tutto ciò che non riguarda
il comportamento di f in a è confinato in un solo termine: il resto Rn−1 della formula. Se
nel valutare f (b) si trascura il resto, si commette un errore, ma tale errore, talvolta, può
essere maggiorato facilmente se si sa maggiorare la derivata n-esima di f . Una situazione
limite particolarmente interessante si ottiene quando la derivata n-esima di f è zero: in
50
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
questo caso si può affermare che il valore di f in un arbitrario punto b dipende soltanto
da ciò che accade in un assegnato punto a.
Spesso, nella formula di Taylor, uno dei due punti, che denotiamo x0 , si suppone fissato e
l’altro, che denotiamo x, si pensa variabile. La formula prende allora la seguente forma:
f (x) = f (x0 ) +
f 00 (x0 )
f 0 (x0 )
(x − x0 ) +
(x − x0 )2 + . . .
1!
2!
f (n−1) (x0 )
(x − x0 )n−1 + Rn−1 (x) ,
... +
(n − 1)!
dove il resto
Rn−1 (x) =
Z
x
(x − t)n−1 (n)
f (t)dt
x0 (n − 1)!
è una funzione di x, tanto più piccola quanto più vicino è x al punto x0 , detto centro della
formula.
Vediamo ora un altro modo per esprimere il resto della formula di Taylor. Poiché il termine
g(t) =
(x − t)n−1
(n − 1)!
non cambia di segno quando la variabile di integrazione t varia tra x0 e x, si può applicare
il secondo teorema della media per gli integrali. Si ottiene quindi
Z x
f (n) (c(x))
(x − t)n−1
(n)
(x − x0 )n ,
dt =
Rn−1 (x) = f (c(x))
n!
x0 (n − 1)!
dove c(x) è un opportuno punto (dipendente da x e) appartenente al segmento x0 x di
estremi x0 e x (si osservi che la funzione c(x) tende ad x0 per x → x0 ). Il termine
Rn−1 (x) =
f (n) (c(x))
(x − x0 )n
n!
si chiama resto n-esimo della formula di Taylor di centro x0 nella forma di Lagrange e,
a parte il fatto che la derivata n-esima di f è calcolata in un punto c(x), invece che nel
centro x0 , ha una stretta parentela con i termini che lo precedono. Riguardo al motivo
per cui detto resto si dice “di Lagrange”, si osservi che la suddetta formula si riduce al
Teorema di Lagrange quando n = 1 (ad eccezione del fatto che nel Teorema di Lagrange
non è richiesta la derivabilità agli estremi x e x0 del segmento).
Se il centro x0 della formula di Taylor è 0, allora la formula si dice anche di MacLaurin.
Esercizio. Sia f : R → R di classe C n e tale che f n (x) = 0 per ogni x ∈ R. Provare che
f è un polinomio di grado minore o uguale ad n − 1 (in particolare, se n = 1, allora f è
costante).
51
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Suggerimento. Scrivere la formula di MacLaurin di ordine n − 1 di f col resto di Lagrange.
Applicazioni della formula di Taylor col resto di Lagrange al calcolo approssimato del
numero e (si sviluppa ex per x = 1).
Applicazioni della formula di Taylor col resto di Lagrange al calcolo approssimato di sen x,
per valori piccoli di x.
49 - Ven. 20/10/00
Col cambiamento di variabile x = x0 + h, la formula di Taylor di ordine n − 1 e centro x0
di f diventa
f (x0 + h) = f (x0 ) +
f 00 (x0 ) 2
f (n−1) (x0 ) n−1
f 0 (x0 )
h+
h + ... +
h
+ Rn−1 (h) .
1!
2!
(n − 1)!
Il resto Rn−1 (h), che rappresenta la differenza tra f (x0 + h) e il polinomio di Taylor
Pn−1 (h) = f (x0 ) +
f 00 (x0 ) 2
f (n−1) (x0 ) n−1
f 0 (x0 )
h+
h + ... +
h
,
1!
2!
(n − 1)!
può essere scritto nella forma di Lagrange:
Rn−1 (h) =
f (n) (c(h)) n
h ,
n!
dove c(h) è un punto, dipendente da h, appartenente al segmento di estremi x0 e x0 + h.
Osservazione. Col cambiamento di variabile x = x0 + h, la formula di Taylor di centro
x0 di f coincide con la formula di MacLaurin della funzione g(h) := f (x0 + h).
Talvolta, per il calcolo dei limiti, è conveniente scrivere il resto della formula di Taylor in un modo diverso dalle due forme (integrale e di Lagrange) precedentemente viste.
Consideriamo infatti il resto
Rn−1 (h) =
f (n) (c(h)) n
h
n!
della formula di Taylor ottenuto con la sostituzione x = x0 + h. Come abbiamo visto, il
punto c(h) appartiene al segmento di estremi x0 e x0 + h. Di conseguenza, c(h) tende ad
x0 per h → 0 e c(0) = x0 . Ovvero, la funzione c(h) è continua nel punto h = 0. Poiché f
è di classe C n , la funzione composta f (n) (c(h))/n! risulta continua per h = 0. Possiamo
dunque scrivere
f (n) (x0 )
f (n) (c(h))
=
+ ²(h) ,
n!
n!
52
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
dove ²(h) := (f (n) (c(h)) − f (n) (x0 ))/n! è una funzione continua e nulla nel punto h = 0.
La precedente formula di Taylor può quindi essere scritta nella forma
f (x0 + h) = f (x0 ) +
f 00 (x0 ) 2
f (n) (x0 ) n
f 0 (x0 )
h+
h + ... +
h + ²(h)hn ,
1!
2!
n!
detta formula di Taylor di centro x0 e ordine n di f col resto nella forma di Peano. Tale
formula costituisce un’uguaglianza valida per ogni h ammissibile (ossia per ogni h per cui
x0 + h appartiene al dominio di f ) ed esprime f (x0 + h) come somma di un polinomio
Pn (h) di grado minore o uguale ad n, detto polinomio di Taylor di f di centro x0 e ordine
n, e di un resto Rn (h) = ²(h)hn , costituito dal prodotto di una funzione ²(h), continua e
nulla per h = 0, con la potenza hn .
Convenzione. Da ora in avanti, anche se non esplicitamente dichiarato, col simbolo ²(h)
denoteremo una qualunque funzione continua e nulla nel punto h = 0. Ovviamente, la
variabile potrà essere indicata con una qualunque lettera (non solo con h).
Riguardo al calcolo con funzioni del tipo ²(h) facciamo le seguenti osservazioni:
– la somma di due funzioni ²(h) è una funzione ²(h);
– il prodotto di una funzione continua (nel punto h = 0) per una funzione ²(h) è una
funzione ²(h);
– se f è continua in un punto x = x0 , allora f (x0 + h) = f (x0 ) + ²(h);
– se g(h) è una funzione continua e nulla in zero, allora la composizione ²(g(h)) è una
funzione ²(h);
– se g(h) è una funzione continua e nulla in zero, allora la composizione g(²(h)) è una
funzione ²(h).
50 - Ven. 20/10/00
Formule di MacLaurin di sen x, cos x, ex , (1 + x)α .
A titolo di esempio, consideriamo la funzione f (x) = x2 sen 2x e determiniamone la formula
di MacLaurin del quinto ordine. Si dovrà scrivere un’uguaglianza del tipo f (x) = P5 (x) +
²(x)x5 , dove P5 (x) è un polinomio di grado minore o uguale a cinque (più avanti proveremo
che tale polinomio è unico). Grazie alla presenza del termine x2 , è sufficiente determinare
la formula di MacLaurin del terzo ordine di sen 2x, e moltiplicarla poi per x2 . Si osservi
infatti che il prodotto di x2 per P3 (x) + ²(x)x3 , dove P3 (x) è un polinomio di grado non
superiore a tre, diventa P5 (x) + ²(x)x5 , dove P5 (x) è di grado non superiore a cinque.
Ricordiamo che per sen x si ha
sen x = x −
x3
+ ²(x)x3 .
6
53
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Poiché tale uguaglianza è valida per ogni numero x, sostituendo 2x al posto di x si ottiene
sen 2x = 2x −
4 3
x + 8²(2x)x3 ,
3
che è ancora un’uguaglianza. Tenendo conto che 8²(2x) è una funzione del tipo ²(x), si ha
sen 2x = 2x −
e quindi
f (x) = x2 (2x −
4 3
x + ²(x)x3
3
4 3
4
x + ²(x)x3 ) = 2x3 − x5 + ²(x)x5 .
3
3
Determiniamo ora una formula di Taylor con centro diverso da zero.
calcoliamo la formula del quarto ordine e centro x0 = −1 di
Ad esempio,
f (x) = 2x + (x + 1)2 cos πx .
Poiché il centro x0 non è zero, conviene effettuare la sostituzione
x = x0 + h = −1 + h .
In questo modo è come se si calcolasse la formula di MacLaurin di g(h) := f (−1 + h). Si
ha
f (−1 + h) = 2(−1 + h) + h2 cos(πh − π) =
−2 + 2h + h2 [cos(πh) cos(−π) − sen(πh) sen(−π)] =
−2 + 2h − h2 cos(πh) = −2 + 2h − h2 (1 −
−2 + 2h − h2 +
π2 2
h + ²(h)h2 ) =
2
π2 4
h + ²(h)h4 .
2
Esercizi sulla formula di Taylor.
Esercizi sul calcolo dei limiti con l’aiuto della formula di Taylor.
51 - Lun. 23/10/00
Teorema (della derivata n-esima). Sia f : J → R di classe C n in un intervallo J e sia x0
un punto interno a J. Supponiamo che
f 0 (x0 ) = f 00 (x0 ) = . . . = f (n−1) (x0 ) = 0
e f (n) (x0 ) 6= 0 (ossia, supponiamo che la prima derivata che non si annulla in x0 sia
di ordine n). Se n è pari, allora x0 è un punto estremante per f e, in particolare, è di
54
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
minimo quando f (n) (x0 ) > 0 ed è di massimo quando f (n) (x0 ) < 0. Se invece n è dispari,
allora x0 non è un punto estremante.
Dimostrazione. Dalla formula di Taylor di centro x0 e ordine n si ottiene
f (x0 + h) − f (x0 ) =
f (n) (x0 ) n
h + ²(h)hn
n!
(∀ h tale che x0 + h ∈ J).
Dunque,
∆f (x0 )(h) = ϕ(h)hn ,
dove ∆f (x0 )(h) = f (x0 + h) − f (x0 ) è l’incremento subito dalla funzione f nel passare dal
punto x0 al punto x0 + h e ϕ(h) := f (n) (x0 )/n! + ²(h).
Supponiamo, per fissare le idee, che f (n) (x0 ) sia positiva. Allora, ϕ(0) > 0, e quindi,
essendo ϕ(h) continua nel punto h = 0, per il teorema della permanenza del segno esiste
un δ > 0 per cui risulta ϕ(h) > 0 per ogni h tale che |h| < δ. Dunque, se n è pari si ha
∆f (x0 )(h) > 0 per 0 < |h| < δ e, conseguentemente, x0 è un punto di minimo relativo
per f . Se invece n è dispari, si ha ∆f (x0 )(h) < 0 per −δ < h < 0 e ∆f (x0 )(h) > 0 per
0 < h < δ, e pertanto x0 non è un punto estremante. Il caso f (n) (x0 ) < 0 si tratta in
modo analogo.
Teorema (di unicità della formula di Taylor). Sia f : J → R di classe C n in un intervallo
J e sia x0 ∈ J. Supponiamo che
f (x0 + h) = a0 + a1 h + a2 h2 + . . . + an hn + ²(h)hn
per ogni h ammissibile (ossia, tale che x0 + h ∈ J). Allora
a0 = f (x0 ), a1 =
f 00 (x0 )
f (n) (x0 )
f 0 (x0 )
, a2 =
, . . . , an =
.
1!
2!
n!
Dimostrazione. Abbiamo già provato che
f 00 (x0 ) 2
f (n) (x0 ) n
f 0 (x0 )
h+
h + ... +
h + ²(h)hn ,
1!
2!
n!
per ogni h ammissibile. Quindi, sottraendo le due uguaglianze, si ha
f (x0 + h) = f (x0 ) +
f 00 (x0 ) 2
f (n) (x0 ) n
f 0 (x0 )
)h + (a2 −
)h + . . . + (an −
)h + ²(h)hn ,
1!
2!
n!
per ogni h ammissibile. Dobbiamo dunque dimostrare che se
0 = (a0 − f (x0 )) + (a1 −
0 = c0 + c1 h + c2 h2 + . . . + cn hn + ²(h)hn ,
∀ h tale che x0 + h ∈ J,
allora c0 = 0, c1 = 0, . . . , cn = 0. Poiché la suddetta uguaglianza è vera anche per h = 0
(ricordarsi che x0 ∈ J, e quindi h = 0 è ammissibile), si ottiene c0 = 0. Conseguentemente,
cancellando c0 , si ha
0 = c1 h + c2 h2 + . . . + cn hn + ²(h)hn ,
∀ h tale che x0 + h ∈ J,
55
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
e pertanto, raccogliendo h, si ottiene
0 = h (c1 + c2 h + . . . + cn hn−1 + ²(h)hn−1 ),
∀ h tale che x0 + h ∈ J.
La funzione
c1 + c2 h + . . . + cn hn−1 + ²(h)hn−1
è dunque nulla per tutti gli h 6= 0 tali che x0 +h ∈ J e, di conseguenza, poiché è continua nel
punto per h = 0 (essendo somma e prodotto di funzioni continue), possiamo concludere che
è nulla anche per h = 0 (si osservi che tende a zero per h → 0). Vale allora l’uguaglianza
0 = c1 + c2 h + . . . + cn hn−1 + ²(h)hn−1 ,
∀ h tale che x0 + h ∈ J.
Pertanto, ponendo h = 0, si deduce che anche il coefficiente c1 deve essere nullo. Il risultato
si ottiene procedendo allo stesso modo per passi successivi.
Esercizi sulla formula di Taylor e applicazioni alla ricerca dei punti estremanti.
52 - Lun. 23/10/00
Formule di MacLaurin di senh x, cosh x, log(1 + x).
Esercizi sulla formula di Taylor.
53 - Mar. 24/10/00
Consideriamo il limite per x → α di una funzione del tipo f (x)g(x) , dove f (x) > 0.
Supponiamo che, per x → α, f (x) → a ∈ R e g(x) → b ∈ R. Poiché ogni numero positivo
c può essere scritto nella forma elog c , si ha
f (x)g(x) = elog f (x)
g(x)
= eg(x) log f (x) .
È importante quindi studiare il limite per x → α della funzione g(x) log f (x). Per semplicità di linguaggio, in ciò che segue, facciamo le seguenti convenzioni: e−∞ = 0, e+∞ = +∞,
log 0 = −∞, log(+∞) = +∞. Nel caso che b log a sia un numero reale esteso, non sia cioè
una forma indeterminata, in base a tali convenzioni possiamo affermare che
lim f (x)g(x) = lim eg(x) log f (x) = elimx→α g(x) log f (x) = eb log a .
x→α
x→α
Ovviamente, nei suddetti passaggi si è tenuto conto del teorema di cambiamento di
variabile per i limiti e della continuità delle funzioni ex e log x.
Analizziamo ora in quali casi la forma b log a risulta indeterminata. Si hanno solo due
possibilità:
56
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
1) b = 0 e log a = ∞;
2) b = ∞ e log a = 0.
Il primo caso dà luogo a due sottocasi: a = 0 e a = +∞. Il caso 2) può capitare solo se
a = 1. La forma b log a risulta quindi indeterminata nelle seguenti tre situazioni:
a) a = 0 e b = 0 (forma indeterminata 00 );
b) a = +∞ e b = 0 (forma indeterminata ∞0 );
c) a = 1 e b = ∞ (forma indeterminata 1∞ ).
Nei reali estesi, all’infuori dei casi 00 , ∞0 e 1∞ (che rappresentano le tre forme
indeterminate delle potenze), è conveniente definire
ab = eb log a .
Ovviamente, affinché nei reali estesi abbia senso log a, è necessario che a sia maggiore o uguale a zero (+∞ incluso). In base a tale definizione, se non si ha una forma
indeterminata, si può dunque affermare che
lim f (x)g(x) = elimx→α g(x) log f (x) = eb log a = ab =
x→α
³
lim f (x)
x→α
´limx→α g(x)
Esempi di forme indeterminate delle potenze:
(00 ) limx→0 xx = limx→0 ex log x = elimx→0 x log x = e0 = 1;
(∞0 ) limx→+∞ x1/x = limx→+∞ elog x/x = elimx→+∞ log x/x = e0 = 1;
(1∞ ) limx→0 (1 + x)1/x = limy→∞ (1 + 1/y)y = e.
54 - Mar. 24/10/00
Esercizi sulla formula di Taylor e applicazioni agli integrali impropri.
Esercizi sulla formula di Taylor e applicazioni alle forme indeterminate.
55 - Mer. 25/10/00
Ricordiamo che una funzione reale di variabile reale si dice infinitesima (o un infinitesimo)
per x → α se tende a zero per x → α.
Definizione. Siano f, g: A → R due infinitesimi per x → α. Supponiamo g(x) 6= 0 in un
intorno forato di α. Si dice che f (x) è un infinitesimo di ordine superiore a g(x), si scrive
f (x) = o(g(x)) e si legge “ f (x) uguale ad o-piccolo di g(x) per x tendente ad α ”, se il
rapporto f (x)/g(x) tende a zero per x → α. Si dice che f (x) e g(x) sono infinitesimi dello
stesso ordine se f (x)/g(x) tende ad un numero finito e diverso da zero (per x → α). Si
57
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
dice che f e g sono due infinitesimi equivalenti (per x → α), e si scrive “ f (x) ∼
= g(x) per
x → α ”, se f (x)/g(x) → 1 per x → α. Si osservi che se due infinitesimi sono equivalenti,
allora sono anche dello stesso ordine (ma in generale non è vero il viceversa).
Esempi di infinitesimi per x → 0:
x,
sen x,
|x|,
x2 /(1 + cos x),
x + x2 ,
2x,
1 − cos x,
x2 − x,
p
|x|,
tang(πx) .
Riguardo ai suddetti esempi, osserviamo che (per x → 0) x ∼
= sen x, che 1 − cos x è di
2
ordine superiore ad x, che 1 − cos x è dello stesso ordine di x (ma non equivalente), che x
p
è di ordine superiore a |x|, che 1 − cos x ∼
= x2 /2 ∼
= x2 /(1 + cos x), che 2x e x2 − x sono
dello stesso odine, che tang(πx) ∼
= πx.
Esempi di infinitesimi per x → +∞:
1/x,
√
1/ x,
1/x2 ,
2/x + 1/x3 ,
1/|x|,
1/(x + x2 ),
x/(1 + x − x2 ),
sen x/(x − cos x),
sen(1/x),
sen(1/x) + 1/x2 .
Osserviamo che (per x → +∞) 1/x2 è di ordine superiore a 1/x, che 1/(x+x2 ) è equivalente
a 1/x2 ; che 1/x è dello stesso ordine di 2/x + 1/x3 , che x/(1 + x − x2 ) e sen(1/x) + 1/x2
sono dello stesso ordine.
Ulteriori esempi di infinitesimi:
p
√
√
sen x per x → π; sen x/x per x → ∞; 2 − x per x → 2; 2 − x per x → 2− ; |2 − x|
p
√
per x → 2; |2 − x| per x → 2+ ; 1/x per x → −∞; 1/x per x → ∞; x + x2 − 1 per
√
x → −∞; x − x2 − 1 per x → +∞; tang x per x → π.
Osservazione. La relazione (tra infinitesimi per x → α) di “essere equivalenti” è una
effettiva relazione di equivalenza; ossia, è riflessiva (f (x) ∼
=
= f (x)), è simmetrica (se f (x) ∼
∼
∼
∼
∼
g(x) allora g(x) = f (x)), ed è transitiva (se f (x) = g(x) e g(x) = h(x) allora f (x) = h(x)).
Talvolta, quando si afferma che una certa funzione f (x) è infinitesima per x → α, risulta
superflua la precisazione “per x → α”, quando è evidente dal contesto o dalla natura di
f (x) quale sia il punto α a cui deve tendere la variabile affinché f (x) risulti infinitesima.
Ad esempio, se si afferma che x2 è un infinitesimo, è inutile aggiungere che lo è per x → 0,
in quanto x = 0 è l’unico possibile punto (nei reali estesi) a cui può tendere x in modo che
x2 sia un infinitesimo. Analogamente, se si afferma, ad esempio, che f (x) = o(x3 ), non
occorre precisare che ciò accade per x → 0: x3 è un infinitesimo solo per x → 0.
La più semplice funzione infinitesima per x → 0 è g(x) = x. Per questo motivo tale
funzione viene spesso considerata un riferimento per gli altri infinitesimi per x → 0. Si
usa dire infatti che f (x) è un infinitesimo del primo ordine se è dello stesso ordine di x,
58
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
che è del secondo se è dello stesso ordine di x2 , che è di ordine superiore al primo se è di
ordine superiore ad x, e cosı̀ via.
Sono
–
–
–
–
–
di facile verifica le seguenti proprietà:
se f (x) = o(xn ), allora xm f (x) = o(xn+m );
se f (x) = o(xn ) e g(x) = o(xm ) allora f (x)g(x) = o(xn+m );
se f (x) = o(xn ) ed m < n, allora f (x) = o(xm );
se f (x) = o(xn ) e g(x) = o(xn ) allora f (x) + g(x) = o(xn );
se f (x) = o(xn ) e g(x) è continua per x = 0, allora g(x)f (x) = o(xn ).
Osservazione. Se f (x) = ²(x)xn , n ≥ 1, allora f (x) = o(xn ). Non è difficile provare che
se si assume f (x) continua nel punto x = 0, allora le due affermazioni “f (x) = o(xn )” e
“f (x) = ²(x)xn ” sono addirittura equivalenti.
Espressione della formula di Taylor col simbolo o-piccolo:
f (x0 + h) = f (x0 ) +
f 00 (x0 ) 2
f (n) (x0 ) n
f 0 (x0 )
h+
h + ... +
h + o(hn ) .
1!
2!
n!
56 - Mer. 25/10/00
Lo spazio R2 è l’insieme delle coppie ordinate di numeri reali; ossia delle coppie di numeri
(x, y), con x, y ∈ R. Una coppia (x, y) si dice “ordinata” perché dei due numeri x e y
è importante conoscere quale sia il primo e quale il secondo (ovvero, l’ordine in cui si
susseguono). In altre parole, una coppia (x, y), quando x 6= y, si considera diversa da
(y, x). Analogamente, lo spazio R3 è l’insieme delle terne ordinate di numeri reali. Più
in generale, dato k ∈ N, con Rk si denota l’insieme delle k-ple (si legge “cappuple”) di
numeri reali.
Gli elementi di R2 [di R3 , di Rk ] si dicono punti (o vettori). Dato un punto p = (x, y) ∈ R2 ,
il numero x si dice la prima coordinata (o componente) di p e il numero y la seconda.
Analogamente, dato x = (x1 , x2 , . . . , xk ) ∈ Rk , i numeri x1 , x2 , . . . , xk sono le coordinate
di x (la prima, la seconda, ... la k-esima). Il punto di Rk con componenti tutte nulle si
chiama origine di Rk (o vettore nullo, o vettore banale) e si indica con 0 (come lo 0 dei
reali, o dei complessi).
Dati due punti p1 = (x1 , y1 ) e p2 = (x2 , y2 ) di R2 , la loro somma si definisce “componente
per componente”:
p1 + p2 = (x1 + x2 , y1 + x2 ) .
Dato un punto p = (x, y) ∈ R2 e dato un numero λ ∈ R (detto scalare, per distinguerlo
dal vettore p) si definisce il prodotto λp moltiplicando per λ ogni componente di p. Ossia,
λp = (λx, λy). Ovviamente anche la differenza tra due punti di R2 , che è definita come
59
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
l’operazione inversa della somma, si fa componente per componente. Analoghe definizioni
si danno in R3 e in Rk (i dettagli sono lasciati allo studente).
Se p = (x, y) è un punto di R2 , la sua norma (o modulo) è il numero
p
kpk = x2 + y 2 ,
che rappresenta la distanza di p dall’origine di R2 . Più in generale, dato p =
(x1 , x2 , . . . , xk ) ∈ Rk , la sua norma è il numero
q
kpk = x21 + x22 + . . . + x2k .
I vettori di R2 [di Rk ] di norma uno si chiamano anche versori o direzioni di R2 [di Rk ].
Si potrebbe provare che la norma gode di proprietà simili a quelle del valore assoluto.
Ossia:
1. kpk ≥ 0;
2. kpk = 0 se e solo se p = 0;
3. kλpk = |λ|kpk;
4. kp + qk ≤ kpk + kqk.
La distanza tra due punti p e q di Rk è, per definizione, il numero
d(p, q) = kp − qk .
In particolare, se p1 = (x1 , y1 ) e p2 = (x2 , y2 ) sono due punti di R2 , si ha
p
d(p1 , p2 ) = kp1 − p2 k = (x1 − x2 )2 + (y1 − y2 )2 .
Nello spazio R3 (e, in particolare, anche in R2 ) si definisce il prodotto tra due arbitrari
vettori u = (x1 , y1 , z1 ) e v = (x2 , y2 , z3 ), detto prodotto scalare e denotato col simbolo u · v
(si legge “u scalare v”), ponendo
u · v = x 1 x 2 + y 1 y 2 + z1 z2 .
Il significato geometrico è il seguente: il prodotto scalare tra due vettori u e v è dato
dal prodotto dei moduli (dei due vettori) per il coseno dell’angolo θ compreso (tra i due
vettori). Si ha pertanto
|u · v| = kukkvk | cos θ| ≤ kukkvk ,
da cui segue la nota disuguaglianza di Schwarz: |u · v| ≤ kukkvk.
Si osservi che la norma di un vettore v ∈ R3 può essere definita anche attraverso il prodotto
√
scalare. Si ha infatti kvk = v · v.
60
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Dato un punto p0 ∈ Rk e dato r > 0, l’intorno (sferico) di centro p0 e raggio r è l’insieme
Bp0 (r) = {p ∈ Rk : kp − p0 k < r}
dei punti p di Rk che distano da p0 meno di r. In R2 , l’intorno sferico di un punto p0
si dice anche intorno circolare, ed è costituito da un cerchio di centro p0 privato della
circonferenza (la frontiera del cerchio). Se da Bp0 (r) si toglie il punto p0 , ciò che rimane
si chiama intorno forato (di centro p0 e raggio r).
Analogamente a quanto si è visto per lo spazio R, dato A ⊂ Rk e dato p0 ∈ Rk , si dice
che p0 è interno ad A se esiste un intorno di p0 contenuto in A; si dice che p0 è un punto
di accumulazione per A se ogni suo intorno forato contiene punti di A; si dice che p0 è di
frontiera per A se ogni suo intorno contiene sia punti di A sia punti del complementare
Ac di A. Un punto p0 di A si dice isolato se non è di accumulazione (significa che p0 , in
un suo intorno, è l’unico punto di A).
L’insieme dei punti interni ad A si dice l’interno di A e si denota con Å, l’insieme dei
punti di accumulazione si chiama il derivato di A e si indica con A0 e l’insieme dei punti
di frontiera di A si denota con ∂A.
Un sottoinsieme A di Rk si dice aperto se ogni suo punto è interno (ossia, se A = Å);
si dice chiuso se il suo complementare è aperto. Si potrebbe provare che un insieme è
chiuso se e solo se contiene tutti i punti della sua frontiera ed è aperto se e solo se ogni
punto della sua frontiera appartiene al complementare (che in questo caso risulta chiuso).
Un’altra condizione necessaria e sufficiente affinché un insieme sia chiuso è che contenga
tutti i suoi punti di accumulazione. Ovviamente, esistono anche insiemi che non sono né
aperti né chiusi; basti pensare ad un insieme che contiene soltanto alcuni punti della sua
frontiera, ma non tutti; come, ad esempio, un intervallo (a, b] di R.
Un sottoinsieme A di Rk si dice limitato se esiste una costante r > 0 tale che kpk ≤ r
per ogni p ∈ A. Non è difficile verificare che A è limitato se e solo se il suo diametro,
diam(A) = sup {kp − qk : p, q ∈ A}, è minore di +∞.
57 - Gio. 26/10/00
Una funzione f : A → R si dice reale di due [di tre, di k] variabili reali se il suo dominio A è
un sottoinsieme di R2 [di R3 , di Rk ]. Se f è una funzione di due [tre, k] variabili, il valore
che assume in un punto (x, y) [(x, y, z), (x1 , x2 , . . . xk )] si denota con f (x, y) [f (x, y, z),
f (x1 , x2 , . . . xk )] o, più semplicemente, con f (p), dove p sta per (x, y) [per (x, y, z), per
(x1 , x2 , . . . xk )].
Ricordiamo che il grafico di un’applicazione tra due arbitrari insiemi, f : X → Y , è costituito delle coppie ordinate (x, y) che soddisfano la relazione y = f (x), detta equazione del
61
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
grafico. Pertanto, in particolare, se f : A → R è una funzione reale di due variabili reali, il
suo grafico è l’insieme delle coppie (p, z) che verificano la condizione z = f (p), con p ∈ A.
D’altra parte, essendo p = (x, y) un punto di R2 , ossia una coppia ordinata di numeri reali,
il grafico di f può essere “visualizzato” in R3 come l’insieme delle terne (x, y, z) che verificano l’equazione z = f (x, y), con (x, y) ∈ A (che, tranne “casi patologici”, rappresenta
una superficie in R3 ).
Data f : A → R, con A ⊂ R2 , e dato un numero c ∈ R, l’insieme
f −1 (c) = {(x, y) ∈ A : f (x, y) = c}
si dice insieme di livello c (della f ). Tranne “casi patologici”, f −1 (c) è una curva in R2 ,
detta curva (o linea) di livello c.
Diremo che una funzione f : A → R, definita su un sottoinsieme A di R2 (o, più in generale,
di Rk ), è limitata [limitata superiormente, limitata inferiormente] se lo è la sua immagine.
Non è difficile verificare che f è limitata se e solo se esiste una costante M > 0 che domina
f ; ossia, tale che |f (p)| ≤ M per ogni p ∈ A .
Notazione. Da ora in avanti, a meno che non venga altrimenti specificato, con la lettera
ρ denoteremo la seguente funzione di due variabili (che di solito verranno indicate con h
e k, ma talvolta anche con x e y):
p
ρ = ρ(h, k) = k(h, k)k = h2 + k 2 .
Osservazione. Le funzioni x/ρ e y/ρ sono limitate. Si ha infatti
Analogamente |y/ρ| ≤ 1.
|x|
|x|
|x/ρ| = p
≤ √ = 1.
x2
x2 + y 2
Sia f : A → R una funzione reale di due variabili reali e sia (x0 , y0 ) un punto di accumulazione per il dominio A di f (non occorre che (x0 , y0 ) appartenga ad A). Si dice che f (x, y)
tende ad un numero reale l per (x, y) che tende ad (x0 , y0 ), e si scrive f (x, y) → l per
(x, y) → (x0 , y0 ), se per ogni ² > 0 esiste δ > 0 tale che da
p
0 < (x − x0 )2 + (y − y0 )2 < δ
e (x, y) ∈ A segue |f (x, y) − l| < ².
Per indicare che f (x, y) → l per (x, y) → (x0 , y0 ) si usa anche dire che il limite per (x, y)
che tende a (x0 , y0 ) di f (x, y) è uguale a l, e si scrive
lim
(x,y)→(x0 ,y0 )
f (x, y) = l
62
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
oppure, denotato con p0 il punto (x0 , y0 ) e con p il generico punto (x, y), si scrive
lim f (p) = l .
p→p0
Più in generale, se f : A → R è una funzione reale di k variabili reali, dato un punto p0
di accumulazione per il dominio A di f e dato un numero reale esteso λ, si dice che f (p)
tende a λ per p → p0 , e si scrive
lim f (p) = λ ,
p→p0
se fissato un arbitrario intorno U di λ esiste un δ > 0 tale che da 0 < kp − p0 k < δ (e
p ∈ A) segue f (p) ∈ U .
Osservazione. Se il limite per (x, y) → (x0 , y0 ) di f (x, y) è uguale λ ∈ R, allora, fissato
un qualunque vettore non nullo v = (h, k) ∈ R2 , si ha
lim f (x0 + th, y0 + tk) = λ .
t→0
In particolare, se esiste il limite per p → p0 di f (p), allora il limite direzionale
lim f (p0 + tv)
t→0
esiste per ogni vettore non nullo v ed è indipendente dalla direzione v. Di conseguenza,
se il limite direzionale (in p0 ) dipende dalla direzione (o non esiste per qualche direzione),
allora f (p) non ammette limite per p → p0 .
Esempio. Consideriamo il
lim
(x,y)→(0,0) x2
xy
.
+ y2
Fissiamo un vettore (h, k) ∈ R2 ed eseguiamo, nel suddetto limite, le sostituzioni x = th,
y = tk. Si ha
hk
t2 hk
= 2
.
lim 2 2
2
2
t→0 t h + t k
h + k2
Il limite direzionale dipende dunque dalla direzione (h, k). Si può pertanto concludere che
la funzione xy/(x2 + y 2 ) non ammette limite per (x, y) → (0, 0).
Vedremo in seguito, con un esempio, che il limite direzionale può esistere ed essere uguale
in ogni direzione, ma il limite può non esistere.
Teorema (fondamentale dei limiti per funzioni di più variabili). Siano f1 ed f2 due
funzioni reali di k variabili reali. Supponiamo che, nei reali estesi, f1 (p) → γ1 e f2 (p) →
γ2 , per p → p0 . Allora, per p → p0 (e quando ha senso), si ha:
1) f1 (p) + f2 (p) → γ1 + γ2 ;
2) f1 (p)f2 (p) → γ1 γ2 ;
63
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
3) f1 (p)/f2 (p) → γ1 /γ2 .
Per le funzioni di più variabili si hanno teoremi analoghi a quelli già incontrati nel caso di
una variabile. Con le opportune modifiche, valgono infatti i seguenti risultati (si invita lo
studente a formularne gli enunciati):
– teorema di unicità del limite;
– teorema della permanenza segno;
– teorema del confronto tra i limiti;
– teorema dei carabinieri (e del carabiniere).
Corollario (del teorema dei carabinieri). Siano f e g due funzioni reali definite in un
sottoinsieme A di Rk . Supponiamo che f sia limitata e che g(p) → 0 per p → p0 . Allora
f (p)g(p) → 0 per p → p0 .
Come applicazione del precedente corollario, determiniamo il seguente limite:
xy 2
.
(x,y)→(0,0) ρ2
lim
Osserviamo che la funzione f (x, y) = xy 2 /ρ2 è il prodotto di tre funzioni: x/ρ, y/ρ e y. Le
prime due non ammettono limite per (x, y) → (0, 0), come si vede facilmente controllando il
limite direzionale (che, in questo caso, dipende dalla direzione). La terza funzione, invece,
tende a zero. Non è dunque applicabile il teorema del prodotto dei limiti. Tuttavia,
essendo limitate le prime due funzioni, per il suddetto corollario si può concludere che
xy 2 /ρ2 → 0 per (x, y) → (0, 0).
La continuità di una funzione di più variabili si definisce analogamente al caso di una sola
variabile:
data f : A → R, con A ⊂ Rk , e dato un punto p0 ∈ A, f è continua in p0 se per ogni ² > 0
esiste un δ > 0 tale che da kp − p0 k < δ segue |f (p) − f (p0 )| < ².
Come nel caso di una variabile, se p0 è di accumulazione per il dominio di f , allora f è
continua in p0 se e solo se f (p) → f (p0 ) per p → p0 . Se invece p0 è un punto isolato del
dominio, allora la continuità in p0 segue direttamente dalla definizione.
Teorema (di continuità delle funzioni combinate). La somma, il prodotto, il quoziente e
la composizione di funzioni continue, quando (e dove) ha senso, è ancora una funzione
continua.
58 - Gio. 26/10/00
Sia f (x, y) una funzione reale di due variabili reali. Se si fissa una delle due variabili, ad
esempio se si fissa y = y0 , si ottiene la funzione di una sola variabile x 7→ f (x, y0 ), detta
64
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
funzione parziale della x (per y = y0 ). In realtà esistono infinite funzioni parziali della
prima variabile: una per ogni fissato valore della y. Analogamente, se si fissa un valore
della prima variabile, si ottiene una delle tante funzioni parziali della seconda variabile.
Tuttavia, le funzioni parziali (delle funzioni di due variabili), anche se sono infinite, si
dividono in due sole classi: quelle della prima variabile e quelle della seconda.
In modo analogo, data una funzione di tre variabili [di k variabili], si definiscono tre [k]
classi di funzioni parziali. I dettagli sono lasciati allo studente.
Sia f : U → R una funzione reale definita su un aperto U di R2 e sia p0 = (x0 , y0 ) un punto
di U . La derivata (parziale) nel punto p0 di f rispetto alla x (o meglio, rispetto alla prima
variabile) è (se esiste) la derivata in x0 della funzione parziale (reale di variabile reale)
x 7→ f (x, y0 ). In modo analogo si definisce la derivata (parziale) rispetto alla seconda
variabile. La derivata parziale di f rispetto ad x in p0 = (x0 , y0 ) si denota con uno dei
seguenti simboli:
∂f
(x0 , y0 ) ,
∂x
∂f
(p0 ) ,
∂x
D1 f (x0 , y0 ) ,
D1 f (p0 ) .
Un’analoga notazione vale per la derivata rispetto ad y.
Si dice semplicemente che f è derivabile (parzialmente) rispetto ad x se è derivabile (rispetto ad x) in ogni punto del dominio. In questo caso risulta ben definita la funzione,
detta derivata rispetto ad x, che ad ogni punto (x, y) di U associa il numero
∂f
(x, y) .
∂x
La definizione della funzione derivata rispetto ad y è analoga.
Si dice che f è derivabile se è derivabile sia rispetto ad x sia rispetto ad y. Se la derivata
di f rispetto ad x è di nuovo derivabile rispetto ad x, allora f si dice derivabile due
volte rispetto ad x (o che ammette derivata seconda rispetto ad x due volte). La derivata
rispetto ad x della derivata rispetto ad x, calcolata in un punto (x, y), si indica con uno
dei seguenti simboli:
∂2f
(x, y) , D1 D1 f (x, y) .
∂x2
In modo simile si definiscono le altre derivate seconde:
∂2f
(x, y) ,
∂y∂x
∂2f
(x, y) ,
∂x∂y
∂2f
(x, y) .
∂y 2
Esercizio. Definire le derivate parziali di ordine superiore al secondo per una funzione di
due variabili.
65
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Esercizio. Definire le derivate parziali di ogni ordine per le funzioni reali di tre (e di k)
variabili reali.
Definizione. Una funzione reale f : U → R, definita su un sottoinsieme aperto U di Rk ,
si dice di classe C 0 (o che è C 0 , o che appartiene a C 0 ) se è continua; si dice di classe C 1
se è derivabile e tutte le sue derivate parziali sono C 0 .
A differenza di quanto accade per le funzioni di una sola variabile, una funzione di due (o
più) variabili può essere derivabile senza che risulti continua. Tuttavia, se una funzione è
derivabile e le sue derivate sono continue, allora si può affermare che è continua. Come
conseguenza del Teorema di Lagrange, vale infatti il seguente risultato:
Teorema Se f è una funzione di classe C 1 , allora è anche di classe C 0 .
Definizione. Sia f : U → R una funzione definita su un aperto di Rk . Per induzione,
si dice che f è di classe C n se è derivabile e tutte le sue derivate parziali sono di classe
C (n−1) .
Usando il principio di induzione non è difficile provare il seguente risultato:
Teorema Se f è una funzione di classe C n , allora è anche di classe C n−1 .
Teorema (di regolarità delle funzioni combinate). La somma, il prodotto, il quoziente e
la composizione di funzioni C n , quando (e dove) ha senso, è ancora una funzione C n .
Esempio (di funzione derivabile ma non continua). Consideriamo la funzione
(
xy
se (x, y) 6= (0, 0)
x2 +y 2
f (x, y) =
0
se (x, y) = (0, 0) .
Ovviamente, nel sottoinsieme aperto R2 \{(0, 0)} di R2 è di classe C ∞ , essendo (in tale
insieme) rapporto di funzioni C ∞ . Dalla definizione derivata parziale segue subito che è
derivabile anche in (0, 0) e le due derivate parziali (in tale punto) sono nulle. Pertanto, f
è derivabile in ogni punto di R2 . È immediato verificare che f non è continua nell’origine,
perché il limite direzionale dipende dalla direzione (di conseguenza, non esiste il limite
per (x, y) → (0, 0) di f (x, y) ). Incidentalmente, osserviamo che f , non essendo continua,
non può essere neppure di classe C 1 (si invita lo studente a verificare direttamente la
discontinuità in (0, 0) delle derivate parziali di f ).
Teorema di Schwarz. Sia f : A → R una funzione di classe C 2 su un aperto A di R2 .
Allora
∂ ∂f
∂ ∂f
(x, y) =
(x, y) , ∀(x, y) ∈ A .
∂y ∂x
∂x ∂y
Osserviamo che, se una funzione è sufficientemente regolare, il Teorema di Schwarz ci
permette di scambiare l’ordine di due qualunque delle sue derivate. Si considerino, ad
66
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
esempio, le seguenti due derivate terze:
∂ ∂ ∂f
(x, y) ,
∂x ∂y ∂x
∂ ∂ ∂f
(x, y) .
∂y ∂x ∂x
Si può affermare che sono uguali? Mostriamo che se f è di classe C 3 , la risposta è
affermativa. Infatti, in tale ipotesi, la funzione
g(x, y) =
∂f
(x, y)
∂x
è di classe C 2 . Di conseguenza, le suddette derivate terze risultano uguali, essendo le
derivate seconde miste della funzione g(x, y). In maniera analoga si prova che se una
funzione è di classe C n , si può scambiare l’ordine di derivazione di due qualunque derivate
in una sua derivata n-esima.
Esercizi assegnati [Spiegel, cap. 6]: 1, 2.
59 - Ven. 27/10/00 - Lezione svolta dal Dott. Mugelli
Vettori. Somma di vettori. Prodotto di un vettore per uno scalare. Versori e coordinate.
Prodotto scalare e vettoriale. Prodotto misto. Significato geometrico dei prodotti scalare,
vettoriale e misto. Prodotto scalare e vettoriale per componenti.
60 - Ven. 27/10/00 - Lezione svolta dal Dott. Mugelli
Campi scalari e vettoriali. Operatore nabla. Definizioni di gradiente. Derivate direzionali.
Differenziale. Divergenza e rotore mediante nabla.
Esercizi consigliati [Spiegel, cap. 7]: 4, 5, 8, 34, 39.
61 - Lun. 30/10/00
Osservazione. Sia f : A → R una funzione reale definita su un sottoinsieme A di R2 (o,
più in generale, di Rk ). Se il limite per p → p0 di f (p) esiste ed è finito, allora f è limitata
in un intorno forato di p0 .
Alcuni esercizi sui limiti:
xy
,
(x,y)→(0,0) ρ
lim
sen xy − xy
,
x3 y 3
(x,y)→(0,0)
lim
xy
,
(x,y)→(0,0) y − x2
lim
sen xy − xy cos y
.
x3 y 3
(x,y)→(0,0)
lim
67
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
62 - Lun. 30/10/00
Sia f : U → R una funzione di classe C 1 definita in un aperto U di R2 . Consideriamo due
punti p0 = (x0 , y0 ) e p0 + ∆p = (x0 + ∆x, y0 + ∆y) del dominio J di f . L’incremento
che subisce la funzione f passando dal punto p0 al punto p0 + ∆p è il numero ∆f =
f (p0 + ∆p) − f (p0 ). Analogamente a quanto si è visto per le funzioni di una sola variabile,
l’incremento ∆f (che dovremmo a rigore scrivere ∆f (p0 , ∆p) o ∆f (p0 )(∆p) o ∆fp0 (∆p),
perché dipende sia dal punto iniziale p0 sia dall’incremento ∆p della variabile vettoriale
p) ha il difetto di non essere facile da valutare. Tuttavia, se l’incremento ∆f (p0 )(∆p) ci
interessa soltanto per valori piccoli di k∆pk (come, ad esempio, per il calcolo degli errori),
al posto dell’incremento vero è preferibile utilizzare un incremento “virtuale” che, pur non
essendo vero (a meno che il grafico di f non sia un piano), ha il duplice pregio di essere
facile da calcolare e di approssimare bene l’incremento vero. Tale incremento virtuale,
detto differenziale di f (nel punto p0 e relativo all’incremento ∆p), è cosı̀ definito:
df (p0 )(∆p) = ∇f (p0 ) · ∆p =
∂f
∂f
(p0 )∆x +
(p0 )∆y .
∂x
∂y
Proveremo in seguito che df (p0 )(∆p) approssima bene l’incremento vero ∆f (p0 )(∆p) per
piccoli valori di k∆pk, nel senso che il rapporto
∆f (p0 )(∆p) − df (p0 )(∆p)
k∆pk
tende a zero per k∆pk che tende a zero. In un certo senso, ciò significa che, per valori
piccoli di ∆x e ∆y, lo scarto tra l’incremento vero e quello virtuale è trascurabile rispetto
alla norma dell’incremento ∆p = (∆x, ∆y) della variabile vettoriale p.
Osserviamo ora che gli incrementi veri, ∆x e ∆y, che subiscono le funzioni x e y passando
dal punto p0 = (x0 , y0 ) al punto p0 + ∆p = (x0 + ∆x, y0 + ∆y) coincidono con i loro
rispettivi incrementi virtuali dx e dy (indipendentemente dal punto iniziale p0 ). Si ha
pertanto
∂f
∂f
(p0 )dx +
(p0 )dy ,
df (p0 ) =
∂x
∂y
dove dx e dy sono i differenziali di due particolari funzioni da R2 ad R: le cosiddette
funzioni coordinate (cartesiane) x ed y. Ovvero, le due “leggi” che ad ogni ad ogni punto
p ∈ R2 assegnano, rispettivamente, la prima e la seconda coordinata di p.
La suddetta uguaglianza, visto che vale per ogni p0 , si potrà scrivere anche
df =
∂f
∂f
dx +
dy
∂x
∂y
o, più semplicemente, con notazioni vettoriali, nella forma
df = ∇f · dp .
68
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Esercizi assegnati [Spiegel, cap. 6]: 4, 5, 7.
63 - Mar. 31/10/00
Abbiamo visto che il differenziale di una funzione f (x, y), di classe C 1 su un aperto U di
R2 , è un’espressione della forma
A(x, y)dx + B(x, y)dy ,
dove le funzioni A(x, y) e B(x, y) sono le derivate parziali di f rispetto ad x e ad y, dx
è il differenziale della prima funzione coordinata e dy della seconda. Da ora in avanti,
un’espressione del tipo
ω = A(x, y)dx + B(x, y)dy ,
dove A(x, y) e B(x, y) sono due funzioni continue su un aperto U di R2 , verrà chiamata
una forma differenziale. Diremo che ω è di classe C n (in U ) se sono di classe C n (in U )
entrambe le funzioni, A(x, y) e B(x, y).
Ci poniamo la seguente domanda: data una forma differenziale
ω = A(x, y)dx + B(x, y)dy ,
si può affermare che questa è il differenziale di una funzione f (x, y)? Il seguente risultato
mostra che la risposta è in generale negativa:
Teorema. Sia ω = A(x, y)dx+B(x, y)dy una forma differenziale di classe C 1 su un aperto
U di R2 . Se esiste una funzione f : U → R tale che df = ω (ossia, tale che ∂f /∂x = A e
∂f /∂y = B), allora ∂A/∂y = ∂B/∂x.
Dimostrazione. Sia f una funzione tale che ∂f /∂x = A e ∂f /∂y = B. Poiché A e B
sono di classe C 1 , la funzione f risulta di classe C 2 . Di conseguenza, tenendo conto del
Teorema di Schwarz, si ha
∂2f
∂2f
∂B
∂A
=
=
=
.
∂y
∂y∂x
∂x∂y
∂x
Esempio. Consideriamo la forma differenziale ω = xdx − xydy, definita su tutto R2 .
Poiché ∂x/∂y = 0 e ∂(−xy)/∂x = −y, non esiste una funzione f : R2 → R tale che df = ω.
Definizione. Sia ω = A(x, y)dx + B(x, y)dy una forma differenziale definita su un aperto
U di R2 . Si dice che ω è una forma esatta (in U ) se esiste una funzione f : U → R, detta
primitiva di ω, tale che df = ω. Si dice che ω è una forma chiusa (in U ) se ∂A/∂y = ∂B/∂x.
In base alla suddetta definizione, il precedente teorema può essere riformulato nel modo
seguente:
69
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
“condizione necessaria affinché una forma differenziale di classe C 1 sia esatta è che sia
chiusa”.
Vedremo in seguito (dopo aver introdotto gli integrali curvilinei) che la condizione di essere
chiusa, senza opportune ipotesi sul dominio della forma differenziale, non assicura che la
forma sia esatta.
Esempi ed esercizi relativi alle forme differenziali in R2 .
Calcolo delle primitive di alcune forme differenziali esatte.
64 - Mar. 31/10/00
Il differenziale di una funzione di tre variabili si definisce in modo analogo a come si è
fatto per le funzioni di due variabili: se f (x, y, z) è una funzione di classe C 1 su un aperto
U di R3 , il differenziale di f è l’espressione
df =
∂f
∂f
∂f
dx +
dy +
dz
∂x
∂y
∂z
o, con notazioni vettoriali, l’espressione
df = ∇f · dp ,
dove dp è il vettore incremento (di componenti dx, dy e dz).
In generale, un’espressione del tipo
ω = A(x, y, z)dx + B(x, y, z)dy + C(x, y, z)dz ,
dove A, B e C sono funzioni continue su un aperto U di R3 , si dice una forma differenziale
in R3 . Come per le forme nel piano, ω è di classe C n (in U ) se sono di classe C n (in U )
le sue tre funzioni componenti: A, B e C. Diremo che ω è una forma esatta se esiste una
funzione f , detta primitiva di ω, tale che df = ω. Diremo che ω è chiusa se sono verificate
le seguenti tre condizioni: ∂A/∂y = ∂B/∂x, ∂B/∂z = ∂C/∂y e ∂C/∂x = ∂A/∂z.
Come per le forme in R2 , dal Teorema di Schwarz discende che (anche in R3 ) ogni forma
esatta di classe C 1 è chiusa. In generale, tuttavia, non è vero il viceversa (lo vedremo con
un esempio, dopo aver introdotto gli integrali curvilinei).
Una condizione che assicura che una forma chiusa sia anche esatta è che il dominio U della
forma sia semplicemente connesso. La nozione di insieme semplicemente connesso richiede
concetti topologici che vanno al di là degli scopi del corso. Ci limitiamo pertanto a darne
un’idea intuitiva, corredandola poi con alcuni esempi esplicativi.
70
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Definizione (euristica di insieme semplicemente connesso). Un sottoinsieme aperto U
di R2 (o di R3 ) si dice semplicemente connesso se ogni curva chiusa contenuta in U può
essere deformata con continuità riducendola ad un punto, senza che nella deformazione
si tocchino mai punti del complementare di U (si pensi ad un elastico che si contrae,
rimanendo sempre dentro U , fino a diventare un punto).
Ricordiamo che un sottoinsieme Q di R2 (o di R3 ) è convesso se presi due qualunque punti
di Q, il segmento che li congiunge è contenuto in Q. Ad esempio, i cerchi, i triangoli e
i rettangoli sono convessi di R2 , le sfere (piene) e i parallelepipedi sono convessi di R3 .
Ovviamente, l’intero spazio R2 è convesso, cosı̀ come è convesso un semipiano. Si potrebbe
dimostrare (se si fosse data una definizione rigorosa di semplicemente connesso) che gli
insiemi convessi sono anche semplicemente connessi.
Esempi di insiemi non semplicemente connessi si ottengono togliendo dal piano un punto,
o un numero finito di punti o, addirittura, un arbitrario insieme limitato. Se, invece, dallo
spazio R3 si toglie un punto (o un numero finito di punti), ciò che resta è ancora un insieme
semplicemente connesso (si pensi ad un elastico che si contrae senza mai toccare i punti
rimossi). Se da R3 si toglie una retta, o una circonferenza (o un numero finito di rette e
circonferenze) ciò che rimane non è semplicemente connesso (si pensi ad un elastico che
circonda una retta o che è concatenato con una circonferenza).
Teorema. Se una forma differenziale (in R2 o in R3 ) è chiusa ed è definita in un insieme
semplicemente connesso, allora è anche esatta.
Esiste un perfetto parallelismo tra le forme differenziali e i campi vettoriali (in R2 o in
R3 ). Ci limitiamo ad un confronto in R3 .
Ad ogni forma differenziale ω = Adx + Bdy + Cdz associamo il campo vettoriale vω
con le stesse componenti di ω; ossia, vω = Ai + Bj + Ck. È ovvio che in questo modo
si ha una corrispondenza biunivoca tra forme differenziali e campi vettoriali. In questa
corrispondenza biunivoca i seguenti concetti si corrispondono:
f è una primitiva di ω
ω è esatta
ω è chiusa
⇐⇒
⇐⇒
⇐⇒
f è un potenziale di vω
vω è conservativo
vω è irrotazionale
Esempi ed esercizi relativi alle forme differenziali.
Esercizi assegnati [Spiegel, cap. 6]: 11, 14, 15.
65 - Gio. 2/11/00
Il limite di una funzione vettoriale di variabile vettoriale si definisce in modo analogo a
71
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
come è fatto per le funzioni reali di più variabili reali.
Sia f : A → Rs un’applicazione definita in un sottoinsieme A di Rk e sia p0 un punto di
accumulazione per il dominio A di f . Si dice che f (p) tende ad un vettore l ∈ Rs per p
che tende a p0 , e si scrive f (p) → l per p → p0 , se per ogni ² > 0 esiste δ > 0 tale che da
0 < kp − p0 k < δ e p ∈ A segue kf (p) − lk < ². In questo caso si può anche scrivere
lim f (p) = l .
p→p0
Si potrebbe dimostrare che f (p) → l per p → p0 se e solo se la prima componente f1 (p) di
f (p) tende alla prima componente l1 del vettore l, la seconda componente di f (p) tende
alla seconda componente di l, e cosı̀ via per tutte le altre componenti.
Sia f : A → Rs un’applicazione definita in un sottoinsieme A di Rk . Diremo che f è
continua in un punto p0 ∈ A se sono continue (in p0 ) le sue s funzioni componenti: f1 , f2 ,
. . . , fs . Per quanto visto prima sul limite di una funzione vettoriale di variabile vettoriale,
nel caso che p0 sia un punto di accumulazione per A, ciò equivale ad affermare che
lim f (p) = f (p0 ) .
p→p0
66 - Gio. 2/11/00
Una curva parametrica in R2 [in R3 ] è una funzione continua γ(t) da un intervallo compatto
[a, b] a valori in R2 [in R3 ]. I punti γ(a) e γ(b) si dicono, rispettivamente, primo e secondo
estremo della curva. La curva γ(t) si dice chiusa se i suoi estremi coincidono (ossia,
se γ(a) = γ(b)). Se la curva γ(t) non è chiusa, allora si dice che è un arco di curva
(parametrica). La variabile t di γ(t) si chiama il parametro della curva. Ovviamente, al
posto di t si può usare una qualunque altra lettera (le più comuni sono t, τ , s, θ, ϕ).
Definizione. Un sottoinsieme A di Rk si dice connesso (per archi) se dati due qualunque
punti p, q ∈ A esiste una curva (parametrica) a valori in A congiungente p con q (cioè, con
estremi p e q).
Si potrebbe dimostrare che gli insiemi connessi di R sono esattamente gli intervalli.
Definizione. Un sottoinsieme A di Rk si dice compatto se è limitato e chiuso.
Ricordiamo che un insieme compatto A di R, essendo limitato, ha estremo inferiore ed
estremo superiore finiti (cioè, appartenenti ad R). Inoltre, essendo anche chiuso, tali
estremi sono, rispettivamente, minimo e massimo di A.
72
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Primo Teorema di Weierstrass in Rk . Sia f : A → Rs una funzione continua in un
sottoinsieme compatto A ⊂ Rk . Allora l’immagine di f è un insieme compatto di Rs . In
particolare, se s = 1, f ammette minimo e massimo assoluti.
Secondo Teorema di Weierstrass in Rk . Sia f : A → Rs una funzione continua in un
sottoinsieme connesso A ⊂ Rk . Allora l’immagine di f è un insieme connesso di Rs . In
particolare, se s = 1, l’immagine di f è un intervallo.
67 - Ven. 3/11/00
Teorema (della derivata di una funzione composta). Sia f (x, y) una funzione di classe C 1
e siano x(t) e y(t) due funzioni derivabili. Allora la funzione composta ϕ(t) = f (x(t), y(t))
è derivabile e si ha
ϕ0 (t) =
∂f
∂f
(x(t), y(t)) x0 (t) +
(x(t), y(t)) y 0 (t) .
∂x
∂y
Più in generale, con le notazioni vettoriali, se f (x) è una funzione reale di k variabili reali e
x(t) è una curva derivabile in Rk , allora la funzione (reale di variabile reale) ϕ(t) = f (x(t))
è derivabile e
ϕ0 (t) =
∂f
∂f
∂f
(x(t)) x01 (t) +
(x(t)) x02 (t) + . . . +
(x(t)) x0k (t) ,
∂x1
∂x2
∂xk
che possiamo scrivere (mediante il prodotto scalare) nella forma
ϕ0 (t) = ∇f (x(t)) · x0 (t)
Il suddetto teorema permette di calcolare la derivata di funzioni composte più complesse
di f (x(t), y(t)). Calcoliamo, ad esempio, la derivata parziale rispetto alla prima variabile
della funzione composta
ϕ(u, v) = f (x(u, v), y(u, v)) ,
dove f (x, y), x(u, v) e y(u, v) sono di classe C 1 . Ricordandosi che la derivata parziale di
ϕ(u, v) rispetto alla variabile u non è altro che la derivata della funzione parziale u 7→
ϕ(u, v), che è di una sola variabile, dal teorema precedente segue immediatamente
∂f
∂f
∂x
∂y
∂ϕ
(u, v) =
(x(u, v), y(u, v))
(u, v) +
(x(u, v), y(u, v))
(u, v) .
∂u
∂x
∂u
∂y
∂u
68 - Ven. 3/11/00
Riportiamo senza dimostrazione il seguente importante risultato:
73
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Teorema (di esistenza della formula di Taylor del secondo ordine in R2 ). Sia f : U → R
una funzione di classe C 2 su un aperto di R2 . Sia p0 = (x0 , y0 ) un punto di U . Allora
vale la seguente formula di Taylor del secondo ordine (col resto nella forma di Peano):
∂f
∂f
(p0 )h +
(p0 )k +
∂x
∂y
¶
µ
1 ∂2f
∂2f
∂2f
2
2
(p0 )h + 2
(p0 )hk + 2 (p0 )k + ²(h, k)ρ2 ,
2 ∂x2
∂x∂y
∂y
f (x0 + h, y0 + k) = f (x0 , y0 ) +
dove ²(h, k) è una funzione reale di due variabili reali nulla in (0, 0) e continua in (0, 0) e
√
ρ è la funzione ρ(h, k) = k(h, k)k = h2 + k 2 .
Ricordiamo che il polinomio omogeneo di primo grado
df (p0 )(h, k) =
∂f
∂f
(p0 )h +
(p0 )k
∂x
∂y
è il differenziale della funzione f calcolato in p0 e applicato al vettore incremento v = (h, k).
Per analogia, il polinomio omogeneo di secondo grado
d2 f (p0 )(h, k) =
∂2f
∂2f
∂2f
2
(p
(p0 )k 2
)h
(p
+
2
)hk
+
0
0
∂x2
∂x∂y
∂y 2
si chiama il differenziale secondo di f calcolato in p0 e applicato al vettore incremento
v = (h, k).
Dunque, con simboli più sintetici la formula di Taylor del secondo ordine si può scrivere
nella forma:
1
∆f (p0 )(v) = df (p0 )(v) + d2 f (p0 )(v) + ²(v)kvk2 .
2
Analogamente al caso di una sola variabile, vale ancora un teorema di unicità della formula
di Taylor. In altre parole se
f (x0 + h, y0 + k) = P2 (h, k) + ²(h, k)ρ2 ,
dove P2 (h, k) è un polinomio di grado minore o uguale a due nelle due variabili h e k, allora
i coefficienti di tale polinomio devono coincidere con quelli indicati nel suddetto teorema
di esistenza della formula di Taylor.
Se il centro è (0, 0), allora la formula di Taylor prende anche il nome di formula di
MacLaurin. In questo caso si ha
∂f
∂f
(0, 0) x +
(0, 0) y +
∂x
∂y
µ
¶
∂2f
∂2f
1 ∂2f
2
2
(0, 0)x + 2
(0, 0)xy + 2 (0, 0)y + ²(x, y)ρ2 ,
2 ∂x2
∂x∂y
∂y
f (x, y) = f (0, 0) +
74
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
dove ρ in questo caso è la funzione
p
x2 + y 2 .
Esercizi assegnati [Spiegel, cap. 6]: 18, 22.
69 - Lun. 6/11/00
Definizione. Sia f : A → R una funzione reale definita in un sottoinsieme A di R2 (o, più
in generale, di Rk ). Un punto p0 ∈ A si dice di minimo [di massimo ] relativo (o locale) per
f in A se esiste un intorno U di p0 tale che f (p) ≥ f (p0 ) [f (p) ≤ f (p0 )] per ogni p ∈ U ∩ A.
Un punto di minimo o di massimo relativo per f (in A) si dice estremante per f (in A).
Teorema di Fermat (per funzioni di due variabili). Sia f : A → R una funzione reale di
due variabili reali e sia p0 = (x0 , y0 ) ∈ A. Supponiamo che siano soddisfatte le seguenti
tre ipotesi:
1) p0 è interno ad A;
2) f è derivabile in p0 ;
3) p0 è un punto estremante per f in A.
Allora
∂f
∂f
(p0 ) = 0 ,
(p0 ) = 0 ;
∂x
∂y
ossia, ∇f (p0 ) = 0.
Dimostrazione. Consideriamo la funzione parziale ϕ : x 7→ f (x, y0 ). Dalle ipotesi 1), 2)
e 3) segue immediatamente che x0 è interno al dominio di ϕ, che ϕ è derivabile in x0 e
che x0 è estremante per ϕ. Quindi, il Teorema di Fermat per funzioni di una variabile ci
assicura che ϕ0 (x0 ) = 0. Pertanto, ricordandosi la definizione di derivata parziale, si ha
∂f
(x0 , y0 ) = ϕ0 (x0 ) = 0 .
∂x
In modo analogo si prova che in (x0 , y0 ) si annulla anche la derivata parziale di f rispetto
ad y.
I punti in cui si annulla il gradiente di una funzione f (x, y) vengono detti critici o stazionari
per f .
Osserviamo che, in base al suddetto teorema, i punti estremanti di una funzione f : A → R
vanno cercati tra le seguenti tre categorie:
1) punti di frontiera di A;
2) punti in cui la funzione non è derivabile;
3) punti critici per f .
Nessuna delle suddette tre condizioni ci assicura che un punto sia estremante. Tuttavia,
se lo è, almeno una delle tre deve essere soddisfatta.
75
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Nella ricerca dei punti estremanti di una funzione di due variabili definita in un insieme
A ⊂ R2 si procede per esclusione: come primo provvedimento, tenendo conto del Teorema
di Fermat, si scagionano subito “dall’accusa di essere estremanti” tutti i punti interni
ad A in cui la funzione risulta derivabile ed una delle due derivate parziali è diversa da
zero. Rimangono da analizzare i punti di frontiera, i punti interni in cui la funzione non è
derivabile e i punti interni in cui si annullano entrambe le derivate. Per “discolpare” altri
punti di frontiera si tiene conto del fatto che se p ∈ ∂A non è estremante per la restrizione
di f alla frontiera di A, allora non lo è neppure per f in A. Di solito, lo studio della
restrizione di f a ∂A consente di escludere la grande maggioranza dei punti di frontiera.
Con tale procedimento di successive esclusioni, molto spesso rimangono soltanto pochi
punti “sospetti” che possono essere analizzati a parte con metodi vari; ad esempio, se si
cercano gli estremi assoluti di f in A, mediante il confronto dei valori assunti.
Per comprendere meglio il procedimento per esclusione nella ricerca dei punti estremanti,
riformuliamo il Teorema di Fermat in una versione equivalente: la versione “garantista”.
Teorema di Fermat in R2 (riformulato). Sia f : A → R una funzione reale di due
variabili reali e sia p0 ∈ A. Supponiamo che siano soddisfatte le seguenti tre ipotesi:
1) p0 è interno ad A;
2) f è derivabile in p0 ;
3) una delle derivate parziali di f in p0 è diversa da zero.
Allora p0 non è estremante per f in A.
Esempi ed esercizi relativi alla ricerca dei punti estremanti per le funzioni di due variabili.
70 - Lun. 6/11/00
Un polinomio omogeneo di secondo grado di due variabili [di k variabili] si dice una forma
quadratica in R2 [in Rk ].
Una forma quadratica si dice definita positiva [definita negativa] se è maggiore di zero
[minore di zero] tranne il caso in cui tutte le variabili sono nulle. Una forma quadratica
si dice indefinita se assume valori sia positivi sia negativi. Infine, una forma quadratica
si dice semidefinita positiva [negativa] se è sempre maggiore [minore] o uguale a zero.
Ovviamente, una forma quadratica definita (positiva o negativa) è anche semidefinita.
Esempi di forme quadratiche in R2 :
x2 + 2y 2 è definita positiva (e quindi anche semidefinita positiva);
x2 − y 2 è indefinita;
x2 − 2xy + y 2 = (x − y)2 è semidefinita positiva (ma non definita positiva).
76
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Studiamo, in generale, una forma quadratica del tipo
ax2 + 2bxy + cy 2 ,
dove a 6= 0. Osserviamo che se y = 0, la forma si annulla solo se x = 0. Non è pertanto
restrittivo supporre y 6= 0. In tal caso si ha
ax2 + 2bxy + cy 2 = y 2 [a (x/y)2 + 2b (x/y) + c ].
Il segno di ax2 + 2bxy + cy 2 dipende quindi dal segno del trinomio at2 + 2bt + c, ove si è
posto x/y = t. Si può quindi concludere che se il discriminante
∆ = 4(b2 − ac)
è negativo, allora il trinomio non si annulla mai e, di conseguenza, la forma quadratica è
definita (positiva o negativa, a seconda che il coefficiente a sia maggiore o minore di zero).
Se ∆ è positivo, allora il trinomio cambia segno, e la forma quadratica risulta indefinita.
Se, infine, ∆ = 0, allora la forma quadratica è semidefinita (ma non è definita, perché si
annulla nei punti della retta x/y = t0 , dove t0 è l’unica radice del trinomio at2 + 2bt + c).
Teorema. Sia f : U → R una funzione di classe C 2 in un aperto U di R2 . Supponiamo
che in un punto p0 ∈ U si annullino le due derivate parziali di f . Consideriamo la forma
quadratica
∂2f
∂2f
∂2f
2
(p
(p0 )k 2 .
(p
)h
)hk
+
+
2
d2 f (p0 )(h, k) =
0
0
∂x2
∂x∂y
∂y 2
Se d2 f (p0 )(h, k) è definita positiva, allora p0 è un punto di minimo relativo (per f ); se è
definita negativa, allora p0 è un punto di massimo relativo; se è indefinita, allora p0 non
è né di massimo né di minimo.
Dal suddetto teorema e dalle considerazioni fatte prima riguardo allo studio del segno di
una forma quadratica, segue la seguente
Regola pratica. Sia f : U → R una funzione di classe C 2 in un aperto U di R2 .
Supponiamo che in un punto p0 ∈ U si annullino le due derivate parziali di f . Se il
numero
³ ∂2f
´2
∂2f
∂2f
(p
(p
)
)
−
(p
,
)
Hf (p0 ) =
0
0
0
∂x2
∂y 2
∂x∂y
detto hessiano della f in p0 , è positivo, allora p0 è un punto estremante. Se è negativo,
p0 non è estremante. In particolare, nel caso che Hf (p0 ) sia positivo, p0 è di minimo o
di massimo a seconda che la derivata ∂ 2 f /∂x2 (p0 ) sia positiva o negativa.
Esempi ed esercizi relativi alla ricerca dei punti estremanti per le funzioni di due variabili.
77
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
71 - Mar. 7/11/00
Esercizi relativi alla ricerca dei punti estremanti per le funzioni di due variabili.
Consideriamo l’equazione x2 + y 2 − 1 = 0. Le sue soluzioni sono l’insieme di livello zero
f −1 (0) = {(x, y) : f (x, y) = 0}
della funzione di due variabili f (x, y) = x2 + y 2 − 1. Tale insieme, che rappresenta una
circonferenza (in R2 ) di centro l’origine e raggio uno, non può essere considerato il grafico
di una funzione reale di una variabile reale y = y(x). Il motivo è che per x ∈ (−1, 1)
esistono due valori di y con la proprietà che (x, y) ∈ f −1 (0), e non uno solo, come è
richiesto dalla definizione di funzione. Per la stessa ragione f −1 (0) non è neppure il
grafico di una funzione del tipo x = x(y). Osserviamo però che f −1 (0) ammette dei
sottoinsiemi che possono essere considerati dei grafici di funzioni continue. Ad esempio,
√
l’insieme definito dall’equazione y = 1 − x2 è un sottoinsieme di f −1 (0) e rappresenta
il grafico di una funzione continua e definita per x ∈ [−1, 1] (è addirittura C ∞ se la si
√
restringe all’intervallo aperto (−1, 1)). Si dice allora che y = 1 − x2 è una funzione
implicita definita dall’equazione x2 + y 2 − 1 = 0 (più precisamente si dovrebbe dire che
√
y = 1 − x2 è l’equazione del grafico di una funzione ma, visto che ogni funzione è
univocamente determinata dal suo grafico, non c’è pericolo di confondersi). Osserviamo
√
y 2 − 1 = 0. Altre
che anche la funzione y = − 1 − x2 è implicitamentepdefinita da x2 + p
due si ottengono ricavando x in funzione di y: x = 1 − y 2 e x = − 1 − y 2 . Quindi,
in un certo senso, si può dire che l’equazione x2 + y 2 − 1 = 0 definisce implicitamente
quattro funzioni continue: due che si ottengono ricavando la y in funzione della x e le
altre due ricavando la x in funzione della y. In realtà le funzioni implicite definite da
x2 + y 2 − 1 = 0 sono infinite, perché si dovrebbero considerare anche tutte le restrizioni
delle suddette quattro funzioni ai sottointervalli del loro dominio. Tuttavia le quattro
funzioni trovate sono le uniche massimali (continue); nel senso che non sono restrizioni
di altre funzioni implicite. Non sempre la situazione è cosı̀ semplice come nel suddetto
esempio. Non è detto infatti che, data un’equazione del tipo f (x, y) = 0, sia facile ricavare
esplicitamente una variabile in funzione dell’altra. Spesso, una volta accertata l’esistenza
di una funzione implicita, per ricavarla si dovrà ricorrere a metodi numerici, o accontentarsi
di trovarne la formula di Taylor di un dato ordine. Riguardo all’esistenza della funzione
implicita, riportiamo, senza dimostrazione, il seguente importante risultato attribuito al
matematico pisano Ulisse Dini (1845-1918):
Teorema (della funzione implicita in R2 ). Sia f : U → R una funzione di classe C n
(n ≥ 1) su un aperto U di R2 . Dato (x0 , y0 ) ∈ f −1 (0), supponiamo che la derivata parziale
∂f /∂y(x0 , y0 ) di f in (x0 , y0 ) sia diversa da zero. Allora f −1 (0), in un conveniente intorno
di (x0 , y0 ), è il grafico di una funzione reale di variabile reale di classe C n , y = y(x),
definita in un intorno del punto x0 ∈ R.
78
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Con riferimento al suddetto teorema, osserviamo che per x in un intorno J = (x0 −δ, x0 +δ)
di x0 si deve avere f (x, y(x)) = 0. Pertanto, derivando rispetto ad x si ottiene
∂f
∂f
(x, y(x)) +
(x, y(x)) y 0 (x) = 0 ,
∂x
∂y
∀x ∈ J .
In particolare si ha
y 0 (x0 ) = −
∂f /∂y (x0 , y0 )
.
∂f /∂y (x0 , y0 )
Osservazione. È ovvio che nel teorema della funzione implicita i ruoli di x e y possono essere scambiati. Pertanto, se si suppone che nel punto (x0 , y0 ) ∈ f −1 (0) si abbia
∂f /∂x (x0 , y0 ) 6= 0, allora f −1 (0), in un intorno di (x0 , y0 ), è il grafico di una funzione
reale di classe C n , x = x(y), definita in un intorno di y0 .
Esempi ed esercizi relativi al teorema della funzione implicita.
72 - Mar. 7/11/00
Consideriamo ora l’equazione f (x, y, z) = 0 definita dalla funzione
f (x, y, z) = x2 + y 2 + z 2 − 1 .
Questa definisce una superficie sferica di centro l’origine di R3 e raggio uno. L’insieme
di livello f −1 (0) non è il grafico di una funzione reale di due variabili reali z = z(x, y).
Tuttavia, se dall’equazione
x2 + y 2 + z 2 − 1 = 0
si ricava la z, si ottengono due funzioni reali (e continue) di due variabili:
p
p
z = 1 − x2 − y 2 e z = − 1 − x2 − y 2 ,
ciascuna delle quali è definita nel cerchio chiuso x2 + y 2 ≤ 1. Entrambe le funzioni hanno
il grafico che soddisfa l’equazione x2 + y 2 + z 2 − 1 = 0, ossia contenuto nell’insieme di
livello f −1 (0). Altre due funzioni si ottengono ricavando la y, e altre due ricavando la x.
L’insieme f −1 (0) contiene quindi il grafico di sei funzioni (continue) reali di due variabili
reali (che rappresentano le funzioni implicite massimali definite da x2 + y 2 + z 2 − 1 = 0).
In generale, data un’equazione del tipo f (x, y, z) = 0, non è sempre cosı̀ facile ricavare
esplicitamente una variabile in funzione delle altre due. Una volta accertata l’esistenza di
una funzione implicita, per calcolarla si dovrà ricorrere a metodi numerici. Un risultato
che ci assicura l’esistenza di tale funzione è costituito dalla seguente versione in R3 del
Teorema di Dini:
79
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Teorema (della funzione implicita in R3 ). Sia f : U → R una funzione di classe C n
(n ≥ 1) su un aperto U di R3 e sia (x0 , y0 , z0 ) ∈ f −1 (0). Se ∂f /∂z(x0 , y0 , z0 ) 6= 0, allora,
in un conveniente intorno di (x0 , y0 , z0 ), f −1 (0) è il grafico di una funzione (implicita)
z = z(x, y) di classe C n in un intorno del punto (x0 , y0 ) ∈ R2 .
È ovvio che nel suddetto teorema il ruolo della variabile z potrà essere assunto da una
qualunque delle altre variabili. Se, ad esempio, si suppone che in un punto (x0 , y0 , z0 ) ∈
f −1 (0) si abbia ∂f /∂x (x0 , y0 , z0 ) 6= 0, allora, in un intorno di tale punto, f −1 (0) è il grafico
di una funzione x = x(y, z) di classe C n . Dovrà essere quindi verificata la condizione
f (x(y, z), y, z) = 0 per ogni (y, z) in un intorno di (y0 , z0 ).
Esempi ed esercizi relativi al teorema della funzione implicita.
73 - Mer. 8/11/00
Una partizione di un rettangolo R = [a, b] × [c, d] ⊂ R2 è una coppia p = (p1 , p2 ) di
partizioni degli intervalli [a, b] e [c, d], rispettivamente.
Date due partizioni, p1 = {x0 , x1 , . . . xn } di [a, b] e p2 = {y0 , y1 , . . . ym } di [c, d], il
rettangolo R viene suddiviso in nm sottorettangoli
Rij = [xi−1 , xi ] × [yj−1 , yj ] ,
i = 1, . . . , n ,
j = 1, . . . , m ,
di area µ(Rij ) = (xi − xi−1 )(yj − yj−1 ). In ogni sottorettangolo Rij scegliamo un punto
cij . L’insieme s dei punti cij si dice una scelta di punti nella partizione p = (p1 , p2 ) di
R. Ogni rettangolo Rij della partizione col punto cij scelto si dice un rettangolo puntato.
La coppia α = (p, s), costituita dalla partizione p = (p1 , p2 ) di R e dalla scelta s, si dice
una partizione puntata di R. Il parametro di finezza di α = (p, s), denotato con |α|, è la
massima ampiezza dei lati di tutti i possibili rettangoli individuati dalla partizione p.
Sia ora assegnata una funzione f : [a, b] × [c, d] → R. Ad ogni partizione puntata α = (p, s)
di R = [a, b] × [c, d] possiamo associare il numero
X
Sf (α) =
f (cij )µ(Rij ) ,
i=1,...,n
j=1,...,m
dove, ricordiamo, µ(Rij ) denotano le aree dei sottorettangoli Rij individuati dalla partizione. Si ha cosı̀ una funzione reale Sf : P → R definita nell’insieme P delle partizioni
puntate del rettangolo R.
Intuitivamente l’integrale doppio (secondo Cauchy) in R della funzione f (x, y) è, quando
esiste, il valore limite che si ottiene facendo tendere a zero i lati dei sottorettangoli individuati dalle possibili partizioni puntate di R. Diremo infatti che il numero I è l’integrale
80
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
doppio di f in R se, fissato un “errore” ² > 0, esiste un δ > 0 tale che, comunque si assegni
una partizione puntata α con parametro di finezza |α| minore di δ, la somma Sf (α) sopra
definita dista da I meno di ². Se ciò accade, si scrive
lim Sf (α) = I
|α|→0
e la funzione f si dice integrabile (in R) secondo Cauchy. Il numero I si chiama “integrale
(doppio)” di f (x, y) in R e si denota con uno dei seguenti simboli:
Z
ZZ
ZZ
Z
f,
f (x, y) dxdy ,
f,
f (x, y) dxdy .
R
R
R
R
Un sottoinsieme di R2 si dice trascurabile (in R2 ) se per ogni ² > 0 può essere ricoperto
con una famiglia (al più) numerabile di rettangoli di area totale minore o uguale ad ². Si
potrebbe dimostrare che il grafico (y = g(x) o x = g(y)) di una funzione continua è un
insieme trascurabile di R2 .
Analogamente a quanto si è visto per gli integrali semplici, una funzione f (x, y) è integrabile in un rettangolo R se e solo se è limitata e l’insieme dei suoi punti di discontinuità è
trascurabile.
Il seguente risultato riconduce il calcolo di un integrale doppio a due successive integrazioni
semplici:
Teorema di Fubini (per gli integrali doppi). Sia f (x, y) una funzione reale definita in
un rettangolo R = [a, b] × [c, d]. Allora, quando ha senso, risulta
¶
ZZ
Z d µZ b
f (x, y) dxdy =
f (x, y) dx dy
R
· ZZ
f (x, y) dxdy =
R
c
Z b µZ
a
a
d
¶
f (x, y) dy dx
c
¸
.
In sostanza, il Teorema di Fubini afferma che per calcolare l’integrale doppio di f (x, y) in
[a, b] × [c, d] è possibile integrare prima in [a, b] la funzione f (x, y) rispetto alla variabile
x, ottenendo cosı̀ una funzione
Z b
g(y) =
f (x, y)dx ,
a
ed integrare poi g(y) nell’intervallo [c, d].
Per convenzione, in un integrale, un’espressione del tipo g(y) dy si potrà scrivere anche
dy g(y). Tenendo conto di ciò, l’uguaglianza del Teorema di Fubini, si potrà esprimere nel
81
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
modo seguente:
ZZ
f (x, y) dxdy =
R
Z
d
dy
c
Z
b
f (x, y) dx .
a
74 - Mer. 8/11/00
Esempi ed esercizi relativi agli integrali doppi nei rettangoli.
Dato un insieme A di R2 e data f : A → R, la funzione fˆ: R2 → R definita da
½
f (x, y) se (x, y) ∈ A
ˆ
f (x, y) =
0
se (x, y) ∈
/A
si chiama estensione standard di f .
Sia f (x, y) una funzione di due variabili definita in un sottoinsieme limitato A di R2 .
Consideriamo un (arbitrario) rettangolo R contenente A. Diremo che f è integrabile in
A se è integrabile in R la sua estensione standard fˆ. In tal caso l’integrale di f in A si
definisce nel modo seguente:
ZZ
ZZ
f (x, y) dxdy :=
fˆ(x, y) dxdy .
A
R
Dal fatto che fˆ è nulla fuori da A si potrebbe dedurre che il secondo integrale non dipende
dal rettangolo R contenente A. Pertanto, la suddetta definizione è ben posta.
Teorema (di additività rispetto all’insieme di integrazione). Supponiamo che una funzione
f (x, y) sia integrabile sia in un insieme A che in un insieme B, con A ∩ B = ∅. Allora f
è integrabile in A ∪ B e
ZZ
ZZ
ZZ
f (x, y) dxdy .
f (x, y) dxdy +
f (x, y) dxdy =
A∪B
A
B
Esempi ed esercizi relativi agli integrali doppi negli insiemi limitati di R2 .
75 - Gio. 9/11/00
Sia A ⊂ R2 un insieme del tipo
A = {(x, y) : a ≤ x ≤ b, ϕ1 (x) ≤ y ≤ ϕ2 (x)} ,
dove ϕ1 , ϕ2 : [a, b] → R sono due funzioni continue. Si dice che A presenta il caso semplice
rispetto all’asse y perché ogni retta parallela a tale asse lo interseca in un intervallo (di
estremi ϕ1 (x) e ϕ2 (x), per x ∈ [a, b]). Supponiamo che f (x, y) sia una funzione integrabile
82
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
in A. Dato un rettangolo R = [a, b] × [c, d] contenente A, per definizione, l’integrale di f
in A è
ZZ
fˆ(x, y) dxdy .
R
Dal Teorema di Fubini si ha
ZZ
Z
fˆ(x, y) dxdy =
R
D’altra parte
Z d
Z
ˆ
f (x, y) dy =
c
ϕ1 (x)
fˆ(x, y) dy +
c
b
dx
a
Z
Z
ϕ2 (x)
d
fˆ(x, y) dy .
c
fˆ(x, y) dy +
ϕ1 (x)
Z
d
fˆ(x, y) dy ,
ϕ2 (x)
e tenendo conto che fˆ è nulla fuori da A si ottiene
Z d
Z ϕ2 (x)
ˆ
f (x, y) dy =
fˆ(x, y) dy .
c
ϕ1 (x)
Poiché in A le due funzioni f ed fˆ coincidono, si ha
Z ϕ2 (x)
Z d
ˆ
f (x, y) dy =
f (x, y) dy .
ϕ1 (x)
c
Si ottiene cosı̀ la seguente importante formula di riduzione, valida per gli insiemi che
presentano il caso semplice rispetto all’asse y:
ZZ
Z b Z ϕ2 (x)
dx
f (x, y) dxdy =
f (x, y) dy .
A
ϕ1 (x)
a
Analogamente, se A ⊂ R2 è un insieme del tipo
A = {(x, y) : c ≤ y ≤ d, ψ1 (y) ≤ x ≤ ψ2 (y)} ,
dove ψ1 , ψ2 : [c, d] → R sono due funzioni continue, ed f (x, y) è integrabile in A, si ha l’altra
formula di riduzione, valida quando A presenta il caso semplice rispetto all’asse x:
ZZ
Z d Z ψ2 (y)
f (x, y) dxdy =
dy
f (x, y) dx .
A
c
ψ1 (y)
Definizione. Un sottoinsieme limitato A di R2 si dice misurabile (secondo Peano-Jordan)
quando è integrabile in A la funzione f (x, y) ≡ 1. In tal caso la misura (bidimensionale)
di A, detta anche area, è il numero
ZZ
µ(A) =
dxdy .
A
83
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Purtroppo, non tutti i sottoinsiemi limitati del piano sono misurabili. Si consideri, ad
esempio, l’insieme A dei punti di R2 con coordinate razionali comprese tra 0 e 1. Ossia
A = {(x, y) ∈ [0, 1] × [0, 1] : x ∈ Q, y ∈ Q} .
Si potrebbe provare che la funzione fˆ che vale 1 in A e 0 nel complementare di A è
discontinua in tutti i punti dell’intero quadrato Q = [0, 1] × [0, 1], che ovviamente non è
trascurabile. Pertanto fˆ non è integrabile e, di conseguenza, A non è misurabile.
Sia A un sottoinsieme limitato di R2 . Consideriamo la cosiddetta funzione caratteristica
di A. Ossia la funzione fˆ: R2 → R che vale 1 in A e 0 fuori di A. Non è difficile verificare
che l’insieme dei punti di discontinuità di fˆ coincide con ∂A. Si può pertanto concludere
che A è misurabile se e solo se la sua frontiera è trascurabile. Ad esempio, è misurabile
ogni insieme limitato la cui frontiera è unione finita di grafici (y = g(x) o x = g(y)) di
funzioni continue e definite in intervalli.
Esercizi sull’inversione dell’ordine d’integrazione.
Calcolo dell’area di un’ellisse.
Esercizi consigliati [Spiegel, cap. 9]: 1, 8.
76 - Gio. 9/11/00
Una partizione di un parallelepipedo
Q = [a1 , b1 ] × [a2 , b2 ] × [a3 , b3 ] ⊂ R3
è una terna p = (p1 , p2 , p3 ) di partizioni degli intervalli [a1 , b1 ], [a2 , b2 ] e [a3 , b3 ],
rispettivamente.
Date tre partizioni, p1 = {x0 , x1 , . . . xn1 } di [a1 , b1 ], p2 = {y0 , y1 , . . . yn2 } di [a2 , b2 ]
e p3 = {z0 , z1 , . . . zn3 } di [a3 , b3 ], il parallelepipedo Q viene suddiviso in n1 n2 n3
sottoparallelepipedi
Qijk = [xi−1 , xi ] × [yj−1 , yj ] × [zk−1 , zk ]
di volume µ(Qijk ) = (xi −xi−1 )(yj −yj−1 )(zj −zj−1 ). In ogni parallelepipedo Qijk scegliamo
un punto cijk . L’insieme s dei punti cijk si dice una scelta di punti nella partizione p =
(p1 , p2 , p3 ) di Q. Ogni parallelepipedo Qijk della partizione col punto cijk scelto si dice un
parallelepipedo puntato. La coppia α = (p, s), costituita dalla partizione p = (p1 , p2 , p3 )
di Q e dalla scelta s, si dice una partizione puntata di Q. Il parametro di finezza di α =
(p, s), denotato con |α|, è la massima ampiezza dei lati di tutti i possibili parallelepipedi
individuati dalla partizione p.
84
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Sia f (x, y, z) una funzione definita in Q. Ad ogni partizione puntata α = (p, s) di Q
possiamo associare il numero
X
Sf (α) =
f (cijk )µ(Qijk ) ,
(i,j,k)∈K
dove la terna di indici (i, j, k) varia nell’insieme
©
ª
K = (i, j, k) ∈ N3 : 1 ≤ i ≤ n1 , 1 ≤ j ≤ n2 , 1 ≤ k ≤ n3 .
Intuitivamente l’integrale triplo (secondo Cauchy) in Q della funzione f è, quando esiste, il
valore limite che si ottiene facendo tendere a zero i lati dei sottoparallelepipedi individuati
dalle possibili partizioni puntate di Q. Diremo infatti che il numero I è l’integrale triplo
di f in Q se, fissato un “errore” ² > 0, esiste un δ > 0 tale che, comunque si assegni
una partizione puntata α con parametro di finezza |α| minore di δ, la somma Sf (α) sopra
definita dista da I meno di ². Se ciò accade, si scrive
lim Sf (α) = I
|α|→0
e la funzione f si dice integrabile (in Q) secondo Cauchy. Il numero I si chiama “integrale
(triplo)” di f (x, y, z) in Q e si denota con uno dei seguenti simboli:
Z
ZZZ
ZZZ
Z
f,
f (x, y, z) dxdydz ,
f,
f (x, y, z) dxdydz .
Q
Q
Q
Q
Un sottoinsieme di R3 si dice trascurabile (in R3 ) se per ogni ² > 0 può essere ricoperto con
una famiglia (al più) numerabile di parallelepipedi di volume totale minore o uguale ad ².
Si potrebbe dimostrare che il grafico di una funzione continua di due variabili (z = g(x, y),
o x = g(y, z), o y = g(z, x)) è un insieme trascurabile di R3 .
Analogamente a quanto si è visto per gli integrali semplici e doppi, una funzione f (x, y, z)
è integrabile in un parallelepipedo Q se e solo se è limitata e l’insieme dei suoi punti di
discontinuità è trascurabile.
Il seguente risultato riconduce il calcolo di un integrale triplo a due successive integrazioni:
una semplice seguita da una doppia, o una doppia seguita da una semplice.
Teorema di Fubini (per gli integrali tripli). Sia f (x, y, z) una funzione reale definita in
un parallelepipedo Q = [a1 , b1 ] × [a2 , b2 ] × [a3 , b3 ]. Allora, quando ha senso, risulta
ZZZ
f (x, y, z) dxdydz =
Q
ZZ
dxdy
R
Z
b3
f (x, y, z) dz ,
a3
85
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
ZZZ
f (x, y, z) dxdydz =
Q
Z
b3
dz
a3
ZZ
f (x, y, z) dxdy ,
R
dove R denota il rettangolo [a1 , b1 ] × [a2 , b2 ] nel piano xy.
La prima formula del Teorema di Fubini afferma che per calcolare l’integrale triplo di
f (x, y, z) in Q è possibile integrare prima in [a3 , b3 ] la funzione f (x, y, z) rispetto alla
variabile z, ottenendo cosı̀ una funzione
Z b3
g(x, y) =
f (x, y, z)dz ,
a3
ed integrare poi g(x, y) nel rettangolo [a1 , b1 ] × [a2 , b2 ].
La seconda formula afferma che si ottiene lo stesso risultato facendo prima l’integrale
doppio in R = [a1 , b1 ] × [a2 , b2 ] della funzione f (x, y, z) rispetto alle variabili x ed y,
ottenendo cosı̀ una funzione
Z
h(z) =
f (x, y, z)dxdy ,
R
ed integrando poi h(z) nell’intervallo [a3 , b3 ].
Ovviamente, nel Teorema di Fubini in R3 i ruoli delle variabili x, y e z possono essere
permutati, ottenendo altre quattro formule di riduzione. In tutto sono sei formule: due se
l’integrale semplice è rispetto a z (come nell’enunciato), due se è rispetto ad y e due se è
rispetto ad x.
Dato un insieme A di R3 e data f : A → R, la funzione fˆ: R3 → R definita da
½
f (x, y, z) se (x, y, z) ∈ A
fˆ(x, y, z) =
0
se (x, y, z) ∈
/A
si chiama estensione standard di f .
Sia f (x, y, z) una funzione di tre variabili definita in un sottoinsieme limitato A di R3 .
Consideriamo un (arbitrario) parallelepipedo Q contenente A. Diremo che f è integrabile
in A se è integrabile in Q la sua estensione standard fˆ. In tal caso l’integrale di f in A si
definisce nel modo seguente:
ZZZ
ZZZ
f (x, y, z) dxdydz :=
fˆ(x, y, z) dxdydz .
A
R
Dal fatto che fˆ è nulla fuori da A si può dedurre che il secondo integrale non dipende dal
parallelepipedo Q contenente A. Pertanto, la suddetta definizione è ben posta.
Teorema (di additività rispetto all’insieme di integrazione). Supponiamo che una funzione
f (x, y, z) sia integrabile sia in un insieme A1 che in un insieme A2 , con A1 ∩ A2 = ∅.
86
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Allora f è integrabile in A = A1 ∪ A2 e
ZZZ
ZZZ
ZZZ
f (x, y, z) dxdydz =
f (x, y, z) dxdydz +
A
A1
f (x, y, z) dxdydz .
A2
Sia A ⊂ R3 un insieme del tipo
A = {(x, y, z) : (x, y) ∈ B, ϕ1 (x, y) ≤ z ≤ ϕ2 (x, y)} ,
dove ϕ1 , ϕ2 : B → R sono due funzioni continue definite in un sottoinsieme compatto B di
R2 . Si dice che A presenta il caso semplice rispetto all’asse z perché ogni retta parallela
a tale asse lo interseca in un intervallo (di estremi ϕ1 (x, y) e ϕ2 (x, y), per (x, y) ∈ B).
Supponiamo che f (x, y, z) sia una funzione integrabile in A. Per definizione, dato un
parallelepipedo Q = [a1 , b1 ] × [a2 , b2 ] × [a3 , b3 ] contenente A, l’integrale di f in A è
ZZZ
fˆ(x, y, z) dxdydz .
Q
Dal Teorema di Fubini si ha
ZZZ
ZZ
Z
ˆ
f (x, y, z) dxdydz =
dxdy
Q
R
b3
fˆ(x, y, z) dz ,
a3
dove R = [a1 , b1 ] × [a2 , b2 ]. Ossia,
ZZZ
ZZ
f (x, y, z) dxdydz =
g(x, y) dxdy ,
A
R
dove g: R → R è la funzione definita da
g(x, y) =
Z
b3
fˆ(x, y, z) dz .
a3
Osserviamo ora che, per la definizione di fˆ, la funzione g(x, y) è nulla se (x, y) ∈
/ B. Di
conseguenza,
ZZ
ZZ
ZZ
ZZ
g(x, y) dxdy =
g(x, y) dxdy +
g(x, y) dxdy =
g(x, y) dxdy .
R
B
R\B
B
Tenendo conto che, dato (x, y) ∈ B, la funzione fˆ è nulla se z non appartiene all’intervallo
[ϕ1 (x, y), ϕ2 (x, y)], per (x, y) ∈ B si ha
g(x, y) =
Z
b3
a3
fˆ(x, y, z) dz =
Z
ϕ2 (x,y)
ϕ1 (x,y)
fˆ(x, y, z) dz =
Z
ϕ2 (x,y)
f (x, y, z) dz .
ϕ1 (x,y)
87
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Si ottiene cosı̀ la seguente importante formula di riduzione, detta anche formula degli
spaghetti (paralleli all’asse z), valida per gli insiemi che presentano il caso semplice
rispetto all’asse z:
Z ϕ2 (x,y)
ZZ
ZZZ
dxdy
f (x, y, z) dxdydz =
f (x, y, z) dz ,
B
A
ϕ1 (x,y)
dove B è la proiezione ortogonale di A sul piano xy e ϕ1 , ϕ2 : B → R sono due funzioni i
cui grafici delimitano A.
Ovviamente si hanno altre due formule degli spaghetti: una con spaghetti paralleli all’asse
x e l’altra con spaghetti paralleli all’asse y. I dettagli sono lasciati allo studente.
Il Teorema di Fubini in R3 ci dice che per calcolare un integrale triplo si può eseguire prima
un integrale doppio e poi un integrale semplice. Da tale teorema si deduce un’altra formula
di riduzione per il calcolo di un integrale triplo in un insieme limitato A: la formula delle
fette. Anche in questo caso, in realtà, si avranno tre formule, a seconda che le fette siano
perpendicolari all’asse z, all’asse x o all’asse y.
Riportiamo la formula delle fette perpendicolari all’asse z. Il compito di scrivere le altre
due formule è lasciato per esercizio allo studente.
Sia f (x, y, z) una funzione integrabile in un insieme limitato A ⊂ R3 . Fissato z ∈ R,
denotiamo con
©
ª
Az = (x, y) ∈ R2 : (x, y, z) ∈ A
la “fetta” (eventualmente vuota) che si ottiene “tagliando” A col piano perpendicolare
all’asse z e passante per il punto (0, 0, z). Sia [a, b] un intervallo contenente la proiezione
ortogonale di A sull’asse z. Allora vale la seguente formula delle fette :
Z b ZZ
ZZZ
f (x, y, z) dxdy .
dz
f (x, y, z) dxdydz =
A
a
Az
Definizione. Un sottoinsieme limitato A di R3 si dice misurabile (secondo Mengoli Cauchy - Riemann) quando è integrabile in A la funzione f (x, y, z) ≡ 1. In tal caso, la
misura (tridimensionale) di A, detta anche volume, è il numero
ZZZ
µ(A) =
dxdydz .
A
Esercizio: calcolo del volume di una sfera col metodo delle fette.
77 - Lun. 13/11/00
Esercizio: calcolo del volume di una sfera col metodo degli spaghetti.
88
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Dimostrazione della formula delle fette. Siano, rispettivamente, [a, b] ed R un intervallo
nell’asse z e un rettangolo nel piano xy in modo che il parallelepipedo Q = [a, b] × R
contenga A. Per definizione, si ha
ZZZ
ZZZ
f (x, y, z) dxdydz =
fˆ(x, y, z) dxdydz ,
A
Q
e per il Teorema di Fubini risulta
ZZZ
f (x, y, z) dxdydz =
A
Z
b
dz
a
ZZ
fˆ(x, y, z) dxdy .
R
Poiché, fissato z ∈ [a, b], la funzione fˆ(x, y, z) è nulla fuori da Az , si ottiene
ZZ
ZZ
ˆ
f (x, y, z) dxdy =
f (x, y, z) dxdy .
R
Pertanto
ZZZ
Az
f (x, y, z) dxdydz =
A
Z
b
dz
a
ZZ
f (x, y, z) dxdy .
Az
78 - Lun. 13/11/00
Dalla definizione di integrale doppio discende immediatamente la seguente
Proprietà di monotonia. Se in un insieme limitato A ⊂ R2 si ha f (x, y) ≤ g(x, y),
allora (quando ha senso) risulta
ZZ
ZZ
g(x, y)dxdy .
f (x, y)dxdy ≤
A
A
È ovvio che un’analoga proprietà di monotonia vale anche per gli integrali tripli. Allo
studente si lascia il compito di formularne l’enunciato.
Primo teorema della media per gli integrali doppi. Sia f : A → R una funzione
integrabile in un insieme limitato A ⊂ R2 di misura positiva. Allora la media di f in A,
ossia
ZZ
1
f (x, y)dxdy ,
µ(A) A
è un numero compreso tra l’estremo inferiore e l’estremo superiore di f . In particolare,
se f è continua ed A è connesso, allora (per il Secondo Teorema di Weierstrass) esiste un
punto p ∈ A per il quale si ha
ZZ
f (x, y)dxdy = f (p)µ(A) .
A
89
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Secondo teorema della media per gli integrali doppi. Siano f, g: A → R due
funzioni integrabili in un insieme limitato A ⊂ R2 . Supponiamo che g(x, y) non cambi
segno in A. Allora (quando ha senso) la media ponderata di f in A (con peso g), ossia
RR
(x, y)g(x, y)dxdy
Af
RR
,
A g(x, y)dxdy
è un numero compreso tra l’estremo inferiore e l’estremo superiore di f . Inoltre, se f è
continua ed A è connesso, esiste un punto p ∈ A per il quale si ha
ZZ
ZZ
f (x, y)g(x, y)dxdy = f (p)
g(x, y)dxdy ,
A
A
incluso il caso in cui l’integrale di g sia zero.
Ovviamente, esistono versioni del primo e del secondo teorema della media anche per gli
integrali tripli. Alle studente il compito di formularne gli enunciati.
Cenni sugli integrali in R4 e calcolo della misura di una sfera (piena) a quattro dimensioni
(col metodo delle fette).
Esercizi consigliati [Spiegel, cap. 9]: 9, 10, 12, 13, 14.
79 - Mar. 14/11/00
Dato un sottoinsieme limitato e misurabile A ⊂ R2 , il suo baricentro geometrico è il punto
(xc , yc ) che ha per ascissa la media delle ascisse e per ordinata le media delle ordinate. Si
ha pertanto
ZZ
ZZ
1
1
xdxdy e yc =
ydxdy .
xc =
µ(A) A
µ(A) A
Si osservi che dal primo teorema della media segue
inf
(x,y)∈A
x ≤ xc ≤ sup x
(x,y)∈A
e
inf
(x,y)∈A
y ≤ yc ≤ sup y .
(x,y)∈A
Esercizi sul calcolo di alcuni baricentri: baricentro di un triangolo, baricentro di un
semicerchio, baricentro di un cerchio forato.
La definizione di baricentro geometrico di un solido è analoga a quella che abbiamo dato
per un sottoinsieme di R2 : dato un sottoinsieme limitato e misurabile A ⊂ R3 il suo
baricentro è quel punto le cui coordinate sono la media in A delle corrispondenti funzioni
coordinate.
Il baricentro fisico di un solido (non necessariamente omogeneo) A ⊂ R3 (o di una piastra
A ⊂ R2 ) è quel punto le cui coordinate (xg , yg , zg ) si ottengono facendo la media ponderata
90
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
delle funzioni coordinate omologhe mediante la densità di massa δ(p). Ad esempio, la
prima coordinata è data da
ZZZ
ZZZ
1
1
xδ(x, y, z) dxdydz =
x dm ,
xg =
m
m
A
A
dove dm = δ(x, y, z)dxdydz = δ(p)dv si chiama elemento di massa e
ZZZ
ZZZ
m=
δ(p)dv =
dm
A
A
è la massa di A (dv = dxdydz si dice elemento di volume).
Esercizio. Verificare che per i solidi omogenei il baricentro fisico coincide con quello
geometrico.
Sia A ⊂ R2 una piastra (non necessariamente omogenea) di massa m. Fissato un punto
p0 = (x0 , y0 ) ∈ R2 , il momento d’inerzia di A rispetto a p0 (o, equivalentemente, rispetto
ad una retta passante per p0 e perpendicolare al piano) è il numero
ZZ
I=
d(p, p0 )2 dm ,
A
dove d(p, p0 ) denota la distanza di un generico punto p = (x, y) ∈ A da p0 = (x0 , y0 )
e dm rappresenta l’elemento di massa, ossia il prodotto della densità (superficiale) δ(p)
per l’elemento di area dσ = dxdy. Nel caso che la piastra sia omogenea, la densità è la
costante δ = m/µ(A).
Sia A ⊂ R3 un solido (non necessariamente omogeneo) di massa m. Fissata una retta α,
il momento d’inerzia di A rispetto ad α è il numero
ZZZ
I=
d(p, α)2 dm ,
A
dove d(p, α) denota la distanza di un generico punto p = (x, y, z) ∈ A dalla retta α e
dm rappresenta l’elemento di massa, ossia il prodotto della densità δ(p) per l’elemento di
volume dv = dxdydz.
80 - Mar. 14/11/00
Dati due numeri naturali m ed n, una matrice (reale) n × m è un insieme A = {aij } di
nm numeri reali, dove gli indici i e j verificano le seguenti condizioni: i ∈ {1, 2, . . . , n},
j ∈ {1, 2, . . . , m}. Una matrice n×m si dice anche matrice di n righe e m colonne. L’indice
i rappresenta la riga alla quale appartiene l’elemento aij e l’indice j rappresenta la colonna.
91
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Dal punto di vista grafico si conviene di rappresentare una matrice A nel seguente modo:


a11 a12 . . . a1m


 a21 a22 . . . a2m 
A=
.. 
 ..

. 
 .
an1 an2 . . . anm
Se n = m, la matrice si dice quadrata, e in questo caso è ben definito un numero, detto
determinante della matrice. Ci sono varie definizioni equivalenti di determinante. Noi
daremo quella induttiva.
Prima di procedere è bene introdurre alcune notazioni. Data una matrice (non necessariamente quadrata) A e dato un elemento aij di A, se da A si cancella la riga e la colonna
che contengono detto elemento, si ottiene una sottomatrice di A che denoteremo con Aij .
Osserviamo che se A è una matrice n × m, una sottomatrice ottenuta in tal modo è del
tipo (n − 1) × (m − 1). Un elemento aij di una matrice A si dice di posto pari se i + j è
pari e di posto dispari in caso contrario.
Il determinante det A di una matrice quadrata A = {aij } del tipo n × n è il numero a11
se n = 1 ed è il numero
a11 det A11 − a12 det A12 + . . . + (−1)1+n a1n det A1n
se n > 1. In altre parole, se n = 1 il determinante di A è l’unico elemento che compone la
matrice, e se n > 1 si calcola facendo la somma a segni alterni del prodotto del generico
elemento della prima riga per il determinante della sottomatrice che si ottiene cancellando, altre alla prima riga, la colonna corrispondente a tale elemento. Il segno dipende
dall’elemento considerato: è 1 se l’elemento è di posto pari ed è −1 se è di posto dispari.
È noto che il determinante di A si può calcolare eseguendo lo sviluppo, invece che rispetto
alla prima riga, rispetto ad una qualunque altra riga o colonna.
Il determinante di una matrice quadrata gode di varie proprietà che saranno oggetto di
studio nel corso di Geometria. Le due seguenti sono tra le più importanti:
– se si invertono tra loro due righe o due colonne della matrice, il determinante cambia
segno;
– se si moltiplica una riga o una colonna della matrice per una costante, il determinante
viene moltiplicato per tale costante.
Sia f : U → Rs un’applicazione di classe C 1 definita su un aperto U di Rk . Denotiamo con
f1 , f2 , . . . , fs le s funzioni reali che compongono la f (ricordiamo che sono funzioni reali
92
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
di k variabili reali). Fissato un punto p0 ∈ U , la matrice
 ∂f
∂f1
∂f1
1
· · · ∂x
∂x2
k
 ∂x1

 ∂f2 ∂f2
∂f2

 ∂x1 ∂x2 · · · ∂xk

f 0 (p0 ) = 
 .
..
 ..
.



∂fs
∂fs
∂fs
· · · ∂x
∂x1
∂x2
k













p0
si chiama matrice jacobiana dell’applicazione f in p0 (il simbolo p0 in basso a destra
significa che tutti gli elementi della matrice si considerano calcolati nel punto p0 ).
Quando k = s, la matrice f 0 (p0 ) è quadrata, e in questo caso ha senso il suo determinante,
det f 0 (p0 ), chiamato jacobiano dell’applicazione f in p0 .
81 - Mer. 15/11/00
Altre notazioni per indicare una matrice jacobiana (o una sottomatrice di una matrice
jacobiana):
∂(x, y)
∂(x, z)
∂(x, y, z)
,
,
, ecc.
∂(u, v)
∂(u, v)
∂u
Teorema (di cambiamento di variabile per gli integrali doppi).
Sia ϕ(u, v) =
2
(ϕ1 (u, v), ϕ2 (u, v)) un’applicazione continua da un compatto A ⊂ R in R2 . Supponiamo che A e ϕ(A) siano misurabili e che ϕ sia C 1 e iniettiva nell’interno Å di A. Allora,
data una funzione f (x, y) continua su ϕ(A), risulta
ZZ
ZZ
¯
¯
f (x, y) dxdy =
f (ϕ1 (u, v), ϕ2 (u, v)) ¯det ϕ0 (u, v)¯ dudv .
ϕ(A)
A
Coordinate polari.
Momento d’inerzia di un disco (omogeneo) di massa m e raggio r: I = 21 mr2 .
Esercizi sugli integrali doppi.
Coordinate ellittiche.
Cenni sugli integrali impropri su R2 .
Calcolo di
ZZ
e−(x
2 +y 2 )
dxdy = π
R2
93
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
82 - Mer. 15/11/00
Calcolo del momento d’inerzia di una sfera (col metodo delle fette).
Teorema di Pappo (per i solidi di rotazione). Sia A un insieme misurabile interamente
contenuto in un semipiano delimitato da una retta λ. Il volume del solido generato dalla
rotazione di A di un angolo θ ∈ (0, 2π] intorno alla retta λ è dato dal prodotto dell’area di
A per la lunghezza dell’arco di circonferenza percorso dal baricentro di A.
Giustificazione geometrica del Teorema di Pappo per i solidi di rotazione.
Esercizi basati sul Teorema di Pappo: calcolo del baricentro di un semicerchio (conoscendo
l’area di un cerchio e il volume di una sfera); volume di un cono; volume di un toro solido.
83 - Gio. 16/11/00
Teorema (di cambiamento di variabile per gli integrali tripli). Sia
ϕ(u, v, w) = (ϕ1 (u, v, w), ϕ2 (u, v, w), ϕ2 (u, v, w))
un’applicazione continua da un compatto A di R3 in R3 . Supponiamo che A e ϕ(A) siano
misurabili e che ϕ sia C 1 e iniettiva nell’interno Å di A. Allora, data una funzione
f (x, y, z) continua su ϕ(A), risulta
ZZZ
f (x, y, z) dxdydz =
ZZZ
ϕ(A)
A
¯
¯
f (ϕ1 (u, v, w), ϕ2 (u, v, w), ϕ3 (u, v, w)) ¯det ϕ0 (u, v, w)¯ dudvdw .
Interpretazione geometrica dell’elemento di area in coordinate polari.
Coordinate cilindriche nello spazio e relativo elemento di volume.
Coordinate sferiche e relativo elemento di volume.
Interpretazione geometrica dell’elemento di volume in coordinate cilindriche e sferiche.
Esercizio. Calcolo del volume di una sfera (solida) in coordinate sferiche.
Esercizio. Calcolo del momento d’inerzia (rispetto ad un asse passante per il centro) di
una sfera (solida) omogenea.
84 - Gio. 16/11/00
Ricordiamo che una curva parametrica in R2 [in R3 ] è una funzione continua γ(t) da un
intervallo compatto [a, b] a valori in R2 [in R3 ]. I punti γ(a) e γ(b) si dicono estremi della
94
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
curva. La curva γ(t) si dice chiusa se i suoi estremi coincidono (ossia, se γ(a) = γ(b)). Se
la curva γ(t) non è chiusa, allora si dice che è un arco di curva parametrica.
Un arco di curva γ da [a, b] in R2 (o in R3 ) si dice semplice se la funzione γ è iniettiva
in [a, b]. Se γ è una curva chiusa, diremo che è semplice se è iniettiva la sua restrizione
all’intervallo aperto (a, b). Ovviamente, in questo caso, essendo γ(a) = γ(b), la funzione
γ non è iniettiva nell’intervallo chiuso [a, b].
Una curva γ(t) in R2 [in R3 ] avrà due [tre] funzioni componenti: γ1 (t) e γ2 (t) [γ1 (t), γ2 (t)
e γ3 (t)], che talvolta vengono denotate x(t) e y(t) [x(t), y(t) e z(t)]. Diremo che γ(t) è C n
se sono C n tutte le sue funzioni componenti.
Le equazioni x = γ1 (t) e y = γ2 (t) di una curva γ(t) = (γ1 (t), γ2 (t)) si chiamano equazioni
parametriche (o equazioni del grafico) della curva γ(t). Chiaramente, se la curva è a valori
in R3 , le sue equazioni parametriche sono tre.
La derivata in un punto t0 di una curva parametrica è, quando esiste, il limite per t → t0
del rapporto incrementale
γ(t) − γ(t0 )
.
t − t0
Ovviamente, tale rapporto ha senso perché è il prodotto del vettore γ(t) − γ(t0 ) per lo
scalare 1/(t−t0 ). È facile verificare che γ(t) è derivabile in t0 se e solo se sono derivabili in t0
le sue funzioni componenti. In tal caso la derivata di γ(t) può essere eseguita componente
per componente.
Una curva parametrica γ(t) (chiusa o non chiusa) si dice regolare se è C 1 e se kγ 0 (t)k 6= 0
per ogni valore t del parametro. In altre parole, γ(t) è regolare se è C 1 e le derivate delle
sue funzioni componenti non si annullano mai simultaneamente (ossia, per lo stesso valore
di t). Dal punto di vista cinematico, una curva parametrica γ(t) rappresenta il moto di un
punto nel piano o nello spazio e il parametro t rappresenta il tempo. Se il moto è C 1 , dire
che è regolare significa affermare che il vettore velocità γ 0 (t) non si annulla mai (ovvero,
il punto γ(t) non si ferma mai).
L’immagine di una curva parametrica γ(t) si chiama il sostegno della curva. Da non
confondere con la curva parametrica γ(t), che è una funzione e, dal un punto di vista
cinematico, non rappresenta solo il percorso del punto γ(t), ma l’intera legge di percorrenza
(lo stesso sostegno può essere infatti percorso in più modi e con velocità diverse).
85 - Ven. 17/11/00
Siano f, g: U → R due funzioni continue definite su un aperto U di R2 (o di R3 ) e sia
γ: [a, b] → U una curva parametrica a valori in U . Vogliamo introdurre un nuovo concetto:
95
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
quello di integrale curvilineo orientato lungo la curva γ di f (p) in dg(p), che denoteremo
col simbolo
Z
f (p)dg(p) .
γ
Ovviamente, p sta per (x, y) se U ⊂
R2
e per (x, y, z) se U ⊂ R3 .
Fissiamo una partizione puntata α di [a, b] costituita da una partizione {t0 , t1 , . . . , tn } di
[a, b] e da una scelta {c1 , c2 , . . . , cn } di punti tali che ci ∈ [ti , ti−1 ]. Alla partizione puntata
α possiamo associare il numero
S(α) =
n
X
f (γ(ci ))∆gi ,
i=1
dove, per ogni i, ∆gi = g(γ(ti )) − g(γ(ti−1 )) denota l’incremento subito dalla funzione g
nel passare dal punto γ(ti−1 ) al punto γ(ti ).
In questo modo risulta definita, nell’insieme P delle partizioni puntate di [a, b], una
funzione reale S che ad ogni α ∈ P associa la somma S(α).
L’integrale curvilineo (orientato) lungo γ di f (p) in dg(p) è, quando esiste, il valore I a
cui tende S(α) quando il parametro di finezza |α| di α tende a zero. Scriveremo
Z
lim S(α) = f (p)dg(p) = I ∈ R
|α|→0
γ
se fissato ² > 0 esiste δ > 0 tale che da |α| < δ segue |S(α) − I| < ². Ovviamente,
affinché la definizione di integrale curvilineo abbia senso, è sufficiente che le funzioni f e g
siano definite sul sostegno di γ. Le abbiamo supposte definite su un aperto contenente il
sostegno di γ soltanto per semplificare l’enunciato di alcuni teoremi che vedremo in seguito.
Osserviamo infatti che se g fosse definita soltanto sul sostegno di γ, non avrebbe senso
considerare le sue derivate parziali (non sarebbero infatti definite le funzioni parziali).
Dalle proprietà dei limiti discende facilmente che se λ1 e λ2 sono due costanti e f1 , f2 : U →
R due funzioni, allora
Z
Z
Z
(λ1 f1 (p) + λ2 f2 (p))dg(p) = λ1 f1 (p)dg(p) + λ2 f2 (p)dg(p) .
γ
γ
γ
Analogamente si ha
Z
Z
Z
f (p)d(λ1 g1 (p) + λ2 g2 (p)) = λ1 f (p)dg1 (p) + λ2 f (p)dg2 (p) .
γ
γ
γ
Esercizio. Dalla definizione di integrale curvilineo dedurre che se γ è una curva costante,
allora
Z
f (p)dg(p) = 0 .
γ
96
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Osservazione. Se la funzione f è identicamente uguale ad uno, si ottiene
Z
dg(p) = g(p2 ) − g(p1 ) ,
γ
dove p1 e p2 sono, rispettivamente, il primo ed il secondo estremo della curva γ. In questo
caso, quindi, l’integrale non dipende dal cammino, ma soltanto dagli estremi della curva.
Un caso particolare (molto importante) di integrale curvilineo si ottiene quando g(p) è
una delle due funzioni coordinate, x o y, di R2 (o una delle tre funzioni coordinate di R3 ).
Se ω = A(x, y)dx + B(x, y)dy è una forma differenziale in R2 e γ è una curva parametrica
nel dominio U di ω, si definisce
Z
Z
Z
ω = A(x, y)dx + B(x, y)dy .
γ
γ
γ
Un’analoga definizione vale per l’integrale curvilineo di una forma differenziale in R3 .
Osserviamo che una forma differenziale ω = A(x, y)dx + B(x, y)dy può essere pensata
anche come il prodotto scalare F · dp tra il campo vettoriale
F (x, y) = (A(x, y), B(x, y))
e il differenziale (vettoriale) dp = (dx, dy) del punto p. Nel caso che F = (A, B) rappresenti
una forza, l’integrale esteso ad una curva γ di ω, che può essere equivalentemente scritto
nella forma
Z
F · dp ,
γ
è il lavoro che compie la forza F in seguito al moto del punto p lungo la curva γ.
Il seguente importante risultato, di cui omettiamo la dimostrazione, riconduce il calcolo
di un integrale curvilineo (orientato) ad un ordinario integrale definito:
Teorema (di riduzione agli integrali semplici per gli integrali curvilinei orientati). Sia U
un aperto di R2 (o di R3 ). Supponiamo che f : U → R sia continua, g: U → R sia C 1 e
γ: [a, b] → U sia C 1 . Allora
Z
Z b
f (p)dg(p) = f (γ(t))dg(γ(t))
γ
o, equivalentemente,
ϕ0 (t)dt
dove
g(γ(t)).
Z
a
f (p)dg(p) =
γ
Z
b
f (γ(t))ϕ0 (t)dt ,
a
è il differenziale delle funzione composta ϕ: [a, b] → R definita da ϕ(t) =
97
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
86 - Ven. 17/11/00
Dal teorema di riduzione segue che quando
ω = A(x, y)dx + B(x, y)dy
è una forma differenziale esatta e g(x, y) una sua primitiva, allora, per ogni curva
parametrica γ di classe C 1 e con sostegno nel dominio U di ω, si ha
Z
Z
Z
dg(x, y) = A(x, y)dx + B(x, y)dy .
γ
γ
γ
Ciò mostra che la notazione dg(p) che appare in un integrale curvilineo è coerente con
quella di differenziale. In effetti, è questo il vero motivo della scelta di tale notazione.
Considerazioni analoghe valgono per gli integrali curvilinei in R3 .
Teorema (formula fondamentale per gli integrali curvilinei).
differenziale esatta e g una sua primitiva, allora
Z
ω = g(p2 ) − g(p1 ) ,
Se ω è una forma
γ
dove p1 e p2 sono, rispettivamente, il primo ed il secondo estremo della curva γ. In particolare, l’integrale curvilineo di una forma differenziale esatta non dipende dal cammino,
ma soltanto dagli estremi della curva.
Corollario Se ω è una forma differenziale esatta, allora l’integrale curvilineo di ω lungo
una qualunque curva chiusa è nullo.
In sostanza, il suddetto corollario afferma che “una condizione necessaria affinché una
forma differenziale sia esatta è che l’integrale lungo ogni curva chiusa sia zero”. Si potrebbe
dimostrare che tale condizione è anche sufficiente. Vale infatti il seguente
Teorema. Condizione necessaria e sufficiente affinché una forma differenziale sia esatta
è che l’integrale curvilineo della forma lungo una qualunque curva chiusa sia zero.
Notazione. L’integrale curvilineo di f in dg esteso ad una curva chiusa γ viene spesso
denotato con
I
f (p)dg(p) .
γ
Ricordiamo che, come conseguenza del Teorema di Schwarz, ogni forma differenziale esatta è anche chiusa. Inoltre, se una forma chiusa è definita in un aperto semplicemente
connesso, allora è anche esatta. Mostriamo con un esempio che (negli aperti non semplicemente connessi) possono esistere forme chiuse che non sono esatte. Consideriamo la forma
differenziale
x
y
dx + 2
dy .
ω = A(x, y)dx + B(x, y)dy = − 2
x + y2
x + y2
98
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Si ha
y 2 − x2
∂A
(x, y) = 2
∂y
(x + y 2 )2
e
∂B
y 2 − x2
(x, y) = 2
.
∂x
(x + y 2 )2
Pertanto ω è una forma chiusa. Osserviamo che il dominio di ω è l’aperto U = R2 \{(0, 0)},
che non è semplicemente connesso. Ciò non implica che la forma debba essere non esatta
(“il dominio semplicemente connesso” è soltanto una condizione sufficiente affinché una
forma chiusa sia esatta). Tuttavia, se fosse esatta, il suo integrale lungo una qualunque
curva chiusa (con sostegno in U ) dovrebbe essere zero. Proviamo ad integrare lungo la
curva chiusa γr definita dalle equazioni parametriche
x = r cos t,
y = r sen t,
0 ≤ t ≤ 2π,
che rappresenta una circonferenza (parametrica) di raggio r > 0 e centro nell’origine. Si
ha
¶
I µ
x
y
dx + 2
dy =
− 2
x + y2
x + y2
γr
¶
Z 2π µ
r cos t
r sen t
d(r cos t) +
d(r sen t) =
−
r2
r2
0
Z 2π
Z 2π
2
2
(sen t + cos t) dt =
dt = 2π .
0
0
La forma differenziale non è pertanto esatta.
Incidentalmente osserviamo che il suddetto integrale non dipende dal parametro r della
curva γr . Questo fatto ha una spiegazione teorica di cui diamo soltanto un’idea intuitiva.
La dimostrazione rigorosa compete ad una moderna disciplina matematica: la Topologia.
Supponiamo che ω sia una forma differenziale chiusa, definita in un aperto U di R2 .
Consideriamo l’integrale curvilineo di ω esteso ad una curva chiusa γ (con sostegno in
U ). Supponiamo di deformare (in una zona) la curva γ, trasformandola in una nuova
curva γ1 , in modo che la deformazione avvenga dentro un cerchio aperto C interamente
contenuto in U . Se si considera la differenza dei due integrali curvilinei (quello esteso a
γ meno quello esteso a γ1 ), il risultato è come se si facesse un integrale curvilineo esteso
ad una curva chiusa interamente contenuta nel cerchio C. Si osservi infatti che le due
curve coincidono fuori da C, e quindi, facendo la differenza dei due integrali, il contributo
dei tratti di curva che stanno fuori da C è nullo. D’altra parte, il cerchio C è un insieme
convesso; dunque, essendo ω chiusa, la sua restrizione a C è una forma esatta. Ciò prova
che la differenza dei due integrali curvilinei, essendo equivalente ad un integrale curvilineo
in C, è zero. Possiamo concludere che se ω è una forma chiusa e γ è una curva chiusa,
l’integrale curvilineo di ω esteso a γ non muta se si deforma γ in un piccolo tratto.
È un fatto intuitivo, e dimostrabile rigorosamente, che se due curve chiuse, entrambe con
sostegno in un aperto U di R2 , differiscono di poco (non solo in un piccolo tratto, ma anche
99
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
nell’intero intervallo in cui varia il parametro), allora è possibile deformare una nell’altra
con un numero finito di piccole deformazioni, in modo che ciascuna di queste avvenga
dentro un cerchio (aperto) contenuto in U . Da ciò si deduce che se due curve differiscono
di poco, l’integrale di una forma chiusa esteso a una curva o all’altra è lo stesso.
Immaginiamo ora di avere (in un aperto U di R2 ) una famiglia di curve che dipendono con
continuità da un parametro che varia in un intervallo (si pensi, ad esempio, alla famiglia
di circonferenze {γr }, con r > 0, considerata prima). Per la dipendenza continua dal
parametro, nel passare da una curva ad un’altra della stessa famiglia, si può dare al parametro una sequenza di valori in modo da ottenere delle curve intermedie con la proprietà
che due qualunque curve consecutive siano sufficientemente vicine tra loro. Per quanto
visto prima, se ω è una forma chiusa in U , passando da una curva alla curva successiva
della sequenza, l’integrale curvilineo non cambia. Ciò prova, almeno Intuitivamente, che
l’integrale curvilineo di ω esteso ad una qualunque delle curve della famiglia è sempre lo
stesso.
Se in un aperto U di R2 (o di R3 ) due curve chiuse sono deformabili l’una nell’altra con
continuità (nel senso che fanno parte di una famiglia di curve con sostegno in U che
dipendono con continuità da un parametro che varia in un intervallo), allora si dice che
sono omotope in U .
Le suddette “chiacchiere” si concretizzano nel seguente risultato:
Teorema (di invarianza per omotopia). Se ω è una forma chiusa in un aperto U di R2
(o di R3 ), e se γ1 e γ2 sono due curve chiuse omotope in U , allora
I
I
ω =
ω.
γ1
γ2
In particolare, se una curva chiusa γ è omotopa (in U ) ad una curva costante, risulta
I
ω = 0.
γ
87 - Lun. 20/11/00
Sia γ: [a, b] → U una curva parametrica con sostegno in un aperto U di R2 (o di R3 ) e sia
f : U → R una funzione continua definita su U (o, più in generale, definita sul sostegno di
γ). Vogliamo introdurre la nozione di integrale curvilineo (non orientato) lungo la curva
γ di f (p) in ds, che denoteremo col simbolo
Z
f (p)ds .
γ
100
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Il termine ds viene detto elemento di lunghezza d’arco.
Fissiamo una partizione puntata α di [a, b] costituita da una partizione {t0 , t1 , . . . , tn } di
[a, b] e da una scelta {c1 , c2 , . . . , cn } di punti tali che ci ∈ [ti , ti−1 ]. Alla partizione puntata
α possiamo associare il numero
n
X
S(α) =
i=1
f (γ(ci ))kγ(ti ) − γ(ti−1 )k ,
dove kγ(ti ) − γ(ti−1 )k denota la lunghezza del segmento che ha per estremi i due punti
γ(ti−1 ) e γ(ti ) sul sostegno della curva γ.
In questo modo risulta definita, nell’insieme P delle partizioni puntate di [a, b], una
funzione reale S che ad ogni α ∈ P associa la somma S(α).
L’integrale curvilineo (non orientato) lungo γ di f (p) in ds è, quando esiste, il valore I a
cui tende S(α) quando il parametro di finezza |α| di α tende a zero. Scriveremo
Z
lim S(α) = f (p)ds = I ∈ R
|α|→0
γ
se fissato ² > 0 esiste δ > 0 tale che da |α| < δ segue |S(α) − I| < ².
Dalle proprietà dei limiti discende facilmente che se λ1 e λ2 sono due costanti e f1 , f2 : U →
R due funzioni, allora
Z
Z
Z
(λ1 f1 (p) + λ2 f2 (p))ds = λ1 f1 (p)ds + λ2 f2 (p)ds .
γ
γ
γ
Dalla proprietà del confronto dei limiti discende la monotonia:
se f1 (p) ≤ f2 (p) per ogni p sul sostegno di γ, allora
Z
Z
f1 (p)ds ≤ f2 (p)ds .
γ
γ
Definizione. Una curva parametrica γ si dice rettificabile se esiste l’integrale lungo γ
della funzione f (p) ≡ 1 in ds, e in questo caso la lunghezza di γ è il numero
Z
L(γ) = ds .
γ
Con riferimento alla definizione di integrale curvilineo non orientato, si osservi che quando
f (p) ≡ 1, la somma S(α) associata ad una partizione puntata α non è altro che la lunghezza
della poligonale inscritta al sostegno di γ con vertici γ(t0 ), γ(t1 ), . . . , γ(tn ). Pertanto,
101
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
la lunghezza di γ è il limite per |α| → 0 delle lunghezze delle poligonali associate alle
partizioni α di [a, b]. Ovviamente, in questo caso, essendo f (p) ≡ 1, è superfluo che le
partizioni di [a, b] siano puntate.
Non tutte le curve parametriche (continue) sono rettificabili. Per avere un’idea di ciò, si
fa presente che nel 1890 l’illustre matematico torinese Giuseppe Peano (1858-1932) fornı̀
uno esempio di curva parametrica (continua) il cui sostegno è un intero quadrato (pieno!),
e una tale curva non è certo rettificabile. Nel 1935, tuttavia, A. B. Brown mostrò che un
tale fenomeno non può verificarsi se la curva è di classe C 1 , perché il suo sostegno risulta
privo di punti interni (sono queste, quelle di classe C 1 , le curve che più aderiscono alla
nostra concezione intuitiva di curva). Le curve C 1 , come vedremo, sono rettificabili.
Dalla proprietà di monotonia degli integrali curvilinei non orientati discende
immediatamente il
Primo teorema della media per gli integrali curvilinei. Siano γ una curva rettificabile ed f una funzione continua definita sul sostegno di γ. Allora la media di f lungo γ,
ossia
Z
1
f (p)ds ,
L(γ) γ
è un numero compreso tra l’estremo inferiore e l’estremo superiore di f . Di conseguenza,
per il Secondo Teorema di Weierstrass, esiste un punto p0 sul sostegno di γ per il quale
risulta
Z
f (p)ds = f (p0 )L(γ) .
γ
Il seguente importante risultato riconduce il calcolo di un integrale curvilineo (non
orientato) ad un ordinario integrale definito:
Teorema (di riduzione agli integrali semplici per gli integrali curvilinei non orientati). Se
f : U → R è continua e γ: [a, b] → U è C 1 , allora
Z
f (p)ds =
γ
Z
b
a
f (γ(t)) kγ 0 (t)kdt .
In particolare, γ è rettificabile e si ha
L(γ) =
Z
b
a
kγ 0 (t)kdt .
Calcolo della lunghezza di una circonferenza.
Calcolo del momento d’inerzia di una circonferenza (di massa m) rispetto al centro.
102
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
88 - Lun. 20/11/00
Definizione. Un’applicazione tra due intervalli compatti, σ: [α, β] → [a, b], si dice un
cambiamento di parametro se è di classe C 1 , suriettiva, con derivata sempre diversa da
zero. Un cambiamento di parametro t = σ(τ ) è detto concorde se σ 0 (τ ) > 0 e discorde in
caso contrario.
Osserviamo che se t = σ(τ ) è un cambiamento di parametro, allora σ è invertibile e anche
τ = σ −1 (t) è un cambiamento di parametro.
Definizione. Due curve parametriche γ1 e γ2 si dicono equivalenti se una si ottiene
dall’altra (mediante la composizione) con un cambiamento di parametro. Due curve parametriche equivalenti si dicono concordi o discordi a seconda che sia concorde o discorde
il cambiamento di parametro che fa passare dall’una all’altra.
Teorema (di indipendenza per gli integrali curvilinei orientati). Siano f, g: U → R due
applicazioni continue e siano γ1 e γ2 due parametrizzazioni equivalenti (con sostegno in
U ). Se γ1 e γ2 sono concordi, allora
Z
Z
f (p)dg(p) = f (p)dg(p) .
Se γ1 e γ2 sono discordi, allora
Z
γ1
γ2
f (p)dg(p) = −
Z
γ1
f (p)dg(p) .
γ2
Teorema (di indipendenza per gli integrali curvilinei non orientati). Sia f : U → R un’applicazione continua e siano γ1 e γ2 due parametrizzazioni equivalenti (con sostegno in U ).
Allora
Z
Z
f (p)ds = f (p)ds ,
γ1
γ2
indipendentemente dal fatto che γ1 e γ2 siano concordi o discordi.
89 - Mar. 21/11/00
Definizione. Un arco di curva (regolare) è un sottoinsieme di R2 (o di R3 ) con la proprietà
di essere sostegno (cioè immagine) di un arco di curva parametrica semplice e regolare,
detta parametrizzazione della curva.
La dimostrazione del seguente importante risultato non è banale ed esula dagli scopi del
corso:
Teorema. Se γ1 e γ2 sono due parametrizzazioni dello stesso arco di curva (regolare),
allora sono equivalenti (concordi o discordi).
103
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Gli estremi di un arco di curva sono, per definizione, gli estremi di una qualunque parametrizzazione. Non è difficile provare, in base al precedente teorema, che tale definizione
è ben posta (ossia, gli estremi non dipendono dalla parametrizzazione).
Un arco di curva si dice orientato quando si è stabilito un ordine tra i due estremi (ossia,
quale dei due è il primo e quale il secondo). Intuitivamente, ciò equivale ad aver scelto
un senso di percorrenza sulla curva (più precisamente si dovrebbe dire “una classe di
equivalenza di parametrizzazioni concordi”, ma lasciamo perdere).
Una parametrizzazione γ di una curva orientata α si dice concorde (con l’orientazione di
α) se il primo estremo di γ coincide col primo estremo di α (e, di conseguenza, il secondo
col secondo) e si dice discorde in caso contrario.
Definizione (di integrale curvilineo non orientato). Sia α un arco di curva (come insieme)
e sia f : U → R una funzione continua definita su un aperto U contenente α (o, più in
generale, definita su α). L’integrale di f in ds lungo α è il numero
Z
Z
f (p)ds := f (p)ds ,
α
γ
dove γ è una qualunque parametrizzazione di α.
Si fa notare che, in base al teorema di indipendenza per gli integrali curvilinei non orientati,
la suddetta definizione è ben posta. In altre parole,
Z
f (p)ds
γ
non dipende dalla parametrizzazione γ di α.
La definizione si estende facilmente ad una catena di archi (detta anche curva generalmente
regolare o regolare a tratti); ossia ad un insieme α con la proprietà di essere sostegno di
una curva parametrica semplice (chiusa o non chiusa) decomponibile in un numero finito
di archi, α1 , α2 , . . . , αn , in modo tale che due qualunque di questi abbiano al più un
estremo a comune. In tal caso si pone
Z
Z
Z
Z
f (p)ds =
f (p)ds +
f (p)ds + · · · +
f (p)ds .
α
α1
α2
αn
Un integrale curvilineo non orientato può avere vari significati fisici o geometrici. Ad
esempio:
– la massa di un filo (quando f (p)ds è l’elemento di massa dm, ossia quando f (p)
rappresenta la densità lineare di massa);
– la carica elettrica su un filo (quando f (p) è una densità di carica);
104
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
– il momento d’inerzia di un filo rispetto ad una retta (se f (p) rappresenta il quadrato
della distanza dalla retta per la densità di massa o, equivalentemente, quando f (p)ds
è il prodotto del quadrato della distanza dalla retta per l’elemento di massa dm);
– la lunghezza di α (quando f (p) ≡ 1).
Definizione (di integrale curvilineo orientato). Siano α un arco di curva orientato, g: U →
R una funzione C 1 su un aperto U contenente α ed f una funzione continua definita su U
(o, più in generale, su α). L’integrale di f in dg lungo α è il numero
Z
Z
f (p)dg(p) := f (p)dg(p) ,
α
γ
dove γ è una qualunque parametrizzazione di α concorde con l’orientazione.
Si fa notare che, in base al teorema di indipendenza per gli integrali curvilinei orientati,
la suddetta definizione è ben posta. In altre parole,
Z
f (p)dg(p)
γ
non dipende dalla parametrizzazione γ di α, purché sia concorde con l’orientazione.
Anche in questo caso, la definizione può essere facilmente estesa ad una catena orientata
di archi; ossia ad una catena di archi α dove è stato scelto un senso di percorrenza. Ciò
significa che gli archi sono tutti orientati (quindi ogni arco ha un primo e un secondo
estremo) e se due archi sono adiacenti, il comune estremo è il primo per un arco ed è il
secondo per l’altro.
Fisicamente, un integrale orientato rappresenta quasi sempre un lavoro. Ad esempio,
quando f è una pressione e g un volume (si pensi alla termodinamica dei gas). Un altro
caso di fondamentale importanza in Fisica si ha quando l’integrale orientato è del tipo
Z
Z
ω=
A(p)dx + B(p)dy + C(p)dz ,
α
α
che, mediante il prodotto scalare, possiamo equivalentemente scrivere nella forma
Z
F (p) · dp ,
α
dove F (p) è il campo vettoriale (A(p), B(p), C(p)) e dp = (dx, dy, dz) il vettore spostamento (del punto p). In questo caso, se il campo vettoriale F (p) rappresenta una forza,
l’integrale è il lavoro che questa compie spostando il punto p lungo la curva α in senso
concorde con l’orientazione. È chiaro, anche fisicamente, che se si inverte l’orientazione, il
lavoro che compie la forza cambia di segno. È interessante osservare che, in base al teorema
di indipendenza dalla parametrizzazione, il lavoro non dipende dalla legge di moto γ(t)
105
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
lungo la curva α, purché il punto p = γ(t) si muova in senso concorde con l’orientazione
di α (e ciò, in questo particolare caso, è vero anche se la forza non è conservativa).
90 - Mar. 21/11/00
Un sottoinsieme di R2 si dice una curva di Jordan (si pronuncia “giordàn”, con l’accento
tonico sull’ultima sillaba) se è il sostegno di una curva parametrica semplice e chiusa. Il
più banale esempio di curva di Jordan è costituito da una circonferenza. Un altro semplice
esempio è dato dalla frontiera di un rettangolo.
Enunciamo, senza dimostrazione, un famoso risultato topologico, tanto intuitivo quanto
non banale da provare (come molti teoremi di Topologia).
Teorema di Jordan. Il complementare di una curva di Jordan è unione di due aperti
disgiunti, connessi per archi e aventi come frontiera comune la curva stessa. Uno dei due
aperti, detto “insieme dei punti racchiusi dalla curva”, è limitato; l’altro è illimitato.
Una curva di Jordan si dice una catena di Jordan o curva di Jordan regolare a tratti (o
generalmente regolare) se è un catena di archi; ossia, ricordiamo, se è decomponibile in
un numero finito di archi in modo che due qualunque di questi abbiano al più un estremo
a comune. Ad esempio, la frontiera di un poligono è una catena di Jordan, cosı̀ come
lo è una circonferenza (perché può essere decomposta in tre archi di cerchio). Non tutte
le curve di Jordan sono catene. Esistono infatti curve di Jordan cosı̀ irregolari da non
ammettere archi di curva come sottoinsiemi. Una di queste è la frontiera frastagliata della
cosiddetta isola di Koch (un noto frattale).
Una singola catena di Jordan può essere orientata in due modi, a seconda del senso di
percorrenza: orario o antiorario. Quindi, un insieme costituito da n catene di Jordan a
due a due disgiunte può essere orientato in 2n modi (due per ogni curva).
Diremo che un insieme compatto X ⊂ R2 è delimitato da una o più catene di Jordan se
queste sono a due a due disgiunte e la loro unione coincide con la frontiera di X. Ad
esempio, una corona circolare è un insieme delimitato da due catene di Jordan (nella
fattispecie, due circonferenze concentriche), mentre i quadrati, i cerchi e i triangoli sono
delimitati da una sola catena di Jordan.
Per convenzione, dato un insieme compatto X ⊂ R2 delimitato da catene di Jordan,
l’orientazione indotta da X sulla sua frontiera si ottiene percorrendo ogni catena in modo
che X si trovi sul lato sinistro e il complementare di X sul lato destro. Ad esempio,
l’orientazione indotta da una corona circolare sulla sua frontiera è antioraria sul cerchio
esterno e oraria su quello interno.
Per comprendere meglio la definizione (non proprio ortodossa) di orientazione indotta, si
106
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
pensi al concetto di riva sinistra (o destra) di un fiume. D’altra parte, bisogna accontentarsi dell’idea intuitiva, perché la definizione formale richiederebbe concetti topologici
troppo avanzati per il livello del corso. Purtroppo, le definizioni informali dei concetti non
consentono dimostrazioni formali dei teoremi connessi (c’è poco da fare!).
Da ora in poi, per semplicità di linguaggio, diremo che una funzione f (x, y) è C n [C ∞ ] in
un insieme X di R2 (non necessariamente aperto) se è C n [C ∞ ] in un aperto U contenente
X. Ad esempio, la funzione x2 + y 2 è C ∞ nel quadrato Q = [0, 1] × [0, 1] perché in realtà
è C ∞ in tutto R2 , che è un aperto contenente Q.
In un certo senso, il seguente risultato rappresenta per gli integrali doppi quello che per gli
integrali semplici è la formula fondamentale del calcolo integrale. Sotto opportune ipotesi,
infatti, l’integrale doppio dipende soltanto da ciò che accade sulla frontiera dell’insieme di
integrazione.
Teorema (formule di Gauss nel piano). Siano A(x, y) e B(x, y) due funzioni di classe C 1
su un insieme compatto X ⊂ R2 delimitato da una o più catene di Jordan. Allora
Z
ZZ
∂B
(x, y) dxdy =
B(x, y) dy ,
∂X
X ∂x
Z
ZZ
∂A
(x, y) dxdy = −
A(x, y) dx ,
∂X
X ∂y
dove l’orientazione di ∂X è quella indotta da X.
Esempi ed esercizi relativi agli integrali curvilinei.
91 - Mer. 22/11/00
Teorema (formule di Gauss-Green nel piano). Siano A(x, y) e B(x, y) due funzioni di
classe C 1 su un insieme compatto X ⊂ R2 delimitato da una o più catene di Jordan.
Allora
!
Ã
Z
ZZ
det
Adx + Bdy =
∂X
X
∂
∂x
∂
∂y
A
B
dxdy ,
dove l’orientazione di ∂X è quella indotta da X.
Osservazione. Dalla formula di Gauss-Green, ponendo A = 0 o B = 0, si ottengono le
due formule di Gauss. Viceversa, sommando le due formule di Gauss si ottiene la formula
di Gauss-Green.
Osservazione. Se si scelgono A e B in modo che la funzione
!
Ã
∂
∂
∂B ∂A
∂x
∂y
−
=
det
∂x
∂y
A B
107
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
sia uguale ad uno, allora l’integrale curvilineo
Z
Adx + Bdy
∂X
rappresenta l’area di X. I casi più interessanti sono i seguenti tre:
A = −y/2, B = x/2;
A = 0, B = x;
A = −y, B = 0.
Calcolo dell’area di un cerchio come integrale curvilineo. Calcolo dell’area di un’ellisse
come integrale curvilineo.
92 - Mer. 22/11/00
Dato un arco di curva (o, più in generale, una catena) α ⊂ R2 , il suo baricentro (geometrico)
è il punto (xc , yc ) che ha per ascissa la media delle ascisse e per ordinata le media delle
ordinate. Si ha pertanto
Z
Z
1
1
x ds e yc =
y ds .
xc =
L(α) α
L(α) α
Calcolo del baricentro di una semicirconferenza.
Teorema di Pappo (per le superfici di rotazione). Sia α un arco di curva interamente
contenuto in un semipiano delimitato da una retta λ. L’area della superficie che si ottiene
ruotando α di un angolo θ ∈ (0, 2π] intorno alla retta λ è dato dal prodotto della lunghezza
di α per la lunghezza della curva percorsa dal baricentro di α.
Esempi ed esercizi basati sul Teorema di Pappo per le superfici di rotazione: area laterale
di un cono; area di una superficie sferica.
Il vettore tangente ad una curva parametrica γ(t) in un punto γ(t0 ) è il vettore v = γ 0 (t0 ).
Un vettore si dice tangente ad un arco di curva (sostegno) α in un punto p ∈ α se è nullo
o è tangente in p ad una delle possibili parametrizzazioni di α. Si potrebbe dimostrare che
se v 6= 0 è tangente ad α in p, tutti gli altri vettori tangenti (ad α in p) sono proporzionali
a v (ossia, sono del tipo λv, con λ ∈ R).
Definizione. Un sottoinsieme α di R2 si dice una curva implicita regolare (o curva di
livello regolare) se è il luogo degli zeri di una funzione g(x, y), di classe C 1 su un aperto di
R2 , ed è verificata la condizione ∇g(p) 6= 0 in ogni punto di p ∈ α (ossia, se in ogni punto
di α almeno una delle due derivate parziali di g è non nulla).
108
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Definizione. Sia α una curva di livello regolare definita dall’equazione g(x, y) = 0. Un
vettore v si dice tangente ad α in p0 se verifica la condizione v · ∇g(p0 ) = 0 (ossia, se è
ortogonale al gradiente di g in p0 , che, ricordiamo, è non nullo).
Si potrebbe dimostrare che un vettore v ∈ R2 è tangente ad una curva di livello regolare
g −1 (0) in un punto p se e solo se è tangente in p ad una curva parametrica di classe C 1
con sostegno in g −1 (0). Si osservi, ad esempio, che il vettore nullo è tangente alla curva
costante γ definita da γ(t) = p per ogni t ∈ [a, b].
Esercizi consigliati [Spiegel, cap. 10]: 1, 2, 3, 4, 5, 6, 8.
93 - Gio. 23/11/00
Ricordiamo che, data una funzione reale f definita in un aperto U di R2 e dato un sottoinsieme X di U , un punto p ∈ X si dice estremante per f in X se è di massimo o di
minimo relativo per la restrizione di f ad X. Ricordiamo anche che (per il Teorema di
Fermat in R2 ) se X = U ed f è C 1 , allora una condizione necessaria affinché un punto
p ∈ X sia estremante è che sia critico per f (sia nullo, cioè, il gradiente di f in p).
Il problema della ricerca dei punti estremanti di una funzione reale f in un aperto U di
R2 (o, più in generale, di Rk ) si dice un problema di massimi e minimi (o estremi) liberi
per distinguerlo da quello che consiste nella ricerca dei punti estremanti della restrizione
di f ad un assegnato sottoinsieme X di U (come, ad esempio, un quadrato in R2 ). Se,
in particolare, l’insieme in cui si cercano i punti estremanti è una curva di livello regolare
g −1 (0) ⊂ U , allora il problema si dice di massimi e minimi (o estremi) condizionati (o
vincolati) e g −1 (0) si dice il vincolo.
Una condizione necessaria affinché un punto sia estremante per un problema di estremi
vincolati è data dal seguente risultato:
Teorema. Siano f, g: U → R due funzioni di classe C 1 su un aperto U di R2 . Supponiamo
che l’insieme
g −1 (0) = {(x, y) ∈ U : g(x, y) = 0}
sia una curva di livello regolare (ossia, ∇g(p) 6= 0 per ogni p tale g(p) = 0). Allora, se
p0 ∈ g −1 (0) è un punto estremante per f in g −1 (0), esiste un λ0 ∈ R per il quale si ha
∇f (p0 ) = λ0 ∇g(p0 ).
Esempi ed esercizi relativi ai problemi di massimi e minimi condizionati.
94 - Gio. 26/2/01
Definizione. Un sottoinsieme S di R3 si dice una superficie implicita regolare (o superficie
109
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
di livello regolare) se è il luogo degli zeri di una funzione g(x, y, z), di classe C 1 su un aperto
di R3 , ed è verificata la condizione ∇g(p) 6= 0 in ogni punto di p ∈ S (ossia, se in ogni
punto di S almeno una delle tre derivate parziali di g è non nulla).
Definizione. Sia S una superficie di livello regolare definita dall’equazione
g(x, y, z) = 0 .
Un vettore v si dice tangente ad S in p0 se verifica la condizione v · ∇g(p0 ) = 0 (ossia, se
è ortogonale al gradiente di g in p0 , che, ricordiamo, è non nullo).
Si potrebbe dimostrare che un vettore v ∈ R3 è tangente ad una superficie di livello regolare
g −1 (0) in un punto p se e solo se è tangente in p ad una curva parametrica di classe C 1
con sostegno in g −1 (0). Si osservi, ad esempio, che il vettore nullo è tangente alla curva
costante γ definita da γ(t) = p per ogni t ∈ [a, b].
Analogamente a quanto visto per le funzioni di due variabili, anche il problema della
ricerca dei punti estremanti della restrizione di una funzione f (x, y, z) ad una superficie
di livello regolare si chiama problema di massimi e minimi vincolati (o condizionati).
Il seguente risultato fornisce una condizione necessaria affinché un punto sia estremante
per un problema di massimi e minimi vincolati in R3 :
Teorema. Siano f, g: U → R due funzioni di classe C 1 su un aperto U di R3 . Supponiamo
che l’insieme
g −1 (0) = {(x, y, z) ∈ U : g(x, y, z) = 0}
sia una superficie di livello regolare (ossia, ∇g(p) 6= 0 per ogni p tale g(p) = 0). Allora,
se p0 ∈ g −1 (0) è un punto estremante per f in g −1 (0), esiste un λ0 ∈ R per il quale si ha
∇f (p0 ) = λ0 ∇g(p0 ).
Il suddetto teorema ci dice che per trovare gli eventuali punti estremanti di f in g −1 (0) si
deve risolvere un sistema di quattro equazioni nelle quattro incognite x, y, z e λ. Le prime
tre equazioni vengono fuori dall’uguaglianza (vettoriale) ∇f (p) = λ∇g(p) e la quarta
rappresenta l’equazione del vincolo: g(p) = 0 (ovviamente p denota (x, y, z)). Se (p0 , λ0 )
è una soluzione del sistema, allora il punto p0 (che ovviamente sta sul vincolo) potrebbe
essere estremante, ma non è detto che lo sia (va solo preso in considerazione tra i possibili
“sospetti”). Per decidere se p0 è in effetti un punto estremante (e, nel caso, se è di minimo
o di massimo) può essere di aiuto il Primo Teorema di Weierstrass (quando il vincolo è
compatto). Talvolta si può far ricorso anche a considerazioni di natura fisica (quando il
problema nasce dalla Fisica) o di natura geometrica (quando nasce dalla Geometria).
Un metodo pratico per trovare i possibili punti estremanti di f in g −1 (0) è il cosiddetto
metodo dei moltiplicatori di Lagrange. In questo caso, tuttavia, essendo il vincolo
110
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
definito da una sola equazione scalare, si dovrebbe dire “metodo del moltiplicatore di
Lagrange” (λ è il moltiplicatore). Il metodo consiste nella ricerca dei punti critici della
funzione ausiliaria
F (x, y, z, λ) := f (x, y, z) − λg(x, y, z) .
Uguagliando a zero le quattro derivate di F si ottiene infatti il sistema

∂F/∂x (x, y, z, λ) = 0


 ∂F/∂y (x, y, z, λ) = 0

∂F/∂z (x, y, z, λ) = 0


∂F/∂λ (x, y, z, λ) = 0 ,
le cui prime tre equazioni scalari equivalgono all’equazione vettoriale ∇f (p) = λ∇g(p), e
l’ultima costituisce l’equazione del vincolo.
In un certo senso, col metodo di Lagrange, il problema della ricerca degli estremi vincolati
in tre dimensioni viene trattato come se fosse un problema di estremi liberi in quattro dimensioni: si cercano i punti critici della funzione ausiliaria F , e questi corrispondono (considerando solo le prime tre coordinate) agli unici possibili candidati ad essere estremanti
per f in g −1 (0) (tutti gli altri non sono estremanti).
Ovviamente, il metodo dei moltiplicatori di Lagrange si applica anche ai problemi di
estremi condizionati in R2 , e la funzione ausiliaria sarà
F (x, y, λ) := f (x, y) − λg(x, y) .
In R3 il vincolo può essere dato anche da due equazioni del tipo
g1 (x, y, z) = 0 e
g2 (x, y, z) = 0 ,
che in questo caso rappresenta una curva (si pensi, ad esempio, all’intersezione di una
superficie sferica con un piano). Quest’anno non tratteremo problemi con vincoli definiti
da più di un’equazione. Ci limitiamo a dire che i possibili punti estremanti della restrizione
al vincolo di una funzione f corrispondono (tramite le prime tre coordinate) ai punti critici
della seguente funzione di cinque variabili:
F (x, y, z, λ1 , λ2 ) := f (x, y, z) − λ1 g1 (x, y, z) − λ2 g2 (x, y, z) ,
dove λ1 e λ2 sono i cosiddetti moltiplicatori di Lagrange (e questa volta il plurale è
appropriato).
Esempi ed esercizi relativi ai problemi di estremi condizionati.
111
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
95 - Ven. 24/11/00
Teorema di Lagrange in due variabili. Sia f : U → R una funzione di classe C 1 in
un aperto U di R2 e siano p e q due punti di U tali che il segmento L di estremi p e q sia
contenuto in U . Allora esiste un punto c ∈ L tale che
f (q) − f (p) = ∇f (c) · (q − p) .
Dimostrazione. Consideriamo la funzione composta ϕ: [0, 1] → R definita da ϕ(t) =
f (γ(t)), dove γ(t) = p + t(q − p) per t ∈ [0, 1]. Chiaramente ϕ è ben definita perché
al variare di t in [0, 1] il punto γ(t) “percorre” il segmento L che, per ipotesi, sta in U
(incidentalmente si fa notare che γ(t) non è altro che una parametrizzazione della curva
sostegno L). Osserviamo che l’incremento f (q)−f (p) della funzione di due variabili f coincide con l’incremento ϕ(1)−ϕ(0) della ϕ, la quale soddisfa (in [0, 1]) le ipotesi del Teorema
di Lagrange, essendo composizione di funzioni C 1 . Esiste quindi un numero θ ∈ (0, 1) tale
che ϕ(1) − ϕ(0) = ϕ0 (θ). Dal teorema della derivata di una funzione composta segue
ϕ0 (t) = ∇f (γ(t)) · γ 0 (t) = ∇f (p + t(q − p)) · (q − p) ,
e pertanto
f (q) − f (p) = ϕ0 (θ) = ∇f (p + θ(q − p)) · (q − p) = ∇f (c) · (q − p) ,
ove si è posto c = p + θ(q − p).
Definizione. Sia f : A → R una funzione reale definita su un aperto A di R2 e sia
p0 = (x0 , y0 ) un punto di A. Supponiamo che esistano ∂f /∂x(p0 ) e ∂f /∂y(p0 ). Diremo
che f è differenziabile in p0 se
f (x, y) − f (x0 , y0 ) − ∂f
∂x (p0 )(x − x0 ) −
p
lim
(x,y)→(x0 ,y0 )
(x − x0 )2 + (y − y0 )2
∂f
∂y (p0 )(y
− y0 )
=0
o, equivalentemente,
f (x0 + h, y0 + k) − f (x0 , y0 ) −
√
(h,k)→(0,0)
h2 + k 2
lim
∂f
∂x (p0 )h
−
∂f
∂y (p0 )k
= 0.
Perciò, se f è differenziabile in p0 , si ha
f (x0 + h, y0 + k) = f (x0 , y0 ) +
con ²(h, k) continua e nulla in (0, 0) e ρ =
in p0 , allora è anche continua (in p0 ).
√
∂f
∂f
(p0 )h +
(p0 )k + ²(h, k)ρ ,
∂x
∂y
h2 + k 2 ; e ciò mostra che se f è differenziabile
112
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Usando le notazioni vettoriali si può affermare che f è differenziabile in p0 se vale
l’uguaglianza
f (p0 + v) = f (p0 ) + ∇f (p0 ) · v + ²(v)kvk ,
dove ²(v) è una funzione continua e nulla nel punto v = 0.
Se f è differenziabile in p0 , il polinomio omogeneo di primo grado
df (p0 )(h, k) =
∂f
∂f
(p0 )h +
(p0 )k
∂x
∂y
si chiama il differenziale (o incremento virtuale) della funzione f calcolato in p0 e applicato
al vettore incremento v = (h, k). In un certo senso, il differenziale di f calcolato in p0 e
applicato a v = (h, k) approssima l’incremento vero ∆f (p0 )(h, k) = f (x0 + h, y0 + k) −
f (x0 , y0 ) di f in modo tale che la differenza tra i due valori (vero e virtuale) è tanto più
trascurabile quanto più piccolo è l’incremento v (cioè tende a zero più velocemente della
norma di v).
Geometricamente l’equazione
z = f (x0 , y0 ) +
∂f
∂f
(p0 )(x − x0 ) +
(p0 )(y − y0 )
∂x
∂x
rappresenta un piano passante per il punto (x0 , y0 , f (x0 , y0 )) del grafico di f , chiamato
piano tangente al grafico di f in (x0 , y0 , f (x0 , y0 )). Tra tutti i piani di R3 , il piano tangente
è quello il cui grafico “meglio approssima” il grafico di f in un intorno di (x0 , y0 , f (x0 , y0 )).
Analogamente al caso delle funzioni di due variabili, si può (se ci è gradito) dire che una
funzione reale di una variabile reale f definita in un aperto A di R è differenziabile in un
punto x0 ∈ A se è derivabile e se
lim
x→x0
f (x) − f (x0 ) − f 0 (x0 )(x − x0 )
= 0,
x − x0
ma ciò non serve a molto, perché dalla definizione di derivata segue subito che una funzione
è derivabile se e solo se è differenziabile (e non c’è un gran vantaggio ad usare due nomi
per uno stesso concetto).
In due variabili non è più vero che l’esistenza delle derivate parziali implichi la differenziabilità. Per convincersene, basta ricordarsi che in R2 esistono funzioni derivabili (addirittura
in ogni punto) ma non continue. Tali funzioni, nei punti di discontinuità, non possono
certo essere differenziabili, visto che la differenziabilità implica la continuità.
Ci si può chiedere se la continuità e la derivabilità, insieme, implichino la differenziabilità.
Anche in questo caso la risposta è negativa, come mostra il seguente
113
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
p
Esempio. La funzione f (x, y) = |xy| è chiaramente continua, essendo composizione di
funzioni continue. Poiché la restrizione di f sia all’asse x che all’asse y è la funzione nulla,
le derivate parziali ∂f /∂x(0, 0) e ∂f /∂y(0, 0) esistono e valgono zero. D’altra parte,
p
|xy|
p
lim
2
(x,y)→(0,0)
x + y2
non esiste, come si verifica immediatamente considerando i limiti direzionali. Perciò f non
è differenziabile in (0, 0).
96 - Ven. 24/11/00
Osserviamo esplicitamente che è il concetto di differenziabilità (e non di derivabilità)
quello che estende a più variabili la nozione di derivabilità in modo che si possano ancora
dedurre importanti proprietà come, ad esempio, la continuità. Infatti, come mostrato in
precedenza con un esempio, a differenza di quanto accade in una variabile, per funzioni di
più variabili la derivabilità non implica la continuità.
Sia f : U → R una funzione reale definita su un aperto U di R2 e sia p0 = (x0 , y0 ) un punto
di U . Fissiamo una qualunque direzione v = (h, k) ∈ R2 e consideriamo la restrizione di
f alla retta passante per p0 e avente la direzione v, cioè la funzione di una variabile reale
t 7→ ϕ(t) data da
ϕ(t) = f (p0 + tv) = f (x0 + th, y0 + tk).
Se ϕ è derivabile in t = 0, diremo che f è derivabile in p0 nella direzione v, e il numero
ϕ0 (0), detto derivata direzionale di f in p0 nella direzione v, si denota col simbolo
∂f
(p0 ) .
∂v
Il suo significato risulta chiaro dalla definizione stessa: misura il tasso di crescita di f in
p muovendosi nella direzione v. Osserviamo che le derivate parziali rispetto ad x e ad y
non sono altro che le derivate direzionali nelle direzioni (1, 0) e (0, 1) rispettivamente.
Teorema. Sia f : U → R una funzione reale definita su un aperto U di R2 . Se f è
differenziabile in p0 ∈ U , allora è derivabile in p0 in ogni direzione e si ha
∂f
(p0 ) = ∇f (p0 ) · v .
∂v
Osserviamo che, in base al suddetto teorema, la derivata direzionale è massima quando
il vettore v punta nella direzione del gradiente. In altre parole, facendo variare v tra i
vettori di norma uno, il massimo di ∂f /∂v(p0 ) si ottiene quando l’angolo θ tra ∇f (p0 ) e
v è nullo (cioè cos θ = 1). Ciò mostra che il gradiente è il vettore che indica la direzione
114
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
di massima crescenza della funzione f (partendo da p0 ) e il suo modulo misura il tasso di
crescita in tale direzione.
Dal Teorema di Lagrange per funzioni di due variabili segue il seguente risultato:
Teorema. Sia f : U → R una funzione reale definita su un aperto U di R2 . Se f è di
classe C 1 , allora è differenziabile in ogni punto in p ∈ U .
97 - Lun. 27/11/00
Richiami sulle serie numeriche.
Esercizio. Provare che se due serie differiscono per un numero finito di termini, allora
hanno lo stesso carattere (entrambe convergenti, divergenti o indeterminate).
Talvolta non ha interesse calcolare esplicitamente la somma di una serie, ma stabilirne
soltanto il carattere. Successivamente, dopo aver provato che una serie converge, la sua
somma (se interessa) potrà essere stimata con metodi numerici mediante l’ausilio di un
elaboratore elettronico (o di una calcolatrice scientifica). Quando di una serie interessa
soltanto il carattere, in base all’esercizio precedente, non ha importanza da quale indice
P
P
inizia la somma. In tal caso potremo scrivere n an al posto di ∞
n=n0 an .
P
Esercizio. Sia ∞
n=n0 an una serie convergente e sia c ∈ R. Provare che
Esercizio. Siano
P∞
n=n0
∞
X
can = c
n=n0
an e
P∞
∞
X
n=n0 bn
an .
n=n0
due serie convergenti. Provare che
(an + bn ) =
n=n0
∞
X
∞
X
an +
n=n0
∞
X
bn .
n=n0
Osservazione. Se una serie è a termini positivi (o anche negativi), allora la successione
delle sue somme parziali è monotona e quindi (per il teorema del limite delle successioni
monotone) non può essere indeterminata. Di conseguenza, la somma della serie risulta
ben definita nei reali estesi. La stessa cosa vale, ovviamente, anche se la serie è a termini
definitivamente positivi (o negativi).
98 - Lun. 27/11/00
P
P∞
Criterio del confronto. Siano ∞
n=n0 an e
n=n0 bn due serie a termini non negativi.
Supponiamo an ≤ bn per n ≥ n0 . Allora, nei reali estesi, si ha
∞
X
n=n0
an ≤
∞
X
bn .
n=n0
115
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
P∞
In particolare, se converge la serie
n=n0 bn (detta maggiorante), converge anche (la
P∞
minorante) n=n0 an (e se diverge la minorante, diverge anche la maggiorante).
Dimostrazione. Poiché le due serie sono a termini non negativi, le successioni delle somme
parziali
n
n
X
X
Sn =
a k e Tn =
bk
k=n0
k=n0
risultano crescenti e, conseguentemente, per entrambe esiste (finito o infinito) il limite per
n → +∞. Dall’ipotesi “ an ≤ bn per n ≥ n0 ” si ottiene Sn ≤ Tn per ogni n ≥ n0 , e la tesi
segue immediatamente dal teorema del confronto dei limiti.
Osservazione. Se, nel criterio del confronto, la disuguaglianza an ≤ bn vale soltanto
definitivamente, si può ancora affermare che la convergenza della serie maggiorante implica
la convergenza della minorante e, di conseguenza, la divergenza della minorante implica
la divergenza della maggiorante. In questo caso, tuttavia, non è più detto che si abbia
P∞
P∞
n=n0 bn .
n=n0 an ≤
P
P
Criterio di convergenza assoluta. Se converge ∞
|an |, converge anche ∞
n=n
n=n0 an
0
P∞
(in questo caso si dice che la serie
n=n0 an converge assolutamente) e vale la
disuguaglianza
¯
¯
∞
∞
¯X
¯
X
¯
¯
an ¯ ≤
|an | .
¯
¯
¯
n=n
n=n0
0
−
Dimostrazione. Definiamo due successioni {a+
n } e {an } nel seguente modo:
a+
n =
|an | + an
= max{an , 0} ,
2
a−
n =
|an | − an
= max{−an , 0} ,
2
e osserviamo che
−
an = a+
n − an ,
−
|an | = a+
n + an ,
0 ≤ a+
n ≤ |an |,
0 ≤ a−
n ≤ |an |.
Poiché la serie degli |an | è convergente, per il criterio del confronto convergono anche le
−
serie degli a+
n e degli an . Pertanto, dal teorema del limite della somma, si ottiene
∞
X
n=n0
an =
∞
X
n=n0
a+
n −
∞
X
a−
n ,
n=n0
e ciò prova la convergenza della serie in esame.
P
P
Criterio del confronto asintotico. Siano n an e n bn due serie a termini definitiP
P
vamente positivi. Allora, se an /bn → λ < +∞ e n bn converge, anche n an converge.
In particolare, se il limite λ, oltre ad essere finito, è anche maggiore di zero, le due serie
hanno lo stesso carattere.
116
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Dimostrazione. Per il teorema della permanenza del segno esiste un n̄ tale che an /bn < λ+1
per n ≥ n̄. Si può supporre (eventualmente scegliendo un n̄ più grande) che i termini an e
bn siano positivi per n ≥ n̄. Di conseguenza an ≤ (λ + 1)bn per n ≥ n̄, e da ciò segue, per
il criterio del confronto, che se converge la serie dei bn , converge anche la serie degli an .
Supponiamo ora che il limite λ (oltre che finito) sia positivo. Allora bn /an → 1/λ < +∞;
pertanto, per quanto appena provato, se converge la serie degli an , converge anche la serie
dei bn , e le serie hanno dunque lo stesso carattere.
Facciamo notare che il criterio del confronto asintotico può anche essere usato come criterio di divergenza (sempre nell’ipotesi che le serie in esame siano a termini definitivamente
positivi). Supponiamo infatti che an /bn → λ < +∞ e che la serie degli an sia divergente.
Allora la serie dei bn non può convergere, perché altrimenti convergerebbe anche la serie degli an e, di conseguenza (essendo a termini definitivamente positivi) deve necessariamente
divergere (a +∞).
Esercizi sulle serie numeriche.
99 - Mar. 28/11/00
Criterio integrale.
decrescente. Allora
Sia n0 ∈ Z e sia f : [n0 , +∞) → R una funzione positiva e
∞
X
f (n)
e
n=n0
Z
+∞
f (x)dx
n0
hanno lo stesso carattere. Più precisamente si ha
Z +∞
Z
∞
X
f (x)dx ≤
f (n) ≤
n0 +1
n=n0 +1
+∞
f (x)dx .
n0
Corollario (del criterio integrale). La serie
∞
X
1
,
nα
n=1
detta serie armonica generalizzata, converge se e solo se α > 1.
Esercizio. Mediante un elaboratore elettronico (o una calcolatrice scientifica) valutare,
P
3
con un errore inferiore a 10−5 , la somma S della serie ∞
n=1 1/n .
Suggerimento. Usare la disuguaglianza del criterio integrale per stimare il resto Rn̄ =
P∞
3
S − Sn̄ =
n=n̄+1 1/n della serie. Determinare (anche a tentativi) n̄ in modo che la
stima approssimata R̄n̄ di Rn̄ differisca da Rn̄ meno di 10−5 . Calcolare la somma finita
P
Sn̄ = n̄n=1 1/n3 (mediante un computer) e aggiungere R̄n̄ a Sn̄ .
Esercizi sulle serie numeriche.
117
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
100 - Mar. 28/11/00
Esercizi sulle serie numeriche.
101 - Mer. 29/11/00
Criterio del rapporto. Sia
(nei reali estesi) il
P
n an
una serie a termini positivi. Supponiamo che esista
an+1
= λ.
n→+∞ an
Se λ < 1, la serie converge; se λ > 1, la serie diverge.
lim
Dimostrazione. Supponiamo prima λ < 1 e fissiamo un numero q ∈ (λ, 1). Dal teorema
della permanenza del segno si ha an+1 /an < q definitivamente. Poiché il carattere di una
serie numerica non muta se si altera un numero finito di termini, si può assumere, per
semplicità, che la disuguaglianza an+1 /an < q valga per ogni n ≥ 0. Ne segue
a1 < a0 q,
a2 < a1 q < a0 q 2 ,
...
In generale si ha an < a0 q n , ∀n ∈ N, come si può facilmente verificare per induzione.
P
La serie a termini positivi ∞
n=0 an è quindi maggiorata, termine a termine, dalla serie
P∞
n
geometrica n=0 a0 q , che è convergente. Dunque, per il criterio del confronto, converge
anche la serie in esame.
Supponiamo ora an+1 /an → λ > 1. In questo caso la successione {an } risulta definitivamente crescente e, di conseguenza, il suo limite non può essere zero perché coincide con
il sup an , che è necessariamente positivo. Non essendo verificata la condizione necessaria
per la convergenza, la serie (essendo a termini positivi) diverge a +∞.
Esempio. Consideriamo la serie
∞
X
an
n=0
n!
,
dove a è un numero positivo assegnato. Il suo termine n-esimo è an /n!, quindi
an+1 n!
a
an+1
=
=
−→ 0 .
n
an
(n + 1)! a
n+1
In base criterio del rapporto possiamo dunque concludere che la serie è convergente.
p
P
Criterio della radice. Sia n an una serie numerica e sia λ = lim n |an |. Se λ < 1 la
serie converge (assolutamente), se λ > 1 non converge. In altre parole, λ < 1 è condizione
sufficiente per la convergenza della serie, mentre λ ≤ 1 è condizione necessaria.
Dimostrazione. Mostriamo prima che se λ > 1 la serie non può convergere. In questo caso,
infatti, il termine generale non può tendere a zero, perché se cosı̀ fosse la successione {|an |}
118
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
sarebbe definitivamente minore di 1 e, di conseguenza, sarebbe definitivamente minore di
p
1 anche { n |an |}. Ciò non è possibile perché l’estremo inferiore dei maggioranti definitivi
p
di { n |an |} è λ > 1.
Supponiamo ora λ < 1 e fissiamo un numero q ∈ (λ, 1). Dalla definizione di massimo limite
p
segue n |an | < q definitivamente, e quindi anche |an | < q n definitivamente. Pertanto, per
P
il criterio del confronto, la serie n |an | converge e, di conseguenza, per il criterio della
convergenza assoluta, converge anche la serie in esame.
Esempio. Consideriamo la serie
∞
X
(−1)n 2n
n=1
Si ha
p
n
|an | =
r
n
2n
=
n
3 − 2n
s
n
3n (1
3n − 2n
.
2
2
2n
= (1 − (2/3)n )−1/n −→ .
n
− (2/3) )
3
3
Quindi, in base al criterio della radice, la serie converge.
Esempio. Studiamo il carattere della serie
∞
X
n=1
xn
,
(3 + (−1)n )n
in funzione del parametro x ∈ R. Si ha
s
p
|x|n
|x|
n
.
=
|an | = n
(3 + (−1)n )n
3 + (−1)n
La successione
½
|x|
3 + (−1)n
¾
non ammette limite per n → +∞, ma il suo massimo limite è |x|/2. Dunque (per il criterio
della radice) la serie converge se |x| < 2 e non converge se |x| > 2. Il criterio non dà
informazioni nei punti x = ±2, che vanno quindi analizzati a parte. In tali punti, tuttavia,
il valore assoluto del termine generale assume infinite volte il valore uno, e non è quindi
soddisfatta la condizione necessaria per la convergenza. Possiamo dunque concludere che
la serie in esame converge se e solo se x ∈ (−2, 2).
102 - Mer. 29/11/00
Esercizi sulle serie numeriche.
Esercizi sulle serie numeriche dipendenti da un parametro x ∈ R.
119
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
103 - Gio. 30/11/00
P
Una serie ∞
n=n0 an si dice a segni alterni se an an+1 < 0 per ogni n ≥ n0 (ossia, se i
termini della serie sono alternativamente positivi e negativi).
P
Criterio di Leibniz. Sia ∞
n=n0 an una serie a segni alterni. Se la successione {|an |} è
decrescente ed è infinitesima, allora la serie è convergente. Inoltre, denotata con S la sua
somma e con Sn la sua somma parziale n-esima, risulta Sn > S, se l’ultimo termine di
Sn è positivo, e Sn < S se è negativo. Di conseguenza |S − Sn | < |an+1 |, ∀n ∈ N; ossia
l’errore che si commette nella valutazione di S arrestandosi alla somma parziale n-esima
è inferiore, in valore assoluto, al valore assoluto del primo termine trascurato.
Una serie del tipo
∞
X
fn (x) ,
n=n0
dove le fn sono funzioni reali di variabile reale, è detta serie di funzioni (reali di variabile
reale). Si dice che la serie è definita in un insieme A ⊂ R se il domino di tutte le funzioni
contiene A (ossia, se sono tutte definite per ogni x ∈ A). Ovviamente, la suddetta serie può
essere pensata anche come una serie numerica dipendente da un parametro x ∈ A e, fissato
x ∈ A, la serie numerica cosı̀ ottenuta può essere o non essere convergente. L’insieme dei
numeri x per cui la serie converge si dice insieme di convergenza. Ad esempio, l’insieme
di convergenza della serie
∞
X
xn
n=0
è l’intervallo (−1, 1), visto che si tratta di una serie geometrica di ragione x ∈ R.
Esercizi sulle serie numeriche e sulle serie di funzioni.
104 - Gio. 30/11/00
Una serie di funzioni del tipo
∞
X
n=0
an (x − x0 )n ,
dove x0 e gli an sono numeri reali assegnati, si dice una serie di potenze in campo reale.
Il punto x0 si chiama centro della serie.
Esercizi sullo studio dell’insieme di convergenza di alcune serie di funzioni e, in particolare,
di alcune serie di potenze.
120
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
105 - Ven. 1/12/00
Se una serie di funzioni
ottiene un numero
P∞
n=n0
fn (x) converge in un insieme A, allora per ogni x ∈ A si
f (x) =
∞
X
fn (x) .
n=n0
Risulta cosı̀ definita una funzione reale di variabile reale f : A → R. È naturale porsi la
domanda se una tale funzione sia continua quando sono continue tutte le fn . In altre
parole: è ancora vero che la somma di funzioni continue è una funzione continua nel caso
di infiniti addendi? La risposta, purtroppo, è negativa, come dimostra il seguente
Esempio. Consideriamo, nell’intervallo [0, 1], la serie di funzioni
∞
X
n=1
(1 − x)xn .
Per x ∈ [0, 1) la serie è geometrica di ragione x e primo termine (1−x)x; pertanto converge
e la sua somma è data da
(1 − x)x
= x.
1−x
Per x = 1 tutte le funzioni fn (x) = (1 − x)x sono nulle e, di conseguenza, la serie converge
anche in tale punto ed ha somma zero. Si può concludere che la serie converge in tutto
l’intervallo chiuso [0, 1] e la sua somma
½
x se x ∈ [0, 1)
f (x) =
0 se x = 1
è discontinua, sebbene tutte le fn siano continue (sono addirittura C ∞ ).
Ricordiamo che una funzione f (x) si dice dominata da una costante c [da una funzione
ϕ(x) ] in A se |f (x)| ≤ c [ |f (x)| ≤ ϕ(x) ] per ogni x ∈ A.
P
Definizione. Si dice che una serie di funzioni ∞
n=n0 fn (x) converge totalmente in un
insieme A ⊂ R se è dominata, termine a termine, da una serie numerica convergente;
P
ossia, se esiste una serie numerica convergente ∞
n=n0 cn tale che |fn (x)| ≤ cn , ∀n ≥ n0 e
∀x ∈ A.
P
Si fa notare che se una serie di funzioni ∞
n=n0 fn (x) converge totalmente in un insieme
A, allora (come conseguenza dei criteri di convergenza assoluta e del confronto) converge
(assolutamente) per ogni x ∈ A. Risulta quindi ben definita la funzione somma
f (x) =
∞
X
fn (x) .
n=n0
121
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Osserviamo inoltre che la più piccola serie numerica che domina
cui termine generale λn è dato da
P∞
n=n0
fn (x) è quella il
λn = sup{|fn (x)| : x ∈ A}.
Pertanto, se tale serie numerica converge, allora la serie di funzioni converge totalmente.
P
In caso contrario, ossia se ∞
n=n0 λn = +∞, per il criterio del confronto nessuna serie
numerica che domina la serie di funzioni può convergere. Possiamo quindi enunciare il
seguente
Teorema. Condizione necessaria e sufficiente affinché una serie di funzioni
∞
X
fn (x)
n=n0
converga totalmente in un insieme A è che sia convergente la serie numerica
∞
X
λn ,
n=n0
dove λn = sup{|fn (x)| : x ∈ A}.
Esempi ed esercizi.
106 - Ven. 1/12/00
L’importanza della convergenza totale è giustificata dai due seguenti risultati (di continuità
e di derivabilità).
Teorema (di continuità per le serie di funzioni). Se una serie di funzioni continue,
P∞
n=n0 fn (x), converge totalmente in un insieme A, allora la funzione somma f (x) :=
P∞
n=n0 fn (x) risulta continua.
Teorema (di derivabilità per le serie di funzioni). Se una serie di funzioni di classe C 1 ,
P∞
P
0
serie delle derivate, ∞
n=n0 fn (x), converge in un insieme A e la
n=n0 fn (x), converge
P∞
totalmente in A, allora la funzione f (x) := n=n0 fn (x) risulta derivabile e si ha f 0 (x) =
P∞
0
n=n0 fn (x).
Teorema. L’insieme di convergenza di una serie di potenze in campo reale è un intervallo
non vuoto, detto intervallo di convergenza, i cui estremi sono equidistanti dal centro della
serie.
P∞
n
Dimostrazione. Sia
n=0 an (x − x0 ) una serie di potenze. Fissiamo un x ∈ R e
applichiamo il criterio della radice alla serie numerica corrispondente. Si ha
p
p
p
lim n |an (x − x0 )n | = lim n |an ||x − x0 |n = lim |x − x0 | n |an | .
122
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Ovviamente, se x = x0 la serie converge (e la sua somma vale a0 ). Si può quindi supporre
x 6= x0 , evitando cosı̀ la forma indeterminata 0 · ∞ nel suddetto limite. Ne segue (nei reali
estesi)
p
p
lim |x − x0 | n |an | = |x − x0 | lim n |an | .
p
Dunque, posto λ = lim n |an | ∈ R, la serie converge nel punto x se |x − x0 |λ < 1 e non
converge se (nei reali estesi) risulta |x − x0 |λ > 1. Di conseguenza, posto (nei reali estesi)
r = 1/λ, si può concludere che la serie converge in tutti i punti interni all’intervallo [x0 −
r, x0 + r] e non converge nei punti esterni (ossia, interni al complementare). L’incertezza,
quando 0 < r < +∞, si riduce ai soli punti di frontiera x0 − r e x0 + r (in quei casi, infatti,
p
il lim n |an (x − x0 )n | = 1, e il criterio della radice non dà informazioni). In ogni caso,
l’insieme di convergenza è un intervallo (aperto, chiuso o semiaperto) e x0 è equidistante
dagli estremi (finiti o infiniti che siano).
Definizione. La semiampiezza dell’intervallo di convergenza di una serie di potenze si
chiama raggio di convergenza della serie.
Osservazione. Dalla dimostrazione del teorema precedente si deduce facilmente che il
P
n
raggio di convergenza r di una serie di potenze ∞
n=0 an (x − x0 ) è dato dalla seguente
formula (da interpretare nei reali estesi):
r=
lim
1
p
n
|an |
.
Avvertenza. La suddetta formula, per quanto utile dal punto di vista teorico, può
facilmente condurre a valutazioni errate sul piano pratico (soprattutto per la difficoltà
di determinare l’espressione generale del coefficiente an ). Se ne sconsiglia pertanto l’uso
negli esercizi da parte degli studenti. Il modo più sicuro per determinare l’insieme di
convergenza di una serie di potenze (o, più in generale, di funzioni) è quello di trattarla
come una serie numerica dipendente da un parametro x.
Esempio. Determiniamo il raggio di convergenza della serie di potenze
∞
X
x2n
.
2n
n=0
(Primo metodo) Fissiamo x ∈ R e applichiamo il criterio della radice alla serie numerica
P 2n n
n x /2 . Si ha
p
p
lim n |x2n /2n | = lim n |x|2n /2n = x2 /2.
√
√
Pertanto la serie converge per |x| < 2 e non converge per |x| > 2. L’incertezza dovuta
√
al criterio della radice si riduce a due soli punti: x = ± 2 e, conseguentemente, il raggio di
√
convergenza r è 2. Talvolta lo studio negli estremi dell’intervallo presenta delle notevoli
123
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
√
difficoltà, ma non in questo caso. Si osservi infatti che per x = ± 2 il termine generale
non tende a zero, e quindi la serie non può convergere.
p
(Metodo errato) Si ha an = 1/2n . Quindi lim n |an | = 1/2 e, di conseguenza, r = 2.
(Secondo metodo) Determiniamo l’espressione generale del coefficiente an della serie
∞
X
an xn =
∞
X
x2n
.
2n
n=0
n=0
Sviluppando la sommatoria si ottiene
a0 + a1 x + a2 x2 + a3 x3 + a4 x4 + · · · = 1 + x2 /2 + x4 /22 + · · ·
Quindi a0 = 1, a1 = 0, a2 = 1/2, a3 = 0, a4 = 1/22 , . . .
In generale si ha
½ −n/2
2
se n è pari
an =
0
se n è dispari
o
np
In questo caso il limite della successione n |an | non esiste; tuttavia, il limite superiore
√
√
(che esiste sempre) vale 1/ 2. Da cui segue r = 2.
Da ora in poi, tra i metodi illustrati per il calcolo del raggio di convergenza, lo studente è
libero di seguire quello che gli è più congeniale (o meno sgradito), purché non sia il metodo
errato.
Esercizi consigliati [Spiegel, cap. 11]: 1, 2, 3, 6, 7, 11, 12, 13, 16, 17, 19, 21, 22, 25.
107 - Lun. 4/12/00
Lemma (della convergenza totale per le serie di potenze). Una serie di potenze
∞
X
n=0
an (x − x0 )n
converge totalmente in ogni intervallo concentrico con quello di convergenza e di raggio
inferiore. Ossia, la serie converge totalmente in ogni intervallo [x0 − ρ, x0 + ρ], con 0 <
ρ < r; dove x0 è il centro della serie e r il raggio di convergenza.
Dimostrazione. Basta osservare che se |x − x0 | ≤ ρ, si ha
|an (x − x0 )n | = |an ||x − x0 |n ≤ |an |ρn
e che la serie numerica
∞
X
n=n0
|an |ρn
124
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
è convergente, essendo
lim
p
n
p
|an |ρn = lim ρ n |an | = ρ/r < 1 .
Osservazione. Una funzione definita come serie di potenze è continua in ogni punto
interno all’intervallo aperto di convergenza (detto dominio di convergenza). Infatti, se x̄ è
un qualunque punto interno a tale intervallo, denotato con x0 il centro della serie e con r
il suo raggio di convergenza, esiste un intervallo (x0 − ρ, x0 + ρ), con 0 < ρ < r, contenente
x̄. Questo implica che la funzione somma è continua nell’intervallo di centro x0 e raggio ρ,
essendo la serie totalmente convergente in tale intervallo. Pertanto, la funzione è continua
anche nel punto x̄.
Lemma (di invarianza del dominio di convergenza). Una serie di potenze
∞
X
n=0
e la serie delle sue derivate
∞
X
n=1
an (x − x0 )n
nan (x − x0 )n−1
hanno lo stesso raggio di convergenza. Di conseguenza, le due serie hanno lo stesso
dominio di convergenza; ossia, (x0 − r, x0 + r).
Dimostrazione. Osserviamo che se si fissa x ∈ R, si può pensare a
∞
X
n=1
nan (x − x0 )n−1
come ad una serie numerica. Pertanto, se si moltiplica ogni suo termine per il numero
x − x0 , il suo carattere non viene alterato. Di conseguenza, la nuova serie, ancora di
potenze, avrà lo stesso insieme di convergenza della precedente. È sufficiente quindi provare
p
che il raggio di convergenza 1/ lim n |nan | di
∞
X
n=n0
nan (x − x0 )n
coincide con il raggio di convergenza 1/ lim
∞
X
n=0
p
n
|an | di
an (x − x0 )n .
Si ha infatti
lim
p
n
|nan | = lim
p
p
p
√
√
n
n n |an | = lim n n lim n |an | = lim n |an |.
125
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Teorema (di derivazione delle serie di potenze). Sia
f (x) :=
∞
X
n=0
an (x − x0 )n
una funzione definita da una serie di potenze. Allora f è derivabile nel suo dominio di
convergenza e si ha
∞
X
0
f (x) =
nan (x − x0 )n−1 .
n=1
Dimostrazione. Denotiamo con r il raggio di convergenza della prima serie (quella che
definisce f ). Fissato un qualunque punto x appartenente al dominio di convergenza (x0 −
r, x0 + r) della prima serie, esiste un intervallo (x0 − ρ, x0 + ρ), con 0 < ρ < r, contenente
x. Per il lemma precedente, r è anche il raggio di convergenza della serie delle derivate,
e quindi, in base al lemma della convergenza totale per le serie di potenze, entrambe le
serie convergono totalmente in (x0 − ρ, x0 + ρ). Dal teorema di derivabilità delle serie di
funzioni segue che f è derivabile in x e risulta
f 0 (x) =
∞
X
n=1
nan (x − x0 )n−1 .
Esercizio. Trovare una primitiva della funzione f (x) :=
P∞
n=0 an x
n.
Suggerimento. Utilizzare il teorema di derivazione delle serie di potenze.
Osservazione. Poiché la derivata di una serie di potenze è ancora una serie di potenze,
dal teorema precedente segue che le funzioni definite tramite serie di potenze sono di classe
C ∞.
108 - Lun. 4/12/00
Osservazione. Sia
f (x) := a0 + a1 (x − x0 ) + a2 (x − x0 )2 + · · · + an (x − x0 )n + · · ·
una funzione definita mediante una serie di potenze. Ponendo x = x0 , si ottiene
a0 = f (x0 ). Derivando e ponendo di nuovo x = x0 , si ha a1 = f 0 (x0 ). Analogamente, mediante derivate successive, in generale si ottiene an = f (n) (x0 )/n!. Pertanto, risulta
necessariamente
∞
X
f (n) (x0 )
(x − x0 )n ,
f (x) =
n!
n=0
dove f (0) (x0 ) denota f (x0 ).
126
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Definizione. Una funzione f (x) si dice sviluppabile in serie di potenze in un intorno di
un punto x0 (o analitica in x0 ) se esiste un intorno di x0 in cui vale l’uguaglianza
f (x) =
∞
X
f (n) (x0 )
n=0
n!
(x − x0 )n ,
detta serie di Taylor di f (x) di centro x0 (o di MacLaurin, quando x0 = 0). Si dice
che f (x) è analitica se ogni punto del suo dominio ammette un intorno in cui f (x) è
sviluppabile in serie di potenze (ossia, se è analitica in ogni punto del suo dominio).
Poiché, come abbiamo già osservato, le funzioni definite tramite serie di potenze sono di
classe C ∞ , le funzioni analitiche sono necessariamente C ∞ . Quindi, ad esempio, le funzioni
valore assoluto di x e parte intera di x non sono analitiche (sono sviluppabili in serie di
potenze nell’intorno di “quasi tutti” i punti del dominio, ma non di tutti).
Esistono (in campo reale) funzioni di classe C ∞ ma non analitiche. Una di queste è
½ −1/|x|
e
se x 6= 0
f (x) :=
0
se x = 0,
le cui derivate successive (come si potrebbe provare) risultano tutte continue e nulle nel
punto x0 = 0. Quindi, se f (x) fosse analitica, in un intorno del punto x0 = 0 dovrebbe
valere l’uguaglianza
∞
X
f (n) (0) n
x ,
f (x) =
n!
n=0
e ciò è impossibile perché f (x) 6= 0 per x 6= 0, mentre la serie ha per somma zero (essendo
nulli tutti i suoi termini).
Esempio. Consideriamo la funzione
f (x) =
x
.
1 + x2
Dalla teoria delle serie geometriche sappiamo che, se | − x2 | < 1, f (x) rappresenta la
somma di una serie geometrica di ragione −x2 e primo termine x. Per x ∈ (−1, 1) si ha
quindi l’uguaglianza
x
= x − x3 + x5 − x7 + · · · + (−1)n x2n+1 + · · ·
1 + x2
e ciò prova che f (x) è sviluppabile in serie di MacLaurin in un intorno del punto x0 = 0.
Mostriamo ora che la funzione f (x) = ex è sviluppabile in serie di MacLaurin e che lo
sviluppo è addirittura valido per ogni x ∈ R (in un certo senso si può dire che in questo
caso l’intorno in cui vale lo sviluppo ha raggio infinito). Fissiamo un punto x ∈ R.
127
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Sappiamo che se ex è effettivamente sviluppabile in serie di MacLaurin, allora si deve
necessariamente avere
∞
∞
X
f (n) (0) n X xn
x =
.
ex =
n!
n!
n=0
n=0
Per definizione di serie, ciò equivale ad affermare
lim (ex − Pn (x)) = 0 ,
n→∞
dove la somma parziale n-esima
Pn (x) =
non è altro che il polinomio di MacLaurin di
n
X
xk
k!
k=0
ex di
ordine n. Ricordiamo che
Rn (x) := ex − Pn (x)
si chiama resto della formula di MacLaurin di ordine n della funzione ex e può essere
scritto nella forma di Lagrange; ovvero
Rn (x) = f (n+1) (cn (x))
xn+1
xn+1
= ecn (x)
,
(n + 1)!
(n + 1)!
dove il punto cn (x), che ovviamente dipende sia da n sia dal numero x fissato, appartiene
al segmento 0x di estremi 0 e x. In ogni caso cn (x) sta nell’intervallo [−|x|, |x|], e quindi,
per la crescenza della funzione esponenziale, risulta
|Rn (x)| ≤ e|x|
|x|n+1
.
(n + 1)!
Osserviamo ora che |x|n+1 /(n + 1)! → 0 per n → +∞, essendo il termine generale di
una serie convergente, come si può facilmente verificare col criterio del rapporto. Poiché
x è fissato, Rn (x) → 0 per x → +∞, e la funzione ex è quindi sviluppabile in serie di
MacLaurin. Per l’arbitrarietà del punto x, possiamo concludere che lo sviluppo è valido
in tutto R.
Osservazione. Ponendo x = 1 nello sviluppo in serie di MacLaurin di ex si ottiene la
seguente espressione del numero e in serie numerica:
e=
∞
X
1
.
n!
n=0
Mostriamo ora che la funzione ex è analitica. A tale scopo fissiamo x0 ∈ R e poniamo, per
comodità, x = x0 + h. Si ha
ex = ex0 +h = ex0 eh = ex0 (1 + h +
hn
h2
+ ··· +
+ · · ·) =
2!
n!
128
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
ex0 + ex0 h + ex0
Quindi
ex = ex0 + ex0 (x − x0 ) + ex0
h2
hn
+ · · · + e x0
+ ···
2!
n!
(x − x0 )n
(x − x0 )2
+ · · · + ex0
+ ···
2!
n!
È noto che non solo ex , ma tutte le funzioni esprimibili tramite serie di potenze sono
analitiche. Più precisamente, se
f (x) :=
∞
X
n=0
an (x − x0 )n
per x ∈ (x0 − r, x0 + r), allora, fissato un punto x̄ ∈ (x0 − r, x0 + r), si ha
f (x) =
∞
X
f (n) (x̄)
n=0
n!
(x − x̄)n
per ogni x nell’intorno di x̄ di raggio r − |x̄ − x0 |.
Esercizio. Provare che le funzioni cos x e sen x sono sviluppabili in serie di MacLaurin.
Determinarne lo sviluppo e l’intorno di validità.
Suggerimento.
esponenziale.
Seguire, passo passo, il metodo usato per lo sviluppo della funzione
Esercizio. Mostrare che le funzioni sen x e cos x sono analitiche.
Suggerimento. Sfruttare le formule di addizione del seno e del coseno.
109 - Mar. 5/12/00
Il metodo usato per sviluppare in serie di MacLaurin le funzioni ex , sen x e cos x (basato su
la stima del resto della formula di Taylor) non è adatto per la funzione f (x) = log(1 + x).
In questo caso conviene procedere diversamente:
– si determina prima lo sviluppo della derivata di f (x);
– successivamente, mediante il teorema di derivazione delle serie di potenze, si trova
una primitiva dello sviluppo di f 0 (x);
– infine, tra tutte le primitive di f 0 (x) espresse in serie di potenze, si sceglie quella che
coincide con f (x).
Tale metodo è adatto anche per determinare lo sviluppo di arctang x e, in generale, di
tutte le funzioni di cui è facile sviluppare la derivata. A tale proposito ricordiamo che due
primitive di una stessa funzione (definita in un intervallo) differiscono per una costante e,
di conseguenza, se coincidono in un punto, coincidono in tutto l’intervallo di definizione.
129
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Cominciamo col determinare, col metodo appena esposto, lo sviluppo di MacLaurin di
log(1 + x). La derivata (1 + x)−1 di log(1 + x) rappresenta, per x ∈ (−1, 1), la somma di
una serie geometrica di ragione −x e primo termine 1. Quindi, per x ∈ (−1, 1), si ha
(1 + x)−1 = 1 − x + x2 − x3 + · · · + (−1)n xn + · · ·
Dal teorema di derivazione delle serie di potenze si deduce che
g(x) = x −
xn+1
x2 x3 x4
+
−
+ · · · + (−1)n
+ ···
2
3
4
n+1
è una primitiva di (1 + x)−1 ; ma, è bene precisare, soltanto per x appartenente al comune
dominio di convergenza (−1, 1) delle due serie. Dunque, log(1 + x) e g(x) hanno la stessa
derivata per x ∈ (−1, 1). Poiché coincidono per x = 0, si può concludere che
log(1 + x) = x −
xn+1
x2 x3 x4
+
−
+ · · · + (−1)n
+ ···
2
3
4
n+1
∀x ∈ (−1, 1) .
Esercizio. Provare che la funzione arctang x è sviluppabile in serie di MacLaurin,
determinarne lo sviluppo e l’intervallo di validità.
Suggerimento. Sviluppare prima la derivata di arctang x.
2
Esercizio. Provare che la funzione e−x è sviluppabile in serie di MacLaurin, determinarne
lo sviluppo e l’intervallo di validità.
Suggerimento. Si ricorda che l’uguaglianza
ex = 1 + x +
xn
x2
+ ··· +
+ ···
2!
n!
è valida per ogni numero reale x, e quindi, in particolare, è valida per ogni numero reale
−x2 .
Esercizio. Provare che la funzione degli errori,
Z x
2
2
e−t dt ,
erf x := √
π 0
è sviluppabile in serie di MacLaurin, determinarne lo sviluppo e l’intervallo di validità.
Suggerimento. Sviluppare prima la derivata di erf x.
Esercizio. Provare che la funzione
f (x) :=
(
sen x
x
1
se x 6= 0
se x = 0
130
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
è sviluppabile in serie di MacLaurin, determinarne lo sviluppo e l’intervallo di validità.
Dedurre da ciò che f (x) è di classe C ∞ .
Suggerimento. Sviluppare prima sen x e, successivamente, ragionare un po’, tenendo conto
del significato di serie di potenze.
Mostriamo ora che la funzione log x è analitica. Allo scopo fissiamo un punto x0 > 0
(ossia, appartenente al dominio di log x). Ponendo, per semplicità, x = x0 + h, si ottiene
log x = log(x0 + h) = log(x0 (1 +
Quindi
log(x0 + h) = log x0 +
h
h
)) = log x0 + log(1 + ) .
x0
x0
h2
hn+1
h
− 2 + · · · + (−1)n
+ ···
x0 2x0
(n + 1)xn+1
0
o, equivalentemente,
log x = log x0 +
n+1
(x − x0 ) (x − x0 )2
n (x − x0 )
+ ···
−
+
·
·
·
+
(−1)
x0
2x20
(n + 1)xn+1
0
110 - Mar. 5/12/00
Ricordiamo che una successione in un insieme X è un’applicazione da N ad X. Se X è un
sottoinsieme di C, la successione è detta complessa (o di numeri complessi).
Una successione {zn } di numeri complessi si dice convergente ad un numero complesso z
se |zn − z| → 0; si dice divergente se |zn | → +∞. Se una successione non è né convergente
né divergente, allora si dice indeterminata.
Si potrebbe dimostrare che una successione {zn } = {an +ibn } di numeri complessi converge
ad un numero complesso a = a + ib se e solo se an → a e bn → b.
Sia {zn } una successione di numeri complessi. Analogamente a quanto visto per le serie
di numeri reali, l’espressione
∞
X
zn
n=1
si legge “serie (o somma) per n che va da 1 a +∞ di zn ” e rappresenta, in modo sintetico,
il
n
X
lim
zk .
n→+∞
k=1
In altri termini, posto Sn = z1 + z2 + ... + zn , per definizione si ha
∞
X
n=1
zn = lim Sn .
n→+∞
131
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
La successione {Sn } si dice successione delle somme parziali (o delle ridotte) della serie,
mentre zn è detto il termine generale. Il carattere della serie è, per definizione, il carattere
della successione {Sn }. Come nel caso reale, il limite S, quando esiste, si dice somma della
serie.
Talvolta, invece di sommare a partire da n = 1, si parte da un indice n0 ∈ Z (anche
negativo). Scriveremo allora
∞
X
zn .
n=n0
Una serie dipendente da un parametro z ∈ C del tipo
∞
X
n=0
an (z − z0 )n ,
dove z0 e gli an sono numeri complessi assegnati, si dice una serie di potenze in campo
complesso. Il punto z0 si chiama centro della serie. Si potrebbe dimostrare che l’insieme
dei punti z ∈ C in cui la serie converge (detto insieme di convergenza) è un cerchio (in
senso generalizzato) di centro z0 . Più precisamente, esiste un numero reale esteso r ≥ 0,
detto raggio di convergenza della serie, con la proprietà che la serie converge se la distanza
|z − z0 | di z dal centro z0 è minore di r e non converge se |z − z0 | > r. Quindi, quando
r < +∞, la serie converge nei punti interni al cerchio di centro z0 e raggio r e non converge
nei punti esterni, mentre nei punti della circonferenza di equazione |z − z0 | = r la serie
può convergere o non convergere. Se, invece, r = +∞, la serie converge in tutto il piano
complesso, che può essere pensato come un cerchio di raggio infinito e centro in ogni punto
(quindi anche in z0 ).
Ricordiamo che la serie
xn
x2
+ ··· +
+ ···
2!
n!
converge per ogni x ∈ R, e la sua somma vale ex . Pertanto, se al posto del numero reale x
si sostituisce un numero complesso z, si ottiene una serie in campo complesso, il cui cerchio
di convergenza, dovendo contenere l’asse reale, coincide con l’intero piano complesso. Ha
senso pertanto estendere la funzione esponenziale al campo complesso nel modo seguente:
1+x+
ez := 1 + z +
zn
z2
+ ··· +
+ ···
2!
n!
Analogamente al caso reale, anche la funzione esponenziale in campo complesso gode della
proprietà fondamentale. Si ha infatti
ez1 +z2 = ez1 ez2 ,
∀ z1 , z2 ∈ C ,
da cui si deduce il
132
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Teorema (di rappresentazione della funzione esponenziale in campo complesso). Per ogni
numero complesso z = x + iy si ha
ex+iy = ex (cos y + i sen y) .
Ossia, ex+iy è un numero complesso di modulo ex e argomento y.
La funzione ez , denotata anche exp z, è un esempio di funzione complessa di variabile
complessa; ossia, di una funzione con dominio e codominio in C. Un altro esempio è dato
dalla potenza z n o, più in generale, da un polinomio di variabile complessa a coefficienti
reali o complessi. Anche le funzioni razionali complesse, ossia le funzioni ottenute mediante
il quoziente di polinomi complessi, sono esempi funzioni complesse di variabile complessa.
La derivata in un punto z0 ∈ C di una funzione complessa f si definisce in modo del tutto
analogo al caso reale: è (quando esiste) il
lim
z→z0
f (z) − f (z0 )
.
z − z0
Proviamo, ad esempio, che la funzione f (z) = z 2 è derivabile in ogni punto. Si ha infatti
f 0 (z0 ) = lim
z→z0
(z − z0 )(z + z0 )
z 2 − z02
= lim
= lim (z + z0 ) = 2z0 .
z→z0
z→z0
z − z0
z − z0
Più in generale, se f (z) = z n , si ha f 0 (z0 ) = nz0n−1 . Per provarlo basta ricordarsi che
z n − z0n = (z − z0 )(z n−1 + z n−2 z0 + z n−3 z02 + · · · + z0n−1 ) ,
come, d’altra parte, è facile verificare eseguendo il prodotto.
Teorema (di derivazione delle serie di potenze in campo complesso). Sia
f (z) :=
∞
X
n=0
an (z − z0 )n
una funzione complessa definita da una serie di potenze. Allora f è derivabile nel cerchio
aperto di convergenza e si ha
f 0 (z) =
∞
X
n=1
nan (z − z0 )n−1 .
Esercizio. Dedurre dal precedente teorema che la derivata di ez è ez .
111 - Mer. 6/12/00
Sia g: W → R una funzione continua su un aperto W di R3 . Un’uguaglianza del tipo
g(x, y, y 0 ) = 0
133
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
o del tipo
g(x, y(x), y 0 (x)) = 0
si chiama equazione differenziale (ordinaria del prim’ordine).
Si fa presente che per capire cosa sia un’equazione (anche non differenziale), a parte il modo
di chiamarla o di scriverla, è indispensabile aver ben definito il concetto di soluzione. In
altre parole, è necessario avere un criterio chiaro per decidere quando, in un assegnato
insieme in cui si cercano le soluzioni, un elemento di detto insieme è o non è una soluzione.
Per quanto riguarda la suddetta equazione, l’insieme in cui si cercano le soluzioni è dato
dalle funzioni reali di classe C 1 definite in un intervallo non banale (l’intervallo può variare
da funzione a funzione). Una funzione y(x), di classe C 1 in un intervallo J, è una soluzione
se per ogni x ∈ J si ha (x, y(x), y 0 (x)) ∈ W e
g(x, y(x), y 0 (x)) = 0 .
In particolare, data una soluzione y: J → R, la sua restrizione ad un sottointervallo non
banale di J è ancora una soluzione. Tra tutte le soluzioni, quelle che non sono restrizione
di altre soluzioni si dicono massimali (o non prolungabili). Si potrebbe dimostrare che ogni
soluzione non massimale è la restrizione di una massimale. In altre parole, ogni soluzione
non massimale si può prolungare fino ad ottenere una soluzione massimale. L’insieme
di tutte le soluzioni di un’equazione differenziale si dice soluzione generale o integrale
generale.
Talvolta la funzione g(x, y, y 0 ) è del tipo y 0 − f (x, y), con f definita (e continua) in un
aperto U di R2 . Si osservi che in questo caso l’aperto W in cui è definita la funzione
g(x, y, y 0 ) := y 0 − f (x, y) è U × R, e l’equazione può essere scritta nella forma
y 0 = f (x, y) ,
detta forma normale.
Da ora in avanti, a meno che non sia altrimenti specificato, ci occuperemo di equazioni
differenziali in forma normale.
Il più banale esempio di equazione differenziale è
y 0 = f (x) ,
dove f è una funzione continua definita in un intervallo J ⊂ R. In questo caso la soluzione
generale è data dall’insieme delle primitive di f .
Non sempre la variabile di un’equazione differenziale viene indicata con x, e non sempre
la funzione incognita si denota con y. Ad esempio,
x0 = f (t, x)
134
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
è un’equazione differenziale dove t è la variabile e x(t) la funzione incognita.
Esempio della carica di un condensatore.
112 - Mer. 6/12/00
Un’equazione differenziale del prim’ordine si dice lineare se è della forma
y 0 = a(x)y + b(x) ,
dove a(x) e b(x) sono due funzioni continue definite in un intervallo J. In particolare,
quando il termine noto b(x) è identicamente nullo, l’equazione si dice lineare omogenea,
e in questo caso la funzione identicamente nulla è soluzione dell’equazione differenziale
(si chiama soluzione banale o nulla). Si potrebbe dimostrare (ma non lo facciamo) che
se la soluzione di un’equazione lineare omogenea è nulla in un punto, allora è nulla in
tutto l’intervallo in cui è definita (è una conseguenza del teorema di esistenza e unicità
che enunceremo più avanti).
Teorema. Sia a(x) una funzione continua in un intervallo J ⊂ R.
(massimali) dell’equazione (lineare omogenea del prim’ordine)
Le soluzioni
y 0 = a(x)y
sono le funzioni del tipo
y(x) = ceA(x) ,
dove A(x) è una primitiva di a(x) in J e c un’arbitraria costante.
Dimostrazione. Proviamo prima che se y(x) è una soluzione, allora esiste una costante c
tale che y(x) = ceA(x) . Se y(x) è la soluzione banale, allora l’uguaglianza è verificata per
c = 0. Supponiamo quindi che y(x) non sia banale. Per quanto detto prima, y(x) non si
annulla mai (altrimenti sarebbe sempre nulla). Possiamo quindi scrivere
y 0 (x)
= a(x)
y(x)
o, equivalentemente,
d
d
log |y(x)| =
A(x) .
dx
dx
Le due funzioni log |y(x)| e A(x) hanno quindi la stessa derivata, ed essendo definite in un
intervallo, esiste una costante k ∈ R tale che
log |y(x)| = A(x) + k .
Dunque
|y(x)| = eA(x)+k = ek eA(x) .
135
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Poiché y(x) non si annulla mai ed è continua in un intervallo, per il Secondo Teorema di
Weierstrass ha sempre lo stesso segno. Possiamo quindi concludere che
y(x) = ceA(x) ,
dove c = ek se y(x) > 0, e c = −ek se y(x) < 0.
Rimane da verificare che ogni funzione del tipo y(x) = ceA(x) è effettivamente una
soluzione, e questo è lasciato per esercizio allo studente.
Esempi ed esercizi.
113 - Gio. 7/12/00
Sia y 0 = f (x, y) un’equazione differenziale del prim’ordine in forma normale e sia U ⊂ R2
l’aperto in cui è definita la funzione f . Dato un punto (x0 , y0 ) ∈ U , ci si pone il problema
di trovare, tra tutte le soluzioni y(x) della suddetta equazione, quella che verifica (o quelle
che verificano) la condizione y(x0 ) = y0 . In altre parole, tra tutte le soluzioni, si cercano
quelle il cui grafico contiene il punto (x0 , y0 ) assegnato. Tale problema viene detto di
Cauchy; cosı̀ come di Cauchy si chiama la condizione y(x0 ) = y0 .
Il seguente risultato dà una risposta al problema posto:
Teorema (di esistenza e unicità per le equazioni del prim’ordine).
l’equazione differenziale
y 0 = f (x, y) ,
Consideriamo
dove f è una funzione continua in un aperto U ⊂ R2 . Se f è derivabile rispetto ad y e
∂f /∂y è continua, allora, per ogni (x0 , y0 ) ∈ U , la suddetta equazione ammette un’unica
soluzione massimale che verifica la condizione y(x0 ) = y0 .
Notiamo che, nel caso in cui la funzione f abbia come dominio una striscia (a, b)×R (con a
e b reali estesi), non c’è da aspettarsi, in generale, che le soluzioni massimali siano definite
in tutto (a, b), come mostra l’esempio che segue. Una soluzione definita in tutto (a, b) sarà
detta una soluzione globale.
Esempio. Consideriamo il problema di Cauchy
(
y0 = y2
y(0) = 1 .
La soluzione massimale di tale problema (il metodo per trovarla sarà visto dopo) è la
restrizione all’intervallo (−∞, 1) della funzione
y(x) =
1
1−x
136
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
(ricordiamo che abbiamo assunto, per definizione, che il dominio di una soluzione di
un’equazione differenziale sia un intervallo).
Dal teorema di esistenza e unicità si deduce un’importante conseguenza:
Corollario. Consideriamo l’equazione differenziale
y 0 = f (x, y) ,
dove f è una funzione continua in un aperto U ⊂ R2 . Supponiamo che f sia derivabile
rispetto ad y con derivata continua. Allora i grafici di due differenti soluzioni massimali
non possono intersecarsi.
Esempio (di non unicità della soluzione di un problema di Cauchy). Si osservi che le
funzioni y1 (x) ≡ 0 e y2 (x) = x3 sono due soluzioni dell’equazione differenziale
p
y0 = 3 3 y2
e verificano entrambe la condizione di Cauchy y(0) = 0.
Il seguente importante risultato asserisce che la continuità della funzione f assicura l’esistenza (anche se non l’unicità) di almeno una soluzione del problema di Cauchy per
l’equazione y 0 = f (x, y):
Teorema di esistenza di Peano. Sia f : U → R una funzione continua su un aperto
U ⊂ R2 . Allora, per ogni (x0 , y0 ) ∈ U , l’equazione y 0 = f (x, y) ammette almeno una
soluzione massimale che verifica la condizione y(x0 ) = y0 .
Una proprietà significativa delle soluzioni di un’equazione differenziale è espressa dal teorema che segue. Per enunciarlo in modo più generale introduciamo la seguente definizione:
una soluzione y: J → R che non sia restrizione di un’altra soluzione definita in un intervallo
più ampio a destra [sinistra] verrà detta massimale a destra [sinistra] (o non prolungabile
a destra [sinistra]). Ovviamente, una soluzione è massimale se e solo se è massimale sia a
destra sia a sinistra.
Teorema di Kamke. Sia f : U → R una funzione continua su un aperto U ⊂ R2 . Il
grafico di una soluzione massimale a destra [a sinistra] dell’equazione differenziale y 0 =
f (x, y) non può essere contenuto in un sottoinsieme compatto di U .
114 - Gio. 7/12/00
Teorema. Supponiamo che ȳ(x) sia una soluzione dell’equazione differenziale lineare
y 0 = a(x)y + b(x) ,
137
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
dove a(x) e b(x) sono funzioni continue in un intervallo J ⊂ R. Allora ogni altra soluzione
si ottiene aggiungendo ad ȳ(x) la soluzione generale dell’equazione omogenea associata
y 0 = a(x)y.
Dimostrazione. Proviamo prima che se u(x) è una soluzione dell’equazione omogenea,
allora y(x) := ȳ(x) + u(x) è soluzione della non omogenea. Dalle uguaglianze
ȳ 0 (x) = a(x)ȳ(x) + b(x)
e
u0 (x) = a(x)u(x)
segue
ȳ 0 (x) + u0 (x) = (a(x)ȳ(x) + b(x)) + a(x)u(x) =
a(x)(ȳ(x) + u(x)) + b(x) .
Quindi
y 0 (x) = a(x)y(x) + b(x) ,
e ciò prova che y(x) := ȳ(x) + u(x) è soluzione della non omogenea.
Rimane da verificare che se ỹ(x) è una soluzione dell’equazione non omogenea, allora esiste
una soluzione u(x) dell’omogenea tale che ỹ(x) = ȳ(x) + u(x). In altre parole, rimane da
provare che la funzione u(x) := ỹ(x) − ȳ(x) è soluzione dell’equazione omogenea, e questo
è un esercizio che lasciamo allo studente.
Osserviamo che il suddetto teorema, nel caso particolare in cui la funzione a(x) sia nulla,
si riduce ad un risultato ben noto: data una primitiva ȳ(x) di b(x), ogni altra primitiva si
ottiene aggiungendo ad ȳ(x) un’arbitraria costante (ossia, la soluzione generale di y 0 = 0).
Esempi ed esercizi.
115 - Lun. 11/12/00
Abbiamo visto che per trovare la soluzione generale di un’equazione non omogenea occorre
prima trovarne almeno una (comunemente detta soluzione particolare). Un metodo per
trovare una soluzione particolare è il cosiddetto metodo di variazione della costante (per
equazioni di ordine superiore al primo si chiama metodo di variazione delle costanti).
Consideriamo l’equazione
y 0 = a(x)y + b(x) .
Sappiamo che la soluzione generale dell’omogenea associata è data da
u(x) = ceA(x) ,
dove A(x) è una primitiva di a(x) e c una costante arbitraria. Il metodo consiste nel cercare
una soluzione particolare dell’equazione non omogenea, pensando variabile la costante c (è
138
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
una contraddizione in termini, ma l’espressione “variazione delle costanti” fa ormai parte
del folclore matematico). In altre parole, si cerca una soluzione del tipo
ȳ(x) = c(x)eA(x) .
Derivando si ottiene
ȳ 0 (x) = c0 (x)eA(x) + c(x)a(x)eA(x) .
Quindi
ȳ 0 (x) = c0 (x)eA(x) + a(x)ȳ(x) .
Sostituendo l’espressione trovata nell’equazione, si ha
c0 (x)eA(x) + a(x)ȳ(x) = a(x)ȳ(x) + b(x) ,
da cui si deduce che ȳ(x) è soluzione se (e solo se)
c0 (x) = e−A(x) b(x) ,
ossia se (e solo se ) c(x) è una primitiva di e−A(x) b(x).
Di conseguenza, la soluzione generale dell’equazione non omogenea è data da
Z
A(x)
A(x)
y(x) = ce
+e
e−A(x) b(x)dx ,
dove c è un’arbitraria costante.
Esempio. Consideriamo l’equazione differenziale
y 0 + 2xy = x .
Supponiamo di voler trovare, tra tutte le soluzioni, quella che verifica la condizione di
Cauchy y(0) = 0. Poiché A(x) = −x2 , si ha
Z
Z
1 −x2
2
−x2
−x2
x2
−x2
ex dx2 =
y(x) = ce
+e
e x dx = ce
+ e
2
1
1 −x2 x2
2
e e = ce−x + .
2
2
Dobbiamo ancora determinare la costante c in modo che sia verificata la condizione y(0) =
0. Abbiamo
1
y(0) = c + = 0 ,
2
da cui si ricava c = −1/2. La soluzione cercata è dunque
2
ce−x +
y(x) =
´
1³
2
1 − e−x ,
2
139
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
come si può facilmente verificare (si invita lo studente a farlo).
Esempi ed esercizi.
116 - Lun. 11/12/00
Il metodo di variazione della costante per determinare una soluzione particolare di un’equazione lineare non omogenea può essere, talvolta, troppo elaborato. Esistono dei metodi,
detti “rapidi”, che funzionano bene quando l’equazione omogenea associata ha il coefficiente costante (ossia, è del tipo y 0 = ay, con a costante) e quando il termine noto si
presenta in una forma molto particolare. Il metodo (che possiamo chiamare “del pescatore”) consiste nel “tirare ad indovinare”, ovvero nel cercare una soluzione dell’equazione in
una classe di funzioni dove si suppone debba essercene almeno una. Se poi non si trova,
pazienza, si può sempre procedere col metodo di variazione della costante. Analizziamo
alcuni casi in cui il metodo funziona.
Consideriamo l’equazione
y 0 = ay + b(x) .
Supponiamo che b(x) sia un polinomio di grado n. Se a 6= 0, si cerca una soluzione
particolare tra i polinomi di grado n; se, invece, a = 0 (ossia, se le costanti sono soluzione
dell’equazione omogenea associata), si cerca moltiplicando per x un generico polinomio di
grado n (si ottiene cosı̀ un generico polinomio di grado n + 1 con termine noto nullo).
Supponiamo ora che b(x) sia del tipo α cos ωx + β sen ωx, con ω ∈ R. In questo caso si
cerca una soluzione particolare dello stesso tipo, dove, ovviamente, al posto delle costanti
α e β si scrivono dei coefficienti da determinare.
Un terzo caso importante si ha quando b(x) = αeγx , con γ ∈ R. Se a 6= γ, si cerca una
soluzione particolare del tipo ceγx , con c costante da determinare. Se a = γ (ossia se
eγx è soluzione dell’equazione omogenea associata), si determina una soluzione particolare
moltiplicando per x la funzione ceγx e si trova c in modo da ottenere una soluzione della
non omogenea.
Il primo e il terzo caso si potrebbero riunire in uno solo: quello in cui b(x) è del tipo
q(x)eγx , dove q(x) è un polinomio e γ una costante. Si osservi infatti che se γ = 0 si
ottiene il primo caso, e se q(x) ≡ 1 si ottiene il terzo. Con un tale b(x) si procede nel
seguente modo: si considera un generico polinomio r(x) dello stesso grado di q(x); se
a 6= γ, si cerca una soluzione particolare della forma r(x)eγx ; se, invece, a = γ (ossia, se
eγx è soluzione dell’omogenea) si cerca una soluzione del tipo xr(x)eγx . Osserviamo che
quest’ultimo metodo include i due già trattati nel primo e nel secondo caso.
Esempi ed esercizi.
140
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
117 - Mar. 12/12/00
Denotiamo con C ∞ (R, R) o, più bravemente, con C ∞ (R), l’insieme costituito dalle funzioni
di classe C ∞ da R in sé. Osserviamo che due funzioni di C ∞ (R) si possono sommare,
ottenendo ancora una funzione di C ∞ (R). Inoltre, se si moltiplica una funzione di C ∞ (R)
per uno scalare reale (ossia per una costante appartenente ad R) si ottiene ancora una
funzione dello stesso insieme. Si ha cosı̀ quello che viene chiamato uno spazio vettoriale
sui reali (i reali si dicono gli scalari e gli elementi dello spazio i vettori). In tale spazio c’è
un vettore che è neutro rispetto alla somma (cioè, sommato ad un qualunque vettore dà
il vettore stesso): è la funzione identicamente nulla (chiamata zero dello spazio).
L’applicazione D: C ∞ (R) → C ∞ (R) che ad ogni funzione y(x) dello spazio C ∞ (R) associa
la funzione derivata Dy := y 0 gode delle seguenti due proprietà:
(additività) D(y1 + y2 ) = Dy1 + Dy2 , per ogni y1 , y2 ∈ C ∞ (R);
(omogeneità) D(λy) = λDy, per ogni λ ∈ R e per ogni y ∈ C ∞ (R).
Poiché D gode di tali proprietà, si dice che è un’applicazione lineare (o un operatore
lineare) dallo spazio C ∞ (R) in sé. Un altro esempio di operatore lineare da C ∞ (R) in
sé e l’operatore identico (o identità) I: C ∞ (R) → C ∞ (R); ossia quell’applicazione che
ad ogni funzione associa la funzione stessa. Due operatori lineari si possono sommare,
ottenendo ancora un operatore lineare, cosı̀ come un operatore lineare si può moltiplicare
per una costante (e il risultato è ancora un operatore lineare). Nel caso di applicazioni da
uno spazio in sé, come quello che stiamo considerando, ha senso anche la composizione.
Ad esempio, la composizione di D con D, denotata con D2 , è l’operatore che ad ogni
funzione di C ∞ (R) associa la sua derivata seconda (ossia, D2 y = y 00 ). Più in generale, Dn
rappresenta l’operatore linere che ad ogni funzione y ∈ C ∞ (R) associa la sua derivata nesima Dn y = y (n) . Per semplicità di linguaggio e di notazioni è comodo fare la convenzione
che D0 rappresenti l’identità I dello spazio C ∞ (R) (D0 y significa quindi derivare zero volte
y).
Si fa notare che l’equazione lineare del primo ordine
y 0 = ay + b(x)
può essere scritta nella forma
Ly = b ,
dove b ∈ C ∞ (R) è il termine noto, y ∈ C ∞ (R) rappresenta la funzione incognita ed
L := D − aI è quell’operatore lineare da C ∞ (R) in sé che si ottiene sommando a D
l’operatore −aI (dato dal prodotto della costante −a per l’identità I).
L’insieme Pn dei polinomi di grado minore o uguale ad n costituisce un sottospazio vettoriale di C ∞ (R); ossia, è un sottoinsieme di C ∞ (R) chiuso rispetto alla somma e alla
141
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
moltiplicazione per gli scalari (cioè, la somma di due elementi di Pn è ancora un elemento
di Pn e se si moltiplica un elemento di Pn per una costante si ottiene ancora un elemento
di Pn ). Osserviamo che l’operatore L sopra definito manda Pn in sé e, in particolare, se
a = 0, manda addirittura Pn+1 in Pn . Con riferimento al primo dei metodi rapidi precedentemente illustrati, è naturale aspettarsi che, nel caso in cui nella suddetta equazione
differenziale il termine noto b appartenga a Pn , esista una soluzione (particolare) ȳ in Pn
o in Pn+1 , a seconda che il coefficiente a sia non nullo o nullo. Infatti, da noti teoremi
di algebra lineare (che verranno svolti nel corso di Geometria) si può facilmente dedurre
che se a 6= 0, allora l’operatore L, visto da Pn in sé, è suriettivo (ed anche iniettivo); se,
invece, a = 0, allora L è suriettivo da Pn+1 in Pn (ma, in questo caso, non iniettivo). Il
motivo per cui funzionano gli altri metodi rapidi (quelli relativi al secondo e al terzo caso)
potrebbe essere spiegato in maniera analoga scegliendo, in ciascuno dei due casi, al posto
di Pn , un appropriato sottospazio di C ∞ (R); ma lasciamo perdere.
Esempi ed esercizi.
118 - Mar. 12/12/00
Un’equazione del tipo
y 0 = a(x)y + b(x)y α ,
dove α è un numero reale e le funzioni a(x) e b(x) sono definite in un intervallo J (spesso
coincidente con R), si dice di Bernoulli. Osserviamo che se α = 0, allora l’equazione rientra
in un caso già studiato: è lineare con termine noto b(x). Se α = 1, allora è addirittura
lineare omogenea. Si può quindi supporre che l’esponente α sia diverso da 0 e da 1.
Ricordiamo che la funzione reale y α è definita per ogni y ∈ R se α è un intero positivo e
per ogni y 6= 0 se α è un intero negativo. Negli altri casi si conviene di definirla soltanto
per y > 0 (e vale l’uguaglianza y α = eα log y ). Incidentalmente si fa notare che la funzione
√
n y, pur essendo definita anche per y = 0 (e anche per y < 0 se n è dispari), coincide con
1
y 1/n (cioè con e n log y ) solo per y > 0. Con tale convenzione sul dominio di y α ,
f (x, y) := a(x)y + b(x)y α
risulta definita in un aperto U di R2 e l’equazione di Bernoulli soddisfa le ipotesi del
teorema di esistenza e unicità. Per chiarezza ribadiamo che U = J × R se α è un intero
positivo, U = J × (R\{0}) se α è un intero negativo, mentre conveniamo di assumere
U = J × (0, +∞) in tutti gli altri casi.
Riguardo a tale equazione osserviamo, innanzi tutto, che se α è un intero positivo, allora
tra le soluzioni c’è la funzione y(x) identicamente nulla (la cosiddetta soluzione banale). Di
conseguenza, per il teorema di esistenza e unicità, ogni altra soluzione è sempre diversa da
142
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
zero e quindi, essendo definita in un intervallo, risulta sempre positiva o sempre negativa.
La stessa cosa vale anche quando α non è un intero positivo, perché se una soluzione si
annullasse, il suo grafico conterrebbe dei punti non appartenenti al dominio U di
f (x, y) = a(x)y + b(x)y α ,
e ciò è in contrasto con la definizione di soluzione.
Per motivi di semplicità ci limitiamo a determinare soltanto le soluzioni positive dell’equazione di Bernoulli (per quelle negative, quando hanno senso, il metodo è analogo,
mentre la soluzione banale, quando esiste, si vede a occhio). Supponiamo dunque che y(x)
sia una soluzione positiva. Dividendo per y(x)α entrambi i membri dell’uguaglianza
y 0 (x) = a(x)y(x) + b(x)y(x)α ,
si ottiene
y 0 (x)y(x)−α = a(x)y(x)1−α + b(x) .
Posto z(x) = y(x)1−α , si ha z 0 (x) = (1−α)y 0 (x)y(x)−α . Pertanto, z(x) verifica l’equazione
differenziale lineare
z 0 = (1 − α)a(x)z + (1 − α)b(x) .
Dalla formula risolutiva per le equazioni lineari del prim’ordine si deduce che z(x) è
(necessariamente) una funzione del tipo
Z
z(x) = ce(1−α)A(x) + (1 − α)e(1−α)A(x) e(α−1)A(x) b(x) dx ,
dove A(x) è una primitiva di a(x) e c ∈ R un’opportuna costante (che dipende da z(x),
e quindi, in definitiva, dalla soluzione y(x) che avevamo considerato). Tenendo conto che
y(x) > 0, si ha y(x) = z(x)1/(1−α) . Di conseguenza, si ottiene la formula
y(x) =
µ
ce
(1−α)A(x)
+ (1 − α)e
(1−α)A(x)
Z
e
(α−1)A(x)
b(x)dx
¶
1
1−α
,
che fornisce tutte le soluzioni positive dell’equazione di Bernoulli (e spesso, non solo
quelle; ma l’approfondimento di un tale fatto esula dai nostri scopi).
Esempio. Determiniamo le soluzioni positive dell’equazione di Bernoulli
y 0 + y/x = y 2 x sen x .
Si tratta di applicare la formula precedente con α = 2, a(x) = −1/x e b(x) = x sen x.
Poiché la funzione
f (x, y) := −y/x + y 2 x sen x
143
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
è definita nell’aperto U costituito da R2 meno l’asse delle y (la retta x = 0), il grafico
di una qualunque soluzione positiva è contenuto interamente o nel primo quadrante o nel
secondo (entrambi aperti). Per fissare le idee, supponiamo che y(x) sia una soluzione
con grafico nel primo quadrante. Visto che per x > 0 una primitiva di a(x) è data da
A(x) = − log x, si deve avere
y(x) =
µ
cx − x
Z
µ
ce
log x
sen x dx
−e
¶−1
log x
Z
e
− log x
x sen x dx
= (cx + x cos x)−1 =
¶−1
=
1
,
x(c + cos x)
dove c è un’opportuna costante. Ovviamente y(x), essendo positiva, sarà definita in un
intervallo di (0, +∞) in cui c + cos x > 0 (e da ciò si deduce che c deve essere maggiore di
−1). Un semplice controllo mostra, tuttavia, che la formula
y(x) =
1
,
x(c + cos x)
non fornisce solo le soluzioni con grafico nel primo quadrante, ma (al variare di c in
R e senza la restrizione x > 0) dà addirittura tutte le possibili soluzioni non banali
dell’equazione considerata (con grafico in uno qualunque dei quattro quadranti).
Si fa notare che se |c| ≤ 1, allora la formula trovata non dà una sola soluzione, ma
infinite: una per ogni intervallo in cui non si annulla la funzione x(c + cos x) (ricordiamo
infatti che, per definizione, la soluzione di un’equazione differenziale deve essere definita
in un intervallo). Il fatto di ottenere più di una soluzione per certi valori di c non deve
meravigliare: il metodo precedentemente esposto per risolvere un’equazione di Bernoulli
fa vedere che ad ogni soluzione positiva y(x) corrisponde una costante c, ma non viceversa
(la corrispondenza può non essere iniettiva).
Esempio. Determiniamo le soluzioni positive dell’equazione di Bernoulli
y0 = −
√ √
y
+2 x y.
x
Seguendo il metodo illustrato in precedenza e ponendo z(x) =
l’equazione lineare
√
z
z0 = −
+ x,
2x
il cui integrale generale è
√
x x
c
, c ∈ R.
z(x) = √ +
2
x
Si ha dunque
√
p
x x
c
,
y(x) = √ +
2
x
p
y(x), otteniamo
c∈R
144
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
o, equivalentemente,
1
y(x) =
x
µ
x2
+c
2
¶2
,
c ∈ R,
√
definita nell’intervallo (0, +∞) se c ≥ 0 oppure nell’intervallo ( −2c, +∞) se c < 0 (si
ricorda che stiamo cercando le soluzioni positive). Ad esempio, la soluzione y(x) > 0 che
soddisfa la condizione iniziale y(1) = 1/9 è
1
y(x) =
x
in (
p
µ
x2
− 1/6
2
¶2
1/3, +∞). Il fatto che la funzione di una variabile
ϕ(x) =
1
x
µ
¶2
x2
− 1/6
2
sia definita in R\{0} non è in contrasto con quanto detto sopra, cioè che il dominio della
p
soluzione y(x) è l’intervallo ( 1/3, +∞); infatti y(x) è la soluzione positiva di un dato
p
problema di Cauchy e, come tale, è la restrizione di ϕ a ( 1/3, +∞).
Un’equazione differenziale del tipo
y 0 = g(x)h(y) ,
dove g e h sono funzioni di una variabile definite in aperti di R, si dice a variabili separabili.
Cerchiamo di spiegarne il motivo, illustrandone il metodo di risoluzione. Supponiamo g
continua e h di classe C 1 . Con tali ipotesi la funzione
f (x, y) := g(x)h(y)
soddisfa le condizioni del teorema di esistenza e unicità. Supponiamo inoltre che g non
si annulli in nessun intervallo non banale (si può tuttavia annullare in punti isolati). Se
c ∈ R è un punto in cui h(y) si annulla, allora la funzione costante y(x) ≡ c è chiaramente
una soluzione dell’equazione differenziale. Viceversa, ogni soluzione costante y(x) ≡ c è
tale h(c) = 0. Studiamo quindi le soluzioni non costanti. Se y(x) è una tale soluzione, per
il teorema di esistenza e unicità si deve avere h(y(x)) 6= 0 per ogni x nell’intervallo J in
cui è definita y(x) (altrimenti il grafico di y(x) intersecherebbe il grafico di una soluzione
costante). Dividendo l’uguaglianza
y 0 (x) = g(x)h(y(x))
per h(y(x)) si ha allora
y 0 (x)
= g(x) .
h(y(x))
145
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Quindi la funzione y(x) verifica l’equazione differenziale
1 dy
= g(x) ,
h(y) dx
che per abuso di notazioni (e per tradizione) viene talvolta scritta nella forma
1
dy = g(x)dx ,
h(y)
dove la variabile dipendente y è separata dalla variabile indipendente x, nel senso che
una sta soltanto nel primo membro dell’equazione e l’altra nel secondo (da ciò il nome
di “equazione a variabili separabili”). Il metodo tradizionale (ma poco ortodosso) per
risolvere quest’ultima equazione consiste nell’integrare entrambi i membri. Si ha quindi
Z
Z
dy
= g(x)dx .
h(y)
Dunque, denotando con H(y) una primitiva di 1/h(y) (in un intervallo in cui h(y) non si
annulla) e con G(x) una primitiva di g(x), si ottiene
H(y) = G(x) + c ,
dove c e un’arbitraria costante. Ricavando la y si ha la formula
y = H −1 (G(x) + c)
che dà tutte le soluzioni non costanti della suddetta equazione a variabili separabili (osserviamo esplicitamente che H è iniettiva perché la stiamo considerando in un intervallo
in cui la sua derivata H 0 (y) = 1/h(y) non si annulla). Si lascia per esercizio la verifica che
ogni funzione del tipo
y(x) = H −1 (G(x) + c) ,
purché la si consideri in un intervallo, è effettivamente una soluzione dell’equazione
y 0 = g(x)h(y) .
Si avverte che nell’eseguire la verifica, la presenza di H −1 rende indispensabile l’uso del
teorema di derivazione di una funzione inversa.
Un metodo più convincente per ottenere la suddetta formula risolutiva è quello di integrare
direttamente entrambi i membri dell’uguaglianza
y 0 (x)
= g(x) ,
h(y(x))
che avevamo precedentemente ottenuto. Con le notazioni introdotte, si ha
H(y(x)) = G(x) + c ,
146
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
come segue facilmente dal fatto che H(y(x)) e G(x) hanno la stessa derivata (ovviamente,
per verificare che H(y(x)) è una primitiva di y 0 (x)/h(y(x)), occorre tener conto del teorema
di derivazione di una funzione composta). Ricavando la y(x) si ha infine
y(x) = H −1 (G(x) + c) .
Osservazione. Il metodo per risolvere le equazioni a variabili separabili esposto sopra
si può applicare anche quando non sono soddisfatte le ipotesi del teorema di esistenza
e unicità, purché ci si limiti alla ricerca delle soluzioni y(x) tali che h(y(x)) 6= 0. Si fa
presente che se la funzione reale y 7→ h(y) non è C 1 , possono esistere soluzioni non costanti
il cui grafico incontra il grafico di una soluzione costante, comep
accade, ad esempio, per la
3
3
0
soluzione y(x) = x dell’equazione a variabili separabili y = 3 y 2 .
Esempio. Consideriamo l’equazione differenziale
y0 = y2 .
Essa è a variabili separabili con g(x) = 1 e h(y) = y 2 . Ovviamente l’equazione possiede
la soluzione nulla, che è l’unica soluzione costante. Sia quindi y(x) una soluzione non
costante. Come già osservato, essa non potrà mai annullarsi, e quindi sarà o sempre
positiva o sempre negativa. Dividendo per y 2 (x) entrambi i membri dell’uguaglianza
y 0 (x) = y 2 (x) e integrando si ottiene
Z
Z 0
y (x)
dx
=
dx ,
y 2 (x)
da cui
−
1
= x + c,
y(x)
c∈R
Di conseguenza, le soluzioni non costanti dell’equazione sono date dalla formula
y(x) = −
1
,
x+c
e l’intervallo massimale di definizione è (−∞, −c) se y(x) > 0 e (−c, +∞) se y(x) < 0. Ad
esempio, la soluzione dell’equazione con dato iniziale y(0) = 1 si ottiene per c = −1 ed è
quindi
1
y(x) =
1−x
in (−∞, 1).
Esempio. Consideriamo il problema di Cauchy

1+y 2
0

 y = 1+x2


y(0) = 1 .
147
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
L’equazione differenziale è a variabili separabili con h(y) = 1 + y 2 , che è di classe C 1 e
quindi il problema di Cauchy ammette una e una sola soluzione massimale. Seguendo il
metodo precedentemente illustrato si ha
Z
Z
1
y 0 (x)
dx =
dx ,
2
1 + y (x)
1 + x2
da cui
arctang y(x) = arctang x + c ,
c ∈ R.
Considerando la condizione iniziale y(0) = 1, si ricava
c = arctang 1 = π/4 ,
per cui la soluzione massimale y(x) del problema di Cauchy verifica la condizione
π
arctang y(x) = arctang x + ,
4
definita se | arctang x + π/4| < π/2, cioè nell’intervallo (−∞, 1). In questo caso, facendo
uso delle formule di addizione delle funzioni seno e coseno, si riesce anche a ricavare
l’espressione esplicita della soluzione. Si ottiene
³
π´ x + 1
=
.
y(x) = tang arctang x +
4
1−x
Esercizio. Trovare le soluzioni dell’equazione differenziale
y 0 = (1 − y 2 ) .
Esempio. Consideriamo l’equazione
y 0 = (2x − y)2 .
Essa soddisfa le ipotesi del teorema di esistenza e unicità, essendo la funzione f (x, y) =
(2x − y)2 addirittura di classe C ∞ . Data una soluzione y(x) dell’equazione, poniamo
z(x) = 2x − y(x) .
Poiché z 0 (x) = 2 − y 0 (x), si ricava che z(x) è soluzione dell’equazione
z0 = 2 − z2 .
Quest’ultima equazione è a variabili separabili e la sua risoluzione è lasciata per esercizio.
119 - Mer. 13/12/00
Un’espressione del tipo
y 00 = f (x, y, y 0 ) ,
148
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
dove f è una funzione continua definita su un aperto U di R3 , si dice un’equazione differenziale del second’ordine (in forma normale). Come precedentemente affermato, se di
un’equazione non è ben definito il concetto di soluzione, non è ben definita l’equazione
stessa; e per introdurre in modo corretto la nozione di equazione occorrono due ingredienti: 1) un insieme, detto universo, in cui si cercano le soluzioni; 2) un criterio chiaro per
stabilire quando un elemento dell’universo abbia il diritto di chiamarsi soluzione.
Per quanto riguarda la suddetta equazione differenziale, le soluzioni si cercano nell’insieme
delle funzioni di classe C 2 , ciascuna delle quali è definita in un intervallo (dipendente dalla
funzione stessa). Una funzione y(x) di tale insieme si dirà una soluzione se per ogni x
appartenente all’intervallo J in cui è definita risulta
(x, y(x), y 0 (x)) ∈ U
e
y 00 (x) = f (x, y(x), y 0 (x)) .
Dal punto di vista fisico, un’equazione del secondo ordine può rappresentare la legge
di moto di un punto materiale di massa unitaria, vincolato a muoversi in una retta e
sottoposto ad una forza f dipendente dal tempo (che in questo caso si denota con t invece
che con x), dalla posizione e dalla velocità (denotate rispettivamente con x e con ẋ).
Ovviamente, non è l’unica interpretazione fisica: un’equazione del second’ordine ne può
avere molte altre o, più precisamente, molti fenomeni fisici (e non solo di dinamica) sono
governati da equazioni differenziali del second’ordine (e non solo del second’ordine).
Più in generale, un’equazione differenziale di ordine n (in forma normale) è un’espressione
del tipo
y (n) = f (x, y, y 0 , . . . , y (n−1) ) ,
dove f : U → R è una funzione continua da un aperto U di Rn+1 in R. Una soluzione è
una funzione y(x) di classe C n in un intervallo J tale che
y (n) (x) = f (x, y(x), y 0 (x), . . . , y (n−1) (x)),
∀ x ∈ J.
Ovviamente, affinché abbia senso la suddetta uguaglianza, si sottintende che
(x, y(x), y 0 (x), . . . , y (n−1) (x)) ∈ U,
∀ x ∈ J.
Come per le equazioni del prim’ordine, anche per quelle di ordine n il problema di Cauchy
consiste nella ricerca delle soluzioni che “passano” per un punto assegnato dell’aperto U
in cui è definita la f . In altre parole, dato un punto p = (x0 , y0 , y1 , . . . , yn−1 ) ∈ U , tra
tutte le soluzioni y(x) dell’equazione
y (n) = f (x, y, y 0 , . . . , y (n−1) ) ,
si cerca quella che verifica (o quelle che verificano) le condizioni y(x0 ) = y0 , y 0 (x0 ) = y1 ,
. . . , y (n−1) (x0 ) = yn−1 (in un certo senso, la soluzione che si cerca è quella il cui grafico in
U contiene il punto p).
149
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Anche per le equazioni di ordine n si può definire il concetto di soluzione massimale e vale
ancora un teorema di esistenza e unicità. Ci limitiamo a dire che se f (x, y, y 0 , . . . , y (n−1) )
è continua e derivabile rispetto alle variabili y, y 0 , . . . , y (n−1) con derivate continue, allora
il problema di Cauchy ammette una ed una sola soluzione massimale. Per l’equazione
di moto di un punto vincolato ad una retta, ciò significa che se ad un certo istante t0 si
assegna la posizione x0 e la velocità ẋ0 , il moto è determinato.
Un’equazione differenziale di ordine n si dice lineare se è del tipo
y (n) + an−1 (x)y (n−1) + an−2 (x)y (n−2) + · · · + a1 (x)y 0 + a0 (x)y = b(x) ,
dove a0 (x), . . . , an−1 (x) e b(x) sono funzioni continue in un intervallo J (di solito J = R).
Le funzioni a0 (x), . . . , an−1 (x) si dicono i coefficienti dell’equazione e b(x) rappresenta il
termine noto. Quando b(x) ≡ 0, l’equazione si dice omogenea.
Per le equazioni lineari vale il teorema di esistenza e unicità e si potrebbe dimostrare
che ogni soluzione massimale è globale, ossia è definita in tutto l’intervallo J in cui sono
definite le funzioni a0 (x), . . . , an−1 (x) e b(x).
Da ora in avanti ci occuperemo prevalentemente di equazioni differenziali lineari a coefficienti costanti con termine noto definito in tutto R e di classe C ∞ ; ossia di equazioni del
tipo
y (n) + an−1 y (n−1) + · · · + a1 y 0 + a0 y = b(x) ,
dove a0 , . . . , an−1 sono numeri reali e b ∈ C ∞ (R). In questo caso le soluzioni massimali
sono definite in tutto R.
Notiamo che un’equazione lineare a coefficienti costanti
y (n) + an−1 y (n−1) + · · · + a1 y 0 + a0 y = b(x)
si può scrivere in modo sintetico nella forma
Ly = b ,
dove L: C ∞ (R) → C ∞ (R) è l’operatore lineare, detto operatore differenziale, che ad ogni
y ∈ C ∞ (R) associa la funzione
y (n) + an−1 y (n−1) + · · · + a1 y 0 + a0 y ,
e che può essere rappresentato nel modo seguente:
L = Dn + an−1 Dn−1 + an−2 Dn−2 + · · · + a1 D + a0 I ,
mettendo cosı̀ in evidenza come L si possa esprimere mediante somma e composizione di
operatori lineari più elementari.
150
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Si osservi che L si può ottenere a partire dal polinomio
p(λ) = λn + an−1 λn−1 + an−2 λn−2 + · · · + a1 λ + a0 ,
detto polinomio caratteristico dell’equazione differenziale considerata, semplicemente sostituendo D al posto della variabile λ (notiamo che il termine a0 si può scrivere a0 λ0 , e
sostituendo D al posto di λ si ha a0 D0 = a0 I).
In generale, se p(λ) è un polinomio qualunque (anche non associato ad un’equazione
differenziale), l’operatore che si ottiene sostituendo D al posto di λ si denota con p(D).
Osservazione. Ogni equazione differenziale lineare a coefficienti costanti con termine noto
b ∈ C ∞ (R) si può scrivere nella forma p(D)y = b, dove p(λ) è il polinomio caratteristico
dell’equazione.
Ad esempio, il polinomio caratteristico dell’equazione differenziale
y 000 − 2y 00 − y 0 + 3y = x − cos x
è
p(λ) = λ3 − 2λ2 − λ + 3
e l’operatore differenziale associato è
p(D) = D3 − 2D2 − D + 3I ,
L’equazione può quindi essere scritta nella forma p(D)y = b, dove b(x) = x − cos x.
120 - Mer. 13/12/00
Teorema. Le soluzioni di un’equazione differenziale lineare non omogenea
p(D)y = b
si ottengono sommando ad una soluzione dell’equazione non omogenea tutte le possibili
soluzioni dell’equazione omogenea associata. In altre parole, se ȳ è una soluzione dell’equazione non omogenea, ogni altra soluzione è del tipo y = ȳ + u, dove u è una soluzione
dell’equazione omogenea associata (ossia, p(D)u = 0).
Dimostrazione. Mostriamo prima che, fissata una soluzione (detta particolare) ȳ dell’equazione non omogenea, ogni funzione del tipo y = ȳ + u, dove u soddisfa la condizione
p(D)u = 0, è ancora una soluzione dell’equazione non omogenea. Per la linearità di p(D)
si ha infatti p(D)(ȳ + u) = p(D)ȳ + p(D)u = p(D)ȳ = b.
151
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Rimane da provare che se y è una qualunque soluzione dell’equazione non omogenea, allora
la differenza u := y − ȳ è una soluzione dell’omogenea. Risulta infatti
p(D)u = p(D)(y − ȳ) = p(D)y − p(D)ȳ = b − b = 0 .
In base al precedente risultato, il problema di risolvere un’equazione differenziale (lineare)
non omogenea si scinde in due sottoproblemi: 1) risolvere l’equazione omogenea associata;
2) trovare almeno una soluzione dell’equazione non omogenea.
Occupiamoci prima dei metodi per risolvere le equazioni differenziali (lineari) omogenee a
coefficienti costanti. È necessario prima introdurre alcune nozioni di algebra lineare.
Definizione. Una combinazione lineare di n funzioni y1 (x), y2 (x), . . . , yn (x) dello spazio
C ∞ (R) è una funzione del tipo
c1 y1 (x) + c2 y2 (x) + · · · + cn yn (x),
dove c1 , c2 , . . . , cn sono n costanti (detti coefficienti della combinazione lineare).
Ad esempio, un polinomio di grado minore o uguale ad n non è altro che una combinazione
lineare delle funzioni 1, x, x2 , . . . , xn (il polinomio è di grado n se il coefficiente di xn è
diverso da zero).
Definizione. Si dice che n funzioni di C ∞ (R), y1 (x), y2 (x), . . . , yn (x), sono linearmente
indipendenti se dall’uguaglianza
c1 y1 (x) + c2 y2 (x) + · · · + cn yn (x) = 0,
∀x ∈ R
segue c1 = c2 = · · · = cn = 0; ossia, se l’unica combinazione lineare che dà la funzione
(identicamente) nulla è quella con i coefficienti tutti nulli.
Esempio. Mostriamo che le funzioni cos ωx e sen ωx (dove ω ∈ R) sono linearmente
indipendenti. Supponiamo infatti che la funzione
y(x) := a cos ωx + b sen ωx
sia (identicamente) nulla. Poiché y(x) è zero per ogni x, deve esserlo anche per x = 0.
Ponendo x = 0 si ottiene a = 0. Per provare che anche il coefficiente b è nullo, basta porre
x = π/(2ω).
Esercizio. Provare che se λ1 e λ2 sono due numeri reali distinti, allora le funzioni eλ1 x e
eλ2 x sono linearmente indipendenti.
Suggerimento. Tenere conto del fatto che se la funzione
y(x) := aeλ1 x + beλ2 x
152
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
è identicamente nulla, allora lo è anche la sua derivata.
Esercizio. Provare che le funzioni 1, x e x2 sono linearmente indipendenti.
Esercizio. Dato λ ∈ R, provare che le funzioni eλx e xeλx sono linearmente indipendenti.
Per lo studio delle equazioni differenziali lineari a coefficienti costanti è utile introdurre uno
spazio più ampio di C ∞ (R): lo spazio vettoriale C ∞ (R, C) costituito dalle funzioni di classe
C ∞ da R in C. Una funzione z(x) di tale spazio si scrive nella forma z(x) = α(x) + iβ(x)
dove α(x) e β(x), dette rispettivamente parte reale e parte immaginaria della funzione
z(x), appartengono a C ∞ (R). La derivata di z(x) è la funzione z 0 (x) = α0 (x) + iβ 0 (x), e
quindi appartiene ancora allo spazio C ∞ (R, C). Ovviamente, ogni funzione di C ∞ (R) può
essere pensata anche in C ∞ (R, C) (con parte immaginaria nulla).
Si fa notare che le funzioni di C ∞ (R, C), non solo si possono moltiplicare per dei numeri
reali, ma addirittura per dei numeri complessi, ottenendo ancora delle funzioni di classe
C ∞ da R in C. Per questo motivo si usa dire che C ∞ (R, C) è uno spazio vettoriale sui
complessi (o uno spazio complesso) e gli elementi di C rappresentano gli scalari dello spazio.
Esercizio. Definire la nozione di combinazione lineare (a coefficienti complessi) per le
funzioni di C ∞ (R, C).
Esercizio. Definire la nozione di funzioni linearmente indipendenti per gli elementi di
C ∞ (R, C).
Esercizio. Provare che se λ1 e λ2 sono due numeri complessi distinti, allora le funzioni
eλ1 x e eλ2 x sono linearmente indipendenti (nello spazio C ∞ (R, C)).
Esercizio. Dato λ ∈ C, provare che le funzioni eλx e xeλx sono linearmente indipendenti
(in C ∞ (R, C)).
Esercizio. Provare che le funzioni 1, x e x2 sono linearmente indipendenti anche in
C ∞ (R, C).
Per risolvere le equazioni differenziali lineari a coefficienti costanti è utile introdurre la
nozione di soluzione complessa (il motivo risulterà chiaro in seguito). La definizione è
analoga a quella che data per le soluzioni reali; l’unica sostanziale differenza è l’universo
in cui tali soluzioni si cercano, che in questo caso è C ∞ (R, C).
Definizione. Sia
y (n) + an−1 y (n−1) + · · · + a1 y 0 + a0 y = b(x)
un’equazione differenziale a coefficienti costanti con termine noto b ∈ C ∞ (R, C). Una
153
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
funzione z ∈ C ∞ (R, C) è una soluzione complessa di tale equazione se
z (n) (x) + an−1 z (n−1) (x) + · · · + a1 z 0 (x) + a0 z(x) = b(x) ,
per ogni x ∈ R.
Consideriamo, ad esempio, l’equazione differenziale
y 00 + y = 0 .
Proviamo a vedere se ammette soluzioni del tipo z(x) = eµx , dove µ è un numero complesso.
Si ha z 0 (x) = µeµx e z 00 (x) = µ2 eµx . Quindi z(x) è soluzione se e solo se
(µ2 + 1)eµx = 0 ,
∀x ∈ R,
ossia (essendo eµx 6= 0) se e solo se µ2 + 1 = 0, da cui si ricava µ = ±i. Pertanto eix e
e−ix sono soluzioni dell’equazione differenziale considerata, e sono le uniche del tipo eµx .
Si osservi che non solo
eix = cos x + i sen x
e
e−ix = cos x − i sen x
sono soluzioni dell’equazione in esame, ma lo è anche una loro arbitraria combinazione
lineare z(x) = c1 eix + c2 e−ix . Ciò dipende dal fatto che l’equazione y 00 + y = 0 è lineare
omogenea, e quindi (come è facile verificare) la somma di due soluzioni è ancora una
soluzione e se si moltiplica una soluzione per una costante si ottiene ancora una soluzione.
L’insieme delle soluzioni dell’equazione y 00 + y = 0 è dunque uno spazio vettoriale (è
facile verificare che questo fatto è vero per una qualunque equazione differenziale lineare
omogenea).
Esercizio. Siano z(x) = α(x) + iβ(x) e z̄(x) = α(x) − iβ(x) due funzioni complesse e
coniugate di C ∞ (R, C). Allora si ha
z(x) + z̄(x)
= α(x)
2
e
z(x) − z̄(x)
= β(x) .
2i
Dedurre da ciò che se z(x) e z̄(x) sono soluzioni di un’equazione differenziale omogenea,
allora lo sono anche α(x) e β(x) (ossia, la parte reale e la parte immaginaria di z(x)).
Teorema. Le soluzioni reali [complesse] di un’equazione differenziale lineare omogenea di
ordine n si ottengono combinando linearmente, con coefficienti in R [in C], n soluzioni
reali [complesse] linearmente indipendenti.
Esempio (equazione del moto armonico). Consideriamo l’equazione differenziale
y 00 + ω 2 y = 0 .
154
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
È immediato verificare che cos ωx e sen ωx sono due soluzioni reali (quindi, in particolare, anche complesse) linearmente indipendenti. Pertanto, ogni altra soluzione reale
[complessa] è del tipo
y(x) = c1 cos ωx + c2 sen ωx ,
con c1 e c2 costanti reali [complesse] arbitrarie. Da elementari considerazioni di trigonometria si deduce facilmente che ogni soluzione reale può essere scritta anche nella
forma
y(x) = A cos(ωx + ϕ) ,
dove le costanti reali A e ϕ (dette, rispettivamente, ampiezza e fase della soluzione) sono
arbitrarie.
Esercizio. Mostrare che la funzione complessa z(x) = eµx è soluzione dell’equazione
differenziale y 00 + by 0 + cy = 0 se e solo se µ è radice del polinomio caratteristico p(λ) =
λ2 + bλ + c (ossia, se e solo se µ2 + bµ + c = 0).
Esercizio. Trovare le radici del polinomio caratteristico dell’equazione differenziale y 00 +
ω 2 y = 0.
Osservazione. Ispirandosi agli esercizi precedenti, non è difficile provare (in generale)
che la funzione complessa z(x) = eµx è soluzione di un’equazione differenziale omogenea
a coefficienti costanti p(D)y = 0 se e solo se µ è radice del polinomio caratteristico p(λ);
ovvero, se e solo se p(µ) = 0.
Illustriamo il metodo generale per risolvere un’equazione differenziale omogenea a coefficienti costanti. Cominciamo con la ricerca delle soluzioni complesse, che è più semplice,
poi passeremo al caso reale (spesso più utile per le applicazioni). Sia data un’equazione
differenziale omogenea a coefficienti costanti (reali) di ordine n
p(D)y = 0
e supponiamo, per il momento, che le radici del polinomio caratteristico p(λ) siano tutte
distinte. Siano queste λ1 , λ2 , . . . , λn . Le funzioni eλ1 x , eλ2 x , . . . , eλn x sono allora soluzioni
dell’equazione differenziale assegnata e, si potrebbe dimostrare, sono linearmente indipendenti. Il problema di scrivere l’integrale generale dell’equazione differenziale in esame è
perciò risolto (almeno in campo complesso): ogni soluzione complessa è del tipo
y(x) = c1 eλ1 x + c2 eλ2 x + · · · + cn eλn x ,
dove c1 , c2 , . . . , cn sono arbitrarie costanti complesse. In questo modo si ottengono
anche tutte le soluzioni reali (che sono un sottoinsieme delle complesse), ma per ottenerle
bisogna dare alle costanti degli opportuni valori complessi (in modo da annullare la parte
immaginaria), e ciò non è molto agevole. Un metodo più astuto per ottenere tutte le
155
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
soluzioni reali è quello di combinare linearmente n soluzioni linearmente indipendenti
tutte reali. In questo modo, se si vuole, si attengono ancora tutte le soluzioni complesse,
ma bisogna farlo apposta (se si danno ai coefficienti valori soltanto reali, si ottengono
soluzioni reali). Per raggiungere lo scopo occorre sostituire le n soluzioni complesse trovate
con altrettante soluzioni reali, purché ancora linearmente indipendenti. Il compito non è
difficile quando l’equazione differenziale, come nel caso che stiamo trattando, è a coefficienti
reali: anche il polinomio caratteristico è a coefficienti reali, e se ammette una radice α+iβ,
ammette anche la coniugata α − iβ. Quindi, non solo l’equazione differenziale ammette la
soluzione
e(α+iβ)x = eαx (cos βx + i sen βx) ,
ma anche
e(α−iβ)x = eαx (cos βx − i sen βx) .
Pertanto l’equazione ammette anche le soluzioni reali eαx cos βx e eαx sen βx che si ottengono dalle due precedenti mediante opportune combinazioni lineari (si somma e si divide
per 2 per la prima, e si sottrae e si divide per 2i per la seconda). Si potrebbe provare
che se nell’insieme delle n soluzioni complesse che avevamo inizialmente trovato si sostituiscono tutte le coppie coniugate del tipo e(α+iβ)x e e(α−iβ)x con eαx cos βx e eαx sen βx,
si ottengono ancora n soluzioni linearmente indipendenti ma, questa volta, tutte reali.
Esempio. Cerchiamo le soluzioni reali dell’equazione differenziale
y 000 + 2y 00 + 2y 0 = 0 .
Il polinomio caratteristico è p(λ) = λ(λ2 + 2λ + 2), le cui radici sono λ1 = 0, λ2 = −1 + i
e λ2 = −1 − i. Quindi, per quanto visto, la soluzione generale in campo reale è data da
y(x) = c1 + c2 e−x cos x + c2 e−x sen x ;
che può essere anche scritta nella forma
y(x) = c + Ae−x cos(x + ϕ) ,
con c, A e ϕ costanti arbitrarie.
Illustriamo brevemente come trattare il problema di determinare n soluzioni linearmente
indipendenti nel caso che non tutte le radici del polinomio caratteristico dell’equazione
p(D)y = 0 siano distinte. Supponiamo, ad esempio, che tra le varie radici del polinomio
p(λ) ce ne sia una doppia che denotiamo con µ. In questo caso, come si può facilmente
verificare, non solo eµx è soluzione dell’equazione considerata, ma lo è anche xeµx . Se poi,
per nostra sfortuna, µ è addirittura una soluzione tripla, allora anche x2 eµx è soluzione, e
cosı̀ via (ma ora basta!). Poiché l’equazione differenziale p(D)y = 0 è a coefficienti reali, se
il polinomio caratteristico ha una radice doppia µ = α + iβ, anche la coniugata µ̄ = α − iβ
156
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
risulta doppia. Quindi, non solo eµx = eαx (cos βx + i sen βx) e xeµx = xeαx (cos βx +
i sen βx) sono soluzioni, ma lo sono anche le due coniugate eµ̄x = eαx (cos βx − i sen βx)
e xeµ̄x = xeαx (cos βx − i sen βx). Si è gia visto che, nella combinazione lineare delle
n soluzioni linearmente indipendenti, al posto delle due soluzioni coniugate eµx e eµ̄x si
possono sostituire le soluzioni reali eαx cos βx e eαx sen βx (rispettivamente parte reale e
parte immaginaria di eµx ). Con lo stesso procedimento si prova che al posto di xeµx e xeµ̄x
si possono considerare le soluzioni reali xeαx cos βx e xeαx sen βx (rispettivamente parte
reale e parte immaginaria di xeµx ).
Invece di continuare ad illustrare il metodo generale è meglio procedere con degli esempi (lo
studente sarà senz’altro in grado di estrapolare il procedimento adattandolo a situazioni
simili).
Esempio. Consideriamo l’equazione
y 000 − 3y 00 + 4y = 0 .
Il polinomio caratteristico è p(λ) = λ3 − 3λ2 + 4. Si vede subito che λ1 = −1 è una radice,
e quindi il polinomio è divisibile per λ + 1. Il quoziente della divisione è λ2 − 4λ + 4, perciò
p(λ) = (λ2 − 4λ + 4)(λ + 1). Le altre due radici sono λ2 = 2 e λ3 = 2 (ossia, 2 è una radice
doppia). Dunque, la soluzione generale è
y(x) = c1 e−x + c2 e2x + c3 xe2x .
Supponiamo ora di voler trovare, tra tutte le soluzioni, quella che verifica il seguente
problema di Cauchy: y(1) = 0, y 0 (1) = 0, y 00 (1) = 0. La risposta è semplice, non c’è
bisogno di fare calcoli: la soluzione si vede a occhio (ed è unica, perché l’equazione è
lineare e soddisfa quindi il teorema di esistenza e unicità).
Esempio. Cerchiamo le soluzioni reali dell’equazione differenziale
y (4) + 8y (2) + 16y = 0 .
Per risolverla occorre prima trovare le quattro radici del polinomio caratteristico p(λ) =
λ4 + 8λ2 + 16. Consideriamo quindi l’equazione algebrica λ4 + 8λ2 + 16 = 0. Ponendo
λ2 = µ si ha µ2 + 8µ + 16 = (µ + 4)2 = 0, da cui si ricavano due soluzioni coincidenti:
µ1 = −4 e µ2 = −4. Avendo posto λ2 = µ, si ottiene λ2 = −4, dove il valore −4 va
considerato due volte. Le quattro radici del polinomio caratteristico sono quindi λ1 = 2i,
λ2 = −2i, λ3 = 2i e λ4 = −2i. Alla radice doppia 2i corrispondono le due soluzioni e2ix e
xe2ix , e alla radice doppia −2i (coniugata della precedente) corrispondono le due soluzioni
e−2ix e xe−2ix (rispettivamente coniugate di e2ix e xe2ix ). Le soluzioni complesse sono
dunque
y(x) = c1 e2ix + c2 e−2ix + c3 xe2ix + c4 xe−2ix ,
157
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
mentre le reali sono
y(x) = a1 cos 2x + a2 sen 2x + a3 x cos 2x + a4 x sen 2x
o, equivalentemente,
y(x) = A1 cos(2x + ϕ1 ) + A2 x cos(2x + ϕ2 ) .
Esempio. Consideriamo l’equazione differenziale y (n) = 0. Il polinomio caratteristico è
p(λ) = λn , e quindi µ = 0 è una radice di molteplicità n (n radici coincidenti). In base al
procedimento illustrato si può affermare che le funzioni
e0x , xe0x , x2 e0x , · · · , xn−1 e0x
sono n soluzioni linearmente indipendenti dell’equazione differenziale considerata.
Dunque, l’integrale generale è
y(x) = a0 + a1 x + a2 x2 + · · · , an−1 xn−1 .
Ossia, y(x) è una soluzione se e solo se è un polinomio di grado minore o uguale ad n − 1.
Esempio. Tra tutte le soluzioni reali dell’equazione differenziale
y (4) + y = 0
determiniamo quelle che tendono a zero per x → +∞. Le soluzioni dell’equazione algebrica
λ4 + 1 = 0 sono le quattro radici quarte del numero −1 (che è un numero complesso di
modulo 1 e argomento π). Risolviamo quindi l’equazione
[r(cos ϕ + i sen ϕ)]4 = cos π + i sen π
(o, equivalentemente, l’equazione (reiϕ )4 = eiπ ). Si ha
r4 cos(4ϕ) + ir4 sen(4ϕ) = cos π + i sen π ,
da cui si deduce r = 1 e 4ϕ = π + 2kπ, con k ∈ Z. Per ottenere le quattro radici basta
dare a k quattro valori consecutivi. Per k = 0 si ottiene λ0 = cos(π/4) + i sen(π/4) =
√
√
√
√
2/2 + i 2/2, e per k = 1 si ha λ1 = cos(3π/4) + i sen(3π/4) = − 2/2 + i 2/2. Le altre
due radici si ottengono ponendo k = −1 e k = 2 oppure, più semplicemente, considerando
le coniugate delle due radici trovate (dipende dal fatto che il polinomio caratteristico è
reale). Pertanto, la soluzione generale in campo reale è
Ã
Ã
√ !
√ !
√
√
√
√
2
2
2
2
2
x
− 22 x
x + c2 sen
x +e 2
x + c4 sen
x
c1 cos
c3 cos
y(x) = e
2
2
2
2
158
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
o, equivalentemente,
y(x) = Ae
−
√
2
x
2
√
√
√
2
2
2
x
x + ϕ) + Be 2 cos (
x + ψ) .
cos (
2
2
Quindi, le soluzioni che tendono a zero per x → +∞ sono
√
√
2
− 22 x
cos (
y(x) = Ae
x + ϕ) ,
2
dove A e ϕ sono due arbitrarie costanti.
121 - Gio. 14/12/00
Esercizio. Mostrare che se ȳ(x) è una soluzione dell’equazione non omogenea
p(D)y = b(x) ,
allora, data una costante c ∈ R, cȳ(x) è una soluzione di p(D)y = cb(x).
Esercizio. Provare che una soluzione particolare dell’equazione differenziale
p(D)y = b1 (x) + b2 (x)
si può ottenere sommando una soluzione di p(D)y = b1 (x) con una soluzione di p(D)y =
b2 (x).
Una regola pratica per determinare una soluzione particolare di un’equazione differenziale
lineare non omogenea a coefficienti costanti del tipo
y (n) + an−1 y (n−1) + · · · + a0 y = q(x)eµx ,
dove q(x) è un polinomio e µ ∈ C, è la seguente: se µ = α + iβ è radice di molteplicità s
del polinomio caratteristico
p(λ) = λn + an−1 λn−1 + · · · + a0 ,
si cerca nella forma xs r(x)eµx , dove r(x) è un polinomio dello stesso grado di q(x) (i cui
coefficienti sono da determinare). In particolare, se µ non è radice di p(λ), ossia s = 0, si
cerca nella forma r(x)eµx .
Osservazione. Per determinare una soluzione di un’equazione a coefficienti reali del tipo
y (n) + an−1 y (n−1) + · · · + a0 y = xk eαx cos βx ,
basta osservare che xk eαx cos βx è la parte reale di xk e(α+iβ)x .
dell’equazione basta quindi determinare una soluzione di
Per la linearità
y (n) + an−1 y (n−1) + · · · + a0 y = xk e(α+iβ)x
159
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
(che è ovviamente complessa) e prenderne la parte reale. In modo analogo si determina una
soluzione di un’equazione con termine noto del tipo xk eαx sen βx che è la parte immaginaria
di xk eαx cos βx.
In pratica una soluzione dell’equazione
y (n) + an−1 y (n−1) + · · · + a0 y = xk eαx cos βx ,
si può determinare anche nel seguente modo: se α + iβ non è radice del polinomio
caratteristico, si cerca nella forma
ak (x)eαx cos βx + bk (x)eαx sen βx ,
dove ak (x) e bk (x) sono polinomi di grado k i cui coefficienti sono da determinare; se α+iβ
è radice semplice si cerca moltiplicando per x la forma precedente, e cosı̀ via.
122 - Gio. 14/12/00
Esempio. Tra tutte le soluzioni dell’equazione differenziale
y 00 = xe−x ,
determiniamo quella che verifica il problema di Cauchy y(0) = 0 e y 0 (0) = 0.
L’equazione omogenea associata è y 00 = 0 e il suo polinomio caratteristico ha due radici
coincidenti: λ1 = 0 e λ2 = 0. Quindi, la soluzione generale dell’equazione omogenea è
u(x) = c0 + c1 x. Occorre trovare una soluzione particolare dell’equazione non omogenea
(per poi sommarla alla soluzione generale dell’omogenea). Osserviamo che µ = −1 non
è radice del polinomio caratteristico. Cerchiamo quindi una soluzione del tipo ȳ(x) =
(a + bx)e−x . Derivando due volte si ha
ȳ 00 (x) = (a − 2b)e−x + bxe−x .
Quindi ȳ(x) è soluzione se (e solo se) è verificata la condizione
(a − 2b)e−x + (b − 1)xe−x = 0 ,
∀x ∈ R,
ossia se (e solo se) a−2b = 0 e b−1 = 0 (si osservi che l’affermazione “ȳ(x) è soluzione solo
se a − 2b = 0 e b − 1 = 0”, anche se non è importante per il nostro scopo, è conseguenza del
fatto che le funzioni e−x e xe−x sono linearmente indipendenti). Dunque, una soluzione
(particolare) dell’equazione non omogenea è data da ȳ(x) = (2 + x)e−x e la soluzione
generale è
y(x) = c0 + c1 x + (2 + x)e−x .
160
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
Determiniamo ora c0 e c1 in modo che siano soddisfatte le condizioni assegnate. Poiché
y(0) = c0 + 2 e y 0 (0) = c1 − 1, ponendo y(0) = 0 e y 0 (0) = 0 si ricava c0 = −2 e c1 = 1.
Pertanto, la soluzione che verifica il problema di Cauchy assegnato è
y(x) = −2 + x + 2e−x − xe−x .
Esempio. Tra tutte le soluzioni dell’equazione differenziale
y 00 − 2y 0 + 2y = 2x ,
determiniamo quella che verifica il problema di Cauchy y(0) = 2, y 0 (0) = 2.
Troviamo prima tutte le soluzioni dell’equazione differenziale e imponiamo poi le condizioni
iniziali assegnate. Il polinomio caratteristico ha due radici complesse coniugate: λ1 = 1 + i
e λ2 = 1 − i. Quindi, in campo complesso, la soluzione generale dell’equazione omogenea
associata è data da
u(x) = c1 e(1+i)x + c2 e(1−i)x .
A questo punto, volendo, si potrebbe determinare anche la soluzione generale in campo
reale, ma per risolvere il nostro problema non è necessario: il teorema di esistenza e unicità
ci assicura che il problema di Cauchy ha una e una sola soluzione, e questa deve essere
reale (visto che sia l’equazione sia le condizioni iniziali sono reali). Procediamo quindi in
campo complesso. Occorre trovare una soluzione particolare dell’equazione non omogenea
e sommarla alla soluzione generale dell’omogenea. Il termine noto si presenta nella forma
q(x)eµx , dove q(x) è un polinomio di primo grado e µ = 0. Poiché µ = 0 non è radice del
polinomio caratteristico, si cerca una soluzione nella forma r(x) = ax + b. Con semplici
calcoli si vede che r(x) è soluzione se (e solo se) a = 1 e b = 1. La soluzione generale
dell’equazione non omogenea è dunque
y(x) = c1 e(1+i)x + c2 e(1−i)x + x + 1 ,
dove c1 e c2 sono arbitrarie costanti complesse. Occorre determinare tali costanti in modo
che si abbia y(0) = 2, y 0 (0) = 2. Poiché
y 0 (x) = (1 + i)c1 e(1+i)x + (1 − i)c2 e(1−i)x + 1 ,
le costanti devono verificare il sistema
(
c1
+
c2
= 1
(1 + i)c1 + (1 − i)c2 = 1 ,
da cui si ricava l’unica soluzione (c1 , c2 ) = (1/2, 1/2). Possiamo concludere che la soluzione
dell’equazione differenziale che verifica le condizioni iniziali assegnate è
y(x) =
e(1+i)x + e(1−i)x
+ x + 1 = ex cos x + x + 1
2
161
Registro di Analisi Matematica 1 – c.l. Ing. Informatica – a.a. 2000/2001 – M. Furi
che, come ci aspettavamo, è una funzione reale. Si invita a verificare che la funzione
y(x) = ex cos x+x+1 è effettivamente una soluzione dell’equazione differenziale considerata
e che soddisfa le condizioni iniziali y(0) = 2, y 0 (0) = 2.
Esempio. Determiniamo l’integrale generale della seguente equazione differenziale:
y 00 − 4y = ex − xe−2x + 1 .
Il polinomio caratteristico è p(λ) = λ2 − 4 e le sue radici sono λ1 = −2 e λ2 = 2. Quindi,
la soluzione generale dell’equazione omogenea associata è
u(x) = c1 e−2x + c2 e2x .
Per determinare una soluzione particolare osserviamo che il termine noto è somma di tre
termini, tutti del tipo q(x)eµx , dove q(x) è un polinomio e µ un numero complesso (in
questo caso reale). Poiché µ = 1 non è radice di p(λ), il primo termine ci induce a cercare
una soluzione (dell’equazione p(D)y = ex ) del tipo ȳ(x) = aex . Riguardo al secondo
termine, osserviamo che µ = −2 è una radice semplice del polinomio caratteristico, e
quindi si cerca una soluzione (di p(D)y = −xe−2x ) nella forma ȳ2 (x) = x(cx + d)e−2x .
Infine, per quanto riguarda il terzo termine, si cerca una soluzione (di p(D)y = 1) del tipo
ȳ3 (x) = d, cioè costante (in questo caso, infatti, µ = 0 non è radice di p(λ)). Cerchiamo
quindi una soluzione dell’equazione differenziale non omogenea nella forma
ȳ(x) = aex + x(bx + c)e−2x + d .
Sostituendo ȳ(x) nell’equazione differenziale, si ricava a = −1/3, b = 1/8, c = 1/16 e
d = −1/4. Pertanto, la soluzione generale dell’equazione non omogenea è
y(x) = c1 e−2x + c2 e2x −
x
x2
1
ex
+ ( + )e−2x − ,
3
8
16
4
dove c1 e c2 sono due costanti (reali o complesse, a seconda che si desiderino soltanto le
soluzioni reali o tutte le soluzioni complesse).
162