Appunti su estremi relativi ed equazioni differenziali

Appunti per il corso di Analisi Matematica II
Pietro d’Avenia
L3 In Ingegneria Edile (corso A)
A.A. 2007/2008
1
Estremi relativi liberi per funzioni di due variabili reali
In questa sezione studiamo le condizioni necessarie e sufficienti relative ai punti
di massimo e minimo relativo per funzioni reali di due variabili reali. Come
vedremo, esistono forti analogie con il caso di funzioni reali di una sola variabile
reale e per questo motivo, dopo aver richiamato alcune nozioni di algebra lineare,
seguiremo lo stesso cammino percorso in Analisi Matematica I.
Nel seguito X indicherà un sottinsieme aperto di R2 e f una funzione definita
in X ed a valori in R.
1.1
Richiami di algebra lineare
Sia A una matrice n × n.
Definizione 1.1. Diciamo che A è una matrice definita positiva (risp. definita
negativa) se per ogni h ∈ Rn \ {0},
hA · h, hi > 0
(risp. hA · h, hi < 0).
Diciamo che A è una matrice semidefinita positiva (risp. semidefinita negativa)
se per ogni h ∈ Rn ,
hA · h, hi ≥ 0
(risp. hA · h, hi ≤ 0).
Diciamo che A non è definita se non è definita positiva, definita negativa,
semidefinita positiva, semidefinita negativa.
Osservazione 1.2. Ovviamente le matrici definite positive (risp. negative)
sono semidefinite positive (risp. negative) ma non vale il viceversa.
Per le matrici definite positive e definite negative abbiamo la seguente caratterizzazione.
1
Teorema 1.3. A è definita positiva (risp. negativa) se e solo se tutti i suoi
autovalori sono strettamente positivi (risp. negativi).
hosspmi Osservazione
1.4. Ovviamente, se una matrice ha sia autovalori positivi che
negativi, non è né definita positiva, né definita negativa (e quindi nemmeno
semidefinita positiva o negativa).
1.2
Alcune definizioni
Le definizioni di punto di massimo e minimo relativo per funzioni di due variabili reali sono le stesse già date nel precedente corso di Analisi Matematica
I. Ovviamente, rispetto alle funzioni reali di variabile reale, qui occorre estendere opportunamente il concetto di intorno. Per completezza ricordiamo che
(x0 , y0 ) ∈ X è un punto di massimo relativo (risp. minimo) se esiste un intorno
U di (x0 , y0 ) tale che per ogni (x, y) ∈ U ∩ X si ha f (x, y) ≥ f (x0 , y0 ) (risp.
f (x, y) ≤ f (x0 , y0 )).
Diamo inoltre la seguente definizione.
Definizione 1.5. Diciamo che (x0 , y0 ) ∈ X è punto critico o stazionario per f
se f è differenziabile in (x0 , y0 ) e
∇f (x0 , y0 ) = 0.
1.3
Condizioni necessarie
Valgono i seguenti risultati.
hpcriti
Teorema 1.6. Supponiamo che (x0 , y0 ) ∈ X sia un punto di massimo o di
minimo relativo per f e che f sia differenziabile in (x0 , y0 ). Allora (x0 , y0 ) è
un punto critico di f .
hsemdefi
Teorema 1.7. Supponiamo che (x0 , y0 ) ∈ X sia un punto di massimo (risp.
minimo) per f e che f sia differenziabile due volte in (x0 , y0 ). Allora Hf (x0 , y0 )
è semidefinita negativa (risp. positiva).
I risultati precedenti costituiscono condizioni solo necessarie.
Infatti, se consideriamo la funzione
f (x, y) = x2 − y 2 ,
semplici calcoli mostrano che (0, 0) è un punto critico ma non è né punto di
massimo, né punto di minimo.
Inoltre, considerata la funzione
f (x, y) = x2 − y 4 ,
semplci calcoli mostrano che (0, 0) è un punto critico, Hf (0, 0) è semidefinita
positiva, ma (0, 0) non è punto di minimo relativo (e neanche punto di massimo).
2
1.4
hcondsuffi
Condizioni sufficienti
Teorema 1.8. Supponiamo che f sia differenziabile due volte in (x0 , y0 ) ∈ X
e che (x0 , y0 ) sia un punto critico di f . Se Hf (x0 , y0 ) è definita positiva (risp.
negativa) allora (x0 , y0 ) è punto di minimo (risp. di massimo) relativo per f .
Dimostrazione. Consideriamo il caso in cui Hf (x0 , y0 ) è definita positiva. Dalla
formula di Taylor, per (x, y) → (x0 , y0 )
f (x, y)
=
=
≥
1.5
f (x0 , y0 ) + h∇f (x0 , y0 ), (x − x0 , y − y0 )i
1
+ hHf (x0 , y0 )(x − x0 , y − y0 ), (x − x0 , y − y0 )i
2
+o (k(x − x0 , y − y0 )k)
f (x0 , y0 )
1
+ hHf (x0 , y0 )(x − x0 , y − y0 ), (x − x0 , y − y0 )i
2
+o (k(x − x0 , y − y0 )k)
f (x0 , y0 ).
Applichiamo i Teoremi in due dimensioni
Quanto detto nelle sezioni precedenti, anche se enunciato per funzioni reali di
due variabili reali, è valido per funzioni reali di n variabili reali.
In questa sezione applichiamo i Teoremi 1.6, 1.7 e 1.8, dando un metodo
valido solo nel caso di funzioni f reali di due variabili reali.
Supponiamo che f sia differenziabile due volte in X.
Dopo aver individuato i punti critici di f (Teorema 1.6), per ciascun punto critico (x0 , y0 ), calcoliamo gli autovalori della matrice Hf (x0 , y0 ) risolvendo
l’equazione
det (Hf (x0 , y0 ) − λI) = 0,
cioè, ricordando che, per il Teorema di Schwarz, fxy (x0 , y0 ) = fyx (x0 , y0 ),
fxx (x0 , y0 ) − λ
fxy (x0 , y0 )
= 0,
fxy (x0 , y0 )
fyy (x0 , y0 ) − λ che, sviluppata, diventa
i
h
2
λ2 −[fxx (x0 , y0 ) + fyy (x0 , y0 )] λ+ fxx (x0 , y0 ) fyy (x0 , y0 ) − (fxy (x0 , y0 )) = 0
o, più brevemente,
λ2 − tr(Hf (x0 , y0 ))λ + det(Hf (x0 , y0 )) = 0.
(1) 1.1c
Osserviamo che l’equazione (1) è un’equazione di secondo grado nell’incognita
λe
2
∆ = [tr(Hf (x0 , y0 ))] − 4 det(Hf (x0 , y0 ))
2
2
= [fxx (x0 , y0 ) − fyy (x0 , y0 )] + 4 (fxy (x0 , y0 )) ≥ 0.
3
Quindi esistono λ1 , λ2 ∈ R soluzioni di (1) e, inoltre,
λ1 + λ2 = tr(Hf (x0 , y0 ))
(2) piu
λ1 λ2 = det(Hf (x0 , y0 )).
(3) per
e
Allora, se
det(Hf (x0 , y0 )) < 0,
da (3) abbiamo che λ1 e λ2 hanno segno opposto. Quindi la matrice Hf (x0 , y0 )
non è definita (Osservazione 1.4) e pertanto, per il Teorema 1.7 il punto (x0 , y0 )
non è né di massimo, né di minimo relativo.
Se
det(Hf (x0 , y0 )) > 0,
da (3) abbiamo che λ1 e λ2 sono concordi ed essendo
det(Hf (x0 , y0 )) = fxx (x0 , y0 ) fyy (x0 , y0 ) − (fxy (x0 , y0 ))
2
anche fxx (x0 , y0 ) e fyy (x0 , y0 ) hanno lo stesso segno.
Pertanto, se fxx (x0 , y0 ) > 0 (e fyy (x0 , y0 ) > 0), allora, per (2), λ1 e λ2 sono
entrambi positivi e quindi (x0 , y0 ) è punto di minimo relativo, se fxx (x0 , y0 ) < 0
(e fyy (x0 , y0 ) < 0), allora, per (2), λ1 e λ2 sono entrambi negativi e quindi
(x0 , y0 ) è punto di massimo relativo.
Se det(Hf (x0 , y0 )) = 0 applichiamo metodi diretti.
4
2
Alcune note sulle equazioni differenziali
In questa sezione diamo alcune nozioni sulle equazioni differenziali che vanno
ad integrare quanto presente nel testo consigliato durante il corso a cui faremo
riferimento.
2.1
Equazioni differenziali: definizione e prime proprietà
Introduzione (pag. 421);
Definizione di equazione differenziale (pagg. 421, 422);
Definizione di sistema di equazioni differenziali del primo ordine (pag. 433);
Definizione di problema di Chuchy per equazioni differenziali (pag. 422) e per
sistemi di equazioni differenziali (pag. 433);
Teoremi di esistenza ed unicità locale per equazioni differenziali (pag. 429) e
sistemi di equazioni differenziali (pag. 434);
Equazioni differenziali del primo ordine a variabili separabili (pagg. 428-431).
2.2
Equazioni differenziali lineari di ordine n
Sia data un’equazione differenziale lineare di ordine n
y (n) = an−1 (x)y (n−1) + ... + a1 (x)y 0 + a0 (x)y + b(x)
(4) eqdifflinn
con n ∈ N e ai e b funzioni reali di variabile reale, che supponiamo definite in
un intervallo I ⊂ R ed ivi continue.
homogi
hosseqomsovri
h1piu2i
Definizione 2.1. Se, per ogni x ∈ I, b(x) = 0, allora diremo che la (4) è
omogenea, altrimenti parleremo di equazione completa.
Osservazione 2.2. Se ŷ, ỹ sono soluzioni di un’equazione differenziale di ordine n lineare e omogenea, allora ogni combinazione lineare λŷ + µỹ è ancora
soluzione della stessa equazione.
Osservazione 2.3. Se b(x) = b1 (x) + b2 (x) allora, detta y1 una soluzione di
y (n) = an−1 (x)y (n−1) + ... + a1 (x)y 0 + a0 (x)y + b1 (x)
e y2 una soluzione di
y (n) = an−1 (x)y (n−1) + ... + a1 (x)y 0 + a0 (x)y + b2 (x)
allora y1 + y2 è soluzione di
y (n) = an−1 (x)y (n−1) + ... + a1 (x)y 0 + a0 (x)y + b(x).
Ovviamente possiamo procedere analogamente nel caso in cui b è somma di m
funzioni bj .
5
L’equazione (4) può essere scritta come un sistema di n equazioni differenziali
lineari del primo ordine. Infatti, se poniamo

y1 = y,




 y2 = y 0 ,
...
(5) relsiseq

(n−2)

y
=
y
,

n−1


yn = y (n−1) ,
allora
 0
y1 = y 0 = y2 ,




 y20 = y 00 = y3 ,
...


y0
= y (n−1) = yn


 n−1
0
yn = y (n)
e quindi la (4) diventa
 0
y1 = y2 ,




 y20 = y3 ,
...


y0
= yn


 n−1
yn0 = a0 (x)y1 + a1 (x)y2 + ... + an−1 (x)yn + b(x)
che, in forma vettoriale può essere scritta
y 0 = A(x)y + B(x)
con





A(x) = 



e
0
0
..
.
1
0
0
1
...
...
..
.
0
0
0
0
..
.
0
0
0
...
0
0
0
...
a0 (x) a1 (x) a2 (x) . . .
1
0
0
1





B(x) = 



2.2.1
0
0
..
.
0
0
b(x)









an−2 (x) an−1 (x)









Sistemi di n equazioni differenziali lineari del primo ordine
In questa prima parte diamo risultati per sistemi di n equazioni differenziali
lineari del primo ordine
y 0 = A(x)y + B(x)
(6) sislincompl
6
con
A(x) = {aij (x)}1≤i,j≤n
e
B(x) = (b1 (x), . . . , bn (x)) .
Supponiamo che le funzioni reali aij e bi siano definite in un intervallo I ⊂ R e
siano continue su I. Tali condizioni permettono di poter applicare il teorema di
esistenza ed unicità (globale) per ogni problema di Cauchy
0
y = A(x)y + B(x)
y(x0 ) = y0
con x0 ∈ I e y0 ∈ Rn .
Definizione 2.4. Analogamente alla Definizione 2.1, diciamo che un sistema
di n equazioni differenziali lineari del primo ordine (6) è omogeneo se per ogni
x ∈ I, B(x) = 0, altrimenti parliamo di sistema completo.
hosssisomsovri Osservazione
2.5. Ovviamente anche per i sistemi di n equazioni differenziali
lineari del primo ordine omogenei vale un risultato analogo a quello enunciato
nell’Osservazione 2.2.
Vogliamo determinare l’insieme
SB = y ∈ C 1 (I, Rn ) y 0 = A(x)y + B(x) ,
cioè l’insieme delle soluzioni di (6).
Consideriamo il sistema omogeneo associato a (6), cioè il sistema
y 0 = A(x)y
ottenuto da (6) ponendo B = 0 e l’insieme
S = y ∈ C 1 (I, Rn ) y 0 = A(x)y ,
ovvero l’insieme delle soluzioni di (7).
Abbiamo il seguente risultato.
hthomassi
Teorema 2.6. L’insieme S è uno spazio vettoriale e dim S = n.
Dimostrazione. Detto
L : y ∈ C 1 (I, Rn ) 7−→ y 0 − A(x)y ∈ C(I, Rn )
abbiamo che, se ŷ, ỹ ∈ C 1 (I, Rn ) e λ, µ ∈ R,
L(λŷ + µỹ)
=
=
=
(λŷ + µỹ)0 − A(x)(λŷ + µỹ)
λŷ 0 + µỹ 0 − λA(x)ŷ − µA(x)ỹ
λL(ŷ) + µL(ỹ)
e quindi L è un operatore lineare.
Inoltre
S = ker(L)
7
(7) sisomass
e quindi S è uno spazio vettoriale. Per determinare la dimensione di S, fissiamo
x0 ∈ I e consideriamo la funzione che a y0 ∈ Rn associa l’unica soluzione del
problema di Cauchy
0
y = A(x)y
y(x0 ) = y0 .
Il teorema di esistenza ed unicità ci consente di affermare che tale funzione è
bigettiva. Inoltre la linearità e l’omogeneità (Osservazione 2.5) implicano la
linearità di tale funzione che quindi risulta essere un isomorfismo.
Pertanto Rn e S, essendo isomorfi, hanno la stessa dimensione e dunque
dim S = n.
Osservazione 2.7. Dalla dimostrazione del teorema precedente segue che una
base di S può essere determinata considerando la base canonica {ei }1≤i≤n e le
soluzioni di
0
y = A(x)y
y(x0 ) = ei
ottenute al variare di i ∈ {1, . . . , n}.
Allora, per determinare l’insieme S, basta determinare una sua base (e quindi un sistema di n vettori linearmente indipendenti) e ogni soluzione di (7) è
combinazione lineare degli elementi di tale base.
Il Teorema 2.6 è utile anche ai fini della determinazione di SB . Infatti
abbiamo il seguente risultato.
hcompli
Teorema 2.8. Sia ȳ una soluzione di (6). Allora
SB = S + ȳ = {y + ȳ y ∈ S} .
Dimostrazione. Dimostriamo che
SB ⊂ S + ȳ.
Se y ∈ SB , allora possiamo scrivere
y = (y − ȳ) + ȳ
e quindi basterà provare che y − ȳ ∈ S. Da
(y − ȳ)0
= y 0 − ȳ 0 = A(x)y + B(x) − A(x)ȳ − B(x)
= A(x)(y − ȳ)
abbiamo subito che (y − ȳ) è soluzione di (7) e quindi (8) è provata.
Per dimostrare che
S + ȳ ⊂ SB ,
prendiamo y ∈ S e facciamo vedere che y + ȳ ∈ SB . Infatti
(y + ȳ)0
= y 0 + ȳ 0 = A(x)y + A(x)ȳ + B(x)
= A(x)(y + ȳ) + B(x).
8
(8) primaincl
Dal Teorema 2.8 abbiamo quindi che, per determinare la generica soluzione
di (6), basta calcolare la generica soluzione di (7) e una soluzione di (6), che,
d’ora in poi, chiameremo integrale particolare.
2.2.2
Equazioni differenziali lineari di ordine n
Grazie a quanto osservato all’inizio del paragrafo (ogni equazione differenziale
lineare di ordine n può essere scritta come un sistema di n equazioni differenziali
lineari del primo ordine), possiamo riportare i risutati ottenuti per i sistemi alle
equazioni. In particolare, se partiamo da un’equazione differenziale lineare di
ordine n, applicando le uguaglianze in (5), otteniamo un sistema di n equazioni
differenziali del primo ordine lineare e le componenti dei vettori sono la funzione
e le sue derivate, fino alla derivata (n − 1)−esima.
Quindi, se abbiamo un’equazione differenziale lineare di ordine n omogenea,
l’insieme delle soluzioni S sarà dato dalle combinazioni lineari di n funzioni yi
tali che gli n vettori
y1 , y1 0 , . . . , y1 (n−1) , . . . , yn , yn 0 , . . . , yn (n−1)
siano linearmente indipendenti.
Se invece abbiamo un’equazione differenziale lineare di ordine n non omogenea, allora dobbiamo anche determinare un integrale particolare dell’equazione
completa.
Diamo ora un esempio fondamentale.
hes2ordi
Esempio 2.9. Consideriamo, a titolo di esempio, l’equazione differenziale
y 00 + by 0 + cy = 0,
(9) 2lincc
con b e c ∈ R, e cerchiamo soluzioni di (9) del tipo
y(x) = eαx
con α ∈ C. Semplici calcoli mostrano che
y 0 (x) = αeαx ,
y 00 (x) = α2 eαx .
Sostituendo in (9), abbiamo che α deve essere soluzione di
α2 + bα + c = 0.
Posto
∆ = b2 − 4c
distinguiamo i seguenti casi:
9
(10) 2grado
∆ > 0 L’equazione (10) ha due soluzioni reali distinte α1 < α2 . Allora
y1 = eα1 x ,
y2 = eα2 x
sono soluzioni di (9). Inoltre i vettori
(y1 , y1 0 ) = (eα1 x , α1 eα1 x )
(y2 , y2 0 ) = (eα2 x , α2 eα2 x )
sono linearmente indipendenti, infatti
y1
eα2 x
y2 eα1 x
0
α1 x
0 =
y1
α1 e
α2 eα2 x
y2
= (α2 − α1 ) e(α1 +α2 )x 6= 0
essendo α1 6= α2 e e(α1 +α2 )x 6= 0. Quindi, in questo caso, l’integrale
generale di (9) è
c1 eα1 x + c2 eα2 x .
∆ = 0 L’equazione (10) ha due soluzioni reali coincidenti e α1 = α2 = − 2b .
Allora
b
y1 = e− 2 x
è soluzione di (9).
Un’altra soluzione di (9) è
b
y2 = xe− 2 x .
Infatti
00
0
y2 + by2 + cy2
b
b
b
b2
− 2b x
+ b 1 − x e− 2 x + cxe− 2 x
x−b e
4
2
b2 − 4c − b x
∆ −bx
xe 2 = xe 2 = 0.
4
4
=
=
Inoltre i vettori
b
b
(y1 , y1 0 ) = e− 2 x , − 2b e− 2 x
b b
(y2 , y2 0 ) = xe− 2 x , 1 − 2b x e− 2 x
sono linearmente indipendenti, infatti
b
y1
e− 2b x
y
xe− 2 x
2 0
=
b
b
0
y1
y2 − 2b e− 2 x
1 − 2b x e− 2 x
Quindi, in questo caso, l’integrale generale di (9) è
b
b
c1 e− 2 x + c2 xe− 2 x .
10
= e−bx 6= 0.
∆ < 0 L’equazione (10) ha due soluzioni complesse coniugate
√
√
b
−∆
b
−∆
α1 = − −
i
e
α2 = − +
i.
2
2
2
2
Allora
eα1 x
eα2 x
e
sono soluzioni di (9). Inoltre, anche
y1 =
y2 =
eα1 x +eα2 x
2
eα2 x −eα1 x
2i
b
=
√
−∆
2 x ,
√
b
−∆
e− 2 x sin
2 x
= e− 2 x cos
sono soluzioni di (9) e i vettori
√
h
√
√
i b b
√
−∆
−∆
−∆
−∆
b
x
,
−
cos
x
+
(
sin
x
e− 2 x
(y1 , y1 0 ) = e− 2 x cos
2
2
2
2
2
b
√
h
√
√
i b √
−∆
−∆
−∆
−∆
b
(y2 , y2 0 ) = e− 2 x sin
x
,
−
sin
x
−
(
cos
x
e− 2 x
2
2
2
2
2
sono linearmente indipendenti, infatti
√
√
y1
−∆
−∆
y2 2
2
0
x + sin
x
e−bx = e−bx 6= 0.
= cos
y1
y2 0 2
2
Quindi, in questo caso, l’integrale generale di (9) è
√
√
−∆
−∆
− 2b x
c1 cos
x + c2 sin
x
.
e
2
2
Diamo ora due metodi per determinare un integrale particolare nel caso di
equazioni differenziali non omogenee.
2.2.3
Equazioni differenziali lineari del primo ordine a coefficienti
continui e metodo della variazione delle costanti arbitrarie
pagg. 422-427
2.2.4
Equazioni differenziali lineari di ordine n a coefficienti costanti
e metodo delle funzioni simili
Sia data l’equazione
y (n) + an−1 y (n−1) + . . . + a1 y 0 + a0 y = b(x)
(11) eqlinccc
con ai ∈ R. Per risolvere l’equazione omogenea associata
y (n) + an−1 y (n−1) + . . . + a1 y 0 + a0 y = 0
11
(12) eqlinccom
calcoliamo le radici dell’equazione caratteristica
λn + an−1 λn−1 + . . . + a1 λ + a0 = 0.
(13) carn
Analogamente a quanto visto nell’Esempio 2.9, ogni soluzione reale λ di (12)
avente molteplicità µ, dà origine a µ termini del tipo
cj xj eλx
j = 0, . . . , µ − 1
(con cj ∈ R) e ogni coppia di soluzioni complesse coniugate α ± iβ di (12) avente
molteplicità ν darà origine a ν termini del tipo
xj eαx (dj cos(βx) + gj sin(βx))
j = 0, . . . , ν − 1
(con dj , gj ∈ R).
In generale, dette λ1 , . . . , λh le soluzioni reali di (13) risptettivamente con molteplicità µ1 , . . . , µh e α1 ± iβ1 , . . . , αk ± iβk le soluzioni complesse coniugate
di (13) risptettivamente con molteplicità ν1 , . . . , νk , l’insieme delle soluzioni (o
integrale generale) di (12) è dato da
Pµ1 −1
j=0
c1j xj eλ1 x
Pµh −1
+ . . . + j=0
chj xj eλh x
νX
1 −1
xj eα1 x (d1j cos(β1 x) + g1j sin(β1 x))
+
j=0
+ ... +
νX
k −1
xj eαk x (dkj cos(βk x) + gkj sin(βk x))
j=0
al variare di cσj , dσj , gσj ∈ R.
Per determinare l’integrarle generale di (11), dobbiamo quindi determinarne
un integrale particolare. Ovviamente possiamo applicare il metodo della variazione delle costanti arbitrarie, ma, in casi particolari, è possibile procedere in
maniera più semplice e veloce.
Supponiamo che
b(x) = P (x)eαx cos βx
(14) funzsimc1
oppure
b(x) = P (x)eαx sin βx
con P (x) polinomio di grado m ≥ 0 e α, β ∈ R.
Poniamo

se α + iβ non è soluzione di (13)
 0
µ=

molteplicità di α + iβ
se α + iβ è soluzione di (13)
Allora, riusciamo sempre a trovare un in integrale particolare del tipo
xµ eαx [R(x) cos βx + S(x) sin βx]
12
con R(x), S(x) polinomi di grado m (aventi lo stesso grado di P (x)).
Pertanto dovremo semplicemente trovare i coefficienti dei polinomi R(x) e S(x).
Se b(x) = P (x), allora siamo nel caso (14) con α = 0 e β = 0.
Ricordiamo infine che, per quanto detto nell’Osservazione 2.3, se in (11)
b(x) = b1 (x) + b2 (x), allora un integrale particolare può essere ottenuto come
somma di due integrali particolari ottenuti considerando le equazioni
y (n) + an−1 y (n−1) + . . . + a1 y 0 + a0 y = b1 (x)
e
y (n) + an−1 y (n−1) + . . . + a1 y 0 + a0 y = b2 (x).
13