Appunti per il corso di Analisi Matematica II Pietro d’Avenia L3 In Ingegneria Edile (corso A) A.A. 2007/2008 1 Estremi relativi liberi per funzioni di due variabili reali In questa sezione studiamo le condizioni necessarie e sufficienti relative ai punti di massimo e minimo relativo per funzioni reali di due variabili reali. Come vedremo, esistono forti analogie con il caso di funzioni reali di una sola variabile reale e per questo motivo, dopo aver richiamato alcune nozioni di algebra lineare, seguiremo lo stesso cammino percorso in Analisi Matematica I. Nel seguito X indicherà un sottinsieme aperto di R2 e f una funzione definita in X ed a valori in R. 1.1 Richiami di algebra lineare Sia A una matrice n × n. Definizione 1.1. Diciamo che A è una matrice definita positiva (risp. definita negativa) se per ogni h ∈ Rn \ {0}, hA · h, hi > 0 (risp. hA · h, hi < 0). Diciamo che A è una matrice semidefinita positiva (risp. semidefinita negativa) se per ogni h ∈ Rn , hA · h, hi ≥ 0 (risp. hA · h, hi ≤ 0). Diciamo che A non è definita se non è definita positiva, definita negativa, semidefinita positiva, semidefinita negativa. Osservazione 1.2. Ovviamente le matrici definite positive (risp. negative) sono semidefinite positive (risp. negative) ma non vale il viceversa. Per le matrici definite positive e definite negative abbiamo la seguente caratterizzazione. 1 Teorema 1.3. A è definita positiva (risp. negativa) se e solo se tutti i suoi autovalori sono strettamente positivi (risp. negativi). hosspmi Osservazione 1.4. Ovviamente, se una matrice ha sia autovalori positivi che negativi, non è né definita positiva, né definita negativa (e quindi nemmeno semidefinita positiva o negativa). 1.2 Alcune definizioni Le definizioni di punto di massimo e minimo relativo per funzioni di due variabili reali sono le stesse già date nel precedente corso di Analisi Matematica I. Ovviamente, rispetto alle funzioni reali di variabile reale, qui occorre estendere opportunamente il concetto di intorno. Per completezza ricordiamo che (x0 , y0 ) ∈ X è un punto di massimo relativo (risp. minimo) se esiste un intorno U di (x0 , y0 ) tale che per ogni (x, y) ∈ U ∩ X si ha f (x, y) ≥ f (x0 , y0 ) (risp. f (x, y) ≤ f (x0 , y0 )). Diamo inoltre la seguente definizione. Definizione 1.5. Diciamo che (x0 , y0 ) ∈ X è punto critico o stazionario per f se f è differenziabile in (x0 , y0 ) e ∇f (x0 , y0 ) = 0. 1.3 Condizioni necessarie Valgono i seguenti risultati. hpcriti Teorema 1.6. Supponiamo che (x0 , y0 ) ∈ X sia un punto di massimo o di minimo relativo per f e che f sia differenziabile in (x0 , y0 ). Allora (x0 , y0 ) è un punto critico di f . hsemdefi Teorema 1.7. Supponiamo che (x0 , y0 ) ∈ X sia un punto di massimo (risp. minimo) per f e che f sia differenziabile due volte in (x0 , y0 ). Allora Hf (x0 , y0 ) è semidefinita negativa (risp. positiva). I risultati precedenti costituiscono condizioni solo necessarie. Infatti, se consideriamo la funzione f (x, y) = x2 − y 2 , semplici calcoli mostrano che (0, 0) è un punto critico ma non è né punto di massimo, né punto di minimo. Inoltre, considerata la funzione f (x, y) = x2 − y 4 , semplci calcoli mostrano che (0, 0) è un punto critico, Hf (0, 0) è semidefinita positiva, ma (0, 0) non è punto di minimo relativo (e neanche punto di massimo). 2 1.4 hcondsuffi Condizioni sufficienti Teorema 1.8. Supponiamo che f sia differenziabile due volte in (x0 , y0 ) ∈ X e che (x0 , y0 ) sia un punto critico di f . Se Hf (x0 , y0 ) è definita positiva (risp. negativa) allora (x0 , y0 ) è punto di minimo (risp. di massimo) relativo per f . Dimostrazione. Consideriamo il caso in cui Hf (x0 , y0 ) è definita positiva. Dalla formula di Taylor, per (x, y) → (x0 , y0 ) f (x, y) = = ≥ 1.5 f (x0 , y0 ) + h∇f (x0 , y0 ), (x − x0 , y − y0 )i 1 + hHf (x0 , y0 )(x − x0 , y − y0 ), (x − x0 , y − y0 )i 2 +o (k(x − x0 , y − y0 )k) f (x0 , y0 ) 1 + hHf (x0 , y0 )(x − x0 , y − y0 ), (x − x0 , y − y0 )i 2 +o (k(x − x0 , y − y0 )k) f (x0 , y0 ). Applichiamo i Teoremi in due dimensioni Quanto detto nelle sezioni precedenti, anche se enunciato per funzioni reali di due variabili reali, è valido per funzioni reali di n variabili reali. In questa sezione applichiamo i Teoremi 1.6, 1.7 e 1.8, dando un metodo valido solo nel caso di funzioni f reali di due variabili reali. Supponiamo che f sia differenziabile due volte in X. Dopo aver individuato i punti critici di f (Teorema 1.6), per ciascun punto critico (x0 , y0 ), calcoliamo gli autovalori della matrice Hf (x0 , y0 ) risolvendo l’equazione det (Hf (x0 , y0 ) − λI) = 0, cioè, ricordando che, per il Teorema di Schwarz, fxy (x0 , y0 ) = fyx (x0 , y0 ), fxx (x0 , y0 ) − λ fxy (x0 , y0 ) = 0, fxy (x0 , y0 ) fyy (x0 , y0 ) − λ che, sviluppata, diventa i h 2 λ2 −[fxx (x0 , y0 ) + fyy (x0 , y0 )] λ+ fxx (x0 , y0 ) fyy (x0 , y0 ) − (fxy (x0 , y0 )) = 0 o, più brevemente, λ2 − tr(Hf (x0 , y0 ))λ + det(Hf (x0 , y0 )) = 0. (1) 1.1c Osserviamo che l’equazione (1) è un’equazione di secondo grado nell’incognita λe 2 ∆ = [tr(Hf (x0 , y0 ))] − 4 det(Hf (x0 , y0 )) 2 2 = [fxx (x0 , y0 ) − fyy (x0 , y0 )] + 4 (fxy (x0 , y0 )) ≥ 0. 3 Quindi esistono λ1 , λ2 ∈ R soluzioni di (1) e, inoltre, λ1 + λ2 = tr(Hf (x0 , y0 )) (2) piu λ1 λ2 = det(Hf (x0 , y0 )). (3) per e Allora, se det(Hf (x0 , y0 )) < 0, da (3) abbiamo che λ1 e λ2 hanno segno opposto. Quindi la matrice Hf (x0 , y0 ) non è definita (Osservazione 1.4) e pertanto, per il Teorema 1.7 il punto (x0 , y0 ) non è né di massimo, né di minimo relativo. Se det(Hf (x0 , y0 )) > 0, da (3) abbiamo che λ1 e λ2 sono concordi ed essendo det(Hf (x0 , y0 )) = fxx (x0 , y0 ) fyy (x0 , y0 ) − (fxy (x0 , y0 )) 2 anche fxx (x0 , y0 ) e fyy (x0 , y0 ) hanno lo stesso segno. Pertanto, se fxx (x0 , y0 ) > 0 (e fyy (x0 , y0 ) > 0), allora, per (2), λ1 e λ2 sono entrambi positivi e quindi (x0 , y0 ) è punto di minimo relativo, se fxx (x0 , y0 ) < 0 (e fyy (x0 , y0 ) < 0), allora, per (2), λ1 e λ2 sono entrambi negativi e quindi (x0 , y0 ) è punto di massimo relativo. Se det(Hf (x0 , y0 )) = 0 applichiamo metodi diretti. 4 2 Alcune note sulle equazioni differenziali In questa sezione diamo alcune nozioni sulle equazioni differenziali che vanno ad integrare quanto presente nel testo consigliato durante il corso a cui faremo riferimento. 2.1 Equazioni differenziali: definizione e prime proprietà Introduzione (pag. 421); Definizione di equazione differenziale (pagg. 421, 422); Definizione di sistema di equazioni differenziali del primo ordine (pag. 433); Definizione di problema di Chuchy per equazioni differenziali (pag. 422) e per sistemi di equazioni differenziali (pag. 433); Teoremi di esistenza ed unicità locale per equazioni differenziali (pag. 429) e sistemi di equazioni differenziali (pag. 434); Equazioni differenziali del primo ordine a variabili separabili (pagg. 428-431). 2.2 Equazioni differenziali lineari di ordine n Sia data un’equazione differenziale lineare di ordine n y (n) = an−1 (x)y (n−1) + ... + a1 (x)y 0 + a0 (x)y + b(x) (4) eqdifflinn con n ∈ N e ai e b funzioni reali di variabile reale, che supponiamo definite in un intervallo I ⊂ R ed ivi continue. homogi hosseqomsovri h1piu2i Definizione 2.1. Se, per ogni x ∈ I, b(x) = 0, allora diremo che la (4) è omogenea, altrimenti parleremo di equazione completa. Osservazione 2.2. Se ŷ, ỹ sono soluzioni di un’equazione differenziale di ordine n lineare e omogenea, allora ogni combinazione lineare λŷ + µỹ è ancora soluzione della stessa equazione. Osservazione 2.3. Se b(x) = b1 (x) + b2 (x) allora, detta y1 una soluzione di y (n) = an−1 (x)y (n−1) + ... + a1 (x)y 0 + a0 (x)y + b1 (x) e y2 una soluzione di y (n) = an−1 (x)y (n−1) + ... + a1 (x)y 0 + a0 (x)y + b2 (x) allora y1 + y2 è soluzione di y (n) = an−1 (x)y (n−1) + ... + a1 (x)y 0 + a0 (x)y + b(x). Ovviamente possiamo procedere analogamente nel caso in cui b è somma di m funzioni bj . 5 L’equazione (4) può essere scritta come un sistema di n equazioni differenziali lineari del primo ordine. Infatti, se poniamo y1 = y, y2 = y 0 , ... (5) relsiseq (n−2) y = y , n−1 yn = y (n−1) , allora 0 y1 = y 0 = y2 , y20 = y 00 = y3 , ... y0 = y (n−1) = yn n−1 0 yn = y (n) e quindi la (4) diventa 0 y1 = y2 , y20 = y3 , ... y0 = yn n−1 yn0 = a0 (x)y1 + a1 (x)y2 + ... + an−1 (x)yn + b(x) che, in forma vettoriale può essere scritta y 0 = A(x)y + B(x) con A(x) = e 0 0 .. . 1 0 0 1 ... ... .. . 0 0 0 0 .. . 0 0 0 ... 0 0 0 ... a0 (x) a1 (x) a2 (x) . . . 1 0 0 1 B(x) = 2.2.1 0 0 .. . 0 0 b(x) an−2 (x) an−1 (x) Sistemi di n equazioni differenziali lineari del primo ordine In questa prima parte diamo risultati per sistemi di n equazioni differenziali lineari del primo ordine y 0 = A(x)y + B(x) (6) sislincompl 6 con A(x) = {aij (x)}1≤i,j≤n e B(x) = (b1 (x), . . . , bn (x)) . Supponiamo che le funzioni reali aij e bi siano definite in un intervallo I ⊂ R e siano continue su I. Tali condizioni permettono di poter applicare il teorema di esistenza ed unicità (globale) per ogni problema di Cauchy 0 y = A(x)y + B(x) y(x0 ) = y0 con x0 ∈ I e y0 ∈ Rn . Definizione 2.4. Analogamente alla Definizione 2.1, diciamo che un sistema di n equazioni differenziali lineari del primo ordine (6) è omogeneo se per ogni x ∈ I, B(x) = 0, altrimenti parliamo di sistema completo. hosssisomsovri Osservazione 2.5. Ovviamente anche per i sistemi di n equazioni differenziali lineari del primo ordine omogenei vale un risultato analogo a quello enunciato nell’Osservazione 2.2. Vogliamo determinare l’insieme SB = y ∈ C 1 (I, Rn ) y 0 = A(x)y + B(x) , cioè l’insieme delle soluzioni di (6). Consideriamo il sistema omogeneo associato a (6), cioè il sistema y 0 = A(x)y ottenuto da (6) ponendo B = 0 e l’insieme S = y ∈ C 1 (I, Rn ) y 0 = A(x)y , ovvero l’insieme delle soluzioni di (7). Abbiamo il seguente risultato. hthomassi Teorema 2.6. L’insieme S è uno spazio vettoriale e dim S = n. Dimostrazione. Detto L : y ∈ C 1 (I, Rn ) 7−→ y 0 − A(x)y ∈ C(I, Rn ) abbiamo che, se ŷ, ỹ ∈ C 1 (I, Rn ) e λ, µ ∈ R, L(λŷ + µỹ) = = = (λŷ + µỹ)0 − A(x)(λŷ + µỹ) λŷ 0 + µỹ 0 − λA(x)ŷ − µA(x)ỹ λL(ŷ) + µL(ỹ) e quindi L è un operatore lineare. Inoltre S = ker(L) 7 (7) sisomass e quindi S è uno spazio vettoriale. Per determinare la dimensione di S, fissiamo x0 ∈ I e consideriamo la funzione che a y0 ∈ Rn associa l’unica soluzione del problema di Cauchy 0 y = A(x)y y(x0 ) = y0 . Il teorema di esistenza ed unicità ci consente di affermare che tale funzione è bigettiva. Inoltre la linearità e l’omogeneità (Osservazione 2.5) implicano la linearità di tale funzione che quindi risulta essere un isomorfismo. Pertanto Rn e S, essendo isomorfi, hanno la stessa dimensione e dunque dim S = n. Osservazione 2.7. Dalla dimostrazione del teorema precedente segue che una base di S può essere determinata considerando la base canonica {ei }1≤i≤n e le soluzioni di 0 y = A(x)y y(x0 ) = ei ottenute al variare di i ∈ {1, . . . , n}. Allora, per determinare l’insieme S, basta determinare una sua base (e quindi un sistema di n vettori linearmente indipendenti) e ogni soluzione di (7) è combinazione lineare degli elementi di tale base. Il Teorema 2.6 è utile anche ai fini della determinazione di SB . Infatti abbiamo il seguente risultato. hcompli Teorema 2.8. Sia ȳ una soluzione di (6). Allora SB = S + ȳ = {y + ȳ y ∈ S} . Dimostrazione. Dimostriamo che SB ⊂ S + ȳ. Se y ∈ SB , allora possiamo scrivere y = (y − ȳ) + ȳ e quindi basterà provare che y − ȳ ∈ S. Da (y − ȳ)0 = y 0 − ȳ 0 = A(x)y + B(x) − A(x)ȳ − B(x) = A(x)(y − ȳ) abbiamo subito che (y − ȳ) è soluzione di (7) e quindi (8) è provata. Per dimostrare che S + ȳ ⊂ SB , prendiamo y ∈ S e facciamo vedere che y + ȳ ∈ SB . Infatti (y + ȳ)0 = y 0 + ȳ 0 = A(x)y + A(x)ȳ + B(x) = A(x)(y + ȳ) + B(x). 8 (8) primaincl Dal Teorema 2.8 abbiamo quindi che, per determinare la generica soluzione di (6), basta calcolare la generica soluzione di (7) e una soluzione di (6), che, d’ora in poi, chiameremo integrale particolare. 2.2.2 Equazioni differenziali lineari di ordine n Grazie a quanto osservato all’inizio del paragrafo (ogni equazione differenziale lineare di ordine n può essere scritta come un sistema di n equazioni differenziali lineari del primo ordine), possiamo riportare i risutati ottenuti per i sistemi alle equazioni. In particolare, se partiamo da un’equazione differenziale lineare di ordine n, applicando le uguaglianze in (5), otteniamo un sistema di n equazioni differenziali del primo ordine lineare e le componenti dei vettori sono la funzione e le sue derivate, fino alla derivata (n − 1)−esima. Quindi, se abbiamo un’equazione differenziale lineare di ordine n omogenea, l’insieme delle soluzioni S sarà dato dalle combinazioni lineari di n funzioni yi tali che gli n vettori y1 , y1 0 , . . . , y1 (n−1) , . . . , yn , yn 0 , . . . , yn (n−1) siano linearmente indipendenti. Se invece abbiamo un’equazione differenziale lineare di ordine n non omogenea, allora dobbiamo anche determinare un integrale particolare dell’equazione completa. Diamo ora un esempio fondamentale. hes2ordi Esempio 2.9. Consideriamo, a titolo di esempio, l’equazione differenziale y 00 + by 0 + cy = 0, (9) 2lincc con b e c ∈ R, e cerchiamo soluzioni di (9) del tipo y(x) = eαx con α ∈ C. Semplici calcoli mostrano che y 0 (x) = αeαx , y 00 (x) = α2 eαx . Sostituendo in (9), abbiamo che α deve essere soluzione di α2 + bα + c = 0. Posto ∆ = b2 − 4c distinguiamo i seguenti casi: 9 (10) 2grado ∆ > 0 L’equazione (10) ha due soluzioni reali distinte α1 < α2 . Allora y1 = eα1 x , y2 = eα2 x sono soluzioni di (9). Inoltre i vettori (y1 , y1 0 ) = (eα1 x , α1 eα1 x ) (y2 , y2 0 ) = (eα2 x , α2 eα2 x ) sono linearmente indipendenti, infatti y1 eα2 x y2 eα1 x 0 α1 x 0 = y1 α1 e α2 eα2 x y2 = (α2 − α1 ) e(α1 +α2 )x 6= 0 essendo α1 6= α2 e e(α1 +α2 )x 6= 0. Quindi, in questo caso, l’integrale generale di (9) è c1 eα1 x + c2 eα2 x . ∆ = 0 L’equazione (10) ha due soluzioni reali coincidenti e α1 = α2 = − 2b . Allora b y1 = e− 2 x è soluzione di (9). Un’altra soluzione di (9) è b y2 = xe− 2 x . Infatti 00 0 y2 + by2 + cy2 b b b b2 − 2b x + b 1 − x e− 2 x + cxe− 2 x x−b e 4 2 b2 − 4c − b x ∆ −bx xe 2 = xe 2 = 0. 4 4 = = Inoltre i vettori b b (y1 , y1 0 ) = e− 2 x , − 2b e− 2 x b b (y2 , y2 0 ) = xe− 2 x , 1 − 2b x e− 2 x sono linearmente indipendenti, infatti b y1 e− 2b x y xe− 2 x 2 0 = b b 0 y1 y2 − 2b e− 2 x 1 − 2b x e− 2 x Quindi, in questo caso, l’integrale generale di (9) è b b c1 e− 2 x + c2 xe− 2 x . 10 = e−bx 6= 0. ∆ < 0 L’equazione (10) ha due soluzioni complesse coniugate √ √ b −∆ b −∆ α1 = − − i e α2 = − + i. 2 2 2 2 Allora eα1 x eα2 x e sono soluzioni di (9). Inoltre, anche y1 = y2 = eα1 x +eα2 x 2 eα2 x −eα1 x 2i b = √ −∆ 2 x , √ b −∆ e− 2 x sin 2 x = e− 2 x cos sono soluzioni di (9) e i vettori √ h √ √ i b b √ −∆ −∆ −∆ −∆ b x , − cos x + ( sin x e− 2 x (y1 , y1 0 ) = e− 2 x cos 2 2 2 2 2 b √ h √ √ i b √ −∆ −∆ −∆ −∆ b (y2 , y2 0 ) = e− 2 x sin x , − sin x − ( cos x e− 2 x 2 2 2 2 2 sono linearmente indipendenti, infatti √ √ y1 −∆ −∆ y2 2 2 0 x + sin x e−bx = e−bx 6= 0. = cos y1 y2 0 2 2 Quindi, in questo caso, l’integrale generale di (9) è √ √ −∆ −∆ − 2b x c1 cos x + c2 sin x . e 2 2 Diamo ora due metodi per determinare un integrale particolare nel caso di equazioni differenziali non omogenee. 2.2.3 Equazioni differenziali lineari del primo ordine a coefficienti continui e metodo della variazione delle costanti arbitrarie pagg. 422-427 2.2.4 Equazioni differenziali lineari di ordine n a coefficienti costanti e metodo delle funzioni simili Sia data l’equazione y (n) + an−1 y (n−1) + . . . + a1 y 0 + a0 y = b(x) (11) eqlinccc con ai ∈ R. Per risolvere l’equazione omogenea associata y (n) + an−1 y (n−1) + . . . + a1 y 0 + a0 y = 0 11 (12) eqlinccom calcoliamo le radici dell’equazione caratteristica λn + an−1 λn−1 + . . . + a1 λ + a0 = 0. (13) carn Analogamente a quanto visto nell’Esempio 2.9, ogni soluzione reale λ di (12) avente molteplicità µ, dà origine a µ termini del tipo cj xj eλx j = 0, . . . , µ − 1 (con cj ∈ R) e ogni coppia di soluzioni complesse coniugate α ± iβ di (12) avente molteplicità ν darà origine a ν termini del tipo xj eαx (dj cos(βx) + gj sin(βx)) j = 0, . . . , ν − 1 (con dj , gj ∈ R). In generale, dette λ1 , . . . , λh le soluzioni reali di (13) risptettivamente con molteplicità µ1 , . . . , µh e α1 ± iβ1 , . . . , αk ± iβk le soluzioni complesse coniugate di (13) risptettivamente con molteplicità ν1 , . . . , νk , l’insieme delle soluzioni (o integrale generale) di (12) è dato da Pµ1 −1 j=0 c1j xj eλ1 x Pµh −1 + . . . + j=0 chj xj eλh x νX 1 −1 xj eα1 x (d1j cos(β1 x) + g1j sin(β1 x)) + j=0 + ... + νX k −1 xj eαk x (dkj cos(βk x) + gkj sin(βk x)) j=0 al variare di cσj , dσj , gσj ∈ R. Per determinare l’integrarle generale di (11), dobbiamo quindi determinarne un integrale particolare. Ovviamente possiamo applicare il metodo della variazione delle costanti arbitrarie, ma, in casi particolari, è possibile procedere in maniera più semplice e veloce. Supponiamo che b(x) = P (x)eαx cos βx (14) funzsimc1 oppure b(x) = P (x)eαx sin βx con P (x) polinomio di grado m ≥ 0 e α, β ∈ R. Poniamo se α + iβ non è soluzione di (13) 0 µ= molteplicità di α + iβ se α + iβ è soluzione di (13) Allora, riusciamo sempre a trovare un in integrale particolare del tipo xµ eαx [R(x) cos βx + S(x) sin βx] 12 con R(x), S(x) polinomi di grado m (aventi lo stesso grado di P (x)). Pertanto dovremo semplicemente trovare i coefficienti dei polinomi R(x) e S(x). Se b(x) = P (x), allora siamo nel caso (14) con α = 0 e β = 0. Ricordiamo infine che, per quanto detto nell’Osservazione 2.3, se in (11) b(x) = b1 (x) + b2 (x), allora un integrale particolare può essere ottenuto come somma di due integrali particolari ottenuti considerando le equazioni y (n) + an−1 y (n−1) + . . . + a1 y 0 + a0 y = b1 (x) e y (n) + an−1 y (n−1) + . . . + a1 y 0 + a0 y = b2 (x). 13