Università degli Studi di Bergamo Esercizi di Matematica II Francesco Bottacin A.A. 2002/03 Capitolo 1 Spazi Vettoriali 1. Richiami di teoria 1.1. Spazi vettoriali Sia C un campo fissato (usualmente C è il campo dei numeri reali R oppure il campo dei numeri complessi C). Definizione 1.1. Uno spazio vettoriale su C è un insieme V dotato di una operazione +V , detta somma, +V : V × V → V, (v1 , v2 ) 7→ v1 +V v2 , e di una operazione ·V ·V : C × V → V, (λ, v) 7→ λ ·V v, detta prodotto per uno scalare, che soddisfano le seguenti proprietà: per ogni λ, λ1 , λ2 ∈ C e ogni v, v1 , v2 ∈ V si ha (1) (2) (3) (4) (5) (6) (7) (8) (v1 +V v2 ) +V v3 = v1 +V (v2 +V v3 ); v1 +V v2 = v2 +V v1 ; esiste un elemento 0V ∈ V tale che v +V 0V = 0V +V v = v; per ogni v ∈ V esiste un elemento v 0 ∈ V tale che v+V v 0 = v 0 +V v = 0V . Tale elemento v 0 viene indicato con −v e detto l’opposto di v; λ ·V (v1 +V v2 ) = (λ ·V v1 ) +V (λ ·V v2 ); (λ1 + λ2 ) ·V v = (λ1 ·V v) +V (λ2 ·V v); (λ1 λ2 ) ·V v = λ1 ·V (λ2 ·V v); 1 ·V v = v. Gli elementi di uno spazio vettoriale V sono detti vettori. Gli elementi del campo C sono detti scalari. D’ora in poi, qualora non vi sia pericolo di confusione, l’operazione di somma in uno spazio vettoriale V sarà indicata semplicemente con + mentre il simbolo del prodotto per uno scalare sarà omesso: si scriverà quindi v1 +v2 al posto di v1 +V v2 e λv al posto di λ ·V v. Consideriamo ora uno spazio vettoriale V , definito sul campo C. 2 1. Spazi Vettoriali Definizione 1.2. Un sottospazio vettoriale W di V è un sottoinsieme W ⊂ V tale che la restrizione a W delle operazioni di somma e di prodotto per uno scalare definite su V rende W uno spazio vettoriale sul campo C. Dalla definizione si deduce quindi che affinché un sottoinsieme W di V sia un sottospazio vettoriale è necessario e sufficiente che, per ogni w1 , w2 ∈ W , si abbia w1 + w2 ∈ W ; che per ogni w ∈ W anche −w ∈ W ; che 0V ∈ W ; e che, per ogni λ ∈ C e ogni w ∈ W , anche λw ∈ W . Tutte queste condizioni si possono riassumere nella seguente: Proposizione 1.3. Un sottoinsieme W di uno spazio vettoriale V sul campo C è un sottospazio vettoriale se e solo se λ1 w1 + λ2 w2 ∈ W, per ogni λ1 , λ2 ∈ C e ogni w1 , w2 ∈ W . Si noti che, se (Wi )i∈I è una famiglia di sottospazi vettoriali di V , allora anche l’intersezione di tutti i Wi \ Wi i∈I è un sottospazio vettoriale di V . L’analoga proprietà non vale invece per l’unione: se W1 e W2 sono due sottospazi vettoriali di V , l’unione W1 ∪W2 non è, in generale, un sottospazio vettoriale di V . 1.2. Combinazioni lineari e basi Sia V uno spazio vettoriale su un campo C e siano v1 , v2 , . . . , vn dei vettori di V . Definizione 1.4. Una combinazione lineare dei vettori v1 , v2 , . . . , vn è l’espressione λ 1 v 1 + λ2 v 2 + · · · + λn v n , per λ1 , λ2 , . . . , λn ∈ C. Definizione 1.5. I vettori v1 , v2 , . . . , vn si dicono linearmente indipendenti se l’equazione λ1 v1 + λ2 v2 + · · · + λn vn = 0V ha come unica soluzione λ1 = λ2 = · · · = λn = 0. I vettori v1 , v2 , . . . , vn si dicono linearmente dipendenti se non sono linearmente indipendenti, cioè se esistono degli scalari λ1 , λ2 , . . . , λn non tutti nulli tali che λ1 v1 + λ2 v2 + · · · + λn vn = 0V . Ricordiamo il seguente risultato: Proposizione 1.6. Se v1 , v2 , . . . , vn sono linearmente indipendenti e se v si può scrivere come loro combinazione lineare, v = λ1 v 1 + λ 2 v 2 + · · · + λ n v n , 1. Richiami di teoria 3 allora gli scalari λ1 , λ2 , . . . , λn sono determinati in modo unico. Sia S un sottoinsieme dello spazio vettoriale V . Definiamo il sottospazio vettoriale generato da S, indicato con L(S), come il più piccolo (per la relazione d’ordine data dall’inclusione) sottospazio vettoriale di V contenente S (se S è vuoto poniamo L(S) = {0}). Dato che l’intersezione di una famiglia di sottospazi vettoriali di V è un sottospazio vettoriale, si verifica immediatamente che si ha: \ L(S) = U, S⊂U cioè L(S) è l’intersezione di tutti i sottospazi vettoriali di V contenenti S. Un’altra descrizione, ancora più esplicita, di L(S) è la seguente: ( n ) X L(S) = λi vi | n ∈ N, λi ∈ C, vi ∈ S , i=1 cioè gli elementi di L(S) sono quei vettori di V che si possono esprimere come combinazione lineare di un numero finito di elementi di S. Se S = {v1 , v2 , . . . , vm }, il sottospazio vettoriale L(S) verrà spesso indicato con la notazione hv1 , v2 , . . . , vn i. Dato che, come abbiamo già visto, nel contesto degli spazi vettoriali l’operazione di unione di due sottospazi non ha delle buone proprietà (l’unione di due sottospazi vettoriali non è un sottospazio vettoriale), tale operazione viene sostituita dall’operazione di somma: Definizione 1.7. Se W1 e W2 sono sottospazi vettoriali di V , la somma W1 + W2 è il sottospazio vettoriale L(W1 ∪ W2 ) generato da W1 ∪ W2 . Da quanto detto prima si ha che W1 + W2 = {λ1 w1 + λ2 w2 | λ1 , λ2 ∈ C, w1 ∈ W1 , w2 ∈ W2 }. Definizione 1.8. La somma di due sottospazi vettoriali W1 e W2 di V si dice diretta, e si indica con W1 ⊕ W2 , se si ha W1 ∩ W2 = 0. Si verifica facilmente che se v ∈ W1 ⊕ W2 allora v si può scrivere in un unico modo nella forma v = w1 + w2 , con w1 ∈ W1 e w2 ∈ W2 . Definizione 1.9. Un insieme di vettori {v1 , v2 , . . . , vm } è detto un insieme di generatori di V se L{v1 , v2 , . . . , vm } = V . In tal caso si dice anche che i vettori v1 , v2 , . . . , vm generano V . Definizione 1.10. Uno spazio vettoriale V è detto finitamente generato se esiste un insieme finito di generatori di V . La relazione fondamentale tra vettori linearmente indipendenti e insiemi di generatori è contenuta nel risultato seguente: Proposizione 1.11. Sia V uno spazio vettoriale. Sia {v1 , v2 , . . . , vm } un insieme di generatori di V e {w1 , w2 , . . . , wr } un insieme di vettori linearmente indipendenti. Allora r ≤ m. 4 1. Spazi Vettoriali Nel seguito considereremo solo spazi vettoriali finitamente generati, cioè spazi vettoriali che ammettono un insieme finito di generatori. A tal proposito, ricordiamo il seguente risultato: Proposizione 1.12. Ogni sottospazio vettoriale W di uno spazio vettoriale finitamente generato V è finitamente generato. Definizione 1.13. Una base di V è un insieme di vettori linearmente indipendenti che generano V . I risultati seguenti precisano le relazioni esistenti tra i concetti di vettori linearmente indipendenti, insiemi di generatori e basi di uno spazio vettoriale V . Proposizione 1.14. Sia {v1 , v2 , . . . , vr } un insieme di vettori linearmente indipendenti di un spazio vettoriale V (finitamente generato). Allora esistono dei vettori vr+1 , . . . , vn tali che {v1 , v2 , . . . , vr , vr+1 , . . . , vn } sia una base di V . Proposizione 1.15. Ogni spazio vettoriale V (finitamente generato) ha una base. Proposizione 1.16. Sia {v1 , v2 , . . . , vm } un insieme di generatori di V . Allora esiste un sottoinsieme di {v1 , v2 , . . . , vm } che è una base di V . Proposizione 1.17. Se {v1 , v2 , . . . , vn } e {w1 , w2 , . . . , wm } sono due basi di V , allora m = n. Dato che tutte le basi di uno spazio vettoriale hanno lo stesso numero di elementi, tale numero dipende solo dallo spazio vettoriale. Possiamo quindi dare la seguente definizione: Definizione 1.18. La dimensione di uno spazio vettoriale V sul corpo C, indicata con dimC V , o semplicemente con dim V , è il numero di elementi di una base di V . Proposizione 1.19. Se W è un sottospazio vettoriale di V , si ha dim W ≤ dim V . Se si conosce la dimensione di uno spazio vettoriale V allora la verifica che un certo insieme di vettori costituisce una base di V risulta semplificata. Vale infatti il seguente risultato. Proposizione 1.20. Sia V uno spazio vettoriale di dimensione n e siano v1 , . . . , vn dei vettori di V . (1) Se i vettori v1 , . . . , vn sono un sistema di generatori di V , allora essi sono anche linearmente indipendenti, e quindi sono una base di V . (2) Se i vettori v1 , . . . , vn sono linearmente indipendenti, allora essi sono anche un sistema di generatori di V , e quindi sono una base di V . 2. Esercizi 5 Per terminare, la seguente formula mette in relazione le dimensioni di due sottospazi vettoriali di V con le dimensioni della loro somma e della loro intersezione: Proposizione 1.21. Siano U e W due sottospazi vettoriali di uno spazio vettoriale V . Allora si ha: dim(U + W ) = dim U + dim W − dim(U ∩ W ). 2. Esercizi 2.1. Definizioni Esercizio 1. Si dica se gli insiemi seguenti sono degli spazi vettoriali: (1) L’insieme delle funzioni reali definite nell’intervallo [0, 1], continue, positive o nulle, per le operazioni di addizione e di prodotto per un numero reale. (2) L’insieme delle funzioni reali f definite in R, tali che lim f (x) = 0, x→+∞ per le operazioni di addizione e di prodotto per un numero reale. (3) L’insieme A = {x ∈ R | x > 0}, per le operazioni di somma e di prodotto per uno scalare definite rispettivamente da x ⊕ y = xy, ∀ x, y ∈ A λ · x = xλ , ∀ x ∈ A, λ ∈ R. (4) L’insieme delle funzioni da R in R che si annullano in 1 oppure in 4. (5) L’insieme dei polinomi di grado uguale a n (n intero positivo). (6) L’insieme delle funzioni da R in R, di classe C 2 , tali che f 00 + ω 2 f = 0, con ω ∈ R. (7) L’insieme delle funzioni reali f (x) definite nell’intervallo [0, 1], continue, tali che Z 1 f (x) sin x dx = 0. 0 2.2. Basi Esercizio 2. Sia V lo spazio vettoriale dei polinomi, a coefficienti reali nella variabile x, di grado ≤ 3. Si verifichi che gli insiemi seguenti sono delle basi di V : (1) {1, x, x2 , x3 }; 6 1. Spazi Vettoriali (2) {1, 1 − x, x − x2 , x2 − x3 }; (3) {1, 1 + x, 1 + x + x2 , 1 + x + x2 + x3 }. Esercizio 3. Nello spazio vettoriale V dei polinomi di grado ≤ 2 si considerino i polinomi p1 (x) = x2 + x(1 − x) + (1 − x)2 p2 (x) = x2 + (1 − x)2 p3 (x) = x2 + 1 + (1 − x)2 p4 (x) = x(1 − x). È possibile estrarre da {p1 (x), p2 (x), p3 (x), p4 (x)} delle basi di V ? In caso affermativo, trovarle tutte. Esercizio 4. Nello spazio vettoriale delle funzioni continue da R in R, si considerino le funzioni f1 (x) = sin x, f2 (x) = sin 2x e f3 (x) = sin 3x. Si dica se queste funzioni sono linearmente indipendenti. Esercizio 5. Si dica se, nei casi seguenti, i vettori v1 , v2 e v3 costituiscono una base di R3 . In caso negativo si descriva il sottospazio da essi generato. (1) v1 = (1, 1, 1), v2 = (3, 0, −1), v3 = (−1, 1, −1); (2) v1 = (1, 2, 3), v2 = (3, 0, −1), v3 = (1, 8, 13); (3) v1 = (1, 2, −3), v2 = (1, 0, −1), v3 = (1, 10, −11). Esercizio 6. In R4 i vettori seguenti formano: (i ) un insieme libero (cioè un insieme di vettori linearmente indipendenti)? In caso affermativo, completarlo per ottenere una base di R4 , altrimenti determinare le relazioni di dipendenza lineare tra di loro ed estrarre da questo insieme di vettori almeno un insieme libero. (ii ) un insieme di generatori? In caso affermativo, estrarne almeno una base di R4 , altrimenti determinare la dimensione del sottospazio da essi generato. (1) v1 v4 (2) v1 (3) v1 v4 = (1, 1, 1, 1), v2 = (0, 1, 2, −1), v3 = (1, 0, −2, 3), = (2, 1, 0, −1), v5 = (4, 3, 2, 1); = (1, 2, 3, 4), v2 = (0, 1, 2, −1), v3 = (3, 4, 5, 16); = (1, 2, 3, 4), v2 = (0, 1, 2, −1), v3 = (2, 1, 0, 11), = (3, 4, 5, 14). Esercizio 7. Si determini una base del sottospazio vettoriale V di R5 costituito dai vettori (x1 , . . . , x5 ) che sono soluzioni del seguente sistema di equazioni lineari: x1 − 3x2 + x4 = 0 x2 + 3x3 − x5 = 0 x + 2x + x − x = 0. 1 2 3 4 2. Esercizi 7 Esercizio 8. In R4 siano v1 = (1, 2, 3, 4) e v2 = (1, −2, 3, −4). È possibile determinare due numeri reali x e y in modo tale che (x, 1, y, 1) ∈ L{v1 , v2 }? (Ricordiamo che L{v1 , v2 } indica il sottospazio generato dai vettori v1 e v2 .) Esercizio 9. Sia V uno spazio vettoriale. Si dica se le affermazioni seguenti sono vere o false. (1) Se i vettori v1 , v2 e v3 sono a due a due non proporzionali allora la famiglia {v1 , v2 , v3 } è libera. (2) Se nessuno fra i vettori v1 , . . . , vr è combinazione lineare dei vettori rimanenti allora la famiglia {v1 , . . . , vr } è libera. Esercizio 10. In R4 siano v1 = (0, 1, −2, 1), v2 = (1, 0, 2, −1), v3 = (3, 2, 2, −1), v4 = (0, 0, 1, 0), v5 = (0, 0, 0, 1). Si dica se le affermazioni seguenti sono vere o false. (1) L{v1 , v2 , v3 } = L{(1, 1, 0, 0), (−1, 1, −4, 2)}; (2) (1, 1, 0, 0) ∈ L{v1 , v2 } ∩ L{v2 , v3 , v4 }; (3) dim(L{v1 , v2 } ∩ L{v2 , v3 , v4 }) = 1; (4) L{v1 , v2 } + L{v2 , v3 , v4 } = R4 ; (5) L{v1 , v2 , v3 } + L{v4 , v5 } = R4 . Esercizio 11. Si studi la dipendenza o l’indipendenza lineare dei vettori seguenti, e si determini in ogni caso una base del sottospazio da essi generato. (1) (1, 0, 1), (0, 2, 2), (3, 7, 1), in R3 ; (2) (1, 0, 0), (0, 1, 1), (1, 1, 1), in R3 ; (3) (1, 2, 1, 2, 1), (2, 1, 2, 1, 2), (1, 0, 1, 1, 0), (0, 1, 0, 0, 1), in R5 . Esercizio 12. Sia V lo spazio vettoriale dei polinomi in x, a coefficienti in R, di grado ≤ n, con n intero positivo. Si dimostri che, per ogni a ∈ R, l’insieme {1, x − a, (x − a)2 , . . . , (x − a)n } è una base di V . Sia poi f (x) ∈ V ; si esprima f (x) come combinazione lineare dei precedenti polinomi. Chi sono i coefficienti di tale combinazione lineare? Esercizio 13. Siano Ut = L{u1 , u2 } e Vt = L{v1 , v2 } due sottospazi di R4 , con u1 = (1, t, 2t, 0), u2 = (t, t, t, t), v1 = (t − 2, −t, −3t, t) e v2 = (2, t, 2t, 0). (1) Si dica se esiste t ∈ R tale che Ut + Vt = R4 . (2) Per quali t ∈ R si ha dim(Ut ∩ Vt ) = 1? (3) Si determini una base di U1 ∩ V1 e la si estenda ad una base di R4 . Esercizio 14. In R4 si considerino i sottospazi U = L{v1 , v2 , v3 } e V = L{v4 , v5 }, dove v1 = (1, 2, 3, 4), v2 = (2, 2, 2, 6), v3 = (0, 2, 4, 4), v4 = (1, 0, −1, 2) e v5 = (2, 3, 0, 1). Si determinino delle basi dei sottospazi U ∩V , U, V e U + V . 8 1. Spazi Vettoriali 2.3. Sottospazi Vettoriali Esercizio 15. Siano U e W due sottospazi vettoriali di uno spazio vettoriale V . Dimostrare che U ∪W è un sottospazio vettoriale di V se e solo se U ⊂ W oppure W ⊂ U . Esercizio 16. Siano U , V e W tre sottospazi di uno stesso spazio vettoriale. Si dica se è vero o falso che U ∩ (V + W ) = (U ∩ V ) + (U ∩ W ). Esercizio 17. Si dica se è diretta la somma dei due seguenti sottospazi di R4 : U = L{(1, 0, 1, 0), (1, 2, 3, 4)} e V = L{(0, 1, 1, 1), (0, 0, 0, 1)}. Esercizio 18. Si considerino i seguenti sottospazi di R4 : U = L{(1, 0, 1, 0), (0, 1, 1, 1), (0, 0, 0, 1)} e V = L{(1, 0, 1, 0), (0, 1, 1, 0)}. Si determini un sottospazio W ⊂ R4 tale che U = V ⊕ W , e si dica se tale W è unico. Esercizio 19. Dati i seguenti sottospazi di R4 , U = L{(1, 0, 1, 0), (0, 0, 0, 1)} e V = L{(1, 0, 2, 0), (0, 0, 1, 1)}, esiste un sottospazio W ⊂ R4 tale che U ⊕ W = V ⊕ W = R4 ? In caso affermativo si determini W e si dica se è unico. Esercizio 20. Nello spazio vettoriale V dei polinomi, nella variabile x a coefficienti reali, di grado ≤ 5, si considerino i sottospazi seguenti: U1 = {p(x) ∈ V | p(0) = 0}, U2 = {p(x) ∈ V | p0 (1) = 0}, U3 = {p(x) ∈ V | x2 + 1 divide p(x)}, U4 = {p(x) ∈ V | p(−x) = p(x), ∀x}, U5 = {p(x) ∈ V | p(x) = xp0 (x), ∀x}. 1) Si determinino delle basi dei seguenti sottospazi: U1 , U2 , U3 , U4 , U5 , U1 ∩ U2 , U1 ∩ U3 , U1 ∩ U2 ∩ U3 , U1 ∩ U2 ∩ U3 ∩ U4 . 2) Si determinino dei sottospazi W1 e W2 di V tali che W1 ⊕ U4 = W2 ⊕ (U1 ∩ U3 ) = V . 3. Soluzioni 9 3. Soluzioni 3.1. Definizioni Svolgimento esercizio 1. Si tratta solo di verificare, caso per caso, se tutte le condizioni necessarie alla definizione di uno spazio vettoriale sono soddisfatte. (1) In questo caso l’insieme in questione non è uno spazio vettoriale. In effetti non è neppure un gruppo abeliano rispetto all’operazione di somma, in quanto non contiene gli opposti dei suoi elementi: se f è una funzione continua positiva o nulla, la funzione opposta −f sarà allora negativa o nulla, e non apparterrà dunque all’insieme in questione. (2) Si verifica facilmente che l’insieme in questione è uno spazio vettoriale, ricordando che, se limx→+∞ f (x) e limx→+∞ g(x) esistono, allora lim (f + g)(x) = lim f (x) + lim g(x) x→+∞ x→+∞ x→+∞ e lim (f g)(x) = x→+∞ lim f (x) x→+∞ lim g(x) . x→+∞ (3) Anche in questo caso l’insieme in questione è uno spazio vettoriale. Si consiglia di verificare con cura tutte le proprietà richieste. A titolo di esempio, verifichiamo che, dati due elementi x, y ∈ A ed uno scalare λ ∈ R, si ha λ · (x ⊕ y) = (λ · x) ⊕ (λ · y). In base alle definizioni date, si ha: λ·(x⊕y) = (xy)λ , mentre (λ·x)⊕(λ·y) = xλ y λ . L’uguaglianza deriva allora dalle note proprietà delle potenze. (4) L’insieme in questione non è uno spazio vettoriale, non essendo chiuso rispetto all’operazione di somma: infatti, sia ad esempio f una funzione tale che f (1) = 0 e f (4) = 1, e g una funzione tale che g(1) = 2 e g(4) = 0. Queste due funzioni appartengono all’insieme in questione, ma la loro somma non appartiene all’insieme dato, in quanto non si annulla né in 1 né in 4. (5) Anche questo insieme non è uno spazio vettoriale, non essendo chiuso rispetto all’operazione di somma: infatti, siano ad esempio p(x) = 2xn + 1 e q(x) = −2xn + 3 due polinomi di grado n. La loro somma è p(x) + q(x) = 4 che non ha più grado n (almeno se n 6= 0). Osservazione: è invece uno spazio vettoriale l’insieme dei polinomi di grado minore o uguale a n. (6) Questo insieme è uno spazio vettoriale (ciò è dovuto al fatto che l’equazione differenziale è lineare). Verifichiamo solo, a titolo di esempio, che esso è chiuso rispetto all’operazione di somma: siano dunque f e g due funzioni 10 1. Spazi Vettoriali che soddisfano l’equazione differenziale in questione. Si ha allora: (f + g)00 + ω 2 (f + g) = f 00 + g 00 + ω 2 f + ω 2 g = (f 00 + ω 2 f ) + (g 00 + ω 2 g) = 0 + 0 = 0. (7) Anche questo insieme è uno spazio vettoriale (ciò è dovuto al fatto che l’operazione di integrazione è lineare). Verifichiamo solo, a titolo di esempio, che esso è chiuso rispetto all’operazione di somma: siano dunque f e g due funzioni che soddisfano l’equazione integrale in questione. Si ha allora: Z 1 Z 1 Z 1 (f + g)(x) sin x dx = f (x) sin x dx + g(x) sin x dx = 0 + 0 = 0. 0 0 0 3.2. Basi Svolgimento esercizio 2. (1) Ogni polinomio f (x) ∈ V si scrive nella forma f (x) = a0 · 1 + a1 x + a2 x2 + a3 x3 , ciò significa che i polinomi 1, x, x2 , x3 sono un insieme di generatori di V . Vediamo se sono anche linearmente indipendenti: se a0 · 1 + a1 x + a2 x2 + a3 x3 = 0V (0V indica lo zero dello spazio vettoriale V , cioè il polinomio nullo), allora, per il principio di identità dei polinomi, si deve avere a0 = a1 = a2 = a3 = 0. Quindi {1, x, x2 , x3 } è una base di V , da cui si deduce, tra l’altro che V ha dimensione 4. (2) Anche in questo caso bisognerebbe dimostrare che i polinomi in questione sono un insieme di generatori e che sono linearmente indipendenti. Tuttavia sapendo che dim V = 4, che è anche il numero dei polinomi della ipotetica base, è sufficiente effettuare una sola delle due verifiche (perché?). Verifichiamo allora, ad esempio, che questi sono un insieme di generatori, e cioè che ogni polinomio f (x) = a0 + a1 x + a2 x2 + a3 x3 si può scrivere nella forma λ0 · 1 + λ1 (1 − x) + λ2 (x − x2 ) + λ3 (x2 − x3 ). Sviluppando i calcoli ed uguagliando i coefficienti delle successive potenze di x, si ottiene il sistema λ 0 + λ 1 = a0 λ 2 − λ 1 = a1 λ 3 − λ 2 = a2 − λ 3 = a3 che ha come soluzione λ3 λ2 λ1 λ0 = −a3 = −a2 − a3 = −a1 − a2 − a3 = a0 + a1 + a2 + a3 3. Soluzioni 11 Si conclude che i polinomi in questione sono un insieme di generatori, e dunque, essendo nel numero giusto, sono una base di V . (3) In base alle osservazioni fatte nel punto (2) è sufficiente dimostrare che i polinomi in questione sono linearmente indipendenti (oppure che sono un insieme di generatori): sia dunque λ0 · 1 + λ1 (1 + x) + λ2 (1 + x + x2 ) + λ3 (1 + x + x2 + x3 ) = 0. Sviluppando i calcoli ed uguagliando a zero i coefficienti, si ottiene il sistema λ 0 + λ 1 + λ2 + λ3 = 0 λ 1 + λ 2 + λ3 = 0 λ2 + λ3 = 0 λ3 = 0 che ha come unica soluzione λ0 = λ1 = λ2 = λ3 = 0. Si conclude cosı̀ che i polinomi in questione sono linearmente indipendenti, e dunque, essendo nel numero giusto, sono una base di V . Svolgimento esercizio 3. Lo spazio vettoriale V dei polinomi di grado ≤ 2 ha dimensione 3. Infatti una sua base è costituita dai tre polinomi {1, x, x2 } (ogni polinomio di grado ≤ 2 si scrive, in modo unico, come combinazione lineare a0 1 + a1 x + a2 x2 di questi tre polinomi). Con un semplice calcolo si verifica che p3 (x) = 2p1 (x), quindi, se da quei quattro polinomi si può estrarre una base, tale base deve essere data da {p1 (x), p2 (x), p4 (x)} (o, equivalentemente, da {p2 (x), p3 (x), p4 (x)}). Tuttavia si verifica che p4 (x) = p2 (x) − p1 (x), quindi i polinomi p1 (x), p2 (x) e p4 (x) sono linearmente dipendenti e non costituiscono pertanto una base di V . In conclusione, dai quattro polinomi dati non è possibile estrarre una base di V . Svolgimento esercizio 4. Consideriamo una combinazione lineare a1 f1 + a2 f2 + a3 f3 delle funzioni f1 , f2 e f3 . Supponiamo che tale combinazione lineare sia nulla (cioè sia la funzione nulla). Si ha dunque: a1 sin x + a2 sin 2x + a3 sin 3x = 0, ∀x ∈ R. Dato che l’espressione precedente deve essere nulla per ogni valore di x, attribuendo ad x dei valori particolari otteniamo (ad esempio): a1 − a3 = 0, √ √ 3 3 x = π/3 : a1 + a2 = 0, 2 √ √2 2 2 a1 + a2 + a3 = 0. x = π/4 : 2 2 L’unica soluzione di tali equazioni è: a1 = a2 = a3 = 0. Ciò dimostra che le tre funzioni date sono linearmente indipendenti. x = π/2 : 12 1. Spazi Vettoriali Svolgimento esercizio 5. Eseguiamo, a titolo di esempio, la verifica solo nel caso (1). Dato che i vettori sono tre, e cioè il numero giusto per poter essere una base di R3 , basterà solo controllare se sono linearmente indipendenti (oppure se sono un insieme di generatori). Posto λ1 v1 +λ2 v2 +λ3 v3 = 0, si ottiene il sistema λ1 + 3λ2 − λ3 = 0 λ1 + λ 3 = 0 λ − λ − λ = 0 1 2 3 che, risolto, fornisce λ1 = λ2 = λ3 = 0. Ciò dimostra che questi tre vettori sono linearmente indipendenti e, di conseguenza, sono una base di R3 . Svolgimento esercizio 6. (1) I cinque vettori dati sono sicuramenti linearmente dipendenti, dato che il numero massimo di vettori linearmente indipendenti in R4 (che coincide con la dimensione dello spazio vettoriale) è 4. Infatti si vede immediatamente che v5 = 2v1 + v4 . Si verifica inoltre, con un facile calcolo, che i vettori v1 , v2 , v3 e v4 sono linearmente indipendenti, e quindi costituiscono una base di R4 . (2) I tre vettori dati sicuramente non sono dei generatori di R4 (che ha dimensione 4). Si verifica comunque che essi sono linearmente indipendenti. Se introduciamo un quarto vettore v4 = (0, 0, 1, 0) (ad esempio), si verifica facilmente che v1 , v2 , v3 e v4 sono linearmente indipendenti, e quindi costituiscono una base di R4 . (3) Si verifica che i quattro vettori dati sono linearmente dipendenti, infatti v4 = v1 + v2 + v3 . Pertanto essi non costituiscono una base di R4 . Si scopre poi che anche v1 è combinazione lineare di v2 e v3 , si ha infatti v1 = 23 v2 + 12 v3 . In conclusione i vettori v1 e v4 appartengono al sottospazio generato da v2 e v3 . Infine si verifica facilmente che v2 e v3 sono linearmente indipendenti. In conclusione, i quattro vettori dati generano un sottospazio di dimensione 2 di R4 , una cui base è data, ad esempio, dai vettori v2 e v3 . Per ottenere una base di R4 si possono considerare i vettori v2 , v3 , (0, 0, 1, 0) e (0, 0, 0, 1), che sono, come si verifica facilmente, linearmente indipendenti. Svolgimento esercizio 7. Risolvendo il sistema si ottiene (ad esempio esplicitando x1 , x4 e x5 in funzione di x2 e x3 ): 1 1 x = x − x3 1 2 2 2 x5 = x2 + 3x3 5 1 x4 = x2 + x3 2 2 Tale sistema ha dunque infinite soluzioni, dipendenti da due parametri. In altre parole, lo spazio V delle soluzioni ha dimensione 2. Per trovare una base di V è allora sufficiente trovare due vettori, linearmente indipendenti, che 3. Soluzioni 13 siano soluzioni del sistema precedente. Tali vettori si trovano semplicemente attribuendo dei valori “qualunque” alle variabili libere x2 e x3 (facendo attenzione a che i vettori trovati siano linearmente indipendenti!). In pratica sarà sufficiente attribuire alle variabili libere alternativamente i valori 0 e 1; saremo cosı̀ sicuri di ottenere dei vettori linearmente indipendenti (perché?). Ponendo dunque x2 = 1 e x3 = 0, si ottiene il vettore ( 12 , 1, 0, 52 , 1), mentre per x2 = 0 e x3 = 1 si ha (− 12 , 0, 1, 12 , 3). Questi due vettori sono una base di V . Svolgimento esercizio 8. Il vettore (x, 1, y, 1) appartiene al sottospazio generato da v1 e v2 se e solo se esso si può esprimere come combinazione lineare di v1 e v2 : (x, 1, y, 1) = λ1 v1 + λ2 v2 . La seconda e la quarta equazione del sistema ottenuto sono, rispettivamente: 2λ1 − 2λ2 = 1 e 4λ1 − 4λ2 = 1, che non hanno soluzioni comuni. Di conseguenza (x, 1, y, 1) 6∈ L{v1 , v2 }. Svolgimento esercizio 9. (1) L’affermazione è falsa. Per dimostrarne la falsità basta fornire un controesempio: sia V = R2 , v1 = (1, 0), v2 = (0, 1), v3 = (1, 1). È evidente che tali vettori sono a due a due non proporzionali, ma non possono essere linearmente indipendenti, dato che la dimensione di R2 è 2. (2) L’affermazione in questione è vera. Infatti se fosse falsa, cioè se i vettori v1 , . . . , vr fossero linearmente dipendenti, si avrebbe λ1 v1 + λ2 v2 + · · · + λr vr = 0, con i coefficienti λi non tutti nulli. Supponiamo allora che λj 6= 0. Si ha dunque 1 X vj = − λi v i , λj i6=j e quindi il vettore vj sarebbe combinazione lineare dei rimanenti, contro l’ipotesi. Svolgimento esercizio 10. Per semplicità di notazione poniamo u1 = (1, 1, 0, 0) e u2 = (−1, 1, −4, 2). (1) Si ha: v1 = 21 (u1 + u2 ), v2 = 12 (u1 − u2 ), v3 = 12 (5u1 − u2 ), quindi L{v1 , v2 , v3 } ⊂ L{u1 , u2 }. Viceversa, si ha anche: u1 = v1 +v2 e u2 = v1 −v2 , quindi L{u1 , u2 } ⊂ L{v1 , v2 , v3 }. Quindi si conclude che L{v1 , v2 , v3 } = L{u1 , u2 }. (2) Abbiamo visto al punto (1) che u1 ∈ L{v1 , v2 }. Dato che u1 = 12 (v3 −v2 ), si ha anche u1 ∈ L{v2 , v3 , v4 }, e quindi u1 ∈ L{v1 , v2 } ∩ L{v2 , v3 , v4 }. (3) Dato che v2 ∈ L{v1 , v2 } ∩ L{v2 , v3 , v4 }, si ha dim(L{v1 , v2 } ∩ L{v2 , v3 , v4 }) ≥ 1. 14 1. Spazi Vettoriali Ma abbiamo visto al punto (1) che anche u1 ∈ L{v1 , v2 } ∩ L{v2 , v3 , v4 }, e i vettori u1 e v2 sono linearmente indipendenti, quindi dim(L{v1 , v2 } ∩ L{v2 , v3 , v4 }) ≥ 2. D’altra parte L{v1 , v2 } ∩ L{v2 , v3 , v4 } ⊂ L{v1 , v2 }, quindi dim(L{v1 , v2 } ∩ L{v2 , v3 , v4 }) ≤ 2. Si conclude quindi che dim(L{v1 , v2 } ∩ L{v2 , v3 , v4 }) = 2. (4) L{v1 , v2 }+L{v2 , v3 , v4 } = R4 se e solo se {v1 , v2 , v3 , v4 } è una base di R4 . Si ha però v3 = 2v1 + 3v2 , quindi i vettori v1 , v2 , v3 , v4 non sono linearmente indipendenti. (5) L{v1 , v2 , v3 } + L{v4 , v5 } = R4 se e solo se i vettori v1 , v2 , v3 , v4 e v5 generano R4 . Si verifica facilmente che i vettori v1 , v2 , v4 , v5 sono linearmente indipendenti e quindi sono una base di R4 . A maggior ragione quindi i vettori v1 , v2 , v3 , v4 e v5 generano tutto R4 . Svolgimento esercizio 11. (1) Si verifica facilmente che i tre vettori dati sono linearmente indipendenti, e quindi sono una base di R3 . (2) Dato che il terzo vettore è la somma dei due precedenti, i tre vettori dati non sono una base di R3 . Una base del sottospazio da essi generato è costituita da due qualunque vettori scelti tra i tre dati. (3) I primi tre vettori sono linearmente indipendenti, mentre il quarto è combinazione lineare dei primi tre. Il sottospazio da essi generato ha pertanto dimensione tre, ed una sua base è data, ad esempio, dai primi tre vettori. Svolgimento esercizio 12. Lo spazio vettoriale V ha dimensione n+1 (una sua base è {1, x, x2 , . . . , xn }). Per dimostrare che {1, x−a, (x−a)2 , . . . , (x− a)n } è una base di V è allora sufficiente dimostrare che tali polinomi sono linearmente indipendenti. Sia λ0 · 1 + λ1 (x − a) + λ2 (x − a)2 + · · · + λn (x − a)n = 0. Osserviamo che nell’espressione precedente il termine di grado massimo è λn xn , da cui si deduce che λn = 0. Si ottiene allora λ0 · 1 + λ1 (x − a) + λ2 (x − a)2 + · · · + λn−1 (x − a)n−1 = 0. In questa espressione il termine di grado massimo è λn−1 xn−1 , da cui si deduce che λn−1 = 0. Continuando in questo modo si dimostra che tutti i coefficienti λi sono nulli, e quindi i vettori in questione sono linearmente indipendenti, e sono dunque una base di V . Sia ora f (x) ∈ V e poniamo f (x) = λ0 + λ1 (x − a) + λ2 (x − a)2 + · · · + λn (x − a)n . 3. Soluzioni 15 Valutando l’espressione precedente per x = a, si ottiene f (a) = λ0 . Per determinare poi λ1 è sufficiente derivare tale espressione, ottenendo f 0 (x) = λ1 + 2λ2 (x − a) + 3λ3 (x − a)2 + · · · + nλn (x − a)n−1 , e poi valutarla per x = a, ottenendo λ1 = f 0 (a). Derivando ancora una volta, e valutando sempre per x = a, si ottiene λ2 = f 00 (a)/2. Continuando in questo modo si dimostra che λi = f (i) (a)/i!, per 0 ≤ i ≤ n. In conclusione si è dimostrato che, rispetto alla base {1, x − a, (x − a)2 , . . . , (x − a)n }, ogni polinomio di grado ≤ n si può scrivere nella forma f (x) = n X f (i) (a) i=0 i! (x − a)i . Questa non è altro che la formula di Taylor!. Svolgimento esercizio 13. (1) Innanzitutto si ha Ut + Vt = L{u1 , u2 , v1 , v2 }. Notiamo che u2 − 2u1 = v1 , ciò prova che i vettori u1 , u2 , v1 , v2 sono linearmente dipendenti, quindi non sono una base di R4 . Di conseguenza Ut + Vt non è mai uguale a R4 . (2) Per quanto visto nel punto (1), si ha v1 ∈ Ut ∩ Vt , per ogni t. Di conseguenza è dim(Ut ∩ Vt ) ≥ 1, per ogni t. Tuttavia si ha anche dim(Ut ∩ Vt ) ≤ 2, dato che Ut e Vt hanno al più dimensione 2, inoltre dim(Ut ∩Vt ) = 2 se e solo se Ut = Vt e dim Ut = 2. Cerchiamo dunque per quali valori di t è Ut = Vt . Dato che v1 ∈ Ut ∩ Vt , per ogni t, basta vedere per quali valori di t si può scrivere v2 come combinazione lineare dei vettori u1 e u2 : v2 = λ1 u1 + λ2 u2 . Si ottiene cosı̀ il sistema λ1 + tλ2 = 2 tλ1 + tλ2 = t 2tλ1 + tλ2 = 2t tλ2 = 0 che ha soluzione se e solo se t = 0. Quindi, per t = 0, si ha Ut = Vt , solo che ora è dim Ut = dim Vt = 1, e quindi anche in questo caso la dimensione di Ut ∩ Vt è 1. In conclusione, dim(Ut ∩ Vt ) = 1 per ogni t ∈ R. (3) Per quanto visto nei punti precedenti, v1 è una base di Ut ∩ Vt , per ogni t. Ponendo t = 1 si ottiene dunque v1 = (−1, −1, −3, 1). Per completare questa base ad una base di R4 è sufficiente trovare altri tre vettori w1 , w2 e w3 in modo che v1 , w1 , w2 , w3 siano linearmente indipendenti. Si verifica facilmente che w1 = (1, 0, 0, 0), w2 = (0, 1, 0, 0) e w3 = (0, 0, 1, 0) vanno bene. 16 1. Spazi Vettoriali Svolgimento esercizio 14. Un vettore w ∈ U ∩ V si può scrivere nella forma seguente: w = λ1 v 1 + λ 2 v 2 + λ3 v 3 = λ 4 v 4 + λ5 v 5 . Risolvendo il sistema cosı̀ ottenuto si trova che: λ1 = 2λ4 1 λ2 = − λ4 2 3 λ 3 = λ4 2 λ5 = 0. Pertanto lo spazio vettoriale U ∩ V ha dimensione 1 ed una sua base è data dal vettore w che si ottiene ponendo, ad esempio, λ4 = 2, nella soluzione precedentemente trovata: w = 4v1 − v2 − 3v3 = (2, 0, −2, −2). Una base di U è data dai vettori v1 , v2 e v3 , dato che essi sono linearmente indipendenti (la verifica è immediata). Anche i vettori v4 e v5 sono linearmente indipendenti, quindi sono una base di V . Infine, si vede facilmente che i vettori v1 , v2 , v3 e v5 sono linearmente indipendenti (mentre v4 è combinazione lineare di v1 , v2 e v3 ). Pertanto lo spazio vettoriale U + V coincide con R4 e una sua base è data da {v1 , v2 , v3 , v5 } (oppure si prenda la base canonica di R4 ). 3.3. Sottospazi Vettoriali Svolgimento esercizio 15. Se U ⊂ W (risp. W ⊂ U ) allora U ∪ W = W (risp. U ∪ W = U ) ed è dunque un sottospazio vettoriale. Viceversa, supponiamo che U ∪ W sia un sottospazio vettoriale, ma U 6⊂ W e W 6⊂ U . Ciò significa che esiste un vettore u ∈ U con u 6∈ W ed un vettore w ∈ W con w 6∈ U . Dato che u, w ∈ U ∪ W , e questo è uno spazio vettoriale, si deve avere u + w ∈ U ∪ W , e dunque u + w ∈ U oppure u + w ∈ W . Se u + w ∈ U , si ha u + w = u0 ∈ U e dunque w = u0 − u ∈ U , contro l’ipotesi che w 6∈ U . Analogamente se fosse u + w ∈ W si concluderebbe che u ∈ W , contro l’ipotesi. Da questa conclusione assurda si deduce allora che l’ipotesi è falsa, ossia che U ∪ W non può essere un sottospazio vettoriale se U 6⊂ W e W 6⊂ U . Svolgimento esercizio 16. Tale uguaglianza è falsa. Per provarlo basta fornire un controesempio: in R2 si considerino i sottospazi U = L{(1, 1)}, V = L{(1, 0)} e W = L{(0, 1)}. Si ha allora U ∩ (V + W ) = U ∩ R2 = U , mentre (U ∩ V ) + (U ∩ W ) = {0} + {0} = {0}. 3. Soluzioni 17 Svolgimento esercizio 17. Dire che la somma di due sottospazi vettoriali è diretta equivale a dire che la loro intersezione è nulla (cioè ridotta al vettore nullo). Un vettore appartiene all’intersezione di U di V se e solo se si può scrivere nel modo seguente: w = λ1 (1, 0, 1, 0) + λ2 (1, 2, 3, 4) = µ1 (0, 1, 1, 1) + µ2 (0, 0, 0, 1). Risolvendo il sistema cosı̀ ottenuto si scopre che, ad esempio, il vettore w = (−1, 1, 2, 2) appartiene a U ∩ V . Da ciò si deduce che la somma di U e V non è diretta. Svolgimento esercizio 18. Poniamo u1 = (1, 0, 1, 0), u2 = (0, 1, 1, 1), u3 = (0, 0, 0, 1), v = (0, 1, 1, 0), in modo che U = L{u1 , u2 , u3 } e V = L{u1 , v}. I vettori u1 , u2 e u3 sono linearmente indipendenti, quindi dim U = 3. Anche u1 e v sono linearmente indipendenti, quindi dim V = 2. Inoltre v = u2 −u3 , quindi V ⊂ U . Per ragioni di dimensione un sottospazio W tale che V ⊕ W = U deve avere dimensione 1, sia quindi w una sua base. Il vettore w deve soddisfare le seguenti condizioni: (i) w 6∈ V , e (ii) u1 , v e w devono generare U . Si vede allora facilmente che w = u3 soddisfa le condizioni richieste. Altrettanto facilmente si vede che anche la scelta w = u2 soddisfa le condizioni richieste; si deduce pertanto che il sottospazio W richiesto esiste ma non è unico. Svolgimento esercizio 19. Poniamo u1 = (1, 0, 1, 0), u2 = (0, 0, 0, 1), v1 = (1, 0, 2, 0), v2 = (0, 0, 1, 1). I sottospazi U e V hanno entrambi dimensione 2 (la verifica è immediata), pertanto un sottospazio W con le proprietà richieste, se esiste, deve avere dimensione 2: poniamo allora W = L{w1 , w2 }. Il problema si riduce allora a determinare due vettori w1 e w2 tali che {u1 , u2 , w1 , w2 } e {v1 , v2 , w1 , w2 } siano entrambe delle basi di R4 . Si scopre facilmente che i vettori w1 = (1, 0, 0, 0) e w2 = (0, 1, 0, 0) soddisfano le proprietà richieste, quindi un tale sottospazio W esiste. Tuttavia anche la scelta w1 = (1, 0, 0, 0) e w2 = (0, 1, 1, 0) fornisce un sottospazio W (diverso dal precedente) che soddisfa le condizioni richieste. Si conclude quindi che, come nell’esercizio precedente, tale sottospazio W non è unico. Svolgimento esercizio 20. (1) Ogni polinomio di grado ≤ 5 si scrive in modo unico come segue: p(x) = a0 + a1 x + a2 x2 + a3 x3 + a4 x4 + a5 x5 . Da ciò si deduce che lo spazio vettoriale V ha dimensione 6, ed una sua base è data dai polinomi 1, x, x2 , x3 , x4 , x5 . La condizione p(0) = 0 equivale a a0 = 0. Il sottospazio U1 è quindi costituito dai polinomi della forma p(x) = a1 x + a2 x2 + a3 x3 + a4 x4 + a5 x5 . Si deduce che U1 ha dimensione 5 ed una sua base è {x, x2 , x3 , x4 , x5 }. 18 1. Spazi Vettoriali La condizione p0 (1) = 0 equivale a a1 = −2a2 − 3a3 − 4a4 − 5a5 . Il sottospazio U2 è quindi costituito dai polinomi della forma p(x) = a0 + (−2a2 − 3a3 − 4a4 − 5a5 )x + a2 x2 + a3 x3 + a4 x4 + a5 x5 . Si deduce che U2 ha dimensione 5 ed una sua base è {1, x2 −2x, x3 −3x, x4 − 4x, x5 − 5x}. La condizione che p(x) sia divisibile per x2 + 1 equivale a dire che p(x) si scrive come segue: p(x) = (x2 + 1)(b0 + b1 x + b2 x2 + b3 x3 ). Si deduce che U3 ha dimensione 4 ed una sua base è {(x2 +1), (x2 +1)x, (x2 + 1)x2 , (x2 + 1)x3 }. La condizione p(−x) = p(x) equivale a a1 = a3 = a5 = 0. Il sottospazio U4 è quindi costituito dai polinomi della forma p(x) = a0 + a2 x2 + a4 x4 . Si deduce che U4 ha dimensione 3 ed una sua base è {1, x2 , x4 }. La condizione p(x) = xp0 (x) equivale a a0 = a2 = a3 = a4 = a5 = 0. Il sottospazio U5 è quindi costituito dai polinomi della forma p(x) = a1 x. Si deduce che U5 ha dimensione 1 ed una sua base è {x}. I polinomi in U1 ∩ U2 devono soddisfare contemporaneamente le condizioni a0 = 0 e a1 = −2a2 − 3a3 − 4a4 − 5a5 . Il sottospazio U1 ∩ U2 è quindi costituito dai polinomi della forma p(x) = (−2a2 − 3a3 − 4a4 − 5a5 )x + a2 x2 + a3 x3 + a4 x4 + a5 x5 . Si deduce che U1 ∩ U2 ha dimensione 4 ed una sua base è {x2 − 2x, x3 − 3x, x4 − 4x, x5 − 5x}. U1 ∩ U3 è costituito dai polinomi della forma p(x) = (x2 + 1)(b0 + b1 x + b2 x2 + b3 x3 ), tali che p(0) = 0, che equivale a b0 = 0. Si deduce che U1 ∩U3 ha dimensione 3 ed una sua base è {(x2 + 1)x, (x2 + 1)x2 , (x2 + 1)x3 }. Imponendo ai polinomi in U1 ∩U3 di soddisfare alla condizione che definisce U2 , si scopre che deve essere b1 = 23 b2 −2b3 . Il sottospazio U1 ∩U2 ∩U3 ha quindi dimensione 2 ed una sua base è {(x2 +1)(2x2 −3x), (x2 +1)(x3 −2x)}. Per terminare, si vede ora facilmente che U1 ∩ U2 ∩ U3 ∩ U4 = 0. (2) Ricordando che la base di U4 trovata precedentemente è {1, x2 , x4 }, si deduce che un sottospazio W1 che soddisfa le condizioni richieste è, ad esempio, W1 = L{x, x3 , x5 }. Analogamente, osservando che il sottospazio U1 ∩ U3 ha dimensione 3 e non contiene polinomi di grado ≤ 2, si deduce che il sottospazio W2 generato dai polinomi 1, x e x2 soddisfa le condizioni richieste. Capitolo 2 Applicazioni Lineari e Matrici 1. Richiami di teoria 1.1. Applicazioni lineari Siano V e W due spazi vettoriali sul corpo C. Definizione 1.1. Una funzione f : V → W è detta lineare se f (v1 + v2 ) = f (v1 ) + f (v2 ) e f (λv) = λf (v), per ogni v, v1 , v2 ∈ V e per ogni λ ∈ C. Osservazione 1.2. Nella letteratura matematica si incontra spesso la seguente terminologia. Una funzione lineare f : V → W è anche detta un omomorfismo. Se f è iniettiva è chiamata monomorfismo, se è suriettiva è chiamata epimorfismo, mentre se è biiettiva è detta isomorfismo. Una funzione lineare f : V → V è chiamata endomorfismo. Se essa è biiettiva è detta automorfismo. Le due proprietà che caratterizzano un’applicazione lineare si possono riunire nella seguente uguaglianza: f (λ1 v1 + λ2 v2 ) = λ1 f (v1 ) + λ2 f (v2 ), per ogni v1 , v2 ∈ V e per ogni λ1 , λ2 ∈ C. Fissiamo ora una base {v1 , . . . , vn } di V e una base {w1 , . . . , wm } di W . Se v ∈ V si scrive come v = λ1 v 1 + · · · + λn v n , dalla linearità di f segue che f (v) = λ1 f (v1 ) + · · · + λn f (vn ). Quindi per conoscere f (v), per ogni v ∈ V , è sufficiente conoscere le immagini dei vettori di base, f (vj ), per j = 1, . . . , n. 20 2. Applicazioni Lineari e Matrici D’altra parte f (vj ) ∈ W , quindi si può scrivere f (vj ) = a1j w1 + a2j w2 + · · · + amj wm = m X aij wi . i=1 Si conclude quindi che la funzione f è unicamente determinata dai coefficienti aij ∈ C, per i = 1, . . . , m, j = 1, . . . , n. Definizione 1.3. La matrice A dell’applicazione lineare f : V → W , rispetto alle basi di V e W fissate, è l’insieme dei coefficienti aij , organizzati in uno schema rettangolare come segue: a11 a12 · · · a1n a21 a22 · · · a2n A= . .. .. .. ... . . . am1 am2 · · · amn Osservazione 1.4. Si noti che la matrice di una applicazione lineare f : V → W è definita solo quando sono state fissate delle basi degli spazi vettoriali V e W , e che tale matrice dipende dalla scelta delle basi. Una stessa applicazione lineare f avrà in generale matrici diverse rispetto a basi diverse per gli stessi spazi vettoriali (vedremo in seguito quali relazioni esistono tra matrici diverse che rappresentano la stessa applicazione lineare rispetto a basi diverse). 1.2. Matrici Richiamiamo ora le definizioni e i principali risultati della teoria delle matrici che ci serviranno in seguito. Definizione 1.5. Una matrice A, a coefficienti nel campo C, è uno schema rettangolare di numeri aij ∈ C, organizzati come segue: a11 a12 · · · a1n a21 a22 · · · a2n A= . .. .. .. ... . . . am1 am2 · · · amn Sia MC (m, n) l’insieme delle matrici con m righe e n colonne a coefficienti in C. In questo insieme si definisce un’operazione di somma come segue: se A = (aij ) e B = (bij ) sono due matrici in MC (m, n), la loro somma C = A + B è la matrice C = (cij ) i cui coefficienti sono cij = aij + bij . Si definisce anche il prodotto di una matrice A = (aij ) ∈ MC (m, n) per uno scalare λ ∈ C come segue: λA = (λaij ). 1. Richiami di teoria 21 Si verifica senza difficoltà che l’insieme MC (m, n), con le operazioni di somma e prodotto per uno scalare appena introdotte, è uno spazio vettoriale su C di dimensione mn. Una sua base naturale è costituita dalle matrici Eij i cui elementi sono tutti nulli, tranne l’elemento di posto ij che è uguale a 1. Sia ora A ∈ MC (m, n) e B ∈ MC (n, r) (cioè il numero di colonne di A è uguale al numero di righe di B. Si definisce il prodotto (righe per colonne) delle matrici A e B come segue: C = AB è la matrice C = (cij ) ∈ MC (m, r) i cui elementi sono dati dalla seguente espressione: cij = n X ail blj . l=1 Si noti che il prodotto fra due matrici A e B non è sempre definito, bisogna infatti che il numero di colonne di A sia uguale al numero di righe di B. In particolare può essere definito il prodotto AB ma non il prodotto BA. Proposizione 1.6. Il prodotto di matrici gode delle seguenti proprietà: (1) Siano A, B ∈ MC (m, n) e C ∈ MC (n, r). Allora (A + B)C = AC + BC; (2) Siano A ∈ MC (m, n) e B, C ∈ MC (n, r). Allora A(B + C) = AB + AC; (3) Siano A ∈ MC (m, n), B ∈ MC (n, r) e C ∈ MC (r, s). Allora A(BC) = (AB)C; (4) Siano A, B ∈ MC (n, n). Allora in generale sarà AB 6= BA; (5) Esiste una matrice I ∈ MC (n, n) tale che AI = I A = A per ogni A ∈ MC (n, n). Tale matrice è 1 0 ··· 0 0 1 · · · 0 I= ... ... . . . ... 0 0 ··· 1 ed è l’elemento neutro per il prodotto di matrici. Osservazione 1.7. Il prodotto di matrici appena definito presenta delle peculiarità che lo rendono molto diverso dal solito prodotto tra numeri: non è sempre definito; non è commutativo, cioè AB 6= BA in generale; è possibile che AB = 0 con A 6= 0 e B 6= 0 (esistono divisori dello zero); è possibile che An = 0 con A 6= 0 (esistono elementi nilpotenti). Particolare 22 2. Applicazioni Lineari e Matrici cura va quindi esercitata nella manipolazione di prodotti di matrici. Diamo solo un esempio: (A + B)2 = (A + B)(A + B) = A2 + AB + BA + B 2 6= A2 + 2AB + B 2 . Definizione 1.8. Sia A una matrice quadrata di ordine n. Si chiama inversa di A, e si indica con A−1 , una matrice tale che AA−1 = A−1 A = I. Una matrice A è detta invertibile se esiste la sua matrice inversa. Se la matrice inversa di A esiste, è facile vedere che essa è unica. Tuttavia non tutte le matrici sono invertibili. Vedremo in seguito quali sono le condizioni che assicurano che una matrice sia invertibile. Definizione 1.9. Sia A = (aij ) ∈ MC (m, n) una matrice. La matrice trasposta di A, indicata con AT , è la matrice in cui si sono scambiate tra loro le righe con le colonne di A, cioè AT = (aji ) ∈ MC (n, m). Definizione 1.10. Sia A una matrice quadrata di ordine n. La traccia di A, indicata con tr(A), è la somma degli elementi sulla diagonale principale di A, n X tr(A) = aii . i=1 Le seguenti proprietà della traccia si verificano immediatamente: Proposizione 1.11. Siano A e B matrici quadrate di ordine n. Si ha: (1) tr(A) = tr(AT ); (2) tr(A + B) = tr(A) + tr(B); (3) tr(AB) = tr(BA). Ritorniamo ora a parlare delle applicazioni lineari tra spazi vettoriali. Consideriamo un’applicazione lineare f : V → W e indichiamo con A la sua matrice rispetto alle basi {v1 , . . . , vn } di V e {w1 , . . . , wm } di W . Sia v ∈ V e scriviamo v = x1 v1 + · · · + xn vn . Il vettore v è unicamente determinato dai coefficienti x1 , . . . , xn . Questi coefficienti sono detti le componenti di v rispetto alla base fissata. In questo modo è possibile identificare il vettore v ∈ V con il vettore (x1 , . . . , xn ) ∈ C n (ovviamente questa identificazione dipende dalla scelta della base di V ). Allo stesso modo possiamo scrivere il vettore f (v) ∈ W come combinazione lineare dei vettori della base di W fissata: f (v) = y1 w1 + · · · + ym wm , e identificare quindi il vettore f (v) ∈ W con il vettore (y1 , . . . , ym ) ∈ C m (anche questa identificazione dipende dalla scelta della base di W ). Si dimostra ora facilmente il seguente risultato: 1. Richiami di teoria 23 Teorema 1.12. Con le notazioni precedenti, si ha: y1 x1 y2 x . = A .2 , .. .. ym xn dove il prodotto è il prodotto righe per colonne. 1.3. Nucleo e immagine Definizione 1.13. Sia f : V → W un’applicazione lineare. Il nucleo di f , indicato con Ker f è definito come segue: Ker f = {v ∈ V | f (v) = 0}. Si verifica facilmente che il nucleo di f è un sottospazio vettoriale di V e che f è iniettiva se e solo se Ker f = {0}. Definizione 1.14. Sia f : V → W un’applicazione lineare. L’immagine di f , indicata con Im f è definita come segue: Im f = {w ∈ W | w = f (v), per qualche v ∈ V }. Si verifica facilmente che l’immagine di f è un sottospazio vettoriale di W . Ovviamente la funzione f è suriettiva se e solo se Im f = W . Il nucleo di f e l’immagine di f sono quindi sottospazi di due spazi vettoriali diversi. Tuttavia le loro dimensioni sono legate dalla seguente relazione. Teorema 1.15. Sia f : V → W un’applicazione lineare. Si ha: dim(Ker f ) + dim(Im f ) = dim V. La dimensione del nucleo di f è anche nota con il nome di nullità di f , mentre la dimensione dell’immagine di f è detta rango di f . Se A è la matrice di f rispetto a delle basi fissate di V e di W si parla anche di nullità e rango di A per indicare la nullità e il rango di f . La nullità di una matrice A è quindi la dimensione dello spazio delle soluzioni del sistema lineare omogeneo x1 A ... = 0. xn Si dimostra che il rango di una matrice A coincide con il massimo numero di righe linearmente indipendenti, che coincide anche con il massimo numero di colonne linearmente indipendenti. 24 2. Applicazioni Lineari e Matrici 1.4. Cambiamento di base In questa sezione ricordiamo le relazioni esistenti tra matrici che rappresentano la stessa applicazione lineare f : V → W rispetto alla scelta di basi diverse per V e W . Sia quindi f : V → W un’applicazione lineare, sia {v1 , . . . vn } una base di V , sia {w1 , . . . wm } una base di W e sia A la matrice di f rispetto a queste basi. Fissiamo ora una nuova base {v10 , . . . vn0 } di V , e una nuova 0 base {w10 , . . . wm } di W , e sia A0 la matrice di f rispetto a queste nuove basi. Possiamo dunque scrivere f (vj ) = m X aij wi i=1 e f (vj0 ) = m X a0ij wi0 i=1 sono i coefficienti delle matrici A e A0 rispettivamente. dove gli aij e gli Ricordando ora che ogni vettore di uno spazio vettoriale si può scrivere come combinazione lineare dei vettori di una qualunque base, si ha: a0ij vj = n X plj vl0 l=1 ove i plj sono gli elementi di una matrice quadrata P di ordine n. Con una notazione più compatta, possiamo scrivere: (v1 , . . . , vn ) = (v10 , . . . vn0 )P, ove il prodotto è il solito prodotto righe per colonne. Dato che il ruolo delle due basi di V è perfettamente simmetrico, si deduce che si deve avere (v10 , . . . , vn0 ) = (v1 , . . . vn )P −1 , e quindi la matrice P deve essere invertibile. Un discorso analogo si può fare per lo spazio vettoriale W . Si conclude quindi che deve esistere una matrice invertibile Q, quadrata di ordine m, tale che 0 (w1 , . . . , wm ) = (w10 , . . . wm )Q, e quindi 0 (w10 , . . . , wm ) = (w1 , . . . wm )Q−1 . Le matrici P e Q sono dette, per ovvi motivi, le matrici di cambiamento di base (in V e W rispettivamente). 2. Esercizi 25 Mettendo assieme le varie formule trovate finora, possiamo scrivere: f (vj ) = = n X l=1 n X plj f (vl0 ) plj l=1 m X h=1 = a0hl n X l=1 m X plj m X a0hl wh0 h=1 q̃kh wk = k=1 m X X k=1 ! plj a0hl q̃kh wk , l,h ove q̃kh sono i coefficienti della matrice Q−1 . D’altra parte si ha anche f (vj ) = m X akj wk . k=1 Dal confronto delle due espressioni trovate si deduce che X akj = plj a0hl q̃kh , l,h ovvero, con notazione matriciale, che A = Q−1 A0 P, o, equivalentemente, che A0 = QAP −1 . Questa è la relazione che lega tra loro matrici che rappresentano la stessa applicazione lineare rispetto a basi diverse. Notiamo in particolare che se W = V , cioè se f è una applicazione lineare da V in sé, allora le matrici di cambiamento di base P e Q coincidono. In questo caso la formula precedente diventa: A0 = P AP −1 . Definizione 1.16. Due matrici A e A0 si dicono simili se rappresentano la stessa applicazione lineare rispetto a basi diverse, cioè se esistono due matrici invertibili P e Q tali che A0 = QAP −1 . 2. Esercizi 2.1. Definizioni Esercizio 1. Si dica se sono lineari le seguenti funzioni: (1) f : R2 → R3 , (x, y) 7→ (x − y, x + y + 1, 0); (2) f : R2 → R2 , (x, y) 7→ (2x, x + y); (3) f : R2 → R, (x, y) 7→ sin(x − y). 26 2. Applicazioni Lineari e Matrici Esercizio 2. Si dica per quali valori di t ∈ R è lineare la seguente funzione: f : R3 → R2 , (x, y, z) 7→ (x + ty, tyz). Esercizio 3. Si consideri la funzione tra C-spazi vettoriali f : C2 → C data da f ((x, y)) = x + ȳ, ove ȳ indica il numero complesso coniugato di y. Si dica se f è lineare (cioè C-lineare). Esercizio 4. Sia f : V → W un’applicazione tra due spazi vettoriali. Si dimostri che f è lineare se e solo se il suo grafico è un sottospazio vettoriale di V × W . 2.2. Applicazioni Lineari e Matrici Esercizio 5. Sia f : V → W un’applicazione lineare tra due spazi vettoriali. Siano {v1 , v2 , v3 } una base di V e {w1 , w2 , w3 , w4 } una base di W , e f sia data da f (v1 ) = 2w1 − 3w2 + w4 , f (v2 ) = w2 − 2w3 + 3w4 e f (v3 ) = w1 + w2 + w3 − 3w4 . Si scriva la matrice di f nelle basi date. Esercizio 6. Siano V e W due spazi vettoriali di basi rispettivamente {v1 , v2 , v3 } e {w1 , w2 }, e sia f : V → W un’applicazione lineare di matrice (rispetto alle basi date) 2 −1 1 A= . 3 2 −3 (1) Si prenda per V la nuova base v10 = v2 + v3 , v20 = v1 + v3 , v30 = v1 + v2 . Qual è la nuova matrice A0 di f rispetto alle basi {v10 , v20 , v30 } e {w1 , w2 }? (2) Si prenda per W la nuova base w10 = 21 (w1 + w2 ) e w20 = 12 (w1 − w2 ). Qual è la matrice A00 di f rispetto alle basi {v10 , v20 , v30 } e {w10 , w20 }? Esercizio 7. Si consideri il sottospazio V di C 0 (R) generato dalle funzioni f1 (x) = e2x + cos x, f2 (x) = cos x + sin x e f3 (x) = sin x. Si dimostri che f1 , f2 e f3 sono linearmente indipendenti e si determini la matrice (rispetto alla base {f1 , f2 , f3 }) dell’endomorfismo di V che ad una funzione associa la sua derivata. Esercizio 8. Si determinino le matrici, rispetto alle basi canoniche, di tutte le applicazioni lineari f : R3 → R4 tali che f ((1, 2, −1)) = (0, 1, 0, 1), f ((3, −1, 2)) = (1, 2, 0, −1) e f ((−1, 5, −4)) = (2, 0, 3, 2). Esercizio 9. Si determinino le matrici, rispetto alle basi canoniche, di tutte le applicazioni lineari f : R3 → R2 tali che f ((0, −2, 1)) = (3, −1), f ((1, 1, −2)) = (1, 2) e f ((2, −4, −1)) = (11, 1). Esercizio 10. Sia V l’insieme delle funzioni polinomiali a coefficienti reali di grado ≤ 4 che si annullano in 0 e 1, e sia W l’insieme delle funzioni polinomiali a coefficienti reali di grado ≤ 3 tali che il loro integrale tra 0 e 1 è nullo. 2. Esercizi 27 (1) Si dimostri che V e W sono due spazi vettoriali e se ne determinino delle basi. (2) Sia D : V → W l’applicazione lineare che associa ad una funzione la sua derivata. Si dimostri che D è ben definita e si determini una sua matrice rispetto alle basi precedentemente trovate. Esercizio 11. Sia φλ : R3 → R4 l’omomorfismo di matrice (rispetto alle basi canoniche) 1 λ 0 0 λ 0 Aλ = 1 0 1 0 0 0 (1) È vero o falso che, per ogni λ ∈ R, esiste un omomorfismo ψ : R4 → R3 tale che ψ ◦ φλ sia suriettivo? (2) Per quali valori di λ esistono x, y, z ∈ R tali che, posto 1 x 0 0 B = 0 y 0 0 −1 z 1 0 si abbia BAλ = I? 2.3. Nucleo e Immagine Esercizio 12. Siano V e W due spazi vettoriali, con basi rispettivamente date da {v1 , v2 , v3 , v4 } e {w1 , w2 , w3 }. Si determini la matrice, rispetto alle basi date, dell’applicazione lineare φ : V → W definita da φ(v1 ) = w1 − w2 , φ(v2 ) = 2w2 − 6w3 , φ(v3 ) = −2w1 + 2w2 , φ(v4 ) = w2 − 3w3 . Si determinino inoltre le dimensioni di Ker φ e di Im φ e si scrivano delle basi di tali sottospazi. Si dica inoltre se w1 + w2 + w3 ∈ Im φ. Esercizio 13. Si dica se l’endomorfismo di R3 definito da f ((x, y, z)) = (x + 2y, y + z, 2z − x) è iniettivo o suriettivo. Si determinino delle basi di Ker f e di Im f e si dica se la somma del nucleo e dell’immagine di f è diretta. Esercizio 14. Sia f : R3 → R3 l’endomorfismo definito ponendo f ((1, 0, 0)) = (2, −1, 0) f ((0, 1, 0)) = (1, −1, 1) f ((0, 1, −1)) = (0, 2, 2). Si determini la matrice di f rispetto alla base canonica di R3 . Si determinino inoltre le dimensioni del nucleo e dell’immagine di f e delle basi di tali sottospazi. 28 2. Applicazioni Lineari e Matrici Esercizio 15. Sia f : R3 → R3 l’endomorfismo di matrice 1 2 3 A = 1 1 1 1 1 1 rispetto alla base canonica. Si determini il rango di f e delle basi di Ker f e di Im f . Esercizio 16. Sia V uno spazio vettoriale di dimensione finita. Si dica sotto quali condizioni su V esiste un endomorfismo φ : V → V tale che Ker φ = Im φ. 2.4. Rango di una Matrice Esercizio 17. Si determini il rango 0 1 A= 0 1 della matrice 1 2 1 1 1 0 −1 1 1 1 4 2 Esercizio 18. Si determini, al variare di 0 1 2 1 2 2 A= 1 1 a 0 a 2a a ∈ R, il rango della matrice 1 0 1 1 0 1 a2 0 3. Soluzioni 3.1. Applicazioni Lineari Svolgimento esercizio 1. Ricordando la definizione di funzione lineare, si tratta solo di controllare se f (v + w) = f (v) + f (w) e se f (λv) = λf (v), per ogni scelta di vettori v e w e per ogni scalare λ. Si verifica cosı̀ immediatamente che solo la funzione al punto (2) è lineare. Svolgimento esercizio 2. Procedendo come nell’esercizio precedente si scopre che l’unico valore di t che rende lineare questa funzione è t = 0. Svolgimento esercizio 3. Si verifica immediatamente che f ((x1 , y1 ) + (x2 , y2 )) = f ((x1 , y1 )) + f ((x2 , y2 )), quindi f è additiva. Tuttavia f (λ(x, y)) = λx + λy = λx + λ̄ȳ, mentre λf ((x, y)) = λx + λȳ, 3. Soluzioni 29 e λ 6= λ̄ per λ ∈ C. Quindi f non è lineare. Svolgimento esercizio 4. Ricordiamo che il grafico di f è il sottoinsieme Γf di V × W definito da Γf = {(v, w) | w = f (v)}. Dire che Γf è un sottospazio vettoriale equivale a dire che è chiuso rispetto alle operazioni di somma e di prodotto scalare, cioè, per ogni (v1 , w1 ), (v2 , w2 ) ∈ Γf e per ogni scalare λ, si deve avere (v1 , w1 ) + (v2 , w2 ) ∈ Γf e λ(v1 , w1 ) ∈ Γf . Ma (v1 , w1 ) + (v2 , w2 ) = (v1 + v2 , w1 + w2 ) e questo elemento appartiene a Γf se e solo se w1 + w2 = f (v1 + v2 ) cioè se e solo se f (v1 ) + f (v2 ) = f (v1 + v2 ), dato che, per definizione, si ha w1 = f (v1 ) e w2 = f (v2 ). Analogamente si scopre che λ(v1 , w1 ) ∈ Γf se e solo se λw1 = f (λv1 ), cioè se e solo se λf (v1 ) = f (λv1 ). Svolgimento esercizio 5. Indichiamo con A la matrice di f . Ricordiamo che se v = λ1 v1 + λ2 v2 + λ3 v3 (cioè se v ha coordinate (λ1 , λ2 , λ3 ) rispetto alla base di V ) e se f (v) = µ1 w1 + · · · + µ4 w4 (cioè se f (v) ha coordinate (µ1 , . . . , µ4 ) rispetto alla base di W ), si deve avere µ1 λ1 ... = A λ2 . λ3 µ4 Dalle ipotesi sappiamo che l’immagine f (v1 ) del vettore v1 , che ha evidentemente coordinate (1, 0, 0), ha coordinate (2, −3, 0, 1). Si deve quindi avere 2 1 −3 = A 0 , 0 0 1 da cui si deduce che le coordinate dell’immagine del primo vettore di base costituiscono la prima colonna della matrice A. Lo stesso discorso si può ripetere per i rimanenti vettori di base, concludendo che le colonne della matrice A sono costituite dalla coordinate delle immagini dei vettori della base di V . Si ha dunque 2 0 1 −3 1 1 A= 0 −2 1 . 1 3 −3 Svolgimento esercizio 6. Dalle ipotesi sappiamo che f (v1 ) = 2w1 + 3w2 , f (v2 ) = −w1 + 2w2 , f (v3 ) = w1 − 3w2 . (1) Sappiamo che le colonne della matrice A0 sono costituite dalle coordinate, rispetto alla base {w1 , w2 }, delle immagini dei vettori della base {v10 , v20 , v30 }. 30 2. Applicazioni Lineari e Matrici Basta allora calcolare f (v10 ), f (v20 ) e f (v30 ). Per la linearità di f si ha: f (v10 ) = f (v2 ) + f (v3 ) = −w2 , f (v20 ) = f (v1 ) + f (v3 ) = 3w1 , f (v30 ) = f (v1 ) + f (v2 ) = w1 + 5w2 , da cui si deduce che 0 3 1 . A = −1 0 5 (2) In modo del tutto analogo, le colonne della matrice A00 sono costituite dalle coordinate, rispetto alla base {w10 , w20 }, delle immagini dei vettori della base {v10 , v20 , v30 }. Si tratta dunque di esprimere i vettori f (v10 ), f (v20 ) e f (v30 ) in funzione dei vettori w10 e w20 . Bisognerà pertanto esprimere i vettori w1 e w2 come combinazione lineare dei vettori della nuova base. Risolvendo il sistema 1 (w1 + w2 ) = w10 2 1 (w1 − w2 ) = w0 2 2 si ottiene ( w1 = w10 + w20 0 w2 = w10 − w20 da cui si ricava f (v10 ) = −w2 = −w10 + w20 , f (v20 ) = 3w1 = 3w10 + 3w20 , f (v30 ) = w1 + 5w2 = 6w10 − 4w20 . La matrice A00 è quindi data da −1 3 6 00 A = . 1 3 −4 Svolgimento esercizio 7. Supponiamo che sia λ1 f1 + λ2 f2 + λ3 f3 = 0. Ciò equivale a dire che la funzione λ1 e2x + (λ1 + λ2 ) cos x + (λ2 + λ3 ) sin x è identicamente nulla. Considerando allora il limite per x → +∞, e ricordando che sin x e cos x sono due funzioni limitate, si deduce che deve essere λ1 = 0. Si rimane allora con la funzione λ2 cos x + (λ2 + λ3 ) sin x, che deve essere identicamente nulla. Se poniamo, ad esempio, x = 0 si ottiene allora λ2 = 0, da cui segue che anche λ3 = 0, dovendo essere la funzione λ3 sin x identicamente nulla. In conclusione, le tre funzioni in questione sono linearmente indipendenti e quindi sono una base del sottospazio V. 3. Soluzioni 31 Sia ora D : V → V l’endomorfismo dato da D(f ) = f 0 . Si ha: D(f1 ) = 2e2x − sin x = 2f1 − 2f2 + f3 , D(f2 ) = − sin x + cos x = f2 − 2f3 , D(f3 ) = cos x = f2 − f3 . Da ciò si deduce che la matrice di D 2 A = −2 1 rispetto alla base {f1 , f2 , f3 } è 0 0 1 1 . −2 −1 Svolgimento esercizio 8. Iniziamo ponendo v1 = (1, 2, −1), v2 = (3, −1, 2), v3 = (−1, 5, −4), w1 = (0, 1, 0, 1), w2 = (1, 2, 0, −1), w3 = (2, 0, 3, 2). Dato che una applicazione lineare è determinata, in modo unico, dalle immagini dei vettori di una base, si deduce che, se i tre vettori v1 , v2 e v3 sono una base di R3 allora tale applicazione esiste ed è unica. Controlliamo allora se questi tre vettori sono linearmente indipendenti: λ 1 v 1 + λ2 v 2 + λ 3 v 3 = 0 equivale a λ1 + 3λ2 − λ3 = 0 2λ1 − λ2 + 5λ3 = 0 − λ + 2λ − 4λ = 0 1 2 3 che, risolto, fornisce λ1 = −3λ2 + λ3 λ2 = λ3 0 = 0. Si scopre cosı̀ che esistono soluzioni non nulle e, di conseguenza, i tre vettori sono linearmente dipendenti. Ponendo, ad esempio, λ3 = 1, si ottiene λ2 = 1 e λ1 = −2, e quindi una relazione di dipendenza lineare fra i tre vettori è la seguente −2v1 + v2 + v3 = 0. Se una tale f esiste, per linearità si deve avere 0 = f (−2v1 + v2 + v3 ) = −2f (v1 ) + f (v2 ) + f (v3 ) = −2w1 + w2 + w3 , ma tale relazione non è soddisfatta dai vettori w1 , w2 e w3 . Si conclude cosı̀ che non esiste nessuna applicazione lineare con le proprietà richieste. 32 2. Applicazioni Lineari e Matrici Svolgimento esercizio 9. Iniziamo ponendo v1 = (0, −2, 1), v2 = (1, 1, −2), v3 = (2, −4, −1), w1 = (3, −1), w2 = (1, 2), w3 = (11, 1). Dato che una applicazione lineare è determinata, in modo unico, dalle immagini dei vettori di una base, si deduce che, se i tre vettori v1 , v2 e v3 sono una base di R3 allora tale applicazione esiste ed è unica. Controlliamo allora se questi tre vettori sono linearmente indipendenti: λ1 v 1 + λ2 v 2 + λ 3 v 3 = 0 equivale a λ2 + 2λ3 = 0 − 2λ1 + λ2 − 4λ3 = 0 λ − 2λ − λ = 0 1 2 3 che, risolto, fornisce λ2 = −2λ3 λ1 = −3λ3 0 = 0. Si scopre cosı̀ che esistono soluzioni non nulle e, di conseguenza, i tre vettori sono linearmente dipendenti. Ponendo, ad esempio, λ3 = 1, si ottiene λ1 = −3 e λ2 = −2, e quindi una relazione di dipendenza lineare fra i tre vettori è la seguente −3v1 − 2v2 + v3 = 0. Se una tale f esiste, per linearità si deve avere 0 = f (−3v1 − 2v2 + v3 ) = −3f (v1 ) − 2f (v2 ) + f (v3 ) = −3w1 − 2w2 + w3 , e tale relazione è effettivamente soddisfatta. Consideriamo allora v1 e v2 e completiamoli ad una base di R3 aggiungendo, ad esempio, il vettore e3 = (0, 0, 1) (si controlli che v1 , v2 ed e3 sono linearmente indipendenti). Dato che f è determinata dalle immagini dei vettori di una base, basta dire chi sono le immagini di v1 , v2 ed e3 . Ma mentre le immagini di v1 e v2 sono fissate, l’immagine di e3 non è soggetta ad alcuna condizione ed è dunque arbitraria, poniamo allora f (e3 ) = (a, b). Da quanto detto si deduce allora che esistono infinite applicazioni lineari che soddisfano alle condizioni richieste, ed inoltre che tali applicazioni lineari dipendono da due parametri reali (che noi abbiamo indicato con a e b). Per determinare le matrici di tali applicazioni rispetto alle basi canoniche dobbiamo conoscere le immagini dei vettori di base e1 , e2 ed e3 . Dobbiamo quindi determinare i vettori della base canonica in funzione dei vettori della base {v1 , v2 , e3 }. Dalle equazioni v1 = −2e2 + e3 v2 = e1 + e2 − 2e3 3. Soluzioni si ricava 33 3 1 e1 = v1 + v2 + e3 2 2 e2 = − 1 v1 + 1 e3 2 2 e si ha quindi 5 3 3 3 1 3 f (e1 ) = f (v1 ) + f (v2 ) + f (e3 ) = + a, + b , 2 2 2 2 2 2 1 3 1 1 1 1 f (e2 ) = − f (v1 ) + f (e3 ) = − + a, + b . 2 2 2 2 2 2 Le matrici richieste sono dunque tutte le matrici 5 3 + 2 a − 32 + 12 a a 2 A= 3 3 + 2 b 12 + 12 b b 2 al variare di a, b ∈ R. Osservazione: un altro modo per risolvere questo esercizio consiste nel considerare una matrice incognita a11 a12 a13 A= a21 a22 a23 e nell’imporre le condizioni Av1 = w1 e Av2 = w2 (si noti che la condizione Av3 = w3 è allora automaticamente soddisfatta). Si ottengono cosı̀ 4 equazioni nelle 6 incognite aij che, una volta risolte, forniranno tutte le matrici richieste. Svolgimento esercizio 10. (1) Gli elementi di V sono i polinomi della forma f (x) = a0 + a1 x + a2 x2 + a3 x3 + a4 x4 tali che f (0) = f (1) = 0, il che equivale a richiedere che a0 = 0 e a0 + a1 + a2 + a3 + a4 = 0. Si ottiene quindi V = {−(a2 + a3 + a4 )x + a2 x2 + a3 x3 + a4 x4 | a2 , a3 , a4 ∈ R}, che si verifica subito essere uno spazio vettoriale (cioè chiuso rispetto alle operazioni di somma e di prodotto per uno scalare). Inoltre, attribuendo ad a2 , a3 , a4 i valori successivamente 1, 0, 0, poi 0, 1, 0, etc., si ottengono i polinomi f1 (x) = x2 − x, f2 (x) = x3 − x, f 3 (x) = x4 − x, che sono dunque una base di V . Gli elementi di W sono invece i polinomi della forma g(x) = b0 + b1 x + b2 x2 + b3 x3 tali che Z 1 (b0 + b1 x + b2 x2 + b3 x3 ) dx = 0, 0 che equivale a richiedere che 1 1 1 b0 + b1 + b2 + b3 = 0. 2 3 4 34 2. Applicazioni Lineari e Matrici Si ha dunque 1 1 1 2 3 W = − b1 + b2 + b3 + b1 x + b2 x + b3 x | b1 , b2 , b3 ∈ R , 2 3 4 che si verifica facilmente essere uno spazio vettoriale. Ancora, attribuendo a b1 , b2 , b3 i valori successivamente 1, 0, 0, poi 0, 1, 0, etc., si ottengono i polinomi g1 (x) = x − 21 , g2 (x) = x2 − 13 , g 3 (x) = x3 − 14 , che sono dunque una base di W . (2) Se f (x) ∈ V , si ha Z 1 D(f (x)) dx = [f (x)]10 = f (1) − f (0) = 0, 0 quindi D(f (x)) ∈ W , e dunque D è ben definita. Per determinare la matrice di D basta calcolare le immagini dei vettori della base di V : D(f1 (x)) = 2x − 1 = 2g1 (x), D(f2 (x)) = 3x2 − 1 = 3g2 (x), D(f3 (x)) = 4x3 − 1 = 4g3 (x), da cui si deduce che la matrice cercata è 2 0 0 A = 0 3 0 . 0 0 4 Svolgimento esercizio 11. (1) Se ψ ◦ φλ : R3 → R3 è suriettivo, allora è anche iniettivo (e viceversa), ma questo implica che anche φλ è iniettivo, e ciò deve valere per ogni λ. Osserviamo però che l’immagine di φλ è generata dai vettori (1, 0, 1, 0), (λ, λ, 0, 0) e (0, 0, 1, 0), e quindi ha dimensione 2 se λ = 0. Di conseguenza, almeno nel caso λ = 0, φλ non è iniettivo, quindi se ne deduce che non esiste un omomorfismo ψ con le caratteristiche richieste. (2) Calcolando il prodotto, si ottiene: 1 λ(1 + x) 0 λy 0 BAλ = 0 0 λ(z − 1) 1 che è la matrice identità se e solo se λ(1 + x) = 0 λy = 1 λ(z − 1) = 0 che ammette soluzioni se e solo se λ 6= 0. (Si noti che B è la matrice di un omomorfismo ψ : R4 → R3 e che BAλ è la matrice dell’applicazione composta ψ ◦ φλ . Da quanto appena visto si deduce allora che, se λ 6= 0, esiste ψ tale che ψ ◦ φλ sia l’identità). 3. Soluzioni 35 3.2. Nucleo e Immagine Svolgimento esercizio 12. Ricordando che le colonne della matrice di φ sono costituite dalle coordinate, rispetto alla base {w1 , w2 , w3 }, delle immagini dei vettori della base {v1 , v2 , v3 , v4 }, si deduce che la matrice in questione è 1 0 −2 0 2 1 . A = −1 2 0 −6 0 −3 Im φ è il sottospazio di W generato dai vettori φ(v1 ), φ(v2 ), φ(v3 ) e φ(v4 ). Tra questi si troverà dunque una base. In effetti, basta osservare che φ(v3 ) = −2φ(v1 ) e φ(v2 ) = 2φ(v4 ), mentre φ(v1 ) e φ(v4 ) sono linearmente indipendenti, per concludere che una base di Im φ è costituita, ad esempio, dai vettori φ(v1 ) e φ(v4 ). Si ha dunque dim(Im φ) = 2 e, di conseguenza, dim(Ker φ) = dim(V ) − dim(Im φ) = 2. Per determinare una base di Ker φ basta allora trovare due vettori linearmente indipendenti che appartengano al nucleo di φ. Dalle relazioni tra i vettori φ(vi ) trovate precedentemente, e dalla linearità di φ, si deduce che φ(2v1 + v3 ) = 0 e φ(v2 − 2v4 ) = 0, quindi i due vettori 2v1 + v3 e v2 − 2v4 appartengono a Ker φ, ed essendo linearmente indipendenti, ne costituiscono una base. Infine il vettore w1 + w2 + w3 appartiene all’immagine di φ se e solo se è combinazione lineare dei vettori che costituiscono una base di Im φ. Si tratta allora di vedere se esistono due scalari λ1 e λ2 tali che w1 + w2 + w3 = λ1 φ(v1 ) + λ2 φ(v4 ) = λ1 (w1 − w2 ) + λ2 (w2 − 3w3 ). Si ottiene cosı̀ il sistema λ1 = 1 − λ 1 + λ2 = 1 − 3λ = 1, 2 che non ammette soluzioni. Si può dunque concludere che w1 + w2 + w3 6∈ Im φ. Svolgimento esercizio 13. Si noti che f è un endomorfismo di R3 , cioè un’applicazione lineare di R3 in sé. Da ciò segue che f è iniettivo se e solo se è suriettivo e cioè, per esempio, se e solo se Ker f = {0}. Determiniamo dunque il nucleo di f : f ((x, y, z)) = 0 se e solo se x + 2y = 0 y+z =0 2z − x = 0 da cui si ottiene x = −2y z = −y. 36 2. Applicazioni Lineari e Matrici Si scopre cosı̀ che il nucleo di f contiene dei vettori non nulli, che ha dimensione 1 (nel sistema precedente c’è una sola variabile libera) e che il vettore (−2, 1, −1) (corrispondente alla scelta y = 1) ne è una base (f non è dunque né iniettivo né suriettivo). La dimensione dell’immagine di f è allora data da dim(Im f ) = dim(R3 ) − dim(Ker f ) = 2, e dato che Im f è generato dall’immagine dei vettori di un base di R3 , per esempio la base canonica, per trovare una base di Im f basterà trovare, fra questi, due vettori linearmente indipendenti. Calcolando f ((1, 0, 0)) = (1, 0, −1) e f ((0, 1, 0)) = (2, 1, 0) ci accorgiamo che questi sono linearmente indipendenti; possiamo dunque concludere che i vettori (1, 0, −1) e (2, 1, 0) sono una base di Im f . Finalmente, ricordiamo che richiedere che la somma di due sottospazi sia diretta equivale a richiedere che la loro intersezione sia nulla (nel senso di {0}, non di ∅!). Basta allora controllare se il vettore (−2, 1, −1), che genera Ker f , si può scrivere come combinazione lineare dei vettori che costituiscono una base di Im f : (−2, 1, −1) = λ1 (1, 0, −1) + λ2 (2, 1, 0). Si ottiene cosı̀ un sistema lineare che non ha soluzioni. Di conseguenza la somma di Ker f e Im f è diretta e, dal computo delle dimensioni, si deduce che Ker f ⊕ Im f = R3 . Svolgimento esercizio 14. Le immagini dei vettori (1, 0, 0) e (0, 1, 0) costituiscono rispettivamente la prima e seconda colonna della matrice cercata. La terza colonna è data dall’immagine del vettore (0, 0, 1). Dato che (0, 0, 1) = (0, 1, 0) − (0, 1, −1), dalla linearità di f segue che f ((0, 0, 1)) = (1, −1, 1) − (0, 2, 2) = (1, −3, −1). La matrice cercata è quindi 2 1 1 A = −1 −1 −3 . 0 1 −1 Si vede ora facilmente che Ker f = 0, e pertanto Im f = R3 . Come base di Im f si può allora prendere la base canonica di R3 . Svolgimento esercizio 15. Osservando la matrice A si vede immediatamente che rango(f ) = dim Im(f ) = rango(A) = 2. Di conseguenza, si ha dim Ker(f ) = 1. Una base del nucleo di f è allora data dal vettore (−1, 2, −1), mentre come base dell’immagine di f si possono prendere, ad esempio, i vettori che costituiscono le prime due colonne della matrice A. Svolgimento esercizio 16. Ricordiamo che le dimensioni del nucleo e dell’immagine di una applicazione lineare sono legate dalla formula dim V = dim(Ker φ) + dim(Im φ). 3. Soluzioni 37 Pertanto, se esiste φ : V → V tale che Ker φ = Im φ si deve avere necessariamente dim V = 2 dim(Ker φ), cioè la dimensione di V deve essere pari. Viceversa, ci chiediamo se il fatto che V abbia dimensione pari sia anche sufficiente a garantire l’esistenza di un endomorfismo φ con le caratteristiche richieste. Sia dunque V uno spazio vettoriale di dimensione 2n e fissiamo una sua base {v1 , v2 , . . . , v2n }. Cerchiamo ora di costruire un’applicazione lineare φ tale che Ker φ = Im φ. Ricordiamo che un’applicazione lineare è determinata dalle immagini degli elementi di una base quindi, per costruire φ, basta dire chi sono φ(v1 ), φ(v2 ), . . . , φ(v2n ). Poniamo allora φ(v1 ) = φ(v2 ) = · · · = φ(vn ) = 0, in modo da ottenere che il nucleo sia il sottospazio di V generato dai primi n vettori della base. Ora che conosciamo il nucleo basterà fare in modo che anche l’immagine di φ sia generata dai vettori v1 , v2 , . . . , vn . Dato che l’immagine è generata dall’immagine dei vettori della base di V , e dato che l’immagine dei primi n vettori è zero, basterà allora porre φ(vn+1 ) = v1 , φ(vn+2 ) = v2 , . . . , φ(v2n ) = vn . Questo prova che un tale φ esiste e quindi che la condizione che V abbia dimensione pari è anche sufficiente. 3.3. Rango di una Matrice Svolgimento esercizio 17. Ricordando che il rango di una matrice è il numero di righe (o colonne) linearmente indipendenti, è chiaro che sommando ad una riga (o colonna) una combinazione lineare delle righe (colonne) rimanenti, oppure scambiando fra loro due righe (o colonne), il rango non cambia. Effettuando quindi questo tipo di operazioni (dette operazioni elementari) sulle righe (o sulle colonne), possiamo ridurre la matrice A ad una forma più semplice, in cui la determinazione del rango risulti immediata. In dettaglio, le operazioni da fare sono, ad esempio, le seguenti: scambiamo la prima con la seconda riga di A, ottenendo 1 1 1 0 0 1 2 1 0 −1 1 1 1 1 4 2 Ora sottraiamo alla quarta riga la prima, 1 1 1 0 1 2 0 −1 1 0 0 3 ottenendo 0 1 1 2 38 2. Applicazioni Lineari e Matrici Ora aggiungiamo alla terza riga la 1 0 0 0 Infine sottraiamo alla quarta riga 1 0 0 0 seconda, ottenendo 1 1 0 1 2 1 0 3 2 0 3 2 la terza, ottenendo 1 1 0 1 2 1 0 3 2 0 0 0 Si noti come l’obiettivo da raggiungere sia quello di fare in modo che tutti gli elementi situati al di sotto della diagonale principale siano 0. A questo punto è immediato contare quante sono le righe linearmente indipendenti: nel nostro caso 3. Questo è dunque il rango di A. Osservazione: In modo del tutto analogo si possono effettuare delle operazioni elementari sulle colonne in modo da ottenere alla fine una matrice in cui tutti gli elementi situati a destra della diagonale principale siano nulli. Tuttavia è bene non mescolare operazioni elementari sulle righe con operazioni elementari sulle colonne. Presentiamo qui un altro metodo per calcolare il rango di una matrice (anche se gli argomenti necessari, e cioè i determinanti, saranno trattati solo in seguito). Ricordiamo che il rango di una matrice è il massimo ordine dei minori non nulli estratti dalla matrice. Dato che A è una matrice quadrata di ordine 4, esiste un solo minore di ordine 4, il determinante di A. Per calcolare det A utilizziamo la regola di Laplace, sviluppando il determinante secondo la prima colonna: 0 1 2 1 1 2 1 1 2 1 1 1 1 0 det 0 −1 1 1 = − det −1 1 1 − det 1 1 0 1 4 2 −1 1 1 1 1 4 2 1 1 −1 1 −1 1 = − det − 2 det + det 4 2 1 2 1 4 1 1 1 2 − det + det −1 1 1 1 = 1 − 1 = 0. Abbiamo cosı̀ visto che det A = 0 quindi il rango di A non è 4. Dobbiamo ora considerare i minori di ordine 3 estratti dalla matrice A. Dato che ci sono quattro modi diversi di scegliere tre righe tra le quattro della matrice A, e lo stesso vale per le colonne, ci sono 16 minori di ordine 3. Fortunatamente, 3. Soluzioni 39 se calcoliamo il minore corrispondente alle prime tre righe e tre colonne di A, troviamo: 0 1 2 1 2 det 1 1 1 = − det = −3 6= 0, −1 1 0 −1 1 quindi possiamo concludere che il rango di A è 3. Notiamo che, se calcolando questo primo minore di ordine tre avessimo trovato 0, avremmo dovuto considerare un altro minore di ordine tre, fino a trovarne uno diverso da zero. Se però la matrice A avesse avuto rango 2, allora calcolando tutti i 16 possibili minori di ordine tre, avremmo sempre trovato 0. A questo punto avremmo dovuto iniziare a calcolare i minori di ordine due, fino a trovarne uno diverso da zero. Dato che il calcolo di un determinante è, in generale, un calcolo piuttosto lungo, si capisce da questo esempio come, in generale, il calcolo dei minori estratti da una matrice non sia un metodo molto efficace per la determinazione del rango. Svolgimento esercizio 18. Con operazioni elementari sulle righe (vedi esercizio precedente) si ottiene, alla fine, la matrice 1 2 2 1 1 0 1 2 1 0 0 0 a 0 0 0 0 0 a2 − a 0 Si vede allora che, se a = 0 si ha rango(A) = 2, se a = 1 si ha rango(A) = 3, mentre per tutti gli altri valori di a si ha rango(A) = 4. Capitolo 3 Determinanti 1. Richiami di teoria 1.1. Determinanti Sia A = (aij ) una matrice quadrata di ordine n a coefficienti in un corpo C. Definizione 1.1. Il determinante di A, indicato con det A, è definito come segue: X det A = (sgn σ)a1σ(1) a2σ(2) · · · anσ(n) , σ ove la somma è estesa a tutte le n! permutazioni dei numeri {1, 2, . . . , n} e sgn σ è il segno della permutazione σ (che è uguale a +1 oppure −1 a seconda che il numero di scambi che bisogna effettuare per riordinare l’insieme di numeri che si ottiene applicando la permutazione σ sia pari o dispari). Come si può facilmente intuire, questa definizione di determinante, seppur molto utile dal punto di vista teorico, non è altrettanto utile in pratica per il calcolo del determinante di una matrice quadrata di ordine n (tranne il caso n = 2 e forse n = 3). Per matrici di ordine 2, si deduce immediatamente dalla definizione che: a b det = ad − bc. c d Osservazione 1.2. Il determinante di una matrice si indica spesso semplicemente sostituendo le parentesi rotonde che delimitano la matrice con delle barre verticali. Si scrive quindi, ad esempio, a b c d per indicare il determinante a b det . c d Elenchiamo ora una serie di proprietà dei determinanti. Proposizione 1.3. Sia A una matrice quadrata di ordine n. 42 3. Determinanti (1) det A = 0 se e solo se le righe di A sono linearmente dipendenti. (2) Il determinante di A non cambia se a una riga si somma una combinazione lineare delle altre righe. (3) Se tutti gli elementi di una riga vengono moltiplicati per uno scalare λ il determinante risulta moltiplicato per λ. (4) Scambiando tra loro due righe di A il determinante cambia di segno. Tutte le affermazioni precedenti rimangono vere sostituendo la parola righe con colonne. Come vedremo negli esercizi queste proprietà dei determinanti possono essere usate per semplificare una matrice prima di procedere al calcolo del suo determinante. Osserviamo che l’applicazione determinante non è lineare. Infatti si ha, in generale, det(A + B) 6= det A + det B, e det(λA) = λn det A. Vale invece il seguente risultato: Teorema 1.4 (Teorema di Binet). Il determinante del prodotto di due matrici quadrate è il prodotto dei determinanti delle singole matrici, cioè det(AB) = det A det B. Un’ultima proprietà dei determinanti è data dalla seguente propositione: Proposizione 1.5. det(A) = det(AT ). Introduciamo ora una formula utile al calcolo effettivo dei determinanti. Teorema 1.6 (Teorema di Laplace). Sia A = (aij ) una matrice quadrata di ordine n. Per ogni k, con 1 ≤ k ≤ n, si ha det A = a1k A1k + a2k A2k + · · · + ank Ank , e anche det A = ak1 Ak1 + ak2 Ak2 + · · · + akn Akn , i+j ove Aij = (−1) Mij , e Mij è il determinante della matrice che si ottiene cancellando la i-esima riga e la j-esima colonna della matrice A (il termine Aij è anche detto il complemento algebrico dell’elemento aij ). 1.2. Matrici inverse Sia A = (aij ) una matrice quadrata di ordine n. Se A è invertibile, cioè se esiste una matrice quadrata A−1 tale che AA−1 = A−1 A = I, dal teorema di Binet segue che det(A) det(A−1 ) = det(AA−1 ) = det(I) = 1 e quindi det(A−1 ) = 1 . det A 1. Richiami di teoria 43 In particolare, se A è invertibile si deve necessariamente avere det A = 6 0. In realtà si può dimostrare che questa condizione è anche sufficiente. Vale quindi il seguente risultato: Proposizione 1.7. Una matrice quadrata A è invertibile se e solo se det A 6= 0. È anche possibile scrivere una formula esplicita per l’inversa di una matrice. Dal teorema di Laplace si deduce infatti il risultato seguente: Proposizione 1.8. Sia A = (aij ) una matrice quadrata di ordine n tale che det A 6= 0. Allora si ha: T A11 A12 · · · A1n A A22 · · · A2n 1 .21 , A−1 = .. .. .. .. det A . . . An1 An2 · · · Ann ove gli Aij sono i complementi algebrici degli elementi aij della matrice A. Si noti tuttavia che, dal punto di vista pratico, calcolare l’inversa di una matrice usando questa formula non è un metodo molto efficace, in quanto è richiesto il calcolo di un gran numero di determinanti. Negli esercizi verrà illustrato un metodo molto più efficace per determinare l’inversa di una matrice. 1.3. Determinante di una applicazione lineare Sia f : V → V un’applicazione lineare. Abbiamo visto in precedenza che, se fissiamo una base {v1 , . . . , vn } di V , a f risulta associata una matrice quadrata A di ordine n. Ovviamente la matrice A dipende dalla base scelta: se {v10 , . . . , vn0 } è un’altra base di V , a f sarà associata un’altra matrice A0 . Le due matrici A e A0 cosı̀ trovate sono simili (in quanto rappresentano la stessa applicazione lineare f ), e quindi sono legate dalla formula seguente A0 = P AP −1 , dove P è la matrice di cambiamento di base. Dal teorema di Binet segue allora che: det A0 = det(P AP −1 ) = det(P ) det(A) det(P −1 ) = det(P ) det(A) det(P )−1 = det A. In altri termini, tutte le matrici che rappresentano la stessa f rispetto a basi diverse hanno lo stesso determinante. Quindi tale determinante dipende solo dall’applicazione lineare f e non dalla base scelta per costruire la matrice. Possiamo quindi dare la seguente definizione: 44 3. Determinanti Definizione 1.9. Sia f : V → V un’applicazione lineare. Il determinante di f , indicato con det(f ), è il determinante di una qualunque matrice che rappresenta f . 2. Esercizi 2.1. Regola di Laplace Esercizio 1. Si calcoli 2 4 det 0 2 3 −1 2 0 . 0 1 2 −1 0 1 3 0 Esercizio 2. Si calcoli 2 2 det 2 2 1 3 4 −1 2 3 4 −1 1 3 5 1 1 . 1 1 1 1 2 −1 2 −1 2.2. Inversione di Matrici Esercizio 3. Si calcoli l’inversa della matrice 2 −3 −1 A = 2 −1 −3 . 1 −3 −1 Esercizio 4. Si calcoli l’inversa della 1 A= 1 1 matrice 2 1 3 0 2 2 2.3. Formule Ricorsive Esercizio 5. Si indichi con An la seguente matrice n × n: 2 1 0 0 ··· 0 3 2 1 0 · · · 0 0 3 2 1 · · · 0 An = .. . . . . . . . . .. . . . . . . 0 · · · 0 3 2 1 0 ··· 0 0 3 2 2. Esercizi 45 Determinare una formula ricorsiva per calcolare det An , per ogni intero n ≥ 1. Esercizio 6. Si indichi con An la seguente matrice n × n: 1 + a1 1 1 1 ··· 1 1 1 + a2 1 1 ··· 1 1 1 1 + a3 1 ··· 1 An = .. .. .. .. ... . . . ··· . 1 ··· 1 1 1 + an−1 1 1 ··· 1 1 1 1 + an ove a1 , . . . , an ∈ R. Si dimostri che, per ogni intero n ≥ 2, si ha det An = a1 a2 · · · an + n X a1 a2 · · · âi · · · an , i=1 dove âi significa che l’elemento ai non compare nel prodotto. 2.4. Altri esercizi Esercizio 7. Sia X la matrice a blocchi X= A B , 0 C dove A è una matrice n × n e C è una matrice m × m. Si dimostri che det X = det A · det C. Esercizio 8. (Determinante di Vandermonde). Si dimostri che, per ogni n ≥ 2, si ha det 1 λ1 λ21 .. . 1 λ2 λ22 .. . ··· ··· ··· 1 λn λ2n .. . ··· λ1n−1 λn−1 · · · λnn−1 2 Y = (λj − λi ). i<j 46 3. Determinanti 3. Soluzioni 3.1. Regola di Laplace Svolgimento esercizio 1. Utilizzando la regola di Laplace, e precisamente sviluppando il determinante secondo la terza riga, si ha: 2 0 3 −1 2 3 −1 2 0 3 4 1 2 0 det 0 3 0 1 = −3 det 4 2 0 − det 4 1 2 2 2 −1 2 0 2 2 0 2 −1 4 2 2 3 2 3 = −3 − det − det − det 2 2 4 2 2 2 = −3(−4 + 8) + 2 = −10. Svolgimento esercizio 2. In questo caso non conviene applicare subito la regola di Laplace, data la mole dei calcoli necessari. Ricordando invece le proprietà dei determinanti possiamo cercare di ridurre la matrice ad una forma più semplice: ciò significa, in pratica, cercare di far comparire parecchi zeri tra gli elementi della matrice. Ciò si può fare, ad esempio, sottraendo alla prima riga la seconda, e ricordando che con tale operazione non si modifica il determinante. Si ha dunque: 0 0 0 0 1 2 3 4 −1 2 2 3 4 −1 1 2 3 4 −1 1 1 1 1 1 = det det 2 3 5 2 3 5 2 1 1 2 1 1 1 1 1 1 1 2 −1 2 −1 1 2 −1 2 −1 e sviluppando ora secondo la prima riga, si ottiene 2 3 4 −1 2 2 3 4 −1 2 3 4 −1 1 2 3 5 1 1 1 det 2 3 5 = det 2 1 1 1 2 1 1 1 1 1 2 −1 2 1 2 −1 2 −1 Ancora una volta risulta conveniente trasformare esempio sottraendo alla prima riga la seconda. Si 2 3 4 −1 0 0 2 3 5 2 3 1 = det det 2 1 1 2 1 1 1 2 −1 2 1 2 quest’ultima matrice, ad ha cosı̀: −1 −2 5 1 1 1 −1 2 3. Soluzioni e, sviluppando il 2 3 2 3 det 2 1 1 2 47 determinante secondo la prima riga, si ottiene 4 −1 2 3 1 2 3 5 5 1 = − det 2 1 1 + 2 det 2 1 1 1 1 1 2 2 1 2 −1 −1 2 Ancora una volta possiamo far comparire degli zeri in queste ultime due matrici sottraendo, ad esempio, la seconda riga alla prima. Si ottiene cosı̀: 2 3 4 −1 0 2 0 0 2 4 2 3 5 1 = − det 2 1 1 + 2 det 2 1 1 det 2 1 1 1 1 2 2 1 2 −1 1 2 −1 2 2 1 2 1 = 2 det + 2 −2 det 1 2 1 −1 2 1 +4 det 1 2 = 6 + 2(6 + 12) = 42. 3.2. Inversione di Matrici Svolgimento esercizio 3. Ricordiamo che, data una matrice A = (aij ), si chiama complemento algebrico dell’elemento aij l’elemento Aij che è uguale al prodotto di (−1)i+j per il determinante della matrice ottenuta dalla matrice A cancellando la i-esima riga e la j-esima colonna. La matrice inversa di A è quindi uguale alla trasposta della matrice dei complementi algebrici degli elementi di A, divisa per il determinante di A. Calcoliamo allora il determinante di A, sviluppando secondo la prima riga: −1 −3 2 −3 2 −1 + 3 det A = 2 1 −1 − 1 −3 −3 −1 = 2(1 − 9) + 3(−2 + 3) − (−6 + 1) = −8. Scriviamo ora la trasposta della matrice dei complementi algebrici: −1 −3 −3 −1 −3 −1 + −3 −1 − −3 −1 + −1 −3 −8 0 8 2 −1 2 −1 2 −3 = −1 −1 4 − + − 1 −1 1 −1 2 −3 −5 3 4 2 −3 2 −3 2 −1 + − + 1 −3 1 −3 2 −1 48 3. Determinanti La matrice inversa di A si ottiene dividendo la matrice appena trovata per il determinante di A. Essa è quindi 1 0 −1 A−1 = 1/8 1/8 −1/2 . 5/8 −3/8 −1/2 Svolgimento esercizio 4. Nell’esercizio precedente abbiamo visto come si possa calcolare l’inversa di una matrice. Il metodo usato tuttavia non è molto efficace, specialmente per matrici “grandi”, perché richiede il calcolo di un gran numero di determinanti. Un altro metodo, molto più semplice del precedente anche se meno meccanico, per calcolare l’inversa di una matrice (quando questa esiste) consiste nell’affiancare alla matrice A la matrice identica, ottenendo 1 2 1 | 1 0 0 1 3 0 | 0 1 0 1 2 2 | 0 0 1 A questo punto, con delle operazioni elementari sulle righe, cerchiamo di far apparire la matrice identica a sinistra: alla fine la matrice che troveremo a destra sarà proprio la matrice inversa di A (perché?). In dettaglio le operazioni da fare sono, ad esempio, le seguenti: sottraiamo alla seconda riga la prima, e alla terza riga la prima, ottenendo 1 2 1 | 1 0 0 0 1 −1 | −1 1 0 0 0 1 | −1 0 1 Ora sommiamo alla seconda terza, ottenendo 1 0 0 Ora sommiamo alla prima 1 0 0 riga la terza, mentre alla prima sottraiamo la 2 0 | 2 0 −1 1 0 | −2 1 1 0 1 | −1 0 1 riga la seconda moltiplicata per −2, ottenendo 0 0 | 6 −2 −3 1 0 | −2 1 1 0 1 | −1 0 1 In conclusione, si ha A−1 6 −2 −3 1 . = −2 1 −1 0 1 3. Soluzioni 49 3.3. Formule Ricorsive Svolgimento esercizio 5. Sviluppando riga si ha: 3 0 0 det An = 2 det An−1 − det ... 0 il determinante secondo la prima 1 2 3 ... ··· 0 ··· = 2 det An−1 − 3 det An−2 . 0 0 1 0 2 1 ... ... 0 3 0 0 ··· 0 · · · 0 · · · 0 . · · · .. 2 1 3 2 (La seconda matrice a destra dell’uguale è una matrice (n − 1) × (n − 1), e si è sviluppato il suo determinante secondo la prima colonna. Si è inoltre supposto, nel calcolo precedente, che n ≥ 3). Rimangono ora da calcolare i determinanti per n = 1 e n = 2: det A1 = det(2) = 2, 2 1 det A2 = det = 1. 3 2 In questo modo si possono calcolare, successivamente tutti gli altri determinanti; ad esempio, si ha: det A3 = 2 det A2 − 3 det A1 = −4, det A4 = 2 det A3 − 3 det A2 = −11. Osservazione: La formula ricorsiva precedente permette il calcolo di tutti i det An , tuttavia per poter calcolare det An per un particolare valore di n è necessario calcolare prima tutti i vari det Ai , per ogni intero i < n. Per trovare una formula che permetta il calcolo diretto di det An si può procedere come segue. Poniamo dn = det An ; si ha dunque d1 = 2, d2 = 1 e dn = 2dn−1 −3dn−2 , per ogni n ≥ 3. Allora si ha anche dn+1 = 2dn −3dn−1 = 2(2dn−1 − 3dn−2 ) − 3dn−1 = dn−1 − 6dn−2 . Si ottiene dunque la seguente equazione: dn+1 1 −6 dn−1 = dn 2 −3 dn−2 dn+1 1 −6 ovvero, ponendo vn = e indicando con B la matrice , dn 2 −3 vn = Bvn−2 . Si ottiene quindi v3 = Bv1 , v5 = Bv3 = B 2 v1 , v7 = Bv5 = B 3 v1 e, in generale, v2n+1 = B n v1 . 50 3. Determinanti 1 Ricordando che v1 = , si scopre allora che il problema del calcolo diretto 2 dei vari dn è ridotto al problema del calcolo delle potenze di una matrice. Ovviamente il calcolo di B n si può effettuare moltiplicando la matrice B per se stessa n volte, ma ciò equivale a calcolare tutti i vari di , per ogni i < n. Tuttavia, come vedremo in seguito, c’è un modo di calcolare direttamente B n senza dover calcolare tutte le varie potenze B i , i = 2, . . . , n − 1. Svolgimento esercizio 6. Poniamo dn (a1 , . . . , an ) = det An . Verifichiamo la formula data per n = 2: 1 + a1 1 d2 (a1 , a2 ) = det = a1 a2 + a1 + a2 . 1 1 + a2 Quindi, per n = 2, la formula è corretta. Procediamo quindi per induzione, supponendo che la formula sia corretta per An−1 e cercando di dimostrare che allora la formula data è corretta anche per An . Per calcolare il determinante dn (a1 , . . . , an ), conviene sottrarre alla prima colonna la seconda (cosı̀ facendo il determinante non cambia), ottenendo a1 1 1 1 ··· 1 −a2 1 + a2 1 1 ··· 1 0 1 1 + a3 1 ··· 1 dn (a1 , . . . , an ) = det .. .. .. .. .. . . . · · · . . 0 ··· 1 1 1+a 1 n−1 0 ··· 1 1 1 1 + an Ora si può sviluppare secondo la prima colonna, ottenendo 1 + a2 1 1 1 ··· 1 1 + a3 1 1 ··· 1 1 1 + a4 1 ··· dn (a1 , . . . , an ) = a1 det . . . . .. .. .. .. ··· 1 ··· 1 1 1 + an−1 1 ··· 1 1 1 1 1 1 1 ··· 1 1 + a3 1 1 ··· 1 1 1 + a4 1 ··· + a2 det .. .. .. ... . . . ··· 1 · · · 1 1 1+a n−1 1 1 1 .. . 1 1 + an 1 1 1 .. . 1 1 ··· 1 1 1 1 + an = a1 dn−1 (a2 , a3 , . . . , an ) + a2 dn−1 (0, a3 , . . . , an ). Usando l’ipotesi induttiva, si ha dn−1 (a2 , a3 , . . . , an ) = a2 a3 · · · an + n X i=2 a2 a3 · · · âi · · · an , 3. Soluzioni 51 e quindi dn−1 (0, a3 , . . . , an ) = 0 + n X 0 · a3 · · · âi · · · an = a3 · · · an . i=2 Sostituendo nell’espressione precedentemente trovata, si ha: dn (a1 , . . . , an ) = a1 (a2 a3 · · · an + n X a2 a3 · · · âi · · · an ) + a2 (a3 · · · an ) i=2 = a1 a2 · · · an + = a1 a2 · · · an + n X i=2 n X a1 a2 · · · âi · · · an + a2 a3 · · · an a1 a2 · · · âi · · · an , i=1 che è proprio ciò che si voleva dimostrare. 3.4. Altri esercizi Svolgimento esercizio 7. Utilizziamo la definizione del determinante: X (sgn σ)x1,σ(1) x2,σ(2) · · · xn,σ(n) xn+1,σ(n+1) · · · xn+m,σ(n+m) , det X = σ ove si è posto X = (xi,j ) e ove la somma è effettuata al variare di σ tra tutte le permutazioni di n + m oggetti. In base alla struttura a blocchi della matrice X, si deduce che xi,j = 0 se i > n e j ≤ n, quindi nel prodotto xn+1,σ(n+1) · · · xn+m,σ(n+m) compare uno zero ogni volta che σ(n + 1) ≤ n, oppure σ(n + 2) ≤ n, . . . , oppure σ(n + m) ≤ n. Ciò significa che gli addendi che compaiono effettivamente nell’espressione del determinante di X corrispondono alle permutazioni σ tali che σ(n + 1), σ(n + 2), . . . , σ(n + m) ∈ {n + 1, . . . , n + m}. Di conseguenza si deve avere anche σ(1), σ(2), . . . , σ(n) ∈ {1, . . . , n}. Ciò significa che gli unici addenti che compaiono effettivamente nell’espressione del determinante di X corrispondono alle permutazioni σ che si spezzano nel prodotto di due permutazioni σ = σ1 σ2 , ove σ1 : {1, . . . , n} → 52 3. Determinanti {1, . . . , n} e σ2 : {n + 1, . . . , n + m} → {n + 1, . . . , n + m}. Si ricordi allora che si ha anche sgn(σ) = sgn(σ1 ) sgn(σ2 ). Si ottiene dunque X det X = (sgn σ1 )(sgn σ2 )x1,σ1 (1) x2,σ1 (2) · · · xn,σ1 (n) xn+1,σ2 (n+1) · · · σ1 ,σ2 · · · xn+m,σ2 (n+m) ! = X (sgn σ1 )x1,σ1 (1) x2,σ1 (2) · · · xn,σ1 (n) × σ1 ! X (sgn σ2 )xn+1,σ2 (n+1) xn+2,σ2 (n+2) · · · xn+m,σ2 (n+m) σ2 = det A · det C. Svolgimento esercizio 8. Verifichiamo la formula data nel caso n = 2: 1 1 det = λ 2 − λ1 . λ 1 λ2 Quindi la formula è corretta. Procediamo allora per induzione, supponendo che la formula sia corretta per n − 1 e cercando di dimostrare che in tal caso è corretta anche per n. Per calcolare 1 1 ··· 1 λ1 λ2 · · · λn 2 λ22 · · · λ2n λ ∆ = det .1 .. .. .. . ··· . λn−1 λn−1 · · · λn−1 1 2 n modifichiamo la matrice sottraendo ad ogni riga, a partire dalla seconda, la riga precedente moltiplicata per λ1 (facendo quanto detto il determinante non cambia). Si ottiene allora 1 1 1 ··· 1 0 λ 2 − λ1 λ3 − λ1 ··· λn − λ 1 2 2 ··· λ2n − λ1 λn . λ 3 − λ1 λ3 0 λ2 − λ 1 λ 2 ∆ = det . .. .. .. .. . . ··· . − λ1 λnn−2 0 λn−1 − λ1 λn−2 λn−1 − λ1 λn−2 · · · λn−1 2 2 3 3 n Sviluppando secondo la prima colonna si ha dunque λ2 − λ1 λ3 − λ 1 ··· λn − λ 1 λ22 − λ1 λ2 λ23 − λ1 λ3 ··· λ2n − λ1 λn . ∆ = det .. .. .. . . ··· . n−1 n−2 n−1 n−2 n−2 n−1 λ 2 − λ1 λ2 λ3 − λ 1 λ3 · · · λn − λ 1 λn 3. Soluzioni 53 A questo punto si può raccogliere a fattore dalla colonna j = 1, . . . , n − 1) il fattore λj − λ1 . Si ottiene pertanto 1 1 λ2 λ2 2 λ λ23 ∆ = (λ2 − λ1 )(λ3 − λ1 ) · · · (λn − λ1 ) det 2 .. ... . n−2 n−2 λ2 λ3 j-esima (per ogni ··· ··· ··· 1 λn λ2n .. . ··· · · · λn−2 n . In quest’ultima espressione compare un determinante di Vandermonde di ordine n − 1. Si può dunque applicare l’ipotesi induttiva, ottenendo finalmente Y ∆ = (λ2 − λ1 )(λ3 − λ1 ) · · · (λn − λ1 ) (λj − λi ) 2≤i<j Y = (λj − λi ). i<j Capitolo 4 Sistemi Lineari 1. Richiami di teoria 1.1. Definizioni e principali risultati Un sistema di m equazioni lineari in n incognite, a coefficienti in un campo C, è un insieme di equazioni del tipo seguente: a11 x1 + a12 x2 + · · · + a1n xn = b1 a21 x1 + a22 x2 + · · · + a2n xn = b2 ··· am1 x1 + am2 x2 + · · · + amn xn = bm dove i coefficienti aij e bi appartengono al campo C, mentre le xi sono le incognite. Risolvere un sistema lineare significa determinare i valori delle incognite per cui sono soddisfatte tutte le equazioni che compongono il sistema. Se chiamiamo A la matrice construita con i coefficienti aij e introduciamo due vettori colonna x1 b1 . X = .. , B = ... , xn bm il sistema precedente si può scrivere semplicamente come segue: AX = B, dove il prodotto è il solito prodotto righe per colonne. Ci sono vari metodi per risolvere un sistema lineare. Il più banale è il metodo di sostituzione. Si ricava una qualunque delle incognite da una delle equazioni del sistema, si sostituisce il valore trovato nelle equazioni rimanenti, in modo da trovare un sistema con una equazione in meno e una incognita in meno. Si itera poi questo processo fino a che non ci sono più equazioni da risolvere. Un metodo più efficace (che comporta cioè un minor numero di calcoli) è il metodo dell’eliminazione di Gauss. Tramite opportune combinazioni 56 4. Sistemi Lineari lineari delle equazioni del sistema si può ridurre la matrice A del sistema a una forma triangolare superiore (cioè tale che tutti gli elementi che si trovano sotto la diagonale principale sono nulli). A questo punto si risolve all’indietro (cioè partendo dall’ultima equazione) il sistema cosı̀ ottenuto, usando il metodo di sostituzione. Da un punto di vista più teorico sono importanti i seguenti risultati. Teorema 1.1 (Teorema di Cramer). Sia AX = B un sistema lineare di n equazioni in n incognite (la matrice A è quindi quadrata di ordine n). Questo sistema ammette una soluzione unica se e solo se det A 6= 0. Notiamo che la condizione det A 6= 0 equivale a richiedere che la matrice A sia invertibile. Sotto tale ipotesi, moltiplicando a sinistra ambo i membri dell’equazione AX = B per la matrice inversa di A, si ottiene X = A−1 B. L’esistenza e l’unicità della soluzione X del sistema risulta quindi ovvia. Si ha addirittura una formula esplicita per ottenerla: per i = 1, . . . , n, si ha xi = ∆i , ∆ ove ∆ = det A e ∆i è il determinante della matrice che si ottiene sostituendo nella matrice A la colonna dei coefficienti della incognita xi con la colonna dei termini noti B. Uno svantaggio del teorema di Cramer è che esso si applica solo a sistemi in cui il numero di incognite coincide con il numero di equazioni. Un risultato molto più generale è il seguente: Teorema 1.2 (Teorema di Rouché–Capelli). Sia AX = B un sistema lineare di n equazioni in m incognite. Indichiamo con (A|B) la matrice ottenuta aggiungendo alla matrice A la colonna B dei termini noti. Allora questo sistema ammette soluzioni se e solo se il rango della matrice A è uguale al rango della matrice (A|B). Inoltre se indichiamo con r il valore comune dei ranghi di queste due matrici, la soluzione è unica se e solo se r = n (cioè se il rango r coincide con il numero n di incognite). Se invece r < n, il sistema ammette infinite soluzioni, dipendenti da n − r parametri (in tal caso si suol dire che il sistema ammette ∞n−r soluzioni). Osserviamo infine che il teorema di Rouché–Capelli è particolarmente utile nella discussione dei sistemi che contengono dei parametri. 2. Esercizi 57 2. Esercizi 2.1. Sistemi parametrici Esercizio 1. Risolvere e discutere in funzione dei valori di m ∈ R il seguente sistema: x + (m + 1)y = m + 2 mx + (m + 4)y = 3. Esercizio 2. Risolvere e discutere in funzione dei valori di m ∈ R il seguente sistema: mx + (m − 1)y = m + 2 (m + 1)x − my = 5m + 3. Esercizio 3. Risolvere e discutere in funzione dei valori di a ∈ R il seguente sistema: x + (a − 1)y + (2 − a)z = a + 5 x + ay + 2z = 4 x + (a − 2)y + (2 − 2a2 )z = 6. Esercizio 4. Si dica per quali valori di λ ∈ R il seguente sistema è risolubile, e lo si risolva quando ha più di una soluzione. x + 2y + 2w + z = 1 y + 2w + z = 0 x + y + λw = 0 λy + 2λw + λ2 z = 0. Esercizio 5. Risolvere e discutere secondo i valori dei parametri b1 , . . . , b4 il sistema x + 3y + 5z + 3t = b1 x + 4y + 7z + 3t = b2 y + 2z = b3 x + 2y + 3z + 2t = b4 . Esercizio 6. Al variare di λ ∈ Q si dica quante soluzioni vi sono in Q4 per il seguente sistema di equazioni lineari: (λ − 1)x1 + 2x2 + 3x4 = 0 λx2 + (λ + 1)x4 = 1 x1 + λx3 + x4 = 0 (λ − 1)x1 + x4 = 0. 58 4. Sistemi Lineari Esercizio 7. Dato il sistema di equazioni lineari λx − µy − µz = µ µx − λy = λ x − y − z = 0 si dica per quali coppie (λ, µ) ∈ R2 è risolubile e per quali la soluzione è unica. 3. Soluzioni 3.1. Sistemi parametrici Svolgimento esercizio 1. Ricordiamo che un sistema lineare del tipo Ax = b ammette soluzioni se e solo se il rango della matrice incompleta A è uguale al rango della matrice completa (A|b). Nel caso in questione è 1 m+1 | m+2 (A|b) = . m m+4 | 3 Per calcolare il rango di quest’ultima matrice sottraiamo alla seconda riga la prima moltiplicata per m, ottenendo 1 m+1 | m+2 . 0 4 − m2 | 3 − m2 − 2m Si vede dunque che, se m 6= ±2 si ha rango(A) = rango(A|b), e quindi il sistema ha un’unica soluzione, mentre per m = 2 oppure m = −2 si ha rango(A) = 1 mentre rango(A|b) = 2, e quindi il sistema non ammette soluzioni. Si noti tuttavia che l’esercizio richiede di risolvere esplicitamente il sistema; in casi come questo si può allora evitare di studiare il rango delle matrici in questione, e si può invece risolvere direttamente il sistema; si scoprirà cosı̀ strada facendo quando la soluzione esiste (e se è unica oppure no) e quando non esiste. Per risolvere il sistema utilizziamo il metodo di eliminazione di Gauss (che è esattamente lo stesso metodo che abbiamo usato per determinare il rango di una matrice): sottraiamo alla seconda equazione la prima moltiplicata per m, ottenendo ( x + (m + 1)y = m + 2 (4 − m2 )y = 3 − m2 − 2m 3. Soluzioni 59 da cui si deduce che, se m 6= ±2, si ha m2 + 2m − 3 y = m2 − 4 m2 + 3m + 5 x = − m2 − 4 mentre, se m = 2 oppure m = −2, il sistema non ammette soluzioni. Presentiamo ora un altro modo per analizzare e risolvere un sistema lineare. Sia 1 m+1 A= m m+4 la matrice (incompleta) del sistema lineare e b = (m + 2, 3) la colonna dei termini noti. Poniamo ∆ = det A. Si ha ∆ = 4 − m2 , quindi ∆ = 0 per m = −2 o m = 2. Pertanto, se m 6= ±2, la matrice A è invertibile (il sistema è un sistema “di Cramer”) e il sistema ammette un’unica soluzione, data da x −1 −1 m + 2 =A b=A . y 3 Esplicitamente, si ha x = ∆x /∆ e y = ∆y /∆, ove ∆x (rispettivamente, ∆y ) è il determinante della matrice che si ottiene da A sostituendo alla prima (rispettivamente, seconda) colonna la colonna dei termini noti. Otteniamo quindi: m+2 m+1 ∆x = det = m2 + 3m + 5, 3 m+4 1 m+2 ∆y = det = −m2 − 2m + 3, m 3 da cui si ricava ∆x m2 + 3m + 5 x = = ∆ 4 − m2 2 ∆ m + 2m − 3 y = y = ∆ m2 − 4 I due casi rimanenti, m = −2 e m = 2 vanno trattati a parte. Per m = −2 si ha: 1 −1 0 A= ; b= . −2 2 3 Si vede subito che rango(A) = 1, mentre rango(A|b) = 2, quindi il sistema non ammette soluzioni. Per m = 2 si ha: 1 3 4 A= ; b= . 2 6 3 60 4. Sistemi Lineari Anche in questo caso si ha rango(A) = 1, mentre rango(A|b) = 2, quindi il sistema non ammette soluzioni. Svolgimento esercizio 2. Risolviamo direttamente il sistema usando il metodo di eliminazione di Gauss. Notiamo innanzitutto che, se m = 0, il sistema ha un’unica soluzione data da y = −2 x = 3. Se m 6= 0 sostituiamo la seconda equazione con la somma della seconda, moltiplicata per m, e della prima, moltiplicata per −(m + 1), ottenendo ( mx + (m − 1)y = m + 2 (1 − 2m2 )y = 4m2 − 2. Ora, se m2 = 21 , nella seconda equazione si ottiene 0 = 0, quindi il sistema ammette infinite soluzioni (dipendenti da un parametro) che si ottengono dalla prima equazione ricavando, ad esempio, la x in funzione della y: 1−m m+2 y+ , m m √ √ (ed ovviamente sostituendo ad m i valori −1/ 2 e 1/ 2 rispettivamente), mentre, se m2 6= 12 , si ottiene y = −2 x = 3. x= In conclusione il sistema ha un’unica soluzione (che non dipende da m) se m2 6= 12 , altrimenti ne ha infinite. Come per l’esercizio precedente, presentiamo anche un altro metodo per studiare e risolvere il sistema lineare in questione. Sia m m−1 A= m + 1 −m la matrice (incompleta) del sistema lineare e b = (m + 2, 5m + 3) la colonna 2 dei termini noti. √ Poniamo ∆√= det A. Si ha ∆ = 1 − 2m √ , quindi ∆ = 0 per m = −1/ 2 o m = 1/ 2. Pertanto, se m 6= ±1/ 2, la matrice A è invertibile (il sistema è un sistema “di Cramer”) e il sistema ammette un’unica soluzione, data da x m+2 −1 −1 =A b=A . y 5m + 3 Esplicitamente, si ha x = ∆x /∆ e y = ∆y /∆, ove ∆x (rispettivamente, ∆y ) è il determinante della matrice che si ottiene da A sostituendo alla prima 3. Soluzioni 61 (rispettivamente, seconda) colonna la colonna dei termini noti. Otteniamo quindi: m+2 m−1 ∆x = det = −6m2 + 3, 5m + 3 −m m m+2 ∆y = det = 4m2 − 2, m + 1 5m + 3 da cui si ricava ∆x 6m2 − 3 = x = ∆ 2m2 − 1 4m2 − 2 ∆ y = y = ∆ 1 − 2m2 √ √ I due casi rimanenti, m = −1/ 2 e m = 1/ 2 vanno trattati a parte. √ Per m = −1/ 2 si ha: √ √ √ −1/ 2 −1/ 2 − 1 −1/ 2+2 √ √ √ A= ; b= . −1/ 2 + 1 1/ 2 −5/ 2 + 3 Con un facile calcolo si scopre che rango(A) = rango(A|b) = 1, quindi il sistema è compatibile e ammette infinite soluzioni, dipendenti da un parametro. Le soluzioni si trovano considerando, ad esempio, la prima equazione 1 1 1 −√ x + − √ − 1 y = −√ + 2 2 2 2 e ricavando x in funzione di y: √ √ x = (−1 − 2)y + 1 − 2 2, ovvero ( x = (−1 − y=t √ √ 2)t + 1 − 2 2 per ogni t ∈ R. √ Analogamente, anche per m = 1/ 2 si scopre che rango(A) = rango(A|b) = 1, quindi il sistema è compatibile e ammette infinite soluzioni, dipendenti da un parametro. Come nel caso precedente si trova, ricavando ad esempio x in funzione di y, √ √ x = ( 2 − 1)y + 1 + 2 2, cioè ( per ogni t ∈ R. √ √ x = ( 2 − 1)t + 1 + 2 2 y=t 62 4. Sistemi Lineari Svolgimento esercizio 3. Ricordiamo il teorema di Rouché–Capelli: un sistema lineare del tipo Ax = b ammette soluzioni se e solo se il rango della matrice incompleta A è uguale al rango della matrice completa (A|b). Nel nostro caso si ha 1 a−1 2−a | a+5 a 2 | 4 . (A|b) = 1 2 1 a − 2 2 − 2a | 6 Per calcolare il rango di questa matrice utilizzeremo trasformazioni elementari sulle righe per ridurla a forma triangolare superiore. Iniziamo scambiando tra di loro la prima e seconda riga, ottenendo: 1 a 2 | 4 1 a − 1 2 − a | a + 5 . 1 a − 2 2 − 2a2 | 6 Ora sostituiamo la seconda riga con la differenza tra la prima e la seconda riga, e alla terza riga sottraiamo la prima: 1 a 2 | 4 0 1 a | −a − 1 . 2 0 −2 −2a | 2 A questo punto alla terza riga sommiamo la seconda riga moltiplicata per 2: 1 a 2 | 4 0 1 a | −a − 1 . 2 0 0 2(a − a ) | −2a È ora immediato riconoscere che, per a = 0 si ha rango(A) = rango(A|b) = 2, quindi il sistema è compatibile ed ammette infinite soluzioni, dipendenti da 3 − 2 = 1 parametro. Le soluzioni si trovano risolvendo il sistema corrispondente alle prime due righe dell’ultima matrice (ovviamente per a = 0), cioè: x + 2z = 4 y = −1 da cui si ricava (ad esempio) x = 4 − 2t y = −1 z =t per ogni t ∈ R. Per a = 1 si ha invece rango(A) = 2 ma rango(A|b) = 3, quindi il sistema è incompatibile, ossia non ammette soluzioni. 3. Soluzioni 63 Infine, se a 6= 0, 1, si ha rango(A) = rango(A|b) = 3, quindi il sistema ammette un’unica soluzione, che si trova risolvendo il sistema corrispondente all’ultima matrice: x + ay + 2z = 4 y + az = −a − 1 2(a − a2 )z = −2a Questo sistema si risolve facilmente per sostituzione, ricavando z dall’ultima equazione, sostituendo il valore trovato nelle equazioni precedenti, ricavando poi y dalla penultima, etc. Si trova: 1 z= a−1 −a2 − a + 1 y= a−1 3 2 x = a + a + 3a − 6 a−1 Presentiamo ora un altro metodo per discutere e risolvere lo stesso sistema lineare. Sia 1 a−1 2−a a 2 A = 1 1 a − 2 2 − 2a2 la matrice (incompleta) del sistema e b = (a + 5, 4, 6) la colonna dei termini noti. Poniamo ∆ = det A. Si ha ∆ = 2a(1 − a), quindi ∆ = 0 per a = 0 o a = 1. Pertanto, se a 6= 0, 1, la matrice A è invertibile (il sistema è un sistema “di Cramer”) e il sistema ammette un’unica soluzione, data da x a+5 y = A−1 b = A−1 4 . z 6 Esplicitamente, si ha x = ∆x /∆, y = ∆y /∆ e z = ∆z /∆, ove ∆x (rispettivamente, ∆y , ∆z ) è il determinante della matrice che si ottiene da A sostituendo alla prima (rispettivamente, seconda, terza) colonna la colonna dei termini noti. Otteniamo quindi: ∆x = 2a(6 − 3a − a2 − a3 ), ∆y = 2a(a2 + a − 1), ∆z = −2a, 64 4. Sistemi Lineari da cui si ottiene ∆x 6 − 3a − a2 − a3 = x = ∆ 1−a 2 ∆y a +a−1 y= = ∆ 1−a ∆ 1 z = z = ∆ a−1 I due casi rimanenti, a = 0 e a = 1, vanno trattati a parte. Per a = 0 si ha: 1 −1 2 5 A = 1 0 2 ; b = 4 . 1 −2 2 6 Si vede subito che rango(A) = 2. Calcolando tutti i minori di ordine tre estratti dalla matrice (A|b), si trova sempre 0, quindi anche rango(A|b) = 2. Il sistema è dunque compatibile e ammette infinite soluzioni, dipendenti da un parametro. Tali soluzioni si trovano risolvendo, ad esempio, il sistema corrispondente alla prime due righe della matrice A: x − y + 2z = 5 x + 2z = 4 da cui si ricava (ad esempio) x = 4 − 2t y = −1 z =t per ogni t ∈ R. Infine, per a = 1, si ha: 1 0 1 A = 1 1 2 ; 1 −1 0 6 b = 4 . 6 Si ha anche in questo caso rango(A) = 2, tuttavia rango(A|b) = 3, come si vede, ad esempio, considerando il minore di ordine tre costituito dalle prime due colonne di A e dalla colonna b. In questo caso il sistema è dunque incompatibile. Svolgimento esercizio 4. In questo caso non è richiesto di risolvere sempre il sistema, quindi possiamo limitarci, per ora, a studiare il rango delle matrici del sistema: 1 2 2 1 | 1 0 1 2 1 | 0 (A|b) = 1 1 λ 0 | 0 . 0 λ 2λ λ2 | 0 3. Soluzioni 65 Con operazioni elementari sulle righe si può trasformare questa matrice fino ad ottenere la matrice seguente: 1 2 2 1 | 1 0 1 2 1 | 0 . 0 0 λ 0 | −1 0 0 0 λ2 − λ | 0 Si scopre allora che, se λ = 0 si ha rango(A) = 2 e rango(A|b) = 3, quindi il sistema non ammette soluzione. Se λ = 1 si ha rango(A) = 3 = rango(A|b), quindi il sistema ammette soluzioni e, dato che il rango di A non è 4, le soluzioni sono infinite (e dipendono da 4 − 3 = 1 parametro). Infine, se λ 6= 0, 1, la matrice A ha rango massimo (= 4), quindi è invertibile, ed il sistema ha un’unica soluzione. A questo punto non ci rimane altro che risolvere il sistema nel solo caso λ = 1. In questo caso il sistema diventa x + 2y + 2w + z = 1 y + 2w + z = 0 x+y+w =0 y + 2w + z = 0 che, mediante eliminazione di Gauss, è equivalente al sistema x + 2y + 2w + z = 1 y + 2w + z = 0 w = −1 0=0 da cui si ottiene, ricavando ad esempio x, y e w in funzione di z, x=z−1 y =2−z w = −1. Svolgimento esercizio 5. Utilizzando il metodo di eliminazione di Gauss si ottiene, alla fine, il sistema x + 3y + 5z + 3t = b1 y + 2z = b2 − b1 0 = b3 − b2 + b1 t = 2b1 − b2 − b4 . Si trova dunque che, se b3 − b2 + b1 6= 0, il sistema non ha soluzione, mentre se b3 − b2 + b1 = 0 ci sono infinite soluzioni, date (ad esempio ricavando x, 66 4. Sistemi Lineari y e t in funzione di z) da t = 2b1 − b2 − b4 y = b2 − b1 − 2z x = −2b + 3b + z. 1 4 Svolgimento esercizio 6. In questo caso non è richiesto di risolvere il sistema, quindi basta studiare il rango delle matrici completa e incompleta. λ−1 2 0 3 | 0 0 λ 0 λ + 1 | 1 (A|b) = 1 0 λ 1 | 0 λ−1 0 0 1 | 0 Con operazioni elementari sulle righe si può trasformare questa matrice fino ad ottenere 1 0 λ 1 | 0 0 2 λ − λ2 4 − λ | 0 0 0 λ − λ2 2 − λ | 0 . 0 0 0 1 | 1 A questo punto si scopre che, se λ = 0, 1 si ha rango(A) = 3 e rango(A|b) = 4, quindi il sistema non ha soluzioni. Se invece λ 6= 0, 1 la matrice A ha rango massimo, quindi è invertibile e dunque la soluzione esiste ed è unica. Il fatto che tale soluzione appartenga a Q4 è ovvio, dato che tutte le operazioni necessarie per risolvere il sistema coinvolgono solo somme e prodotti di numeri razionali. Svolgimento esercizio 7. Calcoliamo il rango delle matrici completa e incompleta: λ −µ −µ | µ (A|b) = µ −λ 0 | λ . 1 −1 −1 | 0 Con operazioni elementari sulle righe si ottiene alla fine la matrice 1 −1 −1 | 0 0 λ − µ λ − µ | µ . 0 0 λ | λ+µ Bisogna distinguere allora i seguenti casi: (1) λ = 0, µ = 0: si ha rango(A) = rango(A|b) = 1, quindi esistono infinite soluzioni (dipendenti da 3 − 1 = 2 parametri); (2) λ = 0, µ 6= 0: si ha rango(A) = 2, rango(A|b) = 3, quindi non esistono soluzioni; (3) λ 6= 0, µ = λ: si ha rango(A) = 2, rango(A|b) = 3, quindi non esistono soluzioni; (4) λ 6= 0, µ 6= λ: si ha rango(A) = rango(A|b) = 3, quindi il sistema ha un’unica soluzione. 3. Soluzioni Studiamo ora lo stesso sistema in λ A= µ 1 67 un altro modo. Sia −µ −µ −λ 0 −1 −1 la matrice (incompleta) del sistema lineare e b = (µ, λ, 0) la colonna dei termini noti. Poniamo ∆ = det A. Si ha ∆ = λ(λ − µ), quindi ∆ = 0 per λ = 0 o λ = µ. Pertanto, se λ 6= 0 e λ 6= µ, la matrice A è invertibile (il sistema è un sistema “di Cramer”) e il sistema ammette un’unica soluzione. Rimangono da trattare i due casi λ = 0 e λ = µ. Se λ = 0 si ha: 0 −µ −µ µ 0 ; A = µ 0 b = 0 . 1 −1 −1 0 Ora, se µ 6= 0 si ha rango(A) = 2 e rango(A|b) = 3, quindi il sistema non ammette soluzioni. Se invece µ = 0, si ha rango(A) = rango(A|b) = 1, quindi il sistema è compatibile ed ammette infinite soluzioni, dipendenti da 3 − 1 = 2 parametri. Nell’ultimo caso, cioè per λ = µ 6= 0, si ha: µ −µ −µ µ µ −µ 0 A= ; b = µ . 1 −1 −1 0 Anche in questo caso si ha rango(A) = 2 e rango(A|b) = 3, quindi il sistema non ammette soluzioni. Capitolo 5 Autovalori e Autovettori 1. Richiami di teoria 1.1. Definizioni Sia f : V → V un’applicazione lineare di uno spazio vettoriale V in sé. Definizione 1.1. Un vettore non nullo v ∈ V è detto autovettore di f se esiste uno scalare λ ∈ C tale che f (v) = λv. In tal caso lo scalare λ è detto autovalore di f , e si dice che l’autovettore v è associato all’autovalore λ. Se A è la matrice di f rispetto a una base fissata di V , si parla di autovalori e autovettori di A per indicare gli autovalori e autovettori di f . Più precisamente, possiamo dare la seguente definizione: Definizione 1.2. Sia A una matrice quadrata di ordine n a coefficienti nel campo C. Un autovettore di A è un vettore non nullo (x1 , . . . , xn ) ∈ C n tale che x1 x1 . A .. = λ ... , xn xn per uno scalare λ ∈ C, detto autovalore di A. Definizione 1.3. Sia A una matrice quadrata di ordine n. Il polinomio PA (x) = det(A − xI) è detto il polinomio caratteristico di A. Teorema 1.4. Gli autovalori di una matrice quadrata A sono le radici del polinomio caratteristico, cioè sono le soluzioni della seguente equazione (detta equazione caratteristica): det(A − xI) = 0 Notiamo che se due matrici A e A0 sono simili, cioè rappresentano la stessa applicazione lineare f : V → V rispetto a basi diverse di V , allora 70 5. Autovalori e Autovettori hanno lo stesso polinomio caratteristico. Dal teorema di Binet segue infatti che PA0 (x) = det(A0 − xI) = det(P AP −1 − xI) = det(P (A − xI)P −1 ) = det P det(A − xI) det P −1 = det(A − xI) = PA (x). Si deduce quindi che matrici simili hanno gli stessi autovalori, quindi gli autovalori dipendono solo dalla applicazione lineare f e non dalla matrice che la rappresenta. Osservazione 1.5. Abbiamo appena osservato che matrici simili hanno lo stesso polinomio caratteristico, e quindi gli stessi autovalori. Si vede facilmente che non vale il viceversa: due matrici che abbiano lo stesso polinomio caratteristico non sono necessariamente simili. Se la matrice A ha ordine n l’equazione caratteristica di A è una equazione polinomiale di grado n. Non è quindi detto che gli autovalori di A esistano. Ciò dipende dal campo C. Il teorema fondamentale dell’algebra afferma che se C è un campo algebricamente chiuso (come il campo complesso C), ogni polinomio di grado n ha sempre n radici, eventualmente non tutte distinte. Ciò è ovviamente falso per il corpo reale R: l’equazione di secondo grado x2 + 1 = 0 non ha infatti soluzioni reali. Teorema 1.6 (Teorema di Hamilton). Una matrice A soddisfa la sua equazione caratteristica, cioè PA (A) = 0. Il teorema di Hamilton afferma che il polinomio caratteristico PA (x) di una matrice A si annulla quando viene valutato per x = A. In generale però il polinomio caratteristico non è il polinomio di grado minimo che ha questa proprietà. Diamo dunque la seguente definizione: Definizione 1.7. Il polinomio minimo di una matrice A è il polinomio monico di grado minimo che si annulla quando viene valutato per x = A. (Ricordiamo che un polinomio di grado r si dice monico quando il coefficiente di xr è 1). Un risultato che vale in tutta generalità è il seguente: Proposizione 1.8. Il polinomio minimo di una matrice A divide il polinomio caratteristico di A. Dopo aver determinato gli autovalori λi di una matrice A, la ricerca degli autovettori è ricondotta alla risoluzione di un sistema lineare. Proposizione 1.9. Se λ è un autovalore di A, gli autovettori corrispondenti sono le soluzioni non nulle del sistema lineare omogeneo (A − λI)X = 0, ove X = (x1 , . . . , xn ). 1. Richiami di teoria 71 Definizione 1.10. L’autospazio Eλ associato all’autovettore λ è l’insieme di tutte le soluzioni del sistema lineare omogeneo (A − λI)X = 0. L’autospazio Eλ è quindi l’insieme di tutti gli autovettori associati all’autovalore λ, più il vettore nullo (che, per definizione, non è considerato autovettore). Si verifica immediatamente che Eλ è effettivamente uno spazio vettoriale. 1.2. Diagonalizzazione Sia f : V → V un’applicazione lineare. Se esiste una base di V costituita da autovettori di f allora si vede immediatamente che la matrice di f rispetto a tale base è diagonale, e gli elementi sulla diagonale sono precisamente gli autovalori di f . Ricordiamo che due matrici A e A0 si dicono simili se rappresentano la stessa applicazione lineare f rispetto a due basi diverse e questo accade se e solo se esiste uma matrice invertibile P tale che A0 = P AP −1 . Possiamo quindi dare la seguente definizione: Definizione 1.11. Una matrice quadrata A è diagonalizzabile se essa è simile a una matrice diagonale, cioè se esiste una matrice diagonale D e una matrice invertibile P tali che A = P DP −1 . Da quanto detto in precedenza si deduce che, se A è diagonalizzabile e vale la relazione A = P DP −1 , la matrice diagonale D deve avere sulla diagonale gli autovalori di A, mentre la matrice P deve essere composta dagli autovettori della matrice A, scritti in colonna, e considerati nello stesso ordine in cui sono stati disposti sulla diagonale di D gli autovalori di A. Precisamente, se λ1 , . . . , λn sono gli n autovalori di A e se v1 = (p11 , p21 , . . . , pn1 ), . . . , vn = (p1n , p2n , . . . , pnn ) sono gli autovettori corrispondenti, allora si ha: p11 p12 · · · p1n λ1 0 · · · 0 0 λ2 · · · 0 p21 p22 · · · p2n , . D= P = . . .. . . .. . .. .. .. .. . . .. . . . 0 0 · · · λn pn1 pn2 · · · pnn Quindi possiamo concludere che affinché una matrice quadrata A, di ordine n, a coefficienti in un campo C sia diagonalizzabile è necessario e sufficiente che la matrice A abbia tutti i suoi autovalori nel campo C e che esistano n autovettori linearmente indipendenti. Consideriamo ora alcune condizioni che garantiscono che una matrice sia diagonalizzabile. 72 5. Autovalori e Autovettori Proposizione 1.12. Se v1 e v2 sono due autovettori relativi agli autovalori λ1 e λ2 rispettivamente, e se λ1 6= λ2 , allora v1 e v2 sono linearmente indipendenti. Da questo risultato discende immediatamente il seguente teorema: Teorema 1.13. Se una matrice quadrata A di ordine n possiede n autovalori a due a due distinti, allora A è diagonalizzabile. Consideriamo ora il caso in cui gli autovalori esistono nel campo C ma non sono tutti distinti. Definizione 1.14. Un autovalore λ di una matrice A ha molteplicità r se nel polinomio caratteristico di A compare il fattore (x − λ)r . Se un autovalore λ ha molteplicità r, si può dimostrare che l’autospazio Eλ corrispondente avrà in generale dimensione ≤ r. Si ha quindi: Teorema 1.15. Una matrice quadrata A di ordine n a coefficienti nel campo C è diagonalizzabile se e solo se essa possiede tutti i suoi autovalori nel campo C e se per ogni autovalore λ di molteplicità r l’autospazio Eλ corrispondente ha esattamente dimensione r. 1.3. Forma canonica di Jordan Da quanto visto in precedenza si deduce che, anche se una matrice possiede tutti i suoi autovalori nel campo C (il che accade sempre se C è algebricamente chiuso), non è detto che essa sia diagonalizzabile. Si dimostra però che in ogni caso essa è simile ad una matrice “non troppo distante” da una matrice diagonale. Precisiamo ora questo concetto. Sia A una matrice quadrata di ordine n e sia λ un autovalore di A. Definizione 1.16. Un blocco di Jordan di ordine r relativo all’autovalore λ è la seguente matrice quadrata di ordine r: λ 0 0 Jλ = . .. 1 λ 0 .. . 0 0 1 0 λ 1 .. . . . . 0 0 0 0 ··· ··· ··· .. . 0 0 0 . 1 ··· λ Si può quindi dimostrare il seguente teorema. Teorema 1.17. Sia A una matrice quadrata di ordine n a coefficienti in un campo C. Se A possiede tutti i suoi autovalori nel campo C allora essa 2. Esercizi è simile ad una matrice del tipo Jλ1 0 0 0 Jλ2 0 0 0 Jλ3 J = . .. .. .. . . 0 0 0 73 ··· ··· ··· .. . 0 0 0 .. . · · · Jλr ove sulla diagonale troviamo le matrici Jλi che sono dei blocchi di Jordan relativi agli autovettori λi di A. La matrice J è detta la forma canonica di Jordan di A, essa è unica a meno di una permutazione dei blocchi di Jordan Jλi . Negli esercizi verranno illustrati dei metodi per determinare la forma canonica di Jordan di una matrice A. 2. Esercizi 2.1. Diagonalizzazione Esercizio 1. Si dica se la matrice 1 4 1 A = −4 −7 2 6 6 0 è diagonalizzabile (cioè simile ad una matrice diagonale). In caso affermativo, si determinino una matrice diagonale D ed una matrice invertibile P tali che A = P DP −1 . Esercizio 2. Si dica se la matrice 1 4 0 −2 0 1 0 0 A= 0 −2 1 1 0 4 0 −1 è diagonalizzabile (cioè simile ad una matrice diagonale). In caso affermativo, si determinino una matrice diagonale D ed una matrice invertibile P tali che D = P −1 AP . Esercizio 3. Determinare per quali valori del parametro reale t la matrice 3 −1 −1 A = t − 1 t + 3 t + 1 −t −t 2 − t è diagonalizzabile (cioè simile ad una matrice diagonale). Per ciascuno di questi valori determinare una matrice diagonale D ed una matrice invertibile P tali che A = P DP −1 . 74 5. Autovalori e Autovettori Esercizio 4. Si calcoli An , per ogni intero n ≥ 1, dove A è la matrice 5/2 −1 A= . 3 −1 Esercizio 5. Si calcoli exp(A), dove 3 A= 0 −3 A è la matrice −2 0 0 −2 . 2 −2 Esercizio 6. Sia A una matrice quadrata non nulla, tale che An = 0 per qualche intero n ≥ 2 (una tale matrice A è detta nilpotente). Dimostrare che tutti gli autovalori di A sono nulli. 2.2. Forma Canonica di Jordan Esercizio 7. Determinare la forma canonica di Jordan dell’endomorfismo φ : R3 → R3 la cui matrice, rispetto alla base canonica, è 3 4 4 A = −3 −6 −8 . 3 7 9 Si determini inoltre una base di R4 rispetto a cui la matrice di φ è la forma canonica trovata. Esercizio 8. Determinare la forma canonica di Jordan dell’endomorfismo φ : R4 → R4 la cui matrice, rispetto alla base canonica, è −1 0 0 0 0 1 0 0 A= 1 −3 −1 −1 . 0 −2 0 1 Si determini inoltre una base di R4 rispetto a cui la matrice di φ è la forma canonica trovata. Esercizio 9. Determinare la forma canonica di Jordan dell’endomorfismo φ : R4 → R4 la cui matrice, rispetto alla base canonica, è 2 0 0 0 −4 2 −4 −3 . A= 4 0 5 3 −3 0 −2 0 Si determini inoltre una base di R4 rispetto a cui la matrice di φ è la forma canonica trovata. 2. Esercizi 75 Esercizio 10. Determinare la forma canonica di Jordan dell’endomorfismo φ : R4 → R4 la cui matrice, rispetto alla base canonica, è 0 0 2 −4 1 2 −1 2 . A= 0 0 2 0 1 0 −1 4 Si determini inoltre una base di R4 rispetto a cui la matrice di φ è la forma canonica trovata. Esercizio 11. Sia A una matrice n × n a coefficienti reali tale che A2 = A. Si dimostri che A è diagonalizzabile e che i suoi autovalori sono solo 0 oppure 1. Si dimostri inoltre che, se anche B è una matrice tale che B 2 = B, allora A e B sono simili se e solo se hanno lo stesso rango. Esercizio 12. Sia A una matrice n × n a coefficienti reali, non-degenere e antisimmetrica. Si dimostri che tutti gli autovalori di A sono puramente immaginari. 2.3. Polinomio Minimo e Polinomio Caratteristico Esercizio 13. Sia V uno spazio vettoriale complesso di dimensione 9. Si determinino tutti gli endomorfismi φ di V che soddisfano alle seguenti condizioni: dim Ker(φ − 2 id) = 1, dim Ker(φ − 2 id)3 = 3, dim Ker(φ − 3 id) = 2, dim Ker(φ − 3 id)2 = 4, dim Im(φ2 ) = 7. Esercizio 14. Sia V uno spazio vettoriale complesso di dimensione 6. Si determinino tutti gli endomorfismi φ di V che hanno rango ≥ 4 ed il cui polinomio minimo è x4 − 6x3 + 9x2 . 2.4. Esercizi Vari Esercizio 15. I numeri di Fibonacci sono i termini della successione definita ponendo x1 = 1, x2 = 1 e xn = xn−1 + xn−2 , per n ≥ 3 (i primi termini sono 1, 1, 2, 3, 5, 8, 13, 21, etc.). Si determini una formula per calcolare l’ennesimo numero di Fibonacci xn , per ogni n > 0. 76 5. Autovalori e Autovettori 3. Soluzioni 3.1. Diagonalizzazione Svolgimento esercizio 1. Determiniamo gli autovalori di A. Si ha: 1−λ 4 1 det(A − λI) = det −4 −7 − λ 2 6 6 −λ 1−λ 3+λ 1 = det −4 −3 − λ 2 6 0 −λ 1−λ 3+λ 1 0 3 = det −3 − λ 6 0 −λ −3 − λ 3 = −(3 + λ) det 6 −λ = −(3 + λ)(λ2 + 3λ − 18), dove, nel primo passaggio abbiamo sottratto alla seconda colonna la prima, mentre nel secondo abbiamo sommato alla seconda riga la prima. Si ha dunque det(A − λI) = 0 per λ = −3, λ = 3 e λ = −6. Questi sono i tre autovalori della matrice A, che è quindi diagonalizzabile avendo tre autovalori (reali e) distinti. Possiamo dunque prendere come matrice diagonale D, ad esempio, la matrice −6 0 0 D = 0 −3 0 . 0 0 3 Per determinare una matrice invertibile P tale che A = P DP −1 è necessario determinare gli autovettori della matrice A. Iniziamo dagli autovettori relativi all’autovalore λ1 = −6; essi sono le soluzioni del sistema x1 (A − λ1 I) x2 = 0. x3 Sviluppando i calcoli si ottiene il sistema 7x1 + 4x2 + x3 = 0 − 4x1 − x2 + 2x3 = 0 6x + 6x + 6x = 0 1 2 3 3. Soluzioni 77 le cui soluzioni sono date da x2 = −2x1 e x3 = x1 . Un autovettore relativo all’autovalore λ1 = −6 è, ad esempio, il vettore v1 = (1, −2, 1). Questo costituirà la prima colonna della matrice P . Per l’autovalore λ2 = −3 si ottiene il sistema x1 (A − λ2 I) x2 = 0, x3 che fornisce 4x1 + 4x2 + x3 = 0 − 4x1 − 4x2 + 2x3 = 0 6x + 6x + 3x = 0 1 2 3 le cui soluzioni sono x1 = −x2 e x3 = 0. Un autovettore relativo all’autovalore λ2 = −3 è, ad esempio, il vettore v2 = (−1, 1, 0). Questo costituirà la seconda colonna della matrice P . Finalmente, per l’autovalore λ3 = 3 si ottiene il sistema x1 (A − λ3 I) x2 = 0, x3 che fornisce − 2x1 + 4x2 + x3 = 0 − 4x1 − 10x2 + 2x3 = 0 6x + 6x − 3x = 0 1 2 3 le cui soluzioni sono x2 = 0 e x3 = 2x1 . Un autovettore relativo all’autovalore λ3 = 3 è, ad esempio, il vettore v3 = (1, 0, 2). Questo costituirà la terza colonna della matrice P . Si ha quindi 1 −1 1 P = −2 1 0 . 1 0 2 Si può ora verificare, per esercizio, che AP = P D, cioè che A = P DP −1 , come richiesto. 78 5. Autovalori e Autovettori Svolgimento esercizio 2. Determiniamo gli autovalori di A: 1−λ 4 0 −2 0 1−λ 0 0 det(A − λI) = det 0 −2 1 − λ 1 0 4 0 −1 − λ 1−λ 0 0 1 = (1 − λ) det −2 1 − λ 4 0 −1 − λ 1−λ 1 2 = (1 − λ) det 0 −1 − λ = (1 − λ)3 (−1 − λ) = 0, le cui soluzioni sono λ1 = 1, con molteplicità 3, e λ2 = −1, con molteplicità 1. Si noti che gli autovalori di A non sono tutti distinti, di conseguenza le informazioni che abbiamo finora non sono sufficienti per decidere se A sia diagonalizzabile o meno. Determiniamo allora gli autovettori di A. Iniziamo dagli autovettori relativi all’autovalore λ1 = 1; essi sono le soluzioni del sistema x1 x2 (A − 1I) x3 = 0. x4 Sviluppando i calcoli si ottiene il sistema 4x2 − 2x4 = 0 − 2x2 + x4 = 0 4x − 2x = 0 2 4 le cui soluzioni sono date da x4 = 2x2 (x1 , x2 e x3 sono liberi di variare). Si scopre cosı̀ che l’autospazio relativo all’autovalore λ1 = 1 ha dimensione 3, uguale alla molteplicità dell’autovalore in questione. Una base di tale autospazio è data, ad esempio, dai vettori v1 = (1, 0, 0, 0), v2 = (0, 1, 0, 2) e v3 = (0, 0, 1, 0). Per l’autovalore λ2 = −1 si ottiene il sistema x1 x2 (A + 1I) x3 = 0, x4 3. Soluzioni 79 che fornisce 2x1 + 4x2 − 2x4 = 0 2x2 = 0 − 2x2 + 2x3 + x4 = 0 4x2 = 0 le cui soluzioni sono x1 = −2x3 , x2 = 0 e x4 = −2x3 . L’autospazio relativo all’autovalore λ2 = −1 ha quindi dimensione 1 (ovviamente!), uguale anche in questo caso alla molteplicità dell’autovalore in questione. Una base di tale autospazio è data, ad esempio, dal vettore v4 = (−2, 0, 1, −2). In conclusione, la matrice A è diagonalizzabile e le due matrici D e P richieste sono, ad esempio, 1 0 0 0 0 1 0 0 D= 0 0 1 0 0 0 0 −1 e 1 0 0 −2 0 1 0 0 P = 0 0 1 1 . 0 2 0 −2 Si può ora verificare, per esercizio, che AP = P D, cioè che D = P −1 AP , come richiesto. Svolgimento esercizio 3. Determiniamo gli autovalori di A. Si ha: 3−λ −1 −1 t+1 det(A − λI) = det t − 1 t + 3 − λ −t −t 2−t−λ 4−λ −1 −1 t+1 = det −4 + λ t + 3 − λ 0 −t 2−t−λ 4−λ −1 −1 t+2−λ t = det 0 0 −t 2−t−λ t+2−λ t = (4 − λ) det −t 2−t−λ = (4 − λ)(λ − 2)2 , dove, nel primo passaggio abbiamo sottratto alla prima colonna la seconda, mentre nel secondo abbiamo sommato alla seconda riga la prima. Le soluzioni di det(A − λI) = 0 sono quindi λ1 = 2, con molteplicità 2, e λ2 = 4, con molteplicità 1. Si noti che gli autovalori di A non sono tutti distinti, di conseguenza le informazioni che abbiamo finora non sono 80 5. Autovalori e Autovettori sufficienti per decidere se A sia diagonalizzabile o meno. Determiniamo allora gli autovettori di A. Iniziamo dagli autovettori relativi all’autovalore λ1 = 2; essi sono le soluzioni del sistema x1 (A − 2I) x2 = 0. x3 Sviluppando i calcoli si ottiene il sistema x1 − x2 − x3 = 0 (t − 1)x1 + (t + 1)x2 + (t + 1)x3 = 0 − tx − tx − tx = 0 1 2 3 Se t 6= 0, le soluzioni sono x1 = 0 e x2 = −x3 , da cui si deduce che l’autospazio relativo all’autovalore λ1 = 2 ha dimensione 1. Dato che la dimensione dell’autospazio è minore della molteplicità dell’autovalore corrispondente, possiamo concludere che, per t 6= 0, la matrice A non è diagonalizzabile. Se invece t = 0, le soluzioni del sistema lineare sono date da x1 = x2 +x3 . In questo caso l’autospazio relativo all’autovalore λ1 = 2 ha dimensione 2, uguale alla molteplicità dell’autovalore corrispondente. Dato che l’autovalore λ2 = 4 ha molteplicità 1, possiamo concludere che la matrice A è diagonalizzabile solo per t = 0. Una base dell’autospazio relativo all’autovalore λ1 = 2 è data, ad esempio, dai vettori v1 = (1, 1, 0) e v2 = (1, 0, 1), che costituiranno le prime due colonne della matrice P . Per l’autovalore λ2 = 4 si ottiene il sistema x1 (A − 4I) x2 = 0, x3 che fornisce − x1 − x2 − x3 = 0 (t − 1)x1 + (t − 1)x2 + (t + 1)x3 = 0 − tx − tx − (t + 2)x = 0 1 2 3 Risolviamolo solo per il valore che interessa, t = 0. Si trova x1 = −x2 e x3 = 0. Un autovettore relativo all’autovalore λ2 = 4 è, ad esempio, il vettore v3 = (−1, 1, 0). Questo costituirà la terza colonna della matrice P . In conclusione, la matrice A è diagonalizzabile solo per t = 0, nel qual caso le due matrici D e P richieste sono, ad esempio, 2 0 0 D = 0 2 0 0 0 4 3. Soluzioni 81 e 1 1 −1 P = 1 0 1 . 0 1 0 Svolgimento esercizio 4. Determiniamo gli autovalori di A: 5/2 − λ −1 det(A − λI) = det 3 −1 − λ 1 3 = λ2 − λ + = 0, 2 2 le cui soluzioni sono λ1 = 1/2 e λ2 = 1. Dato che gli autovalori di A sono tutti distinti, A è diagonalizzabile. Determiniamo ora gli autovettori di A. Iniziamo dagli autovettori relativi all’autovalore λ1 = 1/2; essi sono le soluzioni del sistema 1 x (A − I) 1 = 0. x2 2 Sviluppando i calcoli si ottiene il sistema 2x1 − x2 = 0 3 3x1 − x2 = 0 2 le cui soluzioni sono date da x2 = 2x1 . Un autovettore relativo all’autovalore λ1 = 1/2 è, ad esempio, v1 = (1, 2). Per l’autovalore λ2 = 1 si ottiene il sistema x (A − 1I) 1 = 0, x2 che fornisce 3x − x = 0 1 2 2 3x − 2x = 0 1 2 le cui soluzioni sono x1 = 32 x2 . Un autovettore relativo all’autovalore λ2 = 1 è, ad esempio, v2 = (2, 3). In conclusione, la matrice A è diagonalizzabile e, se poniamo 1/2 0 1 2 , P = , D= 0 1 2 3 si ha A = P DP −1 . Calcoliamo ora P −1 . Si ha det P = −1, quindi −3 2 −1 P = . 2 −1 82 5. Autovalori e Autovettori È ora facile calcolare An . Si ha infatti: An = (P DP −1 )n = (P DP −1 )(P DP −1 ) · · · (P DP −1 ) = P Dn P −1 1 −3 2 1 2 0 n 2 = 2 −1 2 3 0 1n 3 1 4 − 2n 2n−1 − 2 = . 3 1 6 − 2n−1 −3 2n−2 Svolgimento esercizio 5. Ricordiamo che l’esponenziale di una matrice quadrata, exp(A), è definito come somma della seguente serie (convergente, per ogni matrice A): +∞ X 1 n exp(A) = A . n! n=0 Da questa formula discende che, se D è una matrice diagonale i cui elementi sulla diagonale principale sono d1 , . . . , dr , allora exp(D) è ancora una matrice diagonale, avente sulla diagonale principale gli elementi ed1 , . . . , edr . Se A è simile ad una matrice diagonale, si ha A = P DP −1 , ove D è una matrice diagonale e P una matrice invertibile. In questo caso è facile calcolare exp(A). Si ha infatti: +∞ +∞ X 1 n X 1 exp(A) = A = (P DP −1 )n n! n! n=0 n=0 X +∞ +∞ X 1 1 n n −1 = PD P = P D P −1 n! n! n=0 n=0 = P exp(D)P −1 , quindi il calcolo di exp(A) si riduce al calcolo di P , exp(D) e P −1 . Determiniamo gli autovalori di A: 3 − λ −2 0 −λ −2 det(A − λI) = det 0 −3 2 −2 − λ = λ(−λ2 + λ + 2) = 0, le cui soluzioni sono λ1 = 0, λ2 = −1 e λ3 = 2. Dato che gli autovalori di A sono tutti distinti, A è diagonalizzabile. Determiniamo ora gli autovettori di A. Iniziamo dagli autovettori relativi all’autovalore λ1 = 0; essi sono le soluzioni del sistema x1 A x2 = 0. x3 3. Soluzioni 83 Sviluppando i calcoli si ottiene il sistema 3x1 − 2x2 = 0 − 2x3 = 0 − 3x + 2x − 2x = 0 1 2 3 le cui soluzioni sono date da x1 = 32 x2 e x3 = 0. Un autovettore relativo all’autovalore λ1 = 0 è, ad esempio, v1 = (2, 3, 0). Per l’autovalore λ2 = −1 si ottiene il sistema x1 (A + 1I) x2 = 0, x3 che fornisce 4x1 − 2x2 = 0 x2 − 2x3 = 0 − 3x + 2x − x = 0 1 2 3 le cui soluzioni sono x1 = x3 e x2 = 2x3 . Un autovettore relativo all’autovalore λ2 = −1 è, ad esempio, v2 = (1, 2, 1). Per l’autovalore λ3 = 2 si ottiene il sistema x1 (A − 2I) x2 = 0, x3 che fornisce x1 − 2x2 = 0 − 2x2 − 2x3 = 0 − 3x + 2x − 4x = 0 1 2 3 le cui soluzioni sono x1 = 2x2 e x3 = −x2 . Un autovettore relativo all’autovalore λ3 = 2 è, ad esempio, v3 = (2, 1, −1). In conclusione, la matrice A è diagonalizzabile e, se poniamo 0 0 0 2 1 2 P = 3 2 1 , D = 0 −1 0 , 0 0 2 0 1 −1 si ha A = P DP −1 . Calcoliamo ora P −1 . Si −1 1 −1 1 −2/3 P = 1 −2/3 ha det P = 3 e −1 4/3 . 1/3 84 5. Autovalori e Autovettori Da quanto visto in precedenza, si ha quindi: exp(A) = P exp(D)P −1 0 2 1 2 e 0 0 −1 1 −1 = 3 2 1 0 e−1 0 1 −2/3 4/3 1 −2/3 1/3 0 0 e2 0 1 −1 2 4 −2 + 1e + 2e2 2 − 3e − 43 e2 −2 + 3e + 23 e2 4 8 − 23 e2 −3 + 3e + 13 e2 . = −3 + 2e + e2 3 − 3e 4 1 2 2 2 1 2 2 −e − 3e + 3 e − 3e e 3e Svolgimento esercizio 6. Sia λ ∈ C un autovalore di A (ricordiamo che il corpo complesso C è algebricamente chiuso, quindi ogni matrice quadrata A ammette tutti i suoi autovalori in C) e sia v un autovettore corrispondente. Si ha dunque Av = λv e, di conseguenza, A2 v = A(Av) = A(λv) = λAv = λ2 v. Ciò significa che, se λ è un autovalore di A, allora λ2 è un autovalore di A2 . Analogamente si dimostra che A3 v = λ3 v e, in generale, che An v = λn v per ogni intero n ≥ 2. In altre parole, se λ è un autovalore di A, allora λn è un autovalore di An . Supponendo ora che An = 0, si deduce che λn = 0, e quindi λ = 0, per ogni autovalore λ di A, cioè che tutti gli autovalori di A sono nulli. 3.2. Forma Canonica di Jordan Svolgimento esercizio 7. Determiniamo gli autovalori di A: λ − 3 −4 −4 λ+6 8 det(λI − A) = det 3 −3 −7 λ − 9 3 3 λ + 6 λ + 6 8 8 + 4 = (λ − 3) −3 λ − 9 − 4 −3 −7 −7 λ − 9 = λ3 − 6λ2 + 11λ − 6 = 0, le cui soluzioni sono λ1 = 1, λ2 = 2 e λ3 = 3. La matrice A ha quindi 3 autovalori distinti e, di conseguenza, la sua forma canonica di Jordan è 1 0 0 J = 0 2 0 . 0 0 3 Una base di R3 rispetto alla quale la matrice di φ è J è costituita dagli autovettori relativi agli autovalori 1, 2 e 3 di A. 3. Soluzioni 85 Determiniamo ora gli autovettori relativi all’autovalore λ1 = 1; essi sono le soluzioni del sistema x1 (A − λ1 I) x2 = 0. x3 Sviluppando i calcoli si ottiene il sistema 2x1 + 4x2 + 4x3 = 0 − 3x1 − 7x2 − 8x3 = 0 3x + 7x + 8x = 0 1 2 3 le cui soluzioni sono date da x1 = 2x3 e x2 = −2x3 . Un autovettore relativo all’autovalore λ1 = 1 è, ad esempio, il vettore v1 = (2, −2, 1). Questo sarà il primo vettore di una base di Jordan. Per l’autovalore λ2 = 2 si ottiene il sistema x1 (A − λ2 I) x2 = 0, x3 che fornisce x1 + 4x2 + 4x3 = 0 − 3x1 − 8x2 − 8x3 = 0 3x + 7x + 7x = 0 1 2 3 le cui soluzioni sono x1 = 0 e x2 = −x3 . Un autovettore relativo all’autovalore λ2 = 2 è, ad esempio, il vettore v2 = (0, −1, 1). Questo sarà il secondo vettore di una base di Jordan. Finalmente, per l’autovalore λ3 = 3 si ottiene il sistema x1 (A − λ3 I) x2 = 0, x3 che fornisce 4x2 + 4x3 = 0 − 3x1 − 9x2 − 8x3 = 0 3x + 7x + 6x = 0 1 2 3 le cui soluzioni sono x1 = 31 x3 e x2 = −x3 . Un autovettore relativo all’autovalore λ3 = 3 è, ad esempio, il vettore v3 = (1, −3, 3). Questo sarà il terzo vettore di una base di Jordan. Se indichiamo con S la matrice le cui colonne sono costituite dalle componenti dei vettori della base di Jordan trovata, 2 0 1 S = −2 −1 −3 , 1 1 3 86 5. Autovalori e Autovettori si ha dunque AS = SJ, da cui si deduce che A = SJS −1 (come esercizio, si può verificare questa uguaglianza con un calcolo diretto). Svolgimento esercizio 8. Determiniamo gli autovalori di A: λ+1 0 0 0 0 λ−1 0 0 det(λI − A) = det −1 3 λ+1 1 0 2 0 λ−1 λ + 1 0 0 λ−1 0 = (λ + 1) 0 0 2 λ − 1 = (λ + 1)2 (λ − 1)2 . Gli autovalori di A sono quindi λ1 = −1, con molteplicità 2, e λ2 = 1, anch’esso con molteplicità 2. Determiniamo ora gli autovettori relativi all’autovalore λ1 = −1; essi sono le soluzioni del sistema x1 x2 (A − λ1 I) x3 = 0. x4 Sviluppando i calcoli si ottiene il sistema 2x2 = 0 x1 − 3x2 − x4 = 0 − 2x + 2x = 0 2 4 le cui soluzioni sono date da x1 = x2 = x4 = 0 e x3 qualunque. L’insieme delle soluzioni costituisce quindi un sottospazio vettoriale di dimensione 1, che è precisamente l’autospazio relativo all’autovalore λ1 = −1. Una sua base è data, ad esempio, dal vettore v1 = e3 = (0, 0, 1, 0). Questo sarà il primo vettore di una base di Jordan. Si può ora dedurre che nella forma canonica di Jordan di A comparirà un blocco di Jordan della forma −1 1 , 0 −1 perché l’autovalore −1 ha molteplicità 2, però c’è un solo autovettore linearmente indipendente relativo a tale autovalore. Di conseguenza, come secondo vettore v2 di una base di Jordan, dovremo prendere un vettore che soddisfi la condizione seguente: Av2 = −v2 + v1 , ossia (A + 1I)v2 = v1 . 3. Soluzioni 87 Si ottiene cosı̀ un sistema di equazioni lineari che è uguale al sistema precedente in cui abbiamo sostituito la colonna di zeri a destra dell’uguale con la colonna delle componenti del vettore v1 . Sviluppando i calcoli si ottiene il sistema 2x2 = 0 x1 − 3x2 − x4 = 1 − 2x + 2x = 0 2 4 le cui soluzioni sono date da x1 = 1, x2 = x4 = 0 e x3 qualunque. Possiamo quindi prendere come secondo vettore di una base di Jordan il vettore v2 = (1, 0, 0, 0). Passiamo ora a considerare l’autovalore λ2 = 1. Gli autovettori corrispondenti si trovano risolvendo il sistema x1 x 2 (A − λ2 I) x3 = 0. x4 Sviluppando i calcoli si ottiene il sistema − 2x1 = 0 x1 − 3x2 − 2x3 − x4 = 0 − 2x = 0 2 le cui soluzioni sono date da x1 = x2 = 0 e x4 = −2x3 . L’insieme delle soluzioni costituisce quindi un sottospazio vettoriale di dimensione 1, che è precisamente l’autospazio relativo all’autovalore λ2 = 1. Una sua base è data, ad esempio, dal vettore v3 = (0, 0, 1, −2). Questo sarà il terzo vettore di una base di Jordan. Si può ora dedurre che nella forma canonica di Jordan di A comparirà un blocco di Jordan della forma 1 1 , 0 1 perché l’autovalore 1 ha molteplicità 2, ma c’è un solo autovettore linearmente indipendente relativo a tale autovalore. Di conseguenza, come quarto vettore v4 di una base di Jordan, dovremo prendere un vettore che soddisfi l’equazione seguente: Av4 = v4 + v3 , ossia (A − 1I)v4 = v3 . Si ottiene cosı̀ un sistema di equazioni lineari che è uguale al sistema precedente in cui abbiamo sostituito la colonna di zeri a destra dell’uguale con la colonna delle componenti del vettore v3 . 88 5. Autovalori e Autovettori Sviluppando i calcoli si ottiene il sistema − 2x1 = 0 x1 − 3x2 − 2x3 − x4 = 1 − 2x = −2 2 le cui soluzioni sono date da x1 = 0, x2 = 1 e x4 = −2x3 − 4. Possiamo quindi prendere come quarto vettore di una base di Jordan il vettore v4 = (0, 1, 0, −4). Si conclude pertanto che i vettori v1 , v2 , v3 e v4 costituiscono una base di Jordan, rispetto alla quale l’endomorfismo φ ha matrice di Jordan −1 1 0 0 0 −1 0 0 . J = 0 0 1 1 0 0 0 1 Se indichiamo con S la matrice le cui colonne sono costituite dalle componenti dei vettori della base di Jordan trovata, 0 1 0 0 0 0 0 1 , S= 1 0 1 0 0 0 −2 −4 si ha dunque AS = SJ, da cui si deduce che A = SJS −1 (come esercizio, si può verificare questa uguaglianza con un calcolo diretto). Svolgimento esercizio 9. Determiniamo gli autovalori di A: λ−2 0 0 0 4 λ−2 4 3 det(λI − A) = det −4 0 λ − 5 −3 3 0 2 λ λ − 5 −3 = (λ − 2)2 2 λ = (λ − 2)2 (λ2 − 5λ + 6) = (λ − 2)3 (λ − 3). Gli autovalori di A sono quindi λ1 = 2, con molteplicità 3, e λ2 = 3, con molteplicità 1. Determiniamo ora gli autovettori relativi all’autovalore λ1 = 2; essi sono le soluzioni del sistema x1 x 2 (A − λ1 I) x3 = 0. x4 3. Soluzioni 89 Sviluppando i calcoli si ottiene il sistema − 4x1 − 4x3 − 3x4 = 0 4x1 + 3x3 + 3x4 = 0 − 3x − 2x − 2x = 0 1 3 4 le cui soluzioni sono date da x1 = x3 = x4 = 0 e x2 qualunque. L’insieme delle soluzioni costituisce quindi un sottospazio vettoriale di dimensione 1, che è precisamente l’autospazio relativo all’autovalore λ1 = 2. Una sua base è data, ad esempio, dal vettore v1 = e2 = (0, 1, 0, 0). Questo sarà il primo vettore di una base di Jordan. Si può ora dedurre che nella forma canonica di Jordan di A comparirà un blocco di Jordan della forma 2 1 0 0 2 1 , 0 0 2 perché l’autovalore 2 ha molteplicità 3, però c’è un solo autovettore linearmente indipendente relativo a tale autovalore. Di conseguenza, come secondo vettore v2 di una base di Jordan, dovremo prendere un vettore che soddisfi la condizione seguente: Av2 = 2v2 + v1 , ossia (A − 2I)v2 = v1 . Si ottiene cosı̀ un sistema di equazioni lineari che è uguale al sistema precedente in cui abbiamo sostituito la colonna di zeri a destra dell’uguale con la colonna delle componenti del vettore v1 . Le soluzioni di tale sistema sono date da x1 = 0, x3 = −1, x4 = 1 e x2 qualunque. Possiamo quindi prendere come secondo vettore di una base di Jordan il vettore v2 = (0, 0, −1, 1). Analogamente, come terzo vettore v3 di una base di Jordan, dovremo prendere un vettore che soddisfi la condizione seguente: Av3 = 2v3 + v2 , ossia (A − 2I)v3 = v2 . Si ottiene cosı̀ un sistema di equazioni lineari che è uguale al sistema precedente in cui abbiamo sostituito la colonna dei termini noti con la colonna delle componenti del vettore v2 . Le soluzioni di tale sistema sono date da x1 = −1, x3 = 1, x4 = 0 e x2 qualunque. Possiamo quindi prendere come terzo vettore di una base di Jordan il vettore v3 = (−1, 0, 1, 0). 90 5. Autovalori e Autovettori Passiamo ora a considerare l’autovalore λ2 = 3. Gli autovettori corrispondenti si trovano risolvendo il sistema x1 x 2 (A − λ2 I) x3 = 0. x4 Sviluppando i calcoli si ottiene il sistema − x1 = 0 − 4x1 − x2 − 4x3 − 3x4 = 0 4x + 2x + 3x = 0 1 3 4 le cui soluzioni sono date da x1 = 0, x2 = −2x3 e x4 = − 32 x3 . L’insieme delle soluzioni costituisce quindi un sottospazio vettoriale di dimensione 1, che è precisamente l’autospazio relativo all’autovalore λ2 = 3. Una sua base è data, ad esempio, dal vettore v4 = (0, −6, 3, −2). Questo sarà il quarto vettore di una base di Jordan. Si conclude pertanto che i vettori v1 , v2 , v3 e v4 costituiscono una base di Jordan, rispetto alla quale l’endomorfismo φ ha matrice di Jordan 2 1 0 0 0 2 1 0 J = 0 0 2 0 . 0 0 0 3 Se indichiamo con S la matrice le cui colonne sono costituite dalle componenti dei vettori della base di Jordan trovata, 0 0 −1 0 1 0 0 −6 , S= 0 −1 1 3 0 1 0 −2 si ha dunque AS = SJ, da cui si deduce per esercizio, che 6 1 2 0 S −1 = −1 0 1 0 che A = SJS −1 . Si verifichi ora, 6 2 0 1 6 3 , 0 1 e si verifichi l’uguaglianza A = SJS −1 con un calcolo diretto. 3. Soluzioni 91 Svolgimento esercizio 10. Determiniamo gli autovalori di A: λ 0 −2 4 −1 λ − 2 1 −2 det(λI − A) = det 0 0 λ−2 0 −1 0 1 λ−4 λ −2 4 0 = (λ − 2) 0 λ − 2 −1 1 λ − 4 λ 4 = (λ − 2)2 −1 λ − 4 = (λ − 2)4 . Quindi A ha un unico autovalore λ = 2, con molteplicità 4. Determiniamo ora gli autovettori relativi all’autovalore λ = 2; essi sono le soluzioni del sistema x1 x 2 (A − λI) x3 = 0. x4 Sviluppando i calcoli si ottiene il sistema − 2x1 + 2x3 − 4x4 = 0 x1 − x3 + 2x4 = 0 x − x + 2x = 0 1 3 4 le cui soluzioni sono date da x1 = x3 −2x4 e x2 , x3 , x4 qualunque. L’insieme delle soluzioni costituisce quindi un sottospazio vettoriale di dimensione 3, che è precisamente l’autospazio relativo all’autovalore λ = 2. Una sua base è data, ad esempio, dai vettori v1 = (0, 1, 0, 0), v2 = (1, 0, 1, 0) e v3 = (−2, 0, 0, 1). Da quanto visto si deduce che la forma canonica di Jordan di A è (a meno di un riordinamento dei blocchi di Jordan) 2 1 0 0 0 2 0 0 J = 0 0 2 0 . 0 0 0 2 In questo caso non è più possibile applicare il metodo descritto nei due esercizi precedenti per determinare una base di Jordan. Infatti bisognerebbe ora determinare un autovettore generalizzato v4 relativo all’autovalore λ = 2, cioè v4 deve soddisfare l’equazione Av4 = 2v4 + v, 92 5. Autovalori e Autovettori dove v è un autovettore relativo all’autovalore λ = 2. Ora però esiste uno spazio di dimensione 3 di autovettori, quindi non si sa come scegliere il nostro v! (Si verifichi per esercizio che nessuno dei tre sistemi Av4 = 2v4 +v1 , Av4 = 2v4 + v2 e Av4 = 2v4 + v3 ha soluzioni. Non è quindi possibile trovare una base di Jordan utilizzando i tre vettori v1 , v2 e v3 determinati in precedenza; il che è abbastanza naturale, visto che i vettori v1 , v2 e v3 sono stati presi a caso dentro uno spazio di dimensione 3). Utilizziamo quindi un altro procedimento. Indichiamo con w1 e w2 i primi due vettori della base di Jordan (che vogliamo determinare). Osservando la matrice di Jordan J scritta in precedenza, si deduce che w1 è un autovettore relativo all’autovalore λ = 2, cioè si deve avere (A − 2I)w1 = 0, mentre w2 è un autovettore generalizzato relativo all’autovalore λ = 2, cioè si deve avere (A − 2I)w2 = w1 . Moltiplicando quest’ultima equazione a sinistra per A − 2, si ottiene (A − 2I)2 w2 = (A − 2I)w1 = 0, quindi w2 è un vettore che appartiene al nucleo di (φ − 2 id)2 (cioè (A − 2I)2 w2 = 0) ma non appartiene al nucleo di φ − 2 id (cioè (A − 2I)w2 6= 0). Per determinare w2 prendiamo quindi un qualunque vettore tale che (A − 2I)2 w2 = 0 e (A − 2I)w2 6= 0. Dato che il nucleo di A − 2I lo abbiamo determinato in precedenza, e visto che (A − 2I)2 = 0 (come si vede osservando la matrice di Jordan J, o come si verifica con un calcolo diretto), è facile trovare un vettore w2 che soddisfi le condizioni richieste: ad esempio il vettore w2 = (2, 1, 1, 1). Conoscendo w2 si determina immediatamente w1 ; basta ricordare che (A − 2I)w2 = w1 . Si ha quindi w1 = (A − 2I)w2 = (−6, 3, 0, 3). Questi sono i primi due vettori di una base di Jordan. I due vettori rimanenti, w3 e w4 , devono ora soddisfare le due condizioni seguenti: devono essere due autovettori relativi all’autovalore λ = 2 e devono essere tali che {w1 , w2 , w3 , w4 } sia una base di R4 . Si verifica immediatamente che i vettori w3 = (1, 0, 1, 0) e w4 = (0, 1, 0, 0) soddisfano le condizioni richieste. In conclusione: i vettori w1 , w2 , w3 e w4 costituiscono, nell’ordine, una base di Jordan, rispetto alla quale l’endomorfismo φ ha matrice di Jordan 2 1 0 0 0 2 0 0 J = 0 0 2 0 . 0 0 0 2 3. Soluzioni 93 Se indichiamo con S la matrice le cui colonne sono costituite dalle componenti dei vettori della base di Jordan trovata, −6 2 1 0 3 1 0 1 S= 0 1 1 0 , 3 1 0 0 si ha dunque AS = SJ, da cui si deduce che A = SJS −1 . Si verifichi ora, per esercizio, che 1 1 − 9 0 19 9 1 0 −1 2 3 3 3 S −1 = − 1 0 4 − 2 , 3 3 3 0 1 0 −1 e si verifichi l’uguaglianza A = SJS −1 con un calcolo diretto. Svolgimento esercizio 11. Lavoriamo nel corpo complesso C. In questo modo esiste una forma canonica di Jordan J per la matrice A, e si ha A = SJS −1 , per una qualche matrice invertibile S (a coefficienti complessi). Da ciò segue che A2 = SJS −1 SJS −1 = SJ 2 S −1 , e dunque l’uguaglianza A2 = A equivale a J 2 = J. Ricordando la forma della matrice di Jordan J, si vede subito che J 2 = J è possibile se e solo se J è diagonale (e quindi A è diagonalizzabile) e, in tal caso, per ogni autovalore λ di A si deve avere λ2 = λ, da cui segue che λ = 0 oppure λ = 1. In conclusione, la matrice A è simile alla matrice Ir 0 J= , 0 0n−r ove Ir indica la matrice identità di ordine r e 0n−r è la matrice nulla di ordine n − r. Si noti a questo punto che l’intero r coincide con il rango di A, pertanto, se B è un’altra matrice con le stesse proprietà di A, essa sarà simile a J (e quindi ad A) se e solo se il suo rango coincide con r. Svolgimento esercizio 12. La matrice A è antisimmetrica, cioè si ha AT = −A. Da ciò segue che la matrice A2 è simmetrica: (A2 )T = (AT )2 = (−A)2 = A2 . Ricordiamo che ogni matrice simmetrica a coefficienti reali è diagonalizzabile e tutti i suoi autovalori sono reali. Pertanto tutti gli autovalori di A2 sono reali. Dimostriamo ora che sono tutti negativi. Sia v ∈ Rn un vettore non nullo; si ha allora v T (A2 )v = (v T A)(Av) = (−v T AT )(Av) = −(Av)T (Av) = −w · w < 0, ove si è posto w = Av e si è usato il fatto che il prodotto scalare in Rn è definito positivo (si noti che w 6= 0 perché A è supposta non-degenere). 94 5. Autovalori e Autovettori Questo significa che la matrice A2 è definita negativa, e quindi tutti i suoi autovalori sono strettamente negativi. Di conseguenza, gli autovalori di A, essendo le radici quadrate degli autovalori di A2 , sono puramente immaginari. Proponiamo anche un’altra dimostrazione. Sia λ ∈ C un autovalore di A, e sia v ∈ Cn un autovettore corrispondente; si ha quindi Av = λv. Coniugando ambo i membri di questa uguaglianza, e ricordando che A è una matrice a coefficienti reali, cioè Ā = A, si ottiene Av̄ = λ̄v̄. Moltiplichiamo ora a sinistra ambo i membri per v T , ottenendo v T Av̄ = λ̄v T v̄, quindi trasponiamo ambo i membri di quest’ultima uguaglianza: (v T Av̄)T = v̄ T AT v = (λ̄v T v̄)T = λ̄v̄ T v. Ricordiamo ora che A è antisimmetrica, cioè AT = −A. Dall’uguaglianza precedente si ottiene quindi −v̄ T Av = λ̄v̄ T v, da cui discende, ricordando che Av = λv, −λv̄ T v = λ̄v̄ T v. In conclusione si ha quindi λ̄ = −λ e, dato che λ 6= 0 perché A è non-degenere, questo significa che l’autovalore λ è puramente immaginario. 3.3. Polinomio Minimo e Polinomio Caratteristico Svolgimento esercizio 13. Premettiamo la λ 1 0 ··· 0 λ 1 · · · . . J = 0 0 . . . . . . . .. .. .. · · · 0 0 0 ··· seguente osservazione. Sia 0 0 0 .. . λ un blocco di Jordan di ordine r, relativo ad un autovalore λ. Si verifica immediatamente che in queste condizioni si ha: dim Ker(J − λI) = 1, dim Ker(J −λI)2 = 2, dim Ker(J −λI)3 = 3, etc., fino a dim Ker(J −λI)r = r. Ritorniamo ora al problema in questione. La condizione dim Ker(φ − 2 id) = 1 equivale a dire che 2 è un autovalore di φ e che l’autospazio ad esso relativo ha dimensione 1, cioè esiste un solo autovettore linearmente indipendente relativo all’autovalore 2. Nella matrice di Jordan di φ comparirà quindi un blocco di Jordan relativo all’autovalore 2, di cui non conosciamo la dimensione, dato che non conosciamo la molteplicità dell’autovalore 2. Tuttavia, ricordando l’osservazione iniziale, si deduce dalla condizione dim Ker(φ − 2 id)3 = 3 che il blocco di Jordan relativo all’autovalore 2 deve avere almeno ordine 3. In modo analogo, la condizione dim Ker(φ−3 id) = 2 significa che ci sono due autovettori linearmente indipendenti relativi all’autovalore 3, e quindi ci sono due blocchi di Jordan relativi all’autovalore 3. Di questi blocchi 3. Soluzioni 95 non conosciamo la dimensione, dato che non conosciamo la molteplicità dell’autovalore 3, tuttavia, con un attimo di riflessione, ci si convince che la condizione dim Ker(φ − 3 id)2 = 4 asserisce che questi blocchi di Jordan devono avere entrambi ordine maggiore o uguale a 2. Per terminare, la condizione dim Im(φ2 ) = 7 equivale a dim Ker(φ2 ) = dim V − dim Im(φ2 ) = 2, che afferma quindi che 0 è un autovettore di φ la cui molteplicità è almeno 2. Si noti però che in questo caso non conosciamo dim Ker(φ), cioè il numero di autovettori linearmente indipendenti relativi all’autovalore 0. Dalle informazioni sulle dimensioni dei blocchi di Jordan ottenute in precedenza, e ricordando che dim V = 9, si deduce che il blocco di Jordan relativo all’autovalore 2 ha esattamente ordine 3, che i due blocchi di Jordan relativi all’autovalore 3 hanno entrambi esattamente ordine 2 e che la molteplicità dell’autovalore 0 è esattamente 2 (e inoltre che non ci sono altri autovalori). Rimangono dunque solo due possibilità, che corrispondono rispettivamente a dim Ker(φ) = 1 e dim Ker(φ) = 2, cioè all’esistenza di due blocchi di Jordan di ordine 1 oppure di un solo blocco di Jordan di ordine 2, relativi all’autovalore 0. Riunendo tutte queste informazioni, si deduce che ci sono solo due matrici di Jordan possibili per l’endomorfismo φ. Esse sono 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 1 0 0 0 0 0 0 0 0 2 1 0 0 0 0 J 1 = 0 0 0 0 2 0 0 0 0 0 0 0 0 0 3 1 0 0 0 0 0 0 0 0 3 0 0 0 0 0 0 0 0 0 3 1 0 0 0 0 0 0 0 0 3 e 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 1 0 0 0 0 0 0 0 0 2 1 0 0 0 0 J 2 = 0 0 0 0 2 0 0 0 0 . 0 0 0 0 0 3 1 0 0 0 0 0 0 0 0 3 0 0 0 0 0 0 0 0 0 3 1 0 0 0 0 0 0 0 0 3 Dato che la forma canonica di Jordan di una matrice è unica, a meno di una permutazione dei singoli blocchi di Jordan, si deduce che ci sono (essenzialmente) solo due endomorfismi φ di V soddisfacenti alle condizioni richieste. 96 5. Autovalori e Autovettori Svolgimento esercizio 14. Il polinomio minimo di φ si fattorizza come segue: x4 − 6x3 + 9x2 = x2 (x − 3)2 . Se ne deduce che gli unici autovalori di φ sono 0 e 3, ed entrambi hanno molteplicità almeno 2 (la molteplicità di un autovalore è l’ordine con cui questo annulla il polinomio caratteristico, e si ricordi che il polinomio minimo divide il polinomio caratteristico). Ricordando poi che il polinomio minimo di un blocco di Jordan di ordine r del tipo λ 1 0 ··· 0 0 λ 1 · · · 0 . . Jr = 0 0 . . . . 0 . . . .. .. .. · · · ... 0 0 0 ··· λ è precisamente (x−λ)r , si deduce che la matrice di Jordan dell’endomorfismo φ deve essere del tipo 0 1 0 0 0 0 0 0 0 0 0 0 0 0 a b 0 0 J = , 0 0 0 c 0 0 0 0 0 0 3 1 0 0 0 0 0 3 a b dove la matrice A = può essere una qualunque delle seguenti: J0 = 0 c 0 0 0 1 3 0 3 1 0 0 , J1 = , J2 = , J3 = , J4 = . 0 0 0 0 0 3 0 3 0 3 Si vede ora immediatamente che se A = J0 il rango di J è 3, se A = J1 oppure A = J4 il rango di J è 4, mentre per A = J2 oppure A = J3 si ha rango(J) = 5. Abbiamo cosı̀ determinato tutti gli endomorfismi (più precisamente, le loro forme canoniche di Jordan) che soddisfano alle condizioni richieste. 3.4. Esercizi Vari Svolgimento esercizio 15. Poniamo vn = (xn+1 , xn ). Si ha v1 = (1, 1) e, da xn = x n−1 + xn−2 segue che, per ogni n > 1, si ha vn = Avn−1 , dove 1 1 A= . 1 0 Si ha dunque: v2 = Av1 , v3 = Av2 = A2 v1 , v4 = Av3 = A3 v1 e, in generale, vn = An−1 v1 . Quindi il calcolo dei numeri di Fibonacci si riduce al calcolo delle potenze di una matrice quadrata. 3. Soluzioni 97 Il polinomio caratteristico di A√è λ2 − λ − 1, quindi gli autovalori di A √ 1 1 sono λ1 = 2 (1 − 5) e λ2 = 2 (1 + 5). Gli autovettori corrispondenti sono √ √ rispettivamente w1 = ( 12 (1 − 5), 1) e w2 = ( 12 (1 + 5), 1). Si ha quindi A = SJS −1 , ove √ √ (1 − 5) 12 (1 + 5) S= 1 1 e √ 1 (1 − 5) 0 √ J= 2 . 1 0 (1 + 5) 2 Si calcola inoltre facilmente che √ 1 −1 12 (1 + 5) −1 √ S =√ . 1 5 1 − 2 (1 − 5) 1 2 Si ha quindi vn = An−1 v1 = (SJS −1 )n−1 v1 = SJ n−1 S −1 v1 = √ n+1 √ n+1 1 1 ((1 + 5) − (1 − n+1 2 √ n √ 5)n ) , =√ 1 ((1 + 5) − (1 − 5) ) 5 2n da cui si ottiene la seguente formula per l’ennesimo numero di Fibonacci: √ √ 1 xn = √ (1 + 5)n − (1 − 5)n . 2n 5 Si noti che, anche se non è evidente dalla formula trovata, questi numeri sono sicuramenti interi. Capitolo 6 Forme Bilineari 1. Richiami di teoria 1.1. Prodotto scalare in Rn Finora abbiamo visto come i vettori si possano sommare e moltiplicare per degli scalari. Non sappiamo però misurare la “lunghezza” di un vettore, né l’“angolo” tra due vettori. Per definire queste due quantità introduciamo la nozione di prodotto scalare di due vettori. Iniziamo dal caso dello spazio vettoriale Rn . Definizione 1.1. Il prodotto scalare di due vettori v = (x1 , . . . , xn ) e w = (y1 , . . . , yn ) di Rn è il numero reale v·w = n X xi yi . i=1 In dimensione 2 e 3 la definizione precedente stabilisce che (x1 , x2 ) · (y1 , y2 ) = x1 y1 + x2 y2 , e (x1 , x2 , x3 ) · (y1 , y2 , y3 ) = x1 y1 + x2 y2 + x3 y3 . In entrambi questi casi si può dimostrare che il prodotto scalare di due vettori v e w coincide con il prodotto delle lunghezze dei due vettori per il coseno dell’angolo compreso tra di essi, dove i concetti di lunghezza e angolo sono quelli usuali della geometria elementare del piano e dello spazio. In particolare si ha: v · v = kvk2 , ove si è indicato con kvk la lunghezza del vettore v, e v·w cos α = , kvk kwk dove α è l’angolo compreso tra i vettori v e w. Visto che è possibile dimostrare che queste uguaglianze valgono sia in dimensione 2 che 3, usiamole per dare un senso alle nozioni di lunghezza e angolo in spazi di dimensione n. 100 6. Forme Bilineari Definizione 1.2. Sia v = (x1 , . . . , xn ) ∈ Rn . La lunghezza di v, detta anche norma di v è data da: v u n uX √ x2 . kvk = v · v = t i i=1 Un vettore di norma unitaria è detto versore. Spesso si usa anche la notazione |v| al posto di kvk, in tal caso si preferisce usare il termine modulo di v al posto di norma di v. Definizione 1.3. Siano v = (x1 , . . . , xn ) e w = (y1 , . . . , yn ) ∈ Rn . L’angolo α tra i due vettori v e w è definito dalla seguente uguaglianza: v·w cos α = . kvk kwk Da questa definizione segue subito che Osservazione 1.4. Due vettori (non nulli) sono ortogonali se e solo se il loro prodotto scalare è 0. Ricordiamo ora le principali proprietà del prodotto scalare. Proposizione 1.5. Per ogni u, v, w ∈ Rn e ogni scalare λ ∈ R, si ha: (1) (u + v) · w = u · w + v · w, (2) u · (v + w) = u · v + u · w, (3) (λv) · w = v · (λw) = λv · w, (4) v · w = w · v, (5) v · v > 0 se v 6= 0. Le prime tre proprietà esprimono il fatto che il prodotto scalare è una applicazione bilineare definita su Rn × Rn a valori in R. La quarta proprietà dice che questa applicazione bilineare è simmetrica. La quinta esprime, per definizione, il fatto che questa applicazione bilineare simmetrica è definita positiva. 1.2. Forme bilineari Sia V uno spazio vettoriale sul campo C. Definizione 1.6. Una forma bilineare su V è una funzione φ:V ×V →C tale che (1) φ(u + v, w) = φ(u, w) + φ(v, w), (2) φ(u, v + w) = φ(u, v) + φ(u, w), (3) φ(λv, w) = φ(v, λw) = λφ(v, w), per ogni u, v, w ∈ V e ogni λ ∈ C. Definizione 1.7. Sia φ : V × V → C una forma bilineare. Essa è detta: (1) non-degenere se φ(v, w) = 0, per ogni w ∈ V , implica che v = 0, 1. Richiami di teoria 101 (2) simmetrica se φ(v, w) = φ(w, v), per ogni v e w in V , (3) antisimmetrica, o alternante, se φ(v, w) = −φ(w, v), per ogni v e w in V (almeno se il corpo C ha caratteristica diversa da 2). Nel seguito ci occuperemo solo delle forme bilineari non-degeneri. Inoltre dato che una forma bilineare φ si può sempre scrivere come φ(v, w) = φ(v, w) + φ(w, v) φ(v, w) − φ(w, v) + 2 2 e che φ(v, w) + φ(w, v) 2 è una forma bilineare simmetrica, mentre φs (v, w) = φ(v, w) − φ(w, v) 2 è una forma bilineare antisimmetrica, possiamo concludere che ogni forma bilineare è somma di una forma bilineare simmetrica e di una alternante. È quindi sufficiente studiare separatamente le forme bilineari simmetriche e quelle alternanti. Introduciamo ora i concetti di vettore isotropo e sottospazio isotropo. Sia V uno spazio vettoriale dotato di una forma bilineare φ. Definizione 1.8. Un vettore v ∈ V è detto isotropo se φ(v, v) = 0. Definizione 1.9. Un sottospazio U ⊂ V è detto isotropo se φ(u1 , u2 ) = 0, per ogni u1 , u1 ∈ U . Si noti che, se U è un sottospazio isotropo di V , allora tutti i vettori di U sono isotropi. È invece falso che un insieme di vettori isotropi di V sia un sottospazio isotropo di V ; in generale, infatti, non sarà neanche un sottospazio vettoriale di V . Sia oraP {v1 , . . . , vn } unaP base di V . Se due vettori v, w ∈ V si scrivono come v = ni=1 xi vi e w = nj=1 yj vj , usando la bilinearità di φ si ottiene: X X n n X φ(v, w) = φ xi vi , yj vj = xi yj φ(vi , vj ) φa (v, w) = i=1 = X j=1 i,j aij xi yj , i,j ove abbiamo posto aij = φ(vi , vj ). In corrispondenza ad una base di V si ottiene quindi una matrice quadrata A = (aij ) che contiene tutte le informazioni necessarie a ricostruire la forma bilineare φ. In termini della matrice A si ha: y1 φ(v, w) = (x1 , . . . , xn ) A ... = X T AY, yn 102 6. Forme Bilineari ove X e Y denotano i vettori colonna delle componenti di v e w rispetto alla base fissata di V . Proposizione 1.10. Sia φ una forma bilineare su V e A la sua matrice rispetto ad una (qualunque) base fissata di V . Allora: (1) φ è non-degenere se e solo se det A 6= 0, (2) φ è simmetrica se e solo se A = AT , (3) φ è antisimmetrica se e solo se A = −AT . Se {v10 , . . . , vn0 } è un’altra base di V e se A0 è la matrice di φ rispetto a questa nuova base allora, se indichiamo con P = (pij ) la matrice Pn di cam0 0 biamento di base, cioè se i vettori vi si scrivono come vi = h=1 phi vh , si ha: X n n X 0 0 0 aij = φ(vi , vj ) = φ phi vh , pkj vk h=1 = X phi pkj φ(vh , vk ) = h,k k=1 X ahk phi pkj . h,k In termini di matrici questa uguaglianza si scrive semplicemente A0 = P T AP. Questa è la relazione che lega tra loro due matrici che corrispondono alla stessa forma bilineare φ rispetto a due basi diverse. Definizione 1.11. Due matrici A e A0 tali che A0 = P T AP , per una qualche matrice invertibile P , si dicono congruenti. 1.3. Forme bilineari simmetriche Occupiamoci ora in particolare delle forme bilineari simmetriche. Sia dunque φ : V × V → C una forma bilineare, simmetrica, nondegenere. Imitando quanto visto in precedenza per il prodotto scalare usuale in Rn , diamo la seguente definizione: Definizione 1.12. Due vettori v, w ∈ V si dicono ortogonali se φ(v, w) = 0. Questa definizione si può estendere ai sottospazi vettoriali di V . Definizione 1.13. Due sottospazi vettoriali U1 e U2 di V si dicono ortogonali se φ(u1 , u2 ) = 0, per ogni u1 ∈ U1 e ogni u2 ∈ U2 . Definizione 1.14. Sia U un sottospazio vettoriale di V . Il sottospazio ortogonale di U , indicato con U ⊥ , è definito come segue: U ⊥ = {v ∈ V | φ(v, u) = 0, ∀u ∈ U }. Si verifica facilmente che U ⊥ è effettivamente un sottospazio vettoriale di V . Per quanto riguarda la classificazione degli spazi vettoriali dotati di una forma bilineare simmetrica non-degenere, il principale risultato è il seguente: 1. Richiami di teoria 103 Teorema 1.15. Lo spazio vettoriale V , dotato della forma bilineare simmetrica non-degenere φ, ammette basi ortogonali. Esiste cioè una base di V costituita da vettori a due a due ortogonali. Lo stesso risultato, espresso in termini di matrici, si traduce nel seguente teorema: Teorema 1.16. Ogni matrice quadrata A, simmetrica e non-degenere, è congruente a una matrice diagonale A0 . Esiste cioè una matrice invertibile P tale che P T AP sia diagonale. Imitando ancora le definizioni valide per il prodotto scalare usuale in Rn , vorremmo definire la norma di un vettore v ∈ V come segue: p kvk = φ(v, v), ma per fare ciò bisogna prima essere sicuri che, nel campo C, esistano le radici quadrate degli elementi del tipo φ(v, v). Se C è un campo algebricamente chiuso, come il campo complesso, non ci sono problemi. Se però C non è algebricamente chiuso, come è il caso del campo dei numeri reali, le radici quadrate degli elementi di C non esistono sempre. In tal caso bisognerà porre delle ipotesi ulteriori sulla forma bilineare φ. Sia quindi C il campo dei numeri reali R (oppure un campo ordinato). Diamo la seguente definizione: Definizione 1.17. Una forma bilineare simmetrica φ è detta: (1) definita positiva se φ(v, v) > 0, per ogni v ∈ V , con v 6= 0, (2) semidefinita positiva se φ(v, v) ≥ 0, per ogni v ∈ V , (3) definita negativa se φ(v, v) < 0, per ogni v ∈ V , con v 6= 0, (4) semidefinita negativa se φ(v, v) ≤ 0, per ogni v ∈ V , (5) indefinita se esistono due vettori v, w ∈ V tali che φ(v, v) > 0 e φ(w, w) < 0. Esiste un criterio molto semplice per stabilire se una forma bilineare simmetrica φ è definita positiva o negativa. Teorema 1.18. Sia A = (aij ) la matrice (quadrata di ordine n) di φ rispetto a una qualche base fissata di V . Indichiamo con ∆r , per r = 1, . . . , n, il determinante della sottomatrice costituita dalle prime r righe e colonne di A. Si ha quindi a11 · · · a1r . a11 a12 .. . , · · · , ∆r = .. ∆1 = a11 , ∆2 = . a21 a22 a · · · a r1 rr Allora φ (o equivalentemente A) è (1) definita positiva se ∆i > 0, per ogni i = 1, . . . , n. (2) definita negativa se ∆i < 0 per ogni i dispari, e ∆i > 0, per ogni i pari, per i = 1, . . . , n. Finalmente possiamo definire la norma di un vettore: 104 6. Forme Bilineari Definizione 1.19. Sia C il campo dei numeri reali R (oppure un campo ordinato in cui ogni elemento positivo è un quadrato). Sia V uno spazio vettoriale su C dotato di una forma bilineare φ simmetrica, non-degenere e definita positiva. Allora, per ogni v ∈ V , poniamo p kvk = φ(v, v). In questo caso è possibile dimostrare un risultato più forte del teorema che assicura l’esistenza di basi ortogonali. Più precisamente, si ha: Teorema 1.20. Sia C il campo dei numeri reali R (oppure un campo ordinato in cui ogni elemento positivo è un quadrato). Sia V uno spazio vettoriale su C dotato di una forma bilineare φ simmetrica, non-degenere e definita positiva. Allora lo spazio vettoriale V ammette basi ortonormali. Esiste cioè una base di V costituita da vettori di norma 1, a due a due ortogonali. Osservazione 1.21. Esiste un metodo standard per costruire una base ortonormale di V partendo da una base qualsiasi. Tale metodo è noto come il procedimento di Gram-Schmidt e verrà illustrato negli esercizi. Si dimostra poi che vale il seguente risultato: Proposizione 1.22. Nelle ipotesi precedenti si ha: |φ(v, w)| ≤ kvk kwk, per ogni v, w ∈ V . Da ciò deriva che si ha −1 ≤ φ(v, w) ≤ 1, kvk kwk e quindi è possibile dare la seguente definizione: Definizione 1.23. Nelle ipotesi precedenti si definisce l’angolo α compreso tra i due vettori v, w ∈ V ponendo cos α = φ(v, w) . kvk kwk Si vede cosı̀ che in uno spazio vettoriale reale, dotato di una forma bilineare φ simmetrica, non-degenere e definita positiva, è possibile definire la lunghezza di un vettore e l’angolo tra due vettori in modo analogo a quanto avviene nel caso di Rn dotato del prodotto scalare usuale. Definizione 1.24. Uno spazio vettoriale V , dotato di una forma bilineare φ simmetrica, non-degenere e definita positiva, è detto spazio euclideo (o anche spazio metrico, o spazio normato) Terminiamo ricordando un importante teorema che classifica gli spazi vettoriali reali dotati di una forma bilineare simmetrica, non necessariamente definita positiva: 1. Richiami di teoria 105 Teorema 1.25 (Teorema di Sylvester). Sia V uno spazio vettoriale reale, dotato di una forma bilineare φ simmetrica e non-degenere. Allora V ammette una base rispetto alla quale la matrice di φ è diagonale e gli elementi sulla diagonale sono +1 oppure −1. Il numero di elementi positivi o negativi sulla diagonale dipende solo da φ e non dalla base scelta. La differenza tra il numero di elementi positivi e il numero di elementi negativi è detto la segnatura, o l’indice d’inerzia, di φ. Per quanto riguarda le applicazioni lineari tra due spazi euclidei, diamo la seguente definizione: Definizione 1.26. Siano (V, φ) e (W, ψ) due spazi vettoriali euclidei. Una applicazione lineare f : V → W è detta isometria se essa è biiettiva e inoltre φ(v1 , v2 ) = ψ(f (v1 ), f (v2 )), per ogni v1 , v2 ∈ V . Una isometria tra due spazi euclidei è dunque un isomorfismo di spazi vettoriali che in più rispetta le strutture metriche presenti sugli spazi in questione. Si dimostra allora facilmente il seguente risultato: Proposizione 1.27. Sia f : V → W una isometria. Allora si ha: (1) kf (v)k = kvk, per ogni v ∈ V , (2) L’angolo compreso tra i vettori f (v1 ) e f (v2 ) è uguale all’angolo compreso tra i vettori v1 e v2 , per ogni v1 , v2 ∈ V . 1.4. Forme bilineari alternanti Sulle forme bilineari alternanti non c’è molto da dire. Sia V uno spazio vettoriale sul campo C (di caratteristica diversa da 2) dotato di una applicazione bilineare alternante non-degenere φ. Il risultato principale è il seguente: Teorema 1.28. Lo spazio vettoriale V ha dimensione pari, dim V = 2n. Inoltre esiste una base di V rispetto alla quale la matrice di φ è una matrice a blocchi del tipo H 0 ··· 0 0 H ··· 0 . . . .. .. . . ... 0 0 ··· H ove H= 0 1 . −1 0 Definizione 1.29. Uno spazio vettoriale V , dotato di una forma bilineare alternante non-degenere φ è detto spazio simplettico. 106 6. Forme Bilineari 1.5. Prodotto vettoriale in R3 Nel caso particolare dello spazio vettoriale R3 si può definire un prodotto fra vettori il cui risultato sia ancora un vettore. La definizione di questo prodotto può essere data come segue: Definizione 1.30. Siano v e w due vettori in R3 . Il prodotto vettoriale di v e w è il vettore, indicato con v ∧ w la cui norma è data dal prodotto delle norme di v e w per il seno dell’angolo α compreso tra di essi, la cui direzione è la retta perpendicolare al piano generato da v e w e il cui verso è indicato dal dito medio della mano destra, quando pollice e indice sono orientati come i vettori v e w rispettivamente. Questa è la definizione usata, ad esempio, dai fisici. Una definizione matematicamente più precisa è la seguente: Definizione 1.31. Siano v = (x1 , x2 , x3 ) e w = (y1 , y2 , y3 ) due vettori in R3 . Il prodotto vettoriale di v e w è il seguente vettore: v ∧ w = (x2 y3 − x3 y2 , x3 y1 − x1 y3 , x1 y2 − x2 y1 ). Si può dimostrare che le due definizioni coincidono. Elenchiamo ora alcune proprietà del prodotto vettoriale. Proposizione 1.32. Per ogni u, v, w ∈ R3 e per ogni λ ∈ R si ha: (1) (2) (3) (4) u ∧ (v + w) = u ∧ v + u ∧ w, (u + v) ∧ w = u ∧ w + v ∧ w, (λv) ∧ w = v ∧ (λw) = λ(v ∧ w), v ∧ w = −w ∧ v. Notiamo poi che, se v e w sono due vettori diversi da zero, si ha v ∧w = 0 se e solo se v e w sono paralleli, cioè sono uno multiplo dell’altro. La norma del prodotto vettoriale di due vettori ha poi una importante interpretazione geometrica: kv ∧ wk è l’area del parallelogramma di lati v e w. Se consideriamo tre vettori di R3 possiamo fare il prodotto scalare di uno di essi per il risultato del prodotto vettoriale degli altri due. Definizione 1.33. Il prodotto misto dei vettori u, v e w è dato da: u · (v ∧ w). Sviluppando i calcoli si dimostra facilmente il seguente risultato: Proposizione 1.34. Se u = (x1 , x2 , x3 ), v sono tre vettori di R3 , si ha: x1 u · (v ∧ w) = det y1 z1 = (y1 , y2 , y3 ) e w = (z1 , z2 , z3 ) x2 x3 y2 y3 . z2 z3 2. Esercizi 107 Anche il prodotto misto di tre vettori ha una importante interpretazione geometrica: il valore assoluto di u · (v ∧ w) rappresenta infatti il volume del parallelepipedo i cui lati sono i tre vettori u, v e w. 2. Esercizi Gli esercizi sul prodotto scalare usuale in Rn e sul prodotto vettoriale in R3 verranno svolti nel capitolo dedicato agli spazi affini. Qui di seguito riportiamo alcuni esercizi sulle forme bilineari in generale. 2.1. Forme Bilineari Simmetriche Esercizio 1. Sia V uno spazio vettoriale sul corpo complesso C con base {v1 , v2 , v3 } e sia g la forma bilineare simmetrica di matrice, rispetto alla base data, 2 3 −1 G = 3 4 0 . −1 0 1 Si determini una matrice invertibile P tale che P T GP = I. Esercizio 2. Sia V uno spazio vettoriale sul corpo dei numeri reali, con base {v1 , v2 , v3 }, e sia g la forma bilineare simmetrica di matrice, rispetto alla base data, 0 2 1 G = 2 3 −1 . 1 −1 2 Si determini una base di V rispetto alla quale la matrice di g sia diagonale, con soli elementi 1 e −1 sulla diagonale. Esercizio 3. Sia V uno spazio vettoriale sul corpo dei numeri reali, con base {v1 , v2 , v3 }, e sia g la forma bilineare simmetrica di matrice, rispetto alla base data, 0 2 −1 G = 2 0 3 . −1 3 0 Si determini una base di V rispetto alla quale la matrice di g sia diagonale, con soli elementi 1 e −1 sulla diagonale. Esercizio 4. Sia V uno spazio vettoriale reale di dimensione 3, e sia {v1 , v2 , v3 } una sua base. Si consideri la forma bilineare simmetrica g di matrice −3 1 0 2 −1 , G= 1 0 −1 −1 108 6. Forme Bilineari rispetto alla base data. (1) Si verifichi che g è non-degenere e si determini una base ortogonale di V relativamente a g. (2) Si calcoli l’indice d’inerzia i(g). (3) Si dica se esistono vettori isotropi non nulli relativamente a g e, in caso affermativo, si determini un sottospazio isotropo di dimensione massima. Esercizio 5. Sia V = R4 e sia g la forma bilineare simmetrica di matrice 3 −2 1 1 −2 1 −1 −1 , G= 1 −1 1 4 1 −1 4 2 rispetto alla base canonica. (1) Si verifichi che g è non-degenere, se ne calcoli l’indice d’inerzia e si determini una base ortogonale di V relativamente a g. (2) (R4 , g) è isometrico allo spazio R4 dotato del prodotto scalare usuale? E allo spazio di Minkowski? Esercizio 6. Sullo spazio vettoriale R4 si consideri la forma bilineare simmetrica g di matrice 0 2 −2 0 2 0 1 −3 G= −2 1 0 −1 0 −3 −1 0 rispetto alla base canonica. (1) Si determini l’indice d’inerzia di g. (2) Si determini, se esiste, una base di R4 rispetto a cui g ha matrice 1 0 0 0 0 1 0 0 0 0 0 1 . 0 0 1 0 (3) Si determini, se esiste, una base di R4 rispetto a cui g ha matrice 0 1 0 0 1 0 0 0 0 0 0 1 . 0 0 1 0 2. Esercizi (4) Si determini, se esiste, una 0 1 1 0 0 0 0 0 109 base di R4 rispetto a cui g ha matrice 0 0 0 0 . −1 0 0 −1 2.2. Forme Bilineari Alternanti Esercizio 7. Sia V uno spazio vettoriale reale e sia {v1 , . . . , v4 } una sua base. Sia g : V × V → R l’applicazione bilineare alternante di matrice 0 3 4 −1 −3 0 5 2 G= −4 −5 0 −6 , 1 −2 6 0 rispetto alla base data. Si determini una base {w1 , . . . , w4 } di V tale che la matrice di g rispetto a questa nuova base sia 0 1 0 0 −1 0 0 0 G0 = 0 0 0 1 . 0 0 −1 0 2.3. Isometrie Esercizio 8. Sia V uno spazio vettoriale reale di dimensione finita e sia g : V × V → R una forma bilineare simmetrica definita positiva. Se φ : V → V è una isometria, si dimostri che si ha Im(φ − id) = Ker(φ − id)⊥ . 2.4. Altri esercizi Esercizio 9. Si consideri C come spazio vettoriale su R e si ponga su di esso l’applicazione bilineare g : C × C → R definita da g(z1 , z2 ) = 2<(z1 z2 ), ove <(z) indica la parte reale del numero complesso z. (1) Si dimostri che g è bilineare e non-degenere. (2) Si determini la matrice di g rispetto alla base {1, i} di C. (3) Siano z1 , z2 ∈ C, linearmente indipendenti su R (cioè z1 e z2 sono una base di C, visto come R-spazio vettoriale). Si determini la 110 6. Forme Bilineari matrice G di g rispetto alla base {z1 , z2 } e si dimostri che 2 z1 z2 det G = det , z̄1 z̄2 ove z̄ indica il numero complesso coniugato di z ∈ C. Esercizio 10. Sia A una matrice simmetrica ad elementi in R. È vero o falso che la matrice I + A2 è invertibile? (I indica la matrice identità). 3. Soluzioni 3.1. Forme Bilineari Simmetriche Svolgimento esercizio 1. Dato che P T GP è la matrice della forma bilineare g rispetto ad una nuova base {v10 , v20 , v30 }, ottenuta dalla base {v1 , v2 , v3 } per mezzo della matrice di cambiamento di base P , cioè (v10 , v20 , v30 ) = (v1 , v2 , v3 )P, il problema si riduce alla determinazione di una base {v10 , v20 , v30 } rispetto alla quale la matrice di g sia l’identità, ossia alla determinazione di una base ortonormale. Utilizziamo a tal fine il√ procedimento di Gram-Schmidt. 0 Dato che g(v1 , v1 ) = 2, poniamo v1 = v1 / 2. Si ha cosı̀ g(v10 , v10 ) = 1. Un vettore v200 ortogonale a v10 si trova nel modo seguente: si ponga v200 = av10 +v2 e si richieda che g(v10 , v200 ) = 0. Si ottiene in questo modo a = −g(v10 , v2 ) e dunque si ha: v200 = v2 − g(v10 , v2 )v10 √ √ = v2 − g(v1 / 2, v2 )v1 / 2 3 = v2 − v1 . 2 00 00 A questo punto bisogna normalizzare questo vettore. Si calcola g(vq 2 , v2 ) = g(v2 − 32 v1 , v2 − 23 v1 ) = − 12 , e si pone di conseguenza v20 = v200 / − 12 = √ √ √ −i 2v200 = 32 i 2v1 − i 2v2 . Rimane solo da determinare un vettore w300 ortogonale a w10 e w20 . Ripetendo il ragionamento fatto in precedenza si scopre che si ha v300 = v3 − g(v10 , v3 )v10 − g(v20 , v3 )v20 √ √ √ √ 3 √ 3 √ = v3 − g(v1 / 2, v3 )v1 / 2 − g( i 2v1 − i 2v2 , v3 )( i 2v1 − i 2v2 ) 2 2 = v3 − 4v1 + 3v2 . 00 Anche quest’ultimo vettore deve essere normalizzato. Si ha g(v300 , v√ 3) = 0 00 g(v3 − 4v1 + 3v2 , v3 − 4v1 + 3v2 ) = 5, e si pone di conseguenza v3 = v3 / 5 = − √45 v1 + √35 v2 + √15 v3 . 3. Soluzioni 111 Si trova allora che la matrice di cambiamento di base è 1 3 √ √4 √ 2 − i 2 √ 5 2 P = 0 −i 2 √35 . √1 0 0 5 Si verifichi che si ha effettivamente P T GP = I. Svolgimento esercizio 2. Utilizziamo il procedimento di Gram-Schmidt. Dato però che il vettore v1 è isotropo, non possiamo prendere come primo vettore v10 della nuova base un suo multiplo. Per ovviare a questo inconveniente è sufficiente scambiare tra loro i vettori v1 e v2 della base data ed applicare il procedimento di Gram-Schmidt √ partendo dunque0 da0 v2 . Dato che 0 g(v2 , v2 ) = 3, bisognerà porre v1 = v2 / 3. Si ha cosı̀ g(v1 , v1 ) = 1. Continuando, poniamo v200 = av10 +√ v1 ed imponiamo che sia g(v10 , v200 ) = 0. Si trova √ allora a = −g(v10 , v1 ) = −2/ 3, e quindi v200 = −2/ 3v10 + v1 = − 23 v2 + v1 . q 4 00 00 Dato che si ha g(v2 , v2 ) = − 3 , e dato che − 43 non esiste in R, dovremo q √ √ √ porre v20 = v200 / 43 = 23 v200 = − 23 v2 + 23 v1 , ottenendo però g(v20 , v20 ) = −1. Per trovare il terzo e ultimo vettore della base, poniamo v300 = av10 + 0 bv2 + v3 ed imponiamo che g(v10 , v300 ) =√0 e g(v20 , v300 ) = 0. Si ottiene cosı̀ a = √ −g(v10 , v3 ) = 1/ 3 e b = g(v20 , v3 ) = 5 3/6 (attenzione che in questo caso si √ 5 3 1 0 0 00 0 0 ha g(v2 , v2 ) = −1). Si ha dunque v3 = √3 v1 + 6 v2 + v3 = − 12 v2 + 54 v1 + v3 . Si ha allora g(v300 , v300 ) = 15/4 e quindi si deve porre v30 = √215 v300 , ottenendo cosı̀ g(v30 , v30 ) = 1. La matrice di g nella base {v10 , v20 , v30 } è dunque 1 0 0 G0 = 0 −1 0 . 0 0 1 Svolgimento esercizio 3. Dato che tutti i vettori della base data sono isotropi non è possibile prendere un loro multiplo come vettore della nuova base. In questo caso si dovranno invece considerare, ad esempio, i vettori v100 = v1 + v2 e v200 = v1 − v2 . Questi due vettori sono ortogonali, dato che g(v100 , v200 ) = g(v1 , v1 ) − g(v2 , v2 ) = 0, e non sono isotropi. Infatti si ha g(v100 , v100 ) = 4 e g(v200 , v200 ) = −4. Si prendono quindi come vettori per la nuova base i vettori v10 = 21 v100 e v20 = 12 v200 , ottenendo g(v10 , v10 ) = 1 e g(v20 , v20 ) = −1. A questo punto v30 si potrà determinare nel modo usuale. Poniamo dunque v300 = av10 + bv20 + v3 ed imponiamo che g(v10 , v300 ) = 0 e g(v20 , v300 ) = 0. Si ottiene allora a = −g(v10 , v3 ) = −1 e b = g(v20 , v3 ) = −2. Di conseguenza √ si ha v300 = −v10 − 2v20 + v3 e, dato che g(v300 , v300 ) = 3, si porrà v30 = v300 / 3, ottenendo g(v30 , v30 ) = 1. 112 6. Forme Bilineari La matrice di g nella base {v10 , v20 , v30 } è 1 0 0 G = 0 −1 0 0 dunque 0 0 . 1 Svolgimento esercizio 4. (1) Si ha 2 −1 1 −1 = 10, det G = −3 − −1 −1 0 −1 quindi g è non-degenere. Procediamo quindi alla determinazione di una base ortogonale. Poniamo w1 = v1 ; si ha g(w1 , w1 ) = −3 6= 0. Si noti che non è necessario normalizzare i vettori della nuova base, perché è richiesta una base ortogonale e non una base ortonormale. Osservando la matrice G si nota che il vettore v3 è ortogonale a w1 , quindi come secondo vettore della base ortogonale possiamo prendere w2 = v3 ; si ha quindi g(w2 , w2 ) = −1. Rimane ora solo da determinare un terzo vettore w3 ortogonale ai due precedenti. Poniamo w3 = λ1 v1 + λ2 v2 + λ3 v3 ed imponiamo a w3 di essere ortogonale a w1 e w2 . Si ottiene il seguente sistema: g(w1 , w3 ) = −3λ1 + λ2 = 0 g(w2 , w3 ) = −λ2 − λ3 = 0, da cui si ricava λ = −1λ 3 1 3 λ = −λ . 2 3 Ponendo, ad esempio, λ3 = 3, si ottiene il vettore w3 = −v1 − 3v2 + 3v3 . Si trova ora g(w3 , w3 ) = 30, da cui si deduce che la matrice di g rispetto alla base ortogonale {w1 , w2 , w3 } è −3 0 0 0 −1 0 . 0 0 30 (2) Osservando la matrice appena trovata si scopre che la restrizione di g al sottospazio L{w1 , w2 }, generato da w1 e w2 , è definita negativa, mentre la restrizione di g al sottospazio generato da w3 è definita positiva. Si deduce quindi che l’indice d’inerzia di g è dato da i(g) = 1 − 2 = −1. (3) Dato che g non è definita, esistono sicuramente dei vettori isotropi non nulli. Ad esempio, se consideriamo un vettore w = λ1 w1 + λ2 w2 + λ3 w3 , la condizione che w sia isotropo è g(w, w) = −3λ21 − λ22 + 30λ23 = 0, che ha ovviamente soluzioni reali non nulle. 3. Soluzioni 113 Sia dunque U un sottospazio isotropo. Dato che, per definizione, si ha U ⊂ U ⊥ , e dim U ⊥ = 3 − dim U , se ne deduce che U può avere al più dimensione 1. Quindi per determinare un sottospazio isotropo di dimensione massima è sufficiente determinare un vettore isotropo non nullo; ad esempio √ il vettore w = 30w2 + w3 . Il sottospazio U = L{w} è pertanto un sottospazio isotropo di dimensione massima (ovviamente tale sottospazio non è unico). Svolgimento esercizio 5. (1) Per dimostrare che g è non-degenere basta dimostrare che det G 6= 0, oppure che esiste una base ortogonale di V . Visto che, in ogni caso, dobbiamo determinare una base ortogonale, possiamo evitare di calcolare il determinante di G; quando avremo calcolato una base ortogonale avremo anche dimostrato che essa esiste, e quindi che g è non-degenere. Indichiamo con {e1 , . . . , e4 } la base canonica di R4 . Come primo elemento di una base ortogonale possiamo prendere v1 = e1 ; si ha g(v1 , v1 ) = 3. Cerchiamo ora un secondo vettore v2 ortogonale a v1 : possiamo prendere v2 della forma seguente v2 = λ1 v1 + e2 , ed imporre che sia g(v1 , v2 ) = 0. Si trova allora λ1 = 32 e quindi 2 2 v2 = v1 + e2 = e1 + e2 ; 3 3 1 si calcola facilmente che g(v2 , v2 ) = − 3 . Per determinare il terzo vettore v3 della base ortogonale il procedimento è analogo. Sia v3 = λ1 v1 + λ2 v2 + e3 , ed imponiamo che g(v1 , v3 ) = 0 e g(v2 , v3 ) = 0. Si ottengono le seguenti due equazioni: g(v1 , v3 ) = 3λ1 + 1 = 0 1 1 g(v2 , v3 ) = − λ2 − = 0, 3 3 1 che hanno come soluzione λ1 = − 3 e λ2 = −1. Si ha quindi 1 v3 = − v1 − v2 + e3 = −e1 − e2 + e3 , 3 da cui si ottiene g(v3 , v3 ) = 1. Analogamente, ponendo v4 = λ1 v1 + λ2 v2 + λ3 v3 + e4 , ed imponendo che g(v1 , v4 ) = 0, g(v2 , v4 ) = 0 e g(v3 , v4 ) = 0, si trova che λ1 = − 31 , λ2 = −1 e λ3 = −4, da cui si ottiene 1 v4 = − v1 − v2 − 4v3 + e4 = 3e1 + 3e2 − 4e3 + e4 , 3 114 6. Forme Bilineari e g(v4 , v4 ) = −14. In conclusione, abbiamo visto che esiste una base ortogonale, data da {v1 , . . . , v4 }; ciò dimostra che g è non-degenere. Inoltre abbiamo visto che la matrice di g rispetto alla base {v1 , . . . , v4 } è 3 0 0 0 0 − 1 0 0 3 0 0 1 0 0 0 0 −14 da cui si deduce che l’indice d’inerzia di g è i(g) = 0. (2) Il prodotto scalare usuale su R4 ha indice d’inerzia 4. Pertanto R4 dotato del prodotto scalare usuale non è isometrico allo spazio V dotato della forma bilineare simmetrica g, che ha indice d’inerzia 0 (si ricordi il teorema di Sylvester). Analogamente, (V, g) non è isometrico allo spazio di Minkowski, perché quest’ultimo è R4 dotato della forma bilineare di matrice −1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 che ha indice d’inerzia 2. Svolgimento esercizio 6. (1) Per determinare l’indice d’inerzia cerchiamo innanzitutto una base ortogonale (dato che sarà utile anche nel seguito). Indichiamo con {e1 , . . . , e4 } la base canonica di R4 . In questo caso tutti e quattro i vettori della base canonica sono isotropi, quindi non possiamo prendere nessuno di questi come primo vettore di una base ortogonale. Prendiamo allora v1 = e1 + e2 ; questo vettore non è isotropo, dato che si ha g(v1 , v1 ) = 2g(e1 , e2 ) = 4. Come secondo vettore si vede immediatamente che si può prendere v2 = e1 − e2 , dato che esso è ortogonale a v1 : g(v1 , v2 ) = 0. Si ha poi g(v2 , v2 ) = −4. A questo punto possiamo prendere v3 = λ1 v1 + λ2 v2 + e3 , ed imporre che g(v1 , v3 ) = g(v2 , v3 ) = 0. Si trova allora λ1 = Si ha quindi 1 3 1 v3 = v1 − v2 + e3 = − e1 + e2 + e3 , 4 4 2 da cui si ottiene g(v3 , v3 ) = 2. Analogamente, ponendo v4 = λ1 v1 + λ2 v2 + λ3 v3 + e4 , 1 4 e λ2 = − 34 . 3. Soluzioni 115 ed imponendo che g(v1 , v4 ) = g(v2 , v4 ) = g(v3 , v4 ) = 0, si trova λ1 = λ2 = 34 e λ3 = 2, da cui si ottiene 3 , 4 3 3 1 v4 = v1 + v2 + 2v3 + e4 = e1 + 2e2 + 2e3 + e4 , 4 4 2 e g(v4 , v4 ) = −8. La matrice di g rispetto alla base 4 0 0 −4 0 0 0 0 {v1 , . . . , v4 } è quindi 0 0 0 0 2 0 0 −8 da cui si deduce che l’indice d’inerzia di g è i(g) = 0. (2) Dato che, come si verifica immediatamente, la matrice d’inerzia 0, si deduce che la matrice 1 0 0 1 0 0 0 0 0 0 0 1 0 1 ha indice 1 0 0 0 1 0 ha indice d’inerzia 2 + 0 = 2, che è diverso dall’indice d’inerzia di g. Dal teorema di Sylvester segue allora che non esiste una base di R4 rispetto a cui g abbia la matrice indicata. (3) Da quanto detto sopra segue che 0 1 1 0 0 0 0 0 la matrice 0 0 0 0 0 1 1 0 ha indice d’inerzia 0 + 0 = 0, che coincide con l’indice d’inerzia di g. Il teorema di Sylvester afferma allora che esiste una base di R4 rispetto a cui g abbia la matrice indicata. Ricordando la matrice di g rispetto alla base {v1 , . . . , v4 } trovata in precedenza, è facile vedere che ponendo, ad esempio, w1 = v1 +v2 , w2 = 41 (v1 −v2 ), w3 = v3 + 12 v4 e w4 = 14 (v3 − 12 v4 ), si ottiene una base rispetto alla quale la matrice di g coincide con la matrice in questione. (4) Da quanto visto in precedenza segue 0 1 0 1 0 0 0 0 −1 0 0 0 che la matrice 0 0 0 −1 116 6. Forme Bilineari ha indice d’inerzia 0 − 2 = −2, che è diverso dall’indice d’inerzia di g. Dal teorema di Sylvester segue allora che non esiste una base di R4 rispetto a cui g abbia la matrice indicata. 3.2. Forme Bilineari Alternanti Svolgimento esercizio 7. Come primo vettore possiamo certo prendere w1 = v1 . Si tratta ora di determinare un vettore w2 tale che g(w1 , w2 ) = 1 (il fatto che g(w2 , w2 ) = 0 è ovvio, dato che g è alternante). Osservando che g(w1 , v2 ) = g(v1 , v2 ) = 3, si vede che basta porre w2 = 13 v2 per ottenere g(w1 , w2 ) = 1. Per determinare w3 poniamo ora w3 = aw1 + bw2 + cv3 . Imponendo le condizioni g(w1 , w3 ) = 0 e g(w2 , w3 ) = 0, otteniamo il sistema b + 4c = 0 5 − a + c = 0. 3 Ponendo, ad esempio, c = 3, si trova b = −12 e a = 5. Di conseguenza si ha w3 = 5w1 − 12w2 + 3v3 = 5v1 − 4v2 + 3v3 . Infine per determinare w4 poniamo w4 = aw1 + bw2 + cw3 + dv4 ed imponiamo le condizioni g(w1 , w4 ) = 0, g(w2 , w4 ) = 0 e g(w3 , w4 ) = 1. Si ottiene cosı̀ il sistema b−d=0 2 −a+ d=0 3 − 31d = 1, 2 1 che ha come soluzione a = − 93 , b = d = − 31 (e c qualunque). Prendendo 2 1 1 2 1 w2 − 31 v4 = − 93 v1 − 93 v2 − c = 0 si ottiene allora il vettore w4 = − 93 w1 − 31 1 v. 31 4 Osservazione: possiamo ora scrivere anche la matrice P di cambiamento di base. Si ha infatti 1 0 5 −2/93 0 1/3 −4 −1/93 , (w1 , . . . , w4 ) = (v1 , . . . , v4 ) 0 0 3 0 0 0 0 −1/31 e quindi 1 0 5 −2/93 0 1/3 −4 −1/93 . P = 0 0 3 0 0 0 0 −1/31 Si può allora controllare che vale la nota formula G0 = P T GP . 3. Soluzioni 117 3.3. Isometrie Svolgimento esercizio 8. Dimostriamo che Im(φ − id) ⊂ Ker(φ − id)⊥ . Sia v ∈ V e w ∈ Ker(φ−id); bisogna dimostrare che (φ−id)(v) è ortogonale a w, cioè che g((φ − id)(v), w) = 0. Osserviamo che si ha φ(w) = w, dato che (φ − id)(w) = 0. Si ottiene quindi: g((φ − id)(v), w) = g(φ(v), w) − g(v, w) = g(φ(v), φ(w)) − g(v, w) = 0, ove si è usato il fatto che g(φ(v), φ(w)) = g(v, w), cioè che φ è una isometria. Dato che la dimostrazione precedente è valida per ogni v ed ogni w, si è cosı̀ provato che Im(φ − id) ⊂ Ker(φ − id)⊥ . D’altra parte, ricordiamo che dim Im(φ − id) = dim V − dim Ker(φ − id) e dim Ker(φ − id)⊥ = dim V − dim Ker(φ − id). Quindi Im(φ − id) e Ker(φ − id)⊥ hanno la stessa dimensione e pertanto devono essere uguali. 3.4. Altri esercizi Svolgimento esercizio 9. (1) Dalla definizione è ovvio che g è simmetrica. Per dimostrare che è bilineare basta allora dimostrare che è lineare nel primo argomento. Si ha: g(λ1 z1 + λ2 z2 , z3 ) = 2<((λ1 z1 + λ2 z2 )z3 ) = 2<(λ1 z1 z3 + λ2 z2 z3 ) = 2λ1 <(z1 z3 ) + 2λ2 <(z2 z3 ) = λ1 g(z1 z3 ) + λ2 g(z2 z3 ), per ogni z1 , z2 ∈ C e ogni λ1 , λ2 ∈ R. Per dimostrare che g è non-degenere bisogna dimostrare che, per ogni z 6= 0 esiste w ∈ C tale che g(z, w) 6= 0. Ora, se z = a + ib 6= 0, deve essere a 6= 0 oppure b 6= 0. Nel primo caso si ha g(z, 1) = 2a 6= 0, mentre nel secondo si ha g(z, i) = −2b 6= 0. Quindi g è non-degenere. (2) Gli elementi della matrice di g rispetto alla base {1, i} sono, per definizione, g(1, 1), g(1, i), g(i, 1) e g(i, i). La matrice in questione è quindi 2 0 . 0 −2 (3) Come nel caso precedente, l’elemento di posto (i, j) della matrice di g rispetto alla base {z1 , z2 } è dato da g(zi , zj ). Si verifica che g(z1 , z1 ) = 118 6. Forme Bilineari 2<(z12 ) = z12 + z̄12 , g(z1 , z2 ) = g(z2 , z1 ) = 2<(z1 z2 ) = z1 z2 + z̄1 z̄2 e g(z2 , z2 ) = 2<(z22 ) = z22 + z̄22 . Si ha pertanto 2 z1 + z̄12 z1 z2 + z̄1 z̄2 G= . z1 z2 + z̄1 z̄2 z22 + z̄22 È ora immediato calcolare il determinante di G e verificare che vale l’uguaglianza in questione. Svolgimento esercizio 10. Dato che la matrice A è simmetrica anche A2 lo è, e quindi rappresenta un’applicazione bilineare simmetrica (ad esempio sullo spazio vettoriale Rn , ove n è l’ordine di A2 , rispetto alla base canonica). L’applicazione bilineare simmetrica definita da A2 è semidefinita positiva; infatti, per ogni vettore colonna v, si ha: v T A2 v = (v T A)(Av) = (Av)T (Av) = wT w ≥ 0, ove si è posto w = Av e si è osservato che wT w non è altro che il prodotto scalare usuale di w per sé stesso. La matrice I + A2 rappresenta quindi la somma di una applicazione bilineare simmetrica definita positiva (di matrice I) con una semidefinita positiva, ed è pertanto definita positiva e quindi non-degenere. Da ciò segue che det(I + A2 ) 6= 0 e quindi I + A2 è una matrice invertibile. Capitolo 7 Spazio Affine 1. Richiami di teoria 1.1. Spazi Affini Ai fini dello studio della geometria, gli spazi vettoriali presentano l’inconveniente di non contenere “punti” ma solo “vettori”. Introduciamo ora una categoria di spazi in cui si possono definire allo stesso tempo i concetti di punto e vettore; questi sono gli spazi affini. Definizione 1.1. Uno spazio affine A sul campo C è una terna A = (S, V, +), costituita da un insieme S, detto l’insieme dei punti, da uno spazio vettoriale V sul campo C, detto l’insieme dei vettori, e da una operazione (vedi figura 1) + : S × V → S, (P, v) 7→ Q = P + v, che soddisfa le seguenti proprietà: (1) (P + v) + w = P + (v + w), per ogni P ∈ S e ogni v, w ∈ V ; (2) P + 0V = P , per ogni P ∈ S; (3) per ogni P, Q ∈ S, esiste un unico vettore v ∈ V tale che P +v = Q. Tale vettore si indica quindi con v = Q − P . La dimensione dello spazio affine A è, per definizione, la dimensione dello spazio vettoriale V . Si noti che le proprietà enunciate legano strettamente tra loro i due insiemi S e V . Infatti se fissiamo un punto P ∈ S, si dimostra facilmente r Q v r P Figura 1. Somma di un punto con un vettore. 120 7. Spazio Affine che la funzione V → S, v 7→ P + v, è una biiezione. L’insieme dei punti S può quindi essere identificato con l’insieme dei vettori V , ma tale identificazione dipende dalla scelta di un punto P . Definizione 1.2. Lo spazio affine n-dimensionale standard sul campo C è An (C) = (C n , C n , +), ove l’insieme S dei punti è C n , lo spazio vettoriale V è ancora C n e l’operazione di somma di un punto con un vettore è definita come segue: se P = (p1 , . . . , pn ) e v = (x1 , . . . , xn ) allora P + v = (p1 + x1 , . . . , pn + xn ). Si verifica facilmente che tutte le proprietà richieste dalla definizione di uno spazio affine sono soddisfatte. 1.2. Sistemi di riferimento Sia A = (S, V, +) uno spazio affine di dimensione n. Definizione 1.3. Un sistema di riferimento in A è il dato di n + 1 punti O, P1 , . . . , Pn tali che gli n vettori vi = Pi − O, per i = 1, . . . , n, siano una base di V . Il punto O è detto l’origine del sistema di riferimento. Dato un sistema di riferimento in A, ogni punto P si può scrivere in modo unico come segue: P = O + x1 v1 + · · · + xn vn , ove gli xi sono degli scalari. Definizione 1.4. Gli scalari (x1 , . . . , xn ) tali che P = O + x1 v1 + · · · + xn vn , sono detti le coordinate del punto P rispetto al sistema di riferimento fissato. Sia A uno spazio affine di dimensione n in cui è stato fissato un sistema di riferimento. Proposizione 1.5. L’applicazione che ad ogni punto P di A associa la n-upla (x1 , . . . , xn ) delle sue coordinate rispetto al sistema di riferimento fissato, determina una biiezione di A con lo spazio affine standard An (C). 1.3. Sottovarietà lineari Sia A = (S, V, +) uno spazio affine. Definizione 1.6. Una sottovarietà lineare L di A è un insieme di punti di A definito come segue: L = {Q ∈ S | Q = P + v, ∀v ∈ W }, 1. Richiami di teoria 121 ove P ∈ S è un punto fissato e W è un sottospazio vettoriale di V . L è detta la sottovarietà lineare di A passante per P e parallela a W . Il sottospazio vettoriale W è detto lo spazio direttore di L. La dimensione di L è, per definizione, la dimensione del suo spazio direttore W . Una sottovarietà lineare di dimensione 0 è un punto, una sottovarietà lineare di dimensione 1 è detta retta, una sottovarietà lineare di dimensione 2 è detta piano, infine una sottovarietà lineare di dimensione n − 1, in uno spazio affine di dimensione n, è detta iperpiano. Definizione 1.7. Due sottovarietà lineari L e M di A si dicono: (1) disgiunte se L ∩ M = ∅, (2) parallele se i sottospazi direttori di L e M sono uno contenuto nell’altro, (3) sghembe se non sono né parallele né incidenti. Come nel caso degli spazi vettoriali, l’intersezione di due sottovarietà lineari è ancora una sottovarietà lineare. Ciò non è vero, in generale, per l’unione. Definizione 1.8. Siano L e M due sottovarietà lineari di A. La sottovarietà lineare generata da L e M , indicata con L + M , è la più piccola (per la relazione di inclusione) sottovarietà lineare di A contenente L e M . Vale il seguente risultato: Proposizione 1.9. Siano L e M due sottovarietà lineari di A. Allora si ha: dim(L + M ) ≤ dim L + dim M − dim(L ∩ M ), ove vale il segno di uguaglianza se L e M sono incidenti oppure sghembe (e si è posto, per convenzione, dim(∅) = −1). Supponiamo ora che nello spazio affine A sia stato fissato un sistema di riferimento O, P1 , . . . , Pn . I vettori vi = Pi − O, per i = 1, . . . , n, sono quindi una base di V . Sia L una sottovarietà lineare di dimensione r di A, data da L = {Q ∈ S | Q = P + v, ∀v ∈ W }, e fissiamo una base w1 , . . . , wr di W . Questi vettori si possono scrivere come combinazione lineare dei vettori v1 , . . . , vn come segue: wj = n X aij vi , i=1 Il generico vettore v ∈ W si può dunque scrivere v= r X j=1 λj wj = X i,j aij λj vi = n X i=1 µi v i , 122 7. Spazio Affine dove abbiamo posto µi = r X aij λj . j=1 I coefficienti (µ1 , . . . , µn ) sono quindi le componenti del vettore v rispetto alla base di V fissata. Se indichiamo con (p1 , . . . , pn ) le coordinate di P e con (x1 , . . . , xn ) le coordinate di Q, rispetto al sistema di riferimento fissato, l’equazione Q = P + v è equivalente al seguente sistema di equazioni: x1 = p1 + a11 λ1 + a12 λ2 + · · · + a1r λr x2 = p2 + a21 λ1 + a22 λ2 + · · · + a2r λr ··· xn = pn + an1 λ1 + an2 λ2 + · · · + anr λr Queste equazioni, al variare del parametri λ1 , . . . , λr ∈ C descrivono tutti i punti della varietà lineare L. Sono quindi chiamate le equazioni parametriche di L (ovviamente rispetto al sistema di riferimento fissato). Una varietà lineare L può essere descritta anche da un altro tipo di equazioni, le sue equazioni cartesiane. Esse si ottengono semplicemente eliminando i parametri λi dal sistema delle sue equazioni parametriche. In generale si ottiene in questo modo un sistema di equazioni lineari nelle incognite x1 , . . . , xn . Ad esempio, se la varietà lineare L è un iperpiano, le sue equazioni cartesiane si riducono ad una unica equazione del tipo a1 x1 + a2 x2 + · · · + an xn = b. Altri esempi verranno presentati negli esercizi. 1.4. Spazi affini euclidei Definizione 1.10. Uno spazio affine euclideo è uno spazio affine A = (S, V, +) tale che lo spazio vettoriale V è dotato di una forma bilineare simmetrica e definita positiva φ (V è quindi uno spazio vettoriale euclideo). In uno spazio affine euclideo, come in uno spazio vettoriale euclideo, si possono quindi misurare le lunghezze (cioè le norme) dei vettori, e gli angoli tra vettori. È quindi possibile definire anche la distanza tra due punti. Definizione 1.11. La distanza tra due punti P e Q è data da p d(P, Q) = kvk = φ(v, v), ove v = Q − P (cioè la distanza tra due punti è la norma del vettore che ha come estremi i due punti dati). Si può anche definire la distanza tra due sottoinsiemi qualsiasi di uno spazio affine. Il modo più semplice per farlo è il seguente: 1. Richiami di teoria 123 rP w r -r Q v R r Figura 2. Distanza di un punto da una retta. Definizione 1.12. Siano A e B due sottoinsiemi di uno spazio affine A (cioè A e B sono sottoinsiemi dell’insieme dei punti di A). La distanza tra A e B è d(A, B) = inf{d(P, Q) | P ∈ A, Q ∈ B}. Ricordiamo ora alcune formule utili per il calcolo delle distanze. Proposizione 1.13 (Distanza di un punto da una retta). Sia A = An (R) lo spazio affine euclideo n-dimensionale standard. Sia P un punto e sia r la retta passante per un punto Q e parallela a un vettore v. Indichiamo con w il vettore w = P − Q. Allora la distanza di P da r è data da: r (v · w)2 d(P, r) = w · w − . v·v Proposizione 1.14 (Distanza di un punto da un iperpiano). Sia A = An (R) lo spazio affine euclideo n-dimensionale standard. Sia P = (p1 , . . . , pn ) un punto e sia π un iperpiano di equazione π : a1 x1 + a2 x2 + · · · + an xn + b = 0. Allora la distanza di P da π è data da: d(P, π) = |a1 p1 + a2 p2 + · · · + an pn + b| p . a21 + · · · + a2n Se lo spazio affine euclideo ha dimensione 3 (e quindi è definito il prodotto vettoriale di due vettori) si possono dimostrare i seguenti risultati. Sia A = A3 (R) lo spazio affine euclideo tridimensionale standard. Proposizione 1.15 (Distanza di un punto da una retta). Sia P un punto e sia r una retta in A. Siano Q e R due punti di r. Poniamo v = R − Q e w = P − Q (vedi figura 2). Allora la distanza di P da r è data da: kv ∧ wk d(P, r) = . kvk Proposizione 1.16 (Distanza tra due rette sghembe). Siano r e s due rette sghembe in A. Siano P , Q due punti di r e R, S due punti di s. 124 7. Spazio Affine Q r r * P r v u HH r H H HH w RH HH HH HH H j H Hr H s S H H Figura 3. Distanza tra due rette sghembe. Poniamo u = P − R, v = Q − P e w = S − R (vedi figura 3). Allora la distanza di r da s è data da: d(r, s) = |u · (v ∧ w)| . kv ∧ wk Proposizione 1.17 (Area di un triangolo). Siano P , Q e R tre punti di A. L’area del triangolo di vertici P , Q e R è data da: 1 A(P QR) = k(Q − P ) ∧ (R − P )k. 2 Proposizione 1.18 (Volume di un tetraedro). Siano P , Q, R e S quattro punti di A. Il volume del tetraedro di vertici P , Q, R e S è dato da: 1 V (P QRS) = |(S − P ) · ((Q − P ) ∧ (R − P ))|. 6 1.5. Applicazioni affini Siano A = (S, V, +) e A0 = (S 0 , V 0 , +) due spazi affini sul campo C. Definizione 1.19. Una applicazione affine f : A → A0 è costituita da una coppia di funzioni f = (fS , fV ), ove fS : S → S 0 è una funzione tra insiemi e fV : V → V 0 una funzione lineare tra spazi vettoriali, tali che fS (P + v) = fS (P ) + fV (v), per ogni P ∈ S e ogni v ∈ V . Si noti che le due applicazioni fS e fV sono strettamente correlate. Dalla definizione segue infatti che, per ogni v ∈ V , si deve avere fV (v) = fS (Q) − fS (P ), ove P e Q sono gli estremi di v, cioè v = Q − P . Si scopre cosı̀ che l’applicazione lineare fV è completamente determinata dall’applicazione insiemistica fS . 2. Esercizi 125 Definizione 1.20. Se A = (S, V, +) e A0 = (S 0 , V 0 , +) sono due spazi affini euclidei, un’applicazione affine f : A → A0 è detta isometria se è biiettiva (cioè fS : S → S 0 è biiettiva) e l’applicazione lineare fV : V → V 0 è una isometria di spazi vettoriali euclidei. Sia f : A → A0 un’applicazione affine e fissiamo due sistemi di riferimento O, P1 , . . . , Pn in A e O0 , P10 , . . . , Pm0 in A0 (ove n = dim A e m = dim A0 ). I vettori vi = Pi − O, per i = 1, . . . , n, sono quindi una base di V , e i vettori vj0 = Pj0 − O0 , per j = 1, . . . , m, sono una base di V 0 . Indichiamo con A la matrice dell’applicazione lineare fV rispetto a queste due basi di V e V 0 . Sia P un punto di A di coordinate (x1 , . . . , xn ) rispetto al sistema di riferimento P fissato. Ciò significa che il punto P è dato da P = O + v, ove v = ni=1 xi vi . Dalla definizione di applicazione affine deriva che fS (P ) = fS (O) + fV (v). Le coordinate (y1 , . . . , ym ) del vettore fV (v), rispetto alla base di V 0 , sono date da y1 x1 . .. = A ... . ym xn Se il punto fS (O) ha coordinate (q1 , . . . , qm ) rispetto al sistema di riferimento fissato su A0 , si conclude che, in termini delle coordinate, l’applicazione affine f si esprime come segue: x1 q1 x1 . . fS : .. 7→ .. + A ... . xn qm xn 2. Esercizi 2.1. Rette e Piani Esercizio 1. Nello spazio affine A3 (R) si determini la retta r passante per il punto P = (p1 , p2 , p3 ) e parallela al vettore v = (v1 , v2 , v3 ). Esercizio 2. Nello spazio affine A3 (R) si determini la retta r passante per i punti P = (p1 , p2 , p3 ) e Q = (q1 , q2 , q3 ). Esercizio 3. Nello spazio affine A3 (R) si determini il piano π passante per il punto P = (p1 , p2 , p3 ) e parallelo ai vettori v = (v1 , v2 , v3 ) e w = (w1 , w2 , w3 ). Esercizio 4. Nello spazio affine A3 (R) si determini il piano π passante per i tre punti (non allineati) P = (p1 , p2 , p3 ), Q = (q1 , q2 , q3 ) e R = (r1 , r2 , r3 ). Esercizio 5. Nello spazio affine A3 (R) sia r la retta di equazioni 2x − 3y + 1 = 0 2x − 2y + z − 1 = 0. 126 7. Spazio Affine Si determini la retta s passante per l’origine e parallela ad r, ed il piano del fascio di asse r passante per l’origine. Esercizio 6. Siano r1 e r2 rispettivamente le rette passanti per P1 = (0, 1, 2) e P2 = (2, −1, 0) e parallele ai vettori v1 = (2, 1, 1) e v2 = (−2, 3, 0). Siano F1 e F2 rispettivamente i fasci di piani di asse r1 e r2 . Si determinino i piani π1 di F1 e π2 di F2 passanti per il punto P = (1, 1, 1), e le intersezioni della retta r = π1 ∩ π2 con i piani coordinati. Si determini infine il triangolo individuato dalle intersezioni delle rette r, r1 e r2 con il piano di equazione x = 0. Esercizio 7. Determinare l’equazione del piano contenente le rette r e s di equazioni y+1=0 2x − 3y + 2z − 1 = 0 r: s: 2x + 2z − 3 = 0 x − 2y + z = 0. Esercizio 8. Sia r la retta passante per i punti P = (1, 0, −2) e Q = (0, −1, 3), e sia s la retta passante per il punto R = (−1, 1, 0) e parallela al vettore v = (1, −1, − 21 ). Si determinino il piano π1 , passante per i punti P , Q e R, il piano π2 contenente la retta s e passante per il punto medio del segmento P Q, ed infine un vettore u parallelo alla retta π1 ∩ π2 . 2.2. Distanza di un Punto da una Retta Esercizio 9. Si determini la distanza del punto P = (2, 0, −1) dalla retta r di equazioni parametriche x = t + 1 y=2 z = t − 1. 2.3. Coni e Cilindri Esercizio 10. Si determinino le rette passanti per il punto Q = (0, 1, −1), distanti 1 dal punto P = (1, 1, 0) e contenute nel piano π di equazione y + z = 0. Esercizio 11. Si determini l’equazione del luogo dei punti dello spazio affine euclideo A3 (R) appartenenti alle rette passanti per il punto P = (2, 1, 1) che formano un angolo pari a π6 con il piano π di equazione 2x + y − z = 0. Esercizio 12. Si determini l’equazione del luogo dei punti dello spazio affine euclideo A3 (R) appartenenti alle rette passanti per il punto P = (3, 3, 3) che 2. Esercizi 127 intersecano la curva C di equazione ( x2 + 2y 2 + 3z 2 = 4 x + z = 0. Esercizio 13. Si determinino le rette del piano √ π di equazione x−y+2z = 0 parallele al vettore v = (1, 3, 1) e distanti 6 dal punto P = (1, 0, 0). Esercizio 14. Nello spazio affine euclideo reale tridimensionale, si determini l’equazione del luogo dei punti appartenenti alle rette distanti 1 dal punto P = (1, 1, 2) e formanti un angolo pari a π3 con i piani π1 : x + y = 0 e π2 : x − z = 0. Esercizio 15. Nello spazio affine euclideo A3 (R) sia π il piano contenente la retta r di equazioni 21 (x − 1) = y + 1 = 13 z ed il punto P = (0, 1, 1). √ Si determinino le rette del piano π passanti per P e distanti 3 dal punto Q = (1, 1, −1). Si determinino inoltre la proiezione ortogonale Q0 di Q su π e le rette di π passanti per Q0 e ortogonali alle rette trovate in precedenza. 2.4. Altri Esercizi Esercizio 16. Nello spazio affine euclideo A3 (R) si determinino le equazioni delle rette passanti per P = (1, 0, 0), incidenti la retta r di equazioni y+z−1=0 r: x=0 e formanti con quest’ultima un angolo pari a π6 . Esercizio 17. Nello spazio affine euclideo A3 (R) si consideri l’affinità f definita da 1 √ 0 − √12 1 x x 2 0 y 0 f : y 7→ √ + 0 1 1 1 √ z z 0 √2 2−1 2 rispetto ad un sistema di riferimento ortonormale. Si mostri che f è una isometria dello spazio affine euclideo che ammette una retta r fatta di punti uniti, e si determini l’equazione di tale retta. Si dica inoltre se f è una rotazione di asse r e, in caso affermativo, si determini l’angolo di rotazione. Esercizio 18. Nel piano affine euclideo A2 (R) siano r1 e r2 le rette di equazione x − 2y + 1 = 0 e 3x − y + 2 = 0 rispettivamente. Si determinino le equazioni delle rette s1 e s2 bisettrici degli angoli formati da r1 e r2 . 128 7. Spazio Affine 3. Soluzioni 3.1. Rette e Piani Svolgimento esercizio 1. La retta r cercata è l’insieme dei punti X tali che il vettore X − P è multiplo del vettore v. Si ha quindi r = {X ∈ A3 | X − P = λv, λ ∈ R}. Se poniamo X = (x1 , x2 , x3 ), si ottengono cosı̀ le equazioni x1 − p1 = λv1 x2 − p2 = λv2 x − p = λv 3 3 3 Queste sono le equazioni parametriche della retta r. Se da queste equazioni eliminiamo il parametro λ, e se supponiamo che v1 6= 0, v2 6= 0 e v3 6= 0, si ottengono le due equazioni seguenti x2 − p2 x3 − p3 x1 − p1 = = v1 v2 v3 che sono le equazioni cartesiane della retta r cercata. Svolgimento esercizio 2. La retta r cercata è la retta passante per il punto P parallela al vettore v = Q − P = (q1 − p1 , q2 − p2 , q3 − p3 ). A questo punto basta applicare quanto visto nell’esercizio precedente. Le equazioni parametriche di r sono quindi x1 − p1 = λ(q1 − p1 ) x2 − p2 = λ(q2 − p2 ) x − p = λ(q − p ) 3 3 3 3 Se poniamo X = (x1 , x2 , x3 ), queste equazioni si scrivono semplicemente come segue: X = λQ + (1 − λ)P, λ ∈ R. Svolgimento esercizio 3. Il piano π in questione è l’insieme dei punti X tali che il vettore X − P appartiene al sottospazio vettoriale generato da v e w. Si ha quindi π = {X ∈ A3 | X − P = λv + µw, λ, µ ∈ R}. Se poniamo X = (x1 , x2 , x3 ), si ottengono cosı̀ le equazioni x1 − p1 = λv1 + µw1 x2 − p2 = λv2 + µw2 x − p = λv + µw 3 3 3 3 Queste sono le equazioni parametriche del piano π. 3. Soluzioni 129 Un’altra descrizione del piano π si può ottenere come segue. Sia u un vettore perpendicolare a v e w (ad esempio, si prenda u = v ∧ w). Il piano π è allora l’insieme dei punti X tali che il vettore X − P è perpendicolare a u, si ha dunque π = {X ∈ A3 | (X − P ) · u = 0}. Se poniamo u = (u1 , u2 , u3 ), si ottiene cosı̀ l’equazione u1 (x1 − p1 ) + u2 (x2 − p2 ) + u3 (x3 − p3 ) = 0. Questa è l’equazione (cartesiana) del piano π. Svolgimento esercizio 4. Il piano π cercato è il piano passante per il punto P e parallelo ai vettori v = Q − P = (q1 − p1 , q2 − p2 , q3 − p3 ) e w = R − P = (r1 − p1 , r2 − p2 , r3 − p3 ). A questo punto basta applicare quanto visto nell’esercizio precedente. Le equazioni parametriche di π sono quindi x1 − p1 = λ(q1 − p1 ) + µ(r1 − p1 ) x2 − p2 = λ(q2 − p2 ) + µ(r2 − p2 ) x − p = λ(q − p ) + µ(r − p ) 3 3 3 3 3 3 Se poniamo X = (x1 , x2 , x3 ), queste equazioni si scrivono semplicemente come segue: X = λQ + µR + (1 − λ − µ)P, λ, µ ∈ R. Svolgimento esercizio 5. Per determinare la retta s è sufficiente conoscere un vettore parallelo ad r. Per determinare questo vettore basta conoscere due punti qualunque della retta r; la loro differenza fornirà il vettore cercato. Si verifica immediatamente che i punti P = (0, 31 , 53 ) e Q = (− 12 , 0, 2) appartengono ad r, quindi come vettore parallelo ad r si può prendere Q − P = (− 12 , − 13 , 13 ). Le equazioni parametriche di s sono allora 1 x=− λ 2 1 y=− λ 3 1 z = λ 3 Eliminando il parametro λ si ottengono le equazioni cartesiane di s, che sono (ad esempio) 2x − 3y = 0 y + z = 0. Passiamo ora alla determinazione del piano in questione. L’equazione del fascio di piani di asse r è λ(2x − 3y + 1) + µ(2x − 2y + z − 1) = 0. 130 7. Spazio Affine Imponendo la condizione di passaggio per l’origine, si ottiene λ − µ = 0, e si può dunque prendere, ad esempio, λ = µ = 1. l’equazione del piano cercato, che è quindi Questo fornisce 4x − 5y + z = 0. Svolgimento esercizio 6. Le equazioni cartesiane di r1 sono x−0 y−1 z−2 = = , 2 1 1 da cui si ottiene r1 : x − 2y + 2 = 0 y − z + 1 = 0. Le equazioni parametriche di r2 sono x = −2t + 2 y = 3t − 1 z = 0, da cui si ricava r2 : 3x + 2y − 4 = 0 z = 0. Le equazioni dei fasci F1 e F2 sono allora F1 : λ(x − 2y + 2) + µ(y − z + 1) = 0 e F2 : λ0 (3x + 2y − 4) + µ0 z = 0. Imponendo le condizioni di passaggio per il punto P = (1, 1, 1) si ottiene λ = −µ e λ0 = −µ0 . Ponendo, ad esempio, λ = λ0 = 1 si trovano le equazioni dei piani π1 e π2 : π1 : x − 3y + z + 1 = 0, e π2 : 3x + 2y − z − 4 = 0. Si ha ora r = π1 ∩ π2 : x − 3y + z + 1 = 0 3x + 2y − z − 4 = 0. Il resto dell’esercizio è ora immediato. 3. Soluzioni 131 Svolgimento esercizio 7. Il fascio di piani di asse r ha equazione λ(2x + 2z − 3) + µ(y + 1) = 0. Per determinare il piano passante per r e s basterà quindi determinare il piano del fascio di asse r passante per un punto di s; naturalmente bisognerà poi verificare che tutta la retta s sia contenuta in questo piano. Un punto della retta s è, ad esempio, il punto P = (2, 1, 0); imponendo, nel fascio di piani precedente, la condizione di passaggio per P si ottiene λ = −2µ, da cui, ponendo µ = 1, si trova l’equazione del piano π contenente la retta r e passante per il punto P : π : −4x + y − 4z + 7 = 0. Per verificare che tutta la retta s è contenuta in π basta verificare che π contiene un altro punto di s (diverso da P ); infatti se un piano contiene due punti di una retta allora contiene tutta la retta. Si verifica subito che Q = (0, 1, 2) è un punto di s e che Q ∈ π. Questo conclude la dimostrazione che π è proprio il piano contenente le due rette r e s. Svolgimento esercizio 8. Un vettore parallelo alla retta r è il vettore Q − P = (−1, −1, 5); quindi le equazioni di r sono x−1 y−0 z+2 = = , −1 −1 5 da cui si ricava −x+y+1=0 r: 5y + z + 2 = 0. Per quanto riguarda la retta s, le sue equazioni sono x+1 y−1 z−0 = = , 1 −1 − 12 da cui si ricava x+y =0 y − 2z − 1 = 0. Il piano π1 è il piano del fascio di asse r passante per R. L’equazione del fascio di piani di asse r è s: λ(−x + y + 1) + µ(5y + z + 2) = 0, e dalla condizione di passaggio per R si ottiene λ = − 73 µ. Ponendo µ = 3 si trova cosı̀ l’equazione del piano π1 : π1 : 7x + 8y + 3z − 1 = 0. Il punto medio M del segmento P Q è il punto dato da P +Q M= = (1/2, −1/2, 1/2) 2 132 7. Spazio Affine (si noti che in uno spazio affine non ha alcun senso fare la somma di due punti. Tuttavia la formula 12 (P + Q) fornisce precisamente le coordinate del punto medio del segmento P Q. Si consiglia al lettore di verificarlo per esercizio). A questo punto il piano π2 si può determinare con lo stesso procedimento usato in precedenza per determinare π1 (si consideri il fascio di piani di asse s e si imponga la condizione di passaggio per il punto M ). Si trova π2 : x + y = 0. La retta π1 ∩ π2 ha quindi equazioni 7x + 8y + 3z − 1 = 0 π1 ∩ π2 : x + y = 0, e per trovare un vettore parallelo a questa retta basta trovarne due punti, ad esempio i punti A = (0, 0, 13 ) e B = (−1, 1, 0). Il vettore in questione è dunque u = B − A = (−1, 1, 31 ). 3.2. Distanza di un Punto da una Retta Svolgimento esercizio 9. Ricordiamo qui le formule che permettono di determinare la distanza di un punto da una retta nello spazio affine euclideo A3 . Sia r la retta passante per un punto Q e parallela al vettore v, e sia P un altro punto. La distanza d = d(P, r) di P dalla retta r è determinata da: ((P − Q) · v)2 . d2 = (P − Q) · (P − Q) − v·v Equivalentemente, si ha la formula seguente: d= k(P − Q) ∧ vk , kvk √ ove kwk = w · w indica la norma del vettore w. Per determinare la distanza di P da r basta quindi conoscere un punto Q di r ed un vettore v parallelo ad r. Nel caso in questione si verifica immediatamente che si può prendere Q = (1, 2, −1) e v = (1, 0, 1) e quindi, applicando ad esempio la prima formula, si trova d(P, r)2 = 92 , da cui si √ ottiene d(P, r) = 23 2. 3.3. Coni e Cilindri Svolgimento esercizio 10. Sia X = (x, y, z) un punto qualunque e consideriamo la retta r, passante per Q e X. Un vettore parallelo a questa retta 3. Soluzioni 133 è il vettore v = X − Q = (x, y − 1, z + 1). Utilizzando la formula per la distanza di un punto da una retta, si ha: d(P, r)2 = kP − Qk2 − ((P − Q) · v)2 . kvk2 Imponendo la condizione d(P, r) = 1, l’equazione precedente diventa 1=2− (x + z + 1)2 , x2 + (y − 1)2 + (z + 1)2 da cui si ricava y 2 − 2xz − 2x − 2y + 1 = 0. Questa equazione descrive il luogo dei punti X tali che la retta passante per Q e X ha distanza fissata, uguale a 1, dal punto P ; si tratta quindi di un cono di vertice Q il cui asse è la retta per Q e P . Dato che le rette che interessano sono solo quelle contenute nel piano π, queste si trovano intersecando il cono trovato con il piano π in questione. Si noti, a questo proposito, che il piano π contiene il vertice Q del cono, quindi l’intersezione del piano π con il cono consiste precisamente di due rette (almeno se il piano non è tangente al cono). L’intersezione tra il piano π e il cono è data dal seguente sistema: ( y 2 − 2xz − 2x − 2y + 1 = 0 y + z = 0. Ricavando y = −z e sostituendo nella prima equazione, si ottiene l’equazione (z + 1)(z + 1 − 2x) = 0, da cui si ricavano quindi i due sistemi z+1=0 y+z =0 e z + 1 − 2x = 0 y + z = 0. Queste sono quindi le equazioni delle due rette ottenute intersecando π con il cono in questione, che sono precisamente le rette cercate. Svolgimento esercizio 11. Dall’equazione del piano π si deduce che il vettore n = (2, 1, −1) è ortogonale al piano π. Una retta forma un angolo di π6 con π se e solo se forma un angolo di π3 con il vettore n, quindi il problema si riduce a determinare tutte le rette passanti per P che formano un angolo fissato, pari a π3 , con il vettore n. Queste rette formano pertanto un cono di vertice P , di asse la retta per P parallela ad n, e di semiapertura π . L’equazione di questo cono si può trovare facilmente come segue: sia 3 134 7. Spazio Affine X = (x, y, z), questo punto appartiene al cono in questione se e solo se il vettore X − P forma un angolo di π3 con il vettore n; si deve pertanto avere π |(X − P ) · n| = kX − P k knk cos . 3 Sviluppando i calcoli, si ottiene √ |2(x − 2) + (y − 1) − (z − 1)| = 6p (x − 2)2 + (y − 1)2 + (z − 1)2 , 2 da cui, elevando al quadrato e semplificando, si ottiene alla fine 5x2 − y 2 − z 2 + 8xy − 8xz − 4yz − 26x − 10y + 22z + 14 = 0. Questa è l’equazione del luogo cercato. Svolgimento esercizio 12. Il luogo cercato non è altro che l’insieme di tutte le rette congiungenti P con un punto Q della curva C, al variare del punto Q nella curva C. Si tratta quindi di un cono di vertice P proiettante la curva C. Sia S = (xS , yS , zS ) e consideriamo la retta per P e S, di equazioni parametriche x = txS + 3(1 − t) y = tyS + 3(1 − t) z = tz + 3(1 − t). S Se imponiamo a questa retta di intersecare la curva C, otteniamo il seguente sistema ( (txS + 3(1 − t))2 + 2(tyS + 3(1 − t))2 + 3(tzS + 3(1 − t))2 = 4 (txS + 3(1 − t)) + (tzS + 3(1 − t)) = 0. Ricavando t dalla seconda equazione, t= 6 6 − xS − zS e sostituendo nella prima, si ottiene 2 2 2 3xS − 3zS −3xS + 6yS − 3zS −3xS + 3zS +2 +3 = 4, 6 − xS − zS 6 − xS − zS 6 − xS − zS da cui, sviluppando i calcoli e semplificando (e trascurando l’indice S), si ottiene alla fine 25x2 + 36y 2 + 25z 2 − 36xy − 22xz − 36yz + 24x + 24z − 72 = 0. Questa è l’equazione del luogo cercato. 3. Soluzioni 135 √ Svolgimento esercizio 13. Le rette parallele al vettore v e distanti 6 dal punto P formano√un cilindro di asse la retta passante per P e parallela a v e raggio di base 6. Le rette cercate si ottengono quindi intersecando questo cilindro con il piano π. Sia r la retta passante per P e parallela a v; essa ha equazioni parametriche x = t + 1 r : y = 3t z = t. Sia X = (x, √y, z) un punto generico del cilindro in questione: si deve avere d(X, r) = 6. Ricordando la formula che fornisce la distanza di un punto da una retta, si ha: ((X − P ) · v)2 = 6, kX − P k − kvk2 2 da cui si ottiene (x − 1 + 3y + z)2 = 6. 11 Sviluppando i calcoli e semplificando, si ha: (x − 1)2 + y 2 + z 2 − 5x2 + y 2 + 5z 2 − 3xy − xz − 3yz − 10x + 3y + z − 28 = 0. √ Questa è l’equazione del cilindro di asse r e raggio di base 6. Intersecando questo cilindro con il piano π si ottiene il sistema ( 5x2 + y 2 + 5z 2 − 3xy − xz − 3yz − 10x + 3y + z − 28 = 0 x − y + 2z = 0, da cui, ricavando y dalla seconda equazione e sostituendo nella prima, si ottiene ( 3(x − z)2 − 7(x − z) − 28 = 0 y = x + 2z. √ Le due soluzioni della prima equazione sono x−z = 7− 6 385 e x−z = si ottengono cosı̀ i due sistemi seguenti: √ √ 7 − 385 7 + 385 x−z = x−z = ; , 6 6 y = x + 2z. y = x + 2z. √ 7+ 385 ; 6 che sono le equazioni delle due rette cercate. Svolgimento esercizio 14. Dalle equazioni dei piani in questione si deduce che i vettori perpendicolari ai piani π1 e π2 sono rispettivamente n1 = (1, 1, 0) e n2 = (1, 0, −1). Si osservi che una retta forma un angolo di π3 con i piani π1 e π2 se e solo se essa forma un angolo pari a π6 con i vettori n1 e n2 . Sia dunque v = (x, y, z) un vettore indeterminato: imponendo a 136 7. Spazio Affine v di formare un angolo pari a π6 con i vettori n1 e n2 si ottiene il seguente sistema: π v · n1 = kvk kn1 k cos 6 v · n = kvk kn k cos π 2 2 6 che ha come unica soluzione (con molteplicità 2) x = −2z y = −z. Ponendo, ad esempio, z = −1, si ottiene il vettore v = (2, 1, −1). Le rette cercate sono quindi tutte le rette parallele al vettore v e distanti 1 dal punto P : esse formano un cilindro di asse la retta passante per P e parallela a v e di raggio di base 1. L’equazione di tale cilindro si trova utilizzando la formula per la distanza di un punto da una retta (vedi l’esercizio precedente). Sviluppando i calcoli si trova, alla fine, 2x2 + 5y 2 + 5z 2 − 4xy + 4xz + 2yz − 8x − 10y − 26z + 29 = 0. Questa è l’equazione del luogo dei punti cercato. Svolgimento esercizio 15. Le equazioni della rette r sono x − 2y − 3 = 0 3y − z + 3 = 0. Il fascio di piani di asse r ha quindi equazione λ(x − 2y − 3) + µ(3y − z + 3) = 0. Imponendo la condizione di passaggio per P si ottiene λ = µ; ponendo quindi λ = µ = 1 si ottiene l’equazione del piano π: π : x + y − z = 0. Sia ora X = (x, y, z) e sia rX la retta passante per P e X. Ricordando la formula per la distanza di un punto da una retta, si ha ((Q − P ) · (X − P ))2 d(Q, rX )2 = kQ − P k2 − , kX − P k2 da cui si ottiene (x − 2z + 2)2 3=5− 2 , x + (y − 1)2 + (z − 1)2 che, sviluppando i calcoli e semplificando, fornisce x2 + 2y 2 − 2z 2 + 4xz − 4x − 4y + 4z = 0. Questa è l’equazione di un cono di vertice P ed asse la retta per P e Q. Le rette cercate si ottengono intersecando questo cono con il piano π: ( x2 + 2y 2 − 2z 2 + 4xz − 4x − 4y + 4z = 0 x + y − z = 0. 3. Soluzioni 137 Ricavando dalla seconda equazione y = z − x e sostituendo nella prima, si ottiene 3x2 = 0, e quindi x = 0. Si noti che si è ottenuta una sola soluzione (con molteplicità 2); esiste √ quindi una sola retta r1 contenuta nel piano π, passante per P e distante 3 dal punto Q (ciò significa che il piano π è tangente al cono in questione). La retta cercata ha dunque equazione x=0 r1 : y − z = 0. Per determinare Q0 basta trovare la retta per Q perpendicolare a π ed intersecarla con π. Dall’equazione di π si vede subito che un vettore perpendicolare a π è il vettore w = (1, 1, −1), quindi la retta cercata ha equazioni x = t + 1 y =t+1 z = −t − 1. Intersecando questa retta con il piano π si trova il punto Q0 = (0, 0, 0). Finalmente, per determinare la retta s è sufficiente trovare un vettore v parallelo ad s, cioè perpendicolare a w ed anche alla retta r1 . Si vede subito che i punti A = (0, 1, 1) e B = (0, 0, 0) appartengono a r1 , quindi un vettore parallelo a r1 è il vettore u = A − B = (0, 1, 1). Di conseguenza, un vettore v perpendicolare a u e w è il vettore v = u ∧ w = (−2, 1, −1). La retta s cercata ha quindi equazioni x = −2t y=t z = −t. Si noti infine che la retta s si può determinare anche come l’intersezione del piano π con il piano passante per Q0 e perpendicolare a r1 , che ha equazione y + z = 0. La retta s ha quindi equazioni cartesiane x+y−z =0 y + z = 0. 3.4. Altri Esercizi Svolgimento esercizio 16. I punti A = (0, 0, 1) e B = (0, 1, 0) appartengono alla retta r, le cui equazioni parametriche sono quindi date da X = A + t(B − A), cioè x = 0 y=t z = 1 − t. 138 7. Spazio Affine Le rette passanti per P e incidenti la retta r sono le rette passanti per P e per il generico punto Xt = (0, t, 1 − t) di r. Basta ora richiedere che l’angolo formato dai vettori Xt − P e B − A sia pari a π6 . Si deve quindi avere π |(Xt − P ) · (B − A)| = kXt − P k kB − Ak cos , 6 che fornisce √ p √ 3 2 2 |2t − 1| = 1 + t + (1 − t) 2 . 2 Elevando al quadrato e semplificando si ottiene alla fine t2 − t − 2 = 0, che ha le seguenti soluzioni: t = −1 e t = 2. In corrispondenza a questi valori di t si ottengono due punti di r, X−1 = (0, −1, 2) e X2 = (0, 2, −1). Le rette cercate sono quindi le rette s e s0 passanti rispettivamente per P e X−1 e per P e X2 . Le loro equazioni cartesiane sono quindi x−y−1=0 x−z−1=0 0 s: s : 2y + z = 0, y + 2z = 0. Svolgimento esercizio 17. Sia A la matrice che descrive l’azione dell’affinità sui vettori: 1 √ 0 − √12 2 0 A=0 1 1 √1 √ 0 2 2 Si verifica subito che AT A = I (dove I indica la matrice identica), quindi AT = A−1 , cioè A è una matrice ortogonale. Ciò prova che f è una isometria dello spazio affine euclideo A3 (R). Cerchiamo ora i punti uniti di f . Sia X = (x, y, z); X è un punto unito se f (X) = X, cioè se z x √ √ 1 + − =x 2 2 y=y √ z x 2 − 1 + √ + √ = z, 2 2 che equivale al seguente sistema: √ z 1 − 2 √ x− √ +1=0 2 2 √ √ 2 √x + 1 − √ z + 2 − 1 = 0. 2 2 Ma queste sono proprio le equazioni di una retta, che è quindi la retta r fatta di punti uniti. 3. Soluzioni 139 La retta r trovata è parallela al vettore u = (0, 1, 0). Per decidere se l’affinità f è una rotazione attorno all’asse r basta controllare se f induce o meno una rotazione dei vettori di un piano perpendicolare a r. Una base di vettori del piano perpendicolare a r è costituita dai vettori v = (1, 0, 0) e w = (0, 0, 1), e questi vettori vengono trasformati da f rispettivamente nei vettori v 0 = Av = √12 v + √12 w e w0 = Aw = − √12 v + √12 w. La matrice della trasformazione lineare indotta dall’affinità f sul piano generato dai vettori v e w è dunque (rispetto alla base data da v e w) 1 π π √ √1 − cos − sin 2 2 4 4 = π π √1 √1 sin cos 4 4 2 2 che corrisponde pertanto ad una rotazione di un angolo pari a alla retta r). π 4 (attorno Svolgimento esercizio 18. Ricordiamo che le rette bisettrici degli angoli formati da r1 e r2 godono della proprietà che i loro punti sono equidistanti dalle due rette r1 e r2 (oltre, naturalmente, alla proprietà di bisecare gli angoli!). Sia quindi X = (x, y) un punto del piano. Imponiamo ora la condizione che la distanza di X da r1 sia uguale alla distanza di X da r2 : d(X, r1 ) = d(X, r2 ). Si ottiene l’equazione seguente: |x − 2y + 1| |3x − y + 2| √ √ = . 5 10 Eliminando i denominatori e i valori assoluti, si ottengono le due equazioni: √ 2 (x − 2y + 1) = ±(3x − y + 2), da cui segue che le rette cercate hanno equazione: √ √ √ s1 : (3 − 2)x + (2 2 − 1)y + 2 − 2 = 0 e s2 : (3 + √ √ √ 2)x − (2 2 + 1)y + 2 + 2 = 0. Capitolo 8 Coniche 1. Richiami di teoria 1.1. Coniche In questo capitolo richiameremo i principali risultati utili allo studio delle coniche nel piano affine euclideo reale standard. Facciamo però notare come l’ambiente più adatto allo studio delle coniche non sia il piano affine ma il piano proiettivo (che è un’estensione del piano affine ottenuta aggiungendo i “punti all’infinito”). Definizione 1.1. Una conica C è il luogo degli zeri di un polinomio di secondo grado nelle variabili x e y: P (x, y) = ax2 + bxy + cy 2 + dx + ey + f = 0. La conica C è detta degenere se il polinomio P (x, y) è il prodotto di due polinomi di primo grado, non-degenere altrimenti. Alla conica C si associa la seguente matrice simmetrica a 2b d2 A = 2b c 2e , d e f 2 2 in modo che si abbia x P (x, y) = (x, y, 1) A y . 1 Se poniamo X = (x, y, 1), l’equazione della conica C si scrive quindi semplicemente come XAX T = 0. Questa equazione può essere interpretata come segue: il punto (x, y) appartiene alla conica C se e solo se il vettore X = (x, y, 1) corrispondente è un vettore isotropo per la forma bilineare simmetrica di matrice A. Da questa osservazione si può facilmente intuire come lo studio delle coniche sia intimamente legato allo studio delle forme bilineari simmetriche. 142 8. Coniche Ricordiamo ora i principali risultati relativi allo studio di una conica. Sia C una conica di matrice A. Proposizione 1.2. La conica C è non-degenere se e solo se det A 6= 0. Se det A = 0, C è una conica degenere, e precisamente C è una retta (contata con molteplicità 2) se rango(A) = 1, mentre C è l’unione di due rette distinte (reali o complesse coniugate) se rango(A) = 2. Nel seguito ci occuperemo solo delle coniche non-degeneri. Sia dunque C una conica non-degenere di matrice A. Indichiamo con A0 la seguente sottomatrice di A: a 2b 0 . A = b c 2 Si ha: Proposizione 1.3. Se det A0 > 0, la conica C è una ellisse (a punti reali o immaginari). Se det A0 = 0, C è una parabola. Se det A0 < 0, C è una iperbole. Osservazione 1.4. Le ellissi e le iperboli sono anche dette coniche a centro, in quanto possiedono un centro di simmetria. Le rette passanti per il centro sono dette diametri. Tra tutti i diametri rivestono particolare importanza quelli che sono anche assi di simmetria per la conica: tali diametri sono detti assi. Tutte le coniche a centro, tranne le circonferenze, possiedono due assi, che sono tra loro ortogonali. Nel caso di una circonferenza tutti i diametri sono assi di simmetria. I vertici di una conica a centro sono i punti di intersezione tra la conica e i suoi assi. 1.2. Ellisse Occupiamoci ora dello studio dettagliato di una ellisse. Sia dunque C una conica di matrice A = (aij ), con det A 6= 0 e det A0 > 0. C è quindi una ellisse non-degenere. Il centro (di simmetria) dell’ellisse è il punto C = (x, y) le cui coordinate sono le soluzioni del seguente sistema: a11 x + a12 y + a13 = 0 a21 x + a22 y + a23 = 0, dove gli aij sono i coefficienti della matrice A. Per determinare gli assi (di simmetria) abbiamo bisogno di conoscere gli autovettori, e quindi anche gli autovalori, della sottomatrice A0 di A. Siano dunque λ1 , λ2 gli autovalori di A0 e v1 , v2 gli autovettori corrispondenti. Gli assi sono le rette passanti per il centro C e parallele ai vettori v1 e v2 . Nel sistema di riferimento che ha come origine il centro C dell’ellisse e come assi X e Y gli assi dell’ellisse, l’equazione dell’ellisse assume la seguente 1. Richiami di teoria 143 forma, detta forma canonica: C : αX 2 + βY 2 = 1, ove i coefficienti α e β sono dati da det A0 det A0 , β = −λ2 . det A det A Altri due punti notevoli relativi allo studio di una ellisse sono i suoi fuochi (che non sono punti dell’ellisse). I fuochi di una ellisse sono due punti che stanno su uno degli assi dell’ellisse, detto asse focale, in posizione simmetrica rispetto al centro, a una distanza d da esso. Tale distanza è data dalla seguente formula: s α = −λ1 d= β−α , αβ se è α < β (altrimenti bisogna scambiare i ruoli di α e β). Un metodo per determinare quale dei due assi trovati sia l’asse focale verrà illustrato negli esercizi. Si dimostra infine che l’ellisse è caratterizzata dalla seguente proprietà: Proposizione 1.5. L’ellisse è il luogo geometrico dei punti del piano tali che la somma delle distanze dai fuochi sia costante. 1.3. Iperbole Consideriamo ora lo studio di una iperbole. Sia dunque C una conica di matrice A = (aij ), con det A 6= 0 e det A0 < 0. C è quindi una iperbole non-degenere. Come nel caso dell’ellisse, il centro (di simmetria) dell’iperbole è il punto C = (x, y) le cui coordinate sono le soluzioni del seguente sistema: a11 x + a12 y + a13 = 0 a21 x + a22 y + a23 = 0. Per determinare gli assi (di simmetria) abbiamo bisogno di conoscere gli autovettori, e quindi anche gli autovalori, della sottomatrice A0 di A. Siano dunque λ1 , λ2 gli autovalori di A0 e v1 , v2 gli autovettori corrispondenti. Gli assi sono le rette passanti per il centro C e parallele ai vettori v1 e v2 . Nel sistema di riferimento che ha come origine il centro C dell’iperbole e come assi X e Y gli assi dell’iperbole, l’equazione dell’iperbole assume la seguente forma, detta forma canonica: C : αX 2 + βY 2 = 1, ove i coefficienti α e β sono dati da α = −λ1 det A0 , det A β = −λ2 det A0 . det A 144 8. Coniche Nel caso dell’iperbole ci sono altre due rette che hanno un importante significato geometrico: gli asintoti. Gli asintoti di una iperbole C sono le rette passanti per il centro C e “tangenti all’infinito” a C . Le direzioni degli asintoti sono determinate dai vettori v = (x, y) che soddisfano l’equazione a11 x2 + 2a12 xy + a22 y 2 = 0. Un’iperbole è detta equilatera se i suoi asintoti sono ortogonali. Infine, come nel caso dell’ellisse, ci sono due punti notevoli detti fuochi (che non sono punti dell’iperbole). I fuochi di una iperbole sono due punti che stanno su uno degli assi dell’iperbole, detto asse focale, in posizione simmetrica rispetto al centro, a una distanza d da esso. Tale distanza è data dalla seguente formula: s β−α d= , αβ se è β < 0 < α (altrimenti bisogna scambiare i ruoli di α e β). Un metodo per determinare quale dei due assi trovati sia l’asse focale verrà illustrato negli esercizi. Si dimostra infine che l’iperbole è caratterizzata dalla seguente proprietà: Proposizione 1.6. L’iperbole è il luogo geometrico dei punti del piano tali che la differenza delle distanze dai fuochi sia costante. 1.4. Parabola Consideriamo infine lo studio di una parabola. Sia dunque C una conica di matrice A = (aij ), con det A 6= 0 e det A0 = 0. C è quindi una parabola non-degenere. Consideriamo il vettore w = (a11 , a12 ) e sia v = (−a12 , a11 ) un vettore ortogonale a w. Il vettore v determina la direzione dell’asse di simmetria della parabola. Il punto V in cui la parabola interseca il suo asse di simmetria è detto il vertice della parabola. Si può dimostrare che l’asse della parabola è la retta di equazione ax + by + c = 0, ove i coefficienti a, b e c sono dati da: a11 a b = A a12 . 0 c Trovato l’asse della parabola si determina poi facilmente il vertice V mettendo a sistema l’equazione dell’asse con l’equazione della parabola. Nel sistema di riferimento che ha come origine il vertice V , come asse Y l’asse della parabola e come asse X la retta per il vertice ortogonale all’asse Y , l’equazione della parabola assume la seguente forma, detta forma 1. Richiami di teoria 145 canonica: 1 C : Y = αX 2 , 2 ove il coefficiente α è dato da r α = ±λ − λ , det A ove λ è l’autovalore non-nullo di A0 e il segno è scelto in modo che α > 0 (in realtà dipende da come si decide di orientare l’asse Y ). Nel caso della parabola c’è un solo altro punto notevole, detto fuoco; è il punto che si trova sull’asse ad una distanza d dal vertice, dalla parte “interna” della parabola (cioè nella regione di piano convessa delimitata dalla parabola). La distanza d è data dalla seguente formula: d= 1 . 2α C’è poi una retta notevole, detta direttrice; è la retta parallela al vettore w, distante d dal vertice, e contenuta nella regione “esterna” alla parabola (cioè nella regione di piano concava delimitata dalla parabola). Si dimostra infine che la parabola è caratterizzata dalla seguente proprietà: Proposizione 1.7. La parabola è il luogo geometrico dei punti del piano equidistanti dal fuoco e dalla direttrice. 1.5. Fasci di coniche Ricordiamo la definizione di un fascio di coniche: Definizione 1.8. Siano C1 e C2 due coniche di equazioni P1 (x, y) = 0 e P2 (x, y) = 0 rispettivamente. Il fascio di coniche generato da C1 e C2 è l’insieme di tutte le coniche le cui equazioni sono date da λP1 (x, y) + µP2 (x, y) = 0, al variare dei parametri λ e µ in R. La seguente osservazione è molto importante nello studio dei fasci di coniche: Osservazione 1.9. Se P ∈ C1 ∩ C2 , allora P appartiene a ogni conica del fascio generato da C1 e C2 . Di conseguenza tutte le coniche del fascio generato da C1 e C2 passano per tutti i punti in cui le due coniche C1 e C2 si intersecano. Tali punti sono detti i punti base del fascio di coniche. 146 8. Coniche 2. Esercizi 2.1. Coniche Degeneri Esercizio 1. Nel piano euclideo, si studi la conica C di equazione 4x2 + 9y 2 − 12xy + 4x − 6y + 1 = 0. Esercizio 2. Nel piano euclideo, si studi la conica C di equazione 2x2 − 3y 2 − 5xy + 3x + 5y − 2 = 0. 2.2. Iperbole Esercizio 3. Nel piano euclideo, si studi la conica C di equazione x2 − 4xy + 3y 2 + 2x − 2y + 2 = 0. 2.3. Ellisse Esercizio 4. Nel piano euclideo, si studi la conica C di equazione 3x2 − 4xy + 4y 2 + 6x + 2y + 2 = 0. 2.4. Parabola Esercizio 5. Nel piano euclideo, si studi la conica C di equazione x2 + 4xy + 4y 2 − 2x + 4y + 1 = 0. 2.5. Altri Esercizi Esercizio 6. Nel piano euclideo, sia C la conica di equazione 2xy + 2y 2 + 2y − 1 = 0. Si determinino le equazioni delle rette passanti per il punto P = (−3, 1) e tangenti alla conica C . Esercizio 7. Nel piano euclideo, si determini l’equazione della conica C avente un fuoco nel punto F = (2, 1), passante per P = (1, 3) e tale che la direttrice relativa al fuoco F (cioè la retta polare di F ) sia la retta d di equazione x + y − 1 = 0. Si determini inoltre l’eccentricità di C . 3. Soluzioni 147 2.6. Fasci di Coniche Esercizio 8. Nel piano euclideo si determini l’equazione della conica C passante per i punti P1 = (0, 1), P2 = (0, 0), P3 = (3/2, 2), P4 = (1, 1) e P5 = (−1/3, 2/3). Esercizio 9. Nel piano euclideo si determini l’equazione della conica C passante per il punto P = (0, 2), tangente alla retta r : x − y + 1 = 0 nel punto R = (1, 2) e tangente alla retta s : 2x + y − 1 = 0 nel punto S = (2, −3). Esercizio 10. Sia F un fascio di coniche nel piano euclideo e sia P un punto distinto dai punti base del fascio F . Si dimostri che le polari di P rispetto alle coniche del fascio F formano un fascio di rette. 3. Soluzioni 3.1. Coniche Degeneri Svolgimento esercizio 1. Una matrice associata alla conica C è: 4 −6 2 A = −6 9 −3 . 2 −3 1 Calcolando il determinante di A si trova det A = 0, quindi la conica C è degenere. Bisogna allora determinare il rango di A, che risulta essere 1, dato che la prima e la seconda riga di A sono multiple della terza (oppure, dato che tutti i minori di ordine 2 sono nulli). Da ciò si deduce che la conica C è una retta, contata con molteplicità 2. Se indichiamo con ax + by + c = 0 l’equazione di tale retta, si deve avere 4x2 + 9y 2 − 12xy + 4x − 6y + 1 = (ax + by + c)2 , da cui si deduce che l’equazione della retta cercata è 2x − 3y + 1 = 0. La conica C è rappresentata in figura 1. Svolgimento esercizio 2. Una matrice associata alla conica C è: 4 −5 3 A = −5 −6 5 . 3 5 −4 Calcolando il determinante di A si trova det A = 0, quindi la conica C è degenere. La matrice A ha rango 2, come si vede facilmente considerando i 148 8. Coniche 1.5 1 0.5 -2 -1 1 2 -0.5 -1 Figura 1. minori di ordine due. Da ciò si deduce che la conica C è costituita da due rette distinte r1 e r2 . Per calcolare le equazioni di r1 e r2 si può procedere come segue. Indichiamo con C il punto r1 ∩r2 (se r1 e r2 non sono parallele); per determinare C si può, ad esempio, intersecare la conica con un fascio di rette, ad esempio il fascio di rette di equazione y = µ, ed imporre che vi sia un solo punto di intersezione; quest’unico punto di intersezione sarà dunque il punto C (alla fine dell’esercizio è proposto un altro procedimento per determinare il punto C). Risolvendo il sistema ( 2x2 − 3y 2 − 5xy + 3x + 5y − 2 = 0 y=µ si ottiene 2x2 + (3 − 5µ)x − 3µ2 + 5µ − 2 = 0. Quest’ultima equazione ha una sola soluzione (con molteplicità 2) se e solo se il suo discriminante è nullo: ∆ = 49µ2 − 70µ + 25 = (7µ − 5)2 = 0, da cui si ricava µ = 57 . Sostituendo questo valore di µ nell’equazione (∗) e risolvendo, si ottiene x = 17 . Il punto C ha dunque coordinate C = ( 71 , 57 ). Basta ora trovare altri due punti di C , per esempio i due punti di intersezione della conica con la retta di equazione y = 0: ( 2x2 − 3y 2 − 5xy + 3x + 5y − 2 = 0 y=0 da cui si ricava P1 = ( 21 , 0) e P2 = (−2, 0). Le due rette r1 e r2 sono allora le rette passanti per C e P1 , e per C e P2 rispettivamente, le cui equazioni 3. Soluzioni 149 3 2 1 -1 C -0.5 0.5 1 -1 Figura 2. sono: r1 : 2x + y − 1 = 0, r2 : x − 3y + 2 = 0. La conica C è rappresentata in figura 2. Determinazione del punto C: un altro modo per determinare il punto C = r1 ∩ r2 è basato sul fatto che C è l’unico punto singolare della conica C , quindi le sue coordinate si ottengono risolvendo il sistema ∂f (x, y) = 0 ∂x ∂f (x, y) = 0 ∂y dove f (x, y) = 0 è l’equazione della conica C . Chi non fosse convinto di ciò, può facilmente dimostrare (farlo per esercizio) che, se f (x, y) = (ax + by + c)(a0 x + b0 y + c0 ), allora i due sistemi lineari ∂f (x, y) = 0 ∂x ∂f (x, y) = 0 ∂y e ax + by + c = 0 a0 x + b 0 y + c 0 = 0 hanno la stessa soluzione (si tratta proprio del punto C in cui si intersecano le due rette di equazione ax + by + c = 0 e a0 x + b0 y + c0 = 0). 150 8. Coniche 3.2. Iperbole Svolgimento esercizio 3. Una matrice associata alla conica C è: 1 −2 1 A = −2 3 −1 . 1 −1 2 Calcolando il determinante di A si trova det A = −2, quindi la conica C è non-degenere. Consideriamo la sottomatrice 1 −2 0 A = . −2 3 Si ha det A0 = −1 < 0, quindi la conica C è una conica a centro e, precisamente, un’iperbole. Centro: il centro C = (xC , yC ) è il punto le cui coordinate sono date da 1 a11 a13 1 a12 a13 , yC = − , xC = det A0 a22 a23 det A0 a12 a23 dove gli aij sono i coefficienti della matrice A. Nel nostro caso, si ha: −2 1 1 1 = 1, = 1, xC = − yC = 3 −1 −2 −1 quindi C = (1, 1). Assi: gli assi si possono determinare come segue. Come prima cosa determiniamo gli autovalori di A0 : nel nostro caso si trova √ √ λ1 = 2 − 5, λ2 = 2 + 5. Gli autovettori corrispondenti sono, rispettivamente, √ √ v1 = (1 + 5, 2), v2 = (1 − 5, 2). Gli autovettori di A0 rappresentano le direzioni degli assi. Gli assi sono quindi le rette r1 e r2 passanti per il centro C e parallele ai vettori v1 e v2 rispettivamente. Le loro equazioni parametriche sono quindi: ( ( √ √ x = 1 + (1 − 5)t x = 1 + (1 + 5)t r2 : r1 : y = 1 + 2t y = 1 + 2t Forma canonica: la forma canonica di un’iperbole è data dalla seguente matrice α 0 0 ∆ = 0 β 0 . 0 0 −1 3. Soluzioni 151 Gli elementi α e β sulla diagonale non sono altro che gli autovalori di A0 A0 moltiplicati per − det . Nel nostro caso si trova: det A √ 1 5 α = − λ1 = −1 + , 2 2 √ 5 1 . β = − λ2 = −1 − 2 2 Fuochi: i fuochi reali dell’iperbole sono due punti che si trovano sull’asse focale ad una distanza d dal centro C. Per determinare i fuochi bisogna quindi determinare l’asse focale e la distanza d. Fra i due valori α e β trovati, uno di essi è positivo (nel nostro caso α), mentre l’altro (nel nostro caso β) è negativo: l’asse focale è quello determinato dall’autovettore di A0 corrispondente al valore positivo. Nel nostro caso l’asse focale è quello determinato dall’autovettore v1 (che corrisponde all’autovalore λ1 che, a sua volta, corrisponde ad α), ed è quindi la retta r1 . Dato che si ha β < 0 < α, la distanza d tra i fuochi e il centro C si calcola con la formula seguente: s β−α d= . αβ √ Nel nostro caso si trova d = 2 4 5. Per trovare le coordinate affini dei fuochi, si può procedere ora come segue: si determini il versore dell’asse focale v̂1 = kvv11 k . I fuochi sono i due punti F1 e F2 dati da: F1 = C − dv̂1 , F2 = C + dv̂1 . Asintoti: per determinare le equazioni degli asintoti si può procedere nel modo seguente. Nell’equazione dell’iperbole C si considerino solo i termini di secondo grado, ottenendo l’equazione x2 − 4xy + 3y 2 = 0. Le soluzioni di quest’ultima equazione sono date da x = 3y oppure x = y. Queste sono le equazioni di due rette parallele ai vettori w1 = (3, 1) e w2 = (1, 1) rispettivamente. Gli asintoti sono le rette passanti per il centro C e parallele ai vettori w1 e w2 rispettivamente (cioè le rette per C parallele alle due rette trovate, di equazioni x = 3y e x = y). Le loro equazioni parametriche sono quindi: x = 1 + 3t x=1+t s1 : s2 : y =1+t y =1+t e le corrispondenti equazioni cartesiane sono: s1 : x − 3y + 2 = 0, s2 : −x + y = 0. 152 8. Coniche 10 5 -10 -5 5 10 -5 -10 Figura 3. Si noti che i vettori w1 e w2 non sono ortogonali, quindi C non è una iperbole equilatera. La conica C è rappresentata in figura 3. 3.3. Ellisse Svolgimento esercizio 4. Una matrice associata alla conica C è: 3 −2 3 A = −2 4 1 . 3 1 2 Calcolando il determinante di A si trova det A = −35, quindi la conica C è non-degenere. Consideriamo la sottomatrice 3 −2 0 A = . −2 4 Si ha det A0 = 8 > 0, quindi la conica C è una conica a centro e, precisamente, una ellisse. 3. Soluzioni 153 Centro: il centro C = (xC , yC ) è il punto le cui coordinate sono date da 1 a11 a13 1 a12 a13 xC = , yC = − , det A0 a22 a23 det A0 a12 a23 dove gli aij sono i coefficienti della matrice A. Nel nostro caso, si ha: 7 1 3 3 9 1 −2 3 =− , =− , yC = − xC = 8 4 1 4 8 −2 1 8 quindi C = (−7/4, −9/8). Assi: gli assi si possono determinare come segue. Come prima cosa determiniamo gli autovalori di A0 : nel nostro caso si trova √ √ 7 + 17 7 − 17 , λ2 = . λ1 = 2 2 Gli autovettori corrispondenti sono, rispettivamente, √ √ v1 = (1 + 17, 4), v2 = (1 − 17, 4). Gli autovettori di A0 rappresentano le direzioni degli assi. Gli assi sono quindi le rette r1 e r2 passanti per il centro C e parallele ai vettori v1 e v2 rispettivamente. Le loro equazioni parametriche sono quindi: ( ( √ √ x = −7/4 + (1 + 17)t x = −7/4 + (1 − 17)t r1 : r2 : y = −9/8 + 4t y = −9/8 + 4t Forma canonica: la forma canonica di una ellisse è data dalla seguente matrice α 0 0 ∆ = 0 β 0 . 0 0 −1 Gli elementi α e β sulla diagonale non sono altro che gli autovalori di A0 A0 moltiplicati per − det . Nel nostro caso si trova: det A √ 8 4(7 − 17) α = λ1 = , 35 35√ 8 4(7 + 17) β = λ2 = . 35 35 Fuochi: i fuochi reali dell’ellisse sono due punti che si trovano sull’asse focale ad una distanza d dal centro C. Per determinare i fuochi bisogna quindi determinare l’asse focale e la distanza d. Fra i due valori α e β trovati, entrambi positivi, uno di essi è minore dell’altro (perché la conica non è un cerchio). Nel nostro caso si tratta di α. L’asse focale è quello determinato dall’autovettore di A0 corrispondente al valore minore. Nel nostro caso l’asse focale è quello determinato dall’autovettore v1 (che corrisponde all’autovalore λ1 che, a sua volta, corrisponde ad α), ed è quindi la retta r1 . 154 8. Coniche -3.5 -3 -2.5 -2 -1.5 -1 -0.5 -0.5 -1 -1.5 -2 -2.5 Figura 4. Dato che α < β, la distanza d tra i fuochi e il centro C si calcola con la formula seguente: s β−α d= . αβ √ √ 35 17 Nel nostro caso si trova d = . 8 Per trovare le coordinate dei fuochi, si può procedere ora come segue: si determini il versore dell’asse focale v̂1 = kvv11 k . I fuochi sono i due punti F1 e F2 dati da: F1 = C − dv̂1 , F2 = C + dv̂1 . La conica C è rappresentata in figura 4. 3.4. Parabola Svolgimento esercizio 5. Una matrice 1 2 A= 2 4 −1 2 associata alla conica C è: −1 2 . 1 Calcolando il determinante di A si trova det A = −16, quindi la conica C è non-degenere. Consideriamo la sottomatrice 1 2 0 A = . 2 4 3. Soluzioni 155 Si ha det A0 = 0, quindi la conica C è una parabola. Asse e Vertice: Sia w = (a11 , a12 ) = (1, 2), e sia v = (−a12 , a11 ) = (−2, 1) un vettore ortogonale a w. Il vettore v determina la direzione dell’asse della parabola. L’equazione cartesiana dell’asse della parabola si può trovare come segue: poniamo a11 a b = A a12 . 0 c Allora l’asse è la retta r di equazione ax + by + c = 0. Nel nostro caso si trova: a 1 5 b = A 2 = 10 , c 0 3 quindi l’asse ha equazione r : 5x + 10y + 3 = 0. Il vertice V è il punto di intersezione tra l’asse e la parabola. Risolvendo il sistema ( x2 + 4xy + 4y 2 − 2x + 4y + 1 = 0 5x + 10y + 3 = 0 1 8 si trova x = 25 e y = − 25 . Il vertice è quindi il punto V di coordinate 1 8 ( 25 , − 25 ). Forma canonica: la forma canonica di una parabola è data dalla seguente matrice α 0 0 ∆ = 0 0 −1 . 0 −1 0 Il coefficiente α è dato dalla seguente formula: r λ α = ±λ − , det A ove λ è l’autovalore non nullo di A0 e il segno è scelto in modo che α sia positivo (dipende in realtà da come si orientano gli assi del nuovo sistema di riferimento). √ Nel nostro caso si trova λ = 5 e quindi α = 5 4 5 . Fuoco e Direttrice: il fuoco di una parabola è il punto che si trova sull’asse ad una distanza d dal vertice, dalla parte “interna” della parabola (cioè nella regione di piano convessa delimitata dalla parabola). La distanza d è data dalla seguente formula: 1 d= . 2α √ Nel nostro caso si trova d = 2255 . 156 8. Coniche -1 1 2 3 -1 -2 -3 Figura 5. La direttrice è invece la retta parallela al vettore w, distante d dal vertice, e contenuta nella regione “esterna” alla parabola (cioè nella regione di piano concava delimitata dalla parabola). La conica C è rappresentata in figura 5. 3.5. Altri Esercizi Svolgimento esercizio 6. Consideriamo la matrice A associata alla conica C: 0 1 0 A = 1 2 1 . 0 1 −1 Calcolando il determinante di A si trova det A = 1, quindi la conica C è non-degenere. Consideriamo la sottomatrice 0 1 0 A = . 1 2 Si ha det A0 = −1, quindi C è una iperbole. 3. Soluzioni 157 Ricordiamo che le tangenti per il punto P alla conica C sono le rette passanti per P e i punti A e B di intersezione tra C e la polare rP del punto P . Determiniamo quindi l’equazione della retta rP , polare del punto P . L’equazione di tale retta è ax + by + c = 0, dove i tre coefficienti a, b e c sono dati da a xP −3 1 b = A yP = A 1 = 0 . c 1 1 0 La retta rP ha dunque equazione x = 0. I punti A e B di intersezione tra la retta rP e la conica C si trovano risolvendo il sistema ( 2xy + 2y 2 + 2y − 1 = 0 x=0 √ √ ). Le due tangenti cercate sono Si trova A = (0, − 3+1 ) e B = (0, 3−1 2 2 quindi le rette di equazione √ √ ( 3 + 3)x + 6y + 3 + 3 3 = 0, (retta per P e A) e √ √ ( 3 − 3)x − 6y − 3 + 3 3 = 0, (retta per P e B). Svolgimento esercizio 7. Sia X = (x, y) un punto del piano affine. Per definizione di eccentricità, X appartiene alla conica C se e solo se il rapporto tra le distanze di X da F e dalla retta d è uguale all’eccentricità e. Si deve quindi avere: p (x − 2)2 + (y − 1)2 = e. |x+y−1| √ 2 Questa è l’equazione della conica C ; ovviamente il parametro e è ancora indeterminato. Per determinare l’eccentricità e e, di conseguenza, l’equazione di C , basta ora imporre la condizione di passaggio per il punto P = (1, 3). √ In questo modo si trova e = 10/3. Dato che e > 1 possiamo affermare che la conica C è una iperbole. Sostituendo questo valore di e nell’equazione precedente, e sviluppando i calcoli, si trova l’equazione di C : 2x2 + 2y 2 + 10xy + 2x − 4y − 10 = 0. 3.6. Fasci di Coniche Svolgimento esercizio 8. Per determinare l’equazione della conica C passante per i cinque punti dati, l’idea è di considerare il fascio di coniche passanti per quattro di questi punti, e poi imporre la condizione di passaggio per il quinto punto. 158 8. Coniche Consideriamo, ad esempio, il fascio F di coniche passanti per P1 , P2 , P4 e P5 . Per determinare l’equazione del fascio F basta conoscere le equazioni di due coniche di tale fascio. Si noti che la retta r1 per P1 e P2 ha equazione x = 0, mentre la retta r2 per P4 e P5 ha equazione x−4y+3 = 0. Come prima conica C1 consideriamo quindi l’unione delle due rette r1 e r2 . Si tratta di una conica degenere, che certamente passa per i quattro punti scelti. L’equazione di C1 è dunque C1 : x(x − 4y + 3) = 0. Analogamente possiamo considerare come seconda conica C2 la conica degenere data dall’unione delle due rette s1 , passante per P1 e P4 , e s2 , passante per P2 e P5 . Dato che s1 ha equazione y−1 = 0 e s2 ha equazione 2x+y = 0, la conica C2 ha equazione C2 : (y − 1)(2x + y) = 0. L’equazione del fascio F è quindi: λx(x − 4y + 3) + µ(y − 1)(2x + y) = 0. λ+ Imponendo ora la condizione di passaggio per il punto P3 , si trova − 21 4 5µ = 0, da cui si ha, ad esempio, λ = 20 e µ = 21. Sostituendo questi valori nell’equazione di F si trova l’equazione della conica C cercata: C : 20x2 + 21y 2 − 38xy + 18x − 21y = 0. Svolgimento esercizio 9. Consideriamo il fascio F di coniche tangenti alla retta r : x − y + 1 = 0 nel punto R = (1, 2) e alla retta s : 2x + y − 1 = 0 nel punto S = (2, −3). Tale fascio contiene due coniche degeneri: una è la conica C1 data dall’unione delle due rette r e s, l’altra è la conica C2 che consiste nella retta σ, passante per i punti R e S, con molteplicità due (infatti tale retta σ, contata con molteplicità due, contiene i punti R e S con molteplicità di intersezione 2). La conica C1 ha dunque equazione (x − y + 1)(2x + y − 1) = 0, mentre C2 ha equazione (5x + y − 7)2 = 0. L’equazione del fascio F è pertanto: F : λ(x − y + 1)(2x + y − 1) + µ(5x + y − 7)2 = 0. Se imponiamo la condizione di passaggio per il punto P = (0, 2), troviamo λ = 25µ, da cui si deduce, ad esempio, che λ = 25 e µ = 1. Sostituendo questi valori nell’equazione del fascio F troviamo l’equazione della conica C cercata: C : 75x2 − 24y 2 − 15xy − 45x + 36y + 24 = 0. Svolgimento esercizio 10. Fissiamo un sistema di riferimento nel piano euclideo, in modo da far corrispondere ad ogni conica una matrice quadrata. Siano ora A e B le matrici di due coniche del fascio F . Tutte le coniche di F sono allora date dalle matrici λA+µB, al variare dei parametri λ, µ ∈ R. 3. Soluzioni 159 Se P = (xP , yP ), le polari di P rispetto alle coniche del fascio sono le rette di equazione ax + by + c = 0, ove i tre coefficienti a, b e c sono dati da a xP xP xP a1 a2 b = (λA + µB) yP = λA yP + µB yP = λ b1 + µ b2 , c 1 1 1 c1 c2 ove abbiamo posto a1 xP b1 = A y P , c1 1 a2 xP b2 = B y P . c2 1 Da ciò si deduce che le equazioni delle polari di P hanno la seguente forma: λ(a1 x + b1 y + c1 ) + µ(a2 x + b2 y + c2 ) = 0, che è precisamente l’equazione di un fascio di rette. Capitolo 9 Funzioni di più Variabili 1. Richiami di teoria 1.1. Limiti e continuità Sia f~ : Rn → Rm una funzione di n variabili a valori vettoriali. Indicheremo con ~x = (x1 , . . . , xn ) il generico punto di Rn e con ~y = (y1 , . . . , ym ) il generico punto di Rm . Quindi la scrittura f~(~x) = ~y significa in realtà f~(x1 , . . . , xn ) = (y1 , . . . , ym ). Di conseguenza la funzione a valori vettoriali f~ : Rn → Rm è data da m funzioni a valori scalari y1 = f1 (x1 , . . . , xn ), . . . , ym = fm (x1 , . . . , xn ). Scriveremo quindi f~ = (f1 , . . . , fm ) ove le fi : Rn → R, per i = 1, . . . , m, sono delle funzioni reali di n variabili dette le componenti di f~. Definizione 1.1. Sia A ⊂ Rn un sottoinsieme aperto, sia f~ : A → Rm e sia ~x0 ∈ A. Diremo che lim f~(~x) = ~y ∈ Rm ~ x→~ x0 se per ogni > 0 esiste δ > 0 tale che si abbia kf~(~x) − ~y k < per ogni ~x ∈ A con k~x − ~x0 k < δ. Anche per i limiti delle funzioni di più variabili valgono dei teoremi analoghi ai noti teoremi sui limiti delle funzioni di una sola variabile. Ad esempio: il limite della somma di due funzioni è la somma dei limiti delle singole funzioni (quando questi limiti esistono), etc. Ricordiamo che la norma di un vettore in Rn è definita come segue: q k(x1 , . . . , xn )k = x21 + · · · + x2n . Dalla definizione precedente segue facilmente il seguente risultato: 162 9. Funzioni di più Variabili Proposizione 1.2. Se f1 , . . . , fm sono le funzioni componenti di f~, cioè se f~ = (f1 , . . . , fm ), allora si ha lim f~(~x) = ~y ~ x→~ x0 se e solo se lim fi (~x) = yi , ~ x→~ x0 ove le yi , per i = 1, . . . , m, sono le componenti del vettore ~y , cioè ~y = (y1 , . . . , ym ). Questo risultato mostra come il calcolo del limite di una funzione a valori vettoriali si riconduca al calcolo di limiti di funzioni a valori scalari: si può riassumere affermando che il limite della funzione f~(~x) è il vettore le cui componenti sono i limiti delle funzioni fi (~x), componenti di f~. Osserviamo che il calcolo del limite di una funzione reale di più variabili non si può ridurre, in generale, al calcolo di limiti di funzioni di una variabile. Il seguente risultato però è molto utile per dimostrare che determinati limiti non esistono. Proposizione 1.3. Se esiste il limite lim f~(~x) = ~y , ~ x→~ x0 allora esiste anche il limite, per ~x che tende a ~x0 , della funzione f~ ristretta a una qualunque curva Γ passante per ~x0 , e tutti questi limiti coincidono. Si ha quindi lim f~(~x) = ~y , ~ x→~ x0 ~ x∈Γ per ogni curva Γ passante per ~x0 . Di conseguenza se troviamo due curve Γ1 e Γ2 tali che la funzione f~ ristretta a Γ1 e Γ2 ammetta, per ~x che tende a ~x0 , due limiti diversi, possiamo concludere che la funzione f~(~x) non ammette limite per ~x che tende a ~x0 . Questo risultato sarà spesso usato negli esercizi. Siamo ora in grado di dare la definizione di funzione continua. Definizione 1.4. Sia A un sottoinsieme aperto di Rn , sia f~ : A → Rm una funzione e sia ~x0 ∈ A. Diremo che la funzione f~ è continua in ~x0 se lim f~(~x) = f~(~x0 ). ~ x→~ x0 Diremo che f~ è continua in A se essa è continua in ogni punto di A. Anche per le funzioni continue di più variabili valgono dei teoremi analoghi ai noti teoremi sulle funzioni continue di una sola variabile. Ad esempio: la somma di funzioni continue è ancora una funzione continua, la composizione di più funzioni continue è ancora una funzione continua, etc. 2. Esercizi 163 2. Esercizi 2.1. Limiti Esercizio 1. Si dimostri che il seguente limite non esiste: xy lim . 2 (x,y)→(0,0) x + y 2 Esercizio 2. Si dimostri che il seguente limite non esiste: x2 y . (x,y)→(0,0) x4 + y 2 lim Esercizio 3. Si dimostri che il seguente limite esiste e si calcoli il suo valore: 2x2 y . (x,y)→(0,0) x2 + y 2 lim Esercizio 4. Si dimostri che il seguente limite esiste e si calcoli il suo valore: sin2 (xy) . (x,y)→(0,0) x2 + y 2 lim Esercizio 5. Si dica se il seguente limite esiste oppure no, ed eventualmente si calcoli il suo valore: x3 y . lim (x,y)→(0,0) x6 + y 2 Esercizio 6. Si dica se il seguente limite esiste oppure no, ed eventualmente si calcoli il suo valore: xy sin x lim . (x,y)→(0,0) x2 sin y + y 2 2.2. Funzioni continue Esercizio 7. Si dica se la seguente funzione √ e xy cos(y 2 ) + 1 f (x, y) = sin(log(xy 2 ) − x) è continua nel suo insieme di definizione. Esercizio 8. Si dica se la seguente funzione ( sin(xy) se (x, y) 6= (0, 0) 2 2 f (x, y) = x +2y 0 se (x, y) = (0, 0) è continua in tutto R2 . 164 9. Funzioni di più Variabili Esercizio 9. Si dica se la seguente funzione ( − 1 e x2 +y2 se (x, y) 6= (0, 0) f (x, y) = 0 se (x, y) = (0, 0) è continua in tutto R2 . Esercizio 10. Sia f : R2 → R la seguente funzione ( (x+y) sin2 x se x 6= 0 e y 6= 0 2xy 2 f (x, y) = 0 altrimenti. Si determinino tutti i punti in cui f è continua. 3. Soluzioni 3.1. Limiti Svolgimento esercizio 1. Calcoliamo il limite in questione facendo tendere il punto (x, y) a (0, 0) lungo una retta di equazione y = mx (cioè calcoliamo il limite della funzione ristretta a questa retta). Si trova quindi: xy mx2 m = lim = . 2 2 2 2 2 x→0 x + m x 1 + m2 (x,y)→(0,0) x + y lim y=mx Il valore del limite dipende quindi da m, e cioè dalla retta scelta. In altre parole, facendo tendere il punto (x, y) a (0, 0) lungo due rette diverse si trovano due limiti diversi. Si conclude quindi che il limite cercato non può esistere. Svolgimento esercizio 2. Calcoliamo il limite in questione facendo tendere il punto (x, y) a (0, 0) lungo una retta di equazione y = mx. Si trova: x2 y mx3 = lim 4 2 x→0 x4 + m2 x2 (x,y)→(0,0) x + y lim y=mx mx = 0, + m2 almeno se m = 6 0. Trattiamo a parte il caso m = 0, cioè il caso della retta y = 0. x2 y 0 lim = lim 4 = 0. 4 2 x→0 x (x,y)→(0,0) x + y = lim x→0 x2 y=0 Un risultato analogo vale per la retta di equazione x = 0. Si scopre quindi che la funzione ristretta ad ogni retta passante per l’origine ammette sempre lo stesso limite, pari a 0. Da questo fatto non si può però dedurre che allora 3. Soluzioni 165 il limite cercato esiste e vale 0. Infatti se facciamo tendere il punto (x, y) a (0, 0) lungo la parabola di equazione y = x2 , si trova: x2 y x4 1 = lim = . 4 2 x→0 x4 + x4 2 (x,y)→(0,0) x + y lim y=x2 Dato che questo limite è diverso dai precedenti, si conclude che il limite cercato non esiste. Svolgimento esercizio 3. In questo caso bisogna dimostrare che un limite esiste. Non serve a nulla quindi calcolare il limite della restrizione della funzione a particolari curve passanti per l’origine: bisogna procedere in un altro modo. Nel caso in questione osserviamo che, per ogni x e y, si ha x2 ≤ x2 + y 2 , da cui deriva che x2 ≤ 1. x2 + y 2 Da queste disuguaglianze deriva che 2x2 y ≤ 2|y|. 0≤ 2 x + y2 0≤ Ma la funzione |y| tende a zero per (x, y) → (0, 0), quindi si ha necessariamente 2x2 y = 0. lim (x,y)→(0,0) x2 + y 2 Svolgimento esercizio 4. Anche in questo caso bisogna dimostrare che il limite in questione esiste. Possiamo utilizzare un ragionamento simile a quello usato nell’esercizio precedente. Innanzi tutto ricordiamo che la funzione sin z è asintotica a z, per z → 0, sin z ∼ z. Si ha quindi sin2 (xy) ∼ (xy)2 , da cui si deduce che sin2 (xy) x2 y 2 lim = lim . (x,y)→(0,0) x2 + y 2 (x,y)→(0,0) x2 + y 2 Osservando che 0≤ x2 ≤ 1, x2 + y 2 0≤ x2 y 2 ≤ y2. x2 + y 2 si ottiene 166 9. Funzioni di più Variabili Infine, dato che la funzione y 2 tende a zero per (x, y) → (0, 0), si conclude che x2 y 2 lim = 0. (x,y)→(0,0) x2 + y 2 Svolgimento esercizio 5. Dato che non sappiamo se il limite esiste oppure no, iniziamo cercando di vedere se il limite non esiste. Proviamo a calcolare il limite in questione facendo tendere il punto (x, y) a (0, 0) lungo una retta di equazione y = mx. Si trova: x3 y mx4 = lim 6 2 x→0 x6 + m2 x2 (x,y)→(0,0) x + y lim y=mx mx2 = 0, x→0 x4 + m2 = lim almeno se m 6= 0. Trattiamo a parte il caso m = 0, cioè il caso della retta y = 0. x3 y 0 lim = lim 6 = 0. 6 2 x→0 x (x,y)→(0,0) x + y y=0 Un risultato analogo vale per la retta di equazione x = 0. Si scopre quindi che la funzione ristretta ad ogni retta passante per l’origine ammette sempre lo stesso limite, pari a 0. Proviamo ora a calcolare lo stesso limite facendo tendere il punto (x, y) a (0, 0) lungo una parabola di equazione y = ax2 . Si trova: x3 y ax5 = lim 6 2 x→0 x6 + a2 x4 (x,y)→(0,0) x + y lim y=ax2 = lim x→0 x2 ax = 0, + a2 almeno se a 6= 0. Se invece a = 0 la parabola diventa la retta y = 0, e questo caso è già stato analizzato. Si scopre quindi che anche la funzione ristretta ad ogni parabola del tipo y = ax2 ammette sempre lo stesso limite, pari a 0. Ovviamente questo non basta per concludere che allora il limite in questione esiste e vale zero. Infatti, se calcoliamo lo stesso limite facendo tendere il punto (x, y) a (0, 0) lungo la curva di equazione y = x3 , si trova: x3 y x6 1 = lim = . 6 2 6 6 x→0 x + x 2 (x,y)→(0,0) x + y lim y=x3 Dato che questo limite è diverso dai precedenti, si conclude che il limite cercato non esiste. 3. Soluzioni 167 Svolgimento esercizio 6. Cerchiamo di vedere se il limite xy sin x lim (x,y)→(0,0) x2 sin y + y 2 non esiste, provando a calcolarlo lungo le rette y = mx: xy sin x mx2 sin x = lim 2 2 x→0 x2 sin(mx) + m2 x2 (x,y)→(0,0) x sin y + y lim y=mx m sin x = 0, x→0 sin(mx) + m2 = lim almeno per m 6= 0. Proviamo ora a calcolare lo stesso limite lungo la parabola y = x2 : xy sin x x3 sin x x sin x = lim = lim . 2 2 2 2 4 x→0 x sin(x ) + x x→0 sin(x2 ) + x2 (x,y)→(0,0) x sin y + y lim y=x2 Dividendo il numeratore e il denominatore per x2 si ottiene: sin x x lim 2 x→0 sin(x ) + x2 1 = , 2 1 dato che sin x = 1. x→0 x Poiché questo limite è diverso dai precedenti, si conclude che il limite cercato non esiste. lim 3.2. Funzioni continue Svolgimento esercizio 7. L’insieme di definizione della funzione f (x, y) è l’insieme delle soluzioni del seguente sistema: xy ≥ 0 log(xy 2 ) − x 6= kπ, k ∈ Z 2 xy > 0 In ogni caso, qualunque sia il suo insieme di definizione, la funzione f è ottenuta componendo (sommando, sottraendo, moltiplicando, etc.) funzioni elementari continue. Di conseguenza f è necessariamente continua dove è definita, cioè in tutto il suo dominio. Svolgimento esercizio 8. In R2 privato dell’origine la funzione f è definita da sin(xy) f (x, y) = 2 . x + 2y 2 168 9. Funzioni di più Variabili Essa è quindi continua in quanto composizione di funzione continue. Rimane da vedere se f è continua anche nell’origine. In base alla definizione si ha che f è continua nell’origine se e solo se lim f (x, y) = f (0, 0), (x,y)→(0,0) cioè se sin(xy) = 0. (x,y)→(0,0) x2 + 2y 2 Se calcoliamo questo limite lungo le rette di equazione y = mx, e ricordiamo che sin z ∼ z, per z → 0, si ha: lim sin(xy) sin(mx2 ) = lim 2 2 x→0 x2 + 2m2 x2 (x,y)→(0,0) x + 2y lim y=mx mx2 x→0 x2 (1 + 2m2 ) m . = 1 + 2m2 Dato che il valore del limite dipende da m, cioè dalla retta scelta, si conclude che il limite cercato non esiste. Di conseguenza la funzione f non è continua nell’origine. = lim Svolgimento esercizio 9. In R2 privato dell’origine la funzione f è definita da − 1 f (x, y) = e x2 +y2 . Essa è quindi continua in quanto composizione di funzione continue. Rimane da vedere se f è continua anche nell’origine. In base alla definizione si ha che f è continua nell’origine se e solo se lim f (x, y) = f (0, 0), (x,y)→(0,0) cioè se lim − e 1 x2 +y 2 = 0. (x,y)→(0,0) Dato che 1 = +∞, (x,y)→(0,0) x2 + y 2 lim e ricordando che lim e−z = 0, z→+∞ si conclude che lim − e 1 x2 +y 2 = 0, (x,y)→(0,0) e quindi la funzione f è continua anche nell’origine. In conclusione, si è dimostrato che f è continua in tutto R2 . 3. Soluzioni 169 Svolgimento esercizio 10. Se x 6= 0 e y 6= 0 la funzione f è definita da (x + y) sin2 x f (x, y) = , 2xy 2 che è continua in quanto composizione di funzioni continue. Rimane da studiare la continuità di f nei punti con x = 0 oppure y = 0, cioè nei punti che stanno sugli assi coordinati. Iniziamo considerando l’origine. Con semplici calcoli, ricordando le proprietà dei limiti, si trova: lim (x + y) sin2 x (x,y)→(0,0) 2xy 2 (x + y)x2 = lim (x,y)→(0,0) 2xy 2 x(x + y) = lim . (x,y)→(0,0) 2y 2 f (x, y) = (x,y)→(0,0) lim Calcolando questo limite per (x, y) che tende a (0, 0) lungo le rette di equazione y = mx, si trova: x(x + y) x(x + mx) 1+m = lim = . 2 2 2 x→0 2y 2m x 2m2 (x,y)→(0,0) lim y=mx Dato che il valore del limite dipende da m, cioè dalla retta scelta, si conclude che il limite cercato non esiste. Di conseguenza la funzione f non è continua nell’origine. Consideriamo ora i punti del tipo (a, 0), con a 6= 0. Si ha: lim (x,y)→(a,0) (x + y) sin2 x (x,y)→(a,0) 2xy 2 (a + y) sin2 a = lim = ±∞, y→0 2ay 2 f (x, y) = lim se sin2 a 6= 0, cioè se a 6= kπ, k ∈ Z. Anche in questo caso si conclude che f non è continua in questi punti. 170 9. Funzioni di più Variabili I punti del tipo (kπ, 0) (con k 6= 0) vanno studiati a parte. Se effettuiamo il cambiamento di variabili X = x − kπ, Y = y, si ha: (x + y) sin2 x (x,y)→(kπ,0) (x,y)→(kπ,0) 2xy 2 (X + kπ + Y ) sin2 (X + kπ) = lim (X,Y )→(0,0) 2(X + kπ)Y 2 kπ sin2 (X) = lim (X,Y )→(0,0) 2kπY 2 X2 = lim . (X,Y )→(0,0) 2Y 2 Calcolando ora questo limite per (X, Y ) che tende a (0, 0) lungo le rette di equazione Y = mX, si trova: X2 1 X2 lim = lim = . 2 2 2 X→0 2m X 2m2 (X,Y )→(0,0) 2Y lim f (x, y) = lim Y =mX Dato che il valore del limite dipende da m, cioè dalla retta scelta, si conclude che il limite cercato non esiste. Di conseguenza la funzione f non è continua nei punti del tipo (kπ, 0). Rimangono ora da considerare solo i punti del tipo (0, b), con b 6= 0. Si ha: (x + y) sin2 x lim f (x, y) = lim (x,y)→(0,b) (x,y)→(0,b) 2xy 2 b sin2 x = lim x→0 2xb2 x2 = lim = 0. x→0 2xb Si ha pertanto lim f (x, y) = f (0, b) = 0, (x,y)→(0,b) quindi f è continua in questi punti. In conclusione, abbiamo dimostrato che f è continua in tutti i punti del piano tranne quelli che stanno sull’asse delle x. Capitolo 10 Calcolo Infinitesimale per le Curve 1. Richiami di teoria 1.1. Curve in Rn Definizione 1.1. Una curva (continua) Γ in Rn è una funzione continua ~r : I → Rn , t 7→ ~r(t) = (x1 (t), x2 (t), . . . , xn (t)), dove I è un intervallo di R. L’immagine della funzione ~r è detta il sostegno della curva. La curva Γ è detta di classe C m se la funzione ~r è di classe C m , cioè ammette tutte le derivate continue fino all’ordine m. Si può pensare alla variabile t come al “tempo” e alla funzione ~r(t) come a una legge che descrive il moto di un punto di Rn al trascorrere del tempo t. Osservazione 1.2. Spesso si usa il termine “curva” per indicare quello che noi abbiamo chiamato il sostegno della curva, cioè il sottoinsieme di Rn che è l’immagine della funzione ~r. In tal caso la funzione ~r : I → Rn sarà detta la parametrizzazione della curva Γ. Noi useremo indifferentemente entrambe le terminologie: il significato dei termini usati sarà chiaro dal contesto. Definizione 1.3. Una curva Γ definita da ~r : [a, b] → Rn , è detta chiusa se ~r(a) = ~r(b). Una curva chiusa è anche detta circuito. Sia ora Γ una curva di classe C 1 in Rn , parametrizzata da ~r : I → Rn , t 7→ ~r(t) = (x1 (t), x2 (t), . . . , xn (t)), e sia t un punto interno all’intervallo I. Proposizione 1.4. Il vettore ~r 0 (t) è tangente alla curva Γ nel punto P = ~r(t) (vedi figura 1). Osservazione 1.5. In fisica, il vettore ~v = ~r 0 (t) è detto velocità istantanea. La proposizione precedente afferma che la velocità istantanea è tangente in ogni punto alla traiettoria, risultato ben noto dalla fisica. La norma del vettore ~r 0 (t) è detta velocità scalare. 172 10. Calcolo Infinitesimale per le Curve ~r0 (t) ~r(t) Γ Figura 1. Vettore tangente alla curva Γ ds ~r(t + dt) ~r(t) Γ Figura 2. Lunghezza d’arco elementare Definizione 1.6. Un punto della curva Γ si dice regolare se in quel punto la funzione ~r(t) è derivabile e si ha ~r 0 (t) 6= 0. Un punto non regolare è detto singolare. I punti singolari sono dunque quelli in cui la funzione ~r(t) non è derivabile, oppure essa è derivabile, ma la sua derivata è nulla (cioè si annulla il vettore velocità istantanea). Consideriamo ora un intervallo di tempo infinitesimo dt. In tale intervallo di tempo il punto individuato da ~r(t) = (x1 (t), . . . , xn (t)) subisce uno spostamento infinitesimo d~r = (dx1 , . . . , dxn ). Se supponiamo che la curva sia di classe C 1 , le funzioni xi (t) sono derivabili e si ha quindi dxi (t) = x0i (t) dt, per i = 1, . . . , n. Il vettore spostamento infinitesimo è quindi dato da: d~r = ~r 0 (t) dt = (x01 , x02 . . . , x0n ) dt, e la sua lunghezza è ds = kd~rk = k~r 0 (t)k dt = p (x01 )2 + (x02 )2 + · · · + (x0n )2 dt. La quantità scalare ds rappresenta quindi lo spazio (infinitesimo) percorso da un punto mobile sulla curva Γ nell’intervallo di tempo infinitesimo dt (vedi figura 2). Definizione 1.7. Lo scalare ds è detto lunghezza d’arco elementare, o differenziale d’arco. Una volta nota l’espressione per la lunghezza d’arco elementare ds, la lunghezza di un tratto finito di curva si calcola facilmente come segue: Teorema 1.8. Sia Γ una curva di classe C 1 in Rn , parametrizzata da ~r : [a, b] → Rn , t 7→ ~r(t) = (x1 (t), x2 (t), . . . , xn (t)). 2. Esercizi 173 La lunghezza L(Γ) della curva Γ è data da: Z L(Γ) = ds, Γ ove questo integrale si calcola come segue: Z Z b Z bp 0 ds = k~r (t)k dt = (x01 (t))2 + (x02 (t))2 + · · · + (x0n (t))2 dt. Γ a a n Se poi f : R → R è una funzione definita sul sostegno della curva Γ, si può definire l’integrale curvilineo di f lungo la curva Γ come segue: Definizione 1.9 (Integrale di linea di prima specie). Il seguente integrale è detto integrale di linea della funzione f lungo la curva Γ: b Z Z f ds = Γ a f (~r(t)) k~r 0 (t)k dt Z b p = f (x1 (t), . . . , xn (t)) (x01 (t))2 + · · · + (x0n (t))2 dt. a 2. Esercizi 2.1. Lunghezza di una curva Esercizio 1. Determinare la lunghezza dell’arco di elica cilindrica Γ (di raggio R e passo P ) parametrizzato da [0, 2π] 3 θ 7→ ~r(θ) = (R cos θ, R sin θ, P θ) ∈ R3 . Esercizio 2. Determinare i punti singolari e la lunghezza della curva Γ (astroide) parametrizzata da [0, 2π] 3 t 7→ ~r(t) = (cos3 t, sin3 t) ∈ R2 . Esercizio 3. Si determini la lunghezza L dell’arco di curva piana Γ parametrizzato da x(t) = t2 , y(t) = t3 , per t ∈ [0, 1]. Esercizio 4. Calcolare la lunghezza L dell’arco di cicloide Γ parametrizzato da x(t) = t − sin t, y(t) = 1 − cos t, per t ∈ [0, 2π]. Esercizio 5. Calcolare la lunghezza L del tratto di grafico della funzione y = ex , compreso tra i punti (0, 1) e (1, e). Esercizio 6. Calcolare la lunghezza L dell’arco chiuso della curva Γ di equazione 9y 2 = x(x − 3)2 . 174 10. Calcolo Infinitesimale per le Curve 2.2. Integrali di linea Esercizio 7. Sia Γ la curva parametrizzata da x = t2 , y = sin t, per t ∈ [0, 2π]. Sia f la seguente funzione x f (x, y) = p . 4x − y 2 + 1 Si calcoli il seguente integrale di linea: Z f ds. Γ Esercizio 8. Si calcoli il seguente integrale di linea: Z xy ds, Γ dove Γ è il quarto dell’ellisse di equazione quadrante. x2 a2 + y2 b2 = 1 contenuto nel primo Esercizio 9. Si calcoli la massa di un filo Γ disposto come la prima spira di un’elica cilindrica di raggio R e passo P , cioè parametrizzato da ~r(t) = (R cos t, R sin t, P t), per t ∈ [0, 2π], se la densità lineare del filo è espressa dalla seguente funzione: p ρ(x, y, z) = x2 + y 2 + |z|. Esercizio 10. Si calcoli l’area della seguente superficie S: S = {(x, y, z) ∈ R3 | x ∈ [0, 2π], y = sin x, 0 ≤ z ≤ f (x, y)}, ove x(2π − x) f (x, y) = p . 2 2 − y2 3. Soluzioni 3.1. Lunghezza di una curva Svolgimento esercizio 1. Essendo ~r(θ) = (R cos θ, R sin θ, P θ), si ha ~r 0 (θ) = (−R sin θ, R cos θ, P ), √ da cui si ottiene k~r 0 (θ)k = R2 + P 2 . La lunghezza dell’arco di elica cilindrica Γ è quindi data da: Z Z 2π L(Γ) = ds = k~r 0 (θ)k dθ Γ 0 Z 2π √ √ = R2 + P 2 dθ = 2π R2 + P 2 . 0 3. Soluzioni 175 1 –1 1 –1 Figura 3. L’astroide in R2 Svolgimento esercizio 2. La curva Γ è parametrizzata da ~r(t) = (cos3 t, sin3 t), quindi si ha ~r 0 (t) = (−3 cos2 t sin t, 3 sin2 t cos t). I punti singolari sono quelli in cui si annulla il vettore ~r 0 (t), e questo avviene se e solo se t = 21 kπ, per k = 0, 1, 2, 3, 4. I punti corrispondenti sulla curva Γ sono quattro, e precisamente (1, 0), (0, 1), (−1, 0) e (0, −1). Ciò che avviene dal punto di vista geometrico nei punti singolari è illustrato bene dal grafico che rappresenta la curva Γ nel piano (vedi figura 3). Dato che la curva Γ è simmetrica rispetto a entrambi gli assi, la sua lunghezza è il quadruplo della lunghezza dell’arco contenuto nel primo quadrante. Calcoliamo quindi la lunghezza L di questo arco. La norma del vettore tangente è k~r 0 (t)k = p 9 cos4 t sin2 t + 9 sin4 t cos2 t p = 3 sin t cos t cos2 t + sin2 t = 3 sin t cos t, ove si è usato il fatto che nel primo quadrante si ha 0 ≤ t ≤ π/2, e quindi sin t e cos t sono sempre positivi. Di conseguenza la lunghezza d’arco elementare è ds = 3 sin t cos t dt, 176 10. Calcolo Infinitesimale per le Curve 2 1 0 2 4 6 Figura 4. Arco di cicloide e la lunghezza L dell’arco di curva in questione è: Z π/2 L= k~r 0 (t)k dt 0 π/2 Z = 3 sin t cos t dt 0 3 = 2 Z 0 π/2 3 sin 2t dt = . 2 La lunghezza della curva Γ è quindi L(Γ) = 4L = 6. Svolgimento esercizio 3. Si ha ~r 0 (t) = (2t, 3t2 ) e quindi √ √ k~r 0 (t)k = 4t2 + 9t4 = t 4 + 9t2 , ove si è usato il fatto che t ∈ [0, 1], e quindi t non è mai negativo. La lunghezza L = L(Γ) si calcola quindi come segue: Z Z 1 L = ds = k~r 0 (t)k dt Γ 0 Z 1 √ = t 9t2 + 4 dt 0 √ 1 2 13 13 − 8 3/2 1 = (9t + 4) = . 0 27 27 Svolgimento esercizio 4. L’arco di cicloide Γ è rappresentato in figura 4. Si ha ~r 0 (t) = (1 − cos t, sin t) e quindi p √ k~r 0 (t)k = 1 − 2 cos t + cos2 t + sin2 t = 2 − 2 cos t. La lunghezza L = L(Γ) si calcola quindi come segue: Z √ Z 2π √ L = ds = 2 1 − cos t dt Γ 0 r √ Z 2π t = 2 2 sin2 dt 2 0 2π √ √ t = 8, = 2 −2 2 cos 2 0 3. Soluzioni 177 dove si è usata la nota formula t 1 − cos t = 2 sin2 . 2 Svolgimento esercizio 5. Il grafico di una funzione del tipo y = f (x) si parametrizza facilmente come segue: x = t, y = f (t). Di conseguenza, il differenziale d’arco ds è dato da: p p ds = x0 (t)2 + y 0 (t)2 dt = 1 + (y 0 )2 dx. Nel nostro caso si ottiene ds = √ 1 + e2x dx, e quindi la lunghezza L richiesta è data da Z 1√ L= 1 + e2x dx. 0 Questo integrale si può calcolare effettuando il seguente cambiamento di variabili: 1 + e2x = u2 , da cui si deduce che dx = u2 u du. −1 Si ha quindi: Z L= 0 1 √ √ 1 + e2x dx 1+e2 u2 du √ u2 − 1 2 Z √1+e2 1 1+ 2 du = √ u −1 2 Z √1+e2 1 1 1+ − du = √ 2(u − 1) 2(u + 1) 2 √1+e2 1 1 = u + log(u − 1) − log(u + 1) √ 2 2 2 √ √ √ √ 2 = 1 + e − 2 + 1 − log(1 + 1 + e2 ) + log(1 + 2), Z = ove l’ultima uguaglianza è stata ottenuta usando le note proprietà del logaritmo. Svolgimento esercizio 6. In questo caso la curva Γ non è fornita in forma parametrica, bensı̀ come luogo dei punti che soddisfano l’equazione 9y 2 = x(x−3)2 . Da una attenta analisi di questa equazione si deduce che il grafico della curva Γ è quello rappresentato in figura 5. 178 10. Calcolo Infinitesimale per le Curve 2 1 –1 1 2 3 4 5 –1 –2 Figura 5. L’arco chiuso di cui si vuole calcolare la lunghezza è l’arco compreso tra i punti di ascissa x = 0 e x = 3. Inoltre, dato che la curva Γ è simmetrica rispetto all’asse delle x, sarà sufficiente calcolare la lunghezza dell’arco compreso tra i punti di ascissa x = 0 e x = 3 e contenuto nel semipiano superiore, y ≥ 0. Quest’arco si può evidentemente rappresentare come grafico di una opportuna funzione y = y(x), dove questa funzione dovrà soddisfare l’equazione 9y(x)2 = x(x − 3)2 . Derivando questa equazione rispetto a x, si ottiene: 18y(x)y 0 (x) = 3x2 − 12x + 9, da cui si ricava y 0 (x) = x2 − 4x + 3 . 6y Il differenziale d’arco è quindi dato da: s p (x2 − 4x + 3)2 ds = 1 + y 0 (x)2 dx = 1 + dx 36y 2 s r (x − 3)2 (x − 1)2 (x − 1)2 = 1+ dx = 1 + dx 4x(x − 3)2 4x r r (x + 1)2 4x + x2 − 2x + 1 dx, = dx = 4x 4x ove si è usato il fatto che 9y 2 = x(x − 3)2 . La lunghezza dell’arco compreso tra i punti di ascissa x = 0 e x = 3 e contenuto nel semipiano superiore si ottiene quindi calcolando il seguente integrale: Z 3r Z 3 (x + 1)2 x+1 √ dx. dx = 4x 0 2 x 0 3. Soluzioni 179 √ Se effettuiamo il cambiamento di variabili x = u, cioè x = u2 , si ottiene: √3 Z 3 Z √3 √ x+1 1 √ dx = (u2 + 1) du = u3 + u = 2 3. 3 0 2 x 0 0 √ La lunghezza L dell’arco chiuso della curva Γ è quindi L = 4 3. 3.2. Integrali di linea Svolgimento esercizio 7. La curva Γ è parametrizzata da ~r(t) = (t2 , sin t), 0 0 per √ t ∈ [0, 2π]. Si ha quindi ~r (t) = (2t, cos t), da cui si ottiene k~r (t)k = 4t2 + cos2 t. Il differenziale d’arco ds è quindi dato da √ ds = 4t2 + cos2 t dt. Si ha pertanto: Z Z 2π f ds = Γ 0 Z 2π = 0 √ t2 p 4t2 2 4t2 + cos2 t dt − sin t + 1 2π 1 3 8 2 t = π3. t dt = 3 3 0 Svolgimento esercizio 8. La curva Γ, cioè il quarto dell’ellisse di equazione 2 x2 + yb2 = 1 contenuto nel primo quadrante, si può parametrizzare come a2 segue: ~r(t) = (a cos t, b sin t), per t ∈ [0, π/2]. Si ha quindi ~r 0 (t) = (−a sin t, b cos t), da cui si ottiene p k~r 0 (t)k = a2 sin2 t + b2 cos2 t q = (a2 − b2 ) sin2 t + b2 . Il differenziale d’arco ds è quindi dato da q ds = (a2 − b2 ) sin2 t + b2 dt. Si ha pertanto: Z Z xy ds = Γ π/2 q ab sin t cos t (a2 − b2 ) sin2 t + b2 dt 0 ab = 2 3(a − b2 ) 3 = 3 " ab(a − b ) . 3(a2 − b2 ) (a2 − b2 ) sin2 t + b2 3/2 #π/2 0 180 10. Calcolo Infinitesimale per le Curve Svolgimento esercizio 9. Per definizione, la densità lineare ρ di un filo materiale è il rapporto ρ= dm , ds ove dm è la massa di un tratto infinitesimo di filo di lunghezza ds. Si ha quindi dm = ρ ds, da cui discende che la massa totale del filo Γ è espressa dal seguente integrale di linea: Z M = ρ ds. Γ Nel nostro caso il filo è parametrizzato da ~r(t) = (R cos t, R sin t, P t), da cui si deduce che ~r 0 (t) = (−R sin t, R cos t, P ), e quindi il differenziale d’arco è dato da √ ds = k~r 0 (t)k dt = R2 + P 2 dt. Si ha quindi: Z Z 2π q √ M = ρ ds = R2 cos2 t + R2 sin2 t + |P t| R2 + P 2 dt Γ 0 Z 2π √ √ = R2 + P 2 R2 + P t dt 0 2π √ 2 2 3/2 2 2 (R + P t) = R +P 3P 0 √ 2 2 2 R +P 2 3/2 3 = (R + 2πP ) − R . 3P Svolgimento esercizio 10. Chiamiamo Γ la curva, contenuta nel piano xy, di equazione y = sin x. La superficie S è la superficie “eretta verticalmente” sulla base Γ e delimitata in basso dal piano di equazione z = 0 e in alto dal grafico della funzione z = f (x, y). Si veda la figura 6 per una rappresentazione grafica della superficie S. Da quanto detto si deduce che l’area A di S è data dal seguente integrale di linea: Z A = f ds. Γ La curva Γ si può parametrizzare nel modo seguente: x = t, y = sin t, cioè ~r(t) = (t, sin t). Si ha quindi ~r 0 (t) = (1, cos t), da cui si deduce che il differenziale d’arco è dato da √ ds = 1 + cos2 t dt. 3. Soluzioni 181 4 3 z2 1 0 0 1 1 2 3 x 4 0y 5 6 –1 Figura 6. Si ha quindi: Z Z A= f ds = Γ 1 2 0 Z 2π t(2π − t) √ p 1 + cos2 t dt 2 2 2 − sin t 2π t(2π − t) dt 2π 1 1 3 2 2 = πt − t = π3. 2 3 0 3 = 0 Capitolo 11 Calcolo Differenziale in più Variabili 1. Richiami di teoria 1.1. Derivate parziali Ricordiamo brevemente la definizione delle derivate parziali di una funzione di più variabili a valori reali. Per semplicità ci limiteremo a trattare il caso delle funzioni di due variabili. Sia dunque A un sottoinsieme aperto di R2 , f : A → R una funzione e (x0 , y0 ) un punto di A. Definizione 1.1. La derivata parziale della funzione f , rispetto alla varia(x0 , y0 ), è: bile x, nel punto (x0 , y0 ), indicata con il simbolo ∂f ∂x ∂f f (x0 + h, y0 ) − f (x0 , y0 ) (x0 , y0 ) = lim . h→0 ∂x h Analogamente, la derivata parziale della funzione f , rispetto alla variabile y, nel punto (x0 , y0 ), indicata con il simbolo ∂f (x0 , y0 ), è: ∂y ∂f f (x0 , y0 + h) − f (x0 , y0 ) (x0 , y0 ) = lim . h→0 ∂y h La funzione f è detta derivabile nel punto (x0 , y0 ) se esistono le sue derivate parziali in quel punto (cioè se i due limiti precedenti esistono finiti). Definizione 1.2. Il gradiente di f , indicato con ∇f , è il vettore le cui componenti sono le derivate parziali di f : ∂f ∂f ∇f (x0 , y0 ) = (x0 , y0 ), (x0 , y0 ) . ∂x ∂y Osservazione 1.3. Osserviamo che, mentre per le funzioni di una variabile la derivabilità della funzione in un punto implica la sua continuità in quel punto, ciò non è vero per le funzioni di più variabili. Si possono facilmente trovare esempi di funzioni di due variabili che sono derivabili, ma non continue, in un punto. Questo mostra come la nozione di derivabilità per le funzioni di più variabili non sia l’equivalente, nel caso di più variabili, della derivabilità per le funzioni di una sola variabile. 184 11. Calcolo Differenziale in più Variabili 1.2. Differenziali Introduciamo ora una condizione più forte della derivabilità, cioè dell’esistenza delle derivate parziali, per una funzione di due variabili f (x, y). Sia A un sottoinsieme aperto di R2 , f : A → R una funzione e (x0 , y0 ) un punto di A. Definizione 1.4. La funzione f è differenziabile nel punto (x0 , y0 ) se esiste una forma lineare φ : R2 → R tale che f (x0 + h, y0 + k) − f (x0 , y0 ) − φ(h, k) = 0, (h,k)→(0,0) k(h, k)k √ ove la norma del vettore (h, k) è definita da k(h, k)k = h2 + k 2 . Se f è differenziabile in (x0 , y0 ), la forma lineare φ che compare nel limite precedente è detta il differenziale di f nel punto (x0 , y0 ), ed è indicata con df (x0 , y0 ). Osservazione 1.5. Osserviamo che se f : A → R è una funzione definita in un aperto A di R2 , e se f è differenziabile in un punto (x0 , y0 ) ∈ A, il suo differenziale df (x0 , y0 ) è una forma lineare definita sempre su tutto R2 , indipendentemente da quale sia l’insieme di definizione della funzione f . Il differenziale di f in un punto (x0 , y0 ), essendo una forma lineare, si scriverà nel modo seguente: lim df (x0 , y0 ) : R2 → R, (h, k) 7→ αh + βk, per qualche α, β ∈ R. Si tratta ora di capire chi sono i due coefficienti α e β. A tal fine si dimostra il seguente risultato: Proposizione 1.6. I coefficienti α e β che compaiono nell’espressione del differenziale di una funzione f in un punto (x0 , y0 ), df (x0 , y0 )(h, k) = αh + βk, sono dati da: α= ∂f (x0 , y0 ), ∂x β= ∂f (x0 , y0 ). ∂y Si ha quindi: (1) df (x0 , y0 )(h, k) = ∂f ∂f (x0 , y0 )h + (x0 , y0 )k. ∂x ∂y Osservazione 1.7. Per tradizione, il differenziale di una funzione f (x, y) nel punto (x0 , y0 ) si suole scrivere anche nel modo seguente: df (x0 , y0 ) = ∂f ∂f (x0 , y0 ) dx + (x0 , y0 ) dy, ∂x ∂y ove i simboli dx e dy (i differenziali delle variabili indipendenti) vengono spesso pensati come degli “incrementi infinitesimi” delle variabili x e y 1. Richiami di teoria 185 rispettivamente. In modo ancora più sintetico si scrive anche ∂f ∂f df = dx + dy. ∂x ∂y Facciamo però notare che il vero significato di queste formule “abbreviate” è quello espresso dall’equazione (1). Si può ora dimostrare il seguente risultato, che mostra come la nozione di differenziabilità sia un sostituto adeguato, per le funzioni di più variabili, della nozione di derivabilità per le funzioni di una variabile. Proposizione 1.8. Se una funzione f (x, y) è differenziabile in (x0 , y0 ) allora essa è continua e derivabile in tale punto. Vale la pena far notare che non vale il viceversa: una funzione può benissimo essere continua e derivabile in un punto, ma non essere differenziabile in tale punto. Purtroppo verificare che una funzione sia differenziabile in un punto usando la definizione data può essere complicato. Infatti è richiesto il calcolo di un limite di una funzione di più variabili, limite questo che, ovviamente, si presenta sempre come forma indeterminata del tipo 00 . A tale scopo è estremamente utile il seguente teorema: Teorema 1.9. Sia f : A → R una funzione definita in un aperto A di R2 e sia (x0 , y0 ) un punto di A. Se f è derivabile in un intorno del punto (x0 , y0 ) e le sue derivate parziali sono continue in (x0 , y0 ), allora f è differenziabile in (x0 , y0 ). In particolare, se f è derivabile in tutto l’insieme A e le sue derivate parziali sono continue in tutto A, allora f è differenziabile in ogni punto di A. Se una funzione f (x, y) è differenziabile in (x0 , y0 ) ha senso parlare del “piano tangente” al grafico di f nel punto (x0 , y0 ). Si tratta del piano di equazione ∂f ∂f z = f (x0 , y0 ) + (x0 , y0 )(x − x0 ) + (x0 , y0 )(y − y0 ). ∂x ∂y Si noti che in questa equazione compaiono le derivate parziali di f nel punto (x0 , y0 ), quindi per poter scrivere questa equazione è sufficiente che la funzione f sia derivabile nel punto (x0 , y0 ). Se però f non è differenziabile in tale punto, il piano rappresentato da questa equazione non è il piano tangente al grafico di f , dato che in questo caso il piano tangente al grafico di f nel punto (x0 , y0 ) non esiste. 1.3. Derivate direzionali Un’estensione del concetto di derivata parziale è quello di derivata direzionale. Sia dunque A un sottoinsieme aperto di R2 , f : A → R una funzione, (x0 , y0 ) un punto di A, e ~v = (vx , vy ) un versore (cioè un vettore di norma unitaria). 186 11. Calcolo Differenziale in più Variabili Definizione 1.10. La derivata della funzione f nella direzione del versore ~v , nel punto (x0 , y0 ), indicata con il simbolo D~v f (x0 , y0 ), è: f (x0 + hvx , y0 + hvy ) − f (x0 , y0 ) . h→0 h Tale derivata è anche detta derivata direzionale di f nella direzione del versore ~v . Osservazione 1.11. Ovviamente le derivate parziali ∂f e ∂f si ritrovano ∂x ∂y come casi particolari di derivate direzionali. Si ha infatti: ∂f = D~v f, se ~v = (1, 0), ∂x ∂f = Dw~ f, se w ~ = (0, 1). ∂y Dalla definizione data si deduce che la derivata direzionale di f nella direzione di un versore ~v misura la velocità di variazione della funzione f (x, y) quando il punto (x, y) percorre una retta parallela a ~v . Se la funzione f è differenziabile tutte le informazioni contenute nelle derivate direzionali sono in realtà già contenute nelle derivate parziali. Si può infatti dimostrare il seguente risultato: Teorema 1.12 (Formula del Gradiente). Se la funzione f è differenziabile nel punto (x0 , y0 ), si ha: ∂f ∂f (x0 , y0 )vx + (x0 , y0 )vy , D~v f (x0 , y0 ) = ∇f (x0 , y0 ) · ~v = ∂x ∂y per ogni versore ~v = (vx , vy ). Osservazione 1.13. Dalla formula del gradiente si può dedurre un’importante proprietà geometrica del gradiente di una funzione f . Se rappresentiamo nel piano Oxy le curve di livello della funzione f , cioè le curve di equazione f (x, y) = c, con c costante, il gradiente di f è un vettore che è, in ogni punto, perpendicolare alla curva di livello passante per quel punto. Infatti, se ~v è un versore tangente a una curva di livello di f in un punto (x0 , y0 ), si ha D~v f (x0 , y0 ) = 0, proprio perché f è costante lungo le sue curve di livello. D’altra parte, se f è differenziabile, dalla formula del gradiente deriva che ∇f (x0 , y0 ) · ~v = D~v f (x0 , y0 ) = 0, e quindi il vettore ∇f (x0 , y0 ) è ortogonale al vettore ~v , che era tangente a una curva di livello di f . Il gradiente di f è quindi ortogonale alle curve di livello di f e indica la direzione di massima variazione della funzione f . D~v f (x0 , y0 ) = lim 1.4. Derivate successive Se una funzione f è derivabile, e se anche le sue derivate parziali sono derivabili, queste si possono derivare ulteriormente per trovare le derivate 1. Richiami di teoria 187 parziali seconde. Questo processo si può iterare, per costruire derivate parziali di ordine successivo al secondo, fin tanto che le funzioni in questione sono derivabili. Per indicare le derivate parziali seconde si usa la seguente notazione abbreviata: ∂2f ∂ ∂f ∂2f ∂ ∂f = , = , ∂x2 ∂x ∂x ∂x∂y ∂x ∂y ∂2f ∂ ∂f ∂2f ∂ ∂f = , = . ∂y 2 ∂y ∂y ∂y∂x ∂y ∂x L’estensione di tale notazione al caso di derivate parziali di ordine superiore al secondo e di funzioni di più di due variabili è ovvia. Si avrà, ad esempio, ∂ ∂ ∂ ∂ ∂f ∂5f = . ∂x2 ∂y∂z 2 ∂x ∂x ∂y ∂z ∂z Per quanto riguarda le derivate parziali miste, si dimostra il seguente risultato importante: Teorema 1.14 (Teorema di Schwarz). Se le derivate seconde miste ∂2f ∂x∂y 2 ∂ f e ∂y∂x della funzione f esistono in un intorno del punto (x0 , y0 ) e sono continue in tale punto, allora si ha: ∂2f ∂2f (x0 , y0 ) = (x0 , y0 ). ∂x∂y ∂y∂x 2 2 ∂ f ∂ f Di conseguenza, se le derivate seconde miste ∂x∂y e ∂y∂x esistono e sono continue in tutto un aperto A, allora esse coincidono in tutto l’aperto A. Osservazione 1.15. Un risultato analogo, con un ovvio enunciato, vale per funzioni di n variabili e per derivate parziali di ordine qualunque. Definizione 1.16. Una funzione f si dice di classe C m in un aperto A (con m ≥ 0), e si scrive f ∈ C m (A), se essa è continua in A e se esistono tutte le derivate parziali fino all’ordine m ed esse sono continue in tutto l’aperto A. Una funzione f si dice di classe C ∞ in un aperto A, e si scrive f ∈ C ∞ (A), se essa è continua in A e se esistono tutte le derivate parziali di ogni ordine ed esse sono continue in tutto l’aperto A. Le derivate parziali seconde di una funzione di n variabili si possono organizzare in modo ovvio a formare una matrice quadrata di ordine n. Diamo quindi la seguente definizione: Definizione 1.17. Sia f (x1 , x2 , . . . , xn ) una funzione di n variabili a valori reali. La matrice Hessiana di f , indicata con H(f ), è la matrice i cui 188 11. Calcolo Differenziale in più Variabili elementi sono le derivate seconde di f : ∂2f ∂2f ∂x21 ∂2f ∂x2 ∂x1 H(f ) = .. . ∂2f ∂xn ∂x1 ∂x1 ∂x2 ∂2f ∂x22 .. . ∂2f ∂xn ∂x2 ··· ··· .. . ··· ∂2f ∂x1 ∂xn ∂2f ∂x2 ∂xn .. . ∂2f ∂x2n . Il teorema di Schwarz afferma che se la funzione f è di classe C 2 in un aperto A di Rn , allora la matrice Hessiana di f è una matrice simmetrica. In tal caso la forma quadratica associata alla matrice Hessiana di f è detta differenziale secondo di f , indicato con d2 f . Si ha quindi: d2 f (~x0 )(h1 , h2 , . . . , hn ) = n X ∂2f (~x0 ) hi hj , ∂x ∂x i j i,j=1 o, in termini della matrice Hessiana, h1 d2 f (~x0 )(h1 , h2 , . . . , hn ) = (h1 , h2 , . . . , hn )H(f )(~x0 ) ... , hn ove il prodotto è il solito prodotto righe per colonne. Come nel caso del differenziale di una funzione f , anche per il differenziale secondo si usa spesso la seguente scrittura: d2 f (~x0 ) = n X ∂2f (~x0 ) dxi dxj , ∂x ∂x i j i,j=1 ove i dxi vengono pensati come incrementi infinitesimi delle variabili xi , per i = 1, . . . , n. 1.5. Serie di Taylor Come per le funzioni di una variabile, anche nel caso di funzioni di più variabili si può scrivere lo sviluppo in serie di Taylor di una funzione all’intorno di un punto interno al suo dominio di definizione. A differenza del caso di una variabile, però, la scrittura di tale formula è complicata dalla presenza di tutte le derivate parziali della funzione in questione. È quindi necessario introdurre una notazione che ci permetta di semplificare la scrittura dello sviluppo in serie di Taylor di una funzione di n variabili. Sia dunque f : A → R una funzione di n variabili definita in un aperto A di Rn e sia ~x0 ∈ A. Introduciamo il seguente operatore differenziale D = h1 ∂ ∂ ∂ + h2 + · · · + hn , ∂x1 ∂x2 ∂xn 1. Richiami di teoria 189 ∂f ∂f ∂f definito ponendo D(f ) = h1 ∂x + h2 ∂x + · · · + hn ∂x , ove hi ∈ R, per n 1 2 i = 1, . . . , n. Possiamo ora enunciare il seguente risultato: Teorema 1.18. Se la funzione f : A → R, A ⊂ Rn , è di classe C m in A, si ha: m X 1 i ~ f (~x0 + h) = f (~x0 ) + D f (~x0 ) + o(k~hkm ), i! i=1 ove i ∂ ∂ ∂ i D = h1 + h2 + · · · + hn ∂x1 ∂x2 ∂xn è l’operatore differenziale che si ottiene sviluppando formalmente la potenza i-esima dell’operatore differenziale D, e o(k~hkm ) è una funzione trascurabile rispetto a k~hkm , cioè tale che o(k~hkm ) = 0. ~h→0 k~ hkm lim A titolo di esempio ricaviamo lo sviluppo in serie di Taylor al secondo ordine per una funzione di due variabili. Dal teorema precedente si ha: ∂ ∂ f (x0 + h, y0 + k) = f (x0 , y0 ) + h +k f (x0 , y0 ) ∂x ∂y 2 1 ∂ ∂ h +k f (x0 , y0 ) + o(k(h, k)k2 ) + 2 ∂x ∂y ∂f ∂f = f (x0 , y0 ) + h (x0 , y0 ) + k (x0 , y0 ) ∂x ∂y 2 1 2∂ f ∂2f + h (x , y ) + 2hk (x0 , y0 ) 0 0 2 ∂x2 ∂x∂y 2 2∂ f +k (x0 , y0 ) + o(h2 + k 2 ). ∂y 2 1.6. Massimi e minimi liberi Sia f : A → R una funzione definita in un aperto A di Rn . Definizione 1.19. Un punto ~x0 ∈ A è detto un punto di massimo locale per f (o di massimo relativo) se si ha f (~x) ≤ f (~x0 ), per ogni ~x che appartiene a un intorno (sufficientemente piccolo) di ~x0 . Un punto ~x0 ∈ A è detto un punto di minimo locale per f (o di minimo relativo) se si ha f (~x) ≥ f (~x0 ), per ogni ~x che appartiene a un intorno (sufficientemente piccolo) di ~x0 . Un punto ~x0 ∈ A è detto un punto di massimo assoluto per f se si ha f (~x) ≤ f (~x0 ), per ogni ~x ∈ A. 190 11. Calcolo Differenziale in più Variabili Un punto ~x0 ∈ A è detto un punto di minimo assoluto per f se si ha f (~x) ≥ f (~x0 ), per ogni ~x ∈ A. Per la ricerca dei massimi e minimi relativi di una funzione è estremamente utile il seguente risultato. Teorema 1.20. Sia f : A → R una funzione definita in un aperto A di Rn . Se ~x0 ∈ A è un punto di massimo o minimo relativo per f , e se f è differenziabile in ~x0 , allora df (~x0 ) = 0 (cioè ∇f (~x0 ) = 0). Osservazione 1.21. Facciamo notare che il teorema precedente vale solo nelle ipotesi che l’insieme A, in cui si cercano i massimi e minimi, sia aperto, che la funzione f sia differenziabile in tali punti, e vale solo per punti di massimo o minimo relativi. Se l’insieme su cui è definita f è chiuso, questo teorema si può applicare solo per i punti interni a tale insieme. Se poi ci sono dei punti in cui f non è differenziabile, tali punti vanno studiati separatamente. Infine notiamo che non vale il viceversa; cioè è possibile che df (~x0 ) = 0 ma ~x0 non sia né un punto di massimo né un punto di minimo relativo per f . Definizione 1.22. I punti di A in cui si annulla il differenziale di f , cioè in cui si annullano tutte le derivate parziali prime di f , sono detti punti critici di f . Osservazione 1.23. Osserviamo che, se ~x0 è un punto critico di f , l’iperpiano tangente al grafico di z = f (~x) nel punto (~x0 , f (~x0 )) è “orizzontale”, cioè ha equazione z = k, con k costante (k = f (~x0 )). Se la funzione f è di classe C 2 in A e se ~x0 è un punto critico di f , lo sviluppo in serie di Taylor al secondo ordine di f , centrato in ~x0 , diventa: n 1 X ∂2f ~ f (~x0 + h) = f (~x0 ) + (~x0 ) hi hj + o(k~hk2 ). 2 i,j=1 ∂xi ∂xj Si vede quindi che il segno di f (~x0 + ~h) − f (~x0 ) è uguale al segno del termine di secondo grado n X ∂2f (~x0 ) hi hj , ∂xi ∂xj i,j=1 cioè al segno del differenziale secondo di f calcolato nell’incremento ~h = (h1 , . . . , hn ). La determinazione della natura dei punti critici di una funzione f è quindi legata allo studio del segno della forma quadratica corrispondente al differenziale secondo di f calcolato nei punti critici. Ricordiamo ora alcuni fatti riguardanti lo studio delle forme quadratiche in Rn . 1. Richiami di teoria 191 Definizione 1.24. Una forma quadratica in Rn è un polinomio omogeneo di secondo grado in n variabili: n q : R → R, q(x1 , . . . , xn ) = n X aij xi xj , i,j=1 dove gli aij sono dei numeri reali. Definizione 1.25. Una forma quadratica q(~x) è detta (1) definita positiva, se q(~x) > 0, per ogni ~x 6= 0; (2) definita negativa, se q(~x) < 0, per ogni ~x 6= 0; (3) semidefinita positiva, se q(~x) ≥ 0, per ogni ~x, e q(~x) = 0 per qualche ~x 6= 0; (4) semidefinita negativa, se q(~x) ≤ 0, per ogni ~x, e q(~x) = 0 per qualche ~x 6= 0; (5) indefinita, se esistono due punti ~x1 e ~x2 tali che q(~x1 ) > 0 e q(~x2 ) < 0. Ricordiamo ancora che a una forma quadratica q(~x) si associa una matrice simmetrica A in modo tale che si abbia x1 q(x1 , . . . , xn ) = (x1 , . . . , xn )A ... , xn ove il prodotto è il solito prodotto righe per colonne. Utilizzando la matrice simmetrica A associata a una forma quadratica q(~x) è possibile stabilire un criterio molto semplice per scoprire se q(~x) è definita positiva o negativa. Teorema 1.26. Sia A = (aij ) la matrice (quadrata di ordine n) associata alla forma quadratica q(~x). Indichiamo con ∆r , per r = 1, . . . , n, il determinante della sottomatrice costituita dalle prime r righe e r colonne di A. Si ha quindi a11 · · · a1r a11 a12 . .. . , · · · , ∆r = .. ∆1 = a11 , ∆2 = . a21 a22 a arr r1 · · · Allora q(~x) (o, equivalentemente, A) è (1) definita positiva se ∆i > 0, per ogni i = 1, . . . , n. (2) definita negativa se ∆i < 0 per ogni i dispari, e ∆i > 0, per ogni i pari, per i = 1, . . . , n. Nel caso n = 2 si può enunciare un risultato più preciso. Teorema 1.27. Sia q : R2 → R una forma quadratica e sia a b A= b c 192 11. Calcolo Differenziale in più Variabili la matrice associata a q. Allora, se a 6= 0, q(~x) (o, equivalentemente, A) è (1) definita positiva se a > 0, e det A > 0; (2) definita negativa se a < 0, e det A > 0; (3) semidefinita positiva se a > 0, e det A = 0; (4) semidefinita negativa se a < 0, e det A = 0; (5) indefinita se det A < 0. Se invece a = 0, le cinque affermazioni precedenti rimangono valide con c sostituito al posto di a. Ritornando allo studio dei massimi e minimi relativi, possiamo ora enunciare il seguente teorema. Teorema 1.28. Sia f : A → R una funzione definita in un aperto A di Rn , di classe C 2 in A, e sia ~x0 un punto critico di f . Se la matrice Hessiana di f calcolata nel punto ~x0 , H(f )(~x0 ), è definita positiva, ~x0 è un punto di minimo relativo per f . Se H(f )(~x0 ) è definita negativa, ~x0 è un punto di massimo relativo per f . Se H(f )(~x0 ) è indefinita, ~x0 non è né un punto di massimo relativo né un punto di minimo relativo per f . Infine, se H(f )(~x0 ) è semidefinita (positiva o negativa), nulla si può affermare sulla natura del punto critico ~x0 . 1.7. Funzioni definite implicitamente In questa sezione richiameremo i principali risultati riguardanti lo studio delle funzioni definite in modo implicito da una equazione del tipo F (x, y) = 0. Per semplicità tratteremo solo il caso di funzioni di due variabili. Sia dunque F (x, y) una funzione reale di due variabili, definita in un aperto A di R2 , e sia (x0 , y0 ) un punto tale che F (x0 , y0 ) = 0. Ci proponiamo di capire sotto quali condizioni l’equazione F (x, y) = 0 definisce, in un intorno del punto (x0 , y0 ), una funzione y = y(x), oppure una funzione x = x(y). Cioè sotto quali condizioni sia possibile determinare una funzione y = y(x) (oppure x = x(y)) in modo tale che l’equazione F (x, y(x)) = 0 (rispettivamente, F (x(y), y) = 0) sia identicamente soddisfatta. La risposta a questo quesito è fornita dal seguente teorema: Teorema 1.29 (Teorema del Dini). Sia A un sottoinsieme aperto di R2 e sia F : A → R una funzione di classe C m in A (con m ≥ 1). Sia (x0 , y0 ) 6= 0, allora (x0 , y0 ) ∈ A un punto tale che F (x0 , y0 ) = 0. Se ∂f ∂y esiste un intorno I di x0 in R e una unica funzione y = y(x), definita in I, tale che F (x, y(x)) = 0, per ogni x ∈ I. Questa funzione y = y(x) è di classe C m in I e si ha ∂f (x, y(x)) dy ∂x (x) = − ∂f , dx (x, y(x)) ∂y per ogni x ∈ I. 1. Richiami di teoria 193 Analogamente, se ∂f (x0 , y0 ) 6= 0, allora esiste un intorno J di y0 in R ∂x e una unica funzione x = x(y), definita in J, tale che F (x(y), y) = 0, per ogni y ∈ J. Questa funzione x = x(y) è di classe C m in J e si ha ∂f (x(y), y) dx ∂y , (y) = − ∂f dy (x(y), y) ∂x per ogni y ∈ J. 1.8. Massimi e minimi vincolati Sia f : A → R una funzione definita in un aperto A di R2 . Sia Γ ⊂ A una curva definita da una equazione del tipo g(x, y) = 0. Ci poniamo ora il problema di determinare gli estremi della funzione f ristretta alla curva Γ, cioè gli estremi della funzione f (x, y) dove le variabili x e y devono soddisfare al vincolo g(x, y) = 0. Il caso più semplice è quello in cui è possibile trovare una parametrizzazione della curva Γ: [a, b] 3 t 7→ ~r(t) = (x(t), y(t)) ∈ Γ. In questo caso, componendo la funzione f (x, y) con la parametrizzazione di Γ, si ottiene una funzione F (t) = f (x(t), y(t)), definita nell’intervallo [a, b], che rappresenta la funzione f calcolata nei punti della curva Γ. Determinare gli estremi della funzione f ristretta alla curva Γ è equivalente a determinare gli estremi liberi della funzione (di una sola variabile) F (t), nell’intervallo [a, b]. Purtroppo, in generale, non sarà possibile determinare una parametrizzazione della curva Γ. In tal caso, per determinare gli estremi della funzione f ristretta alla curva Γ si può ricorrere al metodo seguente, noto come il metodo dei moltiplicatori di Lagrange. Teorema 1.30. Sia f : A → R una funzione definita in un aperto A di R2 e di classe C 1 in A. Sia Γ ⊂ A una curva definita da una equazione del tipo g(x, y) = 0, dove g(x, y) è una funzione di classe C 1 . Sia (x0 , y0 ) ∈ Γ un punto non-singolare della curva Γ, cioè un punto tale che g(x0 , y0 ) = 0, ma ∇g(x0 , y0 ) 6= 0. Allora (x0 , y0 ) è un punto critico della restrizione di f alla curva Γ se e solo se esso è un punto critico (non vincolato) della funzione L(x, y, λ) = f (x, y) + λg(x, y), per qualche λ ∈ R. Questo teorema afferma quindi che i punti critici di f (x, y), soggetti al vincolo g(x, y) = 0, si trovano cercando i punti critici (liberi) della funzione di tre variabili L(x, y, λ) = f (x, y) + λg(x, y), detta Lagrangiana. Si noti che ciò vale solo per i punti non-singolari della curva Γ. Il comportamento 194 11. Calcolo Differenziale in più Variabili di f nei punti singolari di Γ, cioè nei punti in cui si annulla il gradiente di g, deve essere studiato a parte. Notiamo infine che questo teorema non dice nulla sulla natura di tali punti critici. Di conseguenza, una volta determinati i punti critici di f utilizzando il metodo dei moltiplicatori di Lagrange, rimarrà il problema di capire se si tratta di punti di massimo, di minimo, oppure di punti di flesso. Occupiamoci ora del problema della determinazione della natura dei punti critici vincolati di una funzione f (x, y), determinati con il metodo dei moltiplicatori di Lagrange. Sia dunque f (x, y) una funzione di classe C 2 definita in un aperto contenente la curva Γ di equazione g(x, y) = 0, dove supponiamo che g(x, y) sia una funzione di classe C 2 . Sia (x0 , y0 ) ∈ Γ un punto critico della restrizione di f alla curva Γ. Supponiamo inoltre che (x0 , y0 ) sia un punto non-singolare di Γ, cioè che ∇g(x0 , y0 ) 6= 0. Dato che il gradiente di g in (x0 , y0 ) è diverso da zero, almeno una delle derivate parziali di g in (x0 , y0 ) ∂g (x0 , y0 ) 6= 0 (un discorso analogo è diversa da zero. Supponiamo che sia ∂y ∂g si può fare se è ∂x (x0 , y0 ) 6= 0, basta scambiare i ruoli di x e y). Per il Teorema del Dini è possibile rappresentare, in un intorno del punto (x0 , y0 ), la curva Γ come grafico di una funzione y = y(x). Di conseguenza la mappa x 7→ (x, y(x)) fornisce una parametrizzazione locale della curva Γ, all’intorno del punto (x0 , y0 ). Componendo la funzione f (x, y) con questa parametrizzazione, si ottiene la funzione della sola variabile x F (x) = f (x, y(x)). A questo punto, per determinare la natura del punto critico (x0 , y0 ) di f , basta determinare la natura del punto critico x0 della funzione F (x). Se le funzioni sono di classe C 2 , come supposto, è possibile determinare il segno della derivata seconda di F in x0 . Se deriviamo la funzione F (x) = f (x, y(x)), utilizzando la formula per la derivazione delle funzioni composte, otteniamo: ∂f ∂f F 0 (x) = (x, y(x)) + (x, y(x)) y 0 (x), ∂x ∂y e, derivando ulteriormente, si ha: F 00 (x) = ∂2f ∂2f (x, y(x)) + 2 (x, y(x)) y 0 (x) ∂x2 ∂x∂y ∂2f ∂f + 2 (x, y(x)) y 0 (x)2 + (x, y(x)) y 00 (x). ∂y ∂y Per calcolare F 00 (x0 ) è quindi necessario conoscere le derivate y 0 (x0 ) e y 00 (x0 ), ma queste si possono calcolare usando il Teorema del Dini. Vedremo negli esercizi degli esempi di applicazioni pratiche del metodo appena descritto. 2. Esercizi 195 2. Esercizi 2.1. Derivate parziali Esercizio 1. Determinare le derivate parziali della funzione x f (x, y) = sin . x+y Esercizio 2. Determinare le derivate parziali della funzione f (x, y) = log(x2 + cos y). Esercizio 3. Determinare le derivate parziali della funzione f (x, y) = p x2 y x2 + y 2 + 1 . Esercizio 4. Determinare le derivate parziali della funzione x2 log(x) cos(y 2 ) − xy 2 . sin(y 2 ) Esercizio 5. Si calcolino le derivate parziali nell’origine della funzione ( xy se (x, y) 6= (0, 0), 2 2 f (x, y) = x +y 0 se (x, y) = (0, 0). f (x, y) = 2.2. Differenziali Esercizio 6. Si dica se la seguente funzione ex sin y f (x, y) = x+y è differenziabile in tutto il suo insieme di definizione. Esercizio 7. Si dimostri che la seguente funzione f (x, y) = x2 cos(xy) − 2y è differenziabile in tutto R2 . Si calcoli poi il suo differenziale nel punto di coordinate (1, π/2). Esercizio 8. Si determini l’equazione del piano tangente al grafico di f (x, y) = xy sin x − y 2 nel punto di coordinate x0 = 0, y0 = 1, z0 = f (x0 , y0 ) = −1. Esercizio 9. Si consideri la funzione f : R2 → R definita come segue: 2 2 xy y − 2x se (x, y) 6= (0, 0), f (x, y) = x2 + y 2 0 se (x, y) = (0, 0). 196 11. Calcolo Differenziale in più Variabili (1) (2) (3) (4) Si dimostri che f è continua nell’origine. Calcolare le derivate parziali di f nei punti (x, y) 6= (0, 0). Stabilire se f è derivabile anche nel punto (0, 0). Stabilire se f è differenziabile nell’origine. 2.3. Derivate direzionali Esercizio 10. Si calcoli la derivata direzionale nel generico punto (x, y) della funzione f (x, y) = 2x2 log(xy) + y sin(x2 ) nella direzione determinata dal vettore ~v = (1, 3). Esercizio 11. Sia f (x, y) la funzione definita da 3 2 xy se (x, y) 6= (0, 0), f (x, y) = (x2 + y 2 )2 0 se (x, y) = (0, 0). Si calcolino tutte le derivate direzionali di f nel punto (0, 0). Si dica poi se f è differenziabile nell’origine. 2.4. Derivate parziali seconde Esercizio 12. Calcolare le derivate parziali seconde della funzione f (x, y) = x2 log y + sin(xy 2 ). Esercizio 13. Scrivere la matrice Hessiana della funzione f (x, y, z) = 2x3 y cos z + xy 2 z. Esercizio 14. Calcolare le derivate parziali seconde miste nell’origine della funzione 2 2 xy y − 2x se (x, y) 6= (0, 0), f (x, y) = x2 + y 2 0 se (x, y) = (0, 0). Alla luce del teorema di Schwarz, spiegare il risultato trovato. 2.5. Serie di Taylor Esercizio 15. Si scriva lo sviluppo in serie di Taylor al primo ordine, all’intorno del punto (1, 1), della funzione f (x, y) = x2 sin(πy) − log(xy). 2. Esercizi 197 Esercizio 16. Si scriva lo sviluppo in serie di Taylor al primo ordine, all’intorno del punto (−1, 1, 1), della funzione f (x, y, z) = xy 2 z + y cos(πz/2) − 2xy sin(πy). Esercizio 17. Si scriva lo sviluppo in serie di Taylor al secondo ordine, all’intorno del punto (0, 1), della funzione f (x, y) = ex sin(xy). Esercizio 18. Si scriva lo sviluppo in serie di Taylor al secondo ordine, all’intorno del punto (1, 1, 0), della funzione f (x, y, z) = 2x2 cos(yz) − y sin(xz). 2.6. Massimi e minimi liberi Esercizio 19. Si studino gli estremi della funzione f (x, y) = x3 + 3xy 2 − 15x − 12y. Si dica inoltre se f ammette massimo o minimo assoluti e, in caso affermativo, si determinino tali valori. Esercizio 20. Determinare i massimi e i minimi relativi della funzione 1 f (x, y, z) = x2 + xyz + y − z. 2 Esercizio 21. Determinare i massimi e i minimi relativi della funzione f (x, y) = x(x2 + y 2 − 2x). Esercizio 22. Si determini la natura del punto critico (0, 0) della funzione f (x, y) = 4y 3 − 8y 2 − x2 y 2 + 6x2 y − x4 . Esercizio 23. Determinare i massimi e i minimi relativi della funzione f (x, y) = 3x4 − 4x2 y + y 2 . Esercizio 24. Determinare i massimi e i minimi relativi della funzione f (x, y) = x4 + y 4 − x2 y 2 . Esercizio 25. Determinare gli estremi relativi e assoluti (se esistono) della funzione f (x, y) = (x2 + y 2 )e−(x 2 +y 2 ) . 198 11. Calcolo Differenziale in più Variabili 2.7. Funzioni definite implicitamente Esercizio 26. Sia Γ ⊂ R2 la curva di equazione f (x, y) = 1 + xy − log(exy + e−xy ) = 0. Determinare in quali punti di Γ è possibile applicare il teorema del Dini. Successivamente, nei punti in cui la curva Γ è rappresentabile come grafico d2 y dy di una funzione y = y(x), si calcolino le derivate dx e dx 2. Esercizio 27. Sia Γ ⊂ R2 la curva di equazione f (x, y) = sin y − xey + x2 cos y = 0. Si verifichi che la curva Γ passa per i punti di coordinate (0, 0) e (1, 0). Si verifichi poi che, in un intorno del punto (0, 0), la curva Γ è rappresentabile come grafico di una funzione y = y(x) e si calcolino le derivate y 0 (0) e y 00 (0). Lo stesso vale anche per il punto (1, 0)? Esercizio 28. Sia Γ ⊂ R3 la curva definita dal sistema di equazioni ( 2 x + log(xy) − x cos z = 0 x2 − y 3 + z 2 + x2 z = 0. Si determini se, in un intorno del punto (1, 1, 0), è possibile rappresentare Γ come grafico di una funzione R → R2 , x 7→ (y(x), z(x)), e, in caso affermativo, si calcolino le derivate y 0 e z 0 nel punto in questione. Esercizio 29. Sia S ⊂ R3 la superficie di equazione f (x, y, z) = x3 − x2 y + 2xyz − y 2 sin z + z 2 cos y = 0. Si verifichi che, in un intorno del punto (1, 1, 0), la superficie S è rappresentabile come grafico di una funzione z = z(x, y) e si calcolino le derivate ∂z ∂z parziali ∂x e ∂y nel punto in questione. 2.8. Massimi e minimi vincolati Esercizio 30. Determinare i massimi e i minimi assoluti della funzione f (x, y) = xy 2 nell’insieme A = {(x, y) ∈ R | x2 + xy + y 2 = 1}. Esercizio 31. Determinare i massimi e i minimi assoluti della funzione √ 2 2 f (x, y) = (y − 2)e− x +y nell’insieme A = {(x, y) ∈ R2 | x2 + y 2 ≤ 16}. Esercizio 32. Determinare i massimi e i minimi assoluti della funzione x f (x, y, z) = z+1 3 2 2 nell’insieme A = {(x, y, z) ∈ R | x + y = 4(1 + z)2 , x + 2z = 2}. 3. Soluzioni 199 Esercizio 33. Determinare i massimi e i minimi assoluti della funzione f (x, y) = x + y nell’insieme X = {(x, y) ∈ R2 | 4x2 + 43 y 2 ≤ 1, √ 3x − y ≥ 0}. Esercizio 34. Determinare i massimi e i minimi relativi della funzione f (x, y, z) = z nell’insieme X = {(x, y, z) ∈ R3 | z 3 + 3x2 + y 2 + 2z 2 + 2z + 1 = 0}. 3. Soluzioni 3.1. Derivate parziali Svolgimento esercizio 1. Si ha: y x ∂f = cos , ∂x (x + y)2 x+y ∂f x =− cos ∂y (x + y)2 x . x+y Svolgimento esercizio 2. Si ha: 2x ∂f = 2 , ∂x x + cos y ∂f sin y =− 2 . ∂y x + cos y Svolgimento esercizio 3. Si ha: ∂f x3 y + 2xy 3 + 2xy = , ∂x (x2 + y 2 + 1)3/2 ∂f x4 + x2 = 2 . ∂y (x + y 2 + 1)3/2 Svolgimento esercizio 4. Si ha: ∂f 2 x log(x) cos(y 2 ) + x cos(y 2 ) − y 2 = , ∂x sin(y 2 ) ∂f −2 x2 log(x) sin(y 2 )y − 2 xy (x2 log(x) cos(y 2 ) − xy 2 ) cos(y 2 )y = − 2 . ∂y sin(y 2 ) (sin(y 2 ))2 Svolgimento esercizio 5. In questo caso, per calcolare le derivate parziali di f nell’origine, bisogna ricorrere alla definizione: ∂f f (0 + h, 0) − f (0, 0) (0, 0) = lim = 0, h→0 ∂x h e analogamente ∂f f (0, 0 + h) − f (0, 0) (0, 0) = lim = 0. h→0 ∂y h La funzione f è quindi derivabile nell’origine, e le sue derivate parziali sono nulle. 200 11. Calcolo Differenziale in più Variabili Facciamo notare che per calcolare le derivate parziali di f nel punto (0, 0) non si poteva calcolarne le derivate parziali nel punto (x, y) 6= (0, 0), e poi passare al limite per (x, y) che tende a (0, 0). Infatti l’uguaglianza ∂f ∂f (0, 0) = lim (x, y) (x,y)→(0,0) ∂x ∂x vale se e solo se la derivata parziale ∂f è continua nell’origine (in base ∂x alla definizione stessa di continuità). Nel nostro caso invece non sapevamo neppure se le derivate parziali di f esistessero nell’origine, tanto meno se esse fossero o meno continue. Nel nostro caso si ha infatti ∂f y 3 − x2 y (x, y) = 2 , ∂x (x + y 2 )2 per (x, y) 6= (0, 0), e il limite ∂f y 3 − x2 y (x, y) = lim (x,y)→(0,0) (x2 + y 2 )2 (x,y)→(0,0) ∂x lim non esiste, come si vede facilmente calcolando tale limite per (x, y) che tende a (0, 0) lungo le rette di equazione y = mx (un discorso analogo si può fare per la derivata parziale ∂f ). Si conclude quindi che la funzione f è derivabile ∂y ovunque, ma le sue derivate parziali non sono continue nel punto (0, 0). Osserviamo, per concludere, che la funzione f , pur essendo derivabile nell’origine, non è continua nell’origine. Infatti il limite xy lim f (x, y) = lim (x,y)→(0,0) (x,y)→(0,0) x2 + y 2 non esiste, come si vede facilmente calcolando tale limite per (x, y) che tende a (0, 0) lungo le rette di equazione y = mx. 3.2. Differenziali Svolgimento esercizio 6. La funzione f è definita nell’insieme A = {(x, y) ∈ R2 | x + y 6= 0}. Osserviamo che A è un sottoinsieme aperto di R2 . Le derivate parziali di f sono: ∂f ex sin y(x + y − 1) = , ∂x (x + y)2 ∂f ex ((x + y) cos y − sin y) = . ∂y (x + y)2 Tali derivate parziali esistono e sono continue in tutto l’insieme aperto A. Da ciò segue che la funzione f è differenziabile in tutto l’insieme A, cioè in tutto il suo dominio di definizione. 3. Soluzioni 201 Svolgimento esercizio 7. La funzione f è definita, ed è continua, in tutto R2 . Le derivate parziali di f sono: ∂f = 2x cos(xy) − x2 y sin(xy), ∂x ∂f = −x3 sin(xy) − 2. ∂y Le derivate parziali esistono e sono continue in tutto R2 , di conseguenza la funzione f è differenziabile in tutto R2 . Il differenziale della funzione f nel generico punto (x, y) è dato da ∂f ∂f df (x, y) = (x, y) dx + (x, y) dy. ∂x ∂y Calcolando le derivate parziali nel punto (1, π/2) si trova ∂f π ∂f (1, π/2) = − , (1, π/2) = −3. ∂x 2 ∂y Il differenziale di f nel punto in questione è quindi π df (1, π/2) = − dx − 3 dy. 2 Ricordiamo che con questa scrittura si indica la seguente applicazione lineare: π df (1, π/2) : R2 → R, (h, k) 7→ df (1, π/2)(h, k) = − h − 3 k. 2 Svolgimento esercizio 8. La funzione f (x, y) = xy sin x − y 2 è definita e continua in tutto R2 . Le sue derivate parziali sono ∂f = y sin x + xy cos x, ∂x ∂f = x sin x − 2y. ∂y Le derivate parziali esistono e sono continue in tutto R2 , quindi f è differenziabile ovunque. Per definizione, l’equazione del piano tangente al grafico di f nel punto di coordinate (x0 , y0 , z0 = f (x0 , y0 )) è: ∂f ∂f z = f (x0 , y0 ) + (x0 , y0 )(x − x0 ) + (x0 , y0 )(y − y0 ). ∂x ∂y Nel nostro caso tale equazione diventa: z = 1 − 2y. Svolgimento esercizio 9. (1) Calcoliamo il limite lim (x,y)→(0,0) f (x, y) = lim (x,y)→(0,0) xy y 2 − 2x2 . x2 + y 2 202 11. Calcolo Differenziale in più Variabili Passando in coordinate polari, si trova: lim xy (x,y)→(0,0) y 2 − 2x2 = lim ρ2 sin θ cos θ(sin2 θ − 2 cos2 θ). ρ→0 x2 + y 2 La funzione sin θ cos θ(sin2 θ − 2 cos2 θ) è limitata, dato che le funzioni sin θ e cos θ assumono valori compresi tra −1 e 1, di conseguenza si ha: lim ρ2 sin θ cos θ(sin2 θ − 2 cos2 θ) = 0, ρ→0 da cui si deduce che f è continua nell’origine. (2) Le derivate parziali di f nei punti (x, y) 6= (0, 0) sono: ∂f y 5 − 7x2 y 3 − 2x4 y (x, y) = , ∂x (x2 + y 2 )2 ∂f −2x5 + 5x3 y 2 + xy 4 (x, y) = . ∂y (x2 + y 2 )2 (3) Usando la definizione di derivata parziale si trova: ∂f f (0 + h, 0) − f (0, 0) (0, 0) = lim = 0. h→0 ∂x h Analogamente si ha ∂f f (0, 0 + h) − f (0, 0) (0, 0) = lim = 0. h→0 ∂y h Quindi f è derivabile anche nell’origine. (4) Calcoliamo il limite ∂f y 5 − 7x2 y 3 − 2x4 y (x, y) = lim . (x,y)→(0,0) ∂x (x,y)→(0,0) (x2 + y 2 )2 lim Passando in coordinate polari, si trova: y 5 − 7x2 y 3 − 2x4 y = lim ρ(sin5 θ − 7 cos2 θ sin3 θ − 2 cos4 θ sin θ). ρ→0 (x,y)→(0,0) (x2 + y 2 )2 lim La funzione sin5 θ − 7 cos2 θ sin3 θ − 2 cos4 θ sin θ è limitata, dato che le funzioni sin θ e cos θ assumono valori compresi tra −1 e 1, di conseguenza si ha: lim ρ(sin5 θ − 7 cos2 θ sin3 θ − 2 cos4 θ sin θ) = 0, ρ→0 è continua nell’origine. Analogamente si verifica da cui si deduce che ∂f ∂x ∂f che anche ∂y è continua nell’origine. La funzione f è quindi differenziabile nell’origine, dato che le sue derivate parziali esistono e sono continue nell’origine. 3. Soluzioni 203 3.3. Derivate direzionali Svolgimento esercizio 10. La funzione f è definita per xy > 0, cioè nel primo e terzo quadrante. Le derivate parziali di f sono: ∂f = 4x log(xy) + 2x + 2xy cos(x2 ), ∂x ∂f 2x2 = + sin(x2 ). ∂y y Tali derivate parziali esistono e sono continue in tutto l’insieme (aperto) di definizione della funzione f . Da ciò segue che la funzione f è differenziabile in tutto il suo dominio di definizione. Dato che f è differenziabile, per calcolare le sue derivate direzionali possiamo usare la formula del gradiente, la quale afferma che Dw~ f (x, y) = ∇f (x, y) · w, ~ per ogni versore w. ~ Nel nostro caso il vettore ~v = (1, 3) non è un versore, cioè non ha norma 1. Bisogna quindi normalizzarlo, dividendolo per la sua norma. Si ottiene cosı̀ il versore ~v 1 v̂ = = √ (1, 3). k~v k 10 Dalla formula del gradiente si ricava quindi: Dv̂ f (x, y) = ∇f (x, y) · v̂ 2 1 3 2x 2 2 =√ 4x log(xy) + 2x + 2xy cos(x ) + √ + sin(x ) . 10 10 y Svolgimento esercizio 11. In questo caso per calcolare le derivate direzionali di f nel punto (0, 0) bisogna usare la definizione. Sia dunque ~v = (vx , vy ) un versore qualunque. Si ha: f (0 + hvx , 0 + hvy ) − f (0, 0) h→0 h 5 3 2 1 h vx vy = lim 2 + v 2 )2 h→0 h h4 (vx y D~v f (0, 0) = lim = vx3 vy2 . (vx2 + vy2 )2 Quindi la funzione f è derivabile nell’origine rispetto a qualsiasi direzione. In particolare, dal risultato appena trovato, si deduce che ∂f (0, 0) = D(1,0) f (0, 0) = 0, ∂x e ∂f (0, 0) = D(0,1) f (0, 0) = 0. ∂y 204 11. Calcolo Differenziale in più Variabili Dato che le derivate parziali di f nell’origine sono nulle, è nullo il gradiente di f nell’origine, ∇f (0, 0) = (0, 0). Se la funzione f fosse differenziabile nell’origine si potrebbe allora applicare la formula del gradiente, ottenendo D~v f (0, 0) = ∇f (0, 0) · ~v = 0, per ogni versore ~v . Ma abbiamo appena visto che le derivate direzionali di f nell’origine non sono tutte nulle. Si conclude quindi che f non può essere differenziabile nell’origine. Questo stesso risultato si poteva ottenere direttamente ricordando la definizione di differenziale. Infatti, se esistesse il differenziale di f nell’origine, si avrebbe df (0, 0) = ∂f ∂f (0, 0) dx + (0, 0) dy = 0, ∂x ∂y inoltre il seguente limite dovrebbe essere nullo: f (0 + h, 0 + k) − f (0, 0) − df (0, 0)(h, k) √ = 0. (h,k)→(0,0) h2 + k 2 lim Ma si ha: f (0 + h, 0 + k) − f (0, 0) − df (0, 0)(h, k) √ (h,k)→(0,0) h2 + k 2 lim = h3 k 2 √ , (h,k)→(0,0) (h2 + k 2 )2 h2 + k 2 lim e si verifica facilmente che questo limite non esiste (infatti se lo calcoliamo lungo le rette di equazione k = mh si scopre che il valore del limite dipende dal parametro m, cioè dalla retta scelta). 3.4. Derivate parziali seconde Svolgimento esercizio 12. Le derivate parziali prime sono: ∂f = 2x log y + y 2 cos(xy 2 ), ∂x ∂f x2 = + 2xy cos(xy 2 ). ∂y y 3. Soluzioni 205 Le derivate parziali seconde sono quindi: ∂2f ∂x2 ∂2f ∂x∂y ∂2f ∂y∂x ∂2f ∂y 2 2 = 2 log y − y 4 sin(xy 2 ), 2x − 2xy 3 sin(xy 2 ) + 2y cos(xy 2 ), y 2x = − 2xy 3 sin(xy 2 ) + 2y cos(xy 2 ), y x2 = − 2 − 4x2 y 2 sin(xy 2 ) + 2x cos(xy 2 ). y = 2 ∂ f ∂ f Si noti che si ha ∂x∂y = ∂y∂x , come previsto dal teorema di Schwartz, dato che le derivate seconde miste sono ovviamente continue. Svolgimento esercizio 13. Le derivate parziali prime sono: ∂f = 6x2 y cos z + y 2 z, ∂x ∂f = 2x3 cos z + 2xyz, ∂y ∂f = −2x3 y sin z + xy 2 . ∂z Le derivate parziali seconde sono quindi: ∂2f = 12xy cos z, ∂x2 ∂2f ∂2f = = 6x2 cos z + 2yz, ∂x∂y ∂y∂x ∂2f ∂2f = = −6x2 y sin z + y 2 , ∂x∂z ∂z∂x ∂2f = 2xz, ∂y 2 ∂2f ∂2f ∂2f = = −2x3 sin z + 2xy, = −2x3 y cos z. ∂y∂z ∂z∂y ∂z 2 La matrice Hessiana di f è quindi: 12xy cos z 6x2 cos z + 2yz −6x2 y sin z + y 2 2xz −2x3 sin z + 2xy . H(f ) = 6x2 cos z + 2yz 2 2 3 −6x y sin z + y −2x sin z + 2xy −2x3 y cos z Svolgimento esercizio 14. La funzione f (x, y) è la stessa dell’esercizio 9. Nello svolgimento di tale esercizio abbiamo visto che f è continua ovunque (anche nell’origine), che essa è derivabile ovunque e che le sue derivate parziali sono date da 5 2 3 4 y − 7x y − 2x y se (x, y) 6= (0, 0), ∂f (x, y) = (x2 + y 2 )2 ∂x 0 se (x, y) = (0, 0), 206 11. Calcolo Differenziale in più Variabili e 5 3 2 4 −2x + 5x y + xy ∂f (x, y) = (x2 + y 2 )2 ∂y 0 se (x, y) 6= (0, 0), se (x, y) = (0, 0). Abbiamo poi dimostrato che le due derivate parziali di f sono continue ovunque (anche nell’origine), e quindi f è differenziabile ovunque. Siamo ora in grado di calcolare le derivate parziali seconde miste nell’origine della funzione f . Si ha: ∂ ∂f ∂2f (0, 0) = (0, 0) ∂x∂y ∂x ∂y = lim ∂f (0 ∂y + h, 0) − ∂f (0, 0) ∂y h −2h5 /h4 = lim = −2, h→0 h h→0 e ∂2f ∂ ∂f (0, 0) = (0, 0) ∂y∂x ∂y ∂x = lim h→0 ∂f (0, 0 ∂x + h) − h ∂f (0, 0) ∂x h5 /h4 = 1. h→0 h Abbiamo cosı̀ scoperto che le due derivate parziali seconde miste di f nell’origine non sono uguali: = lim ∂2f ∂2f (0, 0) 6= (0, 0). ∂x∂y ∂y∂x Ricordando il teorema di Schwarz, possiamo quindi concludere che, anche se le derivate parziali seconde miste esistono nell’origine, esse non possono essere continue in tale punto (altrimenti dovrebbero essere necessariamente uguali). La funzione f è quindi un esempio di una funzione che è di classe C 1 , ma non di classe C 2 , in un intorno dell’origine. 3.5. Serie di Taylor Svolgimento esercizio 15. Ricordiamo che lo sviluppo in serie di Taylor al primo ordine di una funzione f (x, y) all’intorno di un punto (x0 , y0 ) è dato da √ ∂f ∂f f (x0 + h, y0 + k) = f (x0 , y0 ) + (x0 , y0 ) h + (x0 , y0 ) k + o( h2 + k 2 ). ∂x ∂y 3. Soluzioni 207 Nel nostro caso si ha: f (1, 1) = 0, ∂f 1 = 2x sin(πy) − , ∂x x 1 ∂f = πx2 cos(πy) − , ∂y y da cui segue ∂f ∂f (1, 1) = −1, (1, 1) = −1 − π. ∂x ∂y Lo sviluppo in serie di Taylor cercato è quindi √ f (1 + h, 1 + k) = −h − (1 + π)k + o( h2 + k 2 ). Svolgimento esercizio 16. Ricordiamo che lo sviluppo in serie di Taylor al primo ordine di una funzione f (x, y, z) all’intorno di un punto (x0 , y0 , z0 ) è dato da ∂f ∂f (x0 , y0 , z0 ) h + (x0 , y0 , z0 ) k f (x0 + h, y0 + k, z0 + l) = f (x0 , y0 , z0 ) + ∂x ∂y √ ∂f + (x0 , y0 , z0 ) l + o( h2 + k 2 + l2 ). ∂z Nel nostro caso si ha: f (−1, 1, 1) = −1, ∂f = y 2 z − 2y sin(πy), ∂x ∂f = 2xyz + cos(πz/2) − 2x sin(πy) − 2πxy cos(πy), ∂y ∂f π = xy 2 − y sin(πz/2), ∂z 2 da cui segue ∂f ∂f ∂f π (−1, 1, 1) = 1, (−1, 1, 1) = −2 − 2π, (−1, 1, 1) = −1 − . ∂x ∂y ∂z 2 Lo sviluppo in serie di Taylor cercato è quindi √ f (−1 + h, 1 + k, 1 + l) = −1 + h − 2(1 + π)k − (1 + π/2)l + o( h2 + k 2 + l2 ). Svolgimento esercizio 17. Ricordiamo che lo sviluppo in serie di Taylor al secondo ordine di una funzione f (x, y) all’intorno di un punto (x0 , y0 ) è dato da ∂f ∂f f (x0 + h, y0 + k) = f (x0 , y0 ) + (x0 , y0 ) h + (x0 , y0 ) k ∂x ∂y 1 ∂2f ∂2f ∂2f 2 2 + (x0 , y0 ) h + 2 (x0 , y0 ) hk + 2 (x0 , y0 ) k 2 ∂x2 ∂x∂y ∂y 2 2 + o(h + k ). 208 11. Calcolo Differenziale in più Variabili Nel nostro caso si ha: f (0, 1) = 0, ∂f = ex sin(xy) + yex cos(xy), ∂x ∂f = xex cos(xy), ∂y da cui segue ∂f ∂f (0, 1) = 1, (0, 1) = 0. ∂x ∂y Le derivate seconde sono: ∂2f = ex sin(xy) + 2yex cos(xy) − y 2 ex sin(xy), ∂x2 ∂2f = xex cos(xy) − xyex sin(xy) + ex cos(xy), ∂x∂y ∂2f = −x2 ex sin(xy), ∂y 2 da cui segue ∂2f (0, 1) = 2, ∂x2 ∂2f (0, 1) = 1, ∂x∂y ∂2f (0, 1) = 0. ∂y 2 Lo sviluppo in serie di Taylor cercato è quindi f (0 + h, 1 + k) = h + h2 + hk + o(h2 + k 2 ). Svolgimento esercizio 18. Ricordiamo che lo sviluppo in serie di Taylor al secondo ordine di una funzione f (x, y, z) all’intorno di un punto (x0 , y0 , z0 ) è dato da ∂f f (x0 + h, y0 + k, z0 + l) = f (x0 , y0 , z0 ) + (x0 , y0 , z0 ) h ∂x ∂f ∂f + (x0 , y0 , z0 ) k + (x0 , y0 , z0 ) l ∂y ∂z 1 ∂2f ∂2f 2 + (x , y , z ) h + (x0 , y0 , z0 ) k 2 0 0 0 2 ∂x2 ∂y 2 ∂2f ∂2f + 2 (x0 , y0 , z0 ) l2 + 2 (x0 , y0 , z0 ) hk ∂z ∂x∂y ∂2f ∂2f +2 (x0 , y0 , z0 ) hl + 2 (x0 , y0 , z0 ) kl ∂x∂z ∂y∂z + o(h2 + k 2 + l2 ). Nel nostro caso si ha: f (1, 1, 0) = 2, 3. Soluzioni 209 ∂f = 4x cos(yz) − yz cos(xz), ∂x ∂f = −2x2 z sin(yz) − sin(xz), ∂y ∂f = −2x2 y sin(yz) − xy cos(xz), ∂z da cui segue ∂f (1, 1, 0) = 4, ∂x ∂f (1, 1, 0) = 0, ∂y ∂f (1, 1, 0) = −1. ∂z Le derivate seconde sono: ∂2f ∂x2 ∂2f ∂y 2 ∂2f ∂z 2 ∂2f ∂x∂y ∂2f ∂x∂z ∂2f ∂y∂z = 4 cos(yz) − yz 2 sin(xz), = −2x2 z 2 cos(yz), = −2x2 y 2 cos(yz) + x2 y sin(xz), = −4xz sin(yz) − z cos(xz), = −4xy sin(yz) + xyz sin(xz) − y cos(xz), = −2x2 yz cos(yz) − 2x2 sin(yz) − x cos(xz), da cui segue ∂2f (1, 1, 0) = 4, ∂x2 ∂2f (1, 1, 0) = 0, ∂y 2 ∂2f (1, 1, 0) = −2, ∂z 2 ∂2f ∂2f (1, 1, 0) = 0, (1, 1, 0) = −1, ∂x∂y ∂x∂z Lo sviluppo in serie di Taylor cercato è quindi ∂2f (1, 1, 0) = −1. ∂y∂z f (1 + h, 1 + k, 0 + l) = 2 + 4h − l + 2h2 − l2 − hl − kl + o(h2 + k 2 + l2 ). 3.6. Massimi e minimi liberi Svolgimento esercizio 19. Le derivate parziali della funzione f sono ∂f = 3x2 + 3y 2 − 15, ∂x ∂f = 6xy − 12. ∂y 210 11. Calcolo Differenziale in più Variabili I punti critici si trovano risolvendo il sistema ∂f = 3x2 + 3y 2 − 15 = 0 ∂x ∂f = 6xy − 12 = 0 ∂y Questo sistema ammette quattro soluzioni, date dai punti di coordinate (2, 1), (−2, −1), (1, 2) e (−1, −2). La matrice Hessiana di f è 6x 6y H(f ) = 6y 6x quindi si ha: 12 6 −12 −6 H(f )(2, 1) = , H(f )(−2, −1) = , 6 12 −6 −12 e 6 12 −6 −12 H(f )(1, 2) = , H(f )(−1, −2) = . 12 6 −12 −6 La matrice H(f )(2, 1) è definita positiva, quindi (2, 1) è un punto di minimo relativo. La matrice H(f )(−2, −1) è definita negativa, quindi (−2, −1) è un punto di massimo relativo. Le matrici H(f )(1, 2) e H(f )(−1, −2) sono indefinite, quindi (1, 2) e (−1, −2) non sono né punti di massimo né punti di minimo relativo (sono punti di sella). Infine, per quanto riguarda gli estremi assoluti, si vede facilemente che f non ammette né minimo né massimo assoluti, dato che si ha, ad esempio, lim f (x, 0) = −∞, x→−∞ e lim f (x, 0) = +∞, x→+∞ cioè dato che f assume, nel suo dominio di definizione, valori arbitrariamente piccoli e valori arbitrariamente grandi. Svolgimento esercizio 20. Le derivate parziali della funzione f sono ∂f ∂f ∂f = x + yz, = xz + 1, = xy − 1. ∂x ∂y ∂z I punti critici si trovano risolvendo il sistema ∂f = x + yz = 0 ∂x ∂f = xz + 1 = 0 ∂y ∂f = xy − 1 = 0. ∂z Si trova un solo punto critico, di coordinate (1, 1, −1). 3. Soluzioni 211 La matrice Hessiana di f è 1 z y H(f ) = z 0 x y x 0 quindi si ha 1 −1 1 H(f )(0, 0) = −1 0 1 . 1 1 0 1 −1 = La catena dei minori principali è data da ∆1 = 1 > 0, ∆2 = −1 0 −1 < 0, ∆3 = det H(f )(0, 0) = −3 < 0. Da ciò si deduce che la matrice H(f )(0, 0) è indefinita, e quindi il punto (0, 0) non è né un punto di massimo né un punto di minimo relativo. Svolgimento esercizio 21. Le derivate parziali della funzione f sono ∂f = 3x2 + y 2 − 4x, ∂x ∂f = 2xy. ∂y I punti critici si trovano risolvendo il sistema ∂f = 3x2 + y 2 − 4x = 0 ∂x ∂f = 2xy = 0. ∂y Si trovano due punti critici, di coordinate (0, 0) e (4/3, 0), rispettivamente. La matrice Hessiana di f è 6x − 4 2y H(f ) = 2y 2x quindi si ha e −4 0 H(f )(0, 0) = 0 0 4 0 H(f )(4/3, 0) = . 0 8/3 La matrice H(f )(4/3, 0) è definita positiva, quindi il punto (4/3, 0) è un punto di minimo relativo per la funzione f . La matrice H(f )(0, 0) invece è semidefinita negativa, quindi siamo in presenza di un caso dubbio: in questo modo non possiamo affermare nulla sulla natura del punto critico (0, 0). Procediamo in un altro modo. Osserviamo che f (0, 0) = 0, quindi cerchiamo di scoprire se, in un intorno di (0, 0) la funzione f assume valori 212 11. Calcolo Differenziale in più Variabili + −1 y − –1 + − − − − − − − –1 − 1 − + x 2 3 − + Figura 1. Studio del segno di f (x, y). positivi o negativi. In altre parole, cerchiamo di risolvere la disequazione f (x, y) > 0. A tal scopo osserviamo che f (x, y) = x(x2 + y 2 − 2x) è il prodotto di due polinomi, quindi per risolvere la disequazione f (x, y) > 0 è sufficiente studiare il segno dei polinomi x e x2 + y 2 − 2x. L’equazione x2 + y 2 − 2x = 0 rappresenta un cerchio di raggio 1 centrato nel punto (1, 0). Si verifica facilmente che il polinomio x2 + y 2 − 2x assume valori negativi nei punti interni al cerchio e valori positivi nei punti esterni. Utilizzando la regola dei segni si deduce quindi che il segno di f (x, y) è quello descritto in figura 1. Si vede quindi che in ogni intorno dell’origine la funzione f assume sia valori positivi, cioè più grandi di f (0, 0), che valori negativi, cioè più piccoli di f (0, 0). Da ciò si deduce che il punto critico (0, 0) non è né un punto di minimo né un punto di massimo per f . Svolgimento esercizio 22. Le derivate parziali della funzione f sono ∂f = −2xy 2 + 12xy − 4x3 , ∂x ∂f = 12y 2 − 16y − 2x2 y + 6x2 . ∂y Si ha effettivamente ∂f (0, 0) = 0 e ∂f (0, 0) = 0, quindi (0, 0) è proprio un ∂x ∂y punto critico per f . La matrice Hessiana di f è −2y 2 + 12y − 12x2 −4xy + 12x H(f ) = −4xy + 12x 24y − 16 − 2x2 quindi si ha H(f )(0, 0) = 0 0 . 0 −16 3. Soluzioni 213 2 − + − –2 − −y1 + − + − − − + − − 0 − − − x − 2 Figura 2. Studio del segno di f (x, y). Questa matrice è semidefinita negativa, quindi siamo in presenza di un caso dubbio: in questo modo non possiamo affermare nulla sulla natura del punto critico (0, 0). Procediamo in un altro modo. Osserviamo che f (0, 0) = 0, quindi cerchiamo di scoprire se, in un intorno di (0, 0) la funzione f assume valori positivi o negativi. In altre parole, cerchiamo di risolvere la disequazione f (x, y) > 0. A tal scopo osserviamo che il polinomio f (x, y) = 4y 3 − 8y 2 − x2 y 2 + 6x2 y − x4 si scompone come segue: f (x, y) = (x2 + y 2 − 2y)(4y − x2 ), quindi per risolvere la disequazione f (x, y) > 0 è sufficiente studiare il segno dei polinomi x2 + y 2 − 2y e 4y − x2 . L’equazione x2 + y 2 − 2y = 0 rappresenta un cerchio di raggio 1 centrato nel punto (0, 1). Si verifica facilmente che il polinomio x2 + y 2 − 2y assume valori negativi nei punti interni al cerchio e valori positivi nei punti esterni. L’equazione 4y − x2 = 0 rappresenta una parabola con il vertice nell’origine, avente come asse l’asse delle y e con la concavità rivolta verso l’alto. Si verifica facilmente che il polinomio 4y − x2 assume valori negativi nei punti del piano che si trovano “sotto” il grafico della parabola e valori positivi nei punti del piano che si trovano “sopra” il grafico della parabola. Utilizzando la regola dei segni si deduce che il segno di f (x, y) è quello descritto in figura 2. Si vede quindi che in ogni intorno dell’origine la funzione f assume sia valori positivi, cioè più grandi di f (0, 0), che valori negativi, cioè più piccoli di f (0, 0). Da ciò si deduce che il punto critico (0, 0) non è né un punto di minimo né un punto di massimo per f . Osservazione: Se consideriamo la restrizione della funzione f (x, y) all’asse delle x, otteniamo la funzione f (x, 0) = −x4 , la quale ha evidentemente un massimo relativo (e anche assoluto) nel punto (0, 0). Analogamente, se consideriamo la restrizione della funzione f (x, y) all’asse delle y, si ottiene la funzione F (y) = f (0, y) = 4y 3 − 8y 2 . La derivata seconda di questa funzione è F 00 (y) = 24y − 16, quindi F 00 (0) = −16 < 0, da cui si deduce che anche la restrizione di f all’asse delle y ha un massimo relativo nel punto 214 11. Calcolo Differenziale in più Variabili (0, 0). Per terminare, consideriamo la restrizione di f (x, y) a una qualunque retta di equazione y = mx, con m 6= 0. Si ottiene la funzione G(x) = f (x, mx) = −(m2 + 1)x4 + (4m3 + 6m)x3 − 8m2 x2 . La derivata seconda di questa funzione è G00 (x) = −12(m2 + 1)x2 + 6(4m3 + 6m)x − 16m2 , quindi G00 (0) = −16m2 < 0, da cui si deduce che anche la restrizione di f a una qualunque retta di equazione y = mx ha un massimo relativo nel punto (0, 0). In conclusione, abbiamo visto che la funzione f (x, y) non ha nell’origine né un massimo né un minimo relativo, tuttavia la sua restrizione a una qualsiasi retta passante per l’origine ammette sempre un massimo relativo nell’origine. Questo fatto quindi non è sufficiente per affermare che il punto (0, 0) è un punto di massimo relativo per una funzione f . Svolgimento esercizio 23. Le derivate parziali della funzione f sono ∂f = 12x3 − 8xy, ∂x ∂f = −4x2 + 2y. ∂y I punti critici si trovano risolvendo il sistema ∂f = 12x3 − 8xy = 0 ∂x ∂f = −4x2 + 2y = 0. ∂y L’unica soluzione di questo sistema è il punto di coordinate (0, 0). La matrice Hessiana di f è 36x2 − 8y −8x H(f ) = −8x 2 e si ha pertanto 0 0 H(f )(0, 0) = . 0 2 Questa matrice è semidefinita positiva, quindi siamo in presenza di un caso dubbio: in questo modo non possiamo affermare nulla sulla natura del punto critico (0, 0). Procediamo in un altro modo. Osserviamo che f (0, 0) = 0, quindi cerchiamo di scoprire se, in un intorno di (0, 0) la funzione f assume valori positivi o negativi. In altre parole, cerchiamo di risolvere la disequazione f (x, y) > 0. A tal scopo osserviamo che il polinomio f (x, y) = 3x4 −4x2 y+y 2 si scompone come segue: f (x, y) = (y − x2 )(y − 3x2 ), 3. Soluzioni 215 4 − − + + + − − − + + − + + –2 + y2 + + 0 x 2 Figura 3. Studio del segno di f (x, y). quindi per risolvere la disequazione f (x, y) > 0 è sufficiente studiare il segno dei polinomi y − x2 e y − 3x2 . L’equazione y − x2 = 0 rappresenta una parabola con il vertice nell’origine, avente come asse l’asse delle y e con la concavità rivolta verso l’alto. Si verifica facilmente che il polinomio y − x2 assume valori negativi nei punti del piano che si trovano “sotto” il grafico della parabola e valori positivi nei punti del piano che si trovano “sopra” il grafico della parabola. In modo del tutto analogo, l’equazione y − 3x2 = 0 rappresenta una parabola con il vertice nell’origine, avente come asse l’asse delle y e con la concavità rivolta verso l’alto. Si verifica facilmente che il polinomio y − 3x2 assume valori negativi nei punti del piano che si trovano “sotto” il grafico della parabola e valori positivi nei punti del piano che si trovano “sopra” il grafico della parabola. Utilizzando la regola dei segni si deduce che il segno di f (x, y) è quello descritto in figura 3. Si vede quindi che in ogni intorno dell’origine la funzione f assume sia valori positivi, cioè più grandi di f (0, 0), che valori negativi, cioè più piccoli di f (0, 0). Da ciò si deduce che il punto critico (0, 0) non è né un punto di minimo né un punto di massimo per f . Osservazione: Se consideriamo la restrizione della funzione f (x, y) all’asse delle x, otteniamo la funzione f (x, 0) = 3x4 , la quale ha evidentemente un minimo relativo (e anche assoluto) nel punto (0, 0). Analogamente, se consideriamo la restrizione della funzione f (x, y) all’asse delle y, si ottiene la funzione f (0, y) = y 2 . Anche questa funzione ha evidentemente un minimo relativo (e anche assoluto) nel punto (0, 0). Per terminare, consideriamo la restrizione di f (x, y) a una qualunque retta di equazione y = mx, con 216 11. Calcolo Differenziale in più Variabili m 6= 0. Si ottiene la funzione F (x) = f (x, mx) = 3x4 − 4mx3 + m2 x2 . La derivata seconda di questa funzione è F 00 (x) = 36x2 − 24mx + 2m2 , quindi F 00 (0) = 2m2 > 0, da cui si deduce che anche la restrizione di f a una qualunque retta di equazione y = mx ha un minimo relativo nel punto (0, 0). In conclusione abbiamo visto che la funzione f (x, y) pur non avendo nell’origine né un massimo né un minimo relativo, è tale che la sua restrizione a una qualsiasi retta passante per l’origine ammette sempre un minimo relativo nell’origine. Svolgimento esercizio 24. Le derivate parziali della funzione f sono ∂f = 4x3 − 2xy 2 , ∂x ∂f = 4y 3 − 2x2 y. ∂y I punti critici si trovano risolvendo il sistema ∂f = 4x3 − 2xy 2 = 0 ∂x ∂f = 4y 3 − 2x2 y = 0. ∂y L’unica soluzione di questo sistema è il punto di coordinate (0, 0). La matrice Hessiana di f è 12x2 − 2y 2 −4xy H(f ) = −4xy 12y 2 − 2x2 quindi si ha 0 0 H(f )(0, 0) = . 0 0 Siamo dunque in presenza di un caso dubbio: in questo modo non possiamo affermare nulla sulla natura del punto critico (0, 0). Procediamo in un altro modo. Osserviamo che f (0, 0) = 0, quindi cerchiamo di scoprire se, in un intorno di (0, 0) la funzione f assume valori positivi o negativi. In altre parole, cerchiamo di risolvere la disequazione f (x, y) > 0. A tal scopo osserviamo che la funzione f (x, y) si può riscrivere come segue: f (x, y) = x4 + y 4 − x2 y 2 = (x2 − y 2 )2 + x2 y 2 . In questo modo si vede che f (x, y) è la somma di due quadrati, e come tale assume sempre valori ≥ 0. 3. Soluzioni 217 In conclusione si ha: f (x, y) ≥ 0, per ogni (x, y), e f (0, 0) = 0. Si conclude quindi che il punto (0, 0) è un punto di minimo relativo, e anche assoluto, per la funzione f . Svolgimento esercizio 25. Le derivate parziali della funzione f sono ∂f 2 2 = 2xe−(x +y ) (1 − x2 − y 2 ), ∂x ∂f 2 2 = 2ye−(x +y ) (1 − x2 − y 2 ). ∂y I punti critici si trovano risolvendo il sistema ∂f 2 2 = 2xe−(x +y ) (1 − x2 − y 2 ) = 0 ∂x ∂f 2 2 = 2ye−(x +y ) (1 − x2 − y 2 ) = 0. ∂y 2 2 Dato che il fattore e−(x +y ) non si annulla mai, le soluzioni di questo sistema sono date dal punto di coordinate (0, 0) e da tutti i punti che soddisfano l’equazione x2 +y 2 = 1, cioè dai punti della circonferenza di raggio 1 centrata nell’origine. In questo caso non è necessario determinare le derivate parziali seconde di f . Notiamo infatti che f (x, y) ≥ 0 per ogni (x, y), e che f (0, 0) = 0. Da ciò segue che il punto (0, 0) è un punto di minimo relativo, e anche assoluto, per f . Osserviamo inoltre che lim f (x, y) = 0, (x,y)→∞ da cui si deduce che f ammette massimo assoluto. In tutti i punti della circonferenza di equazione x2 + y 2 = 1 la funzione assume sempre lo stesso valore, pari a e−1 . Questi sono dunque punti di massimo relativo, e anche assoluto, per f . Osservazione: In alternativa si poteva studiare la funzione f (x, y) utilizzando le coordinate polari nel piano. Sostituendo x e y con le espressioni x = ρ cos θ, y = ρ sin θ, la funzione f (x, y) si riscrive come segue: 2 f (ρ, θ) = ρ2 e−ρ . Questa funzione dipende effettivamente solo dalla variabile ρ, quindi i suoi massimi e minimi si trovano con il solito metodo usato per le funzioni di una sola variabile. 3.7. Funzioni definite implicitamente Svolgimento esercizio 26. Il teorema del Dini si può applicare nei punti di Γ in cui il gradiente di f è diverso da zero. Calcoliamo quindi le derivate 218 11. Calcolo Differenziale in più Variabili parziali di f . Si ha: ∂f 2ye−xy = xy , ∂x e + e−xy ∂f 2xe−xy = xy . ∂y e + e−xy L’unico punto in cui si annullano entrambe le derivate parziali è il punto di coordinate (0, 0), tuttavia si ha f (0, 0) = 1 − log(2) 6= 0, quindi il punto in questione non appartiene alla curva Γ. Si conclude quindi che non ci sono punti di Γ in cui si annulla il gradiente di f , e quindi si può applicare il teorema del Dini in ogni punto di Γ. Il teorema del Dini afferma poi che la curva Γ è rappresentabile come grafico di una funzione y = y(x) nei punti in cui ∂f 6= 0. Dato che si ha ∂y ∂f 6= 0 per x 6= 0, si conclude che dall’equazione f (x, y) = 0 è possibile ∂y ricavare y in funzione della variabile x solo nei punti in cui x 6= 0. dy Per calcolare la derivata dx ricordiamo ancora il teorema del Dini, il quale afferma che è ∂f (x, y(x)) dy ∂x (x) = − ∂f dx (x, y(x)) ∂y 2y(x)e−xy(x) exy(x) + e−xy(x) · exy(x) + e−xy(x) 2xe−xy(x) y(x) =− . x =− 2 d y Per calcolare la derivata seconda dx 2 basta ora derivare l’espressione appena trovata: d2 y d y(x) (x) = − dx2 dx x 0 xy (x) − y(x) =− x2 2y(x) = . x2 Osserviamo infine che l’equazione f (x, y) = 0 è sufficientemente semplice da permetterci di ricavare esplicitamente y in funzione di x. Si ha infatti: f (x, y) = 0 ⇔ 1 + xy = log(exy + e−xy ) ⇔ e1+xy = exy + e−xy . Moltiplicando ambo i membri per e−xy si ottiene e = 1 + e−2xy , da cui si ricava −2xy = log(e − 1) e quindi y=− log(e − 1) , 2x 3. Soluzioni 219 ovviamente con la condizione x 6= 0 (che è esattamente la condizione trovata utilizzando il teorema del Dini). A questo punto, nota l’espressione di y in funzione di x, è facile calcolare dy d2 y direttamente le derivate dx e dx 2 e verificare quindi l’esattezza dei risultati trovati in precedenza utilizzando il teorema del Dini. Svolgimento esercizio 27. Si ha f (0, 0) = 0 e f (1, 0) = 0, quindi i punti (0, 0) e (1, 0) appartengono alla curva Γ. Calcoliamo ora le derivate parziali di f . Si ha: ∂f ∂f = −ey + 2x cos y, = cos y − xey − x2 sin y. ∂x ∂y Dato che ∂f (0, 0) = 1 6= 0, in base al teorema del Dini, la curva Γ è ∂y rappresentabile come grafico di una funzione y = y(x) in un intorno del punto (0, 0). Inoltre si ha: 0 y (0) = ∂f (0, 0) ∂x − ∂f (0, 0) ∂y = 1. Per quanto riguarda il punto (1, 0), si ha ∂f (1, 0) = 0, quindi, in un intorno ∂y di tale punto, non è possibile esprimere Γ come grafico di una funzione della variabile x. Per calcolare la derivata seconda y 00 (0) possiamo procedere come segue. Iniziamo derivando rispetto a x l’espressione f (x, y(x)) = 0. Si trova: y 0 cos y − ey − xy 0 ey + 2x cos y − x2 y 0 sin y = 0. Derivando ancora rispetto a x l’espressione appena trovata si ottiene: − (y 0 )2 sin y + y 00 cos y − 2y 0 ey − x(y 0 )2 ey − xy 00 ey + 2 cos y − 4xy 0 sin y − x2 (y 0 )2 cos y − x2 y 00 sin y = 0. Valutando questa espressione nel punto (0, 0) e ricordando che y 0 (0) = 0, si trova y 00 (0) = 0. Osservazione: Osserviamo che l’equazione f (x, y) = 0 è sufficientemente semplice da permetterci di ricavare esplicitamente x in funzione di y. Si tratta infatti di una equazione di secondo grado nella variabile x (dipendente da un parametro y) x2 cos y − xey + sin y = 0, da cui si ottiene p ey ± e2y − 4 sin y cos y . x= 2 cos y Il grafico di queste due funzioni è rappresentato in figura 4. Osservando la figura si vede chiaramente che la retta tangente alla curva Γ nel punto di coordinate (1, 0) è verticale (è questo il significato geometrico del fatto che 220 11. Calcolo Differenziale in più Variabili 1 –1 0 1 2 Figura 4. Grafico di f (x, y) = 0. ∂f (1, 0) ∂y = 0). Questa è la ragione per cui, in un intorno del punto (1, 0), non è possibile esprimere Γ come grafico di una funzione y = y(x). Svolgimento esercizio 28. Supponiamo che, in un intorno del punto (1, 1, 0), esistano delle funzioni y = y(x) e z = z(x) tali che valgano le due identità ( 2 x + log(xy(x)) − x cos z(x) = 0 x2 − y(x)3 + z(x)2 + x2 z(x) = 0. Derivando rispetto a x si ottiene: 0 2x + y + xy − cos z + xz 0 sin z = 0 xy 0 2zz + 2x − 3y 2 y 0 + x2 z 0 + 2xz = 0. Valutando queste espressioni nel punto (1, 1, 0) si trova: ( 2 + y 0 (1) = 0 2 − 3y 0 (1) + z 0 (1) = 0, da cui si ricava infine ( y 0 (1) = −2 z 0 (1) = −8. Abbiamo quindi calcolato le derivate richieste, nell’ipotesi che esistano le due funzioni y = y(x) e z = z(x) in un intorno del punto (1, 1, 0). Ma, in base a una versione più sofisticata del teorema del Dini, l’esistenza delle due derivate y 0 (1) e z 0 (1) è precisamente una condizione sufficiente a garantire l’esistenza locale delle due funzioni y = y(x) e z = z(x). Svolgimento esercizio 29. Si ha: ∂f = 2xy − y 2 cos z + 2z cos y, ∂z da cui si deduce che ∂f (1, 1, 0) = 1 6= 0. ∂z 3. Soluzioni 221 In base a una versione più raffinata del teorema del Dini possiamo quindi affermare che, in un intorno del punto (1, 1, 0), la superficie S è rappresentabile come grafico di una funzione z = z(x, y). Deriviamo ora, rispetto a x e y, l’identità f (x, y, z(x, y)) = 0. Si ottiene: ∂z ∂z ∂z − y 2 cos z + 2z cos y =0 3x2 − 2xy + 2yz + 2xy ∂x ∂x ∂x − x2 + 2xz + 2xy ∂z − 2y sin z − y 2 cos z ∂z + 2z cos y ∂z − z 2 sin y = 0. ∂y ∂y ∂y Valutando queste espressioni nel punto (1, 1, 0) si trova: ∂z (1, 1) = 0 1 + ∂x ∂z (1, 1) = 0, −1+ ∂y da cui si ricava ∂z (1, 1) = −1 ∂x ∂z (1, 1) = 1. ∂y 3.8. Massimi e minimi vincolati Svolgimento esercizio 30. Osserviamo innanzi tutto che la funzione f è continua e l’insieme A è chiuso e limitato. In base al teorema di Weierstrass siano quindi certi che la funzione f ammette massimo e minimo assoluti in A. Per determinare i punti critici di f , vincolati a stare nell’insieme A, utilizziamo il metodo dei moltiplicatori di Lagrange. Construiamo la funzione Lagrangiana: L(x, y, λ) = xy + λ(x2 + xy + y 2 − 1). I punti critici di L si trovano risolvendo il sistema ∂L = y + 2λx + λy = 0 ∂x ∂L = x + λx + 2λy = 0 ∂y ∂L = x2 + xy + y 2 − 1 = 0. ∂λ Le soluzioni di questo sistema forniscono i seguenti quattro punti critici: √ √ √ √ (1, −1), (−1, 1), ( 3/3, 3/3), (− 3/3, − 3/3). Si noti che f (x, y) = f (−x, −y), quindi se un punto (x0 , y0 ) è un punto critico di f , lo stesso vale per il punto (−x0 , −y0 ). 222 11. Calcolo Differenziale in più Variabili Valutando la funzione f nei quattro punti trovati, si ha: √ √ √ √ f (1, −1) = f (−1, 1) = −1, f ( 3/3, 3/3) = f (− 3/3, − 3/3) = 1/3. Osservando questi valori, e ricordando che, in base al teorema di Weierstrass, la funzione f ammette sicuramente massimo e minimo assoluti in A, possiamo concludere che i√punti√(1, −1) e√(−1, 1) √ sono i punti di minimo assoluto, mentre i punti ( 3/3, 3/3) e ( 3/3, − 3/3) sono i punti di massimo assoluto per f nell’insieme A. Svolgimento esercizio 31. Osserviamo innanzi tutto che la funzione f è continua e l’insieme A è chiuso e limitato. In base al teorema di Weierstrass siano quindi certi che la funzione f ammette massimo e minimo assoluti in A. L’insieme A è costituito dai punti interni al cerchio di raggio 4 centrato nell’origine (punti che soddisfano la disequazione x2 + y 2 < 16) e anche dai punti che si trovano sulla circonferenza (punti che soddisfano l’equazione x2 + y 2 = 16). Il problema della determinazione degli estremi assoluti di f in A si scompone quindi in due sottoproblemi: (1) la determinazione dei massimi e minimi liberi di f che siano contenuti all’interno del cerchio A; (2) la determinazione dei massimi e minimi di f vincolati a stare sulla circonferenza di equazione x2 + y 2 = 16. Iniziamo dal primo problema; la ricerca dei massimi e minimi liberi di f. Le derivate parziali della funzione f sono x(y − 2) −√x2 +y2 ∂f = −p e , ∂x x2 + y 2 ∂f y(y − 2) −√x2 +y2 = 1− p e . ∂y x2 + y 2 Notiamo che le derivate parziali non esistono nel punto di coordinate (0, 0): la funzione f non è derivabile nell’origine, quindi questo punto dovrà essere studiato separatamente. I punti critici di f si trovano risolvendo il sistema ∂f x(y − 2) −√x2 +y2 p = − e =0 ∂x x2 + y 2 ∂f y(y − 2) −√x2 +y2 = 1− p e = 0. ∂y x2 + y 2 L’unica soluzione di questo sistema è il punto di coordinate (0, 3) (attenzione: risolvendo il sistema si trovano altre soluzioni, che non sono però accettabili). Effettivamente il punto trovato è interno al cerchio A, quindi la funzione f ha un solo punto critico all’interno dell’insieme A. 3. Soluzioni 223 Notiamo a questo punto come non sia necessario procedere allo studio delle derivate parziali seconde per determinare la natura del punto critico (0, 3). Infatti l’esercizio richiede di determinare i massimi e minimi assoluti di f e non quelli relativi. Per fare ciò basta calcolare il valore di f nei punti “interessanti” (punti critici, punti di non-derivabilità, etc.) e prendere rispettivamente il più grande e il più piccolo tra i valori trovati. Nel nostro caso si ha: f (0, 3) = e−3 e f (0, 0) = −2 (ricordiamo che (0, 0) non è un punto critico di f , ma va considerato ugualmente perché f non è derivabile in (0, 0)). Passiamo ora al secondo problema: la ricerca dei massimi e minimi di f vincolati a stare sulla circonferenza di equazione x2 + y 2 = 16. Dato che tale circonferenza si può parametrizzare come segue [0, 2π] 3 θ 7→ (4 cos θ, 4 sin θ), la ricerca dei punti critici di f su questa circonferenza equivale alla ricerca dei punti critici della funzione F (θ) = f (4 cos θ, 4 sin θ) = (4 sin θ − 2)e−4 , per θ ∈ [0, 2π]. Si ha: F 0 (θ) = 4e−4 cos θ = 0, per θ = π/2 e θ = 3π/2. La funzione F (θ) ha dunque due punti critici nell’intervallo [0, 2π], tuttavia bisogna considerare separatamente anche i punti corrispondenti ai valori estremi θ = 0 e θ = 2π, perché in tali punti la funzione F (θ) non è derivabile (questi punti sono i due estremi di un intervallo chiuso). Si ottengono quindi i seguenti tre punti in cui bisogna valutare la funzione f : (4, 0) (per θ = 0 e θ = 2π), (0, 4) (per θ = π/2) e (0, −4) (per θ = 3π/2). I valori di f sono: f (4, 0) = −2e−4 , f (0, 4) = 2e−4 e f (0, −4) = −6e−4 . Analizzando i valori di f nei cinque punti “interessanti” precedentemente trovati, si vede subito che f (0, 0) = −2 è il più piccolo, mentre f (0, 3) = e−3 è il più grande. Si conclude quindi che f ha un minimo assoluto nel punto (0, 0) e un massimo assoluto nel punto (0, 3). Svolgimento esercizio 32. Iniziamo osservando che, per i punti dell’insieme A, è sempre z 6= −1, quindi la funzione f è definita in tutto l’insieme A (in realtà f è definita addirittura in un aperto contenente l’insieme A). L’insieme A è definito dal seguente sistema di equazioni ( x2 + y 2 = 4(1 + z)2 x + 2z = 2. Ricavando z dalla seconda equazione e sostituendo nella prima, si ottiene y 2 = 16 − 8x 224 11. Calcolo Differenziale in più Variabili 1 2 da cui si ricava x = 2 − 18 y 2 , e quindi z = 16 y . Si vede cosı̀ che è possibile ottenere una parametrizzazione globale dell’insieme A: 1 2 1 2 y 7→ (x(y), y, z(y)) = 2 − y , y, y . 8 16 Componendo la funzione x z+1 con questa parametrizzazione, si ottiene la funzione f (x, y, z) = 32 − 2y 2 . 16 + y 2 Gli estremi (liberi) della funzione h(y) rappresentano quindi gli estremi (vincolati) della funzione f (x, y, z) nell’insieme A. Derivando si ottiene: 128y h0 (y) = − (16 + y 2 )2 che si annulla solo per y = 0. Da ciò si ricava che x = 2 e z = 0. La funzione f ha quindi un solo punto critico nell’insieme A, di coordinate (2, 0, 0). Studiando ora il segno di h0 (y), si scopre che la funzione h(y) è crescente per y < 0 e decrescente per y > 0. Il punto y = 0 è quindi un punto di massimo relativo, e anche assoluto, per la funzione h(y). Di conseguenza il punto di coordinate (2, 0, 0) è di massimo relativo, e anche assoluto, per la funzione f nell’insieme A. Infine notiamo che si ha h(y) = f (x(y), y, z(y)) = lim h(y) = −2. y→±∞ La funzione h(y) presenta quindi un asintoto orizzontale, per y → ±∞. Da ciò si deduce che la funzione h(y) (e quindi anche la funzione f nell’insieme A) non ammette un minimo assoluto, anche se ammette un estremo inferiore pari a −2. Svolgimento esercizio 33. Iniziamo descrivendo l’insieme X. L’equazione 4 4x2 + y 2 = 1 3 rappresenta un’ellisse con centro nell’origine e i cui assi coincidono con gli assi cartesiani. L’ellisse interseca gli assi nei quattro punti di coordinate √ (±1/2, 0) e (0, ± 3/2). La disequazione 4 4x2 + y 2 ≤ 1 3 rappresenta quindi la parte di piano interna all’ellisse. √ √ La disequazione 3x − y ≥ 0 equivale a y ≤ 3x ed è quindi soddisfatta √ dai punti che si trovano “sotto” la retta di equazione y = 3x. 3. Soluzioni 225 D B A C Figura 5. L’insieme X. √ √ √ La retta y = 3x interseca l’ellisse nei due punti A = (− 2/4, − 6/4) √ √ e B = ( 2/4, 6/4). Si conclude quindi che l’insieme X è costituito dalla regione interna alla semi-ellisse che giace “sotto” il segmento AB. La situazione è rappresentata in figura 5. Per determinare i massimi e i minimi della funzione f (x, y) = x + y nell’insieme X utilizzeremo il metodo delle curve di livello. Le curve di livello della funzione f sono date dall’equazione f (x, y) = x + y = c, con c costante. Si tratta quindi di un fascio di rette parallele alla bisettrice del secondo e quarto quadrante. Cerchiamo le due rette del fascio che sono tangenti all’ellisse. Dal sistema x + y = c 4 4x2 + y 2 = 1 3 si ottiene l’equazione 16x2 − 8cx + 4c2 − 3 = 0. La condizione di tangenza richiede che sia nullo il discriminante di tale equazione. I valori di c che annullano il discriminante sono c = ±1. Le due rette tangenti cercate sono quindi le rette di equazione x+y = −1 e x+y = 1 rispettivamente. Tali rette intersecano l’ellisse nei punti C = (−1/4, −3/4) e D = (1/4, 3/4) rispettivamente. Ma, dalla descrizione dell’insieme X, si vede facilmente che il punto D non appartiene all’insieme X (si veda la 226 11. Calcolo Differenziale in più Variabili figura 5). Si conclude quindi che il punto C = (−1/4, −3/4) è il punto di minimo assoluto della funzione f (e f (C) = f (−1/4, −3/4) = −1 è il valore minimo √ assunto √ da f ), mentre il massimo assoluto viene raggiunto nel punto B = ( 2/4, 6/4), e non nel punto D dato che quest’ultimo √ non appartiene √ all’insieme X. Il valore massimo di f è dato da f (B) = f ( 2/4, 6/4) = √ √ ( 2 + 6)/4. Svolgimento esercizio 34. Per risolvere questo esercizio utilizzeremo il metodo dei moltiplicatori di Lagrange. Ricordiamo, innanzi tutto, che tale metodo si può applicare solo nei punti non-singolari dell’insieme X. Iniziamo quindi cercando gli eventuali punti singolari di X, che dovranno essere studiati a parte. Poniamo g(x, y, z) = z 3 + 3x2 + y 2 + 2z 2 + 2z + 1. L’insieme X è definito dall’equazione g(x, y, z) = 0 (da ciò deriva che X è un insieme chiuso, ma non limitato. Il lettore lo verifichi per esercizio). I punti singolari di X sono quelli in cui si annulla il gradiente di g. Si ha: ∂g = 6x = 0 ∂x ∂g = 2y = 0 ∂y ∂g = 3z 2 + 4z + 2 = 0. ∂z La terza equazione non ha soluzioni reali, quindi il gradiente di g non si annulla mai e, di conseguenza, l’insieme X non ha punti singolari. Possiamo quindi applicare senza problemi il metodo dei moltiplicatori di Lagrange. La funzione Lagrangiana è L(x, y, z, λ) = z + λ(z 3 + 3x2 + y 2 + 2z 2 + 2z + 1). Determiniamone ora i punti critici: ∂L = 6λx = 0 ∂x ∂L = 2λy = 0 ∂y ∂L = 1 + λ(3z 2 + 4z + 2) = 0 ∂z ∂L = g(x, y, z) = 0. ∂λ Se λ = 0 la terza equazione non ha soluzioni. Si deve quindi avere x = y = 0. La quarta equazione diventa allora z 3 + 2z 2 + 2z + 1 = 0. 3. Soluzioni 227 Questo polinomio si scompone come segue: z 3 + 2z 2 + 2z + 1 = (z + 1)(z 2 + z + 1). Dato che z 2 + z + 1 = 0 non ha soluzioni reali, si conclude che l’unica soluzione è z = −1. Dalla terza equazione si ricava poi λ = −1, anche se per i nostri scopi, questa informazione è inutile. In conclusione, abbiamo visto che esiste un unico punto critico della Lagrangiana, il punto di coordinate (0, 0, −1). Si tratta ora di determinare la natura di tale punto critico. Osserviamo che, in questo caso, non è possibile applicare il teorema di Weierstrass, in quanto l’insieme X, pur essendo chiuso, non è limitato. Non è quindi garantita l’esistenza del massimo e minimo assoluto per la funzione f (ciò è consistente col fatto che abbiamo trovato un solo punto critico). Notiamo ora che ∂g (0, 0, −1) = 1 6= 0, ∂z quindi, in base al teorema del Dini, in un intorno del punto (0, 0, −1) l’insieme X è rappresentabile come grafico di una funzione del tipo z = z(x, y). In altre parole, dall’equazione g(x, y, z) = 0 è possibile ricavare, localmente all’intorno del punto (0, 0, −1), z in funzione di x e y. È quindi possibile esprimere la funzione f (x, y, z) = z, localmente all’intorno del punto (0, 0, −1), come funzione delle due sole variabili x e y. Poniamo allora h(x, y) = f (x, y, z(x, y)) = z(x, y), ove si intende che la funzione h(x, y) è definita solo in un qualche intorno del punto di coordinate x = 0 e y = 0. Calcoliamo ora le derivate parziali della funzione h. Derivando l’equazione g(x, y, z(x, y)) = 0 rispetto a x e a y rispettivamente, si ottiene: (3z 2 + 4z + 2) ∂z + 6x = 0 ∂x (3z 2 + 4z + 2) ∂z + 2y = 0. ∂y e Valutando queste due espressioni nel punto (0, 0, −1) si trova ∂z (0, 0, −1) = 0, ∂x ∂z (0, 0, −1) = 0, ∂y come deve essere, dato che sappiamo che (0, 0, −1) è un punto critico della Lagrangiana, cioè un punto critico vincolato per la funzione f , e quindi deve anche essere un punto critico per la funzione h(x, y) = z(x, y). Per studiare la natura di tale punto critico basta ora determinare la matrice Hessiana della funzione h(x, y). Derivando ulteriormente, rispetto 228 11. Calcolo Differenziale in più Variabili a x e a y, le due equazioni precedenti, si ottiene: ∂z ∂2z ∂z ∂z 6z +4 + (3z 2 + 4z + 2) 2 + 6 = 0, ∂x ∂x ∂x ∂x ∂z ∂2z ∂z ∂z 6z +4 + (3z 2 + 4z + 2) = 0, ∂y ∂y ∂x ∂x∂y ∂z ∂z ∂2z ∂z 6z +4 + (3z 2 + 4z + 2) 2 + 2 = 0, ∂y ∂y ∂y ∂y e valutando queste tre espressioni nel punto (0, 0, −1) si ottiene ∂2z ∂2z ∂2z (0, 0, −1) = −6, (0, 0, −1) = 0, (0, 0, −1) = −2. ∂x2 ∂x∂y ∂y 2 La matrice Hessiana, nel punto x = 0 e y = 0, della funzione h(x, y) è quindi −6 0 H(h)(0, 0) = . 0 −2 Questa matrice è definita negativa, quindi il punto critico (0, 0, −1) è un punto di massimo relativo. Il corrispondente valore di f è f (0, 0, −1) = −1. Per terminare, osserviamo che l’equazione g(x, y, z) = 0 è equivalente all’equazione 3x2 + y 2 = −(z 3 + 2z 2 + 2z + 1). Il termine di sinistra è evidentemente sempre ≥ 0, quindi questa equazione ammette soluzioni se e solo se z 3 + 2z 2 + 2z + 1 ≤ 0. Il polinomio z 3 + 2z 2 + 2z + 1 si scompone come segue z 3 + 2z 2 + 2z + 1 = (z + 1)(z 2 + z + 1), e il fattore z 2 + z + 1 assume sempre valori positivi, dato che non ha radici reali. Pertanto la disequazione precedente è equivalente a z ≤ −1. Questo dimostra che l’immagine della funzione f (x, y, z) = z, valutata nei punti dell’insieme X, è Im(f ) = f (X) =] − ∞, −1] ⊂ R. Avendo determinato esplicitamente l’immagine di f , si può cosı̀ vedere che −1 è il massimo assoluto (oltre che relativo) assunto dalla funzione f nell’insieme X. Non esiste invece il minimo assoluto (e nemmeno l’estremo inferiore) di f . Ciò è compatibile con il fatto che, in questo caso, non è possibile applicare il teorema di Weierstrass (che garantirebbe l’esistenza sia del massimo che del minimo assoluto) in quanto l’insieme X non è limitato. Capitolo 12 Funzioni di più Variabili a Valori Vettoriali 1. Richiami di teoria 1.1. Differenziabilità: la matrice Jacobiana Una funzione di più variabili a valori vettoriali è una funzione che ha come dominio un sottoinsieme di Rn e come codominio (un sottoinsieme di) Rm , per qualche n e m. Si tratta quindi di una funzione del tipo f~ : A → Rm , ~x = (x1 , . . . , xn ) 7→ f~(~x) = ~y = (y1 , . . . , ym ), ove A ⊂ Rn . Dato che ciascuna delle m componenti del vettore ~y = (y1 , . . . , ym ) risulta essere funzione delle variabili x1 , x2 , . . . , xn , possiamo scrivere yi = fi (x1 , x2 , . . . , xn ), per i = 1, 2, . . . , m. Le m funzioni fi : A → R cosı̀ ottenute sono dette le componenti della funzione f~ e si scriverà anche f~ = (f1 , f2 , . . . , fm ). In questo modo una funzione f~ a valori vettoriali viene identificata con le m funzioni a valori scalari f1 , f2 , . . . , fm . Estendiamo ora alle funzioni a valori vettoriali il concetto di differenziabilità. Definizione 1.1. Sia A un sottoinsieme aperto di Rn , f~ : A → Rm una funzione, e ~x0 un punto di A. La funzione f~ è differenziabile nel punto ~x0 se lo sono tutte le sue funzioni componenti. Pertanto, se f~ = (f1 , f2 , . . . , fm ), la funzione f~ è differenziabile in ~x0 se e solo se valgono le seguenti relazioni: fi (~x0 + ~h) − fi (~x0 ) = n X ∂fi (~x0 ) hj + o(k~hk), ∂x j j=1 per ~h → 0 e per i = 1, 2, . . . , m (ove si è posto ~h = (h1 , h2 , . . . , hn )). 230 12. Funzioni di più Variabili a Valori Vettoriali Se scriviamo in colonna i vettori f1 (~x) f2 (~x) f~(~x) = ... , h1 h ~h = .2 .. hn fm (~x) e se introduciamo la matrice ∂f1 (~x) ∂x1 ∂f2 (~x) ∂x1 Jf~(~x) = .. . ∂fm (~x) ∂x1 ∂f1 (~x) ∂x2 ∂f2 (~x) ∂x2 ··· ··· ... .. . ∂fm (~x) · · · ∂x2 ∂f1 (~x) ∂xn ∂f2 (~x) ∂xn .. . ∂fm (~x) ∂xn il sistema composto dalle m equazioni precedenti si può riscrivere in forma vettoriale come segue: f~(~x0 + ~h) − f~(~x0 ) = J ~(~x0 ) · ~h + o(k~hk), f ove il prodotto Jf~(~x0 )·~h è il solito prodotto righe per colonne (di una matrice per un vettore colonna). Diamo ora la seguente definizione: Definizione 1.2. La matrice ∂f1 ∂f1 ∂f1 · · · ∂x ∂x1 ∂x2 n ∂f2 ∂f2 · · · ∂f2 ∂xn Jf~ = ∂x. 1 ∂x. 2 . .. .. .. .. . ∂fm ∂x1 ∂fm ∂x2 ··· ∂fm ∂xn è detta la matrice jacobiana della funzione f~. Definizione 1.3. Se la funzione f~ è differenziabile nel punto ~x0 ∈ A, il suo differenziale in ~x0 è la seguente funzione lineare: df~(~x0 ) : Rn → Rm , ~h 7→ J ~(~x0 ) · ~h. f Osservazione 1.4. Si noti che il differenziale di f~ in ~x0 è una funzione lineare definita su tutto Rn , indipendentemente dal fatto che la funzione f~ sia definita solo su un sottoinsieme aperto A ⊂ Rn . Sappiamo poi che ogni funzione lineare da Rn a Rm può essere rappresentata da una matrice con m righe e n colonne. La definizione precedente afferma semplicemente che la matrice jacobiana Jf~(~x0 ) è la matrice cha rappresenta (rispetto alle basi canoniche) la funzione lineare chiamata differenziale di f~ in ~x0 . Ricordiamo che l’esistenza di tutte le derivate parziali prime di una funzione in un punto non è sufficiente a garantire la differenziabilità della funzione stessa in tale punto. In altri termini, anche se esiste la matrice jacobiana Jf~(~x0 ) non è detto che la funzione f~ sia differenziabile in ~x0 . Una 1. Richiami di teoria 231 condizione sufficiente a garantire la differenziabilità di una funzione in un punto è espressa dalla seguente proposizione: Proposizione 1.5. Se tutti gli elementi della matrice jacobiana di f~, cioè tutte le derivate parziali prime di tutte le funzioni componenti di f~, esistono e sono continue in un intorno di un punto ~x0 ∈ A, allora la funzione f~ è differenziabile in ~x0 . Quindi se tutti gli elementi della matrice jacobiana di f~ esistono e sono continui in tutto l’insieme aperto A, allora la funzione f~ è differenziabile in tutto A. Utilizzando le matrici jacobiane, la regola per la differenziazione delle funzioni composte si può scrivere in un modo particolarmente semplice. Siano f~ : Rn → Rm e ~g : Rm → Rk due funzioni e consideriamo la funzione composta ~g ◦ f~ : Rn → Rk . Teorema 1.6. Se f~ è differenziabile nel punto ~x0 ∈ Rn e ~g è differenziabile nel punto ~y0 = f~(~x0 ) ∈ Rm , la funzione composta ~g ◦ f~ è differenziabile nel punto ~x0 e la sua matrice jacobiana è data da J~g◦f~(~x0 ) = J~g (f~(~x0 )) · Jf~(~x0 ), ove il prodotto tra matrici J~g (f~(~x0 )) · Jf~(~x0 ) è il solito prodotto righe per colonne. Se poniamo ~y = f~(~x) e ~z = (~g ◦ f~)(~x) = ~g (f~(~x)), eseguendo il prodotto tra matrici J~g (~y0 ) · Jf~(~x0 ), si ottiene la seguente formula, che fornisce una regola esplicita per la derivazione delle funzioni composte : m X ∂zj ∂yl ∂zj (~x0 ) = (f~(~x0 )) (~x0 ), ∂xi ∂yl ∂xi l=1 per i = 1, . . . , n e j = 1, . . . , k. 1.2. Superficie Vediamo ora alcuni esempi di funzioni di più variabili a valori vettoriali. Ricordiamo che abbiamo definito il concetto di curva in Rn (in forma parametrica) come una funzione ~r : I → Rn , dove I è un intervallo di R. Analogamente possiamo definire il concetto di superficie in Rn : Definizione 1.7. Una superficie S (di classe C r ), in forma parametrica, in Rn è una funzione di classe C r ~r : A → Rn , dove A è un sottoinsieme aperto di R2 . Scriveremo ~r(u, v) = x1 (u, v), x2 (u, v), . . . , xn (u, v) , 232 12. Funzioni di più Variabili a Valori Vettoriali S ∂~ r ∂v ∂~ r ∂u Figura 1. Vettori tangenti alla superficie S. dove le funzioni xi (u, v), per i = 1, . . . , n, sono le funzioni componenti della funzione ~r(u, v). Se la funzione ~r è almeno di classe C 1 , possiamo considerare le due derivate parziali ∂~r ∂x1 ∂x2 ∂xn = , ,..., ∂u ∂u ∂u ∂u e ∂x1 ∂x2 ∂~r ∂xn = , ,..., . ∂v ∂v ∂v ∂v ∂~ r Il vettore ∂u è un vettore tangente alla curva ottenuta sulla superficie S facendo variare solo la variabile u (e tenendo fisso il valore di v). Analoga∂~ r mente, il vettore ∂v è un vettore tangente alla curva ottenuta facendo variare solo la variabile v (e tenendo fisso il valore di u). Si ottengono in questo modo due vettori tangenti alla superficie S (si veda l’esempio in figura 1, che rappresenta una superficie in R3 ). Se questi due vettori generano un piano, questo deve essere il piano tangente alla superficie S (questo accade se e solo se entrambi i vettori tangenti sono diversi da zero e se non sono paralleli tra loro). Consideriamo ora la matrice jacobiana di ~r: ∂x ∂x 1 ∂u ∂x2 J~r = ∂u . .. ∂xn ∂u 1 ∂v ∂x2 ∂v .. . . ∂xn ∂v Le colonne della matrice jacobiana sono precisamente i due vettori tangenti ∂~ r ∂~ r e ∂v . La condizione che questi due vettori generino un piano (cioè che ∂u siano linearmente indipendenti) equivale quindi a richiedere che il rango della matrice jacobiana sia pari a 2. Si arriva cosı̀ alla seguente definizione di una superficie regolare (cioè una superficie che ammette un piano tangente in ogni suo punto): Definizione 1.8. Una superficie S in Rn , parametrizzata da una funzione ~r : A → Rn , è detta regolare se la funzione ~r è differenziabile in A ⊂ R2 e se la matrice jacobiana di ~r ha rango massimo (cioè 2) in tutto l’insieme A. 1. Richiami di teoria 233 La precedente definizione è piuttosto restrittiva. Spesso accade infatti che la matrice jacobiana di ~r abbia rango massimo in tutti i punti di A tranne in qualche punto isolato. Si parla allora di punti singolari e di superficie singolari: Definizione 1.9. Una superficie S come sopra, tale che esistano dei punti isolati di A in cui il rango della matrice jacobiana di ~r è minore di 2, è detta singolare. I punti di A in cui il rango della matrice jacobiana di ~r non è massimo sono detti punti singolari. D’ora in poi ci occuperemo solo delle superficie in R3 di classe C r , con r ≥ 1. Sia dunque S una superficie in R3 , parametrizzata da una funzione di classe C r ~r : A → R3 . ∂~ r ∂~ r Consideriamo i due vettori tangenti a S dati da ∂u e ∂v . Dato che stiamo 3 considerando vettori di R , è ben definito il loro prodotto vettoriale ∂~r ∂~r ∧ . ∂u ∂v ∂~ r ∂~ r Il vettore ~n cosı̀ definito è un vettore ortogonale ai due vettori ∂u e ∂v tangenti alla superficie S, e quindi è un vettore ortogonale al piano tangente ∂~ r a S, quando questo esiste. Si noti che ~n 6= 0 se e solo se i due vettori ∂u e ∂~ r sono linearmente indipendenti, cioè se e solo se la matrice jacobiana di ∂v ~r ha rango massimo. Si ottiene cosı̀ il seguente criterio per la regolarità di una superficie in R3 : Proposizione 1.10. Una superficie S in R3 , parametrizzata da ~n = ~r : A → R3 , è regolare se e solo se il vettore ∂~r ∂~r ∧ ∂u ∂v è diverso da zero in tutti i punti di A. Se S non è regolare, i punti di A in cui si annulla il vettore ~n sono i punti singolari di S. Il vettore normale ~n, oltre a fornire una condizione per la regolarità di una superficie, risulta essere estremamente utile anche per la determinazione del cosiddetto “elemento infinitesimo di area” su una superficie S. Consideriamo il rettangolo “infinitesimo” dR, contenuto in A ⊂ R2 , di vertici (u, v), (u + du, v), (u, v + dv) e (u + du, v + dv), e quindi di area pari a du dv. Questo rettangolo viene trasformato dalla funzione ~r : A → R3 in un quadrilatero curvilineo dQ, anch’esso “infinitesimo”, di vertici ~r(u, v), ~r(u+du, v), ~r(u, v+dv) e ~r(u+du, v+dv) (si veda la figura 2). Considerando lo sviluppo in serie di Taylor al primo ordine, si ha ~n = ~r(u + du, v) ≈ ~r(u, v) + ∂~r du ∂u 234 12. Funzioni di più Variabili a Valori Vettoriali ~ r (u,v+dv) A ~ r (u,v) dQ S ~ r (u+du,v+dv) ~r ~ r(u+du,v) v dv dR du u Figura 2. Trasformazione dell’elemento infinitesimo di area. e ~r(u, v + dv) ≈ ~r(u, v) + ∂~r dv. ∂v Si può cosı̀ concludere che, a meno di infinitesimi di ordine superiore al primo, l’area del quadrilatero curvilineo dQ coincide con l’area del paralle∂~ r ∂~ r logramma generato dai due vettori ∂u du e ∂v dv. Ma quest’ultima area è pari alla norma del prodotto vettoriale dei due vettori che costituiscono i lati di tale parallelogramma, quindi si ha: ∂~r ∂~r ∂~r ∂~ r dS = Area(dQ) ≈ ∂u du ∧ ∂v dv = ∂u ∧ ∂v du dv = k~nk du dv. Si scopre quindi che, nella trasformazione operata dalla funzione ~r, un rettangolo “infinitesimo” dR di area du dv viene trasformato in un quadrilatero curvilineo “infinitesimo” dQ la cui area è data da k~nk du dv (a meno di infinitesimi di ordine superiore al primo). La norma del vettore normale ~n rappresenta quindi il fattore di scala per cui viene moltiplicata un’area infinitesima tramite la trasformazione operata dalla funzione ~r. Occupiamoci ora di due esempi particolarmente importanti di superficie. 1.2.1. Superficie grafico di una funzione di due variabili Sia A un sottoinsieme aperto di R2 e sia f : A → R una funzione di classe C r , con r ≥ 1. Indichiamo con S la superficie grafico della funzione f : S = {(x, y, z) ∈ R3 | (x, y) ∈ A, z = f (x, y)}. Cerchiamo ora una parametrizzazione di S. A tal fine introduciamo due variabili u e v e poniamo x = u e y = v (stiamo semplicemente cambiando i nomi delle variabili indipendenti). L’equazione z = f (x, y) diventa ora z = f (u, v). Si ottiene in questo modo la seguente parametrizzazione della 1. Richiami di teoria 235 superficie S: x = u y=v z = f (u, v), al variare di (u, v) ∈ A. In altre parole, la superficie S è parametrizzata dalla funzione ~r : A → R3 , (u, v) 7→ ~r(u, v) = (u, v, f (u, v)). I due vettori tangenti sono ∂~r = ∂u ∂f 1, 0, ∂u e ∂f ∂~r = 0, 1, ∂v ∂v e il vettore normale ~n è dato da ∂~r ∂~r ∂f ∂f ~n = ∧ = − ,− ,1 . ∂u ∂v ∂u ∂v Notiamo che l’ultima componente di ~n è costante (pari a 1), quindi il vettore ~n non si annulla mai. Da ciò discende che la superficie S non ha punti singolari. Calcoliamo infine l’espressione che assume l’elemento infinitesimo di area: s 2 2 ∂f ∂f dS = k~nk dudv = + + 1 du dv. ∂u ∂v 1.2.2. Superficie di rotazione Consideriamo ora una superficie S ottenuta dalla rotazione di una curva γ attorno a una retta r. Per semplicità analizzeremo solo il caso in cui la retta r (cioè l’asse di rotazione) coincide con l’asse z e la curva γ è contenuta nel piano yz. Nella rotazione della curva γ attorno all’asse z, ogni punto P = (0, yP , zP ) di γ descrive un cerchio CP contenuto nel piano di equazione z = zP , centrato nel punto OP = (0, 0, zP ) e di raggio RP pari alla distanza di P dall’asse z, cioè RP = |yP | (la situazione è descritta in figura 3). Questo cerchio si può descrivere in forma parametrica come segue: x = yP cos θ CP : y = yP sin θ con 0 ≤ θ < 2π. z =z P Al variare del punto P lungo la curva γ, l’insieme dei cerchi cosı̀ ottenuti descrive la superficie di rotazione S. 236 12. Funzioni di più Variabili a Valori Vettoriali S z γ OP P CP y x Figura 3. Una superficie di rotazione. Se la curva γ è descritta in forma parametrica da una funzione del tipo γ : [a, b] 3 t 7→ y(t), z(t) , sostituendo y(t) e z(t) al posto di yP e zP nel sistema precedente, si ottiene l’espressione parametrica della superficie S: x = y(t) cos θ S : y = y(t) sin θ con a ≤ t ≤ b, 0 ≤ θ < 2π. z = z(t) Riassumendo, possiamo affermare che la superficie S ottenuta dalla rotazione di una curva γ (contenuta nel piano yz) attorno all’asse z è parametrizzata dalla funzione ~r(t, θ) = y(t) cos θ, y(t) sin θ, z(t) , con a ≤ t ≤ b e 0 ≤ θ < 2π, ove si è indicata con (y(t), z(t)) la parametrizzazione di γ. A questo punto possiamo determinare i vettori tangenti alla superficie S: ∂~r = y 0 (t) cos θ, y 0 (t) sin θ, z 0 (t) , ∂t ∂~r = − y(t) sin θ, y(t) cos θ, 0 , ∂θ e il vettore normale ∂~r ∂~r ~n = ∧ = − y(t)z 0 (t) cos θ, −y(t)z 0 (t) sin θ, y(t)y 0 (t) . ∂t ∂θ Possiamo osservare che gli eventuali punti della superficie S con y = 0, cioè gli eventuali punti di intersezione di S con l’asse di rotazione, sono punti singolari (in essi si annulla il vettore ~n). 1. Richiami di teoria 237 Calcoliamo infine l’elemento infinitesimo di area: p dS = k~nk dt dθ = |y(t)| y 0 (t)2 + z 0 (t)2 dt dθ. p (Ricordiamo qui che l’espressione y 0 (t)2 + z 0 (t)2 dt non è altro che l’elemento infinitesimo di lunghezza sulla curva γ, detto anche lunghezza d’arco elementare, o differenziale d’arco). 1.3. Trasformazioni di coordinate Consideriamo in questa sezione un tipo particolare di funzioni a valori vettoriali, note come trasformazioni di coordinate. Definizione 1.11. Sia A un aperto di Rn . Una trasformazione regolare di coordinate, definita in A, è una funzione di classe C 1 f~ : A → Rn tale che la sua matrice jacobiana Jf~ abbia determinante diverso da zero in ogni punto di A. Se invece il determinante di Jf~ si annulla in qualche punto di A, la trasformazione di coordinate è detta singolare e i punti in cui questo accade sono detti punti singolari della trasformazione di coordinate. Una delle conseguenze più importanti del fatto che il determinante della matrice jacobiana di f~ sia diverso da zero è il seguente teorema di invertibilità locale: Teorema 1.12. Sia f~ : A → Rn una trasformazione di coordinate. Se ~x0 ∈ A è tale che det Jf~(~x0 ) 6= 0, allora esistono un intorno U di ~x0 in A e un intorno V di f~(~x0 ) in Rn tali che la funzione indotta f~ : U → V sia una biiezione. Esiste pertanto la funzione inversa f~−1 : V → U ed essa è di classe C 1 . In particolare, se la trasformazione di coordinate f~ è regolare, essa è localmente invertibile. Osservazione 1.13. Osserviamo che il fatto che una funzione f : A → B sia localmente invertibile, cioè che essa sia invertibile all’intorno di ogni punto del suo dominio, non implica che essa sia globalmente invertibile, cioè che esista la sua funzione inversa f −1 : B → A. Il teorema precedente afferma quindi che se una trasformazione di coordinate (y1 , y2 , . . . , yn ) = f~(x1 , x2 , . . . , xn ) è regolare, è possibile ricavare le variabili x1 , x2 , . . . , xn in funzione delle variabili y1 , y2 , . . . , yn (cioè invertire la trasformazione di coordinate), localmente all’intorno di ogni punto. Ovviamente non c’è però nessuna ricetta che permetta di scrivere esplicitamente la trasformazione inversa. Studiamo ora come viene trasformato un elemento infinitesimo di volume da una trasformazione regolare di coordinate. 238 12. Funzioni di più Variabili a Valori Vettoriali dQ f~ dP dz dx dy Figura 4. Trasformazione dell’elemento di volume. Consideriamo un parallelepipedo n-dimensionale “infinitesimo” dP , contenuto in A ⊂ Rn , avente un vertice nel punto (x1 , x2 , . . . , xn ) e i lati paralleli agli assi coordinati, di lunghezza dx1 , dx2 , . . . , dxn rispettivamente. Il volume n-dimensionale di questo parallelepipedo è quindi pari a dx1 dx2 · · · dxn . Questo parallelepipedo n-dimensionale dP viene trasformato dalla funzione f~ : A → Rn in un parallelepipedo curvilineo n-dimensionale dQ, anch’esso “infinitesimo”, i cui vertici sono i trasformati tramite f~ dei vertici del parallelepipedo dP , cioè sono i punti f~(x1 , x2 , . . . , xn ), f~(x1 + dx1 , x2 , . . . , xn ), f~(x1 , x2 + dx2 , . . . , xn ), etc. (si veda la figura 4, che rappresenta il caso tridimensionale). Considerando lo sviluppo in serie di Taylor al primo ordine, si ha: ∂ f~ f~(x1 + dx1 , x2 , . . . , xn ) ≈ f~(x1 , x2 , . . . , xn ) + dx1 ∂x1 ∂ f~ f~(x1 , x2 + dx2 , . . . , xn ) ≈ f~(x1 , x2 , . . . , xn ) + dx2 ∂x2 ········· ∂ f~ f~(x1 , x2 , . . . , xn + dxn ) ≈ f~(x1 , x2 , . . . , xn ) + dxn . ∂xn Si può cosı̀ concludere che, a meno di infinitesimi di ordine superiore al primo, il volume n-dimensionale del parallelepipedo curvilineo dQ coincide con il volume n-dimensionale del parallelepipedo n-dimensionale generato ∂ f~ ∂ f~ ∂ f~ dx1 , ∂x dx2 , . . . , ∂x dxn . Ma quest’ultimo volume è pari al dai vettori ∂x n 1 2 valore assoluto del determinante della matrice che ha come colonne i vettori 2. Esercizi ∂ f~ ∂x1 dx1 , ∂ f~ ∂x2 dx2 , . . . , 239 ∂ f~ ∂xn dxn . Si ha quindi: ∂f1 ∂f1 dx1 ∂x dx2 . . . ∂x1 2 ∂f2 dx1 ∂f2 dx2 . . . ∂x2 Vol(dQ) ≈ det ∂x1 . .. .. .. . . ∂fn ∂fn dx1 ∂x2 dx2 . . . ∂x1 ∂f1 ∂xn ∂f2 ∂xn dxn dxn .. . ∂fn dxn ∂xn = | det Jf~| dx1 dx2 · · · dxn . Si scopre quindi che, nella trasformazione di coordinate operata dalla funzione f~, un parallelepipedo n-dimensionale “infinitesimo” dP di volume n-dimensionale dx1 dx2 · · · dxn viene trasformato in un parallelepipedo curvilineo n-dimensionale “infinitesimo” dQ il cui volume n-dimensionale è dato da | det Jf~| dx1 dx2 · · · dxn (a meno di infinitesimi di ordine superiore al primo). Il valore assoluto del determinante della matrice jacobiana di f~ rappresenta quindi il fattore di scala per cui viene moltiplicato un volume infinitesimo tramite la trasformazione di coordinate operata dalla funzione f~. 2. Esercizi 2.1. Differenziabilità: la matrice Jacobiana Esercizio 1. Sia f~ : R3 → R2 la funzione definita da f~(x1 , x2 , x3 ) = (x1 + x2 cos(x23 ), 2x21 x2 x3 ). Si scriva la matrice jacobiana di f~ e si dica se f~ è differenziabile in tutto il suo dominio di definizione. Esercizio 2. Sia f~ : R2 → R3 la funzione definita da f~(x1 , x2 ) = (x1 log(1 + x22 ), −x2 sin(x1 ), x21 x2 ). Si determini il differenziale della funzione f~ nel punto (π/2, 0). Si calcoli poi df~(π/2, 0)(2, −1). 2.2. Superficie Esercizio 3. Determinare il vettore normale ~n, i punti singolari e l’elemento infinitesimo di area della sfera di raggio R parametrizzata da (θ, φ) 7→ ~r(θ, φ) = (R sin φ cos θ, R sin φ sin θ, R cos φ), per 0 ≤ θ < 2π e 0 ≤ φ ≤ π. 240 12. Funzioni di più Variabili a Valori Vettoriali Esercizio 4. Determinare il vettore normale ~n, i punti singolari e l’elemento infinitesimo di area del cono parametrizzato da (t, θ) 7→ ~r(t, θ) = (t cos θ, t sin θ, t), per t ∈ R e 0 ≤ θ < 2π. Esercizio 5. Si scriva la matrice jacobiana, il vettore normale e l’elemento infinitesimo di area della superficie grafico della funzione z = f (x, y) = x2 y 3 . Esercizio 6. Nello spazio R3 sia γ la circonferenza di raggio r, contenuta nel piano yz e centrata nel punto di coordinate (0, R, 0), con 0 < r < R. Sia S la superficie generata dalla rotazione della curva γ attorno all’asse z (tale superficie è detta toro). Si determini il vettore normale ~n, i punti singolari e l’elemento infinitesimo di area di S. Esercizio 7. Nello spazio R3 sia γ l’arco di parabola, contenuta nel piano yz, di equazione z = y 2 − 2y + 1, con 0 ≤ y ≤ 3. Sia S la superficie generata dalla rotazione della curva γ attorno all’asse z. Si determini il vettore normale ~n, i punti singolari e l’elemento infinitesimo di area di S. 2.3. Trasformazioni di coordinate Esercizio 8. (Coordinate polari) Si consideri la seguente trasformazione di coordinate in R2 : x = ρ cos θ y = ρ sin θ, definita per ρ ≥ 0 e 0 ≤ θ < 2π. Si determinino i punti singolari di questa trasformazione di coordinate e si esprima l’elemento infinitesimo di area dx dy nelle coordinate ρ e θ. Esercizio 9. (Coordinate cilindriche) Si consideri la seguente trasformazione di coordinate in R3 : x = ρ cos θ y = ρ sin θ z = z, definita per ρ ≥ 0, 0 ≤ θ < 2π e ∀z. Si determinino i punti singolari di questa trasformazione di coordinate e si esprima l’elemento infinitesimo di volume dx dy dz nelle coordinate ρ, θ, z. Esercizio 10. (Coordinate sferiche) Si consideri la seguente trasformazione di coordinate in R3 : x = ρ sin φ cos θ y = ρ sin φ sin θ z = ρ cos φ, 3. Soluzioni 241 definita per ρ ≥ 0, 0 ≤ φ ≤ π e 0 ≤ θ < 2π. Si determinino i punti singolari di questa trasformazione di coordinate e si esprima l’elemento infinitesimo di volume dx dy dz nelle coordinate ρ, φ, θ. Esercizio 11. Si consideri la seguente trasformazione di coordinate in R2 : ( x = u3 √ y = v, definita per u ≥ 0 e v ≥ 0. Si determinino i punti singolari di questa trasformazione di coordinate e si esprima l’elemento infinitesimo di area dx dy nelle coordinate u, v. 3. Soluzioni 3.1. Differenziabilità: la matrice Jacobiana Svolgimento esercizio 1. Le funzioni componenti di f~ sono f1 (x1 , x2 , x3 ) = x1 +x2 cos(x23 ) e f2 (x1 , x2 , x3 ) = 2x21 x2 x3 . La matrice jacobiana di f~ è quindi ! ∂f1 ∂x1 ∂f2 ∂x1 Jf~ = = ∂f1 ∂x2 ∂f2 ∂x2 ∂f1 ∂x3 ∂f2 ∂x3 1 cos(x23 ) −2x2 x3 sin(x23 ) . 4x1 x2 x3 2x21 x3 2x21 x2 Il dominio di definizione di f~ è R3 . Dato che tutti gli elementi della matrice jacobiana sono funzioni definite e continue in R3 , possiamo concludere che la funzione f~ è differenziabile in tutto il suo dominio di definizione. Svolgimento esercizio 2. Scriviamo innanzi tutto la matrice jacobiana di f~: 2x1 x2 log(1 + x22 ) 1+x22 Jf~ = −x2 cos x1 − sin x1 , 2x1 x2 x21 da cui segue che 0 0 Jf~(π/2, 0) = 0 −1 . 0 π 2 /4 Il differenziale della funzione f~ nel punto (π/2, 0) è la funzione lineare df~(π/2, 0) : R2 → R3 242 12. Funzioni di più Variabili a Valori Vettoriali la cui matrice (rispetto alle basi canoniche) è la matrice Jf~(π/2, 0). Si ha quindi: 0 0 0 h df~(π/2, 0)(h1 , h2 ) = 0 −1 1 = −h2 . h2 0 π 2 /4 π 2 h2 /4 Da ciò si deduce subito che df~(π/2, 0)(2, −1) = (0, 1, −π 2 /4). 3.2. Superficie Svolgimento esercizio 3. Determiniamo i due vettori tangenti: ∂~r = (−R sin φ sin θ, R sin φ cos θ, 0), ∂θ ∂~r ~v2 = = (R cos φ cos θ, R cos φ sin θ, −R sin φ). ∂φ ~v1 = Il vettore normale è quindi ~n = ~v1 ∧ ~v2 ~k ~ ı ~ = −R sin φ sin θ R sin φ cos θ 0 R cos φ cos θ R cos φ sin θ −R sin φ = (−R2 sin2 φ cos θ, −R2 sin2 φ sin θ, −R2 sin φ cos θ) = −R sin φ(R sin φ cos θ, R sin φ sin θ, R cos φ) = −R sin φ ~r(θ, φ). I punti singolari sono quelli in cui si annulla il vettore ~n. Questo accade se e solo se sin φ = 0, cioè per φ = 0 e per φ = π. I punti corrispondenti sulla sfera sono i due punti N e S le cui coordinate sono date da N = ~r(θ, 0) = (0, 0, R) e S = ~r(θ, π) = (0, 0, −R), si tratta cioè dei due poli Nord e Sud rispettivamente. Ovviamente, dal punto di vista geometrico, non accade niente di speciale nei due poli Nord e Sud (una sfera è un oggetto perfettamente simmetrico, tutti i suoi punti godono delle stesse proprietà), è solo la parametrizzazione scelta che non è regolare in quei punti (infatti in quei due punti si incontrano tutte le curve caratterizzate da θ = costante, cioè tutti i meridiani). La situazione è descritta in figura 5. Una volta determinato il vettore normale ~n, il calcolo dell’elemento infinitesimo di area è banale. Si ha infatti: dS = k~nk dθ dφ = R2 sin φ dθ dφ. 3. Soluzioni 243 N Figura 5. La sfera parametrizzata. Svolgimento esercizio 4. Determiniamo i due vettori tangenti: ∂~r = (cos θ, sin θ, 1), ∂t ∂~r ~v2 = = (−t sin θ, t cos θ, 0). ∂θ ~v1 = Il vettore normale è ~n = ~v1 ∧ ~v2 ~ı ~k ~ = cos θ sin θ 1 −t sin θ t cos θ 0 = (−t cos θ, −t sin θ, t) = t (− cos θ, − sin θ, 1). I punti singolari sono quelli in cui si annulla il vettore ~n. Questo accade se e solo se t = 0. Il punto corrispondente sul cono è il punto V le cui coordinate sono date da V = ~r(0, θ) = (0, 0, 0); si tratta del vertice del cono. In questo caso, a differenza di quanto visto per i poli Nord e Sud della sfera, la singolarità presente nel vertice del cono non dipende dalla parametrizzazione usata, ma si tratta di una proprietà intrinseca all’oggetto geometrico cono. La situazione è descritta in figura 6. Una volta determinato il vettore normale ~n il calcolo dell’elemento infinitesimo di area è banale. Si ha infatti: √ dS = k~nk dt dθ = t 2 dt dθ. Svolgimento esercizio 5. Sia S la superficie grafico della funzione z = f (x, y) = x2 y 3 . La prima cosa da fare è determinare una parametrizzazione di S. Il modo ovvio di farlo è semplicemente quello di “cambiare i nomi delle variabili indipendenti”: se poniamo x = u e y = v, l’equazione z = x2 y 3 diventa z = u2 v 3 . Si ottiene cosı̀ la seguente descrizione di S in forma 244 12. Funzioni di più Variabili a Valori Vettoriali 2 1 V z0 –1 –2 –1 –2 –2 –1 0x 0 y 1 1 2 2 Figura 6. Il cono parametrizzato. parametrica: x = u y=v z = u2 v 3 , al variare di (u, v) ∈ R2 . In altre parole, la superficie S è parametrizzata dalla funzione ~r : R2 → R3 , (u, v) 7→ ~r(u, v) = (u, v, u2 v 3 ). La matrice jacobiana è quindi 1 0 1 . J~r = 0 3 2uv 3u2 v 2 I due vettori tangenti sono dati da ∂~r = (1, 0, 2uv 3 ), ∂u ∂~r = (0, 1, 3u2 v 2 ) ∂v e il vettore normale è ~n = ∂~r ∂~r ∧ = (−2uv 3 , −3u2 v 2 , 1). ∂u ∂v Si noti come, in questo caso, il vettore normale ~n non si annulli mai (l’ultima componente è costante e uguale a 1), quindi non ci sono punti singolari sulla superficie S. Infine, l’elemento infinitesimo di area sulla superficie S è dato da √ dS = k~nk du dv = 4u2 v 6 + 9u4 v 4 + 1 du dv. 3. Soluzioni 245 1 –4 z0 –1 –2 –4 0x –2 0 y 2 2 4 4 Figura 7. Il toro. Svolgimento esercizio 6. La circonferenza γ è parametrizzata da y(t) = R + r cos t z(t) = r sin t, con 0 ≤ t < 2π. Da ciò segue che una parametrizzazione della superficie S è data da: x = y(t) cos θ = (R + r cos t) cos θ y = y(t) sin θ = (R + r cos t) sin θ z = z(t) = r sin t, cioè S è parametrizzata dalla funzione ~r(t, θ) = (R + r cos t) cos θ, (R + r cos t) sin θ, r sin t , con 0 ≤ t < 2π e 0 ≤ θ < 2π. La superficie di rotazione S (detta toro) è rappresentata in figura 7. I due vettori tangenti sono quindi ∂~r = (−r sin t cos θ, −r sin t sin θ, r cos t), ∂t ∂~r = − (R + r cos t) sin θ, (R + r cos t) cos θ, 0 , ∂θ e il vettore normale è ∂~r ∂~r ~n = ∧ = −r(R + r cos t)(cos t cos θ, cos t sin θ, sin t). ∂t ∂θ Si verifica facilmente che il vettore normale ~n non si annulla mai, quindi non ci sono punti singolari sulla superficie S. Infine, l’elemento infinitesimo di area su S è dato da dS = k~nk dt dθ = r(R + r cos t) dt dθ. Svolgimento esercizio 7. L’arco di parabola γ è parametrizzato da ( y(t) = t z(t) = t2 − 2t + 1, 246 12. Funzioni di più Variabili a Valori Vettoriali 4 z2 0 –3 –2 –1 –3 –2 –1 0x 0 y 1 1 2 2 3 3 Figura 8. La superficie di rotazione S. con 0 ≤ t ≤ 3. Da ciò segue che una parametrizzazione della superficie S è data da: x = y(t) cos θ = t cos θ y = y(t) sin θ = t sin θ z = z(t) = t2 − 2t + 1, cioè S è parametrizzata dalla funzione ~r(t, θ) = (t cos θ, t sin θ, t2 − 2t + 1), con 0 ≤ t ≤ 3 e 0 ≤ θ < 2π. La superficie di rotazione S è rappresentata in figura 8. I due vettori tangenti sono quindi ∂~r = (cos θ, sin θ, 2t − 2), ∂t ∂~r = (−t sin θ, t cos θ, 0), ∂θ e il vettore normale è ~n = ∂~r ∂~r ∧ = t − (2t − 2) cos θ, −(2t − 2) sin θ, 1 . ∂t ∂θ Il vettore ~n si annulla se e solo se t = 0, che corrisponde al punto di coordinate (0, 0, 1). Questo è l’unico punto singolare della superficie S. Infine, l’elemento infinitesimo di area su S è dato da √ dS = k~nk dt dθ = t 4t2 − 8t + 5 dt dθ. 3. Soluzioni 247 3.3. Trasformazioni di coordinate Svolgimento esercizio 8. (Coordinate polari) La trasformazione di coordinate in questione è espressa dalla funzione f~ : (ρ, θ) 7→ (ρ cos θ, ρ sin θ) = (x, y). La matrice jacobiana di f~ è Jf~ = ∂x ∂ρ ∂y ∂ρ ∂x ∂θ ∂y ∂θ ! = cos θ −ρ sin θ . sin θ ρ cos θ Si ha det Jf~ = ρ. I punti singolari della trasformazione di coordinate sono quelli in cui si annulla il determinante della matrice jacobiana. Esiste quindi un unico punto singolare, dato da ρ = 0, e cioè da (x, y) = (0, 0). Si conclude pertanto che l’origine è l’unico punto singolare per le coordinate polari nel piano. Per la trasformazione dell’elemento infinitesimo di area vale la seguente formula: dx dy = | det Jf~| dρ dθ = ρ dρ dθ. Svolgimento esercizio 9. (Coordinate cilindriche) La trasformazione di coordinate in questione è espressa dalla funzione f~ : (ρ, θ, z) 7→ (ρ cos θ, ρ sin θ, z) = (x, y, z). La matrice jacobiana di f~ è Jf~ = ∂x ∂ρ ∂y ∂ρ ∂z ∂ρ ∂x ∂θ ∂y ∂θ ∂z ∂θ ∂x ∂z ∂y ∂z ∂z ∂z cos θ −ρ sin θ 0 = sin θ ρ cos θ 0 . 0 0 1 Si ha det Jf~ = ρ. I punti singolari della trasformazione di coordinate sono quelli in cui si annulla il determinante della matrice jacobiana, cioè sono tutti i punti determinati dall’equazione ρ = 0. Si tratta di tutti i punti che stanno sull’asse delle z. Si conclude pertanto che l’asse z è una retta di punti singolari per le coordinate cilindriche nello spazio. Per la trasformazione dell’elemento infinitesimo di volume vale la seguente formula: dx dy dz = | det Jf~| dρ dθ dz = ρ dρ dθ dz. 248 12. Funzioni di più Variabili a Valori Vettoriali Svolgimento esercizio 10. (Coordinate sferiche) La trasformazione di coordinate in questione è espressa dalla funzione f~ : (ρ, φ, θ) 7→ (ρ sin φ cos θ, ρ sin φ sin θ, ρ cos φ) = (x, y, z). La matrice jacobiana di f~ è sin φ cos θ ρ cos φ cos θ −ρ sin φ sin θ Jf~ = sin φ sin θ ρ cos φ sin θ ρ sin φ cos θ . cos φ −ρ sin φ 0 Si ha det Jf~ = ρ2 sin φ. I punti singolari della trasformazione di coordinate sono quelli in cui si annulla il determinante della matrice jacobiana, cioè sono i punti tali che ρ = 0 oppure sin φ = 0. Si tratta dei punti che stanno sull’asse delle z. Si conclude pertanto che l’asse z è una retta di punti singolari per le coordinate sferiche nello spazio. Per la trasformazione dell’elemento infinitesimo di volume vale la seguente formula: dx dy dz = | det Jf~| dρ dφ dθ = ρ2 sin φ dρ dφ dθ. Svolgimento esercizio 11. La trasformazione di coordinate in questione è espressa dalla funzione √ f~ : (u, v) 7→ (u3 , v) = (x, y), con u ≥ 0 e v ≥ 0. La matrice jacobiana di f~ è Jf~ = 3u2 0 0 1 √ 2 v . Si ha 3u2 det Jf~ = √ . 2 v Per u = 0 (che corrisponde a x = 0) si annulla il determinante della matrice jacobiana. Tali punti sono dunque punti singolari della trasformazione di coordinate. Si noti però che per v = 0 si annulla il denominatore della derivata ∂y , quindi in tali punti la funzione non è derivabile. Di conseguen∂v za anche i punti che soddisfano v = 0 (cioè y = 0) sono punti singolari, non perché in tali punti si annulla il determinante della matrice jacobiana, ma semplicemente perché in essi non esiste la matrice jacobiana, cioè la trasformazione di coordinate non è derivabile nei punti in cui v = 0. In conclusione, abbiamo visto che la trasformazione di coordinate in questione è singolare in tutti i punti degli assi x e y. 3. Soluzioni Infine, per la trasformazione dell’elemento infinitesimo di area si ha: 3u2 dx dy = | det Jf~| du dv = √ du dv. 2 v 249 Capitolo 13 Calcolo Integrale 1. Richiami di teoria 1.1. Integrali doppi Ricordiamo brevemente la definizione dell’integrale (di Riemann) di una funzione di una variabile. Sia I = [a, b] un intervallo di R e sia f : I → R una funzione. Per definire l’integrale di f esteso all’intervallo I, si divide l’intervallo I in N intervallini uguali J1 , J2 , . . . , JN , di lunghezza ` = b−a , si prende poi, per N ogni intervallino Ji un punto xi ∈ Ji (si veda la figura 1), e si considera la seguente somma: N X S(N ) = f (xi )`. i=1 Si considera poi il limite, per N → +∞, della somma S(N ) e, se questo limite esiste finito e non dipende dalla scelta dei punti xi , si pone Z f (x) dx = lim S(N ). N →+∞ I Dalla costruzione fatta, si deduce che tale integrale rappresenta l’area della regione di piano compresa tra l’asse x e il grafico della funzione f , dove si y f (xi ) Ji O a xi Figura 1. b x 252 13. Calcolo Integrale y R d Pi Ji c O a b x Figura 2. considerano positive le area che stanno sopra l’asse delle x e negative quelle che stanno sotto. Per quanto riguarda l’esistenza del suddetto limite, si dimostra il seguente risultato: Teorema 1.1. Se f : I → R è una funzione continua definita nell’intervallo I ⊂ R, allora esiste l’integrale di f esteso a I. Ci proponiamo ora di estendere questa costruzione al caso di funzioni di più variabili. Iniziamo considerando il caso delle funzioni di due variabili. L’analogo bidimensionale di un intervallo di R è un rettangolo. Sia dunque R = [a, b] × [c, d] un rettangolo in R2 e sia f : R → R una funzione. Dividiamo il rettangolo R in N rettangolini uguali J1 , J2 , . . . , JN , e prendiamo, in ogni rettangolino Ji un punto Pi = (xi , yi ) ∈ Ji (si veda la figura 2). Consideriamo poi la seguente somma: S(N ) = N X f (xi , yi ) Area(Ji ). i=1 Se il limite di S(N ), per N → +∞, esiste finito e non dipende dalla scelta dei punti Pi , si pone ZZ f (x, y) dx dy = lim S(N ). R N →+∞ La notazione utilizzata è particolarmente suggestiva: il prodotto dx dy rappresenta l’elemento infinitesimo di area nel piano (pensato come l’area di un rettangolino infinitesimo di lati dx e dy), quindi moltiplicando dx dy per f (x, y) si ottiene il volume di un parallelepipedo infinitesimo di base dx dy e di altezza f (x, y). Infine, sommando i volumi di tutti questi parallelepipedi infinitesimi si ottiene il volume della regione compresa tra il piano xy e il grafico della funzione f , ove si considerano positivi i volumi che stanno sopra il piano xy e negativi quelli che stanno sotto. Si noti come questa 1. Richiami di teoria 253 R y f˜=0 Ω f˜=f O x Figura 3. interpretazione geometrica dell’integrale di una funzione di due variabili sia del tutto analoga a quella dell’integrale di una funzione di una variabile. Anche in questo caso si può dimostrare il seguente risultato: Teorema 1.2. Sia f : R → R una funzione continua, definita su un rettangolo R ⊂ R2 . Allora esiste l’integrale di f esteso a R. Tuttavia, se nel caso di funzioni di una variabile saperle integrare su degli intervalli poteva essere soddisfacente, nel caso di funzioni di due variabili è certamente troppo restrittivo poterle integrare solo su delle regioni rettangolari del piano. Si pone allora il problema di estendere la definizione di integrale a delle regioni limitate qualsiasi del piano. Un’idea per affrontare questo problema potrebbe essere la seguente. Sia f : Ω → R una funzione continua definita su un insieme limitato Ω. Consideriamo un rettangolo R sufficientemente grande da contenere Ω. Estendiamo la definizione di f a tutto il rettangolo R nel modo seguente: ( f (x, y) se (x, y) ∈ Ω, f˜(x, y) = 0 se (x, y) 6∈ Ω. La nuova funzione f˜ : R → R coincide con f nell’insieme Ω ed è nulla all’esterno (si veda la figura 3). In base all’interpretazione geometrica dell’integrale doppio descritta in precedenza, ha quindi senso porre ZZ ZZ f (x, y) dx dy = f˜(x, y) dx dy, Ω R dato che, nella regione di R esterna a Ω il contributo di f˜ all’integrale che compare nel membro di destra dell’uguaglianza precedente è nullo. In questo modo la definizione dell’integrale di una funzione f su una qualunque regione limitata Ω ⊂ R2 è ricondotta alla definizione dell’integrale di una funzione su un rettangolo. Osserviamo però che, anche se la funzione f è continua in tutto Ω, la nuova funzione f˜ non sarà più, in generale, 254 13. Calcolo Integrale y y O x O (a) Insieme y-semplice ma non x-semplice. x (b) Insieme x-semplice ma non y-semplice. y y O x O (c) Insieme y-semplice e x-semplice. x (d) Insieme né y-semplice né x-semplice. Figura 4. continua nel rettangolo R, e quindi l’esistenza dell’integrale di f˜ su R (e di conseguenza l’esistenza dell’integrale di f su Ω) non è più garantita. Si possono adottare delle strategie più sofisticate per definire l’integrale di una funzione f su un sottoinsieme Ω di R2 , tuttavia, qualunque sia la strategia che si voglia seguire, si trovano sempre dei sottoinsiemi del piano talmente irregolari da far si che non sia possibile integrare su di essi neppure funzioni estremamente semplici, come ad esempio la funzione costante pari a 1 (questi insiemi si dicono non-misurabili). Ci proponiamo quindi un compito meno ambizioso: definire l’integrale di una funzione di due variabili f (x, y) solo su una ben determinata classe di sottoinsiemi di R2 (classe, tuttavia, sufficientemente estesa da contenere tutti i casi di interesse pratico). Definizione 1.3. Un sottoinsieme A di R2 è detto y-semplice se è del tipo A = {(x, y) | a ≤ x ≤ b, h1 (x) ≤ y ≤ h2 (x)}, ove h1 e h2 sono due funzioni continue definite nell’intervallo [a, b]. Analogamente, un sottoinsieme B di R2 è detto x-semplice se è del tipo B = {(x, y) | c ≤ y ≤ d, k1 (y) ≤ x ≤ k2 (y)}, ove k1 e k2 sono due funzioni continue definite nell’intervallo [c, d]. Infine, un sottoinsieme di R2 è detto semplice se è y-semplice oppure x-semplice (si veda la figura 4). Si può dimostrare il seguente risultato fondamentale: Teorema 1.4. Se A ⊂ R2 è un insieme y-semplice, dato da A = {(x, y) | a ≤ x ≤ b, h1 (x) ≤ y ≤ h2 (x)}, 1. Richiami di teoria 255 e f : A → R è una funzione continua, allora f è integrabile in A e si ha: ! ZZ Z b Z h2 (x) f (x, y) dx dy = dx f (x, y) dy . A a h1 (x) Analogamente, se B ⊂ R2 è un insieme x-semplice, dato da B = {(x, y) | c ≤ y ≤ d, k1 (y) ≤ x ≤ k2 (y)}, e f : B → R è una funzione continua, allora f è integrabile in B e si ha: ! Z k2 (y) ZZ Z d f (x, y) dx dy = dy f (x, y) dx . B c k1 (y) Infine, se C è un insieme sia y-semplice che x-semplice, e f : C → R è una funzione continua, allora valgono entrambe le formule precedenti e i due risultati coincidono. Notiamo a questo punto la seguente proprietà additiva dell’integrale: se A e B sono due regioni del piano che si intersecano al più lungo il bordo, e se f è una funzione definita in A ∪ B, allora si ha: ZZ ZZ ZZ f (x, y) dx dy = f (x, y) dx dy + f (x, y) dx dy. A∪B A B Grazie a questa proprietà possiamo estendere la definizione di integrale di una funzione anche a insiemi che non siano semplici, purché sia possibile rappresentarli come unione di un numero finito di sottoinsiemi semplici che si intersecano a due a due al più lungo il loro bordo. Diamo quindi la seguente definizione: Definizione 1.5. Un sottoinsieme Ω di R2 è detto regolare se esiste un numero finito di insiemi semplici A1 , A2 , . . . , An , per qualche intero n, tali che n [ Ω= Ai , i=1 e, per ogni i e j, con i 6= j, gli insiemi Ai e Aj si intersechino al più lungo il bordo. Se Ω è un insieme regolare come sopra, e f : Ω → R è una funzione continua, si pone ZZ n ZZ X f (x, y) dx dy = f (x, y) dx dy. Ω i=1 Ai Si può dimostare che questa definizione è ben posta, nel senso che non dipende dalla decomposizione di Ω come unione di insiemi semplici usata per calcolare l’integrale. Abbiamo cosı̀ definito la nozione di integrale di una funzione continua su un insieme regolare. Ovviamente la classe degli insiemi regolari non contiene tutti i sottoinsiemi di R2 , ma risulta sufficientemente ampia da contenere 256 13. Calcolo Integrale essenzialmente tutti i casi di interesse pratico. A titolo di esempio, notiamo che l’insieme rappresentato in figura 4 (d) è regolare (ma non semplice). Lo studente è invitato a individuare una sua decomposizione in sottoinsiemi semplici. Come caso particolare, possiamo usare gli integrali doppi per definire il concetto di area di un insieme regolare. Definizione 1.6. Sia Ω un sottoinsieme regolare di R2 . L’area di Ω è definita ponendo ZZ Area(Ω) = dx dy. Ω Osservazione 1.7. Osserviamo che il problema dell’esistenza di insiemi non-misurabili, cioè di insiemi Ω tali che non esista l’integrale ZZ dx dy, Ω è intrinseco alla teoria stessa dell’integrazione. Citiamo, a tal proposito, il paradosso di Banach-Tarski, il quale afferma che dati due qualunque sottoinsiemi limitati a interno non vuoto A e B di Rn (n ≥ 3), è possibile suddividere A in un numero finito di sottoinsiemi a due a due disgiunti e riarrangiare quest’ultimi, con movimenti rigidi, per formare B. Evidentemente tali sottoinsiemi non possono essere misurabili! (Paradossi analoghi esistono anche per n = 1 e n = 2). Come conseguenza di ciò si ottiene il fatto che non esiste nessuna misura numerabilmente additiva ed invariante per traslazioni, definita su tutti i sottoinsiemi di Rn , e per cui l’ipercubo [0, 1]n abbia misura unitaria. Per una trattazione di questi risultati si rimanda, ad esempio, a S. Wagon, “The Banach-Tarski Paradox,” Encyclopedia of Mathematics and its Applications, Vol. 24, Cambridge University Press, 1985. 1.1.1. Il cambiamento di variabili negli integrali doppi Sia Ω un sottoinsieme regolare di R2 e sia f : Ω → R una funzione continua. Consideriamo una trasformazione di coordinate ~r : (u, v) 7→ x(u, v), y(u, v) . Se componiamo la funzione f (x, y) con la funzione ~r(u, v), otteniamo una nuova funzione delle due variabili u e v, data da f (x(u, v), y(u, v)). Sappiamo inoltre che, nella trasformazione di coordinate operata dalla funzione ~r, l’elemento infinitesimo di area dx dy si trasforma come segue (vedi Capitolo 12, Sezione 1.3): dx dy = | det J~r (u, v)| du dv. 1. Richiami di teoria z 257 f (P ) S dS P y x Figura 5. Da questi fatti si deduce la seguente formula per il cambiamento di variabili negli integrali doppi: ZZ ZZ f (x, y) dx dy = f x(u, v), y(u, v) | det J~r (u, v)| du dv, Ω Ω0 ove Ω0 = ~r−1 (Ω), cioè Ω0 è sempre lo stesso dominio regolare Ω, espresso però nelle nuove coordinate u e v. 1.2. Integrali di superficie Sia S ⊂ R3 una superficie e sia f : S → R una funzione definita su S. Ci proponiamo di definire l’integrale di f esteso a S. La procedura da seguire è simile a quella usata per una superficie piana, cioè per un sottoinsieme di R2 . L’idea è sempre la stessa: si considera un elemento infinitesimo di area dS sulla superficie S e lo si moltiplica per il valore della funzione f calcolata in un qualche punto P interno a tale elemento di superficie. Si ottiene cosı̀ la quantità f (P ) dS, che rappresenta il volume di un parallelepipedo infinitesimo di base dS e altezza f (P ) (si veda la figura 5). Sommando poi tutti questi volumi infinitesimi si ottiene ciò che si definisce come l’integrale di f esteso a S: ZZ f dS. S Il problema è ora quello di capire come si possa calcolare un tale integrale. Supponiamo che la superficie S sia parametrizzata dalla funzione ~r : A → R3 , (u, v) 7→ x(u, v), y(u, v), z(u, v) , 258 13. Calcolo Integrale ove A è un sottoinsieme di R2 . Se componiamo la funzione f : S → R con la parametrizzazione ~r di S, otteniamo una nuova funzione delle variabili u e v, f (x(u, v), y(u, v), z(u, v)). Sappiamo inoltre che, in termini della parametrizzazione ~r, l’elemento infinitesimo di area sulla superficie S è dato da dS = k~nk du dv, ∂~ r ∂~ r ove ~n = ∂u ∧ ∂v è il vettore normale a S. Si ottiene cosı̀ la seguente uguaglianza, che può essere usata come definizione dell’integrale di f esteso alla superficie S: ZZ ZZ f dS = f x(u, v), y(u, v), z(u, v) k~nk du dv. S A Osservazione 1.8. Si può dimostrare che questa definizione è ben posta, nel senso che l’integrale di f esteso a S non dipende dalla parametrizzazione della superficie S usata per calcolarlo. 1.3. Integrali tripli L’estensione della definizione di integrale dal caso di una funzione di due variabili a quello di una funzione di tre variabili non presenta particolari problemi. Si procede per analogia con quanto fatto nel caso di due variabili. L’analogo tridimensionale di un rettangolo di R2 è un parallelepipedo. Sia dunque Q = [a, b] × [c, d] × [e, f ] un parallelepipedo in R3 e sia f : Q → R una funzione. Dividiamo il parallelepipedo Q in N parallelepipedi uguali J1 , J2 , . . . , JN , e prendiamo, in ogni parallelepipedo Ji un punto Pi = (xi , yi , zi ) ∈ Ji . Consideriamo poi la seguente somma: S(N ) = N X f (xi , yi , zi ) Vol(Ji ). i=1 Se il limite di S(N ), per N → +∞, esiste finito e non dipende dalla scelta dei punti Pi , si pone ZZZ f (x, y, z) dx dy dz = lim S(N ). Q N →+∞ Come per le funzioni di due variabili, si dimostra il seguente risultato: Teorema 1.9. Sia f : Q → R una funzione continua, definita in un parallelepipedo Q ⊂ R3 . Allora esiste l’integrale di f esteso a Q. Come nel caso delle funzioni di due variabili, si può cercare di estendere la definizione di integrale a delle regioni limitate qualsiasi dello spazio nel modo seguente. Sia f : Ω → R una funzione continua definita su un insieme limitato Ω ⊂ R3 . Consideriamo un parallelepipedo Q sufficientemente grande da 1. Richiami di teoria 259 contenere Ω. Estendiamo la definizione di f a tutto il parallelepipedo Q nel modo seguente: ( f (x, y, z) se (x, y, z) ∈ Ω, f˜(x, y, z) = 0 se (x, y, z) 6∈ Ω. La nuova funzione f˜ : Q → R coincide con f nell’insieme Ω ed è nulla all’esterno di Ω. Ha senso quindi porre ZZZ ZZZ f (x, y, z) dx dy dz = f˜(x, y, z) dx dy dz, Ω Q dato che, nella regione di Q esterna a Ω il contributo di f˜ all’integrale che compare nel membro di destra dell’uguaglianza precedente è nullo. In questo modo la definizione dell’integrale di una funzione f su una qualunque regione limitata Ω ⊂ R3 è ricondotta alla definizione dell’integrale di una funzione su un parallelepipedo. Osserviamo però che, anche se la funzione f è continua in tutto Ω, la nuova funzione f˜ non sarà più, in generale, continua nel parallelepipedo Q, e quindi l’esistenza dell’integrale di f˜ su Q (e di conseguenza l’esistenza dell’integrale di f su Ω) non è più garantita. Ci proponiamo quindi un compito meno ambizioso: definire l’integrale di una funzione di tre variabili f (x, y, z) solo su una ben determinata classe di sottoinsiemi di R3 . Definizione 1.10. Un sottoinsieme A di R3 è detto z-semplice se è del tipo A = {(x, y, z) | (x, y) ∈ A0 , h1 (x, y) ≤ z ≤ h2 (x, y)}, ove A0 ⊂ R2 è un insieme semplice e h1 e h2 sono due funzioni continue definite in A0 . In modo del tutto analogo si possono poi definire gli insiemi x-semplici e y-semplici. Un sottoinsieme A di R3 è detto semplice se è z-semplice, oppure ysemplice, oppure x-semplice. Si può dimostrare il seguente risultato fondamentale: Teorema 1.11. Se A ⊂ R3 è un insieme z-semplice, dato da A = {(x, y, z) | (x, y) ∈ A0 , h1 (x, y) ≤ z ≤ h2 (x, y)}, e f : A → R è una funzione continua, allora f è integrabile in A e si ha: ! ZZ ZZZ Z h2 (x,y) f (x, y, z) dx dy dz = dx dy f (x, y, z) dz . A A0 h1 (x,y) Valgono ovviamente dei risultati analoghi per gli insiemi y-semplici e quelli x-semplici. Il calcolo di un integrale triplo è cosı̀ ricondotto al calcolo di un integrale semplice seguito da quello di un integrale doppio. Quest’ultimo, a sua volta, può essere decomposto in due integrali semplici come visto in precedenza. 260 13. Calcolo Integrale Esiste anche un’altra possibile decomposizione di un integrale triplo. Se A ⊂ R3 è un insieme z-semplice, indichiamo con Az̄ l’intersezione di A con il piano di equazione z = z̄, cioè Az̄ = {(x, y, z) ∈ A | z = z̄}. Se tutti gli insiemi Az sono regolari, si ha: ZZZ Z zmax Z Z f (x, y, z) dx dy dz = dz A zmin f (x, y, z) dx dy , Az ove abbiamo indicato con zmin e zmax i valori minimo a massimo assunti dalla variabile z nell’insieme A. In questo caso si esegue quindi prima un integrale doppio esteso allo strato Az e poi un integrale semplice. Esempio 1.12. Per illustrare quest’ultimo metodo di integrazione consideriamo il seguente problema: calcolare il volume di una sfera di raggio r in R3 . Sia S 3 (r) ⊂ R3 la sfera di raggio r centrata nell’origine: S 3 (r) : x2 + y 2 + z 2 ≤ r2 . Il suo volume è dato dal seguente integrale triplo: ZZZ 3 dx dy dz. Vol(S (r)) = S 3 (r) Lo strato S 3 (r)z̄ ottenuto intersecando la sfera con il piano di equazione z = z̄ è costituito dalle soluzioni del seguente sistema: ( x2 + y 2 + z 2 ≤ r 2 z = z̄, da cui si ricava S 3 (r)z̄ : x2 + y 2 ≤ r2 − z̄ 2 . √ Si scopre quindi che S 3 (r)z̄ è un cerchio di raggio r0 = r2 − z̄ 2 , se −r ≤ z̄ ≤ r, altrimenti è l’insieme vuoto (si veda la figura 6). Il precedente integrale triplo può quindi essere calcolato come segue: ZZZ Z r ZZ dx dy dz = dz dx dy. S 3 (r) −r S 3 (r)z Notiamo che l’integrale doppio ZZ dx dy S 3 (r)z √ rappresenta l’area del cerchio S 3 (r)z di raggio r0 = r2 − z 2 , e quindi si ha: ZZ 2 dx dy = πr0 = π(r2 − z 2 ). S 3 (r)z 1. Richiami di teoria 261 z z̄ r0 r y x Figura 6. Possiamo ora completare il calcolo del volume della sfera: ZZZ 3 Vol(S (r)) = dx dy dz S 3 (r) Z r ZZ = dz dx dy −r S 3 (r)z Z r =π (r2 − z 2 )dz −r r z3 2 =π r z− 3 −r 4 = πr3 . 3 Anche nel caso degli integrali tripli è possibile estendere la definizione dell’integrale di una funzione continua a una classe più ampia di insiemi: Definizione 1.13. Un sottoinsieme Ω di R3 è detto regolare se esiste un numero finito di insiemi semplici A1 , A2 , . . . , An , per qualche intero n, tali che Ω= n [ Ai , i=1 e, per ogni i e j, con i 6= j, gli insiemi Ai e Aj si intersechino al più lungo il bordo. 262 13. Calcolo Integrale Se Ω è un insieme regolare come sopra, e f : Ω → R è una funzione continua, si pone ZZZ n ZZZ X f (x, y, z) dx dy dz = f (x, y, z) dx dy dz. Ω i=1 Ai Si può dimostare che questa definizione è ben posta, nel senso che non dipende dalla decomposizione di Ω come unione di insiemi semplici usata per calcolare l’integrale. Come caso particolare, possiamo usare gli integrali tripli per definire il concetto di volume di un insieme regolare. Definizione 1.14. Sia Ω un sottoinsieme regolare di R3 . Il volume di Ω è definito ponendo ZZZ Vol(Ω) = dx dy dz. Ω 1.3.1. Il cambiamento di variabili negli integrali tripli Sia Ω un sottoinsieme regolare di R3 e sia f : Ω → R una funzione continua. Consideriamo una trasformazione di coordinate ~r : (u, v, w) 7→ x(u, v, w), y(u, v, w), z(u, v, w) . Se componiamo la funzione f (x, y, z) con la funzione ~r(u, v, w), otteniamo una nuova funzione delle variabili u, v e w, data da f x(u, v, w), y(u, v, w), z(u, v, w) . Sappiamo inoltre che, nella trasformazione di coordinate operata dalla funzione ~r, l’elemento infinitesimo di volume dx dy dz si trasforma come segue (vedi Capitolo 12, Sezione 1.3): dx dy dz = | det J~r (u, v, w)| du dv dw. Da ciò si deduce la seguente formula per il cambiamento di variabili negli integrali tripli: ZZZ ZZZ f (x, y, z) dx dy dz = f ~r(u, v, w) | det J~r (u, v, w)| du dv dw, Ω0 Ω 0 −1 0 ove Ω = ~r (Ω), cioè Ω è sempre lo stesso dominio regolare Ω, espresso però nelle nuove coordinate u, v e w. 1.4. Integrali in Rn Avendo visto come si definiscono gli integrali per le funzioni di due o tre variabili non dovrebbe essere difficile immaginare come si possano estendere le definizioni e i risultati precedenti al caso di funzioni di n variabili. Non entriamo nei dettagli ma osserviamo solo che si possono ottenere dei risultati 1. Richiami di teoria 263 del tutto analoghi a quelli già visti in dimensione 2 o 3. In particolare si può ottenere il seguente risultato fondamentale: Teorema 1.15. Sia Ω un sottoinsieme regolare di Rn e sia f : Ω → R una funzione continua. Allora esiste l’integrale di f esteso a Ω. In particolare, si può definire il volume (n-dimensionale) di un insieme regolare Ω ⊂ Rn come segue: ZZ Z Vol(Ω) = · · · dx1 dx2 · · · dxn . Ω L’integrale di una funzione di n variabili su un insieme regolare Ω si può poi decomporre in tanti integrali semplici in modo del tutto analogo a quanto visto per gli integrali doppi e tripli. Anche in questo caso non entriamo nei dettagli, ma illustriamo la procedura da seguire con due semplici esempi. Esempio 1.16. La 4-sfera. Ci proponiamo di calcolare il volume di una sfera di raggio r in R4 . Sia dunque S 4 (r) ⊂ R4 la sfera di raggio r centrata nell’origine: S 4 (r) : x2 + y 2 + z 2 + w2 ≤ r2 . Il suo volume è dato dal seguente integrale: ZZZZ 4 Vol(S (r)) = dx dy dz dw. S 4 (r) Lo strato S 4 (r)w̄ ottenuto intersecando la sfera con l’iperpiano di equazione w = w̄ è costituito dalle soluzioni del seguente sistema: ( x2 + y 2 + z 2 + w 2 ≤ r 2 w = w̄, da cui si ricava S 4 (r)w̄ : x2 + y 2 + z 2 ≤ r2 − w̄2 . 4 0 Si √ scopre quindi che S (r)w̄ è una sfera tridimensionale di raggio r = r2 − w̄2 , se −r ≤ w̄ ≤ r, altrimenti è l’insieme vuoto. L’integrale che fornisce il volume della 4-sfera può quindi essere calcolato come segue: ZZZZ Z r ZZZ dx dy dz dw = dw dx dy dz. S 4 (r) −r S 4 (r)w Notiamo che l’integrale triplo ZZZ dx dy dz S 4 (r)w rappresenta il volume della sfera tridimensionale S 4 (r)w di raggio r0 = √ r2 − w2 , e quindi si ha: ZZZ 4 4 p 3 dx dy dz = πr0 = π (r2 − w2 )3 . 3 3 S 4 (r)w 264 13. Calcolo Integrale Per il calcolo del volume della 4-sfera si ottiene quindi: ZZZZ 4 Vol(S (r)) = dx dy dz dw S 4 (r) Z r ZZZ = dw dx dy dz −r S 4 (r)w Z rp 4 = π (r2 − w2 )3 dw 3 −r s Z r w 2 3 4 3 dw. = πr 1− 3 r −r Quest’ultimo integrale si può calcolare mediante il cambiamento di variabili w = sin φ, r da cui si ottiene dw = r cos φ dφ. Effettuando questo cambiamento di variabili, e rideterminando gli estremi di integrazione in funzione della variabile φ, si ottiene: s Z r w 2 3 4 4 3 Vol(S (r)) = πr 1− dw 3 r −r Z q 4 3 π/2 (1 − sin2 φ)3 r cos φ dφ = πr 3 −π/2 Z π/2 4 = πr4 cos4 φ dφ. 3 −π/2 Occupiamoci ora del calcolo del seguente integrale: Z cos4 φ dφ. Questo integrale si può calcolare integrando per parti, come segue: Z Z 4 cos φ dφ = cos3 φ cos φ dφ Z 3 = cos φ sin φ + 3 sin2 φ cos2 φ dφ Z 3 = cos φ sin φ + 3(1 − cos2 φ) cos2 φ dφ Z Z 3 2 = cos φ sin φ + 3 cos φ dφ − 3 cos4 φ dφ. 1. Richiami di teoria 265 R Portando tutti i termini che contengono l’integrale cos4 φ dφ a primo membro, si ottiene Z Z 4 3 4 cos φ dφ = cos φ sin φ + 3 cos2 φ dφ. Rimane ora da calcolare l’integrale Z cos2 φ dφ. Questo si può calcolare integrando per parti in modo del tutto analogo a quanto appena visto, e si trova Z 1 cos2 φ dφ = (φ + sin φ cos φ). 2 Sostituendo nell’espressione precedente si trova quindi Z 1 3 cos4 φ dφ = cos3 φ sin φ + (φ + sin φ cos φ). 4 8 Da ciò segue che Z π/2 3 cos4 φ dφ = π. 8 −π/2 Possiamo cosı̀ completare il calcolo del volume della 4-sfera, ottenendo: Z 4 4 π/2 1 4 Vol(S (r)) = πr cos4 φ dφ = π 2 r4 . 3 2 −π/2 Esempio 1.17. La 5-sfera. In questo secondo esempio ci proponiamo di calcolare il volume di una sfera di raggio r in R5 . Sia dunque S 5 (r) ⊂ R5 la sfera di raggio r centrata nell’origine: S 5 (r) : x2 + y 2 + z 2 + w2 + t2 ≤ r2 . Il suo volume è dato dal seguente integrale: ZZ Z 5 Vol(S (r)) = ··· dx dy dz dw dt. S 5 (r) Lo strato S 5 (r)t̄ ottenuto intersecando la sfera con l’iperpiano di equazione t = t̄ è costituito dalle soluzioni del seguente sistema: ( x2 + y 2 + z 2 + w2 + t2 ≤ r2 t = t̄, da cui si ricava S 5 (r)t̄ : x2 + y 2 + z 2 + w2 ≤ r2 − t̄2 . 5 0 Si √ scopre quindi che S (r)t̄ è una sfera quadridimensionale di raggio r = r2 − t̄2 , se −r ≤ t̄ ≤ r, altrimenti è l’insieme vuoto. 266 13. Calcolo Integrale L’integrale che fornisce il volume della 5-sfera può quindi essere calcolato come segue: ZZ Z Z r ZZZZ ··· dx dy dz dw dt = dt dx dy dz dw. S 5 (r) −r S 5 (r)t Notiamo che l’integrale quadruplo ZZZZ dx dy dz dw S 5 (r)t rappresenta il volume della sfera quadridimensionale S 5 (r)t di raggio r0 = √ r2 − t2 . Questo volume è stato calcolato nell’esempio precedente, e si ha quindi: ZZZZ 1 1 4 dx dy dz dw = π 2 r0 = π 2 (r2 − t2 )2 . 2 2 S 5 (r)t Possiamo ora calcolare il volume della 5-sfera come segue: ZZ Z 5 Vol(S (r)) = ··· dx dy dz dw dt S 5 (r) Z r ZZZZ = dt dx dy dz dw −r S 5 (r)t Z 1 2 r 2 (r − t2 )2 dt = π 2 Z−r 1 2 r 4 = π (r − 2r2 t2 + t4 ) dt 2 −r 8 2 5 = π r . 15 Osservazione 1.18. Per terminare, osserviamo che, operando in modo del tutto analogo a quanto fatto nei due esempi precedenti, si può calcolare il volume n-dimensionale della sfera S n (r) di raggio r in Rn . Le formule che si trovano sono diverse a seconda che la dimensione n sia pari o dispari. Si ha: 2p π p 2p 2p Vol(S (r)) = r , (2p)!! se n = 2p è pari, e Vol(S 2p+1 (r)) = 2p+1 π p 2p+1 r , (2p + 1)!! se n = 2p + 1 è dispari, ove il simbolo m!! indica il semifattoriale di un numero intero m, definito da m!! = m(m − 2)(m − 4) · · · . 2. Esercizi 267 2. Esercizi 2.1. Integrali doppi Esercizio 1. Sia I = [a, b] un intervallo di R e sia f : I → R una funzione continua e positiva. Sia A la parte di piano compresa tra l’asse x e il grafico della funzione f , cioè A = {(x, y) | a ≤ x ≤ b, 0 ≤ y ≤ f (x)}. Si determini l’area dell’insieme A per mezzo di un integrale doppio. Esercizio 2. Sia D la regione limitata del piano compresa tra la retta y = 2x e la parabola y = x2 . Si calcoli il seguente integrale: ZZ xy dx dy. D 2 Esercizio 3. Sia T ⊂ R il trapezio di vertici A = (2, 1), B = (4, 0), C = (4, 4) e D = (2, 3). Si calcoli il seguente integrale: ZZ xy dx dy. T Esercizio 4. Si calcoli il seguente integrale doppio ZZ (x − y) dx dy, D ove D è la regione interna al triangolo di vertici (2, 1), (6, 3) e (5, 4). Esercizio 5. Si calcoli il seguente integrale doppio: ZZ xy dx dy, D ove D è la regione interna al semicerchio di raggio 2 centrato nel punto (0, 3) e contenuto nel semipiano x ≥ 0. Esercizio 6. Calcolare il volume del solido delimitato dai cinque piani di equazione: π1 : z = 0, π2 : y = 0, π3 : x = 1, π4 : x − y = 0, π5 : x − y − z + 1 = 0. Esercizio 7. Calcolare l’integrale doppio ZZ dx dy √ I= , 4−x D dove D è il cerchio di raggio 2, tangente agli assi coordinati e contenuto nel primo quadrante. Esercizio 8. Calcolare il volume del solido limitato dal paraboloide ellittico z = 2x2 + y 2 + 1, dal piano x + y = 1 e dai piani coordinati. Esercizio 9. Calcolare il volume della semisfera, contenuta nel semispazio z ≥ 0, centrata nell’origine e di raggio R. 268 13. Calcolo Integrale Esercizio 10. Si calcoli l’area di un cerchio di raggio R, utilizzando le coordinate polari. Esercizio 11. Si calcoli il seguente integrale: ZZ xy 2 dx dy, 2 2 D x +y ove D = {(x, y) | x2 + y 2 ≤ 4, x > 0, y > 0} (si usino le coordinate polari). Esercizio 12. Calcolare il seguente integrale: ZZ xy dx dy, 2 2 D x +y ove D = {(x, y) | 1 ≤ x2 + y 2 ≤ 4; y ≥ 0; x ≥ y}. Esercizio 13. Si calcoli l’area del seguente insieme D: D = {(x, y) | 0 ≤ y ≤ x, 2x ≤ x2 + y 2 ≤ 4x}. Esercizio 14. Siano a, b, p, q ∈ R dei numeri fissati, con 0 < a < b e 0 < p < q. Si calcoli l’area del seguente insieme D: D = {(x, y) | x > 0, y > 0, a2 y ≤ x3 ≤ b2 y, p2 x ≤ y 3 ≤ q 2 x}. 2.2. Integrali di superficie Esercizio 15. Indichiamo con S la superficie parametrizzata da x = u2 , √ y = 2uv, z = v 2 , per u ∈ [−1, 1] e v ∈ [−2, 2]. Si determinino i punti singolari e l’area della superficie S. Esercizio 16. Si calcoli l’area della superficie sferica di raggio R. Esercizio 17. Si calcoli l’area della superficie del toro (in funzione dei due raggi). Esercizio 18. Calcolare la lunghezza L dell’arco di cicloide Γ parametrizzato da x(t) = 2(t − sin t) y(t) = 2(1 − cos t), per t ∈ [0, 2π]. Calcolare inoltre l’area della superficie S generata da una rotazione completa della curva Γ attorno all’asse x. 2.3. Integrali tripli Esercizio 19. Si calcoli il volume di un cono circolare di raggio di base r e altezza h. Esercizio 20. Si calcoli il volume di una sfera di raggio R, utilizzando le coordinate sferiche. Esercizio 21. Si calcoli il volume dell’ellissoide E di semiassi a, b e c. 3. Soluzioni 269 3. Soluzioni 3.1. Integrali doppi Svolgimento esercizio 1. Per definizione, si ha ZZ dx dy. Area(A) = A Dato che l’insieme A è y-semplice, questo integrale si può decomporre come segue: ZZ Z b dx dy = Z dx A a f (x) Z b dy = 0 a f (x) dx y 0 = Z b f (x) dx. a Si R b ritrova, in questo modo, la solita interpretazione geometrica dell’integrale f (x) dx come l’area della regione di piano compresa tra l’asse x e il grafico a della funzione f . Svolgimento esercizio 2. La retta y = 2x e la parabola y = x2 si intersecano nei punti (0, 0) e (2, 4). Si ha quindi: D = {(x, y) | 0 ≤ x ≤ 2, x2 ≤ y ≤ 2x}. L’insieme D è dunque y-semplice (in effetti è anche x-semplice), e l’integrale doppio si può calcolare come segue: ZZ Z xy dx dy = D 2 Z 2x dx xy dy 2x Z 2 1 2 = x dx y 2 0 x2 Z 2 1 = x(4x2 − x4 ) dx 2 0 2 1 4 x6 8 = x − = . 2 6 0 3 0 x2 Svolgimento esercizio 3. La retta AB ha equazione y = −x/2 + 2 e la retta CD ha equazione y = x/2 + 2. Gli altri due lati del trapezio sono verticali e le loro equazioni sono: AD : x = 2, BC : x = 4. Il trapezio T può quindi essere descritto come segue (lo studente è invitato a disegnare la figura): T = {(x, y) | 2 ≤ x ≤ 4, −x/2 + 2 ≤ y ≤ x/2 + 2}. 270 13. Calcolo Integrale L’insieme T è dunque y-semplice e l’integrale da calcolare può essere decomposto come segue: ZZ 4 Z xy dx dy = Z x/2+2 dx T xy dy −x/2+2 2 4 Z = 2 1 2 x dx y 2 4 Z x/2+2 −x/2+2 1 x dx (x/2 + 2)2 − (−x/2 + 2)2 2 = 2 4 Z 2x2 dx = 2 x3 =2 3 4 = 2 112 . 3 Svolgimento esercizio 4. Indichiamo con A = (2, 1), B = (6, 3) e C = (5, 4) i vertici del triangolo D. L’insieme D in questione è sia x-semplice che y-semplice. Calcoliamo l’integrale considerando D come insieme y-semplice. La retta AB ha equazione y = x/2. La retta AC ha equazione y = x − 1. Infine, la retta BC ha equazione y = 9 − x. Per calcolare l’integrale è conveniente dividere il triangolo D in due triangoli più piccoli nel modo seguente: dal punto C tracciamo una retta verticale (di equazione x = 5) che incontra il lato AB nel punto E = (5, 5/2). Chiamiamo D1 il triangolo di vertici ACE e D2 il triangolo di vertici BCE (lo studente è invitato a disegnare la figura). In questo modo si ha: ZZ ZZ (x − y) dx dy = D ZZ (x − y) dx dy + D1 (x − y) dx dy. D2 I due integrali in questione si calcolano ora come segue: ZZ Z 5 (x − y) dx dy = D1 Z x−1 (x − y) dy dx 2 x/2 x−1 y2 = dx xy − 2 x/2 2 Z 5 1 2 1 = x − dx 8 2 2 5 1 3 1 27 = x − x = , 24 2 2 8 Z 5 3. Soluzioni e ZZ Z 6 (x − y) dx dy = D2 Z 9−x (x − y) dy dx 5 271 x/2 9−x y2 = dx xy − 2 x/2 5 Z 6 81 15 2 = − x + 18x − dx 8 2 5 6 5 3 81 13 2 = − x + 9x − x = . 8 2 8 5 Sommando i due valori trovati, si ha infine ZZ 27 13 (x − y) dx dy = + = 5. 8 8 D Z 6 Svolgimento esercizio 5. La circonferenza di centro C = (0, 3) e raggio r = 2 ha equazione x2 + (y − 3)2 = 4, da cui si ricava, per la semicirconferenza contenuta nel semipiano x ≥ 0, p p x = 4 − (y − 3)2 = −y 2 + 6y − 5. L’insieme D è quindi x-semplice, e precisamente si ha: p D = {(x, y) | 1 ≤ y ≤ 5, 0 ≤ x ≤ −y 2 + 6y − 5 }. L’integrale doppio da calcolare si può quindi scomporre come segue: ZZ Z 5 Z √−y2 +6y−5 xy dx dy = dy xy dx D 1 0 2 √−y2 +6y−5 Z 5 x = y dy 2 0 1 Z 5 1 = (−y 3 + 6y 2 − 5y) dy 2 1 4 5 1 y 5 2 3 = − + 2y − y 2 4 2 1 = 16. Svolgimento esercizio 6. Il piano π1 è il piano xy, il piano π2 è il piano xz e il piano π3 è il piano passante per il punto A = (1, 0, 0) e parallelo al piano yz. Consideriamo ora il piano π4 , la cui equazione è x = y. Si tratta del piano contenente l’asse z e la retta di equazione x = y nel piano xy. Il solido individuato da questi quattro piani è quindi un parallelepipedo che ha come base il triangolo T , contenuto nel piano xy, di vertici O = (0, 0, 0), A = (1, 0, 0) e B = (1, 1, 0) (è indispensabile, a questo punto, disegnare la 272 13. Calcolo Integrale figura). Il quinto piano π5 seziona questo parallelepipedo, determinando in questo modo il solido di cui si vuole calcolare il volume. Dall’equazione di π5 si ricava z = x − y + 1 e, da quanto detto fin’ora, segue che il volume cercato è dato dal seguente integrale: ZZ V = (x − y + 1) dx dy. T Dato che il triangolo T è un insieme y-semplice (in effetti è anche xsemplice), questo integrale doppio si può calcolare come segue: ZZ Z 1 Z x (x − y + 1) dx dy = dx (x − y + 1) dy T 0 0 x Z 1 y2 = dx xy − +y 2 0 0 Z 1 2 x 2 = + x dx = . 2 3 0 Svolgimento esercizio 7. Il cerchio D in questione ha raggio 2 e centro nel punto C = (2, 2). La sua equazione è quindi (x − 2)2 + (y − 2)2 = 4, cioè x2 + y 2 − 4x − 4y + 4 = 0. L’insieme D è sia x-semplice che y-semplice. Se lo pensiamo come insieme y-semplice, dall’equazione del cerchio ricaviamo √ y = 2 ± 4x − x2 , e si ha dunque D = {(x, y) | 0 ≤ x ≤ 4, 2 − √ 4x − x2 ≤ y ≤ 2 + √ 4x − x2 }. L’integrale in questione si calcola quindi come segue: ZZ Z 4 Z 2+√4x−x2 dx dy dy √ √ = dx √ 4−x 4−x D 0 2− 4x−x2 Z 4 √ dx 2+ 4x−x2 √ = y √ 2 4 − x 2− 4x−x 0 √ Z 4 2 4x − x2 √ dx = 4−x 0 Z 4 √ 32 =2 x dx = . 3 0 Svolgimento esercizio 8. La base del solido in questione è il triangolo T , contenuto nel piano xy, di vertici (0, 0, 0), (1, 0, 0) e (0, 1, 0) (si invita il 3. Soluzioni 273 lettore a disegnare la figura). Il volume cercato è quindi dato dal seguente integrale: ZZ V = (2x2 + y 2 + 1) dx dy. T Il triangolo T è y-semplice (e anche x-semplice), quindi si ha: ZZ Z 1 Z 1−x 2 2 (2x + y + 1) dx dy = dx (2x2 + y 2 + 1) dy T 0 Z 0 1 1−x y3 2 dx 2x y + +y 3 0 1 1 (1 − x)(7x2 − 2x + 4)dx 3 = 0 Z = 0 3 = . 4 Svolgimento esercizio 9. L’equazione della sfera di raggio R, centrata nell’origine, è x2 + y 2 + z 2 = R 2 , da cui si ricava, per la semisfera contenuta nel semispazio z ≥ 0, p z = R 2 − x2 − y 2 , ove questa funzione è definita nel cerchio Ω, contenuto nel piano xy, centrato nell’origine e di raggio R: Ω = {(x, y) | x2 + y 2 ≤ R2 }. Il volume della semisfera in questione è quindi dato da ZZ p V = R2 − x2 − y 2 dx dy. Ω L’insieme Ω è sia x-semplice che y-semplice. Considerandolo come insieme y-semplice, l’integrale doppio si può calcolare come segue: Z R Z √R2 −x2 p ZZ p R2 − x2 − y 2 dx dy = dx √ R2 − x2 − y 2 dy Ω −R − R2 −x2 Iniziamo dunque calcolando il seguente integrale indefinito: Z p R2 − x2 − y 2 dy. Se poniamo A2 = R2 − x2 , si ha: Z p Z p Z r y 2 R2 − x2 − y 2 dy = A2 − y 2 dy = A 1− dy. A 274 13. Calcolo Integrale Quest’ultimo integrale si può calcolare mediante la sostituzione ottenendo: Z r Z p y 2 2 A 1− dy = A 1 − sin2 t cos t dt A Z 2 =A cos2 t dt = y A = sin t, A2 (t + sin t cos t), 2 ove si è usata l’uguaglianza Z 1 cos2 t dt = (t + sin t cos t). 2 Da quanto visto, si ottiene: t=π/2 Z √R2 −x2 p 2 2 R − x π R2 − x2 − y 2 dy = t + sin t cos t = (R2 − x2 ). √ 2 2 − R2 −x2 t=−π/2 Possiamo ora completare il calcolo dell’integrale doppio: ZZ p Z π R 2 4 2 2 2 R − x − y dx dy = (R − x2 )dx = πR3 . 2 −R 6 Ω Il volume di una semisfera di raggio R è dunque V = 46 πR3 , da cui segue che il volume di una sfera di raggio R è 34 πR3 . Per concludere, osserviamo che il calcolo del volume della semisfera risulterebbe estremamente più semplice utilizzando le coordinate sferiche. Svolgimento esercizio 10. Sia Ω il cerchio di raggio R centrato nell’origine: Ω = {(x, y) | x2 + y 2 ≤ R2 }. Se introduciamo le coordinate polari ρ e θ, legate alle coordinate cartesiane x e y dalla trasformazione di coordinate x = ρ cos θ, y = ρ sin θ, il cerchio Ω è descritto come segue: Ω0 = {(ρ, θ) | 0 ≤ ρ ≤ R, 0 ≤ θ ≤ 2π}. In coordinate polari il cerchio Ω diventa quindi il rettangolo Ω0 . Ricordiamo ora che l’elemento di area dx dy è espresso, in coordinate polari, dalla formula dx dy = ρ dρ dθ. 3. Soluzioni 275 Siamo ora in grado di calcolare l’area A del cerchio Ω di raggio R: ZZ A= dx dy Z ZΩ = ρ dρ dθ Ω0 Z R Z 2π = dρ ρ dθ 0 0 Z R = 2π ρ dρ = πR2 . 0 Svolgimento esercizio 11. Effettuiamo il cambiamento di variabili x = ρ cos θ, y = ρ sin θ. Sappiamo che l’elemento di area dx dy è espresso, in coordinate polari, dalla formula dx dy = ρ dρ dθ. L’insieme D = {(x, y) | x2 + y 2 ≤ 4, x > 0, y > 0} è il quarto del cerchio di raggio 2, centrato nell’origine, contenuto nel primo quadrante. Bisogna ora calcolare l’insieme D0 , che non è altro che lo stesso insieme D espresso però usando le coordinate polari. Si vede immediatamente che si ha: D0 = {(ρ, θ) | 0 < ρ ≤ 2, 0 < θ < π/2}. L’insieme D0 è dunque un rettangolo, e l’integrale doppio si può ora calcolare come segue: ZZ ZZ xy 2 ρ cos θρ2 sin2 θ dx dy = ρ dρ dθ 2 2 ρ2 D x +y D0 ZZ = ρ2 cos θ sin2 θ dρ dθ Z D0 2 = Z π/2 ρ2 cos θ sin2 θ dθ dρ 0 Z 0 2 = 0 Z = 0 2 1 3 ρ dρ sin θ 3 2 π/2 0 1 2 8 ρ dρ = . 3 9 Svolgimento esercizio 12. Per calcolare questo integrale conviene usare le coordinate polari. Effettuiamo quindi il cambiamento di variabili x = ρ cos θ, y = ρ sin θ. 276 13. Calcolo Integrale Sappiamo che l’elemento di area dx dy è espresso, in coordinate polari, dalla formula dx dy = ρ dρ dθ. Bisogna ora calcolare l’insieme D0 , cioè l’insieme D espresso in coordinate polari. Le disequazioni 1 ≤ x2 + y 2 ≤ 4 diventano, in coordinate polari, 1 ≤ ρ2 ≤ 4, cioè 1 ≤ ρ ≤ 2. La disequazione y ≥ 0 è equivalente a sin θ ≥ 0, cioè 0 ≤ θ ≤ π. Infine, la disequazione x ≥ y è equivalente a cos θ ≥ sin θ, le cui soluzioni sono date da 0 ≤ θ ≤ π/4 (ove si è tenuto conto del fatto che, in precedenza, si era trovato 0 ≤ θ ≤ π). L’insieme D0 è dunque dato da: D0 = {(ρ, θ) | 1 ≤ ρ ≤ 2, 0 ≤ θ ≤ π/4}. Possiamo ora calcolare l’integrale doppio come segue: ZZ ZZ xy dx dy = ρ cos θ sin θ dρ dθ 2 2 D x +y D0 Z 2 Z π/4 = dρ ρ cos θ sin θ dθ 1 Z 0 2 1 = dρ ρ sin2 θ 2 1 Z 1 2 3 = ρ dρ = . 4 1 8 Svolgimento esercizio 13. Si ha: ZZ Area(D) = dx dy. π/4 0 D Sebbene questo integrale si possa calcolare usando le coordinate cartesiane x e y, risulta più conveniente passare in coordinate polari ρ e θ. La trasformazione di coordinate è data da x = ρ cos θ, y = ρ sin θ. L’elemento di area dx dy è espresso, in coordinate polari, dalla formula dx dy = ρ dρ dθ. Bisogna ora calcolare l’insieme D0 , cioè l’insieme D espresso in coordinate polari. Le disequazioni 0 ≤ y ≤ x diventano, in coordinate polari, 0 ≤ ρ sin θ ≤ ρ cos θ, che sono equivalenti al sistema sin θ ≥ 0 cos θ ≥ sin θ. Le soluzioni di questo sistema sono date da 0 ≤ θ ≤ π/4. Rimangono ora le disequazioni 2x ≤ x2 + y 2 ≤ 4x che, in coordinate polari, diventano 2ρ cos θ ≤ ρ2 ≤ 4ρ cos θ, cioè 2 cos θ ≤ ρ ≤ 4 cos θ. 3. Soluzioni 277 L’insieme D0 è dunque dato da: D0 = {(ρ, θ) | 2 cos θ ≤ ρ ≤ 4 cos θ, 0 ≤ θ ≤ π/4}. Da questa descrizione si deduce che D0 è un insieme ρ-semplice. Disponiamo ora di tutte le informazioni necessarie per poter calcolare l’integrale doppio: ZZ dx dy Area(D) = D ZZ = ρ dρ dθ Z D0 π/4 = Z 4 cos θ dθ ρ dρ 0 Z 2 cos θ π/4 = 0 Z = 1 2 dθ ρ 2 4 cos θ 2 cos θ π/4 6 cos2 θ dθ 0 h iπ/4 = 3 θ + sin θ cos θ 0 3 3 = π+ , 4 2 ove si è usata la (nota) uguaglianza Z 1 cos2 θ dθ = (θ + sin θ cos θ). 2 Svolgimento esercizio 14. Data la forma dell’insieme D, per calcolare l’integrale ZZ Area(D) = dx dy, D conviene effettuare un cambiamento di variabili. Poniamo u = x3 /y e v = y 3 /x. Invertendo la trasformazione di coordinate, cioè ricavando x e y in funzione di u e v, si trova ( x = (u3 v)1/8 , y = (uv 3 )1/8 . Possiamo ora scrivere la matrice jacobiana della trasformazione di coordinate: ∂x ∂x 3 2 3 −7/8 1 3 3 −7/8 u v(u v) u (u v) ∂v = 81 3 3 −7/8 38 2 3 −7/8 . J = ∂u ∂y ∂y v (uv ) uv (uv ) 8 8 ∂u ∂v Il determinante della matrice jacobiana è 1 det J = √ , 8 uv 278 13. Calcolo Integrale e quindi l’elemento infinitesimo di area si trasforma come segue: 1 dx dy = √ du dv. 8 uv Bisogna ora determinare l’insieme D0 , cioè l’insieme D espresso nelle nuove coordinate u e v. 3 Le disequazioni a2 y ≤ x3 ≤ b2 y sono equivalenti a a2 ≤ xy ≤ b2 , che diventano a2 ≤ u ≤ b2 . Analogamente, le disequazioni p2 x ≤ y 3 ≤ q 2 x sono 3 equivalenti a p2 ≤ yx ≤ q 2 , che diventano p2 ≤ v ≤ q 2 . L’insieme D0 è quindi dato da: D0 = {(u, v) | a2 ≤ u ≤ b2 , p2 ≤ v ≤ q 2 }. Nelle nuove coordinate u e v l’insieme D0 è dunque un rettangolo. Possiamo finalmente procedere al calcolo dell’area dell’insieme D: ZZ Area(D) = dx dy D ZZ 1 √ du dv = D0 8 uv Z b2 Z q2 1 √ dv = du a2 p2 8 uv Z b2 Z q2 1 1 1 √ du √ dv = 8 a2 u v p2 2 2 h i h i √ q 1 √ b = 2 u 2 v 8 a2 p2 1 = (b − a)(q − p). 2 3.2. Integrali di superficie Svolgimento esercizio 15. Chiamiamo ~r la funzione √ ~r(u, v) = (u2 , 2uv, v 2 ), che parametrizza la superficie S. Si ha: √ ∂~r = (2u, 2v, 0), ∂u √ ∂~r = (0, 2u, 2v). ∂v Il vettore normale ~n è quindi dato da √ √ ∂~r ∂~r ~n = ∧ = (2 2v 2 , −4uv, 2 2u2 ). ∂u ∂v 3. Soluzioni 279 I punti singolari sono quelli in cui il vettore ~n è nullo, il che accade solo se u = v = 0. Quindi l’unico punto singolare di S è il punto di coordinate ~r(0, 0) = (0, 0, 0), cioè l’origine. Infine l’area A di S è data dal seguente integrale: ZZ A= k~nk du dv, D ove D =√{(u, v) | − 1 ≤ u ≤ 1, −2 ≤ v ≤ 2}. La norma del vettore ~n è k~nk = 2 2(u2 + v 2 ), quindi si ha √ ZZ √ Z 2 √ Z 1 80 2 2 2 2 2 A= 2 2(u + v ) du dv = 2 2 du (u + v ) dv = . 3 D −1 −2 Svolgimento esercizio 16. Sia S la superficie sferica di raggio R centrata nell’origine. Abbiamo già visto, in uno degli esercizi del Capitolo 12, che la superficie S è parametrizzata dalla funzione (θ, φ) 7→ ~r(θ, φ) = (R sin φ cos θ, R sin φ sin θ, R cos φ), per 0 ≤ θ < 2π e 0 ≤ φ ≤ π. L’insieme di definizione della funzione ~r è dunque il rettangolo Ω = {(θ, φ) | 0 ≤ θ < 2π, 0 ≤ φ ≤ π}. Determiniamo i due vettori tangenti: ∂~r = (−R sin φ sin θ, R sin φ cos θ, 0), ∂θ ∂~r ~v2 = = (R cos φ cos θ, R cos φ sin θ, −R sin φ). ∂φ ~v1 = Il vettore normale è quindi ~n = ~v1 ∧ ~v2 ~k ~ ı ~ = −R sin φ sin θ R sin φ cos θ 0 R cos φ cos θ R cos φ sin θ −R sin φ = (−R2 sin2 φ cos θ, −R2 sin2 φ sin θ, −R2 sin φ cos θ) = −R sin φ(R sin φ cos θ, R sin φ sin θ, R cos φ) = −R sin φ ~r(θ, φ). Possiamo ora calcolare l’elemento infinitesimo di area sulla superficie S: dS = k~nk dθ dφ = R2 sin φ dθ dφ. 280 13. Calcolo Integrale L’area della superficie S è quindi data dal seguente integrale: ZZ Area(S) = dS S ZZ = R2 sin φ dθ dφ Ω Z π Z 2π 2 =R sin φ dφ dθ 0 0 Z π 2 = 2πR sin φ dφ 0 2 = 4πR . Svolgimento esercizio 17. Abbiamo già visto, in uno degli esercizi del Capitolo 12, che il toro T è parametrizzato da x = (R + r cos t) cos θ y = (R + r cos t) sin θ z = r sin t, cioè dalla funzione ~r(t, θ) = (R + r cos t) cos θ, (R + r cos t) sin θ, r sin t , con 0 ≤ t < 2π e 0 ≤ θ < 2π (ove abbiamo indicato con r e R i due raggi che individuano il toro). L’insieme di definizione della funzione ~r è dunque il rettangolo Ω = {(t, θ) | 0 ≤ t < 2π, 0 ≤ θ < 2π}. Determiniamo i due vettori tangenti: ∂~r = (−r sin t cos θ, −r sin t sin θ, r cos t), ∂t ∂~r = − (R + r cos t) sin θ, (R + r cos t) cos θ, 0 . ∂θ Il vettore normale è quindi ~n = ∂~r ∂~r ∧ = −r(R + r cos t)(cos t cos θ, cos t sin θ, sin t). ∂t ∂θ Possiamo ora calcolare l’elemento infinitesimo di area sulla superficie del toro: dS = k~nk dt dθ = r(R + r cos t) dt dθ. 3. Soluzioni 281 L’area del toro T è quindi data dal seguente integrale: ZZ Area(T ) = dS T ZZ = r(R + r cos t) dt dθ Z 2π =r dt (R + r cos t) dθ 0 0 Z 2π = 2πr (R + r cos t) dt 0 2π = 2πr Rt + r sin t 0 Ω Z 2π = (2πr)(2πR) = 4π 2 rR. Svolgimento esercizio 18. Si ha x0 (t) = 2(1 − cos t) e y 0 (t) = 2 sin t. L’elemento infinitesimo di lunghezza d` sulla curva Γ (detto anche differenziale d’arco) è dato da: d` = √ √ x0 (t)2 + y 0 (t)2 dt = 2 2 1 − cos t dt. p La lunghezza L = L(Γ) si calcola quindi come segue: √ Z 2π √ L = d` = 2 2 1 − cos t dt Γ 0 r √ Z 2π t =2 2 2 sin2 dt 2 0 2π √ √ t = 16, = 2 2 −2 2 cos 2 0 Z dove si è usata la nota formula t 1 − cos t = 2 sin2 . 2 Sia ora S la superficie generata da una rotazione completa della curva Γ attorno all’asse x. Un punto P = (xP , yP ) su Γ descrive, nella rotazione di Γ attorno all’asse x, una circonferenza di lunghezza pari a 2πyP . Da ciò segue che un trattino infinitesimo di lunghezza d` sulla curva Γ descrive una superficie infinitesima la cui area è data da 2πyP d`, a meno di infinitesimi di ordine superiore al primo. Da ciò segue che l’area della superficie S è 282 13. Calcolo Integrale data dal seguente integrale: Z Area(S) = 2πy(t) d`(t) Γ Z 2π √ √ = 2π 2(1 − cos t) 2 2 1 − cos t dt 0 √ Z 2π = 8π 2 (1 − cos t)3/2 dt 0 √ Z 2π √ t = 8π 2 2 2 sin3 dt 2 Z π0 = 64π sin3 u du, 0 ove si è usata l’identità 1 − cos t = 2 sin2 t 2 e si è posto poi u = t/2. Quest’ultimo integrale si calcola facilmente integrando per parti, ottenendo Z 1 sin3 u du = − cos u (sin2 u + 2). 3 Sviluppando i calcoli, si trova infine che l’area della superficie S è pari a 256 π. 3 Per terminare, notiamo come, operando nel modo descritto sopra, non sia necessario determinare una parametrizzazione della superficie S al fine di calcolare l’elemento infinitesimo di area dS per ottenere poi, tramite un integrale doppio, l’area di S. 3.3. Integrali tripli Svolgimento esercizio 19. Sia C un cono circolare di raggio di base r e altezza h. Fissiamo il sistema di riferimento in modo che la base del cono sia contenuta nel piano xy e l’asse del cono coincida con l’asse z. Il volume del cono C è dato dal seguente integrale triplo: ZZZ Vol(C ) = dx dy dz. C Per calcolare questo integrale utilizziamo il metodo di integrazione per strati: ZZZ Z h ZZ dx dy dz = dz dx dy. C 0 Cz Lo strato Cz , ottenuto intersecando il cono con il piano parallelo al piano xy passante per il punto di coordinate (0, 0, z), è un cerchio il cui raggio r0 3. Soluzioni 283 si verifica facilmente essere dato da r0 = r(h − z) . h Si ha dunque: ZZ 2 dx dy = πr0 = Cz πr2 (h − z)2 . h2 Possiamo ora completare il calcolo del volume del cono: ZZZ Vol(C ) = dx dy dz C Z h ZZ = dz dx dy Cz 0 2 = πr h2 Z h (h − z)2 dz 0 h πr 1 3 = 2 − (h − z) h 3 0 1 = πhr2 . 3 2 Svolgimento esercizio 20. Sia S la sfera di raggio R centrata nell’origine: S = {(x, y, z) | x2 + y 2 + z 2 ≤ R2 }. Se introduciamo le coordinate sferiche ρ, φ e θ, legate alle coordinate cartesiane x, y, z dalla trasformazione di coordinate x = ρ sin φ cos θ y = ρ sin φ sin θ z = ρ cos φ, con ρ ≥ 0, 0 ≤ φ ≤ π e 0 ≤ θ < 2π, la sfera S è descritta come segue: S 0 = {(ρ, φ, θ) | 0 ≤ ρ ≤ R, 0 ≤ φ ≤ π, 0 ≤ θ ≤ 2π}. In coordinate sferiche la sfera S diventa quindi il parallelepipedo S 0 . Ricordiamo ora che l’elemento di volume dx dy dz è espresso, in coordinate sferiche, dalla formula dx dy dz = ρ2 sin φ dρ dφ dθ. 284 13. Calcolo Integrale Siamo ora in grado di calcolare il volume della sfera S: ZZZ Vol(S) = dx dy dz S ZZZ = ρ2 sin φ dρ dφ dθ 0 S Z R Z π Z 2π = dρ dφ ρ2 sin φ dθ 0 0 0 Z R Z π = 2π dρ ρ2 sin φ dφ 0 0 Z R = 4π ρ2 dρ 0 1 3 = 4π ρ 3 R = 0 4 πR3 . 3 Svolgimento esercizio 21. L’ellissoide E di semiassi a, b e c è definito dalla seguente disequazione: E : x2 y 2 z 2 + 2 + 2 ≤ 1. a2 b c Se poniamo X = x/a, Y = y/b e Z = z/c, la disequazione precedente diventa: E 0 : X 2 + Y 2 + Z 2 ≤ 1. Nelle nuove coordinate X, Y e Z, l’ellissoide E è quindi diventato una sfera di raggio 1. Calcoliamo ora la matrice jacobiana J della precedente trasformazione di coordinate, che scriviamo nella forma x = aX y = bY z = cZ. Si vede immediatamente che a 0 0 J = 0 b 0 , 0 0 c e quindi det J = abc. Concludiamo quindi che, nella precedente trasformazione di coordinate, l’elemento infinitesimo di volume si trasforma come segue: dx dy dz = abc dX dY dZ. 3. Soluzioni 285 Possiamo ora calcolare il volume dell’ellissoide, usando la formula per il cambiamento di variabili negli integrali tripli: ZZZ ZZZ Vol(E ) = dx dy dz = abc dX dY dZ = abc Vol(E 0 ). E E0 Dato che, come abbiamo prima osservato, E 0 è una sfera di raggio 1, il suo volume è noto: 4 Vol(E 0 ) = π. 3 Si conclude quindi che 4 Vol(E ) = π abc. 3 Per terminare, notiamo come, con una semplice trasformazione di coordinate abbiamo potuto determinare il volume dell’ellissoide E senza dover, in effetti, calcolare alcun integrale.