Esercizi di Matematica II

Università degli Studi di Bergamo
Esercizi di Matematica II
Francesco Bottacin
A.A. 2002/03
Capitolo 1
Spazi Vettoriali
1. Richiami di teoria
1.1. Spazi vettoriali
Sia C un campo fissato (usualmente C è il campo dei numeri reali R oppure
il campo dei numeri complessi C).
Definizione 1.1. Uno spazio vettoriale su C è un insieme V dotato di una
operazione +V , detta somma,
+V : V × V → V,
(v1 , v2 ) 7→ v1 +V v2 ,
e di una operazione ·V
·V : C × V → V,
(λ, v) 7→ λ ·V v,
detta prodotto per uno scalare, che soddisfano le seguenti proprietà: per
ogni λ, λ1 , λ2 ∈ C e ogni v, v1 , v2 ∈ V si ha
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(v1 +V v2 ) +V v3 = v1 +V (v2 +V v3 );
v1 +V v2 = v2 +V v1 ;
esiste un elemento 0V ∈ V tale che v +V 0V = 0V +V v = v;
per ogni v ∈ V esiste un elemento v 0 ∈ V tale che v+V v 0 = v 0 +V v =
0V . Tale elemento v 0 viene indicato con −v e detto l’opposto di v;
λ ·V (v1 +V v2 ) = (λ ·V v1 ) +V (λ ·V v2 );
(λ1 + λ2 ) ·V v = (λ1 ·V v) +V (λ2 ·V v);
(λ1 λ2 ) ·V v = λ1 ·V (λ2 ·V v);
1 ·V v = v.
Gli elementi di uno spazio vettoriale V sono detti vettori. Gli elementi
del campo C sono detti scalari.
D’ora in poi, qualora non vi sia pericolo di confusione, l’operazione di
somma in uno spazio vettoriale V sarà indicata semplicemente con + mentre
il simbolo del prodotto per uno scalare sarà omesso: si scriverà quindi v1 +v2
al posto di v1 +V v2 e λv al posto di λ ·V v.
Consideriamo ora uno spazio vettoriale V , definito sul campo C.
2
1. Spazi Vettoriali
Definizione 1.2. Un sottospazio vettoriale W di V è un sottoinsieme W ⊂
V tale che la restrizione a W delle operazioni di somma e di prodotto per
uno scalare definite su V rende W uno spazio vettoriale sul campo C.
Dalla definizione si deduce quindi che affinché un sottoinsieme W di V sia
un sottospazio vettoriale è necessario e sufficiente che, per ogni w1 , w2 ∈ W ,
si abbia w1 + w2 ∈ W ; che per ogni w ∈ W anche −w ∈ W ; che 0V ∈ W ; e
che, per ogni λ ∈ C e ogni w ∈ W , anche λw ∈ W . Tutte queste condizioni
si possono riassumere nella seguente:
Proposizione 1.3. Un sottoinsieme W di uno spazio vettoriale V sul campo C è un sottospazio vettoriale se e solo se
λ1 w1 + λ2 w2 ∈ W,
per ogni λ1 , λ2 ∈ C e ogni w1 , w2 ∈ W .
Si noti che, se (Wi )i∈I è una famiglia di sottospazi vettoriali di V , allora
anche l’intersezione di tutti i Wi
\
Wi
i∈I
è un sottospazio vettoriale di V .
L’analoga proprietà non vale invece per l’unione: se W1 e W2 sono due
sottospazi vettoriali di V , l’unione W1 ∪W2 non è, in generale, un sottospazio
vettoriale di V .
1.2. Combinazioni lineari e basi
Sia V uno spazio vettoriale su un campo C e siano v1 , v2 , . . . , vn dei vettori
di V .
Definizione 1.4. Una combinazione lineare dei vettori v1 , v2 , . . . , vn è l’espressione
λ 1 v 1 + λ2 v 2 + · · · + λn v n ,
per λ1 , λ2 , . . . , λn ∈ C.
Definizione 1.5. I vettori v1 , v2 , . . . , vn si dicono linearmente indipendenti
se l’equazione
λ1 v1 + λ2 v2 + · · · + λn vn = 0V
ha come unica soluzione λ1 = λ2 = · · · = λn = 0. I vettori v1 , v2 , . . . , vn si
dicono linearmente dipendenti se non sono linearmente indipendenti, cioè
se esistono degli scalari λ1 , λ2 , . . . , λn non tutti nulli tali che λ1 v1 + λ2 v2 +
· · · + λn vn = 0V .
Ricordiamo il seguente risultato:
Proposizione 1.6. Se v1 , v2 , . . . , vn sono linearmente indipendenti e se v
si può scrivere come loro combinazione lineare,
v = λ1 v 1 + λ 2 v 2 + · · · + λ n v n ,
1. Richiami di teoria
3
allora gli scalari λ1 , λ2 , . . . , λn sono determinati in modo unico.
Sia S un sottoinsieme dello spazio vettoriale V . Definiamo il sottospazio
vettoriale generato da S, indicato con L(S), come il più piccolo (per la relazione d’ordine data dall’inclusione) sottospazio vettoriale di V contenente
S (se S è vuoto poniamo L(S) = {0}). Dato che l’intersezione di una famiglia di sottospazi vettoriali di V è un sottospazio vettoriale, si verifica
immediatamente che si ha:
\
L(S) =
U,
S⊂U
cioè L(S) è l’intersezione di tutti i sottospazi vettoriali di V contenenti S.
Un’altra descrizione, ancora più esplicita, di L(S) è la seguente:
( n
)
X
L(S) =
λi vi | n ∈ N, λi ∈ C, vi ∈ S ,
i=1
cioè gli elementi di L(S) sono quei vettori di V che si possono esprimere
come combinazione lineare di un numero finito di elementi di S.
Se S = {v1 , v2 , . . . , vm }, il sottospazio vettoriale L(S) verrà spesso indicato con la notazione hv1 , v2 , . . . , vn i.
Dato che, come abbiamo già visto, nel contesto degli spazi vettoriali l’operazione di unione di due sottospazi non ha delle buone proprietà (l’unione
di due sottospazi vettoriali non è un sottospazio vettoriale), tale operazione
viene sostituita dall’operazione di somma:
Definizione 1.7. Se W1 e W2 sono sottospazi vettoriali di V , la somma
W1 + W2 è il sottospazio vettoriale L(W1 ∪ W2 ) generato da W1 ∪ W2 .
Da quanto detto prima si ha che
W1 + W2 = {λ1 w1 + λ2 w2 | λ1 , λ2 ∈ C, w1 ∈ W1 , w2 ∈ W2 }.
Definizione 1.8. La somma di due sottospazi vettoriali W1 e W2 di V si
dice diretta, e si indica con W1 ⊕ W2 , se si ha W1 ∩ W2 = 0.
Si verifica facilmente che se v ∈ W1 ⊕ W2 allora v si può scrivere in un
unico modo nella forma v = w1 + w2 , con w1 ∈ W1 e w2 ∈ W2 .
Definizione 1.9. Un insieme di vettori {v1 , v2 , . . . , vm } è detto un insieme
di generatori di V se L{v1 , v2 , . . . , vm } = V . In tal caso si dice anche che i
vettori v1 , v2 , . . . , vm generano V .
Definizione 1.10. Uno spazio vettoriale V è detto finitamente generato se
esiste un insieme finito di generatori di V .
La relazione fondamentale tra vettori linearmente indipendenti e insiemi
di generatori è contenuta nel risultato seguente:
Proposizione 1.11. Sia V uno spazio vettoriale. Sia {v1 , v2 , . . . , vm } un
insieme di generatori di V e {w1 , w2 , . . . , wr } un insieme di vettori linearmente indipendenti. Allora r ≤ m.
4
1. Spazi Vettoriali
Nel seguito considereremo solo spazi vettoriali finitamente generati, cioè
spazi vettoriali che ammettono un insieme finito di generatori. A tal proposito, ricordiamo il seguente risultato:
Proposizione 1.12. Ogni sottospazio vettoriale W di uno spazio vettoriale
finitamente generato V è finitamente generato.
Definizione 1.13. Una base di V è un insieme di vettori linearmente
indipendenti che generano V .
I risultati seguenti precisano le relazioni esistenti tra i concetti di vettori linearmente indipendenti, insiemi di generatori e basi di uno spazio
vettoriale V .
Proposizione 1.14. Sia {v1 , v2 , . . . , vr } un insieme di vettori linearmente indipendenti di un spazio vettoriale V (finitamente generato). Allora
esistono dei vettori vr+1 , . . . , vn tali che
{v1 , v2 , . . . , vr , vr+1 , . . . , vn }
sia una base di V .
Proposizione 1.15. Ogni spazio vettoriale V (finitamente generato) ha
una base.
Proposizione 1.16. Sia {v1 , v2 , . . . , vm } un insieme di generatori di V .
Allora esiste un sottoinsieme di {v1 , v2 , . . . , vm } che è una base di V .
Proposizione 1.17. Se {v1 , v2 , . . . , vn } e {w1 , w2 , . . . , wm } sono due basi
di V , allora m = n.
Dato che tutte le basi di uno spazio vettoriale hanno lo stesso numero di
elementi, tale numero dipende solo dallo spazio vettoriale. Possiamo quindi
dare la seguente definizione:
Definizione 1.18. La dimensione di uno spazio vettoriale V sul corpo C,
indicata con dimC V , o semplicemente con dim V , è il numero di elementi
di una base di V .
Proposizione 1.19. Se W è un sottospazio vettoriale di V , si ha dim W ≤
dim V .
Se si conosce la dimensione di uno spazio vettoriale V allora la verifica
che un certo insieme di vettori costituisce una base di V risulta semplificata.
Vale infatti il seguente risultato.
Proposizione 1.20. Sia V uno spazio vettoriale di dimensione n e siano
v1 , . . . , vn dei vettori di V .
(1) Se i vettori v1 , . . . , vn sono un sistema di generatori di V , allora
essi sono anche linearmente indipendenti, e quindi sono una base
di V .
(2) Se i vettori v1 , . . . , vn sono linearmente indipendenti, allora essi
sono anche un sistema di generatori di V , e quindi sono una base
di V .
2. Esercizi
5
Per terminare, la seguente formula mette in relazione le dimensioni di
due sottospazi vettoriali di V con le dimensioni della loro somma e della
loro intersezione:
Proposizione 1.21. Siano U e W due sottospazi vettoriali di uno spazio
vettoriale V . Allora si ha:
dim(U + W ) = dim U + dim W − dim(U ∩ W ).
2. Esercizi
2.1. Definizioni
Esercizio 1. Si dica se gli insiemi seguenti sono degli spazi vettoriali:
(1) L’insieme delle funzioni reali definite nell’intervallo [0, 1], continue,
positive o nulle, per le operazioni di addizione e di prodotto per un
numero reale.
(2) L’insieme delle funzioni reali f definite in R, tali che
lim f (x) = 0,
x→+∞
per le operazioni di addizione e di prodotto per un numero reale.
(3) L’insieme A = {x ∈ R | x > 0}, per le operazioni di somma e di
prodotto per uno scalare definite rispettivamente da
x ⊕ y = xy, ∀ x, y ∈ A
λ · x = xλ ,
∀ x ∈ A, λ ∈ R.
(4) L’insieme delle funzioni da R in R che si annullano in 1 oppure in
4.
(5) L’insieme dei polinomi di grado uguale a n (n intero positivo).
(6) L’insieme delle funzioni da R in R, di classe C 2 , tali che
f 00 + ω 2 f = 0,
con ω ∈ R.
(7) L’insieme delle funzioni reali f (x) definite nell’intervallo [0, 1], continue, tali che
Z 1
f (x) sin x dx = 0.
0
2.2. Basi
Esercizio 2. Sia V lo spazio vettoriale dei polinomi, a coefficienti reali nella
variabile x, di grado ≤ 3. Si verifichi che gli insiemi seguenti sono delle basi
di V :
(1) {1, x, x2 , x3 };
6
1. Spazi Vettoriali
(2) {1, 1 − x, x − x2 , x2 − x3 };
(3) {1, 1 + x, 1 + x + x2 , 1 + x + x2 + x3 }.
Esercizio 3. Nello spazio vettoriale V dei polinomi di grado ≤ 2 si considerino i polinomi
p1 (x) = x2 + x(1 − x) + (1 − x)2
p2 (x) = x2 + (1 − x)2
p3 (x) = x2 + 1 + (1 − x)2
p4 (x) = x(1 − x).
È possibile estrarre da {p1 (x), p2 (x), p3 (x), p4 (x)} delle basi di V ? In caso
affermativo, trovarle tutte.
Esercizio 4. Nello spazio vettoriale delle funzioni continue da R in R, si
considerino le funzioni f1 (x) = sin x, f2 (x) = sin 2x e f3 (x) = sin 3x. Si
dica se queste funzioni sono linearmente indipendenti.
Esercizio 5. Si dica se, nei casi seguenti, i vettori v1 , v2 e v3 costituiscono
una base di R3 . In caso negativo si descriva il sottospazio da essi generato.
(1) v1 = (1, 1, 1), v2 = (3, 0, −1), v3 = (−1, 1, −1);
(2) v1 = (1, 2, 3), v2 = (3, 0, −1), v3 = (1, 8, 13);
(3) v1 = (1, 2, −3), v2 = (1, 0, −1), v3 = (1, 10, −11).
Esercizio 6. In R4 i vettori seguenti formano:
(i ) un insieme libero (cioè un insieme di vettori linearmente indipendenti)?
In caso affermativo, completarlo per ottenere una base di R4 , altrimenti
determinare le relazioni di dipendenza lineare tra di loro ed estrarre da
questo insieme di vettori almeno un insieme libero.
(ii ) un insieme di generatori? In caso affermativo, estrarne almeno una base
di R4 , altrimenti determinare la dimensione del sottospazio da essi generato.
(1) v1
v4
(2) v1
(3) v1
v4
= (1, 1, 1, 1), v2 = (0, 1, 2, −1), v3 = (1, 0, −2, 3),
= (2, 1, 0, −1), v5 = (4, 3, 2, 1);
= (1, 2, 3, 4), v2 = (0, 1, 2, −1), v3 = (3, 4, 5, 16);
= (1, 2, 3, 4), v2 = (0, 1, 2, −1), v3 = (2, 1, 0, 11),
= (3, 4, 5, 14).
Esercizio 7. Si determini una base del sottospazio vettoriale V di R5 costituito dai vettori (x1 , . . . , x5 ) che sono soluzioni del seguente sistema di
equazioni lineari:


 x1 − 3x2 + x4 = 0
x2 + 3x3 − x5 = 0

 x + 2x + x − x = 0.
1
2
3
4
2. Esercizi
7
Esercizio 8. In R4 siano v1 = (1, 2, 3, 4) e v2 = (1, −2, 3, −4). È possibile
determinare due numeri reali x e y in modo tale che (x, 1, y, 1) ∈ L{v1 , v2 }?
(Ricordiamo che L{v1 , v2 } indica il sottospazio generato dai vettori v1 e v2 .)
Esercizio 9. Sia V uno spazio vettoriale. Si dica se le affermazioni seguenti
sono vere o false.
(1) Se i vettori v1 , v2 e v3 sono a due a due non proporzionali allora la
famiglia {v1 , v2 , v3 } è libera.
(2) Se nessuno fra i vettori v1 , . . . , vr è combinazione lineare dei vettori
rimanenti allora la famiglia {v1 , . . . , vr } è libera.
Esercizio 10. In R4 siano v1 = (0, 1, −2, 1), v2 = (1, 0, 2, −1), v3 =
(3, 2, 2, −1), v4 = (0, 0, 1, 0), v5 = (0, 0, 0, 1). Si dica se le affermazioni
seguenti sono vere o false.
(1) L{v1 , v2 , v3 } = L{(1, 1, 0, 0), (−1, 1, −4, 2)};
(2) (1, 1, 0, 0) ∈ L{v1 , v2 } ∩ L{v2 , v3 , v4 };
(3) dim(L{v1 , v2 } ∩ L{v2 , v3 , v4 }) = 1;
(4) L{v1 , v2 } + L{v2 , v3 , v4 } = R4 ;
(5) L{v1 , v2 , v3 } + L{v4 , v5 } = R4 .
Esercizio 11. Si studi la dipendenza o l’indipendenza lineare dei vettori seguenti, e si determini in ogni caso una base del sottospazio da essi
generato.
(1) (1, 0, 1), (0, 2, 2), (3, 7, 1), in R3 ;
(2) (1, 0, 0), (0, 1, 1), (1, 1, 1), in R3 ;
(3) (1, 2, 1, 2, 1), (2, 1, 2, 1, 2), (1, 0, 1, 1, 0), (0, 1, 0, 0, 1), in R5 .
Esercizio 12. Sia V lo spazio vettoriale dei polinomi in x, a coefficienti in
R, di grado ≤ n, con n intero positivo. Si dimostri che, per ogni a ∈ R,
l’insieme
{1, x − a, (x − a)2 , . . . , (x − a)n }
è una base di V . Sia poi f (x) ∈ V ; si esprima f (x) come combinazione
lineare dei precedenti polinomi. Chi sono i coefficienti di tale combinazione
lineare?
Esercizio 13. Siano Ut = L{u1 , u2 } e Vt = L{v1 , v2 } due sottospazi di R4 ,
con u1 = (1, t, 2t, 0), u2 = (t, t, t, t), v1 = (t − 2, −t, −3t, t) e v2 = (2, t, 2t, 0).
(1) Si dica se esiste t ∈ R tale che Ut + Vt = R4 .
(2) Per quali t ∈ R si ha dim(Ut ∩ Vt ) = 1?
(3) Si determini una base di U1 ∩ V1 e la si estenda ad una base di R4 .
Esercizio 14. In R4 si considerino i sottospazi U = L{v1 , v2 , v3 } e V =
L{v4 , v5 }, dove v1 = (1, 2, 3, 4), v2 = (2, 2, 2, 6), v3 = (0, 2, 4, 4), v4 =
(1, 0, −1, 2) e v5 = (2, 3, 0, 1). Si determinino delle basi dei sottospazi U ∩V ,
U, V e U + V .
8
1. Spazi Vettoriali
2.3. Sottospazi Vettoriali
Esercizio 15. Siano U e W due sottospazi vettoriali di uno spazio vettoriale
V . Dimostrare che U ∪W è un sottospazio vettoriale di V se e solo se U ⊂ W
oppure W ⊂ U .
Esercizio 16. Siano U , V e W tre sottospazi di uno stesso spazio vettoriale.
Si dica se è vero o falso che
U ∩ (V + W ) = (U ∩ V ) + (U ∩ W ).
Esercizio 17. Si dica se è diretta la somma dei due seguenti sottospazi di
R4 : U = L{(1, 0, 1, 0), (1, 2, 3, 4)} e V = L{(0, 1, 1, 1), (0, 0, 0, 1)}.
Esercizio 18. Si considerino i seguenti sottospazi di R4 :
U = L{(1, 0, 1, 0), (0, 1, 1, 1), (0, 0, 0, 1)}
e
V = L{(1, 0, 1, 0), (0, 1, 1, 0)}.
Si determini un sottospazio W ⊂ R4 tale che U = V ⊕ W , e si dica se tale
W è unico.
Esercizio 19. Dati i seguenti sottospazi di R4 ,
U = L{(1, 0, 1, 0), (0, 0, 0, 1)}
e
V = L{(1, 0, 2, 0), (0, 0, 1, 1)},
esiste un sottospazio W ⊂ R4 tale che U ⊕ W = V ⊕ W = R4 ?
In caso affermativo si determini W e si dica se è unico.
Esercizio 20. Nello spazio vettoriale V dei polinomi, nella variabile x a
coefficienti reali, di grado ≤ 5, si considerino i sottospazi seguenti:
U1 = {p(x) ∈ V | p(0) = 0},
U2 = {p(x) ∈ V | p0 (1) = 0},
U3 = {p(x) ∈ V | x2 + 1 divide p(x)},
U4 = {p(x) ∈ V | p(−x) = p(x), ∀x},
U5 = {p(x) ∈ V | p(x) = xp0 (x), ∀x}.
1) Si determinino delle basi dei seguenti sottospazi: U1 , U2 , U3 , U4 , U5 ,
U1 ∩ U2 , U1 ∩ U3 , U1 ∩ U2 ∩ U3 , U1 ∩ U2 ∩ U3 ∩ U4 .
2) Si determinino dei sottospazi W1 e W2 di V tali che W1 ⊕ U4 = W2 ⊕
(U1 ∩ U3 ) = V .
3. Soluzioni
9
3. Soluzioni
3.1. Definizioni
Svolgimento esercizio 1. Si tratta solo di verificare, caso per caso, se
tutte le condizioni necessarie alla definizione di uno spazio vettoriale sono
soddisfatte.
(1) In questo caso l’insieme in questione non è uno spazio vettoriale. In
effetti non è neppure un gruppo abeliano rispetto all’operazione di somma,
in quanto non contiene gli opposti dei suoi elementi: se f è una funzione
continua positiva o nulla, la funzione opposta −f sarà allora negativa o
nulla, e non apparterrà dunque all’insieme in questione.
(2) Si verifica facilmente che l’insieme in questione è uno spazio vettoriale,
ricordando che, se limx→+∞ f (x) e limx→+∞ g(x) esistono, allora
lim (f + g)(x) = lim f (x) + lim g(x)
x→+∞
x→+∞
x→+∞
e
lim (f g)(x) =
x→+∞
lim f (x)
x→+∞
lim g(x) .
x→+∞
(3) Anche in questo caso l’insieme in questione è uno spazio vettoriale.
Si consiglia di verificare con cura tutte le proprietà richieste. A titolo di
esempio, verifichiamo che, dati due elementi x, y ∈ A ed uno scalare λ ∈ R,
si ha
λ · (x ⊕ y) = (λ · x) ⊕ (λ · y).
In base alle definizioni date, si ha: λ·(x⊕y) = (xy)λ , mentre (λ·x)⊕(λ·y) =
xλ y λ . L’uguaglianza deriva allora dalle note proprietà delle potenze.
(4) L’insieme in questione non è uno spazio vettoriale, non essendo chiuso
rispetto all’operazione di somma: infatti, sia ad esempio f una funzione
tale che f (1) = 0 e f (4) = 1, e g una funzione tale che g(1) = 2 e g(4) =
0. Queste due funzioni appartengono all’insieme in questione, ma la loro
somma non appartiene all’insieme dato, in quanto non si annulla né in 1 né
in 4.
(5) Anche questo insieme non è uno spazio vettoriale, non essendo chiuso
rispetto all’operazione di somma: infatti, siano ad esempio p(x) = 2xn + 1 e
q(x) = −2xn + 3 due polinomi di grado n. La loro somma è p(x) + q(x) = 4
che non ha più grado n (almeno se n 6= 0).
Osservazione: è invece uno spazio vettoriale l’insieme dei polinomi di
grado minore o uguale a n.
(6) Questo insieme è uno spazio vettoriale (ciò è dovuto al fatto che l’equazione differenziale è lineare). Verifichiamo solo, a titolo di esempio, che esso
è chiuso rispetto all’operazione di somma: siano dunque f e g due funzioni
10
1. Spazi Vettoriali
che soddisfano l’equazione differenziale in questione. Si ha allora:
(f + g)00 + ω 2 (f + g) = f 00 + g 00 + ω 2 f + ω 2 g
= (f 00 + ω 2 f ) + (g 00 + ω 2 g) = 0 + 0 = 0.
(7) Anche questo insieme è uno spazio vettoriale (ciò è dovuto al fatto che
l’operazione di integrazione è lineare). Verifichiamo solo, a titolo di esempio,
che esso è chiuso rispetto all’operazione di somma: siano dunque f e g due
funzioni che soddisfano l’equazione integrale in questione. Si ha allora:
Z 1
Z 1
Z 1
(f + g)(x) sin x dx =
f (x) sin x dx +
g(x) sin x dx = 0 + 0 = 0.
0
0
0
3.2. Basi
Svolgimento esercizio 2. (1) Ogni polinomio f (x) ∈ V si scrive nella
forma
f (x) = a0 · 1 + a1 x + a2 x2 + a3 x3 ,
ciò significa che i polinomi 1, x, x2 , x3 sono un insieme di generatori di V .
Vediamo se sono anche linearmente indipendenti: se a0 · 1 + a1 x + a2 x2 +
a3 x3 = 0V (0V indica lo zero dello spazio vettoriale V , cioè il polinomio
nullo), allora, per il principio di identità dei polinomi, si deve avere a0 =
a1 = a2 = a3 = 0. Quindi {1, x, x2 , x3 } è una base di V , da cui si deduce,
tra l’altro che V ha dimensione 4.
(2) Anche in questo caso bisognerebbe dimostrare che i polinomi in questione sono un insieme di generatori e che sono linearmente indipendenti.
Tuttavia sapendo che dim V = 4, che è anche il numero dei polinomi della
ipotetica base, è sufficiente effettuare una sola delle due verifiche (perché?).
Verifichiamo allora, ad esempio, che questi sono un insieme di generatori, e
cioè che ogni polinomio f (x) = a0 + a1 x + a2 x2 + a3 x3 si può scrivere nella
forma λ0 · 1 + λ1 (1 − x) + λ2 (x − x2 ) + λ3 (x2 − x3 ). Sviluppando i calcoli ed
uguagliando i coefficienti delle successive potenze di x, si ottiene il sistema

λ 0 + λ 1 = a0



 λ 2 − λ 1 = a1
λ 3 − λ 2 = a2




− λ 3 = a3
che ha come soluzione

λ3



 λ2
λ1




λ0
= −a3
= −a2 − a3
= −a1 − a2 − a3
= a0 + a1 + a2 + a3
3. Soluzioni
11
Si conclude che i polinomi in questione sono un insieme di generatori, e
dunque, essendo nel numero giusto, sono una base di V .
(3) In base alle osservazioni fatte nel punto (2) è sufficiente dimostrare che
i polinomi in questione sono linearmente indipendenti (oppure che sono un
insieme di generatori): sia dunque
λ0 · 1 + λ1 (1 + x) + λ2 (1 + x + x2 ) + λ3 (1 + x + x2 + x3 ) = 0.
Sviluppando i calcoli ed uguagliando a zero i coefficienti, si ottiene il sistema

λ 0 + λ 1 + λ2 + λ3 = 0



 λ 1 + λ 2 + λ3 = 0
λ2 + λ3 = 0




λ3 = 0
che ha come unica soluzione λ0 = λ1 = λ2 = λ3 = 0. Si conclude cosı̀ che i
polinomi in questione sono linearmente indipendenti, e dunque, essendo nel
numero giusto, sono una base di V .
Svolgimento esercizio 3. Lo spazio vettoriale V dei polinomi di grado ≤ 2
ha dimensione 3. Infatti una sua base è costituita dai tre polinomi {1, x, x2 }
(ogni polinomio di grado ≤ 2 si scrive, in modo unico, come combinazione
lineare a0 1 + a1 x + a2 x2 di questi tre polinomi).
Con un semplice calcolo si verifica che p3 (x) = 2p1 (x), quindi, se da quei
quattro polinomi si può estrarre una base, tale base deve essere data da
{p1 (x), p2 (x), p4 (x)} (o, equivalentemente, da {p2 (x), p3 (x), p4 (x)}). Tuttavia si verifica che p4 (x) = p2 (x) − p1 (x), quindi i polinomi p1 (x), p2 (x) e
p4 (x) sono linearmente dipendenti e non costituiscono pertanto una base di
V . In conclusione, dai quattro polinomi dati non è possibile estrarre una
base di V .
Svolgimento esercizio 4. Consideriamo una combinazione lineare a1 f1 +
a2 f2 + a3 f3 delle funzioni f1 , f2 e f3 . Supponiamo che tale combinazione
lineare sia nulla (cioè sia la funzione nulla). Si ha dunque:
a1 sin x + a2 sin 2x + a3 sin 3x = 0,
∀x ∈ R.
Dato che l’espressione precedente deve essere nulla per ogni valore di x,
attribuendo ad x dei valori particolari otteniamo (ad esempio):
a1 − a3 = 0,
√
√
3
3
x = π/3 :
a1 +
a2 = 0,
2 √
√2
2
2
a1 + a2 +
a3 = 0.
x = π/4 :
2
2
L’unica soluzione di tali equazioni è: a1 = a2 = a3 = 0. Ciò dimostra che le
tre funzioni date sono linearmente indipendenti.
x = π/2 :
12
1. Spazi Vettoriali
Svolgimento esercizio 5. Eseguiamo, a titolo di esempio, la verifica solo
nel caso (1). Dato che i vettori sono tre, e cioè il numero giusto per poter
essere una base di R3 , basterà solo controllare se sono linearmente indipendenti (oppure se sono un insieme di generatori). Posto λ1 v1 +λ2 v2 +λ3 v3 = 0,
si ottiene il sistema


 λ1 + 3λ2 − λ3 = 0
λ1 + λ 3 = 0

λ − λ − λ = 0
1
2
3
che, risolto, fornisce λ1 = λ2 = λ3 = 0. Ciò dimostra che questi tre vettori
sono linearmente indipendenti e, di conseguenza, sono una base di R3 .
Svolgimento esercizio 6. (1) I cinque vettori dati sono sicuramenti linearmente dipendenti, dato che il numero massimo di vettori linearmente
indipendenti in R4 (che coincide con la dimensione dello spazio vettoriale) è
4. Infatti si vede immediatamente che v5 = 2v1 + v4 . Si verifica inoltre, con
un facile calcolo, che i vettori v1 , v2 , v3 e v4 sono linearmente indipendenti,
e quindi costituiscono una base di R4 .
(2) I tre vettori dati sicuramente non sono dei generatori di R4 (che ha dimensione 4). Si verifica comunque che essi sono linearmente indipendenti.
Se introduciamo un quarto vettore v4 = (0, 0, 1, 0) (ad esempio), si verifica facilmente che v1 , v2 , v3 e v4 sono linearmente indipendenti, e quindi
costituiscono una base di R4 .
(3) Si verifica che i quattro vettori dati sono linearmente dipendenti, infatti
v4 = v1 + v2 + v3 . Pertanto essi non costituiscono una base di R4 . Si scopre
poi che anche v1 è combinazione lineare di v2 e v3 , si ha infatti v1 = 23 v2 + 12 v3 .
In conclusione i vettori v1 e v4 appartengono al sottospazio generato da v2
e v3 . Infine si verifica facilmente che v2 e v3 sono linearmente indipendenti.
In conclusione, i quattro vettori dati generano un sottospazio di dimensione
2 di R4 , una cui base è data, ad esempio, dai vettori v2 e v3 . Per ottenere
una base di R4 si possono considerare i vettori v2 , v3 , (0, 0, 1, 0) e (0, 0, 0, 1),
che sono, come si verifica facilmente, linearmente indipendenti.
Svolgimento esercizio 7. Risolvendo il sistema si ottiene (ad esempio
esplicitando x1 , x4 e x5 in funzione di x2 e x3 ):

1
1


x
=
x
−
x3

1
2

2
2

x5 = x2 + 3x3



5
1

 x4 = x2 + x3
2
2
Tale sistema ha dunque infinite soluzioni, dipendenti da due parametri. In
altre parole, lo spazio V delle soluzioni ha dimensione 2. Per trovare una base di V è allora sufficiente trovare due vettori, linearmente indipendenti, che
3. Soluzioni
13
siano soluzioni del sistema precedente. Tali vettori si trovano semplicemente attribuendo dei valori “qualunque” alle variabili libere x2 e x3 (facendo
attenzione a che i vettori trovati siano linearmente indipendenti!). In pratica sarà sufficiente attribuire alle variabili libere alternativamente i valori 0
e 1; saremo cosı̀ sicuri di ottenere dei vettori linearmente indipendenti (perché?). Ponendo dunque x2 = 1 e x3 = 0, si ottiene il vettore ( 12 , 1, 0, 52 , 1),
mentre per x2 = 0 e x3 = 1 si ha (− 12 , 0, 1, 12 , 3). Questi due vettori sono
una base di V .
Svolgimento esercizio 8. Il vettore (x, 1, y, 1) appartiene al sottospazio
generato da v1 e v2 se e solo se esso si può esprimere come combinazione
lineare di v1 e v2 :
(x, 1, y, 1) = λ1 v1 + λ2 v2 .
La seconda e la quarta equazione del sistema ottenuto sono, rispettivamente:
2λ1 − 2λ2 = 1 e 4λ1 − 4λ2 = 1, che non hanno soluzioni comuni. Di
conseguenza (x, 1, y, 1) 6∈ L{v1 , v2 }.
Svolgimento esercizio 9. (1) L’affermazione è falsa. Per dimostrarne la
falsità basta fornire un controesempio: sia V = R2 , v1 = (1, 0), v2 = (0, 1),
v3 = (1, 1). È evidente che tali vettori sono a due a due non proporzionali,
ma non possono essere linearmente indipendenti, dato che la dimensione di
R2 è 2.
(2) L’affermazione in questione è vera. Infatti se fosse falsa, cioè se i vettori
v1 , . . . , vr fossero linearmente dipendenti, si avrebbe
λ1 v1 + λ2 v2 + · · · + λr vr = 0,
con i coefficienti λi non tutti nulli. Supponiamo allora che λj 6= 0. Si ha
dunque
1 X
vj = −
λi v i ,
λj i6=j
e quindi il vettore vj sarebbe combinazione lineare dei rimanenti, contro
l’ipotesi.
Svolgimento esercizio 10. Per semplicità di notazione poniamo u1 =
(1, 1, 0, 0) e u2 = (−1, 1, −4, 2).
(1) Si ha: v1 = 21 (u1 + u2 ), v2 = 12 (u1 − u2 ), v3 = 12 (5u1 − u2 ), quindi
L{v1 , v2 , v3 } ⊂ L{u1 , u2 }. Viceversa, si ha anche: u1 = v1 +v2 e u2 = v1 −v2 ,
quindi L{u1 , u2 } ⊂ L{v1 , v2 , v3 }. Quindi si conclude che L{v1 , v2 , v3 } =
L{u1 , u2 }.
(2) Abbiamo visto al punto (1) che u1 ∈ L{v1 , v2 }. Dato che u1 = 12 (v3 −v2 ),
si ha anche u1 ∈ L{v2 , v3 , v4 }, e quindi u1 ∈ L{v1 , v2 } ∩ L{v2 , v3 , v4 }.
(3) Dato che v2 ∈ L{v1 , v2 } ∩ L{v2 , v3 , v4 }, si ha
dim(L{v1 , v2 } ∩ L{v2 , v3 , v4 }) ≥ 1.
14
1. Spazi Vettoriali
Ma abbiamo visto al punto (1) che anche u1 ∈ L{v1 , v2 } ∩ L{v2 , v3 , v4 }, e i
vettori u1 e v2 sono linearmente indipendenti, quindi
dim(L{v1 , v2 } ∩ L{v2 , v3 , v4 }) ≥ 2.
D’altra parte L{v1 , v2 } ∩ L{v2 , v3 , v4 } ⊂ L{v1 , v2 }, quindi
dim(L{v1 , v2 } ∩ L{v2 , v3 , v4 }) ≤ 2.
Si conclude quindi che dim(L{v1 , v2 } ∩ L{v2 , v3 , v4 }) = 2.
(4) L{v1 , v2 }+L{v2 , v3 , v4 } = R4 se e solo se {v1 , v2 , v3 , v4 } è una base di R4 .
Si ha però v3 = 2v1 + 3v2 , quindi i vettori v1 , v2 , v3 , v4 non sono linearmente
indipendenti.
(5) L{v1 , v2 , v3 } + L{v4 , v5 } = R4 se e solo se i vettori v1 , v2 , v3 , v4 e v5
generano R4 . Si verifica facilmente che i vettori v1 , v2 , v4 , v5 sono linearmente indipendenti e quindi sono una base di R4 . A maggior ragione quindi
i vettori v1 , v2 , v3 , v4 e v5 generano tutto R4 .
Svolgimento esercizio 11. (1) Si verifica facilmente che i tre vettori dati
sono linearmente indipendenti, e quindi sono una base di R3 .
(2) Dato che il terzo vettore è la somma dei due precedenti, i tre vettori
dati non sono una base di R3 . Una base del sottospazio da essi generato è
costituita da due qualunque vettori scelti tra i tre dati.
(3) I primi tre vettori sono linearmente indipendenti, mentre il quarto è
combinazione lineare dei primi tre. Il sottospazio da essi generato ha pertanto dimensione tre, ed una sua base è data, ad esempio, dai primi tre
vettori.
Svolgimento esercizio 12. Lo spazio vettoriale V ha dimensione n+1 (una
sua base è {1, x, x2 , . . . , xn }). Per dimostrare che {1, x−a, (x−a)2 , . . . , (x−
a)n } è una base di V è allora sufficiente dimostrare che tali polinomi sono
linearmente indipendenti. Sia
λ0 · 1 + λ1 (x − a) + λ2 (x − a)2 + · · · + λn (x − a)n = 0.
Osserviamo che nell’espressione precedente il termine di grado massimo è
λn xn , da cui si deduce che λn = 0. Si ottiene allora
λ0 · 1 + λ1 (x − a) + λ2 (x − a)2 + · · · + λn−1 (x − a)n−1 = 0.
In questa espressione il termine di grado massimo è λn−1 xn−1 , da cui si
deduce che λn−1 = 0.
Continuando in questo modo si dimostra che tutti i coefficienti λi sono
nulli, e quindi i vettori in questione sono linearmente indipendenti, e sono
dunque una base di V .
Sia ora f (x) ∈ V e poniamo
f (x) = λ0 + λ1 (x − a) + λ2 (x − a)2 + · · · + λn (x − a)n .
3. Soluzioni
15
Valutando l’espressione precedente per x = a, si ottiene f (a) = λ0 . Per
determinare poi λ1 è sufficiente derivare tale espressione, ottenendo
f 0 (x) = λ1 + 2λ2 (x − a) + 3λ3 (x − a)2 + · · · + nλn (x − a)n−1 ,
e poi valutarla per x = a, ottenendo λ1 = f 0 (a). Derivando ancora una
volta, e valutando sempre per x = a, si ottiene λ2 = f 00 (a)/2. Continuando
in questo modo si dimostra che λi = f (i) (a)/i!, per 0 ≤ i ≤ n. In conclusione
si è dimostrato che, rispetto alla base {1, x − a, (x − a)2 , . . . , (x − a)n }, ogni
polinomio di grado ≤ n si può scrivere nella forma
f (x) =
n
X
f (i) (a)
i=0
i!
(x − a)i .
Questa non è altro che la formula di Taylor!.
Svolgimento esercizio 13. (1) Innanzitutto si ha
Ut + Vt = L{u1 , u2 , v1 , v2 }.
Notiamo che u2 − 2u1 = v1 , ciò prova che i vettori u1 , u2 , v1 , v2 sono linearmente dipendenti, quindi non sono una base di R4 . Di conseguenza Ut + Vt
non è mai uguale a R4 .
(2) Per quanto visto nel punto (1), si ha v1 ∈ Ut ∩ Vt , per ogni t. Di
conseguenza è dim(Ut ∩ Vt ) ≥ 1, per ogni t. Tuttavia si ha anche dim(Ut ∩
Vt ) ≤ 2, dato che Ut e Vt hanno al più dimensione 2, inoltre dim(Ut ∩Vt ) = 2
se e solo se Ut = Vt e dim Ut = 2. Cerchiamo dunque per quali valori di
t è Ut = Vt . Dato che v1 ∈ Ut ∩ Vt , per ogni t, basta vedere per quali
valori di t si può scrivere v2 come combinazione lineare dei vettori u1 e u2 :
v2 = λ1 u1 + λ2 u2 . Si ottiene cosı̀ il sistema

λ1 + tλ2 = 2



 tλ1 + tλ2 = t
2tλ1 + tλ2 = 2t




tλ2 = 0
che ha soluzione se e solo se t = 0. Quindi, per t = 0, si ha Ut = Vt , solo
che ora è dim Ut = dim Vt = 1, e quindi anche in questo caso la dimensione
di Ut ∩ Vt è 1. In conclusione, dim(Ut ∩ Vt ) = 1 per ogni t ∈ R.
(3) Per quanto visto nei punti precedenti, v1 è una base di Ut ∩ Vt , per ogni
t. Ponendo t = 1 si ottiene dunque v1 = (−1, −1, −3, 1). Per completare
questa base ad una base di R4 è sufficiente trovare altri tre vettori w1 , w2
e w3 in modo che v1 , w1 , w2 , w3 siano linearmente indipendenti. Si verifica
facilmente che w1 = (1, 0, 0, 0), w2 = (0, 1, 0, 0) e w3 = (0, 0, 1, 0) vanno
bene.
16
1. Spazi Vettoriali
Svolgimento esercizio 14. Un vettore w ∈ U ∩ V si può scrivere nella
forma seguente:
w = λ1 v 1 + λ 2 v 2 + λ3 v 3 = λ 4 v 4 + λ5 v 5 .
Risolvendo il sistema cosı̀ ottenuto si trova che:

λ1 = 2λ4




1


 λ2 = − λ4
2
3

 λ 3 = λ4



2


λ5 = 0.
Pertanto lo spazio vettoriale U ∩ V ha dimensione 1 ed una sua base è data
dal vettore w che si ottiene ponendo, ad esempio, λ4 = 2, nella soluzione
precedentemente trovata: w = 4v1 − v2 − 3v3 = (2, 0, −2, −2).
Una base di U è data dai vettori v1 , v2 e v3 , dato che essi sono linearmente
indipendenti (la verifica è immediata).
Anche i vettori v4 e v5 sono linearmente indipendenti, quindi sono una
base di V .
Infine, si vede facilmente che i vettori v1 , v2 , v3 e v5 sono linearmente
indipendenti (mentre v4 è combinazione lineare di v1 , v2 e v3 ). Pertanto lo spazio vettoriale U + V coincide con R4 e una sua base è data da
{v1 , v2 , v3 , v5 } (oppure si prenda la base canonica di R4 ).
3.3. Sottospazi Vettoriali
Svolgimento esercizio 15. Se U ⊂ W (risp. W ⊂ U ) allora U ∪ W = W
(risp. U ∪ W = U ) ed è dunque un sottospazio vettoriale.
Viceversa, supponiamo che U ∪ W sia un sottospazio vettoriale, ma U 6⊂
W e W 6⊂ U . Ciò significa che esiste un vettore u ∈ U con u 6∈ W ed
un vettore w ∈ W con w 6∈ U . Dato che u, w ∈ U ∪ W , e questo è uno
spazio vettoriale, si deve avere u + w ∈ U ∪ W , e dunque u + w ∈ U
oppure u + w ∈ W . Se u + w ∈ U , si ha u + w = u0 ∈ U e dunque
w = u0 − u ∈ U , contro l’ipotesi che w 6∈ U . Analogamente se fosse
u + w ∈ W si concluderebbe che u ∈ W , contro l’ipotesi. Da questa
conclusione assurda si deduce allora che l’ipotesi è falsa, ossia che U ∪ W
non può essere un sottospazio vettoriale se U 6⊂ W e W 6⊂ U .
Svolgimento esercizio 16. Tale uguaglianza è falsa. Per provarlo basta
fornire un controesempio: in R2 si considerino i sottospazi U = L{(1, 1)},
V = L{(1, 0)} e W = L{(0, 1)}. Si ha allora U ∩ (V + W ) = U ∩ R2 = U ,
mentre (U ∩ V ) + (U ∩ W ) = {0} + {0} = {0}.
3. Soluzioni
17
Svolgimento esercizio 17. Dire che la somma di due sottospazi vettoriali
è diretta equivale a dire che la loro intersezione è nulla (cioè ridotta al
vettore nullo). Un vettore appartiene all’intersezione di U di V se e solo se
si può scrivere nel modo seguente:
w = λ1 (1, 0, 1, 0) + λ2 (1, 2, 3, 4) = µ1 (0, 1, 1, 1) + µ2 (0, 0, 0, 1).
Risolvendo il sistema cosı̀ ottenuto si scopre che, ad esempio, il vettore
w = (−1, 1, 2, 2) appartiene a U ∩ V . Da ciò si deduce che la somma di U
e V non è diretta.
Svolgimento esercizio 18. Poniamo u1 = (1, 0, 1, 0), u2 = (0, 1, 1, 1), u3 =
(0, 0, 0, 1), v = (0, 1, 1, 0), in modo che U = L{u1 , u2 , u3 } e V = L{u1 , v}. I
vettori u1 , u2 e u3 sono linearmente indipendenti, quindi dim U = 3. Anche
u1 e v sono linearmente indipendenti, quindi dim V = 2. Inoltre v = u2 −u3 ,
quindi V ⊂ U .
Per ragioni di dimensione un sottospazio W tale che V ⊕ W = U deve
avere dimensione 1, sia quindi w una sua base. Il vettore w deve soddisfare
le seguenti condizioni: (i) w 6∈ V , e (ii) u1 , v e w devono generare U . Si vede
allora facilmente che w = u3 soddisfa le condizioni richieste. Altrettanto
facilmente si vede che anche la scelta w = u2 soddisfa le condizioni richieste;
si deduce pertanto che il sottospazio W richiesto esiste ma non è unico.
Svolgimento esercizio 19. Poniamo u1 = (1, 0, 1, 0), u2 = (0, 0, 0, 1), v1 =
(1, 0, 2, 0), v2 = (0, 0, 1, 1). I sottospazi U e V hanno entrambi dimensione
2 (la verifica è immediata), pertanto un sottospazio W con le proprietà
richieste, se esiste, deve avere dimensione 2: poniamo allora W = L{w1 , w2 }.
Il problema si riduce allora a determinare due vettori w1 e w2 tali che
{u1 , u2 , w1 , w2 } e {v1 , v2 , w1 , w2 } siano entrambe delle basi di R4 . Si scopre
facilmente che i vettori w1 = (1, 0, 0, 0) e w2 = (0, 1, 0, 0) soddisfano le
proprietà richieste, quindi un tale sottospazio W esiste. Tuttavia anche la
scelta w1 = (1, 0, 0, 0) e w2 = (0, 1, 1, 0) fornisce un sottospazio W (diverso
dal precedente) che soddisfa le condizioni richieste. Si conclude quindi che,
come nell’esercizio precedente, tale sottospazio W non è unico.
Svolgimento esercizio 20. (1) Ogni polinomio di grado ≤ 5 si scrive in
modo unico come segue:
p(x) = a0 + a1 x + a2 x2 + a3 x3 + a4 x4 + a5 x5 .
Da ciò si deduce che lo spazio vettoriale V ha dimensione 6, ed una sua base
è data dai polinomi 1, x, x2 , x3 , x4 , x5 .
La condizione p(0) = 0 equivale a a0 = 0. Il sottospazio U1 è quindi
costituito dai polinomi della forma
p(x) = a1 x + a2 x2 + a3 x3 + a4 x4 + a5 x5 .
Si deduce che U1 ha dimensione 5 ed una sua base è {x, x2 , x3 , x4 , x5 }.
18
1. Spazi Vettoriali
La condizione p0 (1) = 0 equivale a a1 = −2a2 − 3a3 − 4a4 − 5a5 . Il
sottospazio U2 è quindi costituito dai polinomi della forma
p(x) = a0 + (−2a2 − 3a3 − 4a4 − 5a5 )x + a2 x2 + a3 x3 + a4 x4 + a5 x5 .
Si deduce che U2 ha dimensione 5 ed una sua base è {1, x2 −2x, x3 −3x, x4 −
4x, x5 − 5x}.
La condizione che p(x) sia divisibile per x2 + 1 equivale a dire che p(x)
si scrive come segue:
p(x) = (x2 + 1)(b0 + b1 x + b2 x2 + b3 x3 ).
Si deduce che U3 ha dimensione 4 ed una sua base è {(x2 +1), (x2 +1)x, (x2 +
1)x2 , (x2 + 1)x3 }.
La condizione p(−x) = p(x) equivale a a1 = a3 = a5 = 0. Il sottospazio
U4 è quindi costituito dai polinomi della forma
p(x) = a0 + a2 x2 + a4 x4 .
Si deduce che U4 ha dimensione 3 ed una sua base è {1, x2 , x4 }.
La condizione p(x) = xp0 (x) equivale a a0 = a2 = a3 = a4 = a5 = 0. Il
sottospazio U5 è quindi costituito dai polinomi della forma
p(x) = a1 x.
Si deduce che U5 ha dimensione 1 ed una sua base è {x}.
I polinomi in U1 ∩ U2 devono soddisfare contemporaneamente le condizioni a0 = 0 e a1 = −2a2 − 3a3 − 4a4 − 5a5 . Il sottospazio U1 ∩ U2 è quindi
costituito dai polinomi della forma
p(x) = (−2a2 − 3a3 − 4a4 − 5a5 )x + a2 x2 + a3 x3 + a4 x4 + a5 x5 .
Si deduce che U1 ∩ U2 ha dimensione 4 ed una sua base è {x2 − 2x, x3 −
3x, x4 − 4x, x5 − 5x}.
U1 ∩ U3 è costituito dai polinomi della forma
p(x) = (x2 + 1)(b0 + b1 x + b2 x2 + b3 x3 ),
tali che p(0) = 0, che equivale a b0 = 0. Si deduce che U1 ∩U3 ha dimensione
3 ed una sua base è {(x2 + 1)x, (x2 + 1)x2 , (x2 + 1)x3 }.
Imponendo ai polinomi in U1 ∩U3 di soddisfare alla condizione che definisce U2 , si scopre che deve essere b1 = 23 b2 −2b3 . Il sottospazio U1 ∩U2 ∩U3 ha
quindi dimensione 2 ed una sua base è {(x2 +1)(2x2 −3x), (x2 +1)(x3 −2x)}.
Per terminare, si vede ora facilmente che U1 ∩ U2 ∩ U3 ∩ U4 = 0.
(2) Ricordando che la base di U4 trovata precedentemente è {1, x2 , x4 },
si deduce che un sottospazio W1 che soddisfa le condizioni richieste è, ad
esempio, W1 = L{x, x3 , x5 }.
Analogamente, osservando che il sottospazio U1 ∩ U3 ha dimensione 3 e
non contiene polinomi di grado ≤ 2, si deduce che il sottospazio W2 generato
dai polinomi 1, x e x2 soddisfa le condizioni richieste.
Capitolo 2
Applicazioni Lineari e Matrici
1. Richiami di teoria
1.1. Applicazioni lineari
Siano V e W due spazi vettoriali sul corpo C.
Definizione 1.1. Una funzione f : V → W è detta lineare se
f (v1 + v2 ) = f (v1 ) + f (v2 )
e
f (λv) = λf (v),
per ogni v, v1 , v2 ∈ V e per ogni λ ∈ C.
Osservazione 1.2. Nella letteratura matematica si incontra spesso la seguente terminologia. Una funzione lineare f : V → W è anche detta un
omomorfismo. Se f è iniettiva è chiamata monomorfismo, se è suriettiva
è chiamata epimorfismo, mentre se è biiettiva è detta isomorfismo. Una
funzione lineare f : V → V è chiamata endomorfismo. Se essa è biiettiva è
detta automorfismo.
Le due proprietà che caratterizzano un’applicazione lineare si possono
riunire nella seguente uguaglianza:
f (λ1 v1 + λ2 v2 ) = λ1 f (v1 ) + λ2 f (v2 ),
per ogni v1 , v2 ∈ V e per ogni λ1 , λ2 ∈ C.
Fissiamo ora una base {v1 , . . . , vn } di V e una base {w1 , . . . , wm } di W .
Se v ∈ V si scrive come
v = λ1 v 1 + · · · + λn v n ,
dalla linearità di f segue che
f (v) = λ1 f (v1 ) + · · · + λn f (vn ).
Quindi per conoscere f (v), per ogni v ∈ V , è sufficiente conoscere le immagini dei vettori di base, f (vj ), per j = 1, . . . , n.
20
2. Applicazioni Lineari e Matrici
D’altra parte f (vj ) ∈ W , quindi si può scrivere
f (vj ) = a1j w1 + a2j w2 + · · · + amj wm =
m
X
aij wi .
i=1
Si conclude quindi che la funzione f è unicamente determinata dai coefficienti aij ∈ C, per i = 1, . . . , m, j = 1, . . . , n.
Definizione 1.3. La matrice A dell’applicazione lineare f : V → W , rispetto alle basi di V e W fissate, è l’insieme dei coefficienti aij , organizzati
in uno schema rettangolare come segue:


a11 a12 · · · a1n
 a21 a22 · · · a2n 
A=
.
..
.. 
..
 ...
.
.
. 
am1 am2 · · · amn
Osservazione 1.4. Si noti che la matrice di una applicazione lineare f :
V → W è definita solo quando sono state fissate delle basi degli spazi vettoriali V e W , e che tale matrice dipende dalla scelta delle basi. Una stessa
applicazione lineare f avrà in generale matrici diverse rispetto a basi diverse
per gli stessi spazi vettoriali (vedremo in seguito quali relazioni esistono tra
matrici diverse che rappresentano la stessa applicazione lineare rispetto a
basi diverse).
1.2. Matrici
Richiamiamo ora le definizioni e i principali risultati della teoria delle matrici
che ci serviranno in seguito.
Definizione 1.5. Una matrice A, a coefficienti nel campo C, è uno schema
rettangolare di numeri aij ∈ C, organizzati come segue:


a11 a12 · · · a1n
 a21 a22 · · · a2n 
A=
.
..
.. 
..
 ...
.
.
. 
am1 am2 · · · amn
Sia MC (m, n) l’insieme delle matrici con m righe e n colonne a coefficienti
in C. In questo insieme si definisce un’operazione di somma come segue:
se A = (aij ) e B = (bij ) sono due matrici in MC (m, n), la loro somma
C = A + B è la matrice C = (cij ) i cui coefficienti sono
cij = aij + bij .
Si definisce anche il prodotto di una matrice A = (aij ) ∈ MC (m, n) per
uno scalare λ ∈ C come segue:
λA = (λaij ).
1. Richiami di teoria
21
Si verifica senza difficoltà che l’insieme MC (m, n), con le operazioni di somma e prodotto per uno scalare appena introdotte, è uno spazio vettoriale su
C di dimensione mn. Una sua base naturale è costituita dalle matrici Eij i
cui elementi sono tutti nulli, tranne l’elemento di posto ij che è uguale a 1.
Sia ora A ∈ MC (m, n) e B ∈ MC (n, r) (cioè il numero di colonne di A è
uguale al numero di righe di B. Si definisce il prodotto (righe per colonne)
delle matrici A e B come segue: C = AB è la matrice C = (cij ) ∈ MC (m, r)
i cui elementi sono dati dalla seguente espressione:
cij =
n
X
ail blj .
l=1
Si noti che il prodotto fra due matrici A e B non è sempre definito, bisogna
infatti che il numero di colonne di A sia uguale al numero di righe di B. In
particolare può essere definito il prodotto AB ma non il prodotto BA.
Proposizione 1.6. Il prodotto di matrici gode delle seguenti proprietà:
(1) Siano A, B ∈ MC (m, n) e C ∈ MC (n, r). Allora
(A + B)C = AC + BC;
(2) Siano A ∈ MC (m, n) e B, C ∈ MC (n, r). Allora
A(B + C) = AB + AC;
(3) Siano A ∈ MC (m, n), B ∈ MC (n, r) e C ∈ MC (r, s). Allora
A(BC) = (AB)C;
(4) Siano A, B ∈ MC (n, n). Allora in generale sarà
AB 6= BA;
(5) Esiste una matrice I ∈ MC (n, n) tale che
AI = I A = A
per ogni A ∈ MC (n, n). Tale matrice è


1 0 ··· 0
0 1 · · · 0

I=
 ... ... . . . ... 
0 0 ··· 1
ed è l’elemento neutro per il prodotto di matrici.
Osservazione 1.7. Il prodotto di matrici appena definito presenta delle
peculiarità che lo rendono molto diverso dal solito prodotto tra numeri:
non è sempre definito; non è commutativo, cioè AB 6= BA in generale; è
possibile che AB = 0 con A 6= 0 e B 6= 0 (esistono divisori dello zero); è
possibile che An = 0 con A 6= 0 (esistono elementi nilpotenti). Particolare
22
2. Applicazioni Lineari e Matrici
cura va quindi esercitata nella manipolazione di prodotti di matrici. Diamo
solo un esempio:
(A + B)2 = (A + B)(A + B) = A2 + AB + BA + B 2 6= A2 + 2AB + B 2 .
Definizione 1.8. Sia A una matrice quadrata di ordine n. Si chiama inversa
di A, e si indica con A−1 , una matrice tale che AA−1 = A−1 A = I. Una
matrice A è detta invertibile se esiste la sua matrice inversa.
Se la matrice inversa di A esiste, è facile vedere che essa è unica. Tuttavia non tutte le matrici sono invertibili. Vedremo in seguito quali sono le
condizioni che assicurano che una matrice sia invertibile.
Definizione 1.9. Sia A = (aij ) ∈ MC (m, n) una matrice. La matrice
trasposta di A, indicata con AT , è la matrice in cui si sono scambiate tra
loro le righe con le colonne di A, cioè AT = (aji ) ∈ MC (n, m).
Definizione 1.10. Sia A una matrice quadrata di ordine n. La traccia di
A, indicata con tr(A), è la somma degli elementi sulla diagonale principale
di A,
n
X
tr(A) =
aii .
i=1
Le seguenti proprietà della traccia si verificano immediatamente:
Proposizione 1.11. Siano A e B matrici quadrate di ordine n. Si ha:
(1) tr(A) = tr(AT );
(2) tr(A + B) = tr(A) + tr(B);
(3) tr(AB) = tr(BA).
Ritorniamo ora a parlare delle applicazioni lineari tra spazi vettoriali.
Consideriamo un’applicazione lineare f : V → W e indichiamo con A la
sua matrice rispetto alle basi {v1 , . . . , vn } di V e {w1 , . . . , wm } di W . Sia
v ∈ V e scriviamo
v = x1 v1 + · · · + xn vn .
Il vettore v è unicamente determinato dai coefficienti x1 , . . . , xn . Questi
coefficienti sono detti le componenti di v rispetto alla base fissata. In questo
modo è possibile identificare il vettore v ∈ V con il vettore (x1 , . . . , xn ) ∈ C n
(ovviamente questa identificazione dipende dalla scelta della base di V ).
Allo stesso modo possiamo scrivere il vettore f (v) ∈ W come combinazione
lineare dei vettori della base di W fissata:
f (v) = y1 w1 + · · · + ym wm ,
e identificare quindi il vettore f (v) ∈ W con il vettore (y1 , . . . , ym ) ∈ C m
(anche questa identificazione dipende dalla scelta della base di W ).
Si dimostra ora facilmente il seguente risultato:
1. Richiami di teoria
23
Teorema 1.12. Con le notazioni precedenti, si ha:
 
 
y1
x1
 y2 
x 
 .  = A  .2  ,
 .. 
 .. 
ym
xn
dove il prodotto è il prodotto righe per colonne.
1.3. Nucleo e immagine
Definizione 1.13. Sia f : V → W un’applicazione lineare. Il nucleo di f ,
indicato con Ker f è definito come segue:
Ker f = {v ∈ V | f (v) = 0}.
Si verifica facilmente che il nucleo di f è un sottospazio vettoriale di V
e che f è iniettiva se e solo se Ker f = {0}.
Definizione 1.14. Sia f : V → W un’applicazione lineare. L’immagine di
f , indicata con Im f è definita come segue:
Im f = {w ∈ W | w = f (v), per qualche v ∈ V }.
Si verifica facilmente che l’immagine di f è un sottospazio vettoriale di
W . Ovviamente la funzione f è suriettiva se e solo se Im f = W .
Il nucleo di f e l’immagine di f sono quindi sottospazi di due spazi
vettoriali diversi. Tuttavia le loro dimensioni sono legate dalla seguente
relazione.
Teorema 1.15. Sia f : V → W un’applicazione lineare. Si ha:
dim(Ker f ) + dim(Im f ) = dim V.
La dimensione del nucleo di f è anche nota con il nome di nullità di
f , mentre la dimensione dell’immagine di f è detta rango di f . Se A è la
matrice di f rispetto a delle basi fissate di V e di W si parla anche di nullità
e rango di A per indicare la nullità e il rango di f .
La nullità di una matrice A è quindi la dimensione dello spazio delle
soluzioni del sistema lineare omogeneo
 
x1

A ...  = 0.
xn
Si dimostra che il rango di una matrice A coincide con il massimo numero di
righe linearmente indipendenti, che coincide anche con il massimo numero
di colonne linearmente indipendenti.
24
2. Applicazioni Lineari e Matrici
1.4. Cambiamento di base
In questa sezione ricordiamo le relazioni esistenti tra matrici che rappresentano la stessa applicazione lineare f : V → W rispetto alla scelta di basi
diverse per V e W .
Sia quindi f : V → W un’applicazione lineare, sia {v1 , . . . vn } una base
di V , sia {w1 , . . . wm } una base di W e sia A la matrice di f rispetto a
queste basi. Fissiamo ora una nuova base {v10 , . . . vn0 } di V , e una nuova
0
base {w10 , . . . wm
} di W , e sia A0 la matrice di f rispetto a queste nuove
basi. Possiamo dunque scrivere
f (vj ) =
m
X
aij wi
i=1
e
f (vj0 )
=
m
X
a0ij wi0
i=1
sono i coefficienti delle matrici A e A0 rispettivamente.
dove gli aij e gli
Ricordando ora che ogni vettore di uno spazio vettoriale si può scrivere
come combinazione lineare dei vettori di una qualunque base, si ha:
a0ij
vj =
n
X
plj vl0
l=1
ove i plj sono gli elementi di una matrice quadrata P di ordine n. Con una
notazione più compatta, possiamo scrivere:
(v1 , . . . , vn ) = (v10 , . . . vn0 )P,
ove il prodotto è il solito prodotto righe per colonne.
Dato che il ruolo delle due basi di V è perfettamente simmetrico, si
deduce che si deve avere
(v10 , . . . , vn0 ) = (v1 , . . . vn )P −1 ,
e quindi la matrice P deve essere invertibile.
Un discorso analogo si può fare per lo spazio vettoriale W . Si conclude
quindi che deve esistere una matrice invertibile Q, quadrata di ordine m,
tale che
0
(w1 , . . . , wm ) = (w10 , . . . wm
)Q,
e quindi
0
(w10 , . . . , wm
) = (w1 , . . . wm )Q−1 .
Le matrici P e Q sono dette, per ovvi motivi, le matrici di cambiamento di
base (in V e W rispettivamente).
2. Esercizi
25
Mettendo assieme le varie formule trovate finora, possiamo scrivere:
f (vj ) =
=
n
X
l=1
n
X
plj f (vl0 )
plj
l=1
m
X
h=1
=
a0hl
n
X
l=1
m
X
plj
m
X
a0hl wh0
h=1
q̃kh wk =
k=1
m
X
X
k=1
!
plj a0hl q̃kh
wk ,
l,h
ove q̃kh sono i coefficienti della matrice Q−1 .
D’altra parte si ha anche
f (vj ) =
m
X
akj wk .
k=1
Dal confronto delle due espressioni trovate si deduce che
X
akj =
plj a0hl q̃kh ,
l,h
ovvero, con notazione matriciale, che
A = Q−1 A0 P,
o, equivalentemente, che
A0 = QAP −1 .
Questa è la relazione che lega tra loro matrici che rappresentano la stessa
applicazione lineare rispetto a basi diverse.
Notiamo in particolare che se W = V , cioè se f è una applicazione lineare
da V in sé, allora le matrici di cambiamento di base P e Q coincidono. In
questo caso la formula precedente diventa:
A0 = P AP −1 .
Definizione 1.16. Due matrici A e A0 si dicono simili se rappresentano
la stessa applicazione lineare rispetto a basi diverse, cioè se esistono due
matrici invertibili P e Q tali che A0 = QAP −1 .
2. Esercizi
2.1. Definizioni
Esercizio 1. Si dica se sono lineari le seguenti funzioni:
(1) f : R2 → R3 , (x, y) 7→ (x − y, x + y + 1, 0);
(2) f : R2 → R2 , (x, y) 7→ (2x, x + y);
(3) f : R2 → R, (x, y) 7→ sin(x − y).
26
2. Applicazioni Lineari e Matrici
Esercizio 2. Si dica per quali valori di t ∈ R è lineare la seguente funzione:
f : R3 → R2 ,
(x, y, z) 7→ (x + ty, tyz).
Esercizio 3. Si consideri la funzione tra C-spazi vettoriali f : C2 → C data
da f ((x, y)) = x + ȳ, ove ȳ indica il numero complesso coniugato di y. Si
dica se f è lineare (cioè C-lineare).
Esercizio 4. Sia f : V → W un’applicazione tra due spazi vettoriali. Si
dimostri che f è lineare se e solo se il suo grafico è un sottospazio vettoriale
di V × W .
2.2. Applicazioni Lineari e Matrici
Esercizio 5. Sia f : V → W un’applicazione lineare tra due spazi vettoriali.
Siano {v1 , v2 , v3 } una base di V e {w1 , w2 , w3 , w4 } una base di W , e f sia
data da f (v1 ) = 2w1 − 3w2 + w4 , f (v2 ) = w2 − 2w3 + 3w4 e f (v3 ) =
w1 + w2 + w3 − 3w4 . Si scriva la matrice di f nelle basi date.
Esercizio 6. Siano V e W due spazi vettoriali di basi rispettivamente
{v1 , v2 , v3 } e {w1 , w2 }, e sia f : V → W un’applicazione lineare di matrice
(rispetto alle basi date)
2 −1 1
A=
.
3 2 −3
(1) Si prenda per V la nuova base v10 = v2 + v3 , v20 = v1 + v3 , v30 = v1 + v2 .
Qual è la nuova matrice A0 di f rispetto alle basi {v10 , v20 , v30 } e {w1 , w2 }?
(2) Si prenda per W la nuova base w10 = 21 (w1 + w2 ) e w20 = 12 (w1 − w2 ).
Qual è la matrice A00 di f rispetto alle basi {v10 , v20 , v30 } e {w10 , w20 }?
Esercizio 7. Si consideri il sottospazio V di C 0 (R) generato dalle funzioni
f1 (x) = e2x + cos x, f2 (x) = cos x + sin x e f3 (x) = sin x. Si dimostri che
f1 , f2 e f3 sono linearmente indipendenti e si determini la matrice (rispetto
alla base {f1 , f2 , f3 }) dell’endomorfismo di V che ad una funzione associa
la sua derivata.
Esercizio 8. Si determinino le matrici, rispetto alle basi canoniche, di
tutte le applicazioni lineari f : R3 → R4 tali che f ((1, 2, −1)) = (0, 1, 0, 1),
f ((3, −1, 2)) = (1, 2, 0, −1) e f ((−1, 5, −4)) = (2, 0, 3, 2).
Esercizio 9. Si determinino le matrici, rispetto alle basi canoniche, di
tutte le applicazioni lineari f : R3 → R2 tali che f ((0, −2, 1)) = (3, −1),
f ((1, 1, −2)) = (1, 2) e f ((2, −4, −1)) = (11, 1).
Esercizio 10. Sia V l’insieme delle funzioni polinomiali a coefficienti reali
di grado ≤ 4 che si annullano in 0 e 1, e sia W l’insieme delle funzioni
polinomiali a coefficienti reali di grado ≤ 3 tali che il loro integrale tra 0 e
1 è nullo.
2. Esercizi
27
(1) Si dimostri che V e W sono due spazi vettoriali e se ne determinino delle
basi.
(2) Sia D : V → W l’applicazione lineare che associa ad una funzione la sua
derivata. Si dimostri che D è ben definita e si determini una sua matrice
rispetto alle basi precedentemente trovate.
Esercizio 11. Sia φλ : R3 → R4 l’omomorfismo di matrice (rispetto alle
basi canoniche)


1 λ 0
0 λ 0

Aλ = 
1 0 1 
0 0 0
(1) È vero o falso che, per ogni λ ∈ R, esiste un omomorfismo ψ : R4 → R3
tale che ψ ◦ φλ sia suriettivo?
(2) Per quali valori di λ esistono x, y, z ∈ R tali che, posto


1 x 0 0
B =  0 y 0 0
−1 z 1 0
si abbia BAλ = I?
2.3. Nucleo e Immagine
Esercizio 12. Siano V e W due spazi vettoriali, con basi rispettivamente
date da {v1 , v2 , v3 , v4 } e {w1 , w2 , w3 }. Si determini la matrice, rispetto alle
basi date, dell’applicazione lineare φ : V → W definita da φ(v1 ) = w1 − w2 ,
φ(v2 ) = 2w2 − 6w3 , φ(v3 ) = −2w1 + 2w2 , φ(v4 ) = w2 − 3w3 . Si determinino inoltre le dimensioni di Ker φ e di Im φ e si scrivano delle basi di tali
sottospazi. Si dica inoltre se w1 + w2 + w3 ∈ Im φ.
Esercizio 13. Si dica se l’endomorfismo di R3 definito da
f ((x, y, z)) = (x + 2y, y + z, 2z − x)
è iniettivo o suriettivo. Si determinino delle basi di Ker f e di Im f e si dica
se la somma del nucleo e dell’immagine di f è diretta.
Esercizio 14. Sia f : R3 → R3 l’endomorfismo definito ponendo
f ((1, 0, 0)) = (2, −1, 0)
f ((0, 1, 0)) = (1, −1, 1)
f ((0, 1, −1)) = (0, 2, 2).
Si determini la matrice di f rispetto alla base canonica di R3 . Si determinino
inoltre le dimensioni del nucleo e dell’immagine di f e delle basi di tali
sottospazi.
28
2. Applicazioni Lineari e Matrici
Esercizio 15. Sia f : R3 → R3 l’endomorfismo di matrice


1 2 3
A = 1 1 1
1 1 1
rispetto alla base canonica. Si determini il rango di f e delle basi di Ker f
e di Im f .
Esercizio 16. Sia V uno spazio vettoriale di dimensione finita. Si dica
sotto quali condizioni su V esiste un endomorfismo φ : V → V tale che
Ker φ = Im φ.
2.4. Rango di una Matrice
Esercizio 17. Si determini il rango

0
1
A=
0
1
della matrice

1 2 1
1 1 0

−1 1 1
1 4 2
Esercizio 18. Si determini, al variare di

0 1 2
1 2 2
A=
1 1 a
0 a 2a
a ∈ R, il rango della matrice

1 0
1 1

0 1
a2 0
3. Soluzioni
3.1. Applicazioni Lineari
Svolgimento esercizio 1. Ricordando la definizione di funzione lineare,
si tratta solo di controllare se f (v + w) = f (v) + f (w) e se f (λv) = λf (v),
per ogni scelta di vettori v e w e per ogni scalare λ. Si verifica cosı̀
immediatamente che solo la funzione al punto (2) è lineare.
Svolgimento esercizio 2. Procedendo come nell’esercizio precedente si
scopre che l’unico valore di t che rende lineare questa funzione è t = 0.
Svolgimento esercizio 3. Si verifica immediatamente che
f ((x1 , y1 ) + (x2 , y2 )) = f ((x1 , y1 )) + f ((x2 , y2 )),
quindi f è additiva. Tuttavia
f (λ(x, y)) = λx + λy = λx + λ̄ȳ,
mentre
λf ((x, y)) = λx + λȳ,
3. Soluzioni
29
e λ 6= λ̄ per λ ∈ C. Quindi f non è lineare.
Svolgimento esercizio 4. Ricordiamo che il grafico di f è il sottoinsieme
Γf di V × W definito da
Γf = {(v, w) | w = f (v)}.
Dire che Γf è un sottospazio vettoriale equivale a dire che è chiuso rispetto alle operazioni di somma e di prodotto scalare, cioè, per ogni (v1 , w1 ),
(v2 , w2 ) ∈ Γf e per ogni scalare λ, si deve avere (v1 , w1 ) + (v2 , w2 ) ∈ Γf e
λ(v1 , w1 ) ∈ Γf . Ma (v1 , w1 ) + (v2 , w2 ) = (v1 + v2 , w1 + w2 ) e questo elemento appartiene a Γf se e solo se w1 + w2 = f (v1 + v2 ) cioè se e solo
se f (v1 ) + f (v2 ) = f (v1 + v2 ), dato che, per definizione, si ha w1 = f (v1 )
e w2 = f (v2 ). Analogamente si scopre che λ(v1 , w1 ) ∈ Γf se e solo se
λw1 = f (λv1 ), cioè se e solo se λf (v1 ) = f (λv1 ).
Svolgimento esercizio 5. Indichiamo con A la matrice di f . Ricordiamo
che se v = λ1 v1 + λ2 v2 + λ3 v3 (cioè se v ha coordinate (λ1 , λ2 , λ3 ) rispetto
alla base di V ) e se f (v) = µ1 w1 + · · · + µ4 w4 (cioè se f (v) ha coordinate
(µ1 , . . . , µ4 ) rispetto alla base di W ), si deve avere
 
 
µ1
λ1
 ...  = A λ2  .
λ3
µ4
Dalle ipotesi sappiamo che l’immagine f (v1 ) del vettore v1 , che ha evidentemente coordinate (1, 0, 0), ha coordinate (2, −3, 0, 1). Si deve quindi
avere
 
 
2
1
−3
  = A 0 ,
0
0
1
da cui si deduce che le coordinate dell’immagine del primo vettore di base
costituiscono la prima colonna della matrice A. Lo stesso discorso si può
ripetere per i rimanenti vettori di base, concludendo che le colonne della
matrice A sono costituite dalla coordinate delle immagini dei vettori della
base di V . Si ha dunque


2
0
1
−3 1
1

A=
 0 −2 1  .
1
3 −3
Svolgimento esercizio 6. Dalle ipotesi sappiamo che f (v1 ) = 2w1 + 3w2 ,
f (v2 ) = −w1 + 2w2 , f (v3 ) = w1 − 3w2 .
(1) Sappiamo che le colonne della matrice A0 sono costituite dalle coordinate,
rispetto alla base {w1 , w2 }, delle immagini dei vettori della base {v10 , v20 , v30 }.
30
2. Applicazioni Lineari e Matrici
Basta allora calcolare f (v10 ), f (v20 ) e f (v30 ). Per la linearità di f si ha:
f (v10 ) = f (v2 ) + f (v3 ) = −w2 ,
f (v20 ) = f (v1 ) + f (v3 ) = 3w1 ,
f (v30 ) = f (v1 ) + f (v2 ) = w1 + 5w2 ,
da cui si deduce che
0 3 1
.
A =
−1 0 5
(2) In modo del tutto analogo, le colonne della matrice A00 sono costituite
dalle coordinate, rispetto alla base {w10 , w20 }, delle immagini dei vettori della
base {v10 , v20 , v30 }. Si tratta dunque di esprimere i vettori f (v10 ), f (v20 ) e f (v30 )
in funzione dei vettori w10 e w20 . Bisognerà pertanto esprimere i vettori w1
e w2 come combinazione lineare dei vettori della nuova base. Risolvendo il
sistema

1

 (w1 + w2 ) = w10
2
1

 (w1 − w2 ) = w0
2
2
si ottiene
(
w1 = w10 + w20
0
w2 = w10 − w20
da cui si ricava
f (v10 ) = −w2 = −w10 + w20 ,
f (v20 ) = 3w1 = 3w10 + 3w20 ,
f (v30 ) = w1 + 5w2 = 6w10 − 4w20 .
La matrice A00 è quindi data da
−1 3 6
00
A =
.
1 3 −4
Svolgimento esercizio 7. Supponiamo che sia λ1 f1 + λ2 f2 + λ3 f3 = 0.
Ciò equivale a dire che la funzione
λ1 e2x + (λ1 + λ2 ) cos x + (λ2 + λ3 ) sin x
è identicamente nulla. Considerando allora il limite per x → +∞, e ricordando che sin x e cos x sono due funzioni limitate, si deduce che deve essere
λ1 = 0. Si rimane allora con la funzione
λ2 cos x + (λ2 + λ3 ) sin x,
che deve essere identicamente nulla. Se poniamo, ad esempio, x = 0 si
ottiene allora λ2 = 0, da cui segue che anche λ3 = 0, dovendo essere la
funzione λ3 sin x identicamente nulla. In conclusione, le tre funzioni in questione sono linearmente indipendenti e quindi sono una base del sottospazio
V.
3. Soluzioni
31
Sia ora D : V → V l’endomorfismo dato da D(f ) = f 0 . Si ha:
D(f1 ) = 2e2x − sin x = 2f1 − 2f2 + f3 ,
D(f2 ) = − sin x + cos x = f2 − 2f3 ,
D(f3 ) = cos x = f2 − f3 .
Da ciò si deduce che la matrice di D

2
A = −2
1
rispetto alla base {f1 , f2 , f3 } è

0
0
1
1 .
−2 −1
Svolgimento esercizio 8. Iniziamo ponendo
v1 = (1, 2, −1), v2 = (3, −1, 2), v3 = (−1, 5, −4),
w1 = (0, 1, 0, 1), w2 = (1, 2, 0, −1), w3 = (2, 0, 3, 2).
Dato che una applicazione lineare è determinata, in modo unico, dalle immagini dei vettori di una base, si deduce che, se i tre vettori v1 , v2 e v3
sono una base di R3 allora tale applicazione esiste ed è unica. Controlliamo
allora se questi tre vettori sono linearmente indipendenti:
λ 1 v 1 + λ2 v 2 + λ 3 v 3 = 0
equivale a


 λ1 + 3λ2 − λ3 = 0
2λ1 − λ2 + 5λ3 = 0

 − λ + 2λ − 4λ = 0
1
2
3
che, risolto, fornisce


 λ1 = −3λ2 + λ3
λ2 = λ3

 0 = 0.
Si scopre cosı̀ che esistono soluzioni non nulle e, di conseguenza, i tre vettori
sono linearmente dipendenti. Ponendo, ad esempio, λ3 = 1, si ottiene λ2 = 1
e λ1 = −2, e quindi una relazione di dipendenza lineare fra i tre vettori è la
seguente
−2v1 + v2 + v3 = 0.
Se una tale f esiste, per linearità si deve avere
0 = f (−2v1 + v2 + v3 ) = −2f (v1 ) + f (v2 ) + f (v3 ) = −2w1 + w2 + w3 ,
ma tale relazione non è soddisfatta dai vettori w1 , w2 e w3 . Si conclude cosı̀
che non esiste nessuna applicazione lineare con le proprietà richieste.
32
2. Applicazioni Lineari e Matrici
Svolgimento esercizio 9. Iniziamo ponendo
v1 = (0, −2, 1), v2 = (1, 1, −2), v3 = (2, −4, −1),
w1 = (3, −1), w2 = (1, 2), w3 = (11, 1).
Dato che una applicazione lineare è determinata, in modo unico, dalle immagini dei vettori di una base, si deduce che, se i tre vettori v1 , v2 e v3
sono una base di R3 allora tale applicazione esiste ed è unica. Controlliamo
allora se questi tre vettori sono linearmente indipendenti:
λ1 v 1 + λ2 v 2 + λ 3 v 3 = 0
equivale a


 λ2 + 2λ3 = 0
− 2λ1 + λ2 − 4λ3 = 0

 λ − 2λ − λ = 0
1
2
3
che, risolto, fornisce


 λ2 = −2λ3
λ1 = −3λ3

 0 = 0.
Si scopre cosı̀ che esistono soluzioni non nulle e, di conseguenza, i tre vettori
sono linearmente dipendenti. Ponendo, ad esempio, λ3 = 1, si ottiene λ1 =
−3 e λ2 = −2, e quindi una relazione di dipendenza lineare fra i tre vettori
è la seguente
−3v1 − 2v2 + v3 = 0.
Se una tale f esiste, per linearità si deve avere
0 = f (−3v1 − 2v2 + v3 ) = −3f (v1 ) − 2f (v2 ) + f (v3 ) = −3w1 − 2w2 + w3 ,
e tale relazione è effettivamente soddisfatta.
Consideriamo allora v1 e v2 e completiamoli ad una base di R3 aggiungendo, ad esempio, il vettore e3 = (0, 0, 1) (si controlli che v1 , v2 ed e3 sono
linearmente indipendenti). Dato che f è determinata dalle immagini dei
vettori di una base, basta dire chi sono le immagini di v1 , v2 ed e3 . Ma
mentre le immagini di v1 e v2 sono fissate, l’immagine di e3 non è soggetta
ad alcuna condizione ed è dunque arbitraria, poniamo allora f (e3 ) = (a, b).
Da quanto detto si deduce allora che esistono infinite applicazioni lineari
che soddisfano alle condizioni richieste, ed inoltre che tali applicazioni lineari dipendono da due parametri reali (che noi abbiamo indicato con a
e b). Per determinare le matrici di tali applicazioni rispetto alle basi canoniche dobbiamo conoscere le immagini dei vettori di base e1 , e2 ed e3 .
Dobbiamo quindi determinare i vettori della base canonica in funzione dei
vettori della base {v1 , v2 , e3 }. Dalle equazioni
v1 = −2e2 + e3
v2 = e1 + e2 − 2e3
3. Soluzioni
si ricava
33

3
1

 e1 = v1 + v2 + e3
2
2

 e2 = − 1 v1 + 1 e3
2
2
e si ha quindi
5 3 3 3
1
3
f (e1 ) = f (v1 ) + f (v2 ) + f (e3 ) =
+ a, + b ,
2
2
2 2 2 2
1
3 1 1 1
1
f (e2 ) = − f (v1 ) + f (e3 ) = − + a, + b .
2
2
2 2 2 2
Le matrici richieste sono dunque tutte le matrici
5 3
+ 2 a − 32 + 12 a a
2
A= 3 3
+ 2 b 12 + 12 b b
2
al variare di a, b ∈ R.
Osservazione: un altro modo per risolvere questo esercizio consiste nel
considerare una matrice incognita
a11 a12 a13
A=
a21 a22 a23
e nell’imporre le condizioni Av1 = w1 e Av2 = w2 (si noti che la condizione
Av3 = w3 è allora automaticamente soddisfatta). Si ottengono cosı̀ 4 equazioni nelle 6 incognite aij che, una volta risolte, forniranno tutte le matrici
richieste.
Svolgimento esercizio 10. (1) Gli elementi di V sono i polinomi della
forma f (x) = a0 + a1 x + a2 x2 + a3 x3 + a4 x4 tali che f (0) = f (1) = 0, il che
equivale a richiedere che a0 = 0 e a0 + a1 + a2 + a3 + a4 = 0. Si ottiene
quindi
V = {−(a2 + a3 + a4 )x + a2 x2 + a3 x3 + a4 x4 | a2 , a3 , a4 ∈ R},
che si verifica subito essere uno spazio vettoriale (cioè chiuso rispetto alle
operazioni di somma e di prodotto per uno scalare). Inoltre, attribuendo
ad a2 , a3 , a4 i valori successivamente 1, 0, 0, poi 0, 1, 0, etc., si ottengono i
polinomi f1 (x) = x2 − x, f2 (x) = x3 − x, f 3 (x) = x4 − x, che sono dunque
una base di V .
Gli elementi di W sono invece i polinomi della forma g(x) = b0 + b1 x +
b2 x2 + b3 x3 tali che
Z 1
(b0 + b1 x + b2 x2 + b3 x3 ) dx = 0,
0
che equivale a richiedere che
1
1
1
b0 + b1 + b2 + b3 = 0.
2
3
4
34
2. Applicazioni Lineari e Matrici
Si ha dunque
1
1
1
2
3
W = −
b1 + b2 + b3 + b1 x + b2 x + b3 x | b1 , b2 , b3 ∈ R ,
2
3
4
che si verifica facilmente essere uno spazio vettoriale. Ancora, attribuendo
a b1 , b2 , b3 i valori successivamente 1, 0, 0, poi 0, 1, 0, etc., si ottengono i
polinomi g1 (x) = x − 21 , g2 (x) = x2 − 13 , g 3 (x) = x3 − 14 , che sono dunque
una base di W .
(2) Se f (x) ∈ V , si ha
Z 1
D(f (x)) dx = [f (x)]10 = f (1) − f (0) = 0,
0
quindi D(f (x)) ∈ W , e dunque D è ben definita. Per determinare la matrice
di D basta calcolare le immagini dei vettori della base di V :
D(f1 (x)) = 2x − 1 = 2g1 (x),
D(f2 (x)) = 3x2 − 1 = 3g2 (x),
D(f3 (x)) = 4x3 − 1 = 4g3 (x),
da cui si deduce che la matrice cercata è


2 0 0
A = 0 3 0 .
0 0 4
Svolgimento esercizio 11. (1) Se ψ ◦ φλ : R3 → R3 è suriettivo, allora è
anche iniettivo (e viceversa), ma questo implica che anche φλ è iniettivo, e
ciò deve valere per ogni λ. Osserviamo però che l’immagine di φλ è generata
dai vettori (1, 0, 1, 0), (λ, λ, 0, 0) e (0, 0, 1, 0), e quindi ha dimensione 2 se
λ = 0. Di conseguenza, almeno nel caso λ = 0, φλ non è iniettivo, quindi se
ne deduce che non esiste un omomorfismo ψ con le caratteristiche richieste.
(2) Calcolando il prodotto, si ottiene:


1 λ(1 + x) 0
λy
0
BAλ = 0
0 λ(z − 1) 1
che è la matrice identità se e solo se


 λ(1 + x) = 0
λy = 1

 λ(z − 1) = 0
che ammette soluzioni se e solo se λ 6= 0. (Si noti che B è la matrice di
un omomorfismo ψ : R4 → R3 e che BAλ è la matrice dell’applicazione
composta ψ ◦ φλ . Da quanto appena visto si deduce allora che, se λ 6= 0,
esiste ψ tale che ψ ◦ φλ sia l’identità).
3. Soluzioni
35
3.2. Nucleo e Immagine
Svolgimento esercizio 12. Ricordando che le colonne della matrice di φ
sono costituite dalle coordinate, rispetto alla base {w1 , w2 , w3 }, delle immagini dei vettori della base {v1 , v2 , v3 , v4 }, si deduce che la matrice in
questione è


1
0 −2 0
2
1 .
A = −1 2
0 −6 0 −3
Im φ è il sottospazio di W generato dai vettori φ(v1 ), φ(v2 ), φ(v3 ) e φ(v4 ).
Tra questi si troverà dunque una base. In effetti, basta osservare che
φ(v3 ) = −2φ(v1 ) e φ(v2 ) = 2φ(v4 ), mentre φ(v1 ) e φ(v4 ) sono linearmente
indipendenti, per concludere che una base di Im φ è costituita, ad esempio,
dai vettori φ(v1 ) e φ(v4 ). Si ha dunque dim(Im φ) = 2 e, di conseguenza,
dim(Ker φ) = dim(V ) − dim(Im φ) = 2. Per determinare una base di Ker φ
basta allora trovare due vettori linearmente indipendenti che appartengano
al nucleo di φ. Dalle relazioni tra i vettori φ(vi ) trovate precedentemente, e
dalla linearità di φ, si deduce che φ(2v1 + v3 ) = 0 e φ(v2 − 2v4 ) = 0, quindi i
due vettori 2v1 + v3 e v2 − 2v4 appartengono a Ker φ, ed essendo linearmente indipendenti, ne costituiscono una base. Infine il vettore w1 + w2 + w3
appartiene all’immagine di φ se e solo se è combinazione lineare dei vettori
che costituiscono una base di Im φ. Si tratta allora di vedere se esistono due
scalari λ1 e λ2 tali che
w1 + w2 + w3 = λ1 φ(v1 ) + λ2 φ(v4 ) = λ1 (w1 − w2 ) + λ2 (w2 − 3w3 ).
Si ottiene cosı̀ il sistema


 λ1 = 1
− λ 1 + λ2 = 1

 − 3λ = 1,
2
che non ammette soluzioni. Si può dunque concludere che w1 + w2 + w3 6∈
Im φ.
Svolgimento esercizio 13. Si noti che f è un endomorfismo di R3 , cioè
un’applicazione lineare di R3 in sé. Da ciò segue che f è iniettivo se e solo
se è suriettivo e cioè, per esempio, se e solo se Ker f = {0}. Determiniamo
dunque il nucleo di f : f ((x, y, z)) = 0 se e solo se


 x + 2y = 0
y+z =0

 2z − x = 0
da cui si ottiene
x = −2y
z = −y.
36
2. Applicazioni Lineari e Matrici
Si scopre cosı̀ che il nucleo di f contiene dei vettori non nulli, che ha dimensione 1 (nel sistema precedente c’è una sola variabile libera) e che il vettore
(−2, 1, −1) (corrispondente alla scelta y = 1) ne è una base (f non è dunque
né iniettivo né suriettivo). La dimensione dell’immagine di f è allora data
da
dim(Im f ) = dim(R3 ) − dim(Ker f ) = 2,
e dato che Im f è generato dall’immagine dei vettori di un base di R3 , per
esempio la base canonica, per trovare una base di Im f basterà trovare,
fra questi, due vettori linearmente indipendenti. Calcolando f ((1, 0, 0)) =
(1, 0, −1) e f ((0, 1, 0)) = (2, 1, 0) ci accorgiamo che questi sono linearmente
indipendenti; possiamo dunque concludere che i vettori (1, 0, −1) e (2, 1, 0)
sono una base di Im f . Finalmente, ricordiamo che richiedere che la somma
di due sottospazi sia diretta equivale a richiedere che la loro intersezione
sia nulla (nel senso di {0}, non di ∅!). Basta allora controllare se il vettore
(−2, 1, −1), che genera Ker f , si può scrivere come combinazione lineare dei
vettori che costituiscono una base di Im f :
(−2, 1, −1) = λ1 (1, 0, −1) + λ2 (2, 1, 0).
Si ottiene cosı̀ un sistema lineare che non ha soluzioni. Di conseguenza la
somma di Ker f e Im f è diretta e, dal computo delle dimensioni, si deduce
che Ker f ⊕ Im f = R3 .
Svolgimento esercizio 14. Le immagini dei vettori (1, 0, 0) e (0, 1, 0) costituiscono rispettivamente la prima e seconda colonna della matrice cercata. La terza colonna è data dall’immagine del vettore (0, 0, 1). Dato che
(0, 0, 1) = (0, 1, 0) − (0, 1, −1), dalla linearità di f segue che f ((0, 0, 1)) =
(1, −1, 1) − (0, 2, 2) = (1, −3, −1). La matrice cercata è quindi


2
1
1
A = −1 −1 −3 .
0
1 −1
Si vede ora facilmente che Ker f = 0, e pertanto Im f = R3 . Come base di
Im f si può allora prendere la base canonica di R3 .
Svolgimento esercizio 15. Osservando la matrice A si vede immediatamente che rango(f ) = dim Im(f ) = rango(A) = 2. Di conseguenza, si
ha dim Ker(f ) = 1. Una base del nucleo di f è allora data dal vettore
(−1, 2, −1), mentre come base dell’immagine di f si possono prendere, ad
esempio, i vettori che costituiscono le prime due colonne della matrice A.
Svolgimento esercizio 16. Ricordiamo che le dimensioni del nucleo e
dell’immagine di una applicazione lineare sono legate dalla formula
dim V = dim(Ker φ) + dim(Im φ).
3. Soluzioni
37
Pertanto, se esiste φ : V → V tale che Ker φ = Im φ si deve avere necessariamente dim V = 2 dim(Ker φ), cioè la dimensione di V deve essere
pari.
Viceversa, ci chiediamo se il fatto che V abbia dimensione pari sia anche
sufficiente a garantire l’esistenza di un endomorfismo φ con le caratteristiche richieste. Sia dunque V uno spazio vettoriale di dimensione 2n e
fissiamo una sua base {v1 , v2 , . . . , v2n }. Cerchiamo ora di costruire un’applicazione lineare φ tale che Ker φ = Im φ. Ricordiamo che un’applicazione
lineare è determinata dalle immagini degli elementi di una base quindi,
per costruire φ, basta dire chi sono φ(v1 ), φ(v2 ), . . . , φ(v2n ). Poniamo allora
φ(v1 ) = φ(v2 ) = · · · = φ(vn ) = 0, in modo da ottenere che il nucleo sia il
sottospazio di V generato dai primi n vettori della base. Ora che conosciamo il nucleo basterà fare in modo che anche l’immagine di φ sia generata
dai vettori v1 , v2 , . . . , vn . Dato che l’immagine è generata dall’immagine dei
vettori della base di V , e dato che l’immagine dei primi n vettori è zero,
basterà allora porre φ(vn+1 ) = v1 , φ(vn+2 ) = v2 , . . . , φ(v2n ) = vn . Questo
prova che un tale φ esiste e quindi che la condizione che V abbia dimensione
pari è anche sufficiente.
3.3. Rango di una Matrice
Svolgimento esercizio 17. Ricordando che il rango di una matrice è il
numero di righe (o colonne) linearmente indipendenti, è chiaro che sommando ad una riga (o colonna) una combinazione lineare delle righe (colonne)
rimanenti, oppure scambiando fra loro due righe (o colonne), il rango non
cambia. Effettuando quindi questo tipo di operazioni (dette operazioni elementari) sulle righe (o sulle colonne), possiamo ridurre la matrice A ad una
forma più semplice, in cui la determinazione del rango risulti immediata.
In dettaglio, le operazioni da fare sono, ad esempio, le seguenti: scambiamo
la prima con la seconda riga di A, ottenendo


1 1 1 0
0 1 2 1


0 −1 1 1
1 1 4 2
Ora sottraiamo alla quarta riga la prima,

1 1 1
0 1 2

0 −1 1
0 0 3
ottenendo

0
1

1
2
38
2. Applicazioni Lineari e Matrici
Ora aggiungiamo alla terza riga la

1
0

0
0
Infine sottraiamo alla quarta riga

1
0

0
0
seconda, ottenendo

1 1 0
1 2 1

0 3 2
0 3 2
la terza, ottenendo

1 1 0
1 2 1

0 3 2
0 0 0
Si noti come l’obiettivo da raggiungere sia quello di fare in modo che tutti
gli elementi situati al di sotto della diagonale principale siano 0. A questo
punto è immediato contare quante sono le righe linearmente indipendenti:
nel nostro caso 3. Questo è dunque il rango di A.
Osservazione: In modo del tutto analogo si possono effettuare delle operazioni elementari sulle colonne in modo da ottenere alla fine una matrice
in cui tutti gli elementi situati a destra della diagonale principale siano
nulli. Tuttavia è bene non mescolare operazioni elementari sulle righe con
operazioni elementari sulle colonne.
Presentiamo qui un altro metodo per calcolare il rango di una matrice
(anche se gli argomenti necessari, e cioè i determinanti, saranno trattati solo
in seguito). Ricordiamo che il rango di una matrice è il massimo ordine dei
minori non nulli estratti dalla matrice. Dato che A è una matrice quadrata
di ordine 4, esiste un solo minore di ordine 4, il determinante di A. Per
calcolare det A utilizziamo la regola di Laplace, sviluppando il determinante
secondo la prima colonna:






0 1 2 1
1
2
1
1
2
1
1 1 1 0





det 
0 −1 1 1 = − det −1 1 1 − det 1 1 0
1 4 2
−1 1 1
1 1 4 2
1 1
−1 1
−1 1
= − det
− 2 det
+ det
4 2
1 2
1 4
1 1
1 2
− det
+ det
−1 1
1 1
= 1 − 1 = 0.
Abbiamo cosı̀ visto che det A = 0 quindi il rango di A non è 4. Dobbiamo
ora considerare i minori di ordine 3 estratti dalla matrice A. Dato che ci sono
quattro modi diversi di scegliere tre righe tra le quattro della matrice A, e
lo stesso vale per le colonne, ci sono 16 minori di ordine 3. Fortunatamente,
3. Soluzioni
39
se calcoliamo il minore corrispondente alle prime tre righe e tre colonne di
A, troviamo:


0 1 2
1
2
det 1 1 1 = − det
= −3 6= 0,
−1 1
0 −1 1
quindi possiamo concludere che il rango di A è 3.
Notiamo che, se calcolando questo primo minore di ordine tre avessimo
trovato 0, avremmo dovuto considerare un altro minore di ordine tre, fino
a trovarne uno diverso da zero. Se però la matrice A avesse avuto rango 2,
allora calcolando tutti i 16 possibili minori di ordine tre, avremmo sempre
trovato 0. A questo punto avremmo dovuto iniziare a calcolare i minori di
ordine due, fino a trovarne uno diverso da zero. Dato che il calcolo di un
determinante è, in generale, un calcolo piuttosto lungo, si capisce da questo
esempio come, in generale, il calcolo dei minori estratti da una matrice non
sia un metodo molto efficace per la determinazione del rango.
Svolgimento esercizio 18. Con operazioni elementari sulle righe (vedi
esercizio precedente) si ottiene, alla fine, la matrice


1 2 2
1
1
0 1 2
1
0


0 0 a
0
0
0 0 0 a2 − a 0
Si vede allora che, se a = 0 si ha rango(A) = 2, se a = 1 si ha rango(A) = 3,
mentre per tutti gli altri valori di a si ha rango(A) = 4.
Capitolo 3
Determinanti
1. Richiami di teoria
1.1. Determinanti
Sia A = (aij ) una matrice quadrata di ordine n a coefficienti in un corpo C.
Definizione 1.1. Il determinante di A, indicato con det A, è definito come
segue:
X
det A =
(sgn σ)a1σ(1) a2σ(2) · · · anσ(n) ,
σ
ove la somma è estesa a tutte le n! permutazioni dei numeri {1, 2, . . . , n} e
sgn σ è il segno della permutazione σ (che è uguale a +1 oppure −1 a seconda
che il numero di scambi che bisogna effettuare per riordinare l’insieme di
numeri che si ottiene applicando la permutazione σ sia pari o dispari).
Come si può facilmente intuire, questa definizione di determinante, seppur molto utile dal punto di vista teorico, non è altrettanto utile in pratica
per il calcolo del determinante di una matrice quadrata di ordine n (tranne
il caso n = 2 e forse n = 3).
Per matrici di ordine 2, si deduce immediatamente dalla definizione che:
a b
det
= ad − bc.
c d
Osservazione 1.2. Il determinante di una matrice si indica spesso semplicemente sostituendo le parentesi rotonde che delimitano la matrice con
delle barre verticali. Si scrive quindi, ad esempio,
a b c d
per indicare il determinante
a b
det
.
c d
Elenchiamo ora una serie di proprietà dei determinanti.
Proposizione 1.3. Sia A una matrice quadrata di ordine n.
42
3. Determinanti
(1) det A = 0 se e solo se le righe di A sono linearmente dipendenti.
(2) Il determinante di A non cambia se a una riga si somma una
combinazione lineare delle altre righe.
(3) Se tutti gli elementi di una riga vengono moltiplicati per uno scalare
λ il determinante risulta moltiplicato per λ.
(4) Scambiando tra loro due righe di A il determinante cambia di segno.
Tutte le affermazioni precedenti rimangono vere sostituendo la parola righe
con colonne.
Come vedremo negli esercizi queste proprietà dei determinanti possono
essere usate per semplificare una matrice prima di procedere al calcolo del
suo determinante.
Osserviamo che l’applicazione determinante non è lineare. Infatti si ha,
in generale,
det(A + B) 6= det A + det B,
e
det(λA) = λn det A.
Vale invece il seguente risultato:
Teorema 1.4 (Teorema di Binet). Il determinante del prodotto di due
matrici quadrate è il prodotto dei determinanti delle singole matrici, cioè
det(AB) = det A det B.
Un’ultima proprietà dei determinanti è data dalla seguente propositione:
Proposizione 1.5. det(A) = det(AT ).
Introduciamo ora una formula utile al calcolo effettivo dei determinanti.
Teorema 1.6 (Teorema di Laplace). Sia A = (aij ) una matrice quadrata
di ordine n. Per ogni k, con 1 ≤ k ≤ n, si ha
det A = a1k A1k + a2k A2k + · · · + ank Ank ,
e anche
det A = ak1 Ak1 + ak2 Ak2 + · · · + akn Akn ,
i+j
ove Aij = (−1) Mij , e Mij è il determinante della matrice che si ottiene
cancellando la i-esima riga e la j-esima colonna della matrice A (il termine
Aij è anche detto il complemento algebrico dell’elemento aij ).
1.2. Matrici inverse
Sia A = (aij ) una matrice quadrata di ordine n. Se A è invertibile, cioè se
esiste una matrice quadrata A−1 tale che AA−1 = A−1 A = I, dal teorema
di Binet segue che det(A) det(A−1 ) = det(AA−1 ) = det(I) = 1 e quindi
det(A−1 ) =
1
.
det A
1. Richiami di teoria
43
In particolare, se A è invertibile si deve necessariamente avere det A =
6 0.
In realtà si può dimostrare che questa condizione è anche sufficiente. Vale
quindi il seguente risultato:
Proposizione 1.7. Una matrice quadrata A è invertibile se e solo se
det A 6= 0.
È anche possibile scrivere una formula esplicita per l’inversa di una
matrice. Dal teorema di Laplace si deduce infatti il risultato seguente:
Proposizione 1.8. Sia A = (aij ) una matrice quadrata di ordine n tale
che det A 6= 0. Allora si ha:

T
A11 A12 · · · A1n
A
A22 · · · A2n 
1 
 .21
,
A−1 =
..
.. 
..

..
det A
.
.
. 
An1 An2 · · · Ann
ove gli Aij sono i complementi algebrici degli elementi aij della matrice A.
Si noti tuttavia che, dal punto di vista pratico, calcolare l’inversa di una
matrice usando questa formula non è un metodo molto efficace, in quanto è
richiesto il calcolo di un gran numero di determinanti. Negli esercizi verrà
illustrato un metodo molto più efficace per determinare l’inversa di una
matrice.
1.3. Determinante di una applicazione lineare
Sia f : V → V un’applicazione lineare. Abbiamo visto in precedenza che,
se fissiamo una base {v1 , . . . , vn } di V , a f risulta associata una matrice
quadrata A di ordine n. Ovviamente la matrice A dipende dalla base scelta:
se {v10 , . . . , vn0 } è un’altra base di V , a f sarà associata un’altra matrice A0 .
Le due matrici A e A0 cosı̀ trovate sono simili (in quanto rappresentano la
stessa applicazione lineare f ), e quindi sono legate dalla formula seguente
A0 = P AP −1 ,
dove P è la matrice di cambiamento di base.
Dal teorema di Binet segue allora che:
det A0 = det(P AP −1 ) = det(P ) det(A) det(P −1 )
= det(P ) det(A) det(P )−1 = det A.
In altri termini, tutte le matrici che rappresentano la stessa f rispetto a basi
diverse hanno lo stesso determinante. Quindi tale determinante dipende solo
dall’applicazione lineare f e non dalla base scelta per costruire la matrice.
Possiamo quindi dare la seguente definizione:
44
3. Determinanti
Definizione 1.9. Sia f : V → V un’applicazione lineare. Il determinante
di f , indicato con det(f ), è il determinante di una qualunque matrice che
rappresenta f .
2. Esercizi
2.1. Regola di Laplace
Esercizio 1. Si calcoli

2
4
det 
0
2

3 −1
2 0
.
0 1
2 −1
0
1
3
0
Esercizio 2. Si calcoli

2
2

det 
2
2
1

3 4 −1 2
3 4 −1 1 

3 5
1
1
.
1 1
1
1
2 −1 2 −1
2.2. Inversione di Matrici
Esercizio 3. Si calcoli l’inversa della matrice


2 −3 −1
A = 2 −1 −3 .
1 −3 −1
Esercizio 4. Si calcoli l’inversa della

1

A= 1
1
matrice

2 1
3 0
2 2
2.3. Formule Ricorsive
Esercizio 5. Si indichi con An la seguente matrice n × n:


2 1
0 0 ··· 0
3 2
1 0 · · · 0


0 3
2 1 · · · 0

An =  .. . . . . . . . . .. 
.
.
.
. .
.

0 · · · 0 3
2 1
0 ···
0
0
3
2
2. Esercizi
45
Determinare una formula ricorsiva per calcolare det An , per ogni intero n ≥
1.
Esercizio 6. Si indichi con An la seguente matrice n × n:


1 + a1
1
1
1
···
1
 1
1 + a2
1
1
···
1 


 1
1
1 + a3 1
···
1 
An = 
.. 
..
..
..
 ...
.
.
.
···
. 


 1
···
1
1 1 + an−1
1 
1
···
1
1
1
1 + an
ove a1 , . . . , an ∈ R.
Si dimostri che, per ogni intero n ≥ 2, si ha
det An = a1 a2 · · · an +
n
X
a1 a2 · · · âi · · · an ,
i=1
dove âi significa che l’elemento ai non compare nel prodotto.
2.4. Altri esercizi
Esercizio 7. Sia X la matrice a blocchi
X=
A B
,
0 C
dove A è una matrice n × n e C è una matrice m × m.
Si dimostri che det X = det A · det C.
Esercizio 8. (Determinante di Vandermonde). Si dimostri che, per ogni
n ≥ 2, si ha



det 


1
λ1
λ21
..
.
1
λ2
λ22
..
.
···
···
···
1
λn
λ2n
..
.
···
λ1n−1 λn−1
·
· · λnn−1
2


 Y
=
(λj − λi ).

 i<j
46
3. Determinanti
3. Soluzioni
3.1. Regola di Laplace
Svolgimento esercizio 1. Utilizzando la regola di Laplace, e precisamente
sviluppando il determinante secondo la terza riga, si ha:






2 0 3 −1
2
3
−1
2
0
3
4 1 2 0 





det 
0 3 0 1  = −3 det 4 2 0 − det 4 1 2
2 2 −1
2 0 2
2 0 2 −1
4 2
2 3
2 3
= −3 − det
− det
− det
2 2
4 2
2 2
= −3(−4 + 8) + 2 = −10.
Svolgimento esercizio 2. In questo caso non conviene applicare subito
la regola di Laplace, data la mole dei calcoli necessari. Ricordando invece le proprietà dei determinanti possiamo cercare di ridurre la matrice ad
una forma più semplice: ciò significa, in pratica, cercare di far comparire
parecchi zeri tra gli elementi della matrice. Ciò si può fare, ad esempio,
sottraendo alla prima riga la seconda, e ricordando che con tale operazione
non si modifica il determinante. Si ha dunque:




0 0 0
0
1
2 3 4 −1 2
2 3 4 −1 1 
2 3 4 −1 1 






1
1
1
1  = det 
det 2 3 5

2 3 5
2 1 1
2 1 1
1
1
1
1
1 2 −1 2 −1
1 2 −1 2 −1
e sviluppando ora secondo la prima riga, si ottiene




2 3 4 −1 2
2
3
4
−1
2 3 4 −1 1 


2 3 5
1


1
1
det 
2 3 5
 = det 2 1 1

1
2 1 1
1
1
1 2 −1 2
1 2 −1 2 −1
Ancora una volta risulta conveniente trasformare
esempio sottraendo alla prima riga la seconda. Si



2 3 4 −1
0 0
2 3 5

2 3
1
 = det 
det 
2 1 1
2 1
1
1 2 −1 2
1 2
quest’ultima matrice, ad
ha cosı̀:

−1 −2
5
1

1
1
−1 2
3. Soluzioni
e, sviluppando il

2 3
2 3
det 
2 1
1 2
47
determinante secondo la prima riga, si ottiene





4 −1
2 3 1
2 3 5

5
1
= − det 2 1 1 + 2 det 2 1 1 
1
1
1 2 2
1 2 −1
−1 2
Ancora una volta possiamo far comparire degli zeri in queste ultime due
matrici sottraendo, ad esempio, la seconda riga alla prima. Si ottiene cosı̀:






2 3 4 −1
0
2
0
0
2
4
2 3 5
1
 = − det 2 1 1 + 2 det 2 1 1 
det 
2 1 1
1
1 2 2
1 2 −1
1 2 −1 2
2 1
2 1
= 2 det
+ 2 −2 det
1 2
1 −1
2 1
+4 det
1 2
= 6 + 2(6 + 12) = 42.
3.2. Inversione di Matrici
Svolgimento esercizio 3. Ricordiamo che, data una matrice A = (aij ), si
chiama complemento algebrico dell’elemento aij l’elemento Aij che è uguale
al prodotto di (−1)i+j per il determinante della matrice ottenuta dalla matrice A cancellando la i-esima riga e la j-esima colonna. La matrice inversa
di A è quindi uguale alla trasposta della matrice dei complementi algebrici
degli elementi di A, divisa per il determinante di A.
Calcoliamo allora il determinante di A, sviluppando secondo la prima
riga:
−1 −3
2 −3 2 −1
+ 3
det A = 2 1 −1 − 1 −3
−3 −1
= 2(1 − 9) + 3(−2 + 3) − (−6 + 1) = −8.
Scriviamo ora la trasposta della matrice dei complementi algebrici:

 −1 −3
−3 −1
−3 −1
+ −3 −1 − −3 −1 + −1 −3 


 −8
0
8
2 −1
2 −1 
 2 −3
 = −1 −1 4
 −
+ − 
 1 −1
1 −1
2 −3 
 −5 3 4
2 −3
2 −3 
 2 −1
+
−
+
1 −3
1 −3
2 −1
48
3. Determinanti
La matrice inversa di A si ottiene dividendo la matrice appena trovata per
il determinante di A. Essa è quindi


1
0
−1
A−1 = 1/8 1/8 −1/2 .
5/8 −3/8 −1/2
Svolgimento esercizio 4. Nell’esercizio precedente abbiamo visto come
si possa calcolare l’inversa di una matrice. Il metodo usato tuttavia non è
molto efficace, specialmente per matrici “grandi”, perché richiede il calcolo
di un gran numero di determinanti.
Un altro metodo, molto più semplice del precedente anche se meno meccanico, per calcolare l’inversa di una matrice (quando questa esiste) consiste
nell’affiancare alla matrice A la matrice identica, ottenendo


1 2 1 | 1 0 0
1 3 0 | 0 1 0
1 2 2 | 0 0 1
A questo punto, con delle operazioni elementari sulle righe, cerchiamo di
far apparire la matrice identica a sinistra: alla fine la matrice che troveremo
a destra sarà proprio la matrice inversa di A (perché?). In dettaglio le
operazioni da fare sono, ad esempio, le seguenti: sottraiamo alla seconda
riga la prima, e alla terza riga la prima, ottenendo


1 2 1 | 1 0 0
0 1 −1 | −1 1 0
0 0 1 | −1 0 1
Ora sommiamo alla seconda
terza, ottenendo

1
0
0
Ora sommiamo alla prima

1
0
0
riga la terza, mentre alla prima sottraiamo la

2 0 | 2 0 −1
1 0 | −2 1 1 
0 1 | −1 0 1
riga la seconda moltiplicata per −2, ottenendo

0 0 | 6 −2 −3
1 0 | −2 1
1
0 1 | −1 0
1
In conclusione, si ha

A−1

6 −2 −3
1 .
= −2 1
−1 0
1
3. Soluzioni
49
3.3. Formule Ricorsive
Svolgimento esercizio 5. Sviluppando
riga si ha:

3
0

0
det An = 2 det An−1 − det 
 ...

0
il determinante secondo la prima
1
2
3
...
···
0 ···
= 2 det An−1 − 3 det An−2 .
0 0
1 0
2 1
... ...
0 3
0 0

··· 0
· · · 0

· · · 0
.
· · · .. 

2 1
3
2
(La seconda matrice a destra dell’uguale è una matrice (n − 1) × (n − 1),
e si è sviluppato il suo determinante secondo la prima colonna. Si è inoltre
supposto, nel calcolo precedente, che n ≥ 3).
Rimangono ora da calcolare i determinanti per n = 1 e n = 2:
det A1 = det(2) = 2,
2 1
det A2 = det
= 1.
3 2
In questo modo si possono calcolare, successivamente tutti gli altri determinanti; ad esempio, si ha:
det A3 = 2 det A2 − 3 det A1 = −4,
det A4 = 2 det A3 − 3 det A2 = −11.
Osservazione: La formula ricorsiva precedente permette il calcolo di tutti
i det An , tuttavia per poter calcolare det An per un particolare valore di
n è necessario calcolare prima tutti i vari det Ai , per ogni intero i < n.
Per trovare una formula che permetta il calcolo diretto di det An si può
procedere come segue. Poniamo dn = det An ; si ha dunque d1 = 2, d2 = 1 e
dn = 2dn−1 −3dn−2 , per ogni n ≥ 3. Allora si ha anche dn+1 = 2dn −3dn−1 =
2(2dn−1 − 3dn−2 ) − 3dn−1 = dn−1 − 6dn−2 . Si ottiene dunque la seguente
equazione:
dn+1
1 −6
dn−1
=
dn
2 −3
dn−2
dn+1
1 −6
ovvero, ponendo vn =
e indicando con B la matrice
,
dn
2 −3
vn = Bvn−2 .
Si ottiene quindi v3 = Bv1 , v5 = Bv3 = B 2 v1 , v7 = Bv5 = B 3 v1 e, in
generale,
v2n+1 = B n v1 .
50
3. Determinanti
1
Ricordando che v1 =
, si scopre allora che il problema del calcolo diretto
2
dei vari dn è ridotto al problema del calcolo delle potenze di una matrice.
Ovviamente il calcolo di B n si può effettuare moltiplicando la matrice B per
se stessa n volte, ma ciò equivale a calcolare tutti i vari di , per ogni i < n.
Tuttavia, come vedremo in seguito, c’è un modo di calcolare direttamente
B n senza dover calcolare tutte le varie potenze B i , i = 2, . . . , n − 1.
Svolgimento esercizio 6. Poniamo dn (a1 , . . . , an ) = det An . Verifichiamo
la formula data per n = 2:
1 + a1
1
d2 (a1 , a2 ) = det
= a1 a2 + a1 + a2 .
1
1 + a2
Quindi, per n = 2, la formula è corretta. Procediamo quindi per induzione,
supponendo che la formula sia corretta per An−1 e cercando di dimostrare
che allora la formula data è corretta anche per An . Per calcolare il determinante dn (a1 , . . . , an ), conviene sottrarre alla prima colonna la seconda (cosı̀
facendo il determinante non cambia), ottenendo


a1
1
1
1
···
1
−a2 1 + a2
1
1
···
1 


 0
1
1 + a3 1
···
1 

dn (a1 , . . . , an ) = det  ..
.. 
..
..
..
.
.
.
·
·
·
. 
.


 0
···
1
1 1+a
1 
n−1
0
···
1
1
1
1 + an
Ora si può sviluppare secondo la prima colonna, ottenendo

1 + a2
1
1
1
···
 1
1 + a3
1
1
···

 1
1
1 + a4 1
···
dn (a1 , . . . , an ) = a1 det 
.
.
.
.
 ..
..
..
..
···

 1
···
1
1 1 + an−1
1
···
1
1
1

1
1
1
1
···
 1 1 + a3
1
1
···

1
1
1 + a4 1
···
+ a2 det 
..
..
..
 ...
.
.
.
···

1 · · ·
1
1 1+a
n−1

1
1 

1 
.. 
. 

1 
1 + an

1
1 

1 
.. 
. 

1 
1 ···
1
1
1
1 + an
= a1 dn−1 (a2 , a3 , . . . , an ) + a2 dn−1 (0, a3 , . . . , an ).
Usando l’ipotesi induttiva, si ha
dn−1 (a2 , a3 , . . . , an ) = a2 a3 · · · an +
n
X
i=2
a2 a3 · · · âi · · · an ,
3. Soluzioni
51
e quindi
dn−1 (0, a3 , . . . , an ) = 0 +
n
X
0 · a3 · · · âi · · · an = a3 · · · an .
i=2
Sostituendo nell’espressione precedentemente trovata, si ha:
dn (a1 , . . . , an ) = a1 (a2 a3 · · · an +
n
X
a2 a3 · · · âi · · · an ) + a2 (a3 · · · an )
i=2
= a1 a2 · · · an +
= a1 a2 · · · an +
n
X
i=2
n
X
a1 a2 · · · âi · · · an + a2 a3 · · · an
a1 a2 · · · âi · · · an ,
i=1
che è proprio ciò che si voleva dimostrare.
3.4. Altri esercizi
Svolgimento esercizio 7. Utilizziamo la definizione del determinante:
X
(sgn σ)x1,σ(1) x2,σ(2) · · · xn,σ(n) xn+1,σ(n+1) · · · xn+m,σ(n+m) ,
det X =
σ
ove si è posto X = (xi,j ) e ove la somma è effettuata al variare di σ tra
tutte le permutazioni di n + m oggetti.
In base alla struttura a blocchi della matrice X, si deduce che xi,j = 0
se i > n e j ≤ n, quindi nel prodotto
xn+1,σ(n+1) · · · xn+m,σ(n+m)
compare uno zero ogni volta che σ(n + 1) ≤ n, oppure σ(n + 2) ≤ n,
. . . , oppure σ(n + m) ≤ n. Ciò significa che gli addendi che compaiono
effettivamente nell’espressione del determinante di X corrispondono alle
permutazioni σ tali che
σ(n + 1), σ(n + 2), . . . , σ(n + m) ∈ {n + 1, . . . , n + m}.
Di conseguenza si deve avere anche
σ(1), σ(2), . . . , σ(n) ∈ {1, . . . , n}.
Ciò significa che gli unici addenti che compaiono effettivamente nell’espressione del determinante di X corrispondono alle permutazioni σ che si spezzano nel prodotto di due permutazioni σ = σ1 σ2 , ove σ1 : {1, . . . , n} →
52
3. Determinanti
{1, . . . , n} e σ2 : {n + 1, . . . , n + m} → {n + 1, . . . , n + m}. Si ricordi allora
che si ha anche sgn(σ) = sgn(σ1 ) sgn(σ2 ). Si ottiene dunque
X
det X =
(sgn σ1 )(sgn σ2 )x1,σ1 (1) x2,σ1 (2) · · · xn,σ1 (n) xn+1,σ2 (n+1) · · ·
σ1 ,σ2
· · · xn+m,σ2 (n+m)
!
=
X
(sgn σ1 )x1,σ1 (1) x2,σ1 (2) · · · xn,σ1 (n)
×
σ1
!
X
(sgn σ2 )xn+1,σ2 (n+1) xn+2,σ2 (n+2) · · · xn+m,σ2 (n+m)
σ2
= det A · det C.
Svolgimento esercizio 8. Verifichiamo la formula data nel caso n = 2:
1 1
det
= λ 2 − λ1 .
λ 1 λ2
Quindi la formula è corretta.
Procediamo allora per induzione, supponendo che la formula sia corretta
per n − 1 e cercando di dimostrare che in tal caso è corretta anche per n.
Per calcolare


1
1
···
1
 λ1
λ2 · · · λn 

 2
λ22 · · · λ2n 
λ
∆ = det 
 .1
..
.. 
 ..
.
···
. 
λn−1
λn−1
· · · λn−1
1
2
n
modifichiamo la matrice sottraendo ad ogni riga, a partire dalla seconda, la
riga precedente moltiplicata per λ1 (facendo quanto detto il determinante
non cambia). Si ottiene allora


1
1
1
···
1
0
λ 2 − λ1
λ3 − λ1
···
λn − λ 1 


2
2
···
λ2n − λ1 λn  .
λ 3 − λ1 λ3
0
λ2 − λ 1 λ 2
∆ = det 

.
..
..
..

 ..
.
.
···
.
− λ1 λnn−2
0 λn−1
− λ1 λn−2
λn−1
− λ1 λn−2
· · · λn−1
2
2
3
3
n
Sviluppando secondo la prima colonna si ha dunque


λ2 − λ1
λ3 − λ 1
···
λn − λ 1
 λ22 − λ1 λ2
λ23 − λ1 λ3
···
λ2n − λ1 λn 
.

∆ = det 
..
..
..

.
.
···
.
n−1
n−2
n−1
n−2
n−2
n−1
λ 2 − λ1 λ2
λ3 − λ 1 λ3
· · · λn − λ 1 λn
3. Soluzioni
53
A questo punto si può raccogliere a fattore dalla colonna
j = 1, . . . , n − 1) il fattore λj − λ1 . Si ottiene pertanto

1
1
 λ2
λ2
 2
λ
λ23

∆ = (λ2 − λ1 )(λ3 − λ1 ) · · · (λn − λ1 ) det  2
..
 ...
.
n−2
n−2
λ2
λ3
j-esima (per ogni
···
···
···
1
λn
λ2n
..
.
···
· · · λn−2
n



.


In quest’ultima espressione compare un determinante di Vandermonde di
ordine n − 1. Si può dunque applicare l’ipotesi induttiva, ottenendo finalmente
Y
∆ = (λ2 − λ1 )(λ3 − λ1 ) · · · (λn − λ1 )
(λj − λi )
2≤i<j
Y
=
(λj − λi ).
i<j
Capitolo 4
Sistemi Lineari
1. Richiami di teoria
1.1. Definizioni e principali risultati
Un sistema di m equazioni lineari in n incognite, a coefficienti in un campo
C, è un insieme di equazioni del tipo seguente:

a11 x1 + a12 x2 + · · · + a1n xn = b1



 a21 x1 + a22 x2 + · · · + a2n xn = b2
···




am1 x1 + am2 x2 + · · · + amn xn = bm
dove i coefficienti aij e bi appartengono al campo C, mentre le xi sono le
incognite.
Risolvere un sistema lineare significa determinare i valori delle incognite
per cui sono soddisfatte tutte le equazioni che compongono il sistema.
Se chiamiamo A la matrice construita con i coefficienti aij e introduciamo
due vettori colonna
 
 
x1
b1
.
X =  ..  ,
B =  ...  ,
xn
bm
il sistema precedente si può scrivere semplicamente come segue:
AX = B,
dove il prodotto è il solito prodotto righe per colonne.
Ci sono vari metodi per risolvere un sistema lineare. Il più banale è
il metodo di sostituzione. Si ricava una qualunque delle incognite da una
delle equazioni del sistema, si sostituisce il valore trovato nelle equazioni
rimanenti, in modo da trovare un sistema con una equazione in meno e una
incognita in meno. Si itera poi questo processo fino a che non ci sono più
equazioni da risolvere.
Un metodo più efficace (che comporta cioè un minor numero di calcoli)
è il metodo dell’eliminazione di Gauss. Tramite opportune combinazioni
56
4. Sistemi Lineari
lineari delle equazioni del sistema si può ridurre la matrice A del sistema
a una forma triangolare superiore (cioè tale che tutti gli elementi che si
trovano sotto la diagonale principale sono nulli). A questo punto si risolve
all’indietro (cioè partendo dall’ultima equazione) il sistema cosı̀ ottenuto,
usando il metodo di sostituzione.
Da un punto di vista più teorico sono importanti i seguenti risultati.
Teorema 1.1 (Teorema di Cramer). Sia AX = B un sistema lineare
di n equazioni in n incognite (la matrice A è quindi quadrata di ordine n).
Questo sistema ammette una soluzione unica se e solo se det A 6= 0.
Notiamo che la condizione det A 6= 0 equivale a richiedere che la matrice
A sia invertibile. Sotto tale ipotesi, moltiplicando a sinistra ambo i membri
dell’equazione AX = B per la matrice inversa di A, si ottiene
X = A−1 B.
L’esistenza e l’unicità della soluzione X del sistema risulta quindi ovvia. Si
ha addirittura una formula esplicita per ottenerla: per i = 1, . . . , n, si ha
xi =
∆i
,
∆
ove ∆ = det A e ∆i è il determinante della matrice che si ottiene sostituendo
nella matrice A la colonna dei coefficienti della incognita xi con la colonna
dei termini noti B.
Uno svantaggio del teorema di Cramer è che esso si applica solo a sistemi in cui il numero di incognite coincide con il numero di equazioni. Un
risultato molto più generale è il seguente:
Teorema 1.2 (Teorema di Rouché–Capelli). Sia AX = B un sistema
lineare di n equazioni in m incognite. Indichiamo con (A|B) la matrice
ottenuta aggiungendo alla matrice A la colonna B dei termini noti. Allora
questo sistema ammette soluzioni se e solo se il rango della matrice A è
uguale al rango della matrice (A|B). Inoltre se indichiamo con r il valore
comune dei ranghi di queste due matrici, la soluzione è unica se e solo se
r = n (cioè se il rango r coincide con il numero n di incognite). Se invece
r < n, il sistema ammette infinite soluzioni, dipendenti da n − r parametri
(in tal caso si suol dire che il sistema ammette ∞n−r soluzioni).
Osserviamo infine che il teorema di Rouché–Capelli è particolarmente
utile nella discussione dei sistemi che contengono dei parametri.
2. Esercizi
57
2. Esercizi
2.1. Sistemi parametrici
Esercizio 1. Risolvere e discutere in funzione dei valori di m ∈ R il seguente
sistema:
x + (m + 1)y = m + 2
mx + (m + 4)y = 3.
Esercizio 2. Risolvere e discutere in funzione dei valori di m ∈ R il seguente
sistema:
mx + (m − 1)y = m + 2
(m + 1)x − my = 5m + 3.
Esercizio 3. Risolvere e discutere in funzione dei valori di a ∈ R il seguente
sistema:


 x + (a − 1)y + (2 − a)z = a + 5
x + ay + 2z = 4


x + (a − 2)y + (2 − 2a2 )z = 6.
Esercizio 4. Si dica per quali valori di λ ∈ R il seguente sistema è risolubile,
e lo si risolva quando ha più di una soluzione.

x + 2y + 2w + z = 1



 y + 2w + z = 0
x + y + λw = 0




λy + 2λw + λ2 z = 0.
Esercizio 5. Risolvere e discutere secondo i valori dei parametri b1 , . . . , b4
il sistema

x + 3y + 5z + 3t = b1



 x + 4y + 7z + 3t = b2
y + 2z = b3




x + 2y + 3z + 2t = b4 .
Esercizio 6. Al variare di λ ∈ Q si dica quante soluzioni vi sono in Q4 per
il seguente sistema di equazioni lineari:

(λ − 1)x1 + 2x2 + 3x4 = 0



 λx2 + (λ + 1)x4 = 1

x1 + λx3 + x4 = 0



(λ − 1)x1 + x4 = 0.
58
4. Sistemi Lineari
Esercizio 7. Dato il sistema di equazioni lineari


 λx − µy − µz = µ
µx − λy = λ

x − y − z = 0
si dica per quali coppie (λ, µ) ∈ R2 è risolubile e per quali la soluzione è
unica.
3. Soluzioni
3.1. Sistemi parametrici
Svolgimento esercizio 1. Ricordiamo che un sistema lineare del tipo Ax =
b ammette soluzioni se e solo se il rango della matrice incompleta A è uguale
al rango della matrice completa (A|b). Nel caso in questione è
1 m+1 | m+2
(A|b) =
.
m m+4 |
3
Per calcolare il rango di quest’ultima matrice sottraiamo alla seconda riga
la prima moltiplicata per m, ottenendo
1 m+1 |
m+2
.
0 4 − m2 | 3 − m2 − 2m
Si vede dunque che, se m 6= ±2 si ha rango(A) = rango(A|b), e quindi il
sistema ha un’unica soluzione, mentre per m = 2 oppure m = −2 si ha
rango(A) = 1 mentre rango(A|b) = 2, e quindi il sistema non ammette
soluzioni.
Si noti tuttavia che l’esercizio richiede di risolvere esplicitamente il sistema; in casi come questo si può allora evitare di studiare il rango delle
matrici in questione, e si può invece risolvere direttamente il sistema; si
scoprirà cosı̀ strada facendo quando la soluzione esiste (e se è unica oppure
no) e quando non esiste. Per risolvere il sistema utilizziamo il metodo di eliminazione di Gauss (che è esattamente lo stesso metodo che abbiamo usato
per determinare il rango di una matrice): sottraiamo alla seconda equazione
la prima moltiplicata per m, ottenendo
(
x + (m + 1)y = m + 2
(4 − m2 )y = 3 − m2 − 2m
3. Soluzioni
59
da cui si deduce che, se m 6= ±2, si ha

m2 + 2m − 3


y =
m2 − 4

m2 + 3m + 5

x = −
m2 − 4
mentre, se m = 2 oppure m = −2, il sistema non ammette soluzioni.
Presentiamo ora un altro modo per analizzare e risolvere un sistema
lineare. Sia
1 m+1
A=
m m+4
la matrice (incompleta) del sistema lineare e b = (m + 2, 3) la colonna dei
termini noti. Poniamo ∆ = det A. Si ha ∆ = 4 − m2 , quindi ∆ = 0 per
m = −2 o m = 2. Pertanto, se m 6= ±2, la matrice A è invertibile (il
sistema è un sistema “di Cramer”) e il sistema ammette un’unica soluzione,
data da
x
−1
−1 m + 2
=A b=A
.
y
3
Esplicitamente, si ha x = ∆x /∆ e y = ∆y /∆, ove ∆x (rispettivamente, ∆y )
è il determinante della matrice che si ottiene da A sostituendo alla prima
(rispettivamente, seconda) colonna la colonna dei termini noti. Otteniamo
quindi:
m+2 m+1
∆x = det
= m2 + 3m + 5,
3
m+4
1 m+2
∆y = det
= −m2 − 2m + 3,
m
3
da cui si ricava

∆x
m2 + 3m + 5


x
=
=

∆
4 − m2
2

∆
m + 2m − 3

y = y =
∆
m2 − 4
I due casi rimanenti, m = −2 e m = 2 vanno trattati a parte.
Per m = −2 si ha:
1 −1
0
A=
;
b=
.
−2 2
3
Si vede subito che rango(A) = 1, mentre rango(A|b) = 2, quindi il sistema
non ammette soluzioni.
Per m = 2 si ha:
1 3
4
A=
;
b=
.
2 6
3
60
4. Sistemi Lineari
Anche in questo caso si ha rango(A) = 1, mentre rango(A|b) = 2, quindi il
sistema non ammette soluzioni.
Svolgimento esercizio 2. Risolviamo direttamente il sistema usando il
metodo di eliminazione di Gauss. Notiamo innanzitutto che, se m = 0, il
sistema ha un’unica soluzione data da
y = −2
x = 3.
Se m 6= 0 sostituiamo la seconda equazione con la somma della seconda,
moltiplicata per m, e della prima, moltiplicata per −(m + 1), ottenendo
(
mx + (m − 1)y = m + 2
(1 − 2m2 )y = 4m2 − 2.
Ora, se m2 = 21 , nella seconda equazione si ottiene 0 = 0, quindi il sistema
ammette infinite soluzioni (dipendenti da un parametro) che si ottengono
dalla prima equazione ricavando, ad esempio, la x in funzione della y:
1−m
m+2
y+
,
m
m
√
√
(ed ovviamente sostituendo ad m i valori −1/ 2 e 1/ 2 rispettivamente),
mentre, se m2 6= 12 , si ottiene
y = −2
x = 3.
x=
In conclusione il sistema ha un’unica soluzione (che non dipende da m) se
m2 6= 12 , altrimenti ne ha infinite.
Come per l’esercizio precedente, presentiamo anche un altro metodo per
studiare e risolvere il sistema lineare in questione. Sia
m
m−1
A=
m + 1 −m
la matrice (incompleta) del sistema lineare e b = (m + 2, 5m + 3) la colonna
2
dei termini noti.
√ Poniamo ∆√= det A. Si ha ∆ = 1 − 2m
√ , quindi ∆ = 0
per m = −1/ 2 o m = 1/ 2. Pertanto, se m 6= ±1/ 2, la matrice A
è invertibile (il sistema è un sistema “di Cramer”) e il sistema ammette
un’unica soluzione, data da
x
m+2
−1
−1
=A b=A
.
y
5m + 3
Esplicitamente, si ha x = ∆x /∆ e y = ∆y /∆, ove ∆x (rispettivamente, ∆y )
è il determinante della matrice che si ottiene da A sostituendo alla prima
3. Soluzioni
61
(rispettivamente, seconda) colonna la colonna dei termini noti. Otteniamo
quindi:
m+2 m−1
∆x = det
= −6m2 + 3,
5m + 3 −m
m
m+2
∆y = det
= 4m2 − 2,
m + 1 5m + 3
da cui si ricava

∆x
6m2 − 3


=
x =
∆
2m2 − 1

4m2 − 2
∆

y = y =
∆
1 − 2m2
√
√
I due casi rimanenti,
m
=
−1/
2
e
m
=
1/
2 vanno trattati a parte.
√
Per m = −1/ 2 si ha:
√
√
√
−1/
2
−1/
2
−
1
−1/
2+2
√
√
√
A=
;
b=
.
−1/ 2 + 1
1/ 2
−5/ 2 + 3
Con un facile calcolo si scopre che rango(A) = rango(A|b) = 1, quindi
il sistema è compatibile e ammette infinite soluzioni, dipendenti da un
parametro. Le soluzioni si trovano considerando, ad esempio, la prima
equazione
1
1
1
−√ x + − √ − 1 y = −√ + 2
2
2
2
e ricavando x in funzione di y:
√
√
x = (−1 − 2)y + 1 − 2 2,
ovvero
(
x = (−1 −
y=t
√
√
2)t + 1 − 2 2
per ogni t ∈ R.
√
Analogamente, anche per m = 1/ 2 si scopre che
rango(A) = rango(A|b) = 1,
quindi il sistema è compatibile e ammette infinite soluzioni, dipendenti da
un parametro. Come nel caso precedente si trova, ricavando ad esempio x
in funzione di y,
√
√
x = ( 2 − 1)y + 1 + 2 2,
cioè
(
per ogni t ∈ R.
√
√
x = ( 2 − 1)t + 1 + 2 2
y=t
62
4. Sistemi Lineari
Svolgimento esercizio 3. Ricordiamo il teorema di Rouché–Capelli: un
sistema lineare del tipo Ax = b ammette soluzioni se e solo se il rango della
matrice incompleta A è uguale al rango della matrice completa (A|b). Nel
nostro caso si ha


1 a−1 2−a | a+5
a
2
|
4 .
(A|b) = 1
2
1 a − 2 2 − 2a |
6
Per calcolare il rango di questa matrice utilizzeremo trasformazioni elementari sulle righe per ridurla a forma triangolare superiore. Iniziamo
scambiando tra di loro la prima e seconda riga, ottenendo:


1
a
2
|
4
1 a − 1 2 − a | a + 5 .
1 a − 2 2 − 2a2 |
6
Ora sostituiamo la seconda riga con la differenza tra la prima e la seconda
riga, e alla terza riga sottraiamo la prima:


1 a
2
|
4
0 1
a
| −a − 1 .
2
0 −2 −2a |
2
A questo punto alla terza riga sommiamo la seconda riga moltiplicata per
2:


1 a
2
|
4
0 1
a
| −a − 1 .
2
0 0 2(a − a ) | −2a
È ora immediato riconoscere che, per a = 0 si ha rango(A) = rango(A|b) =
2, quindi il sistema è compatibile ed ammette infinite soluzioni, dipendenti
da 3 − 2 = 1 parametro. Le soluzioni si trovano risolvendo il sistema corrispondente alle prime due righe dell’ultima matrice (ovviamente per a = 0),
cioè:
x + 2z = 4
y = −1
da cui si ricava (ad esempio)


 x = 4 − 2t
y = −1

z =t
per ogni t ∈ R.
Per a = 1 si ha invece rango(A) = 2 ma rango(A|b) = 3, quindi il sistema
è incompatibile, ossia non ammette soluzioni.
3. Soluzioni
63
Infine, se a 6= 0, 1, si ha rango(A) = rango(A|b) = 3, quindi il sistema ammette un’unica soluzione, che si trova risolvendo il sistema corrispondente
all’ultima matrice:


 x + ay + 2z = 4
y + az = −a − 1

 2(a − a2 )z = −2a
Questo sistema si risolve facilmente per sostituzione, ricavando z dall’ultima
equazione, sostituendo il valore trovato nelle equazioni precedenti, ricavando
poi y dalla penultima, etc. Si trova:

1


z=


a−1



−a2 − a + 1
y=

a−1



3
2


 x = a + a + 3a − 6
a−1
Presentiamo ora un altro metodo per discutere e risolvere lo stesso sistema lineare. Sia


1 a−1 2−a
a
2 
A = 1
1 a − 2 2 − 2a2
la matrice (incompleta) del sistema e b = (a + 5, 4, 6) la colonna dei termini
noti. Poniamo ∆ = det A. Si ha ∆ = 2a(1 − a), quindi ∆ = 0 per a = 0
o a = 1. Pertanto, se a 6= 0, 1, la matrice A è invertibile (il sistema è un
sistema “di Cramer”) e il sistema ammette un’unica soluzione, data da
 


x
a+5
y  = A−1 b = A−1  4  .
z
6
Esplicitamente, si ha x = ∆x /∆, y = ∆y /∆ e z = ∆z /∆, ove ∆x (rispettivamente, ∆y , ∆z ) è il determinante della matrice che si ottiene da A
sostituendo alla prima (rispettivamente, seconda, terza) colonna la colonna
dei termini noti. Otteniamo quindi:
∆x = 2a(6 − 3a − a2 − a3 ),
∆y = 2a(a2 + a − 1),
∆z = −2a,
64
4. Sistemi Lineari
da cui si ottiene

∆x
6 − 3a − a2 − a3


=
x
=


∆
1−a



2
∆y
a +a−1
y=
=

∆
1−a




∆
1

z = z =
∆
a−1
I due casi rimanenti, a = 0 e a = 1, vanno trattati a parte.
Per a = 0 si ha:


 
1 −1 2
5
A = 1 0 2 ;
b = 4 .
1 −2 2
6
Si vede subito che rango(A) = 2. Calcolando tutti i minori di ordine tre
estratti dalla matrice (A|b), si trova sempre 0, quindi anche rango(A|b) = 2.
Il sistema è dunque compatibile e ammette infinite soluzioni, dipendenti da
un parametro. Tali soluzioni si trovano risolvendo, ad esempio, il sistema
corrispondente alla prime due righe della matrice A:
x − y + 2z = 5
x + 2z = 4
da cui si ricava (ad esempio)


 x = 4 − 2t
y = −1

z =t
per ogni t ∈ R.
Infine, per a = 1, si ha:


1 0 1
A = 1 1 2 ;
1 −1 0
 
6
b = 4 .
6
Si ha anche in questo caso rango(A) = 2, tuttavia rango(A|b) = 3, come
si vede, ad esempio, considerando il minore di ordine tre costituito dalle
prime due colonne di A e dalla colonna b. In questo caso il sistema è
dunque incompatibile.
Svolgimento esercizio 4. In questo caso non è richiesto di risolvere sempre
il sistema, quindi possiamo limitarci, per ora, a studiare il rango delle matrici
del sistema:


1 2 2 1 | 1
0 1 2 1 | 0

(A|b) = 
1 1 λ 0 | 0 .
0 λ 2λ λ2 | 0
3. Soluzioni
65
Con operazioni elementari sulle righe si può trasformare questa matrice fino
ad ottenere la matrice seguente:


1 2 2
1
| 1
0 1 2
1
| 0

.
0 0 λ
0
| −1
0 0 0 λ2 − λ | 0
Si scopre allora che, se λ = 0 si ha rango(A) = 2 e rango(A|b) = 3, quindi il
sistema non ammette soluzione. Se λ = 1 si ha rango(A) = 3 = rango(A|b),
quindi il sistema ammette soluzioni e, dato che il rango di A non è 4, le
soluzioni sono infinite (e dipendono da 4 − 3 = 1 parametro). Infine, se
λ 6= 0, 1, la matrice A ha rango massimo (= 4), quindi è invertibile, ed il
sistema ha un’unica soluzione.
A questo punto non ci rimane altro che risolvere il sistema nel solo caso
λ = 1. In questo caso il sistema diventa

x + 2y + 2w + z = 1



 y + 2w + z = 0
x+y+w =0




y + 2w + z = 0
che, mediante eliminazione di Gauss, è equivalente al sistema

x + 2y + 2w + z = 1



 y + 2w + z = 0
w = −1




0=0
da cui si ottiene, ricavando ad esempio x, y e w in funzione di z,


 x=z−1
y =2−z

 w = −1.
Svolgimento esercizio 5. Utilizzando il metodo di eliminazione di Gauss
si ottiene, alla fine, il sistema

x + 3y + 5z + 3t = b1



 y + 2z = b2 − b1
0 = b3 − b2 + b1




t = 2b1 − b2 − b4 .
Si trova dunque che, se b3 − b2 + b1 6= 0, il sistema non ha soluzione, mentre
se b3 − b2 + b1 = 0 ci sono infinite soluzioni, date (ad esempio ricavando x,
66
4. Sistemi Lineari
y e t in funzione di z) da


 t = 2b1 − b2 − b4
y = b2 − b1 − 2z

 x = −2b + 3b + z.
1
4
Svolgimento esercizio 6. In questo caso non è richiesto di risolvere il
sistema, quindi basta studiare il rango delle matrici completa e incompleta.


λ−1 2 0
3
| 0
 0
λ 0 λ + 1 | 1

(A|b) = 
 1
0 λ
1
| 0
λ−1 0 0
1
| 0
Con operazioni elementari sulle righe si può trasformare questa matrice fino
ad ottenere


1 0
λ
1
| 0
0 2 λ − λ2 4 − λ | 0


0 0 λ − λ2 2 − λ | 0 .
0 0
0
1
| 1
A questo punto si scopre che, se λ = 0, 1 si ha rango(A) = 3 e rango(A|b) =
4, quindi il sistema non ha soluzioni. Se invece λ 6= 0, 1 la matrice A
ha rango massimo, quindi è invertibile e dunque la soluzione esiste ed è
unica. Il fatto che tale soluzione appartenga a Q4 è ovvio, dato che tutte
le operazioni necessarie per risolvere il sistema coinvolgono solo somme e
prodotti di numeri razionali.
Svolgimento esercizio 7. Calcoliamo il rango delle matrici completa e
incompleta:


λ −µ −µ | µ
(A|b) = µ −λ 0 | λ .
1 −1 −1 | 0
Con operazioni elementari sulle righe si ottiene alla fine la matrice


1 −1
−1 |
0
0 λ − µ λ − µ |
µ .
0
0
λ
| λ+µ
Bisogna distinguere allora i seguenti casi:
(1) λ = 0, µ = 0: si ha rango(A) = rango(A|b) = 1, quindi esistono
infinite soluzioni (dipendenti da 3 − 1 = 2 parametri);
(2) λ = 0, µ 6= 0: si ha rango(A) = 2, rango(A|b) = 3, quindi non
esistono soluzioni;
(3) λ 6= 0, µ = λ: si ha rango(A) = 2, rango(A|b) = 3, quindi non
esistono soluzioni;
(4) λ 6= 0, µ 6= λ: si ha rango(A) = rango(A|b) = 3, quindi il sistema
ha un’unica soluzione.
3. Soluzioni
Studiamo ora lo stesso sistema in

λ

A= µ
1
67
un altro modo. Sia

−µ −µ
−λ 0 
−1 −1
la matrice (incompleta) del sistema lineare e b = (µ, λ, 0) la colonna dei
termini noti. Poniamo ∆ = det A. Si ha ∆ = λ(λ − µ), quindi ∆ = 0 per
λ = 0 o λ = µ. Pertanto, se λ 6= 0 e λ 6= µ, la matrice A è invertibile (il
sistema è un sistema “di Cramer”) e il sistema ammette un’unica soluzione.
Rimangono da trattare i due casi λ = 0 e λ = µ. Se λ = 0 si ha:


 
0 −µ −µ
µ
0 ;
A = µ 0
b = 0 .
1 −1 −1
0
Ora, se µ 6= 0 si ha rango(A) = 2 e rango(A|b) = 3, quindi il sistema non
ammette soluzioni. Se invece µ = 0, si ha rango(A) = rango(A|b) = 1,
quindi il sistema è compatibile ed ammette infinite soluzioni, dipendenti da
3 − 1 = 2 parametri.
Nell’ultimo caso, cioè per λ = µ 6= 0, si ha:


 
µ −µ −µ
µ



µ
−µ
0
A=
;
b = µ .
1 −1 −1
0
Anche in questo caso si ha rango(A) = 2 e rango(A|b) = 3, quindi il sistema
non ammette soluzioni.
Capitolo 5
Autovalori e Autovettori
1. Richiami di teoria
1.1. Definizioni
Sia f : V → V un’applicazione lineare di uno spazio vettoriale V in sé.
Definizione 1.1. Un vettore non nullo v ∈ V è detto autovettore di f se
esiste uno scalare λ ∈ C tale che
f (v) = λv.
In tal caso lo scalare λ è detto autovalore di f , e si dice che l’autovettore v
è associato all’autovalore λ.
Se A è la matrice di f rispetto a una base fissata di V , si parla di
autovalori e autovettori di A per indicare gli autovalori e autovettori di f .
Più precisamente, possiamo dare la seguente definizione:
Definizione 1.2. Sia A una matrice quadrata di ordine n a coefficienti nel
campo C. Un autovettore di A è un vettore non nullo (x1 , . . . , xn ) ∈ C n
tale che
 
 
x1
x1
.
A  ..  = λ  ...  ,
xn
xn
per uno scalare λ ∈ C, detto autovalore di A.
Definizione 1.3. Sia A una matrice quadrata di ordine n. Il polinomio
PA (x) = det(A − xI)
è detto il polinomio caratteristico di A.
Teorema 1.4. Gli autovalori di una matrice quadrata A sono le radici
del polinomio caratteristico, cioè sono le soluzioni della seguente equazione
(detta equazione caratteristica):
det(A − xI) = 0
Notiamo che se due matrici A e A0 sono simili, cioè rappresentano la
stessa applicazione lineare f : V → V rispetto a basi diverse di V , allora
70
5. Autovalori e Autovettori
hanno lo stesso polinomio caratteristico. Dal teorema di Binet segue infatti
che
PA0 (x) = det(A0 − xI) = det(P AP −1 − xI)
= det(P (A − xI)P −1 ) = det P det(A − xI) det P −1
= det(A − xI) = PA (x).
Si deduce quindi che matrici simili hanno gli stessi autovalori, quindi gli
autovalori dipendono solo dalla applicazione lineare f e non dalla matrice
che la rappresenta.
Osservazione 1.5. Abbiamo appena osservato che matrici simili hanno lo
stesso polinomio caratteristico, e quindi gli stessi autovalori. Si vede facilmente che non vale il viceversa: due matrici che abbiano lo stesso polinomio
caratteristico non sono necessariamente simili.
Se la matrice A ha ordine n l’equazione caratteristica di A è una equazione polinomiale di grado n. Non è quindi detto che gli autovalori di A
esistano. Ciò dipende dal campo C. Il teorema fondamentale dell’algebra
afferma che se C è un campo algebricamente chiuso (come il campo complesso C), ogni polinomio di grado n ha sempre n radici, eventualmente non
tutte distinte. Ciò è ovviamente falso per il corpo reale R: l’equazione di
secondo grado x2 + 1 = 0 non ha infatti soluzioni reali.
Teorema 1.6 (Teorema di Hamilton). Una matrice A soddisfa la sua
equazione caratteristica, cioè PA (A) = 0.
Il teorema di Hamilton afferma che il polinomio caratteristico PA (x) di
una matrice A si annulla quando viene valutato per x = A. In generale
però il polinomio caratteristico non è il polinomio di grado minimo che ha
questa proprietà. Diamo dunque la seguente definizione:
Definizione 1.7. Il polinomio minimo di una matrice A è il polinomio
monico di grado minimo che si annulla quando viene valutato per x =
A. (Ricordiamo che un polinomio di grado r si dice monico quando il
coefficiente di xr è 1).
Un risultato che vale in tutta generalità è il seguente:
Proposizione 1.8. Il polinomio minimo di una matrice A divide il polinomio caratteristico di A.
Dopo aver determinato gli autovalori λi di una matrice A, la ricerca degli
autovettori è ricondotta alla risoluzione di un sistema lineare.
Proposizione 1.9. Se λ è un autovalore di A, gli autovettori corrispondenti
sono le soluzioni non nulle del sistema lineare omogeneo
(A − λI)X = 0,
ove X = (x1 , . . . , xn ).
1. Richiami di teoria
71
Definizione 1.10. L’autospazio Eλ associato all’autovettore λ è l’insieme
di tutte le soluzioni del sistema lineare omogeneo
(A − λI)X = 0.
L’autospazio Eλ è quindi l’insieme di tutti gli autovettori associati all’autovalore λ, più il vettore nullo (che, per definizione, non è considerato
autovettore). Si verifica immediatamente che Eλ è effettivamente uno spazio
vettoriale.
1.2. Diagonalizzazione
Sia f : V → V un’applicazione lineare. Se esiste una base di V costituita da
autovettori di f allora si vede immediatamente che la matrice di f rispetto
a tale base è diagonale, e gli elementi sulla diagonale sono precisamente gli
autovalori di f .
Ricordiamo che due matrici A e A0 si dicono simili se rappresentano la
stessa applicazione lineare f rispetto a due basi diverse e questo accade se
e solo se esiste uma matrice invertibile P tale che A0 = P AP −1 . Possiamo
quindi dare la seguente definizione:
Definizione 1.11. Una matrice quadrata A è diagonalizzabile se essa è
simile a una matrice diagonale, cioè se esiste una matrice diagonale D e una
matrice invertibile P tali che
A = P DP −1 .
Da quanto detto in precedenza si deduce che, se A è diagonalizzabile e
vale la relazione A = P DP −1 , la matrice diagonale D deve avere sulla diagonale gli autovalori di A, mentre la matrice P deve essere composta dagli
autovettori della matrice A, scritti in colonna, e considerati nello stesso ordine in cui sono stati disposti sulla diagonale di D gli autovalori di A. Precisamente, se λ1 , . . . , λn sono gli n autovalori di A e se v1 = (p11 , p21 , . . . , pn1 ),
. . . , vn = (p1n , p2n , . . . , pnn ) sono gli autovettori corrispondenti, allora si ha:




p11 p12 · · · p1n
λ1 0 · · · 0
 0 λ2 · · · 0 
 p21 p22 · · · p2n 
,
 .
D=
P
=
.
.
..
.
.
.. 
.
..
 ..
 ..
..
. . .. 
.
.
. 
0
0
· · · λn
pn1 pn2 · · · pnn
Quindi possiamo concludere che affinché una matrice quadrata A, di ordine
n, a coefficienti in un campo C sia diagonalizzabile è necessario e sufficiente
che la matrice A abbia tutti i suoi autovalori nel campo C e che esistano n
autovettori linearmente indipendenti.
Consideriamo ora alcune condizioni che garantiscono che una matrice sia
diagonalizzabile.
72
5. Autovalori e Autovettori
Proposizione 1.12. Se v1 e v2 sono due autovettori relativi agli autovalori
λ1 e λ2 rispettivamente, e se λ1 6= λ2 , allora v1 e v2 sono linearmente
indipendenti.
Da questo risultato discende immediatamente il seguente teorema:
Teorema 1.13. Se una matrice quadrata A di ordine n possiede n autovalori a due a due distinti, allora A è diagonalizzabile.
Consideriamo ora il caso in cui gli autovalori esistono nel campo C ma
non sono tutti distinti.
Definizione 1.14. Un autovalore λ di una matrice A ha molteplicità r se
nel polinomio caratteristico di A compare il fattore (x − λ)r .
Se un autovalore λ ha molteplicità r, si può dimostrare che l’autospazio
Eλ corrispondente avrà in generale dimensione ≤ r. Si ha quindi:
Teorema 1.15. Una matrice quadrata A di ordine n a coefficienti nel campo C è diagonalizzabile se e solo se essa possiede tutti i suoi autovalori
nel campo C e se per ogni autovalore λ di molteplicità r l’autospazio Eλ
corrispondente ha esattamente dimensione r.
1.3. Forma canonica di Jordan
Da quanto visto in precedenza si deduce che, anche se una matrice possiede
tutti i suoi autovalori nel campo C (il che accade sempre se C è algebricamente chiuso), non è detto che essa sia diagonalizzabile. Si dimostra però
che in ogni caso essa è simile ad una matrice “non troppo distante” da una
matrice diagonale. Precisiamo ora questo concetto.
Sia A una matrice quadrata di ordine n e sia λ un autovalore di A.
Definizione 1.16. Un blocco di Jordan di ordine r relativo all’autovalore
λ è la seguente matrice quadrata di ordine r:
λ
0

0
Jλ = 
.
 ..

1
λ
0
..
.
0 0
1 0
λ 1
.. . .
.
.
0 0 0 0
···
···
···
..
.

0
0

0 .

1
··· λ
Si può quindi dimostrare il seguente teorema.
Teorema 1.17. Sia A una matrice quadrata di ordine n a coefficienti in
un campo C. Se A possiede tutti i suoi autovalori nel campo C allora essa
2. Esercizi
è simile ad una matrice del tipo

Jλ1 0
0
 0 Jλ2 0

0
0 Jλ3
J =
 .
..
..
 ..
.
.
0
0
0
73
···
···
···
..
.
0
0
0
..
.






· · · Jλr
ove sulla diagonale troviamo le matrici Jλi che sono dei blocchi di Jordan
relativi agli autovettori λi di A. La matrice J è detta la forma canonica di
Jordan di A, essa è unica a meno di una permutazione dei blocchi di Jordan
Jλi .
Negli esercizi verranno illustrati dei metodi per determinare la forma
canonica di Jordan di una matrice A.
2. Esercizi
2.1. Diagonalizzazione
Esercizio 1. Si dica se la matrice


1
4 1
A = −4 −7 2
6
6 0
è diagonalizzabile (cioè simile ad una matrice diagonale). In caso affermativo, si determinino una matrice diagonale D ed una matrice invertibile P
tali che A = P DP −1 .
Esercizio 2. Si dica se la matrice


1 4 0 −2
0 1 0 0 

A=
0 −2 1 1 
0 4 0 −1
è diagonalizzabile (cioè simile ad una matrice diagonale). In caso affermativo, si determinino una matrice diagonale D ed una matrice invertibile P
tali che D = P −1 AP .
Esercizio 3. Determinare per quali valori del parametro reale t la matrice


3
−1
−1
A = t − 1 t + 3 t + 1 
−t
−t 2 − t
è diagonalizzabile (cioè simile ad una matrice diagonale). Per ciascuno di
questi valori determinare una matrice diagonale D ed una matrice invertibile
P tali che A = P DP −1 .
74
5. Autovalori e Autovettori
Esercizio 4. Si calcoli An , per ogni intero n ≥ 1, dove A è la matrice
5/2 −1
A=
.
3 −1
Esercizio 5. Si calcoli exp(A), dove

3
A= 0
−3
A è la matrice

−2 0
0 −2 .
2 −2
Esercizio 6. Sia A una matrice quadrata non nulla, tale che An = 0 per
qualche intero n ≥ 2 (una tale matrice A è detta nilpotente). Dimostrare
che tutti gli autovalori di A sono nulli.
2.2. Forma Canonica di Jordan
Esercizio 7. Determinare la forma canonica di Jordan dell’endomorfismo
φ : R3 → R3 la cui matrice, rispetto alla base canonica, è


3
4
4
A = −3 −6 −8 .
3
7
9
Si determini inoltre una base di R4 rispetto a cui la matrice di φ è la forma
canonica trovata.
Esercizio 8. Determinare la forma canonica di Jordan dell’endomorfismo
φ : R4 → R4 la cui matrice, rispetto alla base canonica, è


−1 0
0
0
0
1
0
0

A=
 1 −3 −1 −1 .
0 −2 0
1
Si determini inoltre una base di R4 rispetto a cui la matrice di φ è la forma
canonica trovata.
Esercizio 9. Determinare la forma canonica di Jordan dell’endomorfismo
φ : R4 → R4 la cui matrice, rispetto alla base canonica, è


2 0 0
0
−4 2 −4 −3
.
A=
4 0 5
3
−3 0 −2 0
Si determini inoltre una base di R4 rispetto a cui la matrice di φ è la forma
canonica trovata.
2. Esercizi
75
Esercizio 10. Determinare la forma canonica di Jordan dell’endomorfismo
φ : R4 → R4 la cui matrice, rispetto alla base canonica, è


0 0 2 −4
1 2 −1 2 
.
A=
0 0 2
0
1 0 −1 4
Si determini inoltre una base di R4 rispetto a cui la matrice di φ è la forma
canonica trovata.
Esercizio 11. Sia A una matrice n × n a coefficienti reali tale che A2 = A.
Si dimostri che A è diagonalizzabile e che i suoi autovalori sono solo 0 oppure
1. Si dimostri inoltre che, se anche B è una matrice tale che B 2 = B, allora
A e B sono simili se e solo se hanno lo stesso rango.
Esercizio 12. Sia A una matrice n × n a coefficienti reali, non-degenere
e antisimmetrica. Si dimostri che tutti gli autovalori di A sono puramente
immaginari.
2.3. Polinomio Minimo e Polinomio Caratteristico
Esercizio 13. Sia V uno spazio vettoriale complesso di dimensione 9.
Si determinino tutti gli endomorfismi φ di V che soddisfano alle seguenti
condizioni:
dim Ker(φ − 2 id) = 1,
dim Ker(φ − 2 id)3 = 3,
dim Ker(φ − 3 id) = 2,
dim Ker(φ − 3 id)2 = 4,
dim Im(φ2 ) = 7.
Esercizio 14. Sia V uno spazio vettoriale complesso di dimensione 6. Si
determinino tutti gli endomorfismi φ di V che hanno rango ≥ 4 ed il cui
polinomio minimo è x4 − 6x3 + 9x2 .
2.4. Esercizi Vari
Esercizio 15. I numeri di Fibonacci sono i termini della successione definita
ponendo x1 = 1, x2 = 1 e xn = xn−1 + xn−2 , per n ≥ 3 (i primi termini sono
1, 1, 2, 3, 5, 8, 13, 21, etc.).
Si determini una formula per calcolare l’ennesimo numero di Fibonacci
xn , per ogni n > 0.
76
5. Autovalori e Autovettori
3. Soluzioni
3.1. Diagonalizzazione
Svolgimento esercizio 1. Determiniamo gli autovalori di A. Si ha:


1−λ
4
1
det(A − λI) = det  −4 −7 − λ 2 
6
6
−λ


1−λ 3+λ
1
= det  −4 −3 − λ 2 
6
0
−λ


1−λ 3+λ 1
0
3 
= det −3 − λ
6
0
−λ
−3 − λ 3
= −(3 + λ) det
6
−λ
= −(3 + λ)(λ2 + 3λ − 18),
dove, nel primo passaggio abbiamo sottratto alla seconda colonna la prima,
mentre nel secondo abbiamo sommato alla seconda riga la prima.
Si ha dunque det(A − λI) = 0 per λ = −3, λ = 3 e λ = −6. Questi
sono i tre autovalori della matrice A, che è quindi diagonalizzabile avendo
tre autovalori (reali e) distinti. Possiamo dunque prendere come matrice
diagonale D, ad esempio, la matrice


−6 0 0
D =  0 −3 0 .
0
0 3
Per determinare una matrice invertibile P tale che A = P DP −1 è necessario
determinare gli autovettori della matrice A.
Iniziamo dagli autovettori relativi all’autovalore λ1 = −6; essi sono le
soluzioni del sistema
 
x1
(A − λ1 I) x2  = 0.
x3
Sviluppando i calcoli si ottiene il sistema


 7x1 + 4x2 + x3 = 0
− 4x1 − x2 + 2x3 = 0

 6x + 6x + 6x = 0
1
2
3
3. Soluzioni
77
le cui soluzioni sono date da x2 = −2x1 e x3 = x1 . Un autovettore relativo
all’autovalore λ1 = −6 è, ad esempio, il vettore v1 = (1, −2, 1). Questo
costituirà la prima colonna della matrice P .
Per l’autovalore λ2 = −3 si ottiene il sistema
 
x1
(A − λ2 I) x2  = 0,
x3
che fornisce


 4x1 + 4x2 + x3 = 0
− 4x1 − 4x2 + 2x3 = 0

 6x + 6x + 3x = 0
1
2
3
le cui soluzioni sono x1 = −x2 e x3 = 0. Un autovettore relativo all’autovalore λ2 = −3 è, ad esempio, il vettore v2 = (−1, 1, 0). Questo costituirà la
seconda colonna della matrice P .
Finalmente, per l’autovalore λ3 = 3 si ottiene il sistema
 
x1

(A − λ3 I) x2  = 0,
x3
che fornisce


 − 2x1 + 4x2 + x3 = 0
− 4x1 − 10x2 + 2x3 = 0

 6x + 6x − 3x = 0
1
2
3
le cui soluzioni sono x2 = 0 e x3 = 2x1 . Un autovettore relativo all’autovalore λ3 = 3 è, ad esempio, il vettore v3 = (1, 0, 2). Questo costituirà la
terza colonna della matrice P . Si ha quindi


1 −1 1
P = −2 1 0 .
1
0 2
Si può ora verificare, per esercizio, che AP = P D, cioè che A = P DP −1 ,
come richiesto.
78
5. Autovalori e Autovettori
Svolgimento esercizio 2. Determiniamo gli autovalori di A:

1−λ
4
0
−2
 0
1−λ
0
0 

det(A − λI) = det 
 0
−2 1 − λ
1 
0
4
0
−1 − λ


1−λ
0
0
1 
= (1 − λ) det  −2 1 − λ
4
0
−1 − λ
1−λ
1
2
= (1 − λ) det
0
−1 − λ

= (1 − λ)3 (−1 − λ) = 0,
le cui soluzioni sono λ1 = 1, con molteplicità 3, e λ2 = −1, con molteplicità
1. Si noti che gli autovalori di A non sono tutti distinti, di conseguenza le
informazioni che abbiamo finora non sono sufficienti per decidere se A sia
diagonalizzabile o meno. Determiniamo allora gli autovettori di A.
Iniziamo dagli autovettori relativi all’autovalore λ1 = 1; essi sono le
soluzioni del sistema
 
x1
x2 

(A − 1I) 
x3  = 0.
x4
Sviluppando i calcoli si ottiene il sistema


 4x2 − 2x4 = 0
− 2x2 + x4 = 0

 4x − 2x = 0
2
4
le cui soluzioni sono date da x4 = 2x2 (x1 , x2 e x3 sono liberi di variare).
Si scopre cosı̀ che l’autospazio relativo all’autovalore λ1 = 1 ha dimensione
3, uguale alla molteplicità dell’autovalore in questione. Una base di tale
autospazio è data, ad esempio, dai vettori v1 = (1, 0, 0, 0), v2 = (0, 1, 0, 2) e
v3 = (0, 0, 1, 0).
Per l’autovalore λ2 = −1 si ottiene il sistema
 
x1
x2 

(A + 1I) 
x3  = 0,
x4
3. Soluzioni
79
che fornisce

2x1 + 4x2 − 2x4 = 0



 2x2 = 0
− 2x2 + 2x3 + x4 = 0




4x2 = 0
le cui soluzioni sono x1 = −2x3 , x2 = 0 e x4 = −2x3 . L’autospazio relativo
all’autovalore λ2 = −1 ha quindi dimensione 1 (ovviamente!), uguale anche
in questo caso alla molteplicità dell’autovalore in questione. Una base di
tale autospazio è data, ad esempio, dal vettore v4 = (−2, 0, 1, −2).
In conclusione, la matrice A è diagonalizzabile e le due matrici D e P
richieste sono, ad esempio,


1 0 0 0
0 1 0 0 

D=
0 0 1 0 
0 0 0 −1
e


1 0 0 −2
0 1 0 0 

P =
0 0 1 1  .
0 2 0 −2
Si può ora verificare, per esercizio, che AP = P D, cioè che D = P −1 AP ,
come richiesto.
Svolgimento esercizio 3. Determiniamo gli autovalori di A. Si ha:


3−λ
−1
−1
t+1 
det(A − λI) = det  t − 1 t + 3 − λ
−t
−t
2−t−λ


4−λ
−1
−1
t+1 
= det −4 + λ t + 3 − λ
0
−t
2−t−λ


4−λ
−1
−1

t+2−λ
t
= det  0
0
−t
2−t−λ
t+2−λ
t
= (4 − λ) det
−t
2−t−λ
= (4 − λ)(λ − 2)2 ,
dove, nel primo passaggio abbiamo sottratto alla prima colonna la seconda,
mentre nel secondo abbiamo sommato alla seconda riga la prima.
Le soluzioni di det(A − λI) = 0 sono quindi λ1 = 2, con molteplicità
2, e λ2 = 4, con molteplicità 1. Si noti che gli autovalori di A non sono
tutti distinti, di conseguenza le informazioni che abbiamo finora non sono
80
5. Autovalori e Autovettori
sufficienti per decidere se A sia diagonalizzabile o meno. Determiniamo
allora gli autovettori di A.
Iniziamo dagli autovettori relativi all’autovalore λ1 = 2; essi sono le
soluzioni del sistema
 
x1
(A − 2I) x2  = 0.
x3
Sviluppando i calcoli si ottiene il sistema


 x1 − x2 − x3 = 0
(t − 1)x1 + (t + 1)x2 + (t + 1)x3 = 0

 − tx − tx − tx = 0
1
2
3
Se t 6= 0, le soluzioni sono x1 = 0 e x2 = −x3 , da cui si deduce che l’autospazio relativo all’autovalore λ1 = 2 ha dimensione 1. Dato che la dimensione
dell’autospazio è minore della molteplicità dell’autovalore corrispondente,
possiamo concludere che, per t 6= 0, la matrice A non è diagonalizzabile.
Se invece t = 0, le soluzioni del sistema lineare sono date da x1 = x2 +x3 .
In questo caso l’autospazio relativo all’autovalore λ1 = 2 ha dimensione 2,
uguale alla molteplicità dell’autovalore corrispondente. Dato che l’autovalore λ2 = 4 ha molteplicità 1, possiamo concludere che la matrice A è
diagonalizzabile solo per t = 0. Una base dell’autospazio relativo all’autovalore λ1 = 2 è data, ad esempio, dai vettori v1 = (1, 1, 0) e v2 = (1, 0, 1),
che costituiranno le prime due colonne della matrice P .
Per l’autovalore λ2 = 4 si ottiene il sistema
 
x1

(A − 4I) x2  = 0,
x3
che fornisce


 − x1 − x2 − x3 = 0
(t − 1)x1 + (t − 1)x2 + (t + 1)x3 = 0

 − tx − tx − (t + 2)x = 0
1
2
3
Risolviamolo solo per il valore che interessa, t = 0. Si trova x1 = −x2 e
x3 = 0. Un autovettore relativo all’autovalore λ2 = 4 è, ad esempio, il
vettore v3 = (−1, 1, 0). Questo costituirà la terza colonna della matrice P .
In conclusione, la matrice A è diagonalizzabile solo per t = 0, nel qual
caso le due matrici D e P richieste sono, ad esempio,


2 0 0
D = 0 2 0
0 0 4
3. Soluzioni
81
e


1 1 −1
P = 1 0 1  .
0 1 0
Svolgimento esercizio 4. Determiniamo gli autovalori di A:
5/2 − λ
−1
det(A − λI) = det
3
−1 − λ
1
3
= λ2 − λ + = 0,
2
2
le cui soluzioni sono λ1 = 1/2 e λ2 = 1. Dato che gli autovalori di A sono
tutti distinti, A è diagonalizzabile.
Determiniamo ora gli autovettori di A. Iniziamo dagli autovettori relativi
all’autovalore λ1 = 1/2; essi sono le soluzioni del sistema
1
x
(A − I) 1 = 0.
x2
2
Sviluppando i calcoli si ottiene il sistema

 2x1 − x2 = 0
3
 3x1 − x2 = 0
2
le cui soluzioni sono date da x2 = 2x1 . Un autovettore relativo all’autovalore
λ1 = 1/2 è, ad esempio, v1 = (1, 2).
Per l’autovalore λ2 = 1 si ottiene il sistema
x
(A − 1I) 1 = 0,
x2
che fornisce

 3x − x = 0
1
2
2
 3x − 2x = 0
1
2
le cui soluzioni sono x1 = 32 x2 . Un autovettore relativo all’autovalore λ2 = 1
è, ad esempio, v2 = (2, 3).
In conclusione, la matrice A è diagonalizzabile e, se poniamo
1/2 0
1 2
,
P =
,
D=
0 1
2 3
si ha A = P DP −1 . Calcoliamo ora P −1 . Si ha det P = −1, quindi
−3 2
−1
P =
.
2 −1
82
5. Autovalori e Autovettori
È ora facile calcolare An . Si ha infatti:
An = (P DP −1 )n = (P DP −1 )(P DP −1 ) · · · (P DP −1 ) = P Dn P −1
1
−3 2
1 2
0
n
2
=
2 −1
2 3
0 1n
3
1
4 − 2n 2n−1 − 2
=
.
3
1
6 − 2n−1
−3
2n−2
Svolgimento esercizio 5. Ricordiamo che l’esponenziale di una matrice
quadrata, exp(A), è definito come somma della seguente serie (convergente,
per ogni matrice A):
+∞
X
1 n
exp(A) =
A .
n!
n=0
Da questa formula discende che, se D è una matrice diagonale i cui elementi sulla diagonale principale sono d1 , . . . , dr , allora exp(D) è ancora una
matrice diagonale, avente sulla diagonale principale gli elementi ed1 , . . . , edr .
Se A è simile ad una matrice diagonale, si ha A = P DP −1 , ove D è
una matrice diagonale e P una matrice invertibile. In questo caso è facile
calcolare exp(A). Si ha infatti:
+∞
+∞
X
1 n X 1
exp(A) =
A =
(P DP −1 )n
n!
n!
n=0
n=0
X
+∞
+∞
X 1
1 n
n −1
=
PD P = P
D P −1
n!
n!
n=0
n=0
= P exp(D)P −1 ,
quindi il calcolo di exp(A) si riduce al calcolo di P , exp(D) e P −1 .
Determiniamo gli autovalori di A:


3 − λ −2
0
−λ
−2 
det(A − λI) = det  0
−3
2 −2 − λ
= λ(−λ2 + λ + 2) = 0,
le cui soluzioni sono λ1 = 0, λ2 = −1 e λ3 = 2. Dato che gli autovalori di A
sono tutti distinti, A è diagonalizzabile.
Determiniamo ora gli autovettori di A. Iniziamo dagli autovettori relativi
all’autovalore λ1 = 0; essi sono le soluzioni del sistema
 
x1

A x2  = 0.
x3
3. Soluzioni
83
Sviluppando i calcoli si ottiene il sistema


 3x1 − 2x2 = 0
− 2x3 = 0

 − 3x + 2x − 2x = 0
1
2
3
le cui soluzioni sono date da x1 = 32 x2 e x3 = 0. Un autovettore relativo
all’autovalore λ1 = 0 è, ad esempio, v1 = (2, 3, 0).
Per l’autovalore λ2 = −1 si ottiene il sistema
 
x1

(A + 1I) x2  = 0,
x3
che fornisce


 4x1 − 2x2 = 0
x2 − 2x3 = 0

 − 3x + 2x − x = 0
1
2
3
le cui soluzioni sono x1 = x3 e x2 = 2x3 . Un autovettore relativo all’autovalore λ2 = −1 è, ad esempio, v2 = (1, 2, 1).
Per l’autovalore λ3 = 2 si ottiene il sistema
 
x1
(A − 2I) x2  = 0,
x3
che fornisce


 x1 − 2x2 = 0
− 2x2 − 2x3 = 0

 − 3x + 2x − 4x = 0
1
2
3
le cui soluzioni sono x1 = 2x2 e x3 = −x2 . Un autovettore relativo
all’autovalore λ3 = 2 è, ad esempio, v3 = (2, 1, −1).
In conclusione, la matrice A è diagonalizzabile e, se poniamo




0 0 0
2 1 2
P = 3 2 1  ,
D = 0 −1 0 ,
0 0 2
0 1 −1
si ha A = P DP −1 . Calcoliamo ora P −1 . Si

−1
1
−1

1 −2/3
P =
1 −2/3
ha det P = 3 e

−1
4/3 .
1/3
84
5. Autovalori e Autovettori
Da quanto visto in precedenza, si ha quindi:
exp(A) = P exp(D)P −1

 0


2 1 2
e
0 0
−1
1
−1
= 3 2 1   0 e−1 0   1 −2/3 4/3
1 −2/3 1/3
0 0 e2
0 1 −1


2
4
−2 + 1e + 2e2 2 − 3e
− 43 e2 −2 + 3e
+ 23 e2
4
8
− 23 e2 −3 + 3e
+ 13 e2  .
=  −3 + 2e + e2 3 − 3e
4
1
2
2 2
1 2
2
−e
− 3e + 3 e
− 3e
e
3e
Svolgimento esercizio 6. Sia λ ∈ C un autovalore di A (ricordiamo che il
corpo complesso C è algebricamente chiuso, quindi ogni matrice quadrata A
ammette tutti i suoi autovalori in C) e sia v un autovettore corrispondente.
Si ha dunque Av = λv e, di conseguenza, A2 v = A(Av) = A(λv) = λAv =
λ2 v. Ciò significa che, se λ è un autovalore di A, allora λ2 è un autovalore di
A2 . Analogamente si dimostra che A3 v = λ3 v e, in generale, che An v = λn v
per ogni intero n ≥ 2. In altre parole, se λ è un autovalore di A, allora λn
è un autovalore di An . Supponendo ora che An = 0, si deduce che λn = 0,
e quindi λ = 0, per ogni autovalore λ di A, cioè che tutti gli autovalori di
A sono nulli.
3.2. Forma Canonica di Jordan
Svolgimento esercizio 7. Determiniamo gli autovalori di A:


λ − 3 −4
−4
λ+6
8 
det(λI − A) = det  3
−3
−7 λ − 9
3
3 λ + 6
λ + 6
8
8
+ 4
= (λ − 3) −3 λ − 9 − 4 −3 −7 −7 λ − 9
= λ3 − 6λ2 + 11λ − 6 = 0,
le cui soluzioni sono λ1 = 1, λ2 = 2 e λ3 = 3. La matrice A ha quindi 3
autovalori distinti e, di conseguenza, la sua forma canonica di Jordan è


1 0 0
J = 0 2 0 .
0 0 3
Una base di R3 rispetto alla quale la matrice di φ è J è costituita dagli
autovettori relativi agli autovalori 1, 2 e 3 di A.
3. Soluzioni
85
Determiniamo ora gli autovettori relativi all’autovalore λ1 = 1; essi sono
le soluzioni del sistema
 
x1
(A − λ1 I) x2  = 0.
x3
Sviluppando i calcoli si ottiene il sistema


 2x1 + 4x2 + 4x3 = 0
− 3x1 − 7x2 − 8x3 = 0

 3x + 7x + 8x = 0
1
2
3
le cui soluzioni sono date da x1 = 2x3 e x2 = −2x3 . Un autovettore relativo
all’autovalore λ1 = 1 è, ad esempio, il vettore v1 = (2, −2, 1). Questo sarà
il primo vettore di una base di Jordan.
Per l’autovalore λ2 = 2 si ottiene il sistema
 
x1
(A − λ2 I) x2  = 0,
x3
che fornisce


 x1 + 4x2 + 4x3 = 0
− 3x1 − 8x2 − 8x3 = 0

 3x + 7x + 7x = 0
1
2
3
le cui soluzioni sono x1 = 0 e x2 = −x3 . Un autovettore relativo all’autovalore λ2 = 2 è, ad esempio, il vettore v2 = (0, −1, 1). Questo sarà il secondo
vettore di una base di Jordan.
Finalmente, per l’autovalore λ3 = 3 si ottiene il sistema
 
x1
(A − λ3 I) x2  = 0,
x3
che fornisce


 4x2 + 4x3 = 0
− 3x1 − 9x2 − 8x3 = 0

 3x + 7x + 6x = 0
1
2
3
le cui soluzioni sono x1 = 31 x3 e x2 = −x3 . Un autovettore relativo all’autovalore λ3 = 3 è, ad esempio, il vettore v3 = (1, −3, 3). Questo sarà il terzo
vettore di una base di Jordan.
Se indichiamo con S la matrice le cui colonne sono costituite dalle componenti dei vettori della base di Jordan trovata,


2
0
1
S = −2 −1 −3 ,
1
1
3
86
5. Autovalori e Autovettori
si ha dunque AS = SJ, da cui si deduce che A = SJS −1 (come esercizio, si
può verificare questa uguaglianza con un calcolo diretto).
Svolgimento esercizio 8. Determiniamo gli autovalori di A:


λ+1
0
0
0
 0
λ−1
0
0 

det(λI − A) = det 
 −1
3
λ+1
1 
0
2
0
λ−1
λ + 1
0
0 λ−1
0 = (λ + 1) 0
0
2
λ − 1
= (λ + 1)2 (λ − 1)2 .
Gli autovalori di A sono quindi λ1 = −1, con molteplicità 2, e λ2 = 1,
anch’esso con molteplicità 2.
Determiniamo ora gli autovettori relativi all’autovalore λ1 = −1; essi
sono le soluzioni del sistema
 
x1
x2 

(A − λ1 I) 
x3  = 0.
x4
Sviluppando i calcoli si ottiene il sistema


 2x2 = 0
x1 − 3x2 − x4 = 0

 − 2x + 2x = 0
2
4
le cui soluzioni sono date da x1 = x2 = x4 = 0 e x3 qualunque. L’insieme
delle soluzioni costituisce quindi un sottospazio vettoriale di dimensione 1,
che è precisamente l’autospazio relativo all’autovalore λ1 = −1. Una sua
base è data, ad esempio, dal vettore v1 = e3 = (0, 0, 1, 0). Questo sarà il
primo vettore di una base di Jordan.
Si può ora dedurre che nella forma canonica di Jordan di A comparirà
un blocco di Jordan della forma
−1 1
,
0 −1
perché l’autovalore −1 ha molteplicità 2, però c’è un solo autovettore linearmente indipendente relativo a tale autovalore.
Di conseguenza, come secondo vettore v2 di una base di Jordan, dovremo
prendere un vettore che soddisfi la condizione seguente:
Av2 = −v2 + v1 ,
ossia
(A + 1I)v2 = v1 .
3. Soluzioni
87
Si ottiene cosı̀ un sistema di equazioni lineari che è uguale al sistema precedente in cui abbiamo sostituito la colonna di zeri a destra dell’uguale con
la colonna delle componenti del vettore v1 .
Sviluppando i calcoli si ottiene il sistema


 2x2 = 0
x1 − 3x2 − x4 = 1

 − 2x + 2x = 0
2
4
le cui soluzioni sono date da x1 = 1, x2 = x4 = 0 e x3 qualunque. Possiamo
quindi prendere come secondo vettore di una base di Jordan il vettore v2 =
(1, 0, 0, 0).
Passiamo ora a considerare l’autovalore λ2 = 1. Gli autovettori corrispondenti si trovano risolvendo il sistema
 
x1
x 2 

(A − λ2 I) 
x3  = 0.
x4
Sviluppando i calcoli si ottiene il sistema


 − 2x1 = 0
x1 − 3x2 − 2x3 − x4 = 0

 − 2x = 0
2
le cui soluzioni sono date da x1 = x2 = 0 e x4 = −2x3 . L’insieme delle
soluzioni costituisce quindi un sottospazio vettoriale di dimensione 1, che
è precisamente l’autospazio relativo all’autovalore λ2 = 1. Una sua base è
data, ad esempio, dal vettore v3 = (0, 0, 1, −2). Questo sarà il terzo vettore
di una base di Jordan.
Si può ora dedurre che nella forma canonica di Jordan di A comparirà
un blocco di Jordan della forma
1 1
,
0 1
perché l’autovalore 1 ha molteplicità 2, ma c’è un solo autovettore linearmente indipendente relativo a tale autovalore.
Di conseguenza, come quarto vettore v4 di una base di Jordan, dovremo
prendere un vettore che soddisfi l’equazione seguente:
Av4 = v4 + v3 ,
ossia
(A − 1I)v4 = v3 .
Si ottiene cosı̀ un sistema di equazioni lineari che è uguale al sistema precedente in cui abbiamo sostituito la colonna di zeri a destra dell’uguale con
la colonna delle componenti del vettore v3 .
88
5. Autovalori e Autovettori
Sviluppando i calcoli si ottiene il sistema


 − 2x1 = 0
x1 − 3x2 − 2x3 − x4 = 1

 − 2x = −2
2
le cui soluzioni sono date da x1 = 0, x2 = 1 e x4 = −2x3 − 4. Possiamo
quindi prendere come quarto vettore di una base di Jordan il vettore v4 =
(0, 1, 0, −4).
Si conclude pertanto che i vettori v1 , v2 , v3 e v4 costituiscono una base
di Jordan, rispetto alla quale l’endomorfismo φ ha matrice di Jordan


−1 1 0 0
 0 −1 0 0
.
J =
0
0 1 1
0
0 0 1
Se indichiamo con S la matrice le cui colonne sono costituite dalle componenti dei vettori della base di Jordan trovata,


0 1 0
0
0 0 0
1
,
S=
1 0 1
0
0 0 −2 −4
si ha dunque AS = SJ, da cui si deduce che A = SJS −1 (come esercizio, si
può verificare questa uguaglianza con un calcolo diretto).
Svolgimento esercizio 9. Determiniamo gli autovalori di A:


λ−2
0
0
0
 4
λ−2
4
3

det(λI − A) = det 
 −4
0
λ − 5 −3
3
0
2
λ
λ − 5 −3
= (λ − 2)2 2
λ
= (λ − 2)2 (λ2 − 5λ + 6)
= (λ − 2)3 (λ − 3).
Gli autovalori di A sono quindi λ1 = 2, con molteplicità 3, e λ2 = 3, con
molteplicità 1.
Determiniamo ora gli autovettori relativi all’autovalore λ1 = 2; essi sono
le soluzioni del sistema
 
x1
x 2 

(A − λ1 I) 
x3  = 0.
x4
3. Soluzioni
89
Sviluppando i calcoli si ottiene il sistema


 − 4x1 − 4x3 − 3x4 = 0
4x1 + 3x3 + 3x4 = 0

 − 3x − 2x − 2x = 0
1
3
4
le cui soluzioni sono date da x1 = x3 = x4 = 0 e x2 qualunque. L’insieme
delle soluzioni costituisce quindi un sottospazio vettoriale di dimensione 1,
che è precisamente l’autospazio relativo all’autovalore λ1 = 2. Una sua base
è data, ad esempio, dal vettore v1 = e2 = (0, 1, 0, 0). Questo sarà il primo
vettore di una base di Jordan.
Si può ora dedurre che nella forma canonica di Jordan di A comparirà
un blocco di Jordan della forma


2 1 0
0 2 1 ,
0 0 2
perché l’autovalore 2 ha molteplicità 3, però c’è un solo autovettore linearmente indipendente relativo a tale autovalore.
Di conseguenza, come secondo vettore v2 di una base di Jordan, dovremo
prendere un vettore che soddisfi la condizione seguente:
Av2 = 2v2 + v1 ,
ossia
(A − 2I)v2 = v1 .
Si ottiene cosı̀ un sistema di equazioni lineari che è uguale al sistema precedente in cui abbiamo sostituito la colonna di zeri a destra dell’uguale con
la colonna delle componenti del vettore v1 .
Le soluzioni di tale sistema sono date da x1 = 0, x3 = −1, x4 = 1 e x2
qualunque. Possiamo quindi prendere come secondo vettore di una base di
Jordan il vettore v2 = (0, 0, −1, 1).
Analogamente, come terzo vettore v3 di una base di Jordan, dovremo
prendere un vettore che soddisfi la condizione seguente:
Av3 = 2v3 + v2 ,
ossia
(A − 2I)v3 = v2 .
Si ottiene cosı̀ un sistema di equazioni lineari che è uguale al sistema precedente in cui abbiamo sostituito la colonna dei termini noti con la colonna
delle componenti del vettore v2 .
Le soluzioni di tale sistema sono date da x1 = −1, x3 = 1, x4 = 0 e
x2 qualunque. Possiamo quindi prendere come terzo vettore di una base di
Jordan il vettore v3 = (−1, 0, 1, 0).
90
5. Autovalori e Autovettori
Passiamo ora a considerare l’autovalore λ2 = 3. Gli autovettori corrispondenti si trovano risolvendo il sistema
 
x1
x 2 

(A − λ2 I) 
x3  = 0.
x4
Sviluppando i calcoli si ottiene il sistema


 − x1 = 0
− 4x1 − x2 − 4x3 − 3x4 = 0

 4x + 2x + 3x = 0
1
3
4
le cui soluzioni sono date da x1 = 0, x2 = −2x3 e x4 = − 32 x3 . L’insieme
delle soluzioni costituisce quindi un sottospazio vettoriale di dimensione 1,
che è precisamente l’autospazio relativo all’autovalore λ2 = 3. Una sua base
è data, ad esempio, dal vettore v4 = (0, −6, 3, −2). Questo sarà il quarto
vettore di una base di Jordan.
Si conclude pertanto che i vettori v1 , v2 , v3 e v4 costituiscono una base
di Jordan, rispetto alla quale l’endomorfismo φ ha matrice di Jordan


2 1 0 0
0 2 1 0

J =
0 0 2 0 .
0 0 0 3
Se indichiamo con S la matrice le cui colonne sono costituite dalle componenti dei vettori della base di Jordan trovata,


0 0 −1 0
1 0
0 −6
,
S=
0 −1 1
3
0 1
0 −2
si ha dunque AS = SJ, da cui si deduce
per esercizio, che

6 1

2 0
S −1 = 
−1 0
1 0
che A = SJS −1 . Si verifichi ora,
6
2
0
1

6
3
,
0
1
e si verifichi l’uguaglianza A = SJS −1 con un calcolo diretto.
3. Soluzioni
91
Svolgimento esercizio 10. Determiniamo gli autovalori di A:


λ
0
−2
4
−1 λ − 2
1
−2 

det(λI − A) = det 
0
0
λ−2
0 
−1
0
1
λ−4
λ
−2
4
0 = (λ − 2) 0 λ − 2
−1
1
λ − 4
λ
4 = (λ − 2)2 −1 λ − 4
= (λ − 2)4 .
Quindi A ha un unico autovalore λ = 2, con molteplicità 4.
Determiniamo ora gli autovettori relativi all’autovalore λ = 2; essi sono
le soluzioni del sistema
 
x1
x 2 

(A − λI) 
x3  = 0.
x4
Sviluppando i calcoli si ottiene il sistema


 − 2x1 + 2x3 − 4x4 = 0
x1 − x3 + 2x4 = 0

 x − x + 2x = 0
1
3
4
le cui soluzioni sono date da x1 = x3 −2x4 e x2 , x3 , x4 qualunque. L’insieme
delle soluzioni costituisce quindi un sottospazio vettoriale di dimensione 3,
che è precisamente l’autospazio relativo all’autovalore λ = 2. Una sua
base è data, ad esempio, dai vettori v1 = (0, 1, 0, 0), v2 = (1, 0, 1, 0) e
v3 = (−2, 0, 0, 1).
Da quanto visto si deduce che la forma canonica di Jordan di A è (a
meno di un riordinamento dei blocchi di Jordan)


2 1 0 0
0 2 0 0

J =
0 0 2 0 .
0 0 0 2
In questo caso non è più possibile applicare il metodo descritto nei due
esercizi precedenti per determinare una base di Jordan. Infatti bisognerebbe
ora determinare un autovettore generalizzato v4 relativo all’autovalore λ =
2, cioè v4 deve soddisfare l’equazione
Av4 = 2v4 + v,
92
5. Autovalori e Autovettori
dove v è un autovettore relativo all’autovalore λ = 2. Ora però esiste
uno spazio di dimensione 3 di autovettori, quindi non si sa come scegliere il
nostro v! (Si verifichi per esercizio che nessuno dei tre sistemi Av4 = 2v4 +v1 ,
Av4 = 2v4 + v2 e Av4 = 2v4 + v3 ha soluzioni. Non è quindi possibile
trovare una base di Jordan utilizzando i tre vettori v1 , v2 e v3 determinati
in precedenza; il che è abbastanza naturale, visto che i vettori v1 , v2 e v3
sono stati presi a caso dentro uno spazio di dimensione 3).
Utilizziamo quindi un altro procedimento. Indichiamo con w1 e w2 i primi
due vettori della base di Jordan (che vogliamo determinare). Osservando la
matrice di Jordan J scritta in precedenza, si deduce che w1 è un autovettore
relativo all’autovalore λ = 2, cioè si deve avere
(A − 2I)w1 = 0,
mentre w2 è un autovettore generalizzato relativo all’autovalore λ = 2, cioè
si deve avere
(A − 2I)w2 = w1 .
Moltiplicando quest’ultima equazione a sinistra per A − 2, si ottiene
(A − 2I)2 w2 = (A − 2I)w1 = 0,
quindi w2 è un vettore che appartiene al nucleo di (φ − 2 id)2 (cioè (A −
2I)2 w2 = 0) ma non appartiene al nucleo di φ − 2 id (cioè (A − 2I)w2 6=
0). Per determinare w2 prendiamo quindi un qualunque vettore tale che
(A − 2I)2 w2 = 0 e (A − 2I)w2 6= 0. Dato che il nucleo di A − 2I lo
abbiamo determinato in precedenza, e visto che (A − 2I)2 = 0 (come si vede
osservando la matrice di Jordan J, o come si verifica con un calcolo diretto),
è facile trovare un vettore w2 che soddisfi le condizioni richieste: ad esempio
il vettore w2 = (2, 1, 1, 1). Conoscendo w2 si determina immediatamente
w1 ; basta ricordare che (A − 2I)w2 = w1 . Si ha quindi
w1 = (A − 2I)w2 = (−6, 3, 0, 3).
Questi sono i primi due vettori di una base di Jordan. I due vettori rimanenti, w3 e w4 , devono ora soddisfare le due condizioni seguenti: devono
essere due autovettori relativi all’autovalore λ = 2 e devono essere tali che
{w1 , w2 , w3 , w4 } sia una base di R4 . Si verifica immediatamente che i vettori
w3 = (1, 0, 1, 0) e w4 = (0, 1, 0, 0) soddisfano le condizioni richieste.
In conclusione: i vettori w1 , w2 , w3 e w4 costituiscono, nell’ordine, una
base di Jordan, rispetto alla quale l’endomorfismo φ ha matrice di Jordan


2 1 0 0
0 2 0 0

J =
0 0 2 0 .
0 0 0 2
3. Soluzioni
93
Se indichiamo con S la matrice le cui colonne sono costituite dalle componenti dei vettori della base di Jordan trovata,


−6 2 1 0
 3 1 0 1

S=
 0 1 1 0 ,
3 1 0 0
si ha dunque AS = SJ, da cui si deduce che A = SJS −1 . Si verifichi ora,
per esercizio, che
 1

1
− 9 0 19
9
 1 0 −1 2 
3
3
3 
S −1 = 
− 1 0 4 − 2  ,
3
3
3
0 1 0 −1
e si verifichi l’uguaglianza A = SJS −1 con un calcolo diretto.
Svolgimento esercizio 11. Lavoriamo nel corpo complesso C. In questo
modo esiste una forma canonica di Jordan J per la matrice A, e si ha
A = SJS −1 , per una qualche matrice invertibile S (a coefficienti complessi).
Da ciò segue che A2 = SJS −1 SJS −1 = SJ 2 S −1 , e dunque l’uguaglianza
A2 = A equivale a J 2 = J. Ricordando la forma della matrice di Jordan J,
si vede subito che J 2 = J è possibile se e solo se J è diagonale (e quindi A
è diagonalizzabile) e, in tal caso, per ogni autovalore λ di A si deve avere
λ2 = λ, da cui segue che λ = 0 oppure λ = 1. In conclusione, la matrice A
è simile alla matrice
Ir
0
J=
,
0 0n−r
ove Ir indica la matrice identità di ordine r e 0n−r è la matrice nulla di
ordine n − r.
Si noti a questo punto che l’intero r coincide con il rango di A, pertanto,
se B è un’altra matrice con le stesse proprietà di A, essa sarà simile a J (e
quindi ad A) se e solo se il suo rango coincide con r.
Svolgimento esercizio 12. La matrice A è antisimmetrica, cioè si ha
AT = −A. Da ciò segue che la matrice A2 è simmetrica:
(A2 )T = (AT )2 = (−A)2 = A2 .
Ricordiamo che ogni matrice simmetrica a coefficienti reali è diagonalizzabile
e tutti i suoi autovalori sono reali. Pertanto tutti gli autovalori di A2 sono
reali. Dimostriamo ora che sono tutti negativi.
Sia v ∈ Rn un vettore non nullo; si ha allora
v T (A2 )v = (v T A)(Av) = (−v T AT )(Av) = −(Av)T (Av) = −w · w < 0,
ove si è posto w = Av e si è usato il fatto che il prodotto scalare in Rn è
definito positivo (si noti che w 6= 0 perché A è supposta non-degenere).
94
5. Autovalori e Autovettori
Questo significa che la matrice A2 è definita negativa, e quindi tutti i
suoi autovalori sono strettamente negativi. Di conseguenza, gli autovalori
di A, essendo le radici quadrate degli autovalori di A2 , sono puramente
immaginari.
Proponiamo anche un’altra dimostrazione. Sia λ ∈ C un autovalore
di A, e sia v ∈ Cn un autovettore corrispondente; si ha quindi Av = λv.
Coniugando ambo i membri di questa uguaglianza, e ricordando che A è una
matrice a coefficienti reali, cioè Ā = A, si ottiene Av̄ = λ̄v̄. Moltiplichiamo
ora a sinistra ambo i membri per v T , ottenendo v T Av̄ = λ̄v T v̄, quindi
trasponiamo ambo i membri di quest’ultima uguaglianza:
(v T Av̄)T = v̄ T AT v = (λ̄v T v̄)T = λ̄v̄ T v.
Ricordiamo ora che A è antisimmetrica, cioè AT = −A. Dall’uguaglianza
precedente si ottiene quindi −v̄ T Av = λ̄v̄ T v, da cui discende, ricordando
che Av = λv, −λv̄ T v = λ̄v̄ T v. In conclusione si ha quindi λ̄ = −λ e, dato
che λ 6= 0 perché A è non-degenere, questo significa che l’autovalore λ è
puramente immaginario.
3.3. Polinomio Minimo e Polinomio Caratteristico
Svolgimento esercizio 13. Premettiamo la

λ 1 0 ···
0 λ 1 · · ·

.
.

J = 0 0 . . . .
. . .
 .. .. .. · · ·
0 0 0 ···
seguente osservazione. Sia

0
0


0
.. 
.
λ
un blocco di Jordan di ordine r, relativo ad un autovalore λ. Si verifica immediatamente che in queste condizioni si ha: dim Ker(J − λI) = 1,
dim Ker(J −λI)2 = 2, dim Ker(J −λI)3 = 3, etc., fino a dim Ker(J −λI)r =
r.
Ritorniamo ora al problema in questione. La condizione dim Ker(φ −
2 id) = 1 equivale a dire che 2 è un autovalore di φ e che l’autospazio ad
esso relativo ha dimensione 1, cioè esiste un solo autovettore linearmente
indipendente relativo all’autovalore 2. Nella matrice di Jordan di φ comparirà quindi un blocco di Jordan relativo all’autovalore 2, di cui non conosciamo la dimensione, dato che non conosciamo la molteplicità dell’autovalore
2. Tuttavia, ricordando l’osservazione iniziale, si deduce dalla condizione
dim Ker(φ − 2 id)3 = 3 che il blocco di Jordan relativo all’autovalore 2 deve
avere almeno ordine 3.
In modo analogo, la condizione dim Ker(φ−3 id) = 2 significa che ci sono
due autovettori linearmente indipendenti relativi all’autovalore 3, e quindi
ci sono due blocchi di Jordan relativi all’autovalore 3. Di questi blocchi
3. Soluzioni
95
non conosciamo la dimensione, dato che non conosciamo la molteplicità
dell’autovalore 3, tuttavia, con un attimo di riflessione, ci si convince che
la condizione dim Ker(φ − 3 id)2 = 4 asserisce che questi blocchi di Jordan
devono avere entrambi ordine maggiore o uguale a 2.
Per terminare, la condizione dim Im(φ2 ) = 7 equivale a dim Ker(φ2 ) =
dim V − dim Im(φ2 ) = 2, che afferma quindi che 0 è un autovettore di φ la
cui molteplicità è almeno 2. Si noti però che in questo caso non conosciamo
dim Ker(φ), cioè il numero di autovettori linearmente indipendenti relativi
all’autovalore 0.
Dalle informazioni sulle dimensioni dei blocchi di Jordan ottenute in
precedenza, e ricordando che dim V = 9, si deduce che il blocco di Jordan
relativo all’autovalore 2 ha esattamente ordine 3, che i due blocchi di Jordan relativi all’autovalore 3 hanno entrambi esattamente ordine 2 e che la
molteplicità dell’autovalore 0 è esattamente 2 (e inoltre che non ci sono altri
autovalori). Rimangono dunque solo due possibilità, che corrispondono rispettivamente a dim Ker(φ) = 1 e dim Ker(φ) = 2, cioè all’esistenza di due
blocchi di Jordan di ordine 1 oppure di un solo blocco di Jordan di ordine
2, relativi all’autovalore 0.
Riunendo tutte queste informazioni, si deduce che ci sono solo due matrici di Jordan possibili per l’endomorfismo φ. Esse sono


0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0


 0 0 2 1 0 0 0 0 0


 0 0 0 2 1 0 0 0 0


J 1 =  0 0 0 0 2 0 0 0 0


 0 0 0 0 0 3 1 0 0
 0 0 0 0 0 0 3 0 0


 0 0 0 0 0 0 0 3 1
0 0 0 0 0 0 0 0 3
e


0 1 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0


 0 0 2 1 0 0 0 0 0


 0 0 0 2 1 0 0 0 0


J 2 =  0 0 0 0 2 0 0 0 0 .
 0 0 0 0 0 3 1 0 0


 0 0 0 0 0 0 3 0 0


 0 0 0 0 0 0 0 3 1
0 0 0 0 0 0 0 0 3
Dato che la forma canonica di Jordan di una matrice è unica, a meno di
una permutazione dei singoli blocchi di Jordan, si deduce che ci sono (essenzialmente) solo due endomorfismi φ di V soddisfacenti alle condizioni
richieste.
96
5. Autovalori e Autovettori
Svolgimento esercizio 14. Il polinomio minimo di φ si fattorizza come
segue:
x4 − 6x3 + 9x2 = x2 (x − 3)2 .
Se ne deduce che gli unici autovalori di φ sono 0 e 3, ed entrambi hanno
molteplicità almeno 2 (la molteplicità di un autovalore è l’ordine con cui
questo annulla il polinomio caratteristico, e si ricordi che il polinomio minimo divide il polinomio caratteristico). Ricordando poi che il polinomio
minimo di un blocco di Jordan di ordine r del tipo


λ 1 0 ··· 0
0 λ 1 · · · 0


.
.


Jr =  0 0 . . . . 0 
. . .

 .. .. .. · · · ... 
0 0 0 ··· λ
è precisamente (x−λ)r , si deduce che la matrice di Jordan dell’endomorfismo
φ deve essere del tipo


0 1 0 0 0 0
0 0 0 0 0 0


0 0 a b 0 0
J =
,
0 0 0 c 0 0
0 0 0 0 3 1
0 0 0 0 0 3
a b
dove la matrice A =
può essere una qualunque delle seguenti: J0 =
0 c
0 0
0 1
3 0
3 1
0 0
, J1 =
, J2 =
, J3 =
, J4 =
.
0 0
0 0
0 3
0 3
0 3
Si vede ora immediatamente che se A = J0 il rango di J è 3, se A = J1
oppure A = J4 il rango di J è 4, mentre per A = J2 oppure A = J3 si ha
rango(J) = 5.
Abbiamo cosı̀ determinato tutti gli endomorfismi (più precisamente, le
loro forme canoniche di Jordan) che soddisfano alle condizioni richieste.
3.4. Esercizi Vari
Svolgimento esercizio 15. Poniamo vn = (xn+1 , xn ). Si ha v1 = (1, 1) e,
da xn = x
n−1 + xn−2 segue che, per ogni n > 1, si ha vn = Avn−1 , dove
1 1
A=
.
1 0
Si ha dunque: v2 = Av1 , v3 = Av2 = A2 v1 , v4 = Av3 = A3 v1 e, in
generale, vn = An−1 v1 . Quindi il calcolo dei numeri di Fibonacci si riduce
al calcolo delle potenze di una matrice quadrata.
3. Soluzioni
97
Il polinomio caratteristico
di A√è λ2 − λ − 1, quindi gli autovalori di A
√
1
1
sono λ1 = 2 (1 − 5) e λ2 = 2 (1 + 5). Gli autovettori corrispondenti sono
√
√
rispettivamente w1 = ( 12 (1 − 5), 1) e w2 = ( 12 (1 + 5), 1). Si ha quindi
A = SJS −1 ,
ove
√
√ (1 − 5) 12 (1 + 5)
S=
1
1
e
√
1
(1
−
5)
0
√
J= 2
.
1
0
(1
+
5)
2
Si calcola inoltre facilmente che
√ 1 −1 12 (1 + 5)
−1
√
S =√
.
1
5 1 − 2 (1 − 5)
1
2
Si ha quindi
vn = An−1 v1 = (SJS −1 )n−1 v1 = SJ n−1 S −1 v1 =
√ n+1
√ n+1 1
1
((1
+
5)
−
(1
−
n+1
2
√ n
√ 5)n ) ,
=√
1
((1
+
5)
−
(1
−
5) )
5
2n
da cui si ottiene la seguente formula per l’ennesimo numero di Fibonacci:
√
√ 1
xn = √ (1 + 5)n − (1 − 5)n .
2n 5
Si noti che, anche se non è evidente dalla formula trovata, questi numeri
sono sicuramenti interi.
Capitolo 6
Forme Bilineari
1. Richiami di teoria
1.1. Prodotto scalare in Rn
Finora abbiamo visto come i vettori si possano sommare e moltiplicare per
degli scalari. Non sappiamo però misurare la “lunghezza” di un vettore, né
l’“angolo” tra due vettori. Per definire queste due quantità introduciamo
la nozione di prodotto scalare di due vettori. Iniziamo dal caso dello spazio
vettoriale Rn .
Definizione 1.1. Il prodotto scalare di due vettori v = (x1 , . . . , xn ) e w =
(y1 , . . . , yn ) di Rn è il numero reale
v·w =
n
X
xi yi .
i=1
In dimensione 2 e 3 la definizione precedente stabilisce che
(x1 , x2 ) · (y1 , y2 ) = x1 y1 + x2 y2 ,
e
(x1 , x2 , x3 ) · (y1 , y2 , y3 ) = x1 y1 + x2 y2 + x3 y3 .
In entrambi questi casi si può dimostrare che il prodotto scalare di due
vettori v e w coincide con il prodotto delle lunghezze dei due vettori per il
coseno dell’angolo compreso tra di essi, dove i concetti di lunghezza e angolo
sono quelli usuali della geometria elementare del piano e dello spazio.
In particolare si ha:
v · v = kvk2 ,
ove si è indicato con kvk la lunghezza del vettore v, e
v·w
cos α =
,
kvk kwk
dove α è l’angolo compreso tra i vettori v e w.
Visto che è possibile dimostrare che queste uguaglianze valgono sia in
dimensione 2 che 3, usiamole per dare un senso alle nozioni di lunghezza e
angolo in spazi di dimensione n.
100
6. Forme Bilineari
Definizione 1.2. Sia v = (x1 , . . . , xn ) ∈ Rn . La lunghezza di v, detta
anche norma di v è data da:
v
u n
uX
√
x2 .
kvk = v · v = t
i
i=1
Un vettore di norma unitaria è detto versore. Spesso si usa anche la notazione |v| al posto di kvk, in tal caso si preferisce usare il termine modulo di
v al posto di norma di v.
Definizione 1.3. Siano v = (x1 , . . . , xn ) e w = (y1 , . . . , yn ) ∈ Rn . L’angolo
α tra i due vettori v e w è definito dalla seguente uguaglianza:
v·w
cos α =
.
kvk kwk
Da questa definizione segue subito che
Osservazione 1.4. Due vettori (non nulli) sono ortogonali se e solo se il
loro prodotto scalare è 0.
Ricordiamo ora le principali proprietà del prodotto scalare.
Proposizione 1.5. Per ogni u, v, w ∈ Rn e ogni scalare λ ∈ R, si ha:
(1) (u + v) · w = u · w + v · w,
(2) u · (v + w) = u · v + u · w,
(3) (λv) · w = v · (λw) = λv · w,
(4) v · w = w · v,
(5) v · v > 0 se v 6= 0.
Le prime tre proprietà esprimono il fatto che il prodotto scalare è una
applicazione bilineare definita su Rn × Rn a valori in R. La quarta proprietà
dice che questa applicazione bilineare è simmetrica. La quinta esprime, per
definizione, il fatto che questa applicazione bilineare simmetrica è definita
positiva.
1.2. Forme bilineari
Sia V uno spazio vettoriale sul campo C.
Definizione 1.6. Una forma bilineare su V è una funzione
φ:V ×V →C
tale che
(1) φ(u + v, w) = φ(u, w) + φ(v, w),
(2) φ(u, v + w) = φ(u, v) + φ(u, w),
(3) φ(λv, w) = φ(v, λw) = λφ(v, w),
per ogni u, v, w ∈ V e ogni λ ∈ C.
Definizione 1.7. Sia φ : V × V → C una forma bilineare. Essa è detta:
(1) non-degenere se φ(v, w) = 0, per ogni w ∈ V , implica che v = 0,
1. Richiami di teoria
101
(2) simmetrica se φ(v, w) = φ(w, v), per ogni v e w in V ,
(3) antisimmetrica, o alternante, se φ(v, w) = −φ(w, v), per ogni v e
w in V (almeno se il corpo C ha caratteristica diversa da 2).
Nel seguito ci occuperemo solo delle forme bilineari non-degeneri. Inoltre
dato che una forma bilineare φ si può sempre scrivere come
φ(v, w) =
φ(v, w) + φ(w, v) φ(v, w) − φ(w, v)
+
2
2
e che
φ(v, w) + φ(w, v)
2
è una forma bilineare simmetrica, mentre
φs (v, w) =
φ(v, w) − φ(w, v)
2
è una forma bilineare antisimmetrica, possiamo concludere che ogni forma
bilineare è somma di una forma bilineare simmetrica e di una alternante.
È quindi sufficiente studiare separatamente le forme bilineari simmetriche e
quelle alternanti.
Introduciamo ora i concetti di vettore isotropo e sottospazio isotropo.
Sia V uno spazio vettoriale dotato di una forma bilineare φ.
Definizione 1.8. Un vettore v ∈ V è detto isotropo se φ(v, v) = 0.
Definizione 1.9. Un sottospazio U ⊂ V è detto isotropo se φ(u1 , u2 ) = 0,
per ogni u1 , u1 ∈ U .
Si noti che, se U è un sottospazio isotropo di V , allora tutti i vettori
di U sono isotropi. È invece falso che un insieme di vettori isotropi di V
sia un sottospazio isotropo di V ; in generale, infatti, non sarà neanche un
sottospazio vettoriale di V .
Sia oraP
{v1 , . . . , vn } unaP
base di V . Se due vettori v, w ∈ V si scrivono
come v = ni=1 xi vi e w = nj=1 yj vj , usando la bilinearità di φ si ottiene:
X
X
n
n
X
φ(v, w) = φ
xi vi ,
yj vj =
xi yj φ(vi , vj )
φa (v, w) =
i=1
=
X
j=1
i,j
aij xi yj ,
i,j
ove abbiamo posto aij = φ(vi , vj ).
In corrispondenza ad una base di V si ottiene quindi una matrice quadrata A = (aij ) che contiene tutte le informazioni necessarie a ricostruire la
forma bilineare φ. In termini della matrice A si ha:
 
y1
φ(v, w) = (x1 , . . . , xn ) A  ...  = X T AY,
yn
102
6. Forme Bilineari
ove X e Y denotano i vettori colonna delle componenti di v e w rispetto
alla base fissata di V .
Proposizione 1.10. Sia φ una forma bilineare su V e A la sua matrice
rispetto ad una (qualunque) base fissata di V . Allora:
(1) φ è non-degenere se e solo se det A 6= 0,
(2) φ è simmetrica se e solo se A = AT ,
(3) φ è antisimmetrica se e solo se A = −AT .
Se {v10 , . . . , vn0 } è un’altra base di V e se A0 è la matrice di φ rispetto a
questa nuova base allora, se indichiamo con P = (pij ) la matrice
Pn di cam0
0
biamento di base, cioè se i vettori vi si scrivono come vi = h=1 phi vh , si
ha:
X
n
n
X
0
0
0
aij = φ(vi , vj ) = φ
phi vh ,
pkj vk
h=1
=
X
phi pkj φ(vh , vk ) =
h,k
k=1
X
ahk phi pkj .
h,k
In termini di matrici questa uguaglianza si scrive semplicemente
A0 = P T AP.
Questa è la relazione che lega tra loro due matrici che corrispondono alla
stessa forma bilineare φ rispetto a due basi diverse.
Definizione 1.11. Due matrici A e A0 tali che A0 = P T AP , per una qualche
matrice invertibile P , si dicono congruenti.
1.3. Forme bilineari simmetriche
Occupiamoci ora in particolare delle forme bilineari simmetriche.
Sia dunque φ : V × V → C una forma bilineare, simmetrica, nondegenere. Imitando quanto visto in precedenza per il prodotto scalare usuale
in Rn , diamo la seguente definizione:
Definizione 1.12. Due vettori v, w ∈ V si dicono ortogonali se φ(v, w) = 0.
Questa definizione si può estendere ai sottospazi vettoriali di V .
Definizione 1.13. Due sottospazi vettoriali U1 e U2 di V si dicono ortogonali se φ(u1 , u2 ) = 0, per ogni u1 ∈ U1 e ogni u2 ∈ U2 .
Definizione 1.14. Sia U un sottospazio vettoriale di V . Il sottospazio
ortogonale di U , indicato con U ⊥ , è definito come segue:
U ⊥ = {v ∈ V | φ(v, u) = 0, ∀u ∈ U }.
Si verifica facilmente che U ⊥ è effettivamente un sottospazio vettoriale
di V .
Per quanto riguarda la classificazione degli spazi vettoriali dotati di una
forma bilineare simmetrica non-degenere, il principale risultato è il seguente:
1. Richiami di teoria
103
Teorema 1.15. Lo spazio vettoriale V , dotato della forma bilineare simmetrica non-degenere φ, ammette basi ortogonali. Esiste cioè una base di
V costituita da vettori a due a due ortogonali.
Lo stesso risultato, espresso in termini di matrici, si traduce nel seguente
teorema:
Teorema 1.16. Ogni matrice quadrata A, simmetrica e non-degenere, è
congruente a una matrice diagonale A0 . Esiste cioè una matrice invertibile
P tale che P T AP sia diagonale.
Imitando ancora le definizioni valide per il prodotto scalare usuale in Rn ,
vorremmo definire la norma di un vettore v ∈ V come segue:
p
kvk = φ(v, v),
ma per fare ciò bisogna prima essere sicuri che, nel campo C, esistano le
radici quadrate degli elementi del tipo φ(v, v). Se C è un campo algebricamente chiuso, come il campo complesso, non ci sono problemi. Se però
C non è algebricamente chiuso, come è il caso del campo dei numeri reali, le radici quadrate degli elementi di C non esistono sempre. In tal caso
bisognerà porre delle ipotesi ulteriori sulla forma bilineare φ.
Sia quindi C il campo dei numeri reali R (oppure un campo ordinato).
Diamo la seguente definizione:
Definizione 1.17. Una forma bilineare simmetrica φ è detta:
(1) definita positiva se φ(v, v) > 0, per ogni v ∈ V , con v 6= 0,
(2) semidefinita positiva se φ(v, v) ≥ 0, per ogni v ∈ V ,
(3) definita negativa se φ(v, v) < 0, per ogni v ∈ V , con v 6= 0,
(4) semidefinita negativa se φ(v, v) ≤ 0, per ogni v ∈ V ,
(5) indefinita se esistono due vettori v, w ∈ V tali che φ(v, v) > 0 e
φ(w, w) < 0.
Esiste un criterio molto semplice per stabilire se una forma bilineare
simmetrica φ è definita positiva o negativa.
Teorema 1.18. Sia A = (aij ) la matrice (quadrata di ordine n) di φ rispetto
a una qualche base fissata di V . Indichiamo con ∆r , per r = 1, . . . , n, il
determinante della sottomatrice costituita dalle prime r righe e colonne di
A. Si ha quindi
a11 · · · a1r .
a11 a12 .. .
, · · · , ∆r = ..
∆1 = a11 , ∆2 = . a21 a22 a
·
·
·
a
r1
rr
Allora φ (o equivalentemente A) è
(1) definita positiva se ∆i > 0, per ogni i = 1, . . . , n.
(2) definita negativa se ∆i < 0 per ogni i dispari, e ∆i > 0, per ogni i
pari, per i = 1, . . . , n.
Finalmente possiamo definire la norma di un vettore:
104
6. Forme Bilineari
Definizione 1.19. Sia C il campo dei numeri reali R (oppure un campo
ordinato in cui ogni elemento positivo è un quadrato). Sia V uno spazio
vettoriale su C dotato di una forma bilineare φ simmetrica, non-degenere e
definita positiva. Allora, per ogni v ∈ V , poniamo
p
kvk = φ(v, v).
In questo caso è possibile dimostrare un risultato più forte del teorema
che assicura l’esistenza di basi ortogonali. Più precisamente, si ha:
Teorema 1.20. Sia C il campo dei numeri reali R (oppure un campo ordinato in cui ogni elemento positivo è un quadrato). Sia V uno spazio
vettoriale su C dotato di una forma bilineare φ simmetrica, non-degenere
e definita positiva. Allora lo spazio vettoriale V ammette basi ortonormali.
Esiste cioè una base di V costituita da vettori di norma 1, a due a due
ortogonali.
Osservazione 1.21. Esiste un metodo standard per costruire una base
ortonormale di V partendo da una base qualsiasi. Tale metodo è noto come
il procedimento di Gram-Schmidt e verrà illustrato negli esercizi.
Si dimostra poi che vale il seguente risultato:
Proposizione 1.22. Nelle ipotesi precedenti si ha:
|φ(v, w)| ≤ kvk kwk,
per ogni v, w ∈ V .
Da ciò deriva che si ha
−1 ≤
φ(v, w)
≤ 1,
kvk kwk
e quindi è possibile dare la seguente definizione:
Definizione 1.23. Nelle ipotesi precedenti si definisce l’angolo α compreso
tra i due vettori v, w ∈ V ponendo
cos α =
φ(v, w)
.
kvk kwk
Si vede cosı̀ che in uno spazio vettoriale reale, dotato di una forma bilineare φ simmetrica, non-degenere e definita positiva, è possibile definire la
lunghezza di un vettore e l’angolo tra due vettori in modo analogo a quanto
avviene nel caso di Rn dotato del prodotto scalare usuale.
Definizione 1.24. Uno spazio vettoriale V , dotato di una forma bilineare
φ simmetrica, non-degenere e definita positiva, è detto spazio euclideo (o
anche spazio metrico, o spazio normato)
Terminiamo ricordando un importante teorema che classifica gli spazi
vettoriali reali dotati di una forma bilineare simmetrica, non necessariamente definita positiva:
1. Richiami di teoria
105
Teorema 1.25 (Teorema di Sylvester). Sia V uno spazio vettoriale
reale, dotato di una forma bilineare φ simmetrica e non-degenere. Allora
V ammette una base rispetto alla quale la matrice di φ è diagonale e gli
elementi sulla diagonale sono +1 oppure −1. Il numero di elementi positivi
o negativi sulla diagonale dipende solo da φ e non dalla base scelta. La
differenza tra il numero di elementi positivi e il numero di elementi negativi
è detto la segnatura, o l’indice d’inerzia, di φ.
Per quanto riguarda le applicazioni lineari tra due spazi euclidei, diamo
la seguente definizione:
Definizione 1.26. Siano (V, φ) e (W, ψ) due spazi vettoriali euclidei. Una
applicazione lineare f : V → W è detta isometria se essa è biiettiva e inoltre
φ(v1 , v2 ) = ψ(f (v1 ), f (v2 )), per ogni v1 , v2 ∈ V .
Una isometria tra due spazi euclidei è dunque un isomorfismo di spazi
vettoriali che in più rispetta le strutture metriche presenti sugli spazi in
questione. Si dimostra allora facilmente il seguente risultato:
Proposizione 1.27. Sia f : V → W una isometria. Allora si ha:
(1) kf (v)k = kvk, per ogni v ∈ V ,
(2) L’angolo compreso tra i vettori f (v1 ) e f (v2 ) è uguale all’angolo
compreso tra i vettori v1 e v2 , per ogni v1 , v2 ∈ V .
1.4. Forme bilineari alternanti
Sulle forme bilineari alternanti non c’è molto da dire.
Sia V uno spazio vettoriale sul campo C (di caratteristica diversa da 2)
dotato di una applicazione bilineare alternante non-degenere φ. Il risultato
principale è il seguente:
Teorema 1.28. Lo spazio vettoriale V ha dimensione pari, dim V = 2n.
Inoltre esiste una base di V rispetto alla quale la matrice di φ è una matrice
a blocchi del tipo


H 0 ··· 0
0 H ··· 0
. . .

 .. ..
. . ... 
0
0
··· H
ove
H=
0 1
.
−1 0
Definizione 1.29. Uno spazio vettoriale V , dotato di una forma bilineare
alternante non-degenere φ è detto spazio simplettico.
106
6. Forme Bilineari
1.5. Prodotto vettoriale in R3
Nel caso particolare dello spazio vettoriale R3 si può definire un prodotto
fra vettori il cui risultato sia ancora un vettore. La definizione di questo
prodotto può essere data come segue:
Definizione 1.30. Siano v e w due vettori in R3 . Il prodotto vettoriale
di v e w è il vettore, indicato con v ∧ w la cui norma è data dal prodotto
delle norme di v e w per il seno dell’angolo α compreso tra di essi, la cui
direzione è la retta perpendicolare al piano generato da v e w e il cui verso
è indicato dal dito medio della mano destra, quando pollice e indice sono
orientati come i vettori v e w rispettivamente.
Questa è la definizione usata, ad esempio, dai fisici. Una definizione
matematicamente più precisa è la seguente:
Definizione 1.31. Siano v = (x1 , x2 , x3 ) e w = (y1 , y2 , y3 ) due vettori in
R3 . Il prodotto vettoriale di v e w è il seguente vettore:
v ∧ w = (x2 y3 − x3 y2 , x3 y1 − x1 y3 , x1 y2 − x2 y1 ).
Si può dimostrare che le due definizioni coincidono.
Elenchiamo ora alcune proprietà del prodotto vettoriale.
Proposizione 1.32. Per ogni u, v, w ∈ R3 e per ogni λ ∈ R si ha:
(1)
(2)
(3)
(4)
u ∧ (v + w) = u ∧ v + u ∧ w,
(u + v) ∧ w = u ∧ w + v ∧ w,
(λv) ∧ w = v ∧ (λw) = λ(v ∧ w),
v ∧ w = −w ∧ v.
Notiamo poi che, se v e w sono due vettori diversi da zero, si ha v ∧w = 0
se e solo se v e w sono paralleli, cioè sono uno multiplo dell’altro.
La norma del prodotto vettoriale di due vettori ha poi una importante
interpretazione geometrica: kv ∧ wk è l’area del parallelogramma di lati v e
w.
Se consideriamo tre vettori di R3 possiamo fare il prodotto scalare di uno
di essi per il risultato del prodotto vettoriale degli altri due.
Definizione 1.33. Il prodotto misto dei vettori u, v e w è dato da:
u · (v ∧ w).
Sviluppando i calcoli si dimostra facilmente il seguente risultato:
Proposizione 1.34. Se u = (x1 , x2 , x3 ), v
sono tre vettori di R3 , si ha:

x1

u · (v ∧ w) = det y1
z1
= (y1 , y2 , y3 ) e w = (z1 , z2 , z3 )

x2 x3
y2 y3  .
z2 z3
2. Esercizi
107
Anche il prodotto misto di tre vettori ha una importante interpretazione
geometrica: il valore assoluto di u · (v ∧ w) rappresenta infatti il volume del
parallelepipedo i cui lati sono i tre vettori u, v e w.
2. Esercizi
Gli esercizi sul prodotto scalare usuale in Rn e sul prodotto vettoriale in
R3 verranno svolti nel capitolo dedicato agli spazi affini. Qui di seguito
riportiamo alcuni esercizi sulle forme bilineari in generale.
2.1. Forme Bilineari Simmetriche
Esercizio 1. Sia V uno spazio vettoriale sul corpo complesso C con base
{v1 , v2 , v3 } e sia g la forma bilineare simmetrica di matrice, rispetto alla
base data,


2 3 −1
G =  3 4 0 .
−1 0 1
Si determini una matrice invertibile P tale che P T GP = I.
Esercizio 2. Sia V uno spazio vettoriale sul corpo dei numeri reali, con
base {v1 , v2 , v3 }, e sia g la forma bilineare simmetrica di matrice, rispetto
alla base data,


0 2
1
G = 2 3 −1 .
1 −1 2
Si determini una base di V rispetto alla quale la matrice di g sia diagonale,
con soli elementi 1 e −1 sulla diagonale.
Esercizio 3. Sia V uno spazio vettoriale sul corpo dei numeri reali, con
base {v1 , v2 , v3 }, e sia g la forma bilineare simmetrica di matrice, rispetto
alla base data,


0 2 −1
G =  2 0 3 .
−1 3 0
Si determini una base di V rispetto alla quale la matrice di g sia diagonale,
con soli elementi 1 e −1 sulla diagonale.
Esercizio 4. Sia V uno spazio vettoriale reale di dimensione 3, e sia
{v1 , v2 , v3 } una sua base. Si consideri la forma bilineare simmetrica g di
matrice


−3 1
0
2 −1 ,
G= 1
0 −1 −1
108
6. Forme Bilineari
rispetto alla base data.
(1) Si verifichi che g è non-degenere e si determini una base ortogonale
di V relativamente a g.
(2) Si calcoli l’indice d’inerzia i(g).
(3) Si dica se esistono vettori isotropi non nulli relativamente a g e, in
caso affermativo, si determini un sottospazio isotropo di dimensione
massima.
Esercizio 5. Sia V = R4 e sia g la forma bilineare simmetrica di matrice


3 −2 1
1
−2 1 −1 −1
,
G=
 1 −1 1
4
1 −1 4
2
rispetto alla base canonica.
(1) Si verifichi che g è non-degenere, se ne calcoli l’indice d’inerzia e si
determini una base ortogonale di V relativamente a g.
(2) (R4 , g) è isometrico allo spazio R4 dotato del prodotto scalare usuale? E allo spazio di Minkowski?
Esercizio 6. Sullo spazio vettoriale R4 si consideri la forma bilineare simmetrica g di matrice


0
2 −2 0
2
0
1 −3

G=
−2 1
0 −1
0 −3 −1 0
rispetto alla base canonica.
(1) Si determini l’indice d’inerzia di g.
(2) Si determini, se esiste, una base di R4 rispetto a cui g ha matrice


1 0 0 0
0 1 0 0


0 0 0 1 .
0 0 1 0
(3) Si determini, se esiste, una base di R4 rispetto a cui g ha matrice


0 1 0 0
1 0 0 0


0 0 0 1 .
0 0 1 0
2. Esercizi
(4) Si determini, se esiste, una

0 1
1 0

0 0
0 0
109
base di R4 rispetto a cui g ha matrice

0
0
0
0
.
−1 0 
0 −1
2.2. Forme Bilineari Alternanti
Esercizio 7. Sia V uno spazio vettoriale reale e sia {v1 , . . . , v4 } una sua
base. Sia g : V × V → R l’applicazione bilineare alternante di matrice


0
3 4 −1
−3 0 5 2 

G=
−4 −5 0 −6 ,
1 −2 6 0
rispetto alla base data.
Si determini una base {w1 , . . . , w4 } di V tale che la matrice di g rispetto
a questa nuova base sia


0 1 0 0
−1 0 0 0

G0 = 
 0 0 0 1 .
0 0 −1 0
2.3. Isometrie
Esercizio 8. Sia V uno spazio vettoriale reale di dimensione finita e sia g :
V × V → R una forma bilineare simmetrica definita positiva. Se φ : V → V
è una isometria, si dimostri che si ha
Im(φ − id) = Ker(φ − id)⊥ .
2.4. Altri esercizi
Esercizio 9. Si consideri C come spazio vettoriale su R e si ponga su di
esso l’applicazione bilineare g : C × C → R definita da
g(z1 , z2 ) = 2<(z1 z2 ),
ove <(z) indica la parte reale del numero complesso z.
(1) Si dimostri che g è bilineare e non-degenere.
(2) Si determini la matrice di g rispetto alla base {1, i} di C.
(3) Siano z1 , z2 ∈ C, linearmente indipendenti su R (cioè z1 e z2 sono
una base di C, visto come R-spazio vettoriale). Si determini la
110
6. Forme Bilineari
matrice G di g rispetto alla base {z1 , z2 } e si dimostri che
2
z1 z2
det G = det
,
z̄1 z̄2
ove z̄ indica il numero complesso coniugato di z ∈ C.
Esercizio 10. Sia A una matrice simmetrica ad elementi in R. È vero o
falso che la matrice I + A2 è invertibile? (I indica la matrice identità).
3. Soluzioni
3.1. Forme Bilineari Simmetriche
Svolgimento esercizio 1. Dato che P T GP è la matrice della forma bilineare g rispetto ad una nuova base {v10 , v20 , v30 }, ottenuta dalla base {v1 , v2 , v3 }
per mezzo della matrice di cambiamento di base P , cioè
(v10 , v20 , v30 ) = (v1 , v2 , v3 )P,
il problema si riduce alla determinazione di una base {v10 , v20 , v30 } rispetto
alla quale la matrice di g sia l’identità, ossia alla determinazione di una
base ortonormale. Utilizziamo a tal fine il√
procedimento di Gram-Schmidt.
0
Dato che g(v1 , v1 ) = 2, poniamo v1 = v1 / 2. Si ha cosı̀ g(v10 , v10 ) = 1. Un
vettore v200 ortogonale a v10 si trova nel modo seguente: si ponga v200 = av10 +v2
e si richieda che g(v10 , v200 ) = 0. Si ottiene in questo modo a = −g(v10 , v2 ) e
dunque si ha:
v200 = v2 − g(v10 , v2 )v10
√
√
= v2 − g(v1 / 2, v2 )v1 / 2
3
= v2 − v1 .
2
00 00
A questo punto bisogna normalizzare questo vettore. Si calcola g(vq
2 , v2 ) =
g(v2 − 32 v1 , v2 − 23 v1 ) = − 12 , e si pone di conseguenza v20 = v200 / − 12 =
√
√
√
−i 2v200 = 32 i 2v1 − i 2v2 .
Rimane solo da determinare un vettore w300 ortogonale a w10 e w20 . Ripetendo il ragionamento fatto in precedenza si scopre che si ha
v300 = v3 − g(v10 , v3 )v10 − g(v20 , v3 )v20
√
√
√
√
3 √
3 √
= v3 − g(v1 / 2, v3 )v1 / 2 − g( i 2v1 − i 2v2 , v3 )( i 2v1 − i 2v2 )
2
2
= v3 − 4v1 + 3v2 .
00
Anche quest’ultimo vettore deve essere normalizzato. Si ha g(v300 , v√
3) =
0
00
g(v3 − 4v1 + 3v2 , v3 − 4v1 + 3v2 ) = 5, e si pone di conseguenza v3 = v3 / 5 =
− √45 v1 + √35 v2 + √15 v3 .
3. Soluzioni
111
Si trova allora che la matrice di cambiamento di base è
1 3 √

√4
√
2
−
i
2 √
5

 2
P =  0 −i 2 √35  .
√1
0
0
5
Si verifichi che si ha effettivamente P T GP = I.
Svolgimento esercizio 2. Utilizziamo il procedimento di Gram-Schmidt.
Dato però che il vettore v1 è isotropo, non possiamo prendere come primo
vettore v10 della nuova base un suo multiplo. Per ovviare a questo inconveniente è sufficiente scambiare tra loro i vettori v1 e v2 della base data ed applicare il procedimento di Gram-Schmidt
√ partendo dunque0 da0 v2 . Dato che
0
g(v2 , v2 ) = 3, bisognerà porre v1 = v2 / 3. Si ha cosı̀ g(v1 , v1 ) = 1. Continuando, poniamo v200 = av10 +√
v1 ed imponiamo che sia
g(v10 , v200 ) = 0. Si trova
√
allora a = −g(v10 , v1 ) = −2/ 3, e quindi v200 = −2/ 3v10 + v1 = − 23 v2 + v1 .
q
4
00 00
Dato che si ha g(v2 , v2 ) = − 3 , e dato che − 43 non esiste in R, dovremo
q
√
√
√
porre v20 = v200 / 43 = 23 v200 = − 23 v2 + 23 v1 , ottenendo però g(v20 , v20 ) = −1.
Per trovare il terzo e ultimo vettore della base, poniamo v300 = av10 +
0
bv2 + v3 ed imponiamo
che g(v10 , v300 ) =√0 e g(v20 , v300 ) = 0. Si ottiene cosı̀ a =
√
−g(v10 , v3 ) = 1/ 3 e b = g(v20 , v3 ) = 5 3/6 (attenzione
che in questo caso si
√
5
3
1
0
0
00
0
0
ha g(v2 , v2 ) = −1). Si ha dunque v3 = √3 v1 + 6 v2 + v3 = − 12 v2 + 54 v1 + v3 .
Si ha allora g(v300 , v300 ) = 15/4 e quindi si deve porre v30 = √215 v300 , ottenendo
cosı̀ g(v30 , v30 ) = 1.
La matrice di g nella base {v10 , v20 , v30 } è dunque


1 0 0
G0 = 0 −1 0 .
0 0 1
Svolgimento esercizio 3. Dato che tutti i vettori della base data sono
isotropi non è possibile prendere un loro multiplo come vettore della nuova
base. In questo caso si dovranno invece considerare, ad esempio, i vettori
v100 = v1 + v2 e v200 = v1 − v2 . Questi due vettori sono ortogonali, dato
che g(v100 , v200 ) = g(v1 , v1 ) − g(v2 , v2 ) = 0, e non sono isotropi. Infatti si ha
g(v100 , v100 ) = 4 e g(v200 , v200 ) = −4. Si prendono quindi come vettori per la nuova
base i vettori v10 = 21 v100 e v20 = 12 v200 , ottenendo g(v10 , v10 ) = 1 e g(v20 , v20 ) = −1.
A questo punto v30 si potrà determinare nel modo usuale. Poniamo dunque
v300 = av10 + bv20 + v3 ed imponiamo che g(v10 , v300 ) = 0 e g(v20 , v300 ) = 0. Si
ottiene allora a = −g(v10 , v3 ) = −1 e b = g(v20 , v3 ) = −2. Di conseguenza
√
si ha v300 = −v10 − 2v20 + v3 e, dato che g(v300 , v300 ) = 3, si porrà v30 = v300 / 3,
ottenendo g(v30 , v30 ) = 1.
112
6. Forme Bilineari
La matrice di g nella base {v10 , v20 , v30 } è

1 0
0

G = 0 −1
0 0
dunque

0
0 .
1
Svolgimento esercizio 4. (1) Si ha
2 −1 1 −1
= 10,
det G = −3 −
−1 −1 0 −1
quindi g è non-degenere.
Procediamo quindi alla determinazione di una base ortogonale. Poniamo
w1 = v1 ; si ha g(w1 , w1 ) = −3 6= 0. Si noti che non è necessario normalizzare
i vettori della nuova base, perché è richiesta una base ortogonale e non una
base ortonormale.
Osservando la matrice G si nota che il vettore v3 è ortogonale a w1 , quindi
come secondo vettore della base ortogonale possiamo prendere w2 = v3 ; si
ha quindi g(w2 , w2 ) = −1.
Rimane ora solo da determinare un terzo vettore w3 ortogonale ai due
precedenti. Poniamo w3 = λ1 v1 + λ2 v2 + λ3 v3 ed imponiamo a w3 di essere
ortogonale a w1 e w2 . Si ottiene il seguente sistema:
g(w1 , w3 ) = −3λ1 + λ2 = 0
g(w2 , w3 ) = −λ2 − λ3 = 0,
da cui si ricava

 λ = −1λ
3
1
3
 λ = −λ .
2
3
Ponendo, ad esempio, λ3 = 3, si ottiene il vettore w3 = −v1 − 3v2 + 3v3 . Si
trova ora g(w3 , w3 ) = 30, da cui si deduce che la matrice di g rispetto alla
base ortogonale {w1 , w2 , w3 } è


−3 0 0
 0 −1 0  .
0
0 30
(2) Osservando la matrice appena trovata si scopre che la restrizione di g al
sottospazio L{w1 , w2 }, generato da w1 e w2 , è definita negativa, mentre la
restrizione di g al sottospazio generato da w3 è definita positiva. Si deduce
quindi che l’indice d’inerzia di g è dato da i(g) = 1 − 2 = −1.
(3) Dato che g non è definita, esistono sicuramente dei vettori isotropi non
nulli. Ad esempio, se consideriamo un vettore w = λ1 w1 + λ2 w2 + λ3 w3 , la
condizione che w sia isotropo è
g(w, w) = −3λ21 − λ22 + 30λ23 = 0,
che ha ovviamente soluzioni reali non nulle.
3. Soluzioni
113
Sia dunque U un sottospazio isotropo. Dato che, per definizione, si ha
U ⊂ U ⊥ , e dim U ⊥ = 3 − dim U , se ne deduce che U può avere al più dimensione 1. Quindi per determinare un sottospazio isotropo di dimensione
massima è sufficiente
determinare un vettore isotropo non nullo; ad esempio
√
il vettore w = 30w2 + w3 . Il sottospazio U = L{w} è pertanto un sottospazio isotropo di dimensione massima (ovviamente tale sottospazio non è
unico).
Svolgimento esercizio 5. (1) Per dimostrare che g è non-degenere basta
dimostrare che det G 6= 0, oppure che esiste una base ortogonale di V . Visto
che, in ogni caso, dobbiamo determinare una base ortogonale, possiamo
evitare di calcolare il determinante di G; quando avremo calcolato una
base ortogonale avremo anche dimostrato che essa esiste, e quindi che g
è non-degenere.
Indichiamo con {e1 , . . . , e4 } la base canonica di R4 . Come primo elemento di una base ortogonale possiamo prendere v1 = e1 ; si ha g(v1 , v1 ) = 3.
Cerchiamo ora un secondo vettore v2 ortogonale a v1 : possiamo prendere v2
della forma seguente
v2 = λ1 v1 + e2 ,
ed imporre che sia g(v1 , v2 ) = 0. Si trova allora λ1 = 32 e quindi
2
2
v2 = v1 + e2 = e1 + e2 ;
3
3
1
si calcola facilmente che g(v2 , v2 ) = − 3 .
Per determinare il terzo vettore v3 della base ortogonale il procedimento
è analogo. Sia
v3 = λ1 v1 + λ2 v2 + e3 ,
ed imponiamo che g(v1 , v3 ) = 0 e g(v2 , v3 ) = 0. Si ottengono le seguenti due
equazioni:

 g(v1 , v3 ) = 3λ1 + 1 = 0
1
1
 g(v2 , v3 ) = − λ2 − = 0,
3
3
1
che hanno come soluzione λ1 = − 3 e λ2 = −1. Si ha quindi
1
v3 = − v1 − v2 + e3 = −e1 − e2 + e3 ,
3
da cui si ottiene g(v3 , v3 ) = 1.
Analogamente, ponendo
v4 = λ1 v1 + λ2 v2 + λ3 v3 + e4 ,
ed imponendo che g(v1 , v4 ) = 0, g(v2 , v4 ) = 0 e g(v3 , v4 ) = 0, si trova che
λ1 = − 31 , λ2 = −1 e λ3 = −4, da cui si ottiene
1
v4 = − v1 − v2 − 4v3 + e4 = 3e1 + 3e2 − 4e3 + e4 ,
3
114
6. Forme Bilineari
e g(v4 , v4 ) = −14.
In conclusione, abbiamo visto che esiste una base ortogonale, data da
{v1 , . . . , v4 }; ciò dimostra che g è non-degenere. Inoltre abbiamo visto che
la matrice di g rispetto alla base {v1 , . . . , v4 } è


3 0 0 0
0 − 1 0 0 
3


0 0 1 0 
0 0 0 −14
da cui si deduce che l’indice d’inerzia di g è i(g) = 0.
(2) Il prodotto scalare usuale su R4 ha indice d’inerzia 4. Pertanto R4
dotato del prodotto scalare usuale non è isometrico allo spazio V dotato
della forma bilineare simmetrica g, che ha indice d’inerzia 0 (si ricordi il
teorema di Sylvester). Analogamente, (V, g) non è isometrico allo spazio di
Minkowski, perché quest’ultimo è R4 dotato della forma bilineare di matrice


−1 0 0 0
 0 1 0 0


 0 0 1 0
0 0 0 1
che ha indice d’inerzia 2.
Svolgimento esercizio 6. (1) Per determinare l’indice d’inerzia cerchiamo
innanzitutto una base ortogonale (dato che sarà utile anche nel seguito).
Indichiamo con {e1 , . . . , e4 } la base canonica di R4 . In questo caso tutti
e quattro i vettori della base canonica sono isotropi, quindi non possiamo prendere nessuno di questi come primo vettore di una base ortogonale.
Prendiamo allora v1 = e1 + e2 ; questo vettore non è isotropo, dato che si ha
g(v1 , v1 ) = 2g(e1 , e2 ) = 4.
Come secondo vettore si vede immediatamente che si può prendere v2 =
e1 − e2 , dato che esso è ortogonale a v1 : g(v1 , v2 ) = 0. Si ha poi g(v2 , v2 ) =
−4.
A questo punto possiamo prendere
v3 = λ1 v1 + λ2 v2 + e3 ,
ed imporre che g(v1 , v3 ) = g(v2 , v3 ) = 0. Si trova allora λ1 =
Si ha quindi
1
3
1
v3 = v1 − v2 + e3 = − e1 + e2 + e3 ,
4
4
2
da cui si ottiene g(v3 , v3 ) = 2.
Analogamente, ponendo
v4 = λ1 v1 + λ2 v2 + λ3 v3 + e4 ,
1
4
e λ2 = − 34 .
3. Soluzioni
115
ed imponendo che g(v1 , v4 ) = g(v2 , v4 ) = g(v3 , v4 ) = 0, si trova λ1 =
λ2 = 34 e λ3 = 2, da cui si ottiene
3
,
4
3
3
1
v4 = v1 + v2 + 2v3 + e4 = e1 + 2e2 + 2e3 + e4 ,
4
4
2
e g(v4 , v4 ) = −8.
La matrice di g rispetto alla base

4 0
0 −4

0 0
0 0
{v1 , . . . , v4 } è quindi

0 0
0 0

2 0
0 −8
da cui si deduce che l’indice d’inerzia di g è i(g) = 0.
(2) Dato che, come si verifica immediatamente, la matrice
d’inerzia 0, si deduce che la matrice

1 0
0 1

0 0
0 0
0
0
0
1
0 1
ha indice
1 0

0
0

1
0
ha indice d’inerzia 2 + 0 = 2, che è diverso dall’indice d’inerzia di g. Dal
teorema di Sylvester segue allora che non esiste una base di R4 rispetto a
cui g abbia la matrice indicata.
(3) Da quanto detto sopra segue che

0 1
1 0

0 0
0 0
la matrice

0 0
0 0

0 1
1 0
ha indice d’inerzia 0 + 0 = 0, che coincide con l’indice d’inerzia di g. Il
teorema di Sylvester afferma allora che esiste una base di R4 rispetto a cui
g abbia la matrice indicata. Ricordando la matrice di g rispetto alla base
{v1 , . . . , v4 } trovata in precedenza, è facile vedere che ponendo, ad esempio,
w1 = v1 +v2 , w2 = 41 (v1 −v2 ), w3 = v3 + 12 v4 e w4 = 14 (v3 − 12 v4 ), si ottiene una
base rispetto alla quale la matrice di g coincide con la matrice in questione.
(4) Da quanto visto in precedenza segue

0 1 0
1 0 0

0 0 −1
0 0 0
che la matrice

0
0

0
−1
116
6. Forme Bilineari
ha indice d’inerzia 0 − 2 = −2, che è diverso dall’indice d’inerzia di g. Dal
teorema di Sylvester segue allora che non esiste una base di R4 rispetto a
cui g abbia la matrice indicata.
3.2. Forme Bilineari Alternanti
Svolgimento esercizio 7. Come primo vettore possiamo certo prendere
w1 = v1 . Si tratta ora di determinare un vettore w2 tale che g(w1 , w2 ) = 1
(il fatto che g(w2 , w2 ) = 0 è ovvio, dato che g è alternante). Osservando
che g(w1 , v2 ) = g(v1 , v2 ) = 3, si vede che basta porre w2 = 13 v2 per ottenere
g(w1 , w2 ) = 1. Per determinare w3 poniamo ora w3 = aw1 + bw2 + cv3 .
Imponendo le condizioni g(w1 , w3 ) = 0 e g(w2 , w3 ) = 0, otteniamo il sistema

 b + 4c = 0
5
 − a + c = 0.
3
Ponendo, ad esempio, c = 3, si trova b = −12 e a = 5. Di conseguenza si
ha w3 = 5w1 − 12w2 + 3v3 = 5v1 − 4v2 + 3v3 .
Infine per determinare w4 poniamo w4 = aw1 + bw2 + cw3 + dv4 ed
imponiamo le condizioni g(w1 , w4 ) = 0, g(w2 , w4 ) = 0 e g(w3 , w4 ) = 1. Si
ottiene cosı̀ il sistema

b−d=0



2
−a+ d=0

3


− 31d = 1,
2
1
che ha come soluzione a = − 93
, b = d = − 31
(e c qualunque). Prendendo
2
1
1
2
1
w2 − 31
v4 = − 93
v1 − 93
v2 −
c = 0 si ottiene allora il vettore w4 = − 93 w1 − 31
1
v.
31 4
Osservazione: possiamo ora scrivere anche la matrice P di cambiamento
di base. Si ha infatti


1 0
5 −2/93
0 1/3 −4 −1/93
,
(w1 , . . . , w4 ) = (v1 , . . . , v4 ) 
0 0
3
0 
0 0
0 −1/31
e quindi


1 0
5 −2/93
0 1/3 −4 −1/93
.
P =
0 0
3
0 
0 0
0 −1/31
Si può allora controllare che vale la nota formula G0 = P T GP .
3. Soluzioni
117
3.3. Isometrie
Svolgimento esercizio 8. Dimostriamo che Im(φ − id) ⊂ Ker(φ − id)⊥ .
Sia v ∈ V e w ∈ Ker(φ−id); bisogna dimostrare che (φ−id)(v) è ortogonale
a w, cioè che g((φ − id)(v), w) = 0. Osserviamo che si ha φ(w) = w, dato
che (φ − id)(w) = 0. Si ottiene quindi:
g((φ − id)(v), w) = g(φ(v), w) − g(v, w)
= g(φ(v), φ(w)) − g(v, w)
= 0,
ove si è usato il fatto che g(φ(v), φ(w)) = g(v, w), cioè che φ è una isometria.
Dato che la dimostrazione precedente è valida per ogni v ed ogni w, si è
cosı̀ provato che Im(φ − id) ⊂ Ker(φ − id)⊥ . D’altra parte, ricordiamo che
dim Im(φ − id) = dim V − dim Ker(φ − id)
e
dim Ker(φ − id)⊥ = dim V − dim Ker(φ − id).
Quindi Im(φ − id) e Ker(φ − id)⊥ hanno la stessa dimensione e pertanto
devono essere uguali.
3.4. Altri esercizi
Svolgimento esercizio 9. (1) Dalla definizione è ovvio che g è simmetrica.
Per dimostrare che è bilineare basta allora dimostrare che è lineare nel primo
argomento. Si ha:
g(λ1 z1 + λ2 z2 , z3 ) = 2<((λ1 z1 + λ2 z2 )z3 )
= 2<(λ1 z1 z3 + λ2 z2 z3 )
= 2λ1 <(z1 z3 ) + 2λ2 <(z2 z3 )
= λ1 g(z1 z3 ) + λ2 g(z2 z3 ),
per ogni z1 , z2 ∈ C e ogni λ1 , λ2 ∈ R.
Per dimostrare che g è non-degenere bisogna dimostrare che, per ogni
z 6= 0 esiste w ∈ C tale che g(z, w) 6= 0. Ora, se z = a + ib 6= 0, deve essere
a 6= 0 oppure b 6= 0. Nel primo caso si ha g(z, 1) = 2a 6= 0, mentre nel
secondo si ha g(z, i) = −2b 6= 0. Quindi g è non-degenere.
(2) Gli elementi della matrice di g rispetto alla base {1, i} sono, per definizione, g(1, 1), g(1, i), g(i, 1) e g(i, i). La matrice in questione è quindi
2 0
.
0 −2
(3) Come nel caso precedente, l’elemento di posto (i, j) della matrice di
g rispetto alla base {z1 , z2 } è dato da g(zi , zj ). Si verifica che g(z1 , z1 ) =
118
6. Forme Bilineari
2<(z12 ) = z12 + z̄12 , g(z1 , z2 ) = g(z2 , z1 ) = 2<(z1 z2 ) = z1 z2 + z̄1 z̄2 e g(z2 , z2 ) =
2<(z22 ) = z22 + z̄22 . Si ha pertanto
2
z1 + z̄12
z1 z2 + z̄1 z̄2
G=
.
z1 z2 + z̄1 z̄2
z22 + z̄22
È ora immediato calcolare il determinante di G e verificare che vale l’uguaglianza in questione.
Svolgimento esercizio 10. Dato che la matrice A è simmetrica anche A2
lo è, e quindi rappresenta un’applicazione bilineare simmetrica (ad esempio
sullo spazio vettoriale Rn , ove n è l’ordine di A2 , rispetto alla base canonica).
L’applicazione bilineare simmetrica definita da A2 è semidefinita positiva;
infatti, per ogni vettore colonna v, si ha:
v T A2 v = (v T A)(Av) = (Av)T (Av) = wT w ≥ 0,
ove si è posto w = Av e si è osservato che wT w non è altro che il prodotto
scalare usuale di w per sé stesso.
La matrice I + A2 rappresenta quindi la somma di una applicazione
bilineare simmetrica definita positiva (di matrice I) con una semidefinita
positiva, ed è pertanto definita positiva e quindi non-degenere. Da ciò segue
che det(I + A2 ) 6= 0 e quindi I + A2 è una matrice invertibile.
Capitolo 7
Spazio Affine
1. Richiami di teoria
1.1. Spazi Affini
Ai fini dello studio della geometria, gli spazi vettoriali presentano l’inconveniente di non contenere “punti” ma solo “vettori”. Introduciamo ora una
categoria di spazi in cui si possono definire allo stesso tempo i concetti di
punto e vettore; questi sono gli spazi affini.
Definizione 1.1. Uno spazio affine A sul campo C è una terna A =
(S, V, +), costituita da un insieme S, detto l’insieme dei punti, da uno spazio
vettoriale V sul campo C, detto l’insieme dei vettori, e da una operazione
(vedi figura 1)
+ : S × V → S,
(P, v) 7→ Q = P + v,
che soddisfa le seguenti proprietà:
(1) (P + v) + w = P + (v + w), per ogni P ∈ S e ogni v, w ∈ V ;
(2) P + 0V = P , per ogni P ∈ S;
(3) per ogni P, Q ∈ S, esiste un unico vettore v ∈ V tale che P +v = Q.
Tale vettore si indica quindi con v = Q − P .
La dimensione dello spazio affine A è, per definizione, la dimensione dello
spazio vettoriale V .
Si noti che le proprietà enunciate legano strettamente tra loro i due
insiemi S e V . Infatti se fissiamo un punto P ∈ S, si dimostra facilmente
r Q
v
r P
Figura 1. Somma di un punto con un vettore.
120
7. Spazio Affine
che la funzione
V → S,
v 7→ P + v,
è una biiezione. L’insieme dei punti S può quindi essere identificato con
l’insieme dei vettori V , ma tale identificazione dipende dalla scelta di un
punto P .
Definizione 1.2. Lo spazio affine n-dimensionale standard sul campo C è
An (C) = (C n , C n , +), ove l’insieme S dei punti è C n , lo spazio vettoriale V
è ancora C n e l’operazione di somma di un punto con un vettore è definita
come segue: se P = (p1 , . . . , pn ) e v = (x1 , . . . , xn ) allora
P + v = (p1 + x1 , . . . , pn + xn ).
Si verifica facilmente che tutte le proprietà richieste dalla definizione di
uno spazio affine sono soddisfatte.
1.2. Sistemi di riferimento
Sia A = (S, V, +) uno spazio affine di dimensione n.
Definizione 1.3. Un sistema di riferimento in A è il dato di n + 1 punti
O, P1 , . . . , Pn tali che gli n vettori vi = Pi − O, per i = 1, . . . , n, siano una
base di V . Il punto O è detto l’origine del sistema di riferimento.
Dato un sistema di riferimento in A, ogni punto P si può scrivere in
modo unico come segue:
P = O + x1 v1 + · · · + xn vn ,
ove gli xi sono degli scalari.
Definizione 1.4. Gli scalari (x1 , . . . , xn ) tali che
P = O + x1 v1 + · · · + xn vn ,
sono detti le coordinate del punto P rispetto al sistema di riferimento fissato.
Sia A uno spazio affine di dimensione n in cui è stato fissato un sistema
di riferimento.
Proposizione 1.5. L’applicazione che ad ogni punto P di A associa la
n-upla (x1 , . . . , xn ) delle sue coordinate rispetto al sistema di riferimento
fissato, determina una biiezione di A con lo spazio affine standard An (C).
1.3. Sottovarietà lineari
Sia A = (S, V, +) uno spazio affine.
Definizione 1.6. Una sottovarietà lineare L di A è un insieme di punti di
A definito come segue:
L = {Q ∈ S | Q = P + v, ∀v ∈ W },
1. Richiami di teoria
121
ove P ∈ S è un punto fissato e W è un sottospazio vettoriale di V . L è detta
la sottovarietà lineare di A passante per P e parallela a W . Il sottospazio
vettoriale W è detto lo spazio direttore di L. La dimensione di L è, per
definizione, la dimensione del suo spazio direttore W .
Una sottovarietà lineare di dimensione 0 è un punto, una sottovarietà
lineare di dimensione 1 è detta retta, una sottovarietà lineare di dimensione
2 è detta piano, infine una sottovarietà lineare di dimensione n − 1, in uno
spazio affine di dimensione n, è detta iperpiano.
Definizione 1.7. Due sottovarietà lineari L e M di A si dicono:
(1) disgiunte se L ∩ M = ∅,
(2) parallele se i sottospazi direttori di L e M sono uno contenuto
nell’altro,
(3) sghembe se non sono né parallele né incidenti.
Come nel caso degli spazi vettoriali, l’intersezione di due sottovarietà
lineari è ancora una sottovarietà lineare. Ciò non è vero, in generale, per
l’unione.
Definizione 1.8. Siano L e M due sottovarietà lineari di A. La sottovarietà
lineare generata da L e M , indicata con L + M , è la più piccola (per la
relazione di inclusione) sottovarietà lineare di A contenente L e M .
Vale il seguente risultato:
Proposizione 1.9. Siano L e M due sottovarietà lineari di A. Allora si
ha:
dim(L + M ) ≤ dim L + dim M − dim(L ∩ M ),
ove vale il segno di uguaglianza se L e M sono incidenti oppure sghembe (e
si è posto, per convenzione, dim(∅) = −1).
Supponiamo ora che nello spazio affine A sia stato fissato un sistema
di riferimento O, P1 , . . . , Pn . I vettori vi = Pi − O, per i = 1, . . . , n, sono
quindi una base di V . Sia L una sottovarietà lineare di dimensione r di A,
data da
L = {Q ∈ S | Q = P + v, ∀v ∈ W },
e fissiamo una base w1 , . . . , wr di W . Questi vettori si possono scrivere come
combinazione lineare dei vettori v1 , . . . , vn come segue:
wj =
n
X
aij vi ,
i=1
Il generico vettore v ∈ W si può dunque scrivere
v=
r
X
j=1
λj wj =
X
i,j
aij λj vi =
n
X
i=1
µi v i ,
122
7. Spazio Affine
dove abbiamo posto
µi =
r
X
aij λj .
j=1
I coefficienti (µ1 , . . . , µn ) sono quindi le componenti del vettore v rispetto
alla base di V fissata.
Se indichiamo con (p1 , . . . , pn ) le coordinate di P e con (x1 , . . . , xn ) le
coordinate di Q, rispetto al sistema di riferimento fissato, l’equazione Q =
P + v è equivalente al seguente sistema di equazioni:

x1 = p1 + a11 λ1 + a12 λ2 + · · · + a1r λr



 x2 = p2 + a21 λ1 + a22 λ2 + · · · + a2r λr
···




xn = pn + an1 λ1 + an2 λ2 + · · · + anr λr
Queste equazioni, al variare del parametri λ1 , . . . , λr ∈ C descrivono tutti i
punti della varietà lineare L. Sono quindi chiamate le equazioni parametriche di L (ovviamente rispetto al sistema di riferimento fissato).
Una varietà lineare L può essere descritta anche da un altro tipo di
equazioni, le sue equazioni cartesiane. Esse si ottengono semplicemente
eliminando i parametri λi dal sistema delle sue equazioni parametriche. In
generale si ottiene in questo modo un sistema di equazioni lineari nelle
incognite x1 , . . . , xn . Ad esempio, se la varietà lineare L è un iperpiano, le
sue equazioni cartesiane si riducono ad una unica equazione del tipo
a1 x1 + a2 x2 + · · · + an xn = b.
Altri esempi verranno presentati negli esercizi.
1.4. Spazi affini euclidei
Definizione 1.10. Uno spazio affine euclideo è uno spazio affine A =
(S, V, +) tale che lo spazio vettoriale V è dotato di una forma bilineare
simmetrica e definita positiva φ (V è quindi uno spazio vettoriale euclideo).
In uno spazio affine euclideo, come in uno spazio vettoriale euclideo, si
possono quindi misurare le lunghezze (cioè le norme) dei vettori, e gli angoli
tra vettori. È quindi possibile definire anche la distanza tra due punti.
Definizione 1.11. La distanza tra due punti P e Q è data da
p
d(P, Q) = kvk = φ(v, v),
ove v = Q − P (cioè la distanza tra due punti è la norma del vettore che ha
come estremi i due punti dati).
Si può anche definire la distanza tra due sottoinsiemi qualsiasi di uno
spazio affine. Il modo più semplice per farlo è il seguente:
1. Richiami di teoria
123
rP
w
r
-r
Q
v R
r
Figura 2. Distanza di un punto da una retta.
Definizione 1.12. Siano A e B due sottoinsiemi di uno spazio affine A
(cioè A e B sono sottoinsiemi dell’insieme dei punti di A). La distanza tra
A e B è
d(A, B) = inf{d(P, Q) | P ∈ A, Q ∈ B}.
Ricordiamo ora alcune formule utili per il calcolo delle distanze.
Proposizione 1.13 (Distanza di un punto da una retta). Sia A =
An (R) lo spazio affine euclideo n-dimensionale standard. Sia P un punto e
sia r la retta passante per un punto Q e parallela a un vettore v. Indichiamo
con w il vettore w = P − Q. Allora la distanza di P da r è data da:
r
(v · w)2
d(P, r) = w · w −
.
v·v
Proposizione 1.14 (Distanza di un punto da un iperpiano). Sia
A = An (R) lo spazio affine euclideo n-dimensionale standard. Sia P =
(p1 , . . . , pn ) un punto e sia π un iperpiano di equazione
π : a1 x1 + a2 x2 + · · · + an xn + b = 0.
Allora la distanza di P da π è data da:
d(P, π) =
|a1 p1 + a2 p2 + · · · + an pn + b|
p
.
a21 + · · · + a2n
Se lo spazio affine euclideo ha dimensione 3 (e quindi è definito il prodotto
vettoriale di due vettori) si possono dimostrare i seguenti risultati.
Sia A = A3 (R) lo spazio affine euclideo tridimensionale standard.
Proposizione 1.15 (Distanza di un punto da una retta). Sia P un
punto e sia r una retta in A. Siano Q e R due punti di r. Poniamo
v = R − Q e w = P − Q (vedi figura 2). Allora la distanza di P da r è data
da:
kv ∧ wk
d(P, r) =
.
kvk
Proposizione 1.16 (Distanza tra due rette sghembe). Siano r e s
due rette sghembe in A. Siano P , Q due punti di r e R, S due punti di s.
124
7. Spazio Affine
Q r
r
*
P
r v
u
HH r
H
H
HH
w
RH
HH
HH
HH
H
j
H
Hr
H s
S H
H
Figura 3. Distanza tra due rette sghembe.
Poniamo u = P − R, v = Q − P e w = S − R (vedi figura 3). Allora la
distanza di r da s è data da:
d(r, s) =
|u · (v ∧ w)|
.
kv ∧ wk
Proposizione 1.17 (Area di un triangolo). Siano P , Q e R tre punti
di A. L’area del triangolo di vertici P , Q e R è data da:
1
A(P QR) = k(Q − P ) ∧ (R − P )k.
2
Proposizione 1.18 (Volume di un tetraedro). Siano P , Q, R e S
quattro punti di A. Il volume del tetraedro di vertici P , Q, R e S è dato da:
1
V (P QRS) = |(S − P ) · ((Q − P ) ∧ (R − P ))|.
6
1.5. Applicazioni affini
Siano A = (S, V, +) e A0 = (S 0 , V 0 , +) due spazi affini sul campo C.
Definizione 1.19. Una applicazione affine f : A → A0 è costituita da una
coppia di funzioni f = (fS , fV ), ove fS : S → S 0 è una funzione tra insiemi
e fV : V → V 0 una funzione lineare tra spazi vettoriali, tali che
fS (P + v) = fS (P ) + fV (v),
per ogni P ∈ S e ogni v ∈ V .
Si noti che le due applicazioni fS e fV sono strettamente correlate. Dalla
definizione segue infatti che, per ogni v ∈ V , si deve avere fV (v) = fS (Q) −
fS (P ), ove P e Q sono gli estremi di v, cioè v = Q − P . Si scopre cosı̀
che l’applicazione lineare fV è completamente determinata dall’applicazione
insiemistica fS .
2. Esercizi
125
Definizione 1.20. Se A = (S, V, +) e A0 = (S 0 , V 0 , +) sono due spazi affini
euclidei, un’applicazione affine f : A → A0 è detta isometria se è biiettiva
(cioè fS : S → S 0 è biiettiva) e l’applicazione lineare fV : V → V 0 è una
isometria di spazi vettoriali euclidei.
Sia f : A → A0 un’applicazione affine e fissiamo due sistemi di riferimento
O, P1 , . . . , Pn in A e O0 , P10 , . . . , Pm0 in A0 (ove n = dim A e m = dim A0 ). I
vettori vi = Pi − O, per i = 1, . . . , n, sono quindi una base di V , e i vettori
vj0 = Pj0 − O0 , per j = 1, . . . , m, sono una base di V 0 . Indichiamo con A la
matrice dell’applicazione lineare fV rispetto a queste due basi di V e V 0 . Sia
P un punto di A di coordinate (x1 , . . . , xn ) rispetto al sistema di riferimento
P
fissato. Ciò significa che il punto P è dato da P = O + v, ove v = ni=1 xi vi .
Dalla definizione di applicazione affine deriva che fS (P ) = fS (O) + fV (v).
Le coordinate (y1 , . . . , ym ) del vettore fV (v), rispetto alla base di V 0 , sono
date da
 
 
y1
x1
.
 ..  = A  ...  .
ym
xn
Se il punto fS (O) ha coordinate (q1 , . . . , qm ) rispetto al sistema di riferimento fissato su A0 , si conclude che, in termini delle coordinate, l’applicazione
affine f si esprime come segue:
 
 
 
x1
q1
x1
.
.
fS :  ..  7→  ..  + A  ...  .
xn
qm
xn
2. Esercizi
2.1. Rette e Piani
Esercizio 1. Nello spazio affine A3 (R) si determini la retta r passante per
il punto P = (p1 , p2 , p3 ) e parallela al vettore v = (v1 , v2 , v3 ).
Esercizio 2. Nello spazio affine A3 (R) si determini la retta r passante per
i punti P = (p1 , p2 , p3 ) e Q = (q1 , q2 , q3 ).
Esercizio 3. Nello spazio affine A3 (R) si determini il piano π passante
per il punto P = (p1 , p2 , p3 ) e parallelo ai vettori v = (v1 , v2 , v3 ) e w =
(w1 , w2 , w3 ).
Esercizio 4. Nello spazio affine A3 (R) si determini il piano π passante per
i tre punti (non allineati) P = (p1 , p2 , p3 ), Q = (q1 , q2 , q3 ) e R = (r1 , r2 , r3 ).
Esercizio 5. Nello spazio affine A3 (R) sia r la retta di equazioni
2x − 3y + 1 = 0
2x − 2y + z − 1 = 0.
126
7. Spazio Affine
Si determini la retta s passante per l’origine e parallela ad r, ed il piano del
fascio di asse r passante per l’origine.
Esercizio 6. Siano r1 e r2 rispettivamente le rette passanti per P1 = (0, 1, 2)
e P2 = (2, −1, 0) e parallele ai vettori v1 = (2, 1, 1) e v2 = (−2, 3, 0). Siano
F1 e F2 rispettivamente i fasci di piani di asse r1 e r2 . Si determinino i
piani π1 di F1 e π2 di F2 passanti per il punto P = (1, 1, 1), e le intersezioni
della retta r = π1 ∩ π2 con i piani coordinati. Si determini infine il triangolo
individuato dalle intersezioni delle rette r, r1 e r2 con il piano di equazione
x = 0.
Esercizio 7. Determinare l’equazione del piano contenente le rette r e s di
equazioni
y+1=0
2x − 3y + 2z − 1 = 0
r:
s:
2x + 2z − 3 = 0
x − 2y + z = 0.
Esercizio 8. Sia r la retta passante per i punti P = (1, 0, −2) e Q =
(0, −1, 3), e sia s la retta passante per il punto R = (−1, 1, 0) e parallela al
vettore v = (1, −1, − 21 ).
Si determinino il piano π1 , passante per i punti P , Q e R, il piano π2
contenente la retta s e passante per il punto medio del segmento P Q, ed
infine un vettore u parallelo alla retta π1 ∩ π2 .
2.2. Distanza di un Punto da una Retta
Esercizio 9. Si determini la distanza del punto P = (2, 0, −1) dalla retta
r di equazioni parametriche


x = t + 1
y=2

 z = t − 1.
2.3. Coni e Cilindri
Esercizio 10. Si determinino le rette passanti per il punto Q = (0, 1, −1),
distanti 1 dal punto P = (1, 1, 0) e contenute nel piano π di equazione
y + z = 0.
Esercizio 11. Si determini l’equazione del luogo dei punti dello spazio affine
euclideo A3 (R) appartenenti alle rette passanti per il punto P = (2, 1, 1) che
formano un angolo pari a π6 con il piano π di equazione 2x + y − z = 0.
Esercizio 12. Si determini l’equazione del luogo dei punti dello spazio affine
euclideo A3 (R) appartenenti alle rette passanti per il punto P = (3, 3, 3) che
2. Esercizi
127
intersecano la curva C di equazione
(
x2 + 2y 2 + 3z 2 = 4
x + z = 0.
Esercizio 13. Si determinino le rette del piano
√ π di equazione x−y+2z = 0
parallele al vettore v = (1, 3, 1) e distanti 6 dal punto P = (1, 0, 0).
Esercizio 14. Nello spazio affine euclideo reale tridimensionale, si determini
l’equazione del luogo dei punti appartenenti alle rette distanti 1 dal punto
P = (1, 1, 2) e formanti un angolo pari a π3 con i piani π1 : x + y = 0 e
π2 : x − z = 0.
Esercizio 15. Nello spazio affine euclideo A3 (R) sia π il piano contenente
la retta r di equazioni 21 (x − 1) = y + 1 = 13 z ed il punto P = (0, 1, 1).
√
Si determinino le rette del piano π passanti per P e distanti 3 dal punto
Q = (1, 1, −1). Si determinino inoltre la proiezione ortogonale Q0 di Q su π
e le rette di π passanti per Q0 e ortogonali alle rette trovate in precedenza.
2.4. Altri Esercizi
Esercizio 16. Nello spazio affine euclideo A3 (R) si determinino le equazioni
delle rette passanti per P = (1, 0, 0), incidenti la retta r di equazioni
y+z−1=0
r:
x=0
e formanti con quest’ultima un angolo pari a π6 .
Esercizio 17. Nello spazio affine euclideo A3 (R) si consideri l’affinità f
definita da

 1
 
 
√
0 − √12
1
x
x
2







0
y
0
f : y 7→ √
+ 0 1
1
1
√
z
z
0 √2
2−1
2
rispetto ad un sistema di riferimento ortonormale.
Si mostri che f è una isometria dello spazio affine euclideo che ammette
una retta r fatta di punti uniti, e si determini l’equazione di tale retta. Si
dica inoltre se f è una rotazione di asse r e, in caso affermativo, si determini
l’angolo di rotazione.
Esercizio 18. Nel piano affine euclideo A2 (R) siano r1 e r2 le rette di
equazione x − 2y + 1 = 0 e 3x − y + 2 = 0 rispettivamente. Si determinino
le equazioni delle rette s1 e s2 bisettrici degli angoli formati da r1 e r2 .
128
7. Spazio Affine
3. Soluzioni
3.1. Rette e Piani
Svolgimento esercizio 1. La retta r cercata è l’insieme dei punti X tali
che il vettore X − P è multiplo del vettore v. Si ha quindi
r = {X ∈ A3 | X − P = λv, λ ∈ R}.
Se poniamo X = (x1 , x2 , x3 ), si ottengono cosı̀ le equazioni


 x1 − p1 = λv1
x2 − p2 = λv2

 x − p = λv
3
3
3
Queste sono le equazioni parametriche della retta r.
Se da queste equazioni eliminiamo il parametro λ, e se supponiamo che
v1 6= 0, v2 6= 0 e v3 6= 0, si ottengono le due equazioni seguenti
x2 − p2
x3 − p3
x1 − p1
=
=
v1
v2
v3
che sono le equazioni cartesiane della retta r cercata.
Svolgimento esercizio 2. La retta r cercata è la retta passante per il
punto P parallela al vettore v = Q − P = (q1 − p1 , q2 − p2 , q3 − p3 ). A questo
punto basta applicare quanto visto nell’esercizio precedente. Le equazioni
parametriche di r sono quindi


 x1 − p1 = λ(q1 − p1 )
x2 − p2 = λ(q2 − p2 )

 x − p = λ(q − p )
3
3
3
3
Se poniamo X = (x1 , x2 , x3 ), queste equazioni si scrivono semplicemente
come segue:
X = λQ + (1 − λ)P, λ ∈ R.
Svolgimento esercizio 3. Il piano π in questione è l’insieme dei punti X
tali che il vettore X − P appartiene al sottospazio vettoriale generato da v
e w. Si ha quindi
π = {X ∈ A3 | X − P = λv + µw, λ, µ ∈ R}.
Se poniamo X = (x1 , x2 , x3 ), si ottengono cosı̀ le equazioni


 x1 − p1 = λv1 + µw1
x2 − p2 = λv2 + µw2

 x − p = λv + µw
3
3
3
3
Queste sono le equazioni parametriche del piano π.
3. Soluzioni
129
Un’altra descrizione del piano π si può ottenere come segue. Sia u un
vettore perpendicolare a v e w (ad esempio, si prenda u = v ∧ w). Il piano
π è allora l’insieme dei punti X tali che il vettore X − P è perpendicolare
a u, si ha dunque
π = {X ∈ A3 | (X − P ) · u = 0}.
Se poniamo u = (u1 , u2 , u3 ), si ottiene cosı̀ l’equazione
u1 (x1 − p1 ) + u2 (x2 − p2 ) + u3 (x3 − p3 ) = 0.
Questa è l’equazione (cartesiana) del piano π.
Svolgimento esercizio 4. Il piano π cercato è il piano passante per il
punto P e parallelo ai vettori v = Q − P = (q1 − p1 , q2 − p2 , q3 − p3 ) e
w = R − P = (r1 − p1 , r2 − p2 , r3 − p3 ). A questo punto basta applicare
quanto visto nell’esercizio precedente. Le equazioni parametriche di π sono
quindi


 x1 − p1 = λ(q1 − p1 ) + µ(r1 − p1 )
x2 − p2 = λ(q2 − p2 ) + µ(r2 − p2 )

 x − p = λ(q − p ) + µ(r − p )
3
3
3
3
3
3
Se poniamo X = (x1 , x2 , x3 ), queste equazioni si scrivono semplicemente
come segue:
X = λQ + µR + (1 − λ − µ)P,
λ, µ ∈ R.
Svolgimento esercizio 5. Per determinare la retta s è sufficiente conoscere
un vettore parallelo ad r. Per determinare questo vettore basta conoscere
due punti qualunque della retta r; la loro differenza fornirà il vettore cercato.
Si verifica immediatamente che i punti P = (0, 31 , 53 ) e Q = (− 12 , 0, 2)
appartengono ad r, quindi come vettore parallelo ad r si può prendere Q −
P = (− 12 , − 13 , 13 ). Le equazioni parametriche di s sono allora

1


x=− λ


2


1
y=− λ

3



1

z = λ
3
Eliminando il parametro λ si ottengono le equazioni cartesiane di s, che
sono (ad esempio)
2x − 3y = 0
y + z = 0.
Passiamo ora alla determinazione del piano in questione. L’equazione del
fascio di piani di asse r è
λ(2x − 3y + 1) + µ(2x − 2y + z − 1) = 0.
130
7. Spazio Affine
Imponendo la condizione di passaggio per l’origine, si ottiene
λ − µ = 0,
e si può dunque prendere, ad esempio, λ = µ = 1.
l’equazione del piano cercato, che è quindi
Questo fornisce
4x − 5y + z = 0.
Svolgimento esercizio 6. Le equazioni cartesiane di r1 sono
x−0
y−1
z−2
=
=
,
2
1
1
da cui si ottiene
r1 :
x − 2y + 2 = 0
y − z + 1 = 0.
Le equazioni parametriche di r2 sono


 x = −2t + 2
y = 3t − 1

 z = 0,
da cui si ricava
r2 :
3x + 2y − 4 = 0
z = 0.
Le equazioni dei fasci F1 e F2 sono allora
F1 : λ(x − 2y + 2) + µ(y − z + 1) = 0
e
F2 : λ0 (3x + 2y − 4) + µ0 z = 0.
Imponendo le condizioni di passaggio per il punto P = (1, 1, 1) si ottiene
λ = −µ e λ0 = −µ0 . Ponendo, ad esempio, λ = λ0 = 1 si trovano le equazioni
dei piani π1 e π2 :
π1 : x − 3y + z + 1 = 0,
e
π2 : 3x + 2y − z − 4 = 0.
Si ha ora
r = π1 ∩ π2 :
x − 3y + z + 1 = 0
3x + 2y − z − 4 = 0.
Il resto dell’esercizio è ora immediato.
3. Soluzioni
131
Svolgimento esercizio 7. Il fascio di piani di asse r ha equazione
λ(2x + 2z − 3) + µ(y + 1) = 0.
Per determinare il piano passante per r e s basterà quindi determinare il
piano del fascio di asse r passante per un punto di s; naturalmente bisognerà
poi verificare che tutta la retta s sia contenuta in questo piano.
Un punto della retta s è, ad esempio, il punto P = (2, 1, 0); imponendo,
nel fascio di piani precedente, la condizione di passaggio per P si ottiene
λ = −2µ, da cui, ponendo µ = 1, si trova l’equazione del piano π contenente
la retta r e passante per il punto P :
π : −4x + y − 4z + 7 = 0.
Per verificare che tutta la retta s è contenuta in π basta verificare che π
contiene un altro punto di s (diverso da P ); infatti se un piano contiene due
punti di una retta allora contiene tutta la retta.
Si verifica subito che Q = (0, 1, 2) è un punto di s e che Q ∈ π. Questo
conclude la dimostrazione che π è proprio il piano contenente le due rette r
e s.
Svolgimento esercizio 8. Un vettore parallelo alla retta r è il vettore
Q − P = (−1, −1, 5); quindi le equazioni di r sono
x−1
y−0
z+2
=
=
,
−1
−1
5
da cui si ricava
−x+y+1=0
r:
5y + z + 2 = 0.
Per quanto riguarda la retta s, le sue equazioni sono
x+1
y−1
z−0
=
=
,
1
−1
− 12
da cui si ricava
x+y =0
y − 2z − 1 = 0.
Il piano π1 è il piano del fascio di asse r passante per R. L’equazione del
fascio di piani di asse r è
s:
λ(−x + y + 1) + µ(5y + z + 2) = 0,
e dalla condizione di passaggio per R si ottiene λ = − 73 µ. Ponendo µ = 3
si trova cosı̀ l’equazione del piano π1 :
π1 : 7x + 8y + 3z − 1 = 0.
Il punto medio M del segmento P Q è il punto dato da
P +Q
M=
= (1/2, −1/2, 1/2)
2
132
7. Spazio Affine
(si noti che in uno spazio affine non ha alcun senso fare la somma di due
punti. Tuttavia la formula 12 (P + Q) fornisce precisamente le coordinate
del punto medio del segmento P Q. Si consiglia al lettore di verificarlo per
esercizio).
A questo punto il piano π2 si può determinare con lo stesso procedimento
usato in precedenza per determinare π1 (si consideri il fascio di piani di asse
s e si imponga la condizione di passaggio per il punto M ). Si trova
π2 : x + y = 0.
La retta π1 ∩ π2 ha quindi equazioni
7x + 8y + 3z − 1 = 0
π1 ∩ π2 :
x + y = 0,
e per trovare un vettore parallelo a questa retta basta trovarne due punti,
ad esempio i punti A = (0, 0, 13 ) e B = (−1, 1, 0). Il vettore in questione è
dunque u = B − A = (−1, 1, 31 ).
3.2. Distanza di un Punto da una Retta
Svolgimento esercizio 9. Ricordiamo qui le formule che permettono di
determinare la distanza di un punto da una retta nello spazio affine euclideo
A3 .
Sia r la retta passante per un punto Q e parallela al vettore v, e sia P
un altro punto. La distanza d = d(P, r) di P dalla retta r è determinata
da:
((P − Q) · v)2
.
d2 = (P − Q) · (P − Q) −
v·v
Equivalentemente, si ha la formula seguente:
d=
k(P − Q) ∧ vk
,
kvk
√
ove kwk = w · w indica la norma del vettore w.
Per determinare la distanza di P da r basta quindi conoscere un punto
Q di r ed un vettore v parallelo ad r. Nel caso in questione si verifica
immediatamente che si può prendere Q = (1, 2, −1) e v = (1, 0, 1) e quindi,
applicando ad esempio la prima formula, si trova d(P, r)2 = 92 , da cui si
√
ottiene d(P, r) = 23 2.
3.3. Coni e Cilindri
Svolgimento esercizio 10. Sia X = (x, y, z) un punto qualunque e consideriamo la retta r, passante per Q e X. Un vettore parallelo a questa retta
3. Soluzioni
133
è il vettore v = X − Q = (x, y − 1, z + 1). Utilizzando la formula per la
distanza di un punto da una retta, si ha:
d(P, r)2 = kP − Qk2 −
((P − Q) · v)2
.
kvk2
Imponendo la condizione d(P, r) = 1, l’equazione precedente diventa
1=2−
(x + z + 1)2
,
x2 + (y − 1)2 + (z + 1)2
da cui si ricava
y 2 − 2xz − 2x − 2y + 1 = 0.
Questa equazione descrive il luogo dei punti X tali che la retta passante
per Q e X ha distanza fissata, uguale a 1, dal punto P ; si tratta quindi
di un cono di vertice Q il cui asse è la retta per Q e P . Dato che le rette
che interessano sono solo quelle contenute nel piano π, queste si trovano
intersecando il cono trovato con il piano π in questione. Si noti, a questo
proposito, che il piano π contiene il vertice Q del cono, quindi l’intersezione
del piano π con il cono consiste precisamente di due rette (almeno se il piano
non è tangente al cono). L’intersezione tra il piano π e il cono è data dal
seguente sistema:
(
y 2 − 2xz − 2x − 2y + 1 = 0
y + z = 0.
Ricavando y = −z e sostituendo nella prima equazione, si ottiene l’equazione
(z + 1)(z + 1 − 2x) = 0,
da cui si ricavano quindi i due sistemi
z+1=0
y+z =0
e
z + 1 − 2x = 0
y + z = 0.
Queste sono quindi le equazioni delle due rette ottenute intersecando π con
il cono in questione, che sono precisamente le rette cercate.
Svolgimento esercizio 11. Dall’equazione del piano π si deduce che il
vettore n = (2, 1, −1) è ortogonale al piano π. Una retta forma un angolo
di π6 con π se e solo se forma un angolo di π3 con il vettore n, quindi il
problema si riduce a determinare tutte le rette passanti per P che formano
un angolo fissato, pari a π3 , con il vettore n. Queste rette formano pertanto
un cono di vertice P , di asse la retta per P parallela ad n, e di semiapertura
π
. L’equazione di questo cono si può trovare facilmente come segue: sia
3
134
7. Spazio Affine
X = (x, y, z), questo punto appartiene al cono in questione se e solo se il
vettore X − P forma un angolo di π3 con il vettore n; si deve pertanto avere
π
|(X − P ) · n| = kX − P k knk cos .
3
Sviluppando i calcoli, si ottiene
√
|2(x − 2) + (y − 1) − (z − 1)| =
6p
(x − 2)2 + (y − 1)2 + (z − 1)2 ,
2
da cui, elevando al quadrato e semplificando, si ottiene alla fine
5x2 − y 2 − z 2 + 8xy − 8xz − 4yz − 26x − 10y + 22z + 14 = 0.
Questa è l’equazione del luogo cercato.
Svolgimento esercizio 12. Il luogo cercato non è altro che l’insieme di
tutte le rette congiungenti P con un punto Q della curva C, al variare del
punto Q nella curva C. Si tratta quindi di un cono di vertice P proiettante
la curva C.
Sia S = (xS , yS , zS ) e consideriamo la retta per P e S, di equazioni
parametriche


 x = txS + 3(1 − t)
y = tyS + 3(1 − t)

 z = tz + 3(1 − t).
S
Se imponiamo a questa retta di intersecare la curva C, otteniamo il seguente
sistema
(
(txS + 3(1 − t))2 + 2(tyS + 3(1 − t))2 + 3(tzS + 3(1 − t))2 = 4
(txS + 3(1 − t)) + (tzS + 3(1 − t)) = 0.
Ricavando t dalla seconda equazione,
t=
6
6 − xS − zS
e sostituendo nella prima, si ottiene
2
2
2
3xS − 3zS
−3xS + 6yS − 3zS
−3xS + 3zS
+2
+3
= 4,
6 − xS − zS
6 − xS − zS
6 − xS − zS
da cui, sviluppando i calcoli e semplificando (e trascurando l’indice S), si
ottiene alla fine
25x2 + 36y 2 + 25z 2 − 36xy − 22xz − 36yz + 24x + 24z − 72 = 0.
Questa è l’equazione del luogo cercato.
3. Soluzioni
135
√
Svolgimento esercizio 13. Le rette parallele al vettore v e distanti 6
dal punto P formano√un cilindro di asse la retta passante per P e parallela
a v e raggio di base 6. Le rette cercate si ottengono quindi intersecando
questo cilindro con il piano π.
Sia r la retta passante per P e parallela a v; essa ha equazioni parametriche


x = t + 1
r : y = 3t

 z = t.
Sia X = (x,
√y, z) un punto generico del cilindro in questione: si deve avere
d(X, r) = 6. Ricordando la formula che fornisce la distanza di un punto
da una retta, si ha:
((X − P ) · v)2
= 6,
kX − P k −
kvk2
2
da cui si ottiene
(x − 1 + 3y + z)2
= 6.
11
Sviluppando i calcoli e semplificando, si ha:
(x − 1)2 + y 2 + z 2 −
5x2 + y 2 + 5z 2 − 3xy − xz − 3yz − 10x + 3y + z − 28 = 0.
√
Questa è l’equazione del cilindro di asse r e raggio di base 6. Intersecando
questo cilindro con il piano π si ottiene il sistema
(
5x2 + y 2 + 5z 2 − 3xy − xz − 3yz − 10x + 3y + z − 28 = 0
x − y + 2z = 0,
da cui, ricavando y dalla seconda equazione e sostituendo nella prima, si
ottiene
(
3(x − z)2 − 7(x − z) − 28 = 0
y = x + 2z.
√
Le due soluzioni della prima equazione sono x−z = 7− 6 385 e x−z =
si ottengono cosı̀ i due sistemi seguenti:


√
√
7 − 385
7 + 385


x−z =
x−z =
;
,
6
6


y = x + 2z.
y = x + 2z.
√
7+ 385
;
6
che sono le equazioni delle due rette cercate.
Svolgimento esercizio 14. Dalle equazioni dei piani in questione si deduce
che i vettori perpendicolari ai piani π1 e π2 sono rispettivamente n1 =
(1, 1, 0) e n2 = (1, 0, −1). Si osservi che una retta forma un angolo di π3
con i piani π1 e π2 se e solo se essa forma un angolo pari a π6 con i vettori
n1 e n2 . Sia dunque v = (x, y, z) un vettore indeterminato: imponendo a
136
7. Spazio Affine
v di formare un angolo pari a π6 con i vettori n1 e n2 si ottiene il seguente
sistema:

π
 v · n1 = kvk kn1 k cos
6
 v · n = kvk kn k cos π
2
2
6
che ha come unica soluzione (con molteplicità 2)
x = −2z
y = −z.
Ponendo, ad esempio, z = −1, si ottiene il vettore v = (2, 1, −1). Le rette
cercate sono quindi tutte le rette parallele al vettore v e distanti 1 dal punto
P : esse formano un cilindro di asse la retta passante per P e parallela a v e
di raggio di base 1. L’equazione di tale cilindro si trova utilizzando la formula per la distanza di un punto da una retta (vedi l’esercizio precedente).
Sviluppando i calcoli si trova, alla fine,
2x2 + 5y 2 + 5z 2 − 4xy + 4xz + 2yz − 8x − 10y − 26z + 29 = 0.
Questa è l’equazione del luogo dei punti cercato.
Svolgimento esercizio 15. Le equazioni della rette r sono
x − 2y − 3 = 0
3y − z + 3 = 0.
Il fascio di piani di asse r ha quindi equazione
λ(x − 2y − 3) + µ(3y − z + 3) = 0.
Imponendo la condizione di passaggio per P si ottiene λ = µ; ponendo
quindi λ = µ = 1 si ottiene l’equazione del piano π:
π : x + y − z = 0.
Sia ora X = (x, y, z) e sia rX la retta passante per P e X. Ricordando la
formula per la distanza di un punto da una retta, si ha
((Q − P ) · (X − P ))2
d(Q, rX )2 = kQ − P k2 −
,
kX − P k2
da cui si ottiene
(x − 2z + 2)2
3=5− 2
,
x + (y − 1)2 + (z − 1)2
che, sviluppando i calcoli e semplificando, fornisce
x2 + 2y 2 − 2z 2 + 4xz − 4x − 4y + 4z = 0.
Questa è l’equazione di un cono di vertice P ed asse la retta per P e Q. Le
rette cercate si ottengono intersecando questo cono con il piano π:
(
x2 + 2y 2 − 2z 2 + 4xz − 4x − 4y + 4z = 0
x + y − z = 0.
3. Soluzioni
137
Ricavando dalla seconda equazione y = z − x e sostituendo nella prima, si
ottiene 3x2 = 0, e quindi x = 0. Si noti che si è ottenuta una sola soluzione
(con molteplicità 2); esiste √
quindi una sola retta r1 contenuta nel piano π,
passante per P e distante 3 dal punto Q (ciò significa che il piano π è
tangente al cono in questione). La retta cercata ha dunque equazione
x=0
r1 :
y − z = 0.
Per determinare Q0 basta trovare la retta per Q perpendicolare a π ed intersecarla con π. Dall’equazione di π si vede subito che un vettore perpendicolare a π è il vettore w = (1, 1, −1), quindi la retta cercata ha
equazioni


x = t + 1
y =t+1

 z = −t − 1.
Intersecando questa retta con il piano π si trova il punto Q0 = (0, 0, 0).
Finalmente, per determinare la retta s è sufficiente trovare un vettore v
parallelo ad s, cioè perpendicolare a w ed anche alla retta r1 . Si vede subito
che i punti A = (0, 1, 1) e B = (0, 0, 0) appartengono a r1 , quindi un vettore
parallelo a r1 è il vettore u = A − B = (0, 1, 1). Di conseguenza, un vettore
v perpendicolare a u e w è il vettore v = u ∧ w = (−2, 1, −1). La retta s
cercata ha quindi equazioni


 x = −2t
y=t

 z = −t.
Si noti infine che la retta s si può determinare anche come l’intersezione del
piano π con il piano passante per Q0 e perpendicolare a r1 , che ha equazione
y + z = 0. La retta s ha quindi equazioni cartesiane
x+y−z =0
y + z = 0.
3.4. Altri Esercizi
Svolgimento esercizio 16. I punti A = (0, 0, 1) e B = (0, 1, 0) appartengono alla retta r, le cui equazioni parametriche sono quindi date da
X = A + t(B − A), cioè


x = 0
y=t

 z = 1 − t.
138
7. Spazio Affine
Le rette passanti per P e incidenti la retta r sono le rette passanti per P e
per il generico punto Xt = (0, t, 1 − t) di r. Basta ora richiedere che l’angolo
formato dai vettori Xt − P e B − A sia pari a π6 . Si deve quindi avere
π
|(Xt − P ) · (B − A)| = kXt − P k kB − Ak cos ,
6
che fornisce
√
p
√ 3
2
2
|2t − 1| = 1 + t + (1 − t) 2
.
2
Elevando al quadrato e semplificando si ottiene alla fine
t2 − t − 2 = 0,
che ha le seguenti soluzioni: t = −1 e t = 2.
In corrispondenza a questi valori di t si ottengono due punti di r, X−1 =
(0, −1, 2) e X2 = (0, 2, −1). Le rette cercate sono quindi le rette s e s0
passanti rispettivamente per P e X−1 e per P e X2 . Le loro equazioni
cartesiane sono quindi
x−y−1=0
x−z−1=0
0
s:
s :
2y + z = 0,
y + 2z = 0.
Svolgimento esercizio 17. Sia A la matrice che descrive l’azione dell’affinità sui vettori:
1

√
0 − √12
2
0 
A=0 1
1
√1
√
0
2
2
Si verifica subito che AT A = I (dove I indica la matrice identica), quindi
AT = A−1 , cioè A è una matrice ortogonale. Ciò prova che f è una isometria
dello spazio affine euclideo A3 (R).
Cerchiamo ora i punti uniti di f . Sia X = (x, y, z); X è un punto unito
se f (X) = X, cioè se

z
x

√
√
1
+
−
=x



2
2

y=y

√

z
x


 2 − 1 + √ + √ = z,
2
2
che equivale al seguente sistema:

√

z
1
−
2

 √ x− √ +1=0

2
2
√
√

2

 √x + 1 −
√ z + 2 − 1 = 0.

2
2
Ma queste sono proprio le equazioni di una retta, che è quindi la retta r
fatta di punti uniti.
3. Soluzioni
139
La retta r trovata è parallela al vettore u = (0, 1, 0). Per decidere se
l’affinità f è una rotazione attorno all’asse r basta controllare se f induce
o meno una rotazione dei vettori di un piano perpendicolare a r. Una base
di vettori del piano perpendicolare a r è costituita dai vettori v = (1, 0, 0) e
w = (0, 0, 1), e questi vettori vengono trasformati da f rispettivamente nei
vettori v 0 = Av = √12 v + √12 w e w0 = Aw = − √12 v + √12 w. La matrice della
trasformazione lineare indotta dall’affinità f sul piano generato dai vettori
v e w è dunque (rispetto alla base data da v e w)
1
π
π
√
√1
−
cos
−
sin
2
2
4
4
=
π
π
√1
√1
sin
cos
4
4
2
2
che corrisponde pertanto ad una rotazione di un angolo pari a
alla retta r).
π
4
(attorno
Svolgimento esercizio 18. Ricordiamo che le rette bisettrici degli angoli
formati da r1 e r2 godono della proprietà che i loro punti sono equidistanti
dalle due rette r1 e r2 (oltre, naturalmente, alla proprietà di bisecare gli
angoli!).
Sia quindi X = (x, y) un punto del piano. Imponiamo ora la condizione
che la distanza di X da r1 sia uguale alla distanza di X da r2 : d(X, r1 ) =
d(X, r2 ). Si ottiene l’equazione seguente:
|x − 2y + 1|
|3x − y + 2|
√
√
=
.
5
10
Eliminando i denominatori e i valori assoluti, si ottengono le due equazioni:
√
2 (x − 2y + 1) = ±(3x − y + 2),
da cui segue che le rette cercate hanno equazione:
√
√
√
s1 : (3 − 2)x + (2 2 − 1)y + 2 − 2 = 0
e
s2 : (3 +
√
√
√
2)x − (2 2 + 1)y + 2 + 2 = 0.
Capitolo 8
Coniche
1. Richiami di teoria
1.1. Coniche
In questo capitolo richiameremo i principali risultati utili allo studio delle
coniche nel piano affine euclideo reale standard. Facciamo però notare come
l’ambiente più adatto allo studio delle coniche non sia il piano affine ma il
piano proiettivo (che è un’estensione del piano affine ottenuta aggiungendo
i “punti all’infinito”).
Definizione 1.1. Una conica C è il luogo degli zeri di un polinomio di
secondo grado nelle variabili x e y:
P (x, y) = ax2 + bxy + cy 2 + dx + ey + f = 0.
La conica C è detta degenere se il polinomio P (x, y) è il prodotto di due
polinomi di primo grado, non-degenere altrimenti.
Alla conica C si associa la seguente matrice simmetrica


a 2b d2
A =  2b c 2e  ,
d
e
f
2
2
in modo che si abbia
 
x

P (x, y) = (x, y, 1) A y  .
1
Se poniamo X = (x, y, 1), l’equazione della conica C si scrive quindi semplicemente come
XAX T = 0.
Questa equazione può essere interpretata come segue: il punto (x, y) appartiene alla conica C se e solo se il vettore X = (x, y, 1) corrispondente
è un vettore isotropo per la forma bilineare simmetrica di matrice A. Da
questa osservazione si può facilmente intuire come lo studio delle coniche
sia intimamente legato allo studio delle forme bilineari simmetriche.
142
8. Coniche
Ricordiamo ora i principali risultati relativi allo studio di una conica.
Sia C una conica di matrice A.
Proposizione 1.2. La conica C è non-degenere se e solo se det A 6= 0.
Se det A = 0, C è una conica degenere, e precisamente C è una retta
(contata con molteplicità 2) se rango(A) = 1, mentre C è l’unione di due
rette distinte (reali o complesse coniugate) se rango(A) = 2.
Nel seguito ci occuperemo solo delle coniche non-degeneri.
Sia dunque C una conica non-degenere di matrice A. Indichiamo con A0
la seguente sottomatrice di A:
a 2b
0
.
A = b
c
2
Si ha:
Proposizione 1.3. Se det A0 > 0, la conica C è una ellisse (a punti reali
o immaginari). Se det A0 = 0, C è una parabola. Se det A0 < 0, C è una
iperbole.
Osservazione 1.4. Le ellissi e le iperboli sono anche dette coniche a centro,
in quanto possiedono un centro di simmetria. Le rette passanti per il centro
sono dette diametri. Tra tutti i diametri rivestono particolare importanza
quelli che sono anche assi di simmetria per la conica: tali diametri sono
detti assi. Tutte le coniche a centro, tranne le circonferenze, possiedono
due assi, che sono tra loro ortogonali. Nel caso di una circonferenza tutti i
diametri sono assi di simmetria. I vertici di una conica a centro sono i punti
di intersezione tra la conica e i suoi assi.
1.2. Ellisse
Occupiamoci ora dello studio dettagliato di una ellisse.
Sia dunque C una conica di matrice A = (aij ), con det A 6= 0 e det A0 >
0. C è quindi una ellisse non-degenere.
Il centro (di simmetria) dell’ellisse è il punto C = (x, y) le cui coordinate
sono le soluzioni del seguente sistema:
a11 x + a12 y + a13 = 0
a21 x + a22 y + a23 = 0,
dove gli aij sono i coefficienti della matrice A. Per determinare gli assi (di
simmetria) abbiamo bisogno di conoscere gli autovettori, e quindi anche gli
autovalori, della sottomatrice A0 di A. Siano dunque λ1 , λ2 gli autovalori di
A0 e v1 , v2 gli autovettori corrispondenti. Gli assi sono le rette passanti per
il centro C e parallele ai vettori v1 e v2 .
Nel sistema di riferimento che ha come origine il centro C dell’ellisse e
come assi X e Y gli assi dell’ellisse, l’equazione dell’ellisse assume la seguente
1. Richiami di teoria
143
forma, detta forma canonica:
C : αX 2 + βY 2 = 1,
ove i coefficienti α e β sono dati da
det A0
det A0
,
β = −λ2
.
det A
det A
Altri due punti notevoli relativi allo studio di una ellisse sono i suoi fuochi
(che non sono punti dell’ellisse). I fuochi di una ellisse sono due punti che
stanno su uno degli assi dell’ellisse, detto asse focale, in posizione simmetrica
rispetto al centro, a una distanza d da esso. Tale distanza è data dalla
seguente formula:
s
α = −λ1
d=
β−α
,
αβ
se è α < β (altrimenti bisogna scambiare i ruoli di α e β). Un metodo
per determinare quale dei due assi trovati sia l’asse focale verrà illustrato
negli esercizi. Si dimostra infine che l’ellisse è caratterizzata dalla seguente
proprietà:
Proposizione 1.5. L’ellisse è il luogo geometrico dei punti del piano tali
che la somma delle distanze dai fuochi sia costante.
1.3. Iperbole
Consideriamo ora lo studio di una iperbole.
Sia dunque C una conica di matrice A = (aij ), con det A 6= 0 e det A0 <
0. C è quindi una iperbole non-degenere.
Come nel caso dell’ellisse, il centro (di simmetria) dell’iperbole è il punto
C = (x, y) le cui coordinate sono le soluzioni del seguente sistema:
a11 x + a12 y + a13 = 0
a21 x + a22 y + a23 = 0.
Per determinare gli assi (di simmetria) abbiamo bisogno di conoscere gli
autovettori, e quindi anche gli autovalori, della sottomatrice A0 di A. Siano
dunque λ1 , λ2 gli autovalori di A0 e v1 , v2 gli autovettori corrispondenti. Gli
assi sono le rette passanti per il centro C e parallele ai vettori v1 e v2 .
Nel sistema di riferimento che ha come origine il centro C dell’iperbole
e come assi X e Y gli assi dell’iperbole, l’equazione dell’iperbole assume la
seguente forma, detta forma canonica:
C : αX 2 + βY 2 = 1,
ove i coefficienti α e β sono dati da
α = −λ1
det A0
,
det A
β = −λ2
det A0
.
det A
144
8. Coniche
Nel caso dell’iperbole ci sono altre due rette che hanno un importante
significato geometrico: gli asintoti.
Gli asintoti di una iperbole C sono le rette passanti per il centro C e
“tangenti all’infinito” a C . Le direzioni degli asintoti sono determinate dai
vettori v = (x, y) che soddisfano l’equazione
a11 x2 + 2a12 xy + a22 y 2 = 0.
Un’iperbole è detta equilatera se i suoi asintoti sono ortogonali.
Infine, come nel caso dell’ellisse, ci sono due punti notevoli detti fuochi
(che non sono punti dell’iperbole). I fuochi di una iperbole sono due punti
che stanno su uno degli assi dell’iperbole, detto asse focale, in posizione
simmetrica rispetto al centro, a una distanza d da esso. Tale distanza è
data dalla seguente formula:
s
β−α
d=
,
αβ
se è β < 0 < α (altrimenti bisogna scambiare i ruoli di α e β). Un metodo
per determinare quale dei due assi trovati sia l’asse focale verrà illustrato
negli esercizi. Si dimostra infine che l’iperbole è caratterizzata dalla seguente
proprietà:
Proposizione 1.6. L’iperbole è il luogo geometrico dei punti del piano tali
che la differenza delle distanze dai fuochi sia costante.
1.4. Parabola
Consideriamo infine lo studio di una parabola.
Sia dunque C una conica di matrice A = (aij ), con det A 6= 0 e det A0 =
0. C è quindi una parabola non-degenere.
Consideriamo il vettore w = (a11 , a12 ) e sia v = (−a12 , a11 ) un vettore
ortogonale a w. Il vettore v determina la direzione dell’asse di simmetria
della parabola. Il punto V in cui la parabola interseca il suo asse di simmetria è detto il vertice della parabola. Si può dimostrare che l’asse della
parabola è la retta di equazione ax + by + c = 0, ove i coefficienti a, b e c
sono dati da:
 
 
a11
a
 b  = A a12  .
0
c
Trovato l’asse della parabola si determina poi facilmente il vertice V mettendo a sistema l’equazione dell’asse con l’equazione della parabola.
Nel sistema di riferimento che ha come origine il vertice V , come asse
Y l’asse della parabola e come asse X la retta per il vertice ortogonale
all’asse Y , l’equazione della parabola assume la seguente forma, detta forma
1. Richiami di teoria
145
canonica:
1
C : Y = αX 2 ,
2
ove il coefficiente α è dato da
r
α = ±λ
−
λ
,
det A
ove λ è l’autovalore non-nullo di A0 e il segno è scelto in modo che α > 0
(in realtà dipende da come si decide di orientare l’asse Y ).
Nel caso della parabola c’è un solo altro punto notevole, detto fuoco;
è il punto che si trova sull’asse ad una distanza d dal vertice, dalla parte
“interna” della parabola (cioè nella regione di piano convessa delimitata
dalla parabola). La distanza d è data dalla seguente formula:
d=
1
.
2α
C’è poi una retta notevole, detta direttrice; è la retta parallela al vettore
w, distante d dal vertice, e contenuta nella regione “esterna” alla parabola
(cioè nella regione di piano concava delimitata dalla parabola). Si dimostra
infine che la parabola è caratterizzata dalla seguente proprietà:
Proposizione 1.7. La parabola è il luogo geometrico dei punti del piano
equidistanti dal fuoco e dalla direttrice.
1.5. Fasci di coniche
Ricordiamo la definizione di un fascio di coniche:
Definizione 1.8. Siano C1 e C2 due coniche di equazioni P1 (x, y) = 0 e
P2 (x, y) = 0 rispettivamente. Il fascio di coniche generato da C1 e C2 è
l’insieme di tutte le coniche le cui equazioni sono date da
λP1 (x, y) + µP2 (x, y) = 0,
al variare dei parametri λ e µ in R.
La seguente osservazione è molto importante nello studio dei fasci di
coniche:
Osservazione 1.9. Se P ∈ C1 ∩ C2 , allora P appartiene a ogni conica del
fascio generato da C1 e C2 .
Di conseguenza tutte le coniche del fascio generato da C1 e C2 passano
per tutti i punti in cui le due coniche C1 e C2 si intersecano. Tali punti sono
detti i punti base del fascio di coniche.
146
8. Coniche
2. Esercizi
2.1. Coniche Degeneri
Esercizio 1. Nel piano euclideo, si studi la conica C di equazione
4x2 + 9y 2 − 12xy + 4x − 6y + 1 = 0.
Esercizio 2. Nel piano euclideo, si studi la conica C di equazione
2x2 − 3y 2 − 5xy + 3x + 5y − 2 = 0.
2.2. Iperbole
Esercizio 3. Nel piano euclideo, si studi la conica C di equazione
x2 − 4xy + 3y 2 + 2x − 2y + 2 = 0.
2.3. Ellisse
Esercizio 4. Nel piano euclideo, si studi la conica C di equazione
3x2 − 4xy + 4y 2 + 6x + 2y + 2 = 0.
2.4. Parabola
Esercizio 5. Nel piano euclideo, si studi la conica C di equazione
x2 + 4xy + 4y 2 − 2x + 4y + 1 = 0.
2.5. Altri Esercizi
Esercizio 6. Nel piano euclideo, sia C la conica di equazione
2xy + 2y 2 + 2y − 1 = 0.
Si determinino le equazioni delle rette passanti per il punto P = (−3, 1) e
tangenti alla conica C .
Esercizio 7. Nel piano euclideo, si determini l’equazione della conica C
avente un fuoco nel punto F = (2, 1), passante per P = (1, 3) e tale che
la direttrice relativa al fuoco F (cioè la retta polare di F ) sia la retta d di
equazione x + y − 1 = 0. Si determini inoltre l’eccentricità di C .
3. Soluzioni
147
2.6. Fasci di Coniche
Esercizio 8. Nel piano euclideo si determini l’equazione della conica C
passante per i punti P1 = (0, 1), P2 = (0, 0), P3 = (3/2, 2), P4 = (1, 1) e
P5 = (−1/3, 2/3).
Esercizio 9. Nel piano euclideo si determini l’equazione della conica C
passante per il punto P = (0, 2), tangente alla retta r : x − y + 1 = 0
nel punto R = (1, 2) e tangente alla retta s : 2x + y − 1 = 0 nel punto
S = (2, −3).
Esercizio 10. Sia F un fascio di coniche nel piano euclideo e sia P un
punto distinto dai punti base del fascio F . Si dimostri che le polari di P
rispetto alle coniche del fascio F formano un fascio di rette.
3. Soluzioni
3.1. Coniche Degeneri
Svolgimento esercizio 1. Una matrice associata alla conica C è:


4 −6 2
A = −6 9 −3 .
2 −3 1
Calcolando il determinante di A si trova det A = 0, quindi la conica C è
degenere. Bisogna allora determinare il rango di A, che risulta essere 1,
dato che la prima e la seconda riga di A sono multiple della terza (oppure,
dato che tutti i minori di ordine 2 sono nulli). Da ciò si deduce che la conica
C è una retta, contata con molteplicità 2. Se indichiamo con
ax + by + c = 0
l’equazione di tale retta, si deve avere
4x2 + 9y 2 − 12xy + 4x − 6y + 1 = (ax + by + c)2 ,
da cui si deduce che l’equazione della retta cercata è
2x − 3y + 1 = 0.
La conica C è rappresentata in figura 1.
Svolgimento esercizio 2. Una matrice associata alla conica C è:


4 −5 3
A = −5 −6 5  .
3
5 −4
Calcolando il determinante di A si trova det A = 0, quindi la conica C è
degenere. La matrice A ha rango 2, come si vede facilmente considerando i
148
8. Coniche
1.5
1
0.5
-2
-1
1
2
-0.5
-1
Figura 1.
minori di ordine due. Da ciò si deduce che la conica C è costituita da due
rette distinte r1 e r2 .
Per calcolare le equazioni di r1 e r2 si può procedere come segue. Indichiamo con C il punto r1 ∩r2 (se r1 e r2 non sono parallele); per determinare
C si può, ad esempio, intersecare la conica con un fascio di rette, ad esempio
il fascio di rette di equazione y = µ, ed imporre che vi sia un solo punto
di intersezione; quest’unico punto di intersezione sarà dunque il punto C
(alla fine dell’esercizio è proposto un altro procedimento per determinare il
punto C). Risolvendo il sistema
(
2x2 − 3y 2 − 5xy + 3x + 5y − 2 = 0
y=µ
si ottiene
2x2 + (3 − 5µ)x − 3µ2 + 5µ − 2 = 0.
Quest’ultima equazione ha una sola soluzione (con molteplicità 2) se e solo
se il suo discriminante è nullo:
∆ = 49µ2 − 70µ + 25 = (7µ − 5)2 = 0,
da cui si ricava µ = 57 . Sostituendo questo valore di µ nell’equazione (∗) e
risolvendo, si ottiene x = 17 . Il punto C ha dunque coordinate C = ( 71 , 57 ).
Basta ora trovare altri due punti di C , per esempio i due punti di
intersezione della conica con la retta di equazione y = 0:
(
2x2 − 3y 2 − 5xy + 3x + 5y − 2 = 0
y=0
da cui si ricava P1 = ( 21 , 0) e P2 = (−2, 0). Le due rette r1 e r2 sono allora
le rette passanti per C e P1 , e per C e P2 rispettivamente, le cui equazioni
3. Soluzioni
149
3
2
1
-1
C
-0.5
0.5
1
-1
Figura 2.
sono:
r1 : 2x + y − 1 = 0,
r2 : x − 3y + 2 = 0.
La conica C è rappresentata in figura 2.
Determinazione del punto C: un altro modo per determinare il punto
C = r1 ∩ r2 è basato sul fatto che C è l’unico punto singolare della conica
C , quindi le sue coordinate si ottengono risolvendo il sistema

∂f


(x, y) = 0

∂x
∂f


(x, y) = 0

∂y
dove f (x, y) = 0 è l’equazione della conica C .
Chi non fosse convinto di ciò, può facilmente dimostrare (farlo per esercizio) che, se
f (x, y) = (ax + by + c)(a0 x + b0 y + c0 ),
allora i due sistemi lineari

∂f


(x, y) = 0

∂x
∂f


(x, y) = 0

∂y
e
ax + by + c = 0
a0 x + b 0 y + c 0 = 0
hanno la stessa soluzione (si tratta proprio del punto C in cui si intersecano
le due rette di equazione ax + by + c = 0 e a0 x + b0 y + c0 = 0).
150
8. Coniche
3.2. Iperbole
Svolgimento esercizio 3. Una matrice associata alla conica C è:


1 −2 1
A = −2 3 −1 .
1 −1 2
Calcolando il determinante di A si trova det A = −2, quindi la conica C è
non-degenere.
Consideriamo la sottomatrice
1 −2
0
A =
.
−2 3
Si ha det A0 = −1 < 0, quindi la conica C è una conica a centro e,
precisamente, un’iperbole.
Centro: il centro C = (xC , yC ) è il punto le cui coordinate sono date da
1 a11 a13 1 a12 a13 ,
yC = −
,
xC =
det A0 a22 a23 det A0 a12 a23 dove gli aij sono i coefficienti della matrice A. Nel nostro caso, si ha:
−2 1 1
1
= 1,
= 1,
xC = − yC = 3 −1
−2 −1
quindi C = (1, 1).
Assi: gli assi si possono determinare come segue. Come prima cosa determiniamo gli autovalori di A0 : nel nostro caso si trova
√
√
λ1 = 2 − 5, λ2 = 2 + 5.
Gli autovettori corrispondenti sono, rispettivamente,
√
√
v1 = (1 + 5, 2), v2 = (1 − 5, 2).
Gli autovettori di A0 rappresentano le direzioni degli assi. Gli assi sono
quindi le rette r1 e r2 passanti per il centro C e parallele ai vettori v1 e v2
rispettivamente. Le loro equazioni parametriche sono quindi:
(
(
√
√
x = 1 + (1 − 5)t
x = 1 + (1 + 5)t
r2 :
r1 :
y = 1 + 2t
y = 1 + 2t
Forma canonica: la forma canonica di un’iperbole è data dalla seguente
matrice


α 0 0
∆ = 0 β 0  .
0 0 −1
3. Soluzioni
151
Gli elementi α e β sulla diagonale non sono altro che gli autovalori di A0
A0
moltiplicati per − det
. Nel nostro caso si trova:
det A
√
1
5
α = − λ1 = −1 +
,
2
2
√
5
1
.
β = − λ2 = −1 −
2
2
Fuochi: i fuochi reali dell’iperbole sono due punti che si trovano sull’asse
focale ad una distanza d dal centro C. Per determinare i fuochi bisogna
quindi determinare l’asse focale e la distanza d.
Fra i due valori α e β trovati, uno di essi è positivo (nel nostro caso α),
mentre l’altro (nel nostro caso β) è negativo: l’asse focale è quello determinato dall’autovettore di A0 corrispondente al valore positivo. Nel nostro
caso l’asse focale è quello determinato dall’autovettore v1 (che corrisponde
all’autovalore λ1 che, a sua volta, corrisponde ad α), ed è quindi la retta r1 .
Dato che si ha β < 0 < α, la distanza d tra i fuochi e il centro C si
calcola con la formula seguente:
s
β−α
d=
.
αβ
√
Nel nostro caso si trova d = 2 4 5.
Per trovare le coordinate affini dei fuochi, si può procedere ora come
segue: si determini il versore dell’asse focale v̂1 = kvv11 k . I fuochi sono i due
punti F1 e F2 dati da:
F1 = C − dv̂1 ,
F2 = C + dv̂1 .
Asintoti: per determinare le equazioni degli asintoti si può procedere nel
modo seguente. Nell’equazione dell’iperbole C si considerino solo i termini
di secondo grado, ottenendo l’equazione
x2 − 4xy + 3y 2 = 0.
Le soluzioni di quest’ultima equazione sono date da x = 3y oppure x = y.
Queste sono le equazioni di due rette parallele ai vettori w1 = (3, 1) e
w2 = (1, 1) rispettivamente. Gli asintoti sono le rette passanti per il centro
C e parallele ai vettori w1 e w2 rispettivamente (cioè le rette per C parallele
alle due rette trovate, di equazioni x = 3y e x = y). Le loro equazioni
parametriche sono quindi:
x = 1 + 3t
x=1+t
s1 :
s2 :
y =1+t
y =1+t
e le corrispondenti equazioni cartesiane sono:
s1 : x − 3y + 2 = 0,
s2 : −x + y = 0.
152
8. Coniche
10
5
-10
-5
5
10
-5
-10
Figura 3.
Si noti che i vettori w1 e w2 non sono ortogonali, quindi C non è una iperbole
equilatera. La conica C è rappresentata in figura 3.
3.3. Ellisse
Svolgimento esercizio 4. Una matrice associata alla conica C è:


3 −2 3
A = −2 4 1 .
3
1 2
Calcolando il determinante di A si trova det A = −35, quindi la conica C è
non-degenere.
Consideriamo la sottomatrice
3 −2
0
A =
.
−2 4
Si ha det A0 = 8 > 0, quindi la conica C è una conica a centro e, precisamente, una ellisse.
3. Soluzioni
153
Centro: il centro C = (xC , yC ) è il punto le cui coordinate sono date da
1 a11 a13 1 a12 a13 xC =
,
yC = −
,
det A0 a22 a23 det A0 a12 a23 dove gli aij sono i coefficienti della matrice A. Nel nostro caso, si ha:
7
1 3 3
9
1 −2 3
=− ,
=− ,
yC = − xC = 8 4 1
4
8 −2 1
8
quindi C = (−7/4, −9/8).
Assi: gli assi si possono determinare come segue. Come prima cosa determiniamo gli autovalori di A0 : nel nostro caso si trova
√
√
7 + 17
7 − 17
, λ2 =
.
λ1 =
2
2
Gli autovettori corrispondenti sono, rispettivamente,
√
√
v1 = (1 + 17, 4), v2 = (1 − 17, 4).
Gli autovettori di A0 rappresentano le direzioni degli assi. Gli assi sono
quindi le rette r1 e r2 passanti per il centro C e parallele ai vettori v1 e v2
rispettivamente. Le loro equazioni parametriche sono quindi:
(
(
√
√
x = −7/4 + (1 + 17)t
x = −7/4 + (1 − 17)t
r1 :
r2 :
y = −9/8 + 4t
y = −9/8 + 4t
Forma canonica: la forma canonica di una ellisse è data dalla seguente
matrice


α 0 0
∆ = 0 β 0  .
0 0 −1
Gli elementi α e β sulla diagonale non sono altro che gli autovalori di A0
A0
moltiplicati per − det
. Nel nostro caso si trova:
det A
√
8
4(7 − 17)
α = λ1 =
,
35
35√
8
4(7 + 17)
β = λ2 =
.
35
35
Fuochi: i fuochi reali dell’ellisse sono due punti che si trovano sull’asse
focale ad una distanza d dal centro C. Per determinare i fuochi bisogna
quindi determinare l’asse focale e la distanza d.
Fra i due valori α e β trovati, entrambi positivi, uno di essi è minore
dell’altro (perché la conica non è un cerchio). Nel nostro caso si tratta di
α. L’asse focale è quello determinato dall’autovettore di A0 corrispondente
al valore minore. Nel nostro caso l’asse focale è quello determinato dall’autovettore v1 (che corrisponde all’autovalore λ1 che, a sua volta, corrisponde
ad α), ed è quindi la retta r1 .
154
8. Coniche
-3.5
-3
-2.5
-2
-1.5
-1
-0.5
-0.5
-1
-1.5
-2
-2.5
Figura 4.
Dato che α < β, la distanza d tra i fuochi e il centro C si calcola con la
formula seguente:
s
β−α
d=
.
αβ
√ √
35 17
Nel nostro caso si trova d =
.
8
Per trovare le coordinate dei fuochi, si può procedere ora come segue: si
determini il versore dell’asse focale v̂1 = kvv11 k . I fuochi sono i due punti F1
e F2 dati da:
F1 = C − dv̂1 ,
F2 = C + dv̂1 .
La conica C è rappresentata in figura 4.
3.4. Parabola
Svolgimento esercizio 5. Una matrice

1 2
A= 2 4
−1 2
associata alla conica C è:

−1
2 .
1
Calcolando il determinante di A si trova det A = −16, quindi la conica C è
non-degenere.
Consideriamo la sottomatrice
1 2
0
A =
.
2 4
3. Soluzioni
155
Si ha det A0 = 0, quindi la conica C è una parabola.
Asse e Vertice: Sia w = (a11 , a12 ) = (1, 2), e sia v = (−a12 , a11 ) = (−2, 1)
un vettore ortogonale a w. Il vettore v determina la direzione dell’asse della
parabola. L’equazione cartesiana dell’asse della parabola si può trovare
come segue: poniamo
 
 
a11
a
 b  = A a12  .
0
c
Allora l’asse è la retta r di equazione ax + by + c = 0.
Nel nostro caso si trova:
 
   
a
1
5
 b  = A 2 = 10 ,
c
0
3
quindi l’asse ha equazione r : 5x + 10y + 3 = 0.
Il vertice V è il punto di intersezione tra l’asse e la parabola. Risolvendo
il sistema
(
x2 + 4xy + 4y 2 − 2x + 4y + 1 = 0
5x + 10y + 3 = 0
1
8
si trova x = 25
e y = − 25
. Il vertice è quindi il punto V di coordinate
1
8
( 25 , − 25 ).
Forma canonica: la forma canonica di una parabola è data dalla seguente
matrice


α 0
0
∆ =  0 0 −1 .
0 −1 0
Il coefficiente α è dato dalla seguente formula:
r
λ
α = ±λ −
,
det A
ove λ è l’autovalore non nullo di A0 e il segno è scelto in modo che α sia
positivo (dipende in realtà da come si orientano gli assi del nuovo sistema
di riferimento).
√
Nel nostro caso si trova λ = 5 e quindi α = 5 4 5 .
Fuoco e Direttrice: il fuoco di una parabola è il punto che si trova sull’asse
ad una distanza d dal vertice, dalla parte “interna” della parabola (cioè nella
regione di piano convessa delimitata dalla parabola). La distanza d è data
dalla seguente formula:
1
d=
.
2α
√
Nel nostro caso si trova d = 2255 .
156
8. Coniche
-1
1
2
3
-1
-2
-3
Figura 5.
La direttrice è invece la retta parallela al vettore w, distante d dal vertice,
e contenuta nella regione “esterna” alla parabola (cioè nella regione di piano
concava delimitata dalla parabola).
La conica C è rappresentata in figura 5.
3.5. Altri Esercizi
Svolgimento esercizio 6. Consideriamo la matrice A associata alla conica
C:


0 1 0
A = 1 2 1  .
0 1 −1
Calcolando il determinante di A si trova det A = 1, quindi la conica C è
non-degenere.
Consideriamo la sottomatrice
0 1
0
A =
.
1 2
Si ha det A0 = −1, quindi C è una iperbole.
3. Soluzioni
157
Ricordiamo che le tangenti per il punto P alla conica C sono le rette
passanti per P e i punti A e B di intersezione tra C e la polare rP del
punto P . Determiniamo quindi l’equazione della retta rP , polare del punto
P . L’equazione di tale retta è ax + by + c = 0, dove i tre coefficienti a, b e
c sono dati da
 
 
   
a
xP
−3
1
 b  = A  yP  = A  1  = 0 .
c
1
1
0
La retta rP ha dunque equazione x = 0.
I punti A e B di intersezione tra la retta rP e la conica C si trovano
risolvendo il sistema
(
2xy + 2y 2 + 2y − 1 = 0
x=0
√
√
). Le due tangenti cercate sono
Si trova A = (0, − 3+1
) e B = (0, 3−1
2
2
quindi le rette di equazione
√
√
( 3 + 3)x + 6y + 3 + 3 3 = 0,
(retta per P e A) e
√
√
( 3 − 3)x − 6y − 3 + 3 3 = 0,
(retta per P e B).
Svolgimento esercizio 7. Sia X = (x, y) un punto del piano affine. Per
definizione di eccentricità, X appartiene alla conica C se e solo se il rapporto
tra le distanze di X da F e dalla retta d è uguale all’eccentricità e. Si deve
quindi avere:
p
(x − 2)2 + (y − 1)2
= e.
|x+y−1|
√
2
Questa è l’equazione della conica C ; ovviamente il parametro e è ancora indeterminato. Per determinare l’eccentricità e e, di conseguenza, l’equazione
di C , basta ora imporre la condizione
di passaggio per il punto P = (1, 3).
√
In questo modo si trova e = 10/3. Dato che e > 1 possiamo affermare che
la conica C è una iperbole. Sostituendo questo valore di e nell’equazione
precedente, e sviluppando i calcoli, si trova l’equazione di C :
2x2 + 2y 2 + 10xy + 2x − 4y − 10 = 0.
3.6. Fasci di Coniche
Svolgimento esercizio 8. Per determinare l’equazione della conica C passante per i cinque punti dati, l’idea è di considerare il fascio di coniche passanti per quattro di questi punti, e poi imporre la condizione di passaggio
per il quinto punto.
158
8. Coniche
Consideriamo, ad esempio, il fascio F di coniche passanti per P1 , P2 , P4
e P5 . Per determinare l’equazione del fascio F basta conoscere le equazioni
di due coniche di tale fascio.
Si noti che la retta r1 per P1 e P2 ha equazione x = 0, mentre la retta r2
per P4 e P5 ha equazione x−4y+3 = 0. Come prima conica C1 consideriamo
quindi l’unione delle due rette r1 e r2 . Si tratta di una conica degenere, che
certamente passa per i quattro punti scelti. L’equazione di C1 è dunque
C1 : x(x − 4y + 3) = 0.
Analogamente possiamo considerare come seconda conica C2 la conica degenere data dall’unione delle due rette s1 , passante per P1 e P4 , e s2 , passante
per P2 e P5 . Dato che s1 ha equazione y−1 = 0 e s2 ha equazione 2x+y = 0,
la conica C2 ha equazione
C2 : (y − 1)(2x + y) = 0.
L’equazione del fascio F è quindi:
λx(x − 4y + 3) + µ(y − 1)(2x + y) = 0.
λ+
Imponendo ora la condizione di passaggio per il punto P3 , si trova − 21
4
5µ = 0, da cui si ha, ad esempio, λ = 20 e µ = 21. Sostituendo questi valori
nell’equazione di F si trova l’equazione della conica C cercata:
C :
20x2 + 21y 2 − 38xy + 18x − 21y = 0.
Svolgimento esercizio 9. Consideriamo il fascio F di coniche tangenti
alla retta r : x − y + 1 = 0 nel punto R = (1, 2) e alla retta s : 2x + y − 1 = 0
nel punto S = (2, −3). Tale fascio contiene due coniche degeneri: una è
la conica C1 data dall’unione delle due rette r e s, l’altra è la conica C2
che consiste nella retta σ, passante per i punti R e S, con molteplicità due
(infatti tale retta σ, contata con molteplicità due, contiene i punti R e S
con molteplicità di intersezione 2).
La conica C1 ha dunque equazione (x − y + 1)(2x + y − 1) = 0, mentre
C2 ha equazione (5x + y − 7)2 = 0. L’equazione del fascio F è pertanto:
F : λ(x − y + 1)(2x + y − 1) + µ(5x + y − 7)2 = 0.
Se imponiamo la condizione di passaggio per il punto P = (0, 2), troviamo
λ = 25µ, da cui si deduce, ad esempio, che λ = 25 e µ = 1. Sostituendo
questi valori nell’equazione del fascio F troviamo l’equazione della conica
C cercata:
C : 75x2 − 24y 2 − 15xy − 45x + 36y + 24 = 0.
Svolgimento esercizio 10. Fissiamo un sistema di riferimento nel piano
euclideo, in modo da far corrispondere ad ogni conica una matrice quadrata.
Siano ora A e B le matrici di due coniche del fascio F . Tutte le coniche di
F sono allora date dalle matrici λA+µB, al variare dei parametri λ, µ ∈ R.
3. Soluzioni
159
Se P = (xP , yP ), le polari di P rispetto alle coniche del fascio sono le rette
di equazione ax + by + c = 0, ove i tre coefficienti a, b e c sono dati da
 
 
 
 
 
 
a
xP
xP
xP
a1
a2
 b  = (λA + µB)  yP  = λA  yP  + µB  yP  = λ  b1  + µ  b2  ,
c
1
1
1
c1
c2
ove abbiamo posto
 
 
a1
xP
 b1  = A  y P  ,
c1
1
 
 
a2
xP
 b2  = B  y P  .
c2
1
Da ciò si deduce che le equazioni delle polari di P hanno la seguente forma:
λ(a1 x + b1 y + c1 ) + µ(a2 x + b2 y + c2 ) = 0,
che è precisamente l’equazione di un fascio di rette.
Capitolo 9
Funzioni di più Variabili
1. Richiami di teoria
1.1. Limiti e continuità
Sia f~ : Rn → Rm una funzione di n variabili a valori vettoriali. Indicheremo
con ~x = (x1 , . . . , xn ) il generico punto di Rn e con ~y = (y1 , . . . , ym ) il generico
punto di Rm . Quindi la scrittura f~(~x) = ~y significa in realtà
f~(x1 , . . . , xn ) = (y1 , . . . , ym ).
Di conseguenza la funzione a valori vettoriali f~ : Rn → Rm è data da
m funzioni a valori scalari y1 = f1 (x1 , . . . , xn ), . . . , ym = fm (x1 , . . . , xn ).
Scriveremo quindi f~ = (f1 , . . . , fm ) ove le fi : Rn → R, per i = 1, . . . , m,
sono delle funzioni reali di n variabili dette le componenti di f~.
Definizione 1.1. Sia A ⊂ Rn un sottoinsieme aperto, sia f~ : A → Rm e
sia ~x0 ∈ A. Diremo che
lim f~(~x) = ~y ∈ Rm
~
x→~
x0
se per ogni > 0 esiste δ > 0 tale che si abbia
kf~(~x) − ~y k < per ogni ~x ∈ A con k~x − ~x0 k < δ.
Anche per i limiti delle funzioni di più variabili valgono dei teoremi
analoghi ai noti teoremi sui limiti delle funzioni di una sola variabile. Ad
esempio: il limite della somma di due funzioni è la somma dei limiti delle
singole funzioni (quando questi limiti esistono), etc.
Ricordiamo che la norma di un vettore in Rn è definita come segue:
q
k(x1 , . . . , xn )k = x21 + · · · + x2n .
Dalla definizione precedente segue facilmente il seguente risultato:
162
9. Funzioni di più Variabili
Proposizione 1.2. Se f1 , . . . , fm sono le funzioni componenti di f~, cioè se
f~ = (f1 , . . . , fm ), allora si ha
lim f~(~x) = ~y
~
x→~
x0
se e solo se
lim fi (~x) = yi ,
~
x→~
x0
ove le yi , per i = 1, . . . , m, sono le componenti del vettore ~y , cioè ~y =
(y1 , . . . , ym ).
Questo risultato mostra come il calcolo del limite di una funzione a valori
vettoriali si riconduca al calcolo di limiti di funzioni a valori scalari: si può
riassumere affermando che il limite della funzione f~(~x) è il vettore le cui
componenti sono i limiti delle funzioni fi (~x), componenti di f~.
Osserviamo che il calcolo del limite di una funzione reale di più variabili
non si può ridurre, in generale, al calcolo di limiti di funzioni di una variabile.
Il seguente risultato però è molto utile per dimostrare che determinati limiti
non esistono.
Proposizione 1.3. Se esiste il limite
lim f~(~x) = ~y ,
~
x→~
x0
allora esiste anche il limite, per ~x che tende a ~x0 , della funzione f~ ristretta
a una qualunque curva Γ passante per ~x0 , e tutti questi limiti coincidono.
Si ha quindi
lim f~(~x) = ~y ,
~
x→~
x0
~
x∈Γ
per ogni curva Γ passante per ~x0 .
Di conseguenza se troviamo due curve Γ1 e Γ2 tali che la funzione f~
ristretta a Γ1 e Γ2 ammetta, per ~x che tende a ~x0 , due limiti diversi, possiamo
concludere che la funzione f~(~x) non ammette limite per ~x che tende a ~x0 .
Questo risultato sarà spesso usato negli esercizi.
Siamo ora in grado di dare la definizione di funzione continua.
Definizione 1.4. Sia A un sottoinsieme aperto di Rn , sia f~ : A → Rm una
funzione e sia ~x0 ∈ A. Diremo che la funzione f~ è continua in ~x0 se
lim f~(~x) = f~(~x0 ).
~
x→~
x0
Diremo che f~ è continua in A se essa è continua in ogni punto di A.
Anche per le funzioni continue di più variabili valgono dei teoremi analoghi ai noti teoremi sulle funzioni continue di una sola variabile. Ad
esempio: la somma di funzioni continue è ancora una funzione continua,
la composizione di più funzioni continue è ancora una funzione continua,
etc.
2. Esercizi
163
2. Esercizi
2.1. Limiti
Esercizio 1. Si dimostri che il seguente limite non esiste:
xy
lim
.
2
(x,y)→(0,0) x + y 2
Esercizio 2. Si dimostri che il seguente limite non esiste:
x2 y
.
(x,y)→(0,0) x4 + y 2
lim
Esercizio 3. Si dimostri che il seguente limite esiste e si calcoli il suo valore:
2x2 y
.
(x,y)→(0,0) x2 + y 2
lim
Esercizio 4. Si dimostri che il seguente limite esiste e si calcoli il suo valore:
sin2 (xy)
.
(x,y)→(0,0) x2 + y 2
lim
Esercizio 5. Si dica se il seguente limite esiste oppure no, ed eventualmente
si calcoli il suo valore:
x3 y
.
lim
(x,y)→(0,0) x6 + y 2
Esercizio 6. Si dica se il seguente limite esiste oppure no, ed eventualmente
si calcoli il suo valore:
xy sin x
lim
.
(x,y)→(0,0) x2 sin y + y 2
2.2. Funzioni continue
Esercizio 7. Si dica se la seguente funzione
√
e xy cos(y 2 ) + 1
f (x, y) =
sin(log(xy 2 ) − x)
è continua nel suo insieme di definizione.
Esercizio 8. Si dica se la seguente funzione
(
sin(xy)
se (x, y) 6= (0, 0)
2
2
f (x, y) = x +2y
0
se (x, y) = (0, 0)
è continua in tutto R2 .
164
9. Funzioni di più Variabili
Esercizio 9. Si dica se la seguente funzione
(
− 1
e x2 +y2 se (x, y) 6= (0, 0)
f (x, y) =
0
se (x, y) = (0, 0)
è continua in tutto R2 .
Esercizio 10. Sia f : R2 → R la seguente funzione
(
(x+y) sin2 x
se x 6= 0 e y 6= 0
2xy 2
f (x, y) =
0
altrimenti.
Si determinino tutti i punti in cui f è continua.
3. Soluzioni
3.1. Limiti
Svolgimento esercizio 1. Calcoliamo il limite in questione facendo tendere
il punto (x, y) a (0, 0) lungo una retta di equazione y = mx (cioè calcoliamo
il limite della funzione ristretta a questa retta). Si trova quindi:
xy
mx2
m
=
lim
=
.
2
2
2
2
2
x→0 x + m x
1 + m2
(x,y)→(0,0) x + y
lim
y=mx
Il valore del limite dipende quindi da m, e cioè dalla retta scelta. In altre
parole, facendo tendere il punto (x, y) a (0, 0) lungo due rette diverse si
trovano due limiti diversi. Si conclude quindi che il limite cercato non può
esistere.
Svolgimento esercizio 2. Calcoliamo il limite in questione facendo tendere
il punto (x, y) a (0, 0) lungo una retta di equazione y = mx. Si trova:
x2 y
mx3
=
lim
4
2
x→0 x4 + m2 x2
(x,y)→(0,0) x + y
lim
y=mx
mx
= 0,
+ m2
almeno se m =
6 0. Trattiamo a parte il caso m = 0, cioè il caso della retta
y = 0.
x2 y
0
lim
= lim 4 = 0.
4
2
x→0 x
(x,y)→(0,0) x + y
= lim
x→0
x2
y=0
Un risultato analogo vale per la retta di equazione x = 0. Si scopre quindi
che la funzione ristretta ad ogni retta passante per l’origine ammette sempre
lo stesso limite, pari a 0. Da questo fatto non si può però dedurre che allora
3. Soluzioni
165
il limite cercato esiste e vale 0. Infatti se facciamo tendere il punto (x, y) a
(0, 0) lungo la parabola di equazione y = x2 , si trova:
x2 y
x4
1
=
lim
=
.
4
2
x→0 x4 + x4
2
(x,y)→(0,0) x + y
lim
y=x2
Dato che questo limite è diverso dai precedenti, si conclude che il limite
cercato non esiste.
Svolgimento esercizio 3. In questo caso bisogna dimostrare che un limite
esiste. Non serve a nulla quindi calcolare il limite della restrizione della
funzione a particolari curve passanti per l’origine: bisogna procedere in un
altro modo.
Nel caso in questione osserviamo che, per ogni x e y, si ha
x2 ≤ x2 + y 2 ,
da cui deriva che
x2
≤ 1.
x2 + y 2
Da queste disuguaglianze deriva che
2x2 y ≤ 2|y|.
0≤ 2
x + y2 0≤
Ma la funzione |y| tende a zero per (x, y) → (0, 0), quindi si ha necessariamente
2x2 y
= 0.
lim
(x,y)→(0,0) x2 + y 2
Svolgimento esercizio 4. Anche in questo caso bisogna dimostrare che
il limite in questione esiste. Possiamo utilizzare un ragionamento simile
a quello usato nell’esercizio precedente. Innanzi tutto ricordiamo che la
funzione sin z è asintotica a z, per z → 0,
sin z ∼ z.
Si ha quindi
sin2 (xy) ∼ (xy)2 ,
da cui si deduce che
sin2 (xy)
x2 y 2
lim
=
lim
.
(x,y)→(0,0) x2 + y 2
(x,y)→(0,0) x2 + y 2
Osservando che
0≤
x2
≤ 1,
x2 + y 2
0≤
x2 y 2
≤ y2.
x2 + y 2
si ottiene
166
9. Funzioni di più Variabili
Infine, dato che la funzione y 2 tende a zero per (x, y) → (0, 0), si conclude
che
x2 y 2
lim
= 0.
(x,y)→(0,0) x2 + y 2
Svolgimento esercizio 5. Dato che non sappiamo se il limite esiste oppure
no, iniziamo cercando di vedere se il limite non esiste. Proviamo a calcolare
il limite in questione facendo tendere il punto (x, y) a (0, 0) lungo una retta
di equazione y = mx. Si trova:
x3 y
mx4
=
lim
6
2
x→0 x6 + m2 x2
(x,y)→(0,0) x + y
lim
y=mx
mx2
= 0,
x→0 x4 + m2
= lim
almeno se m 6= 0. Trattiamo a parte il caso m = 0, cioè il caso della retta
y = 0.
x3 y
0
lim
= lim 6 = 0.
6
2
x→0 x
(x,y)→(0,0) x + y
y=0
Un risultato analogo vale per la retta di equazione x = 0. Si scopre quindi
che la funzione ristretta ad ogni retta passante per l’origine ammette sempre
lo stesso limite, pari a 0.
Proviamo ora a calcolare lo stesso limite facendo tendere il punto (x, y)
a (0, 0) lungo una parabola di equazione y = ax2 . Si trova:
x3 y
ax5
=
lim
6
2
x→0 x6 + a2 x4
(x,y)→(0,0) x + y
lim
y=ax2
= lim
x→0 x2
ax
= 0,
+ a2
almeno se a 6= 0. Se invece a = 0 la parabola diventa la retta y = 0, e
questo caso è già stato analizzato. Si scopre quindi che anche la funzione
ristretta ad ogni parabola del tipo y = ax2 ammette sempre lo stesso limite,
pari a 0.
Ovviamente questo non basta per concludere che allora il limite in questione esiste e vale zero. Infatti, se calcoliamo lo stesso limite facendo
tendere il punto (x, y) a (0, 0) lungo la curva di equazione y = x3 , si trova:
x3 y
x6
1
=
lim
= .
6
2
6
6
x→0 x + x
2
(x,y)→(0,0) x + y
lim
y=x3
Dato che questo limite è diverso dai precedenti, si conclude che il limite
cercato non esiste.
3. Soluzioni
167
Svolgimento esercizio 6. Cerchiamo di vedere se il limite
xy sin x
lim
(x,y)→(0,0) x2 sin y + y 2
non esiste, provando a calcolarlo lungo le rette y = mx:
xy sin x
mx2 sin x
=
lim
2
2
x→0 x2 sin(mx) + m2 x2
(x,y)→(0,0) x sin y + y
lim
y=mx
m sin x
= 0,
x→0 sin(mx) + m2
= lim
almeno per m 6= 0.
Proviamo ora a calcolare lo stesso limite lungo la parabola y = x2 :
xy sin x
x3 sin x
x sin x
=
lim
= lim
.
2
2
2
2
4
x→0 x sin(x ) + x
x→0 sin(x2 ) + x2
(x,y)→(0,0) x sin y + y
lim
y=x2
Dividendo il numeratore e il denominatore per x2 si ottiene:
sin x
x
lim
2
x→0 sin(x ) +
x2
1
= ,
2
1
dato che
sin x
= 1.
x→0 x
Poiché questo limite è diverso dai precedenti, si conclude che il limite cercato
non esiste.
lim
3.2. Funzioni continue
Svolgimento esercizio 7. L’insieme di definizione della funzione f (x, y) è
l’insieme delle soluzioni del seguente sistema:

xy ≥ 0


log(xy 2 ) − x 6= kπ, k ∈ Z

 2
xy > 0
In ogni caso, qualunque sia il suo insieme di definizione, la funzione f è
ottenuta componendo (sommando, sottraendo, moltiplicando, etc.) funzioni
elementari continue. Di conseguenza f è necessariamente continua dove è
definita, cioè in tutto il suo dominio.
Svolgimento esercizio 8. In R2 privato dell’origine la funzione f è definita
da
sin(xy)
f (x, y) = 2
.
x + 2y 2
168
9. Funzioni di più Variabili
Essa è quindi continua in quanto composizione di funzione continue. Rimane
da vedere se f è continua anche nell’origine.
In base alla definizione si ha che f è continua nell’origine se e solo se
lim
f (x, y) = f (0, 0),
(x,y)→(0,0)
cioè se
sin(xy)
= 0.
(x,y)→(0,0) x2 + 2y 2
Se calcoliamo questo limite lungo le rette di equazione y = mx, e ricordiamo
che sin z ∼ z, per z → 0, si ha:
lim
sin(xy)
sin(mx2 )
=
lim
2
2
x→0 x2 + 2m2 x2
(x,y)→(0,0) x + 2y
lim
y=mx
mx2
x→0 x2 (1 + 2m2 )
m
.
=
1 + 2m2
Dato che il valore del limite dipende da m, cioè dalla retta scelta, si conclude
che il limite cercato non esiste. Di conseguenza la funzione f non è continua
nell’origine.
= lim
Svolgimento esercizio 9. In R2 privato dell’origine la funzione f è definita
da
− 1
f (x, y) = e x2 +y2 .
Essa è quindi continua in quanto composizione di funzione continue. Rimane
da vedere se f è continua anche nell’origine.
In base alla definizione si ha che f è continua nell’origine se e solo se
lim
f (x, y) = f (0, 0),
(x,y)→(0,0)
cioè se
lim
−
e
1
x2 +y 2
= 0.
(x,y)→(0,0)
Dato che
1
= +∞,
(x,y)→(0,0) x2 + y 2
lim
e ricordando che
lim e−z = 0,
z→+∞
si conclude che
lim
−
e
1
x2 +y 2
= 0,
(x,y)→(0,0)
e quindi la funzione f è continua anche nell’origine.
In conclusione, si è dimostrato che f è continua in tutto R2 .
3. Soluzioni
169
Svolgimento esercizio 10. Se x 6= 0 e y 6= 0 la funzione f è definita da
(x + y) sin2 x
f (x, y) =
,
2xy 2
che è continua in quanto composizione di funzioni continue. Rimane da
studiare la continuità di f nei punti con x = 0 oppure y = 0, cioè nei punti
che stanno sugli assi coordinati.
Iniziamo considerando l’origine. Con semplici calcoli, ricordando le proprietà dei limiti, si trova:
lim
(x + y) sin2 x
(x,y)→(0,0)
2xy 2
(x + y)x2
= lim
(x,y)→(0,0)
2xy 2
x(x + y)
= lim
.
(x,y)→(0,0)
2y 2
f (x, y) =
(x,y)→(0,0)
lim
Calcolando questo limite per (x, y) che tende a (0, 0) lungo le rette di
equazione y = mx, si trova:
x(x + y)
x(x + mx)
1+m
= lim
=
.
2
2
2
x→0
2y
2m x
2m2
(x,y)→(0,0)
lim
y=mx
Dato che il valore del limite dipende da m, cioè dalla retta scelta, si conclude
che il limite cercato non esiste. Di conseguenza la funzione f non è continua
nell’origine.
Consideriamo ora i punti del tipo (a, 0), con a 6= 0. Si ha:
lim
(x,y)→(a,0)
(x + y) sin2 x
(x,y)→(a,0)
2xy 2
(a + y) sin2 a
= lim
= ±∞,
y→0
2ay 2
f (x, y) =
lim
se sin2 a 6= 0, cioè se a 6= kπ, k ∈ Z. Anche in questo caso si conclude che
f non è continua in questi punti.
170
9. Funzioni di più Variabili
I punti del tipo (kπ, 0) (con k 6= 0) vanno studiati a parte. Se effettuiamo
il cambiamento di variabili X = x − kπ, Y = y, si ha:
(x + y) sin2 x
(x,y)→(kπ,0)
(x,y)→(kπ,0)
2xy 2
(X + kπ + Y ) sin2 (X + kπ)
=
lim
(X,Y )→(0,0)
2(X + kπ)Y 2
kπ sin2 (X)
=
lim
(X,Y )→(0,0)
2kπY 2
X2
=
lim
.
(X,Y )→(0,0) 2Y 2
Calcolando ora questo limite per (X, Y ) che tende a (0, 0) lungo le rette di
equazione Y = mX, si trova:
X2
1
X2
lim
= lim
=
.
2
2
2
X→0
2m X
2m2
(X,Y )→(0,0) 2Y
lim
f (x, y) =
lim
Y =mX
Dato che il valore del limite dipende da m, cioè dalla retta scelta, si conclude
che il limite cercato non esiste. Di conseguenza la funzione f non è continua
nei punti del tipo (kπ, 0).
Rimangono ora da considerare solo i punti del tipo (0, b), con b 6= 0. Si
ha:
(x + y) sin2 x
lim f (x, y) = lim
(x,y)→(0,b)
(x,y)→(0,b)
2xy 2
b sin2 x
= lim
x→0 2xb2
x2
= lim
= 0.
x→0 2xb
Si ha pertanto
lim f (x, y) = f (0, b) = 0,
(x,y)→(0,b)
quindi f è continua in questi punti.
In conclusione, abbiamo dimostrato che f è continua in tutti i punti del
piano tranne quelli che stanno sull’asse delle x.
Capitolo 10
Calcolo Infinitesimale per le Curve
1. Richiami di teoria
1.1. Curve in Rn
Definizione 1.1. Una curva (continua) Γ in Rn è una funzione continua
~r : I → Rn ,
t 7→ ~r(t) = (x1 (t), x2 (t), . . . , xn (t)),
dove I è un intervallo di R. L’immagine della funzione ~r è detta il sostegno
della curva. La curva Γ è detta di classe C m se la funzione ~r è di classe C m ,
cioè ammette tutte le derivate continue fino all’ordine m.
Si può pensare alla variabile t come al “tempo” e alla funzione ~r(t) come
a una legge che descrive il moto di un punto di Rn al trascorrere del tempo
t.
Osservazione 1.2. Spesso si usa il termine “curva” per indicare quello che
noi abbiamo chiamato il sostegno della curva, cioè il sottoinsieme di Rn che è
l’immagine della funzione ~r. In tal caso la funzione ~r : I → Rn sarà detta la
parametrizzazione della curva Γ. Noi useremo indifferentemente entrambe
le terminologie: il significato dei termini usati sarà chiaro dal contesto.
Definizione 1.3. Una curva Γ definita da
~r : [a, b] → Rn ,
è detta chiusa se ~r(a) = ~r(b). Una curva chiusa è anche detta circuito.
Sia ora Γ una curva di classe C 1 in Rn , parametrizzata da
~r : I → Rn ,
t 7→ ~r(t) = (x1 (t), x2 (t), . . . , xn (t)),
e sia t un punto interno all’intervallo I.
Proposizione 1.4. Il vettore ~r 0 (t) è tangente alla curva Γ nel punto P =
~r(t) (vedi figura 1).
Osservazione 1.5. In fisica, il vettore ~v = ~r 0 (t) è detto velocità istantanea.
La proposizione precedente afferma che la velocità istantanea è tangente in
ogni punto alla traiettoria, risultato ben noto dalla fisica. La norma del
vettore ~r 0 (t) è detta velocità scalare.
172
10. Calcolo Infinitesimale per le Curve
~r0 (t)
~r(t)
Γ
Figura 1. Vettore tangente alla curva Γ
ds
~r(t + dt)
~r(t)
Γ
Figura 2. Lunghezza d’arco elementare
Definizione 1.6. Un punto della curva Γ si dice regolare se in quel punto
la funzione ~r(t) è derivabile e si ha ~r 0 (t) 6= 0. Un punto non regolare è
detto singolare. I punti singolari sono dunque quelli in cui la funzione ~r(t)
non è derivabile, oppure essa è derivabile, ma la sua derivata è nulla (cioè
si annulla il vettore velocità istantanea).
Consideriamo ora un intervallo di tempo infinitesimo dt. In tale intervallo
di tempo il punto individuato da ~r(t) = (x1 (t), . . . , xn (t)) subisce uno spostamento infinitesimo d~r = (dx1 , . . . , dxn ). Se supponiamo che la curva sia
di classe C 1 , le funzioni xi (t) sono derivabili e si ha quindi dxi (t) = x0i (t) dt,
per i = 1, . . . , n. Il vettore spostamento infinitesimo è quindi dato da:
d~r = ~r 0 (t) dt = (x01 , x02 . . . , x0n ) dt,
e la sua lunghezza è
ds = kd~rk = k~r 0 (t)k dt =
p
(x01 )2 + (x02 )2 + · · · + (x0n )2 dt.
La quantità scalare ds rappresenta quindi lo spazio (infinitesimo) percorso
da un punto mobile sulla curva Γ nell’intervallo di tempo infinitesimo dt
(vedi figura 2).
Definizione 1.7. Lo scalare ds è detto lunghezza d’arco elementare, o
differenziale d’arco.
Una volta nota l’espressione per la lunghezza d’arco elementare ds, la
lunghezza di un tratto finito di curva si calcola facilmente come segue:
Teorema 1.8. Sia Γ una curva di classe C 1 in Rn , parametrizzata da
~r : [a, b] → Rn ,
t 7→ ~r(t) = (x1 (t), x2 (t), . . . , xn (t)).
2. Esercizi
173
La lunghezza L(Γ) della curva Γ è data da:
Z
L(Γ) = ds,
Γ
ove questo integrale si calcola come segue:
Z
Z b
Z bp
0
ds =
k~r (t)k dt =
(x01 (t))2 + (x02 (t))2 + · · · + (x0n (t))2 dt.
Γ
a
a
n
Se poi f : R → R è una funzione definita sul sostegno della curva Γ, si
può definire l’integrale curvilineo di f lungo la curva Γ come segue:
Definizione 1.9 (Integrale di linea di prima specie). Il seguente
integrale è detto integrale di linea della funzione f lungo la curva Γ:
b
Z
Z
f ds =
Γ
a
f (~r(t)) k~r 0 (t)k dt
Z b
p
=
f (x1 (t), . . . , xn (t)) (x01 (t))2 + · · · + (x0n (t))2 dt.
a
2. Esercizi
2.1. Lunghezza di una curva
Esercizio 1. Determinare la lunghezza dell’arco di elica cilindrica Γ (di
raggio R e passo P ) parametrizzato da
[0, 2π] 3 θ 7→ ~r(θ) = (R cos θ, R sin θ, P θ) ∈ R3 .
Esercizio 2. Determinare i punti singolari e la lunghezza della curva Γ
(astroide) parametrizzata da
[0, 2π] 3 t 7→ ~r(t) = (cos3 t, sin3 t) ∈ R2 .
Esercizio 3. Si determini la lunghezza L dell’arco di curva piana Γ parametrizzato da x(t) = t2 , y(t) = t3 , per t ∈ [0, 1].
Esercizio 4. Calcolare la lunghezza L dell’arco di cicloide Γ parametrizzato
da x(t) = t − sin t, y(t) = 1 − cos t, per t ∈ [0, 2π].
Esercizio 5. Calcolare la lunghezza L del tratto di grafico della funzione
y = ex , compreso tra i punti (0, 1) e (1, e).
Esercizio 6. Calcolare la lunghezza L dell’arco chiuso della curva Γ di
equazione
9y 2 = x(x − 3)2 .
174
10. Calcolo Infinitesimale per le Curve
2.2. Integrali di linea
Esercizio 7. Sia Γ la curva parametrizzata da x = t2 , y = sin t, per
t ∈ [0, 2π]. Sia f la seguente funzione
x
f (x, y) = p
.
4x − y 2 + 1
Si calcoli il seguente integrale di linea:
Z
f ds.
Γ
Esercizio 8. Si calcoli il seguente integrale di linea:
Z
xy ds,
Γ
dove Γ è il quarto dell’ellisse di equazione
quadrante.
x2
a2
+
y2
b2
= 1 contenuto nel primo
Esercizio 9. Si calcoli la massa di un filo Γ disposto come la prima spira
di un’elica cilindrica di raggio R e passo P , cioè parametrizzato da
~r(t) = (R cos t, R sin t, P t),
per t ∈ [0, 2π], se la densità lineare del filo è espressa dalla seguente funzione:
p
ρ(x, y, z) = x2 + y 2 + |z|.
Esercizio 10. Si calcoli l’area della seguente superficie S:
S = {(x, y, z) ∈ R3 | x ∈ [0, 2π], y = sin x, 0 ≤ z ≤ f (x, y)},
ove
x(2π − x)
f (x, y) = p
.
2 2 − y2
3. Soluzioni
3.1. Lunghezza di una curva
Svolgimento esercizio 1. Essendo ~r(θ) = (R cos θ, R sin θ, P θ), si ha
~r 0 (θ) = (−R sin θ, R cos θ, P ),
√
da cui si ottiene k~r 0 (θ)k = R2 + P 2 . La lunghezza dell’arco di elica
cilindrica Γ è quindi data da:
Z
Z 2π
L(Γ) = ds =
k~r 0 (θ)k dθ
Γ
0
Z 2π √
√
=
R2 + P 2 dθ = 2π R2 + P 2 .
0
3. Soluzioni
175
1
–1
1
–1
Figura 3. L’astroide in R2
Svolgimento esercizio 2. La curva Γ è parametrizzata da
~r(t) = (cos3 t, sin3 t),
quindi si ha
~r 0 (t) = (−3 cos2 t sin t, 3 sin2 t cos t).
I punti singolari sono quelli in cui si annulla il vettore ~r 0 (t), e questo avviene
se e solo se t = 21 kπ, per k = 0, 1, 2, 3, 4. I punti corrispondenti sulla curva Γ
sono quattro, e precisamente (1, 0), (0, 1), (−1, 0) e (0, −1). Ciò che avviene
dal punto di vista geometrico nei punti singolari è illustrato bene dal grafico
che rappresenta la curva Γ nel piano (vedi figura 3).
Dato che la curva Γ è simmetrica rispetto a entrambi gli assi, la sua
lunghezza è il quadruplo della lunghezza dell’arco contenuto nel primo
quadrante. Calcoliamo quindi la lunghezza L di questo arco.
La norma del vettore tangente è
k~r 0 (t)k =
p
9 cos4 t sin2 t + 9 sin4 t cos2 t
p
= 3 sin t cos t cos2 t + sin2 t
= 3 sin t cos t,
ove si è usato il fatto che nel primo quadrante si ha 0 ≤ t ≤ π/2, e quindi sin t
e cos t sono sempre positivi. Di conseguenza la lunghezza d’arco elementare
è
ds = 3 sin t cos t dt,
176
10. Calcolo Infinitesimale per le Curve
2
1
0
2
4
6
Figura 4. Arco di cicloide
e la lunghezza L dell’arco di curva in questione è:
Z π/2
L=
k~r 0 (t)k dt
0
π/2
Z
=
3 sin t cos t dt
0
3
=
2
Z
0
π/2
3
sin 2t dt = .
2
La lunghezza della curva Γ è quindi L(Γ) = 4L = 6.
Svolgimento esercizio 3. Si ha ~r 0 (t) = (2t, 3t2 ) e quindi
√
√
k~r 0 (t)k = 4t2 + 9t4 = t 4 + 9t2 ,
ove si è usato il fatto che t ∈ [0, 1], e quindi t non è mai negativo. La
lunghezza L = L(Γ) si calcola quindi come segue:
Z
Z 1
L = ds =
k~r 0 (t)k dt
Γ
0
Z 1 √
=
t 9t2 + 4 dt
0
√
1 2
13 13 − 8
3/2 1
=
(9t + 4)
=
.
0
27
27
Svolgimento esercizio 4. L’arco di cicloide Γ è rappresentato in figura 4.
Si ha ~r 0 (t) = (1 − cos t, sin t) e quindi
p
√
k~r 0 (t)k = 1 − 2 cos t + cos2 t + sin2 t = 2 − 2 cos t.
La lunghezza L = L(Γ) si calcola quindi come segue:
Z
√ Z 2π √
L = ds = 2
1 − cos t dt
Γ
0
r
√ Z 2π
t
= 2
2 sin2 dt
2
0
2π
√
√
t
= 8,
= 2 −2 2 cos
2 0
3. Soluzioni
177
dove si è usata la nota formula
t
1 − cos t = 2 sin2 .
2
Svolgimento esercizio 5. Il grafico di una funzione del tipo y = f (x) si
parametrizza facilmente come segue: x = t, y = f (t). Di conseguenza, il
differenziale d’arco ds è dato da:
p
p
ds = x0 (t)2 + y 0 (t)2 dt = 1 + (y 0 )2 dx.
Nel nostro caso si ottiene
ds =
√
1 + e2x dx,
e quindi la lunghezza L richiesta è data da
Z 1√
L=
1 + e2x dx.
0
Questo integrale si può calcolare effettuando il seguente cambiamento di
variabili:
1 + e2x = u2 ,
da cui si deduce che
dx =
u2
u
du.
−1
Si ha quindi:
Z
L=
0
1
√
√
1 + e2x dx
1+e2
u2
du
√
u2 − 1
2
Z √1+e2 1
1+ 2
du
= √
u −1
2
Z √1+e2 1
1
1+
−
du
= √
2(u − 1) 2(u + 1)
2
√1+e2
1
1
= u + log(u − 1) − log(u + 1) √
2
2
2
√
√
√
√
2
= 1 + e − 2 + 1 − log(1 + 1 + e2 ) + log(1 + 2),
Z
=
ove l’ultima uguaglianza è stata ottenuta usando le note proprietà del logaritmo.
Svolgimento esercizio 6. In questo caso la curva Γ non è fornita in forma
parametrica, bensı̀ come luogo dei punti che soddisfano l’equazione 9y 2 =
x(x−3)2 . Da una attenta analisi di questa equazione si deduce che il grafico
della curva Γ è quello rappresentato in figura 5.
178
10. Calcolo Infinitesimale per le Curve
2
1
–1
1
2
3
4
5
–1
–2
Figura 5.
L’arco chiuso di cui si vuole calcolare la lunghezza è l’arco compreso tra
i punti di ascissa x = 0 e x = 3. Inoltre, dato che la curva Γ è simmetrica rispetto all’asse delle x, sarà sufficiente calcolare la lunghezza dell’arco
compreso tra i punti di ascissa x = 0 e x = 3 e contenuto nel semipiano superiore, y ≥ 0. Quest’arco si può evidentemente rappresentare come grafico
di una opportuna funzione y = y(x), dove questa funzione dovrà soddisfare
l’equazione 9y(x)2 = x(x − 3)2 . Derivando questa equazione rispetto a x, si
ottiene:
18y(x)y 0 (x) = 3x2 − 12x + 9,
da cui si ricava
y 0 (x) =
x2 − 4x + 3
.
6y
Il differenziale d’arco è quindi dato da:
s
p
(x2 − 4x + 3)2
ds = 1 + y 0 (x)2 dx = 1 +
dx
36y 2
s
r
(x − 3)2 (x − 1)2
(x − 1)2
= 1+
dx
=
1
+
dx
4x(x − 3)2
4x
r
r
(x + 1)2
4x + x2 − 2x + 1
dx,
=
dx =
4x
4x
ove si è usato il fatto che 9y 2 = x(x − 3)2 .
La lunghezza dell’arco compreso tra i punti di ascissa x = 0 e x = 3 e
contenuto nel semipiano superiore si ottiene quindi calcolando il seguente
integrale:
Z 3r
Z 3
(x + 1)2
x+1
√ dx.
dx =
4x
0 2 x
0
3. Soluzioni
179
√
Se effettuiamo il cambiamento di variabili x = u, cioè x = u2 , si ottiene:
√3
Z 3
Z √3
√
x+1
1
√ dx =
(u2 + 1) du = u3 + u
= 2 3.
3
0 2 x
0
0
√
La lunghezza L dell’arco chiuso della curva Γ è quindi L = 4 3.
3.2. Integrali di linea
Svolgimento esercizio 7. La curva Γ è parametrizzata da ~r(t) = (t2 , sin t),
0
0
per
√ t ∈ [0, 2π]. Si ha quindi ~r (t) = (2t, cos t), da cui si ottiene k~r (t)k =
4t2 + cos2 t. Il differenziale d’arco ds è quindi dato da
√
ds = 4t2 + cos2 t dt.
Si ha pertanto:
Z
Z
2π
f ds =
Γ
0
Z
2π
=
0
√
t2
p
4t2
2
4t2 + cos2 t dt
− sin t + 1
2π
1 3
8
2
t
= π3.
t dt =
3
3
0
Svolgimento esercizio 8. La curva Γ, cioè il quarto dell’ellisse di equazione
2
x2
+ yb2 = 1 contenuto nel primo quadrante, si può parametrizzare come
a2
segue:
~r(t) = (a cos t, b sin t),
per t ∈ [0, π/2].
Si ha quindi ~r 0 (t) = (−a sin t, b cos t), da cui si ottiene
p
k~r 0 (t)k = a2 sin2 t + b2 cos2 t
q
= (a2 − b2 ) sin2 t + b2 .
Il differenziale d’arco ds è quindi dato da
q
ds = (a2 − b2 ) sin2 t + b2 dt.
Si ha pertanto:
Z
Z
xy ds =
Γ
π/2
q
ab sin t cos t (a2 − b2 ) sin2 t + b2 dt
0
ab
=
2
3(a − b2 )
3
=
3
"
ab(a − b )
.
3(a2 − b2 )
(a2 − b2 ) sin2 t + b2
3/2 #π/2
0
180
10. Calcolo Infinitesimale per le Curve
Svolgimento esercizio 9. Per definizione, la densità lineare ρ di un filo
materiale è il rapporto
ρ=
dm
,
ds
ove dm è la massa di un tratto infinitesimo di filo di lunghezza ds. Si ha
quindi dm = ρ ds, da cui discende che la massa totale del filo Γ è espressa
dal seguente integrale di linea:
Z
M = ρ ds.
Γ
Nel nostro caso il filo è parametrizzato da ~r(t) = (R cos t, R sin t, P t), da cui
si deduce che ~r 0 (t) = (−R sin t, R cos t, P ), e quindi il differenziale d’arco è
dato da
√
ds = k~r 0 (t)k dt = R2 + P 2 dt.
Si ha quindi:
Z
Z 2π q
√
M = ρ ds =
R2 cos2 t + R2 sin2 t + |P t| R2 + P 2 dt
Γ
0
Z 2π √
√
= R2 + P 2
R2 + P t dt
0
2π
√
2
2
3/2
2
2
(R + P t)
= R +P
3P
0
√
2
2
2 R +P
2
3/2
3
=
(R + 2πP ) − R .
3P
Svolgimento esercizio 10. Chiamiamo Γ la curva, contenuta nel piano
xy, di equazione y = sin x. La superficie S è la superficie “eretta verticalmente” sulla base Γ e delimitata in basso dal piano di equazione z = 0 e
in alto dal grafico della funzione z = f (x, y). Si veda la figura 6 per una
rappresentazione grafica della superficie S.
Da quanto detto si deduce che l’area A di S è data dal seguente integrale
di linea:
Z
A = f ds.
Γ
La curva Γ si può parametrizzare nel modo seguente: x = t, y = sin t,
cioè ~r(t) = (t, sin t). Si ha quindi ~r 0 (t) = (1, cos t), da cui si deduce che il
differenziale d’arco è dato da
√
ds = 1 + cos2 t dt.
3. Soluzioni
181
4
3
z2
1
0
0
1
1
2
3
x
4
0y
5
6
–1
Figura 6.
Si ha quindi:
Z
Z
A=
f ds =
Γ
1
2
0
Z
2π
t(2π − t) √
p
1 + cos2 t dt
2
2 2 − sin t
2π
t(2π − t) dt
2π
1
1 3
2
2
=
πt − t
= π3.
2
3 0
3
=
0
Capitolo 11
Calcolo Differenziale in più Variabili
1. Richiami di teoria
1.1. Derivate parziali
Ricordiamo brevemente la definizione delle derivate parziali di una funzione
di più variabili a valori reali. Per semplicità ci limiteremo a trattare il caso
delle funzioni di due variabili.
Sia dunque A un sottoinsieme aperto di R2 , f : A → R una funzione e
(x0 , y0 ) un punto di A.
Definizione 1.1. La derivata parziale della funzione f , rispetto alla varia(x0 , y0 ), è:
bile x, nel punto (x0 , y0 ), indicata con il simbolo ∂f
∂x
∂f
f (x0 + h, y0 ) − f (x0 , y0 )
(x0 , y0 ) = lim
.
h→0
∂x
h
Analogamente, la derivata parziale della funzione f , rispetto alla variabile
y, nel punto (x0 , y0 ), indicata con il simbolo ∂f
(x0 , y0 ), è:
∂y
∂f
f (x0 , y0 + h) − f (x0 , y0 )
(x0 , y0 ) = lim
.
h→0
∂y
h
La funzione f è detta derivabile nel punto (x0 , y0 ) se esistono le sue derivate
parziali in quel punto (cioè se i due limiti precedenti esistono finiti).
Definizione 1.2. Il gradiente di f , indicato con ∇f , è il vettore le cui
componenti sono le derivate parziali di f :
∂f
∂f
∇f (x0 , y0 ) =
(x0 , y0 ),
(x0 , y0 ) .
∂x
∂y
Osservazione 1.3. Osserviamo che, mentre per le funzioni di una variabile
la derivabilità della funzione in un punto implica la sua continuità in quel
punto, ciò non è vero per le funzioni di più variabili. Si possono facilmente
trovare esempi di funzioni di due variabili che sono derivabili, ma non continue, in un punto. Questo mostra come la nozione di derivabilità per le
funzioni di più variabili non sia l’equivalente, nel caso di più variabili, della
derivabilità per le funzioni di una sola variabile.
184
11. Calcolo Differenziale in più Variabili
1.2. Differenziali
Introduciamo ora una condizione più forte della derivabilità, cioè dell’esistenza delle derivate parziali, per una funzione di due variabili f (x, y).
Sia A un sottoinsieme aperto di R2 , f : A → R una funzione e (x0 , y0 )
un punto di A.
Definizione 1.4. La funzione f è differenziabile nel punto (x0 , y0 ) se esiste
una forma lineare φ : R2 → R tale che
f (x0 + h, y0 + k) − f (x0 , y0 ) − φ(h, k)
= 0,
(h,k)→(0,0)
k(h, k)k
√
ove la norma del vettore (h, k) è definita da k(h, k)k = h2 + k 2 .
Se f è differenziabile in (x0 , y0 ), la forma lineare φ che compare nel limite
precedente è detta il differenziale di f nel punto (x0 , y0 ), ed è indicata con
df (x0 , y0 ).
Osservazione 1.5. Osserviamo che se f : A → R è una funzione definita
in un aperto A di R2 , e se f è differenziabile in un punto (x0 , y0 ) ∈ A, il
suo differenziale df (x0 , y0 ) è una forma lineare definita sempre su tutto R2 ,
indipendentemente da quale sia l’insieme di definizione della funzione f .
Il differenziale di f in un punto (x0 , y0 ), essendo una forma lineare, si
scriverà nel modo seguente:
lim
df (x0 , y0 ) : R2 → R,
(h, k) 7→ αh + βk,
per qualche α, β ∈ R. Si tratta ora di capire chi sono i due coefficienti α e
β. A tal fine si dimostra il seguente risultato:
Proposizione 1.6. I coefficienti α e β che compaiono nell’espressione del
differenziale di una funzione f in un punto (x0 , y0 ),
df (x0 , y0 )(h, k) = αh + βk,
sono dati da:
α=
∂f
(x0 , y0 ),
∂x
β=
∂f
(x0 , y0 ).
∂y
Si ha quindi:
(1)
df (x0 , y0 )(h, k) =
∂f
∂f
(x0 , y0 )h +
(x0 , y0 )k.
∂x
∂y
Osservazione 1.7. Per tradizione, il differenziale di una funzione f (x, y)
nel punto (x0 , y0 ) si suole scrivere anche nel modo seguente:
df (x0 , y0 ) =
∂f
∂f
(x0 , y0 ) dx +
(x0 , y0 ) dy,
∂x
∂y
ove i simboli dx e dy (i differenziali delle variabili indipendenti) vengono spesso pensati come degli “incrementi infinitesimi” delle variabili x e y
1. Richiami di teoria
185
rispettivamente. In modo ancora più sintetico si scrive anche
∂f
∂f
df =
dx +
dy.
∂x
∂y
Facciamo però notare che il vero significato di queste formule “abbreviate”
è quello espresso dall’equazione (1).
Si può ora dimostrare il seguente risultato, che mostra come la nozione
di differenziabilità sia un sostituto adeguato, per le funzioni di più variabili,
della nozione di derivabilità per le funzioni di una variabile.
Proposizione 1.8. Se una funzione f (x, y) è differenziabile in (x0 , y0 )
allora essa è continua e derivabile in tale punto.
Vale la pena far notare che non vale il viceversa: una funzione può benissimo essere continua e derivabile in un punto, ma non essere differenziabile
in tale punto.
Purtroppo verificare che una funzione sia differenziabile in un punto
usando la definizione data può essere complicato. Infatti è richiesto il calcolo
di un limite di una funzione di più variabili, limite questo che, ovviamente,
si presenta sempre come forma indeterminata del tipo 00 . A tale scopo è
estremamente utile il seguente teorema:
Teorema 1.9. Sia f : A → R una funzione definita in un aperto A di R2 e
sia (x0 , y0 ) un punto di A. Se f è derivabile in un intorno del punto (x0 , y0 )
e le sue derivate parziali sono continue in (x0 , y0 ), allora f è differenziabile
in (x0 , y0 ). In particolare, se f è derivabile in tutto l’insieme A e le sue
derivate parziali sono continue in tutto A, allora f è differenziabile in ogni
punto di A.
Se una funzione f (x, y) è differenziabile in (x0 , y0 ) ha senso parlare del
“piano tangente” al grafico di f nel punto (x0 , y0 ). Si tratta del piano di
equazione
∂f
∂f
z = f (x0 , y0 ) +
(x0 , y0 )(x − x0 ) +
(x0 , y0 )(y − y0 ).
∂x
∂y
Si noti che in questa equazione compaiono le derivate parziali di f nel punto (x0 , y0 ), quindi per poter scrivere questa equazione è sufficiente che la
funzione f sia derivabile nel punto (x0 , y0 ). Se però f non è differenziabile
in tale punto, il piano rappresentato da questa equazione non è il piano
tangente al grafico di f , dato che in questo caso il piano tangente al grafico
di f nel punto (x0 , y0 ) non esiste.
1.3. Derivate direzionali
Un’estensione del concetto di derivata parziale è quello di derivata direzionale. Sia dunque A un sottoinsieme aperto di R2 , f : A → R una funzione,
(x0 , y0 ) un punto di A, e ~v = (vx , vy ) un versore (cioè un vettore di norma
unitaria).
186
11. Calcolo Differenziale in più Variabili
Definizione 1.10. La derivata della funzione f nella direzione del versore
~v , nel punto (x0 , y0 ), indicata con il simbolo D~v f (x0 , y0 ), è:
f (x0 + hvx , y0 + hvy ) − f (x0 , y0 )
.
h→0
h
Tale derivata è anche detta derivata direzionale di f nella direzione del
versore ~v .
Osservazione 1.11. Ovviamente le derivate parziali ∂f
e ∂f
si ritrovano
∂x
∂y
come casi particolari di derivate direzionali. Si ha infatti:
∂f
= D~v f, se ~v = (1, 0),
∂x
∂f
= Dw~ f, se w
~ = (0, 1).
∂y
Dalla definizione data si deduce che la derivata direzionale di f nella
direzione di un versore ~v misura la velocità di variazione della funzione
f (x, y) quando il punto (x, y) percorre una retta parallela a ~v . Se la funzione
f è differenziabile tutte le informazioni contenute nelle derivate direzionali
sono in realtà già contenute nelle derivate parziali. Si può infatti dimostrare
il seguente risultato:
Teorema 1.12 (Formula del Gradiente). Se la funzione f è differenziabile nel punto (x0 , y0 ), si ha:
∂f
∂f
(x0 , y0 )vx +
(x0 , y0 )vy ,
D~v f (x0 , y0 ) = ∇f (x0 , y0 ) · ~v =
∂x
∂y
per ogni versore ~v = (vx , vy ).
Osservazione 1.13. Dalla formula del gradiente si può dedurre un’importante proprietà geometrica del gradiente di una funzione f . Se rappresentiamo nel piano Oxy le curve di livello della funzione f , cioè le curve di
equazione f (x, y) = c, con c costante, il gradiente di f è un vettore che è,
in ogni punto, perpendicolare alla curva di livello passante per quel punto.
Infatti, se ~v è un versore tangente a una curva di livello di f in un punto
(x0 , y0 ), si ha D~v f (x0 , y0 ) = 0, proprio perché f è costante lungo le sue curve
di livello. D’altra parte, se f è differenziabile, dalla formula del gradiente
deriva che
∇f (x0 , y0 ) · ~v = D~v f (x0 , y0 ) = 0,
e quindi il vettore ∇f (x0 , y0 ) è ortogonale al vettore ~v , che era tangente a
una curva di livello di f . Il gradiente di f è quindi ortogonale alle curve di
livello di f e indica la direzione di massima variazione della funzione f .
D~v f (x0 , y0 ) = lim
1.4. Derivate successive
Se una funzione f è derivabile, e se anche le sue derivate parziali sono
derivabili, queste si possono derivare ulteriormente per trovare le derivate
1. Richiami di teoria
187
parziali seconde. Questo processo si può iterare, per costruire derivate parziali di ordine successivo al secondo, fin tanto che le funzioni in questione
sono derivabili.
Per indicare le derivate parziali seconde si usa la seguente notazione
abbreviata:
∂2f
∂ ∂f
∂2f
∂ ∂f
=
,
=
,
∂x2
∂x ∂x
∂x∂y
∂x ∂y
∂2f
∂ ∂f
∂2f
∂ ∂f
=
,
=
.
∂y 2
∂y ∂y
∂y∂x
∂y ∂x
L’estensione di tale notazione al caso di derivate parziali di ordine superiore
al secondo e di funzioni di più di due variabili è ovvia. Si avrà, ad esempio,
∂
∂
∂ ∂ ∂f
∂5f
=
.
∂x2 ∂y∂z 2
∂x ∂x ∂y ∂z ∂z
Per quanto riguarda le derivate parziali miste, si dimostra il seguente
risultato importante:
Teorema 1.14 (Teorema di Schwarz). Se le derivate seconde miste
∂2f
∂x∂y
2
∂ f
e ∂y∂x
della funzione f esistono in un intorno del punto (x0 , y0 ) e sono
continue in tale punto, allora si ha:
∂2f
∂2f
(x0 , y0 ) =
(x0 , y0 ).
∂x∂y
∂y∂x
2
2
∂ f
∂ f
Di conseguenza, se le derivate seconde miste ∂x∂y
e ∂y∂x
esistono e sono
continue in tutto un aperto A, allora esse coincidono in tutto l’aperto A.
Osservazione 1.15. Un risultato analogo, con un ovvio enunciato, vale per
funzioni di n variabili e per derivate parziali di ordine qualunque.
Definizione 1.16. Una funzione f si dice di classe C m in un aperto A (con
m ≥ 0), e si scrive f ∈ C m (A), se essa è continua in A e se esistono tutte le
derivate parziali fino all’ordine m ed esse sono continue in tutto l’aperto A.
Una funzione f si dice di classe C ∞ in un aperto A, e si scrive f ∈ C ∞ (A),
se essa è continua in A e se esistono tutte le derivate parziali di ogni ordine
ed esse sono continue in tutto l’aperto A.
Le derivate parziali seconde di una funzione di n variabili si possono
organizzare in modo ovvio a formare una matrice quadrata di ordine n.
Diamo quindi la seguente definizione:
Definizione 1.17. Sia f (x1 , x2 , . . . , xn ) una funzione di n variabili a valori
reali. La matrice Hessiana di f , indicata con H(f ), è la matrice i cui
188
11. Calcolo Differenziale in più Variabili
elementi sono le derivate seconde di f :
 ∂2f
∂2f
∂x21
∂2f

 ∂x2 ∂x1
H(f ) = 
 ..
 .
∂2f
∂xn ∂x1
∂x1 ∂x2
∂2f
∂x22
..
.
∂2f
∂xn ∂x2
···
···
..
.
···
∂2f
∂x1 ∂xn
∂2f 

∂x2 ∂xn 

..
.
∂2f
∂x2n
.

Il teorema di Schwarz afferma che se la funzione f è di classe C 2 in un
aperto A di Rn , allora la matrice Hessiana di f è una matrice simmetrica.
In tal caso la forma quadratica associata alla matrice Hessiana di f è detta
differenziale secondo di f , indicato con d2 f . Si ha quindi:
d2 f (~x0 )(h1 , h2 , . . . , hn ) =
n
X
∂2f
(~x0 ) hi hj ,
∂x
∂x
i
j
i,j=1
o, in termini della matrice Hessiana,

h1
d2 f (~x0 )(h1 , h2 , . . . , hn ) = (h1 , h2 , . . . , hn )H(f )(~x0 )  ...  ,
hn

ove il prodotto è il solito prodotto righe per colonne.
Come nel caso del differenziale di una funzione f , anche per il differenziale secondo si usa spesso la seguente scrittura:
d2 f (~x0 ) =
n
X
∂2f
(~x0 ) dxi dxj ,
∂x
∂x
i
j
i,j=1
ove i dxi vengono pensati come incrementi infinitesimi delle variabili xi , per
i = 1, . . . , n.
1.5. Serie di Taylor
Come per le funzioni di una variabile, anche nel caso di funzioni di più variabili si può scrivere lo sviluppo in serie di Taylor di una funzione all’intorno
di un punto interno al suo dominio di definizione. A differenza del caso di
una variabile, però, la scrittura di tale formula è complicata dalla presenza
di tutte le derivate parziali della funzione in questione. È quindi necessario
introdurre una notazione che ci permetta di semplificare la scrittura dello
sviluppo in serie di Taylor di una funzione di n variabili.
Sia dunque f : A → R una funzione di n variabili definita in un aperto
A di Rn e sia ~x0 ∈ A. Introduciamo il seguente operatore differenziale
D = h1
∂
∂
∂
+ h2
+ · · · + hn
,
∂x1
∂x2
∂xn
1. Richiami di teoria
189
∂f
∂f
∂f
definito ponendo D(f ) = h1 ∂x
+ h2 ∂x
+ · · · + hn ∂x
, ove hi ∈ R, per
n
1
2
i = 1, . . . , n.
Possiamo ora enunciare il seguente risultato:
Teorema 1.18. Se la funzione f : A → R, A ⊂ Rn , è di classe C m in A,
si ha:
m
X
1 i
~
f (~x0 + h) = f (~x0 ) +
D f (~x0 ) + o(k~hkm ),
i!
i=1
ove
i
∂
∂
∂
i
D = h1
+ h2
+ · · · + hn
∂x1
∂x2
∂xn
è l’operatore differenziale che si ottiene sviluppando formalmente la potenza
i-esima dell’operatore differenziale D, e o(k~hkm ) è una funzione trascurabile
rispetto a k~hkm , cioè tale che
o(k~hkm )
= 0.
~h→0 k~
hkm
lim
A titolo di esempio ricaviamo lo sviluppo in serie di Taylor al secondo
ordine per una funzione di due variabili. Dal teorema precedente si ha:
∂
∂
f (x0 + h, y0 + k) = f (x0 , y0 ) + h
+k
f (x0 , y0 )
∂x
∂y
2
1
∂
∂
h
+k
f (x0 , y0 ) + o(k(h, k)k2 )
+
2 ∂x
∂y
∂f
∂f
= f (x0 , y0 ) + h (x0 , y0 ) + k (x0 , y0 )
∂x
∂y
2
1 2∂ f
∂2f
+
h
(x
,
y
)
+
2hk
(x0 , y0 )
0
0
2
∂x2
∂x∂y
2
2∂ f
+k
(x0 , y0 ) + o(h2 + k 2 ).
∂y 2
1.6. Massimi e minimi liberi
Sia f : A → R una funzione definita in un aperto A di Rn .
Definizione 1.19. Un punto ~x0 ∈ A è detto un punto di massimo locale per
f (o di massimo relativo) se si ha f (~x) ≤ f (~x0 ), per ogni ~x che appartiene
a un intorno (sufficientemente piccolo) di ~x0 .
Un punto ~x0 ∈ A è detto un punto di minimo locale per f (o di minimo
relativo) se si ha f (~x) ≥ f (~x0 ), per ogni ~x che appartiene a un intorno
(sufficientemente piccolo) di ~x0 .
Un punto ~x0 ∈ A è detto un punto di massimo assoluto per f se si ha
f (~x) ≤ f (~x0 ), per ogni ~x ∈ A.
190
11. Calcolo Differenziale in più Variabili
Un punto ~x0 ∈ A è detto un punto di minimo assoluto per f se si ha
f (~x) ≥ f (~x0 ), per ogni ~x ∈ A.
Per la ricerca dei massimi e minimi relativi di una funzione è estremamente utile il seguente risultato.
Teorema 1.20. Sia f : A → R una funzione definita in un aperto A di
Rn . Se ~x0 ∈ A è un punto di massimo o minimo relativo per f , e se f è
differenziabile in ~x0 , allora df (~x0 ) = 0 (cioè ∇f (~x0 ) = 0).
Osservazione 1.21. Facciamo notare che il teorema precedente vale solo
nelle ipotesi che l’insieme A, in cui si cercano i massimi e minimi, sia aperto,
che la funzione f sia differenziabile in tali punti, e vale solo per punti di
massimo o minimo relativi. Se l’insieme su cui è definita f è chiuso, questo
teorema si può applicare solo per i punti interni a tale insieme. Se poi
ci sono dei punti in cui f non è differenziabile, tali punti vanno studiati
separatamente. Infine notiamo che non vale il viceversa; cioè è possibile che
df (~x0 ) = 0 ma ~x0 non sia né un punto di massimo né un punto di minimo
relativo per f .
Definizione 1.22. I punti di A in cui si annulla il differenziale di f , cioè in
cui si annullano tutte le derivate parziali prime di f , sono detti punti critici
di f .
Osservazione 1.23. Osserviamo che, se ~x0 è un punto critico di f , l’iperpiano tangente al grafico di z = f (~x) nel punto (~x0 , f (~x0 )) è “orizzontale”,
cioè ha equazione z = k, con k costante (k = f (~x0 )).
Se la funzione f è di classe C 2 in A e se ~x0 è un punto critico di f , lo
sviluppo in serie di Taylor al secondo ordine di f , centrato in ~x0 , diventa:
n
1 X ∂2f
~
f (~x0 + h) = f (~x0 ) +
(~x0 ) hi hj + o(k~hk2 ).
2 i,j=1 ∂xi ∂xj
Si vede quindi che il segno di f (~x0 + ~h) − f (~x0 ) è uguale al segno del termine
di secondo grado
n
X
∂2f
(~x0 ) hi hj ,
∂xi ∂xj
i,j=1
cioè al segno del differenziale secondo di f calcolato nell’incremento ~h =
(h1 , . . . , hn ).
La determinazione della natura dei punti critici di una funzione f è
quindi legata allo studio del segno della forma quadratica corrispondente al
differenziale secondo di f calcolato nei punti critici.
Ricordiamo ora alcuni fatti riguardanti lo studio delle forme quadratiche
in Rn .
1. Richiami di teoria
191
Definizione 1.24. Una forma quadratica in Rn è un polinomio omogeneo
di secondo grado in n variabili:
n
q : R → R,
q(x1 , . . . , xn ) =
n
X
aij xi xj ,
i,j=1
dove gli aij sono dei numeri reali.
Definizione 1.25. Una forma quadratica q(~x) è detta
(1) definita positiva, se q(~x) > 0, per ogni ~x 6= 0;
(2) definita negativa, se q(~x) < 0, per ogni ~x 6= 0;
(3) semidefinita positiva, se q(~x) ≥ 0, per ogni ~x, e q(~x) = 0 per
qualche ~x 6= 0;
(4) semidefinita negativa, se q(~x) ≤ 0, per ogni ~x, e q(~x) = 0 per
qualche ~x 6= 0;
(5) indefinita, se esistono due punti ~x1 e ~x2 tali che q(~x1 ) > 0 e q(~x2 ) <
0.
Ricordiamo ancora che a una forma quadratica q(~x) si associa una matrice simmetrica A in modo tale che si abbia
 
x1
q(x1 , . . . , xn ) = (x1 , . . . , xn )A  ...  ,
xn
ove il prodotto è il solito prodotto righe per colonne.
Utilizzando la matrice simmetrica A associata a una forma quadratica
q(~x) è possibile stabilire un criterio molto semplice per scoprire se q(~x) è
definita positiva o negativa.
Teorema 1.26. Sia A = (aij ) la matrice (quadrata di ordine n) associata
alla forma quadratica q(~x). Indichiamo con ∆r , per r = 1, . . . , n, il determinante della sottomatrice costituita dalle prime r righe e r colonne di A.
Si ha quindi
a11 · · · a1r a11 a12 .
.. .
, · · · , ∆r = ..
∆1 = a11 , ∆2 = . a21 a22 a
arr r1 · · ·
Allora q(~x) (o, equivalentemente, A) è
(1) definita positiva se ∆i > 0, per ogni i = 1, . . . , n.
(2) definita negativa se ∆i < 0 per ogni i dispari, e ∆i > 0, per ogni i
pari, per i = 1, . . . , n.
Nel caso n = 2 si può enunciare un risultato più preciso.
Teorema 1.27. Sia q : R2 → R una forma quadratica e sia
a b
A=
b c
192
11. Calcolo Differenziale in più Variabili
la matrice associata a q. Allora, se a 6= 0, q(~x) (o, equivalentemente, A) è
(1) definita positiva se a > 0, e det A > 0;
(2) definita negativa se a < 0, e det A > 0;
(3) semidefinita positiva se a > 0, e det A = 0;
(4) semidefinita negativa se a < 0, e det A = 0;
(5) indefinita se det A < 0.
Se invece a = 0, le cinque affermazioni precedenti rimangono valide con c
sostituito al posto di a.
Ritornando allo studio dei massimi e minimi relativi, possiamo ora enunciare il seguente teorema.
Teorema 1.28. Sia f : A → R una funzione definita in un aperto A di Rn ,
di classe C 2 in A, e sia ~x0 un punto critico di f . Se la matrice Hessiana
di f calcolata nel punto ~x0 , H(f )(~x0 ), è definita positiva, ~x0 è un punto di
minimo relativo per f . Se H(f )(~x0 ) è definita negativa, ~x0 è un punto di
massimo relativo per f . Se H(f )(~x0 ) è indefinita, ~x0 non è né un punto di
massimo relativo né un punto di minimo relativo per f . Infine, se H(f )(~x0 )
è semidefinita (positiva o negativa), nulla si può affermare sulla natura del
punto critico ~x0 .
1.7. Funzioni definite implicitamente
In questa sezione richiameremo i principali risultati riguardanti lo studio
delle funzioni definite in modo implicito da una equazione del tipo F (x, y) =
0. Per semplicità tratteremo solo il caso di funzioni di due variabili.
Sia dunque F (x, y) una funzione reale di due variabili, definita in un
aperto A di R2 , e sia (x0 , y0 ) un punto tale che F (x0 , y0 ) = 0. Ci proponiamo
di capire sotto quali condizioni l’equazione F (x, y) = 0 definisce, in un
intorno del punto (x0 , y0 ), una funzione y = y(x), oppure una funzione
x = x(y). Cioè sotto quali condizioni sia possibile determinare una funzione
y = y(x) (oppure x = x(y)) in modo tale che l’equazione F (x, y(x)) = 0
(rispettivamente, F (x(y), y) = 0) sia identicamente soddisfatta.
La risposta a questo quesito è fornita dal seguente teorema:
Teorema 1.29 (Teorema del Dini). Sia A un sottoinsieme aperto di
R2 e sia F : A → R una funzione di classe C m in A (con m ≥ 1). Sia
(x0 , y0 ) 6= 0, allora
(x0 , y0 ) ∈ A un punto tale che F (x0 , y0 ) = 0. Se ∂f
∂y
esiste un intorno I di x0 in R e una unica funzione y = y(x), definita in
I, tale che F (x, y(x)) = 0, per ogni x ∈ I. Questa funzione y = y(x) è di
classe C m in I e si ha
∂f
(x, y(x))
dy
∂x
(x) = − ∂f
,
dx
(x, y(x))
∂y
per ogni x ∈ I.
1. Richiami di teoria
193
Analogamente, se ∂f
(x0 , y0 ) 6= 0, allora esiste un intorno J di y0 in R
∂x
e una unica funzione x = x(y), definita in J, tale che F (x(y), y) = 0, per
ogni y ∈ J. Questa funzione x = x(y) è di classe C m in J e si ha
∂f
(x(y), y)
dx
∂y
,
(y) = − ∂f
dy
(x(y), y)
∂x
per ogni y ∈ J.
1.8. Massimi e minimi vincolati
Sia f : A → R una funzione definita in un aperto A di R2 . Sia Γ ⊂ A
una curva definita da una equazione del tipo g(x, y) = 0. Ci poniamo ora il
problema di determinare gli estremi della funzione f ristretta alla curva Γ,
cioè gli estremi della funzione f (x, y) dove le variabili x e y devono soddisfare
al vincolo g(x, y) = 0.
Il caso più semplice è quello in cui è possibile trovare una parametrizzazione della curva Γ:
[a, b] 3 t 7→ ~r(t) = (x(t), y(t)) ∈ Γ.
In questo caso, componendo la funzione f (x, y) con la parametrizzazione di
Γ, si ottiene una funzione
F (t) = f (x(t), y(t)),
definita nell’intervallo [a, b], che rappresenta la funzione f calcolata nei punti
della curva Γ. Determinare gli estremi della funzione f ristretta alla curva
Γ è equivalente a determinare gli estremi liberi della funzione (di una sola
variabile) F (t), nell’intervallo [a, b].
Purtroppo, in generale, non sarà possibile determinare una parametrizzazione della curva Γ. In tal caso, per determinare gli estremi della funzione
f ristretta alla curva Γ si può ricorrere al metodo seguente, noto come il
metodo dei moltiplicatori di Lagrange.
Teorema 1.30. Sia f : A → R una funzione definita in un aperto A di R2
e di classe C 1 in A. Sia Γ ⊂ A una curva definita da una equazione del tipo
g(x, y) = 0, dove g(x, y) è una funzione di classe C 1 . Sia (x0 , y0 ) ∈ Γ un
punto non-singolare della curva Γ, cioè un punto tale che g(x0 , y0 ) = 0, ma
∇g(x0 , y0 ) 6= 0. Allora (x0 , y0 ) è un punto critico della restrizione di f alla
curva Γ se e solo se esso è un punto critico (non vincolato) della funzione
L(x, y, λ) = f (x, y) + λg(x, y),
per qualche λ ∈ R.
Questo teorema afferma quindi che i punti critici di f (x, y), soggetti al
vincolo g(x, y) = 0, si trovano cercando i punti critici (liberi) della funzione
di tre variabili L(x, y, λ) = f (x, y) + λg(x, y), detta Lagrangiana. Si noti
che ciò vale solo per i punti non-singolari della curva Γ. Il comportamento
194
11. Calcolo Differenziale in più Variabili
di f nei punti singolari di Γ, cioè nei punti in cui si annulla il gradiente di
g, deve essere studiato a parte.
Notiamo infine che questo teorema non dice nulla sulla natura di tali
punti critici. Di conseguenza, una volta determinati i punti critici di f
utilizzando il metodo dei moltiplicatori di Lagrange, rimarrà il problema di
capire se si tratta di punti di massimo, di minimo, oppure di punti di flesso.
Occupiamoci ora del problema della determinazione della natura dei punti critici vincolati di una funzione f (x, y), determinati con il metodo dei
moltiplicatori di Lagrange.
Sia dunque f (x, y) una funzione di classe C 2 definita in un aperto contenente la curva Γ di equazione g(x, y) = 0, dove supponiamo che g(x, y)
sia una funzione di classe C 2 . Sia (x0 , y0 ) ∈ Γ un punto critico della restrizione di f alla curva Γ. Supponiamo inoltre che (x0 , y0 ) sia un punto
non-singolare di Γ, cioè che ∇g(x0 , y0 ) 6= 0. Dato che il gradiente di g in
(x0 , y0 ) è diverso da zero, almeno una delle derivate parziali di g in (x0 , y0 )
∂g
(x0 , y0 ) 6= 0 (un discorso analogo
è diversa da zero. Supponiamo che sia ∂y
∂g
si può fare se è ∂x (x0 , y0 ) 6= 0, basta scambiare i ruoli di x e y). Per il
Teorema del Dini è possibile rappresentare, in un intorno del punto (x0 , y0 ),
la curva Γ come grafico di una funzione y = y(x). Di conseguenza la mappa
x 7→ (x, y(x))
fornisce una parametrizzazione locale della curva Γ, all’intorno del punto
(x0 , y0 ). Componendo la funzione f (x, y) con questa parametrizzazione, si
ottiene la funzione della sola variabile x
F (x) = f (x, y(x)).
A questo punto, per determinare la natura del punto critico (x0 , y0 ) di f ,
basta determinare la natura del punto critico x0 della funzione F (x). Se
le funzioni sono di classe C 2 , come supposto, è possibile determinare il
segno della derivata seconda di F in x0 . Se deriviamo la funzione F (x) =
f (x, y(x)), utilizzando la formula per la derivazione delle funzioni composte,
otteniamo:
∂f
∂f
F 0 (x) =
(x, y(x)) +
(x, y(x)) y 0 (x),
∂x
∂y
e, derivando ulteriormente, si ha:
F 00 (x) =
∂2f
∂2f
(x,
y(x))
+
2
(x, y(x)) y 0 (x)
∂x2
∂x∂y
∂2f
∂f
+ 2 (x, y(x)) y 0 (x)2 +
(x, y(x)) y 00 (x).
∂y
∂y
Per calcolare F 00 (x0 ) è quindi necessario conoscere le derivate y 0 (x0 ) e y 00 (x0 ),
ma queste si possono calcolare usando il Teorema del Dini. Vedremo negli
esercizi degli esempi di applicazioni pratiche del metodo appena descritto.
2. Esercizi
195
2. Esercizi
2.1. Derivate parziali
Esercizio 1. Determinare le derivate parziali della funzione
x
f (x, y) = sin
.
x+y
Esercizio 2. Determinare le derivate parziali della funzione
f (x, y) = log(x2 + cos y).
Esercizio 3. Determinare le derivate parziali della funzione
f (x, y) = p
x2 y
x2 + y 2 + 1
.
Esercizio 4. Determinare le derivate parziali della funzione
x2 log(x) cos(y 2 ) − xy 2
.
sin(y 2 )
Esercizio 5. Si calcolino le derivate parziali nell’origine della funzione
(
xy
se (x, y) 6= (0, 0),
2
2
f (x, y) = x +y
0
se (x, y) = (0, 0).
f (x, y) =
2.2. Differenziali
Esercizio 6. Si dica se la seguente funzione
ex sin y
f (x, y) =
x+y
è differenziabile in tutto il suo insieme di definizione.
Esercizio 7. Si dimostri che la seguente funzione
f (x, y) = x2 cos(xy) − 2y
è differenziabile in tutto R2 . Si calcoli poi il suo differenziale nel punto di
coordinate (1, π/2).
Esercizio 8. Si determini l’equazione del piano tangente al grafico di
f (x, y) = xy sin x − y 2
nel punto di coordinate x0 = 0, y0 = 1, z0 = f (x0 , y0 ) = −1.
Esercizio 9. Si consideri la funzione f : R2 → R definita come segue:

2
2
xy y − 2x se (x, y) 6= (0, 0),
f (x, y) =
x2 + y 2

0
se (x, y) = (0, 0).
196
11. Calcolo Differenziale in più Variabili
(1)
(2)
(3)
(4)
Si dimostri che f è continua nell’origine.
Calcolare le derivate parziali di f nei punti (x, y) 6= (0, 0).
Stabilire se f è derivabile anche nel punto (0, 0).
Stabilire se f è differenziabile nell’origine.
2.3. Derivate direzionali
Esercizio 10. Si calcoli la derivata direzionale nel generico punto (x, y)
della funzione
f (x, y) = 2x2 log(xy) + y sin(x2 )
nella direzione determinata dal vettore ~v = (1, 3).
Esercizio 11. Sia f (x, y) la funzione definita da

3 2
 xy
se (x, y) 6= (0, 0),
f (x, y) = (x2 + y 2 )2

0
se (x, y) = (0, 0).
Si calcolino tutte le derivate direzionali di f nel punto (0, 0). Si dica poi se
f è differenziabile nell’origine.
2.4. Derivate parziali seconde
Esercizio 12. Calcolare le derivate parziali seconde della funzione
f (x, y) = x2 log y + sin(xy 2 ).
Esercizio 13. Scrivere la matrice Hessiana della funzione
f (x, y, z) = 2x3 y cos z + xy 2 z.
Esercizio 14. Calcolare le derivate parziali seconde miste nell’origine della
funzione

2
2
xy y − 2x se (x, y) 6= (0, 0),
f (x, y) =
x2 + y 2

0
se (x, y) = (0, 0).
Alla luce del teorema di Schwarz, spiegare il risultato trovato.
2.5. Serie di Taylor
Esercizio 15. Si scriva lo sviluppo in serie di Taylor al primo ordine,
all’intorno del punto (1, 1), della funzione
f (x, y) = x2 sin(πy) − log(xy).
2. Esercizi
197
Esercizio 16. Si scriva lo sviluppo in serie di Taylor al primo ordine,
all’intorno del punto (−1, 1, 1), della funzione
f (x, y, z) = xy 2 z + y cos(πz/2) − 2xy sin(πy).
Esercizio 17. Si scriva lo sviluppo in serie di Taylor al secondo ordine,
all’intorno del punto (0, 1), della funzione
f (x, y) = ex sin(xy).
Esercizio 18. Si scriva lo sviluppo in serie di Taylor al secondo ordine,
all’intorno del punto (1, 1, 0), della funzione
f (x, y, z) = 2x2 cos(yz) − y sin(xz).
2.6. Massimi e minimi liberi
Esercizio 19. Si studino gli estremi della funzione
f (x, y) = x3 + 3xy 2 − 15x − 12y.
Si dica inoltre se f ammette massimo o minimo assoluti e, in caso affermativo, si determinino tali valori.
Esercizio 20. Determinare i massimi e i minimi relativi della funzione
1
f (x, y, z) = x2 + xyz + y − z.
2
Esercizio 21. Determinare i massimi e i minimi relativi della funzione
f (x, y) = x(x2 + y 2 − 2x).
Esercizio 22. Si determini la natura del punto critico (0, 0) della funzione
f (x, y) = 4y 3 − 8y 2 − x2 y 2 + 6x2 y − x4 .
Esercizio 23. Determinare i massimi e i minimi relativi della funzione
f (x, y) = 3x4 − 4x2 y + y 2 .
Esercizio 24. Determinare i massimi e i minimi relativi della funzione
f (x, y) = x4 + y 4 − x2 y 2 .
Esercizio 25. Determinare gli estremi relativi e assoluti (se esistono) della
funzione
f (x, y) = (x2 + y 2 )e−(x
2 +y 2 )
.
198
11. Calcolo Differenziale in più Variabili
2.7. Funzioni definite implicitamente
Esercizio 26. Sia Γ ⊂ R2 la curva di equazione
f (x, y) = 1 + xy − log(exy + e−xy ) = 0.
Determinare in quali punti di Γ è possibile applicare il teorema del Dini.
Successivamente, nei punti in cui la curva Γ è rappresentabile come grafico
d2 y
dy
di una funzione y = y(x), si calcolino le derivate dx
e dx
2.
Esercizio 27. Sia Γ ⊂ R2 la curva di equazione
f (x, y) = sin y − xey + x2 cos y = 0.
Si verifichi che la curva Γ passa per i punti di coordinate (0, 0) e (1, 0). Si
verifichi poi che, in un intorno del punto (0, 0), la curva Γ è rappresentabile
come grafico di una funzione y = y(x) e si calcolino le derivate y 0 (0) e y 00 (0).
Lo stesso vale anche per il punto (1, 0)?
Esercizio 28. Sia Γ ⊂ R3 la curva definita dal sistema di equazioni
( 2
x + log(xy) − x cos z = 0
x2 − y 3 + z 2 + x2 z = 0.
Si determini se, in un intorno del punto (1, 1, 0), è possibile rappresentare Γ come grafico di una funzione R → R2 , x 7→ (y(x), z(x)), e, in caso
affermativo, si calcolino le derivate y 0 e z 0 nel punto in questione.
Esercizio 29. Sia S ⊂ R3 la superficie di equazione
f (x, y, z) = x3 − x2 y + 2xyz − y 2 sin z + z 2 cos y = 0.
Si verifichi che, in un intorno del punto (1, 1, 0), la superficie S è rappresentabile come grafico di una funzione z = z(x, y) e si calcolino le derivate
∂z
∂z
parziali ∂x
e ∂y
nel punto in questione.
2.8. Massimi e minimi vincolati
Esercizio 30. Determinare i massimi e i minimi assoluti della funzione
f (x, y) = xy
2
nell’insieme A = {(x, y) ∈ R | x2 + xy + y 2 = 1}.
Esercizio 31. Determinare i massimi e i minimi assoluti della funzione
√
2
2
f (x, y) = (y − 2)e− x +y
nell’insieme A = {(x, y) ∈ R2 | x2 + y 2 ≤ 16}.
Esercizio 32. Determinare i massimi e i minimi assoluti della funzione
x
f (x, y, z) =
z+1
3
2
2
nell’insieme A = {(x, y, z) ∈ R | x + y = 4(1 + z)2 , x + 2z = 2}.
3. Soluzioni
199
Esercizio 33. Determinare i massimi e i minimi assoluti della funzione
f (x, y) = x + y
nell’insieme X = {(x, y) ∈ R2 | 4x2 + 43 y 2 ≤ 1,
√
3x − y ≥ 0}.
Esercizio 34. Determinare i massimi e i minimi relativi della funzione
f (x, y, z) = z
nell’insieme X = {(x, y, z) ∈ R3 | z 3 + 3x2 + y 2 + 2z 2 + 2z + 1 = 0}.
3. Soluzioni
3.1. Derivate parziali
Svolgimento esercizio 1. Si ha:
y
x
∂f
=
cos
,
∂x
(x + y)2
x+y
∂f
x
=−
cos
∂y
(x + y)2
x
.
x+y
Svolgimento esercizio 2. Si ha:
2x
∂f
= 2
,
∂x
x + cos y
∂f
sin y
=− 2
.
∂y
x + cos y
Svolgimento esercizio 3. Si ha:
∂f
x3 y + 2xy 3 + 2xy
=
,
∂x
(x2 + y 2 + 1)3/2
∂f
x4 + x2
= 2
.
∂y
(x + y 2 + 1)3/2
Svolgimento esercizio 4. Si ha:
∂f
2 x log(x) cos(y 2 ) + x cos(y 2 ) − y 2
=
,
∂x
sin(y 2 )
∂f
−2 x2 log(x) sin(y 2 )y − 2 xy
(x2 log(x) cos(y 2 ) − xy 2 ) cos(y 2 )y
=
−
2
.
∂y
sin(y 2 )
(sin(y 2 ))2
Svolgimento esercizio 5. In questo caso, per calcolare le derivate parziali
di f nell’origine, bisogna ricorrere alla definizione:
∂f
f (0 + h, 0) − f (0, 0)
(0, 0) = lim
= 0,
h→0
∂x
h
e analogamente
∂f
f (0, 0 + h) − f (0, 0)
(0, 0) = lim
= 0.
h→0
∂y
h
La funzione f è quindi derivabile nell’origine, e le sue derivate parziali sono
nulle.
200
11. Calcolo Differenziale in più Variabili
Facciamo notare che per calcolare le derivate parziali di f nel punto (0, 0)
non si poteva calcolarne le derivate parziali nel punto (x, y) 6= (0, 0), e poi
passare al limite per (x, y) che tende a (0, 0). Infatti l’uguaglianza
∂f
∂f
(0, 0) = lim
(x, y)
(x,y)→(0,0) ∂x
∂x
vale se e solo se la derivata parziale ∂f
è continua nell’origine (in base
∂x
alla definizione stessa di continuità). Nel nostro caso invece non sapevamo
neppure se le derivate parziali di f esistessero nell’origine, tanto meno se
esse fossero o meno continue.
Nel nostro caso si ha infatti
∂f
y 3 − x2 y
(x, y) = 2
,
∂x
(x + y 2 )2
per (x, y) 6= (0, 0), e il limite
∂f
y 3 − x2 y
(x, y) = lim
(x,y)→(0,0) (x2 + y 2 )2
(x,y)→(0,0) ∂x
lim
non esiste, come si vede facilmente calcolando tale limite per (x, y) che tende
a (0, 0) lungo le rette di equazione y = mx (un discorso analogo si può fare
per la derivata parziale ∂f
). Si conclude quindi che la funzione f è derivabile
∂y
ovunque, ma le sue derivate parziali non sono continue nel punto (0, 0).
Osserviamo, per concludere, che la funzione f , pur essendo derivabile
nell’origine, non è continua nell’origine. Infatti il limite
xy
lim f (x, y) = lim
(x,y)→(0,0)
(x,y)→(0,0) x2 + y 2
non esiste, come si vede facilmente calcolando tale limite per (x, y) che tende
a (0, 0) lungo le rette di equazione y = mx.
3.2. Differenziali
Svolgimento esercizio 6. La funzione f è definita nell’insieme
A = {(x, y) ∈ R2 | x + y 6= 0}.
Osserviamo che A è un sottoinsieme aperto di R2 .
Le derivate parziali di f sono:
∂f
ex sin y(x + y − 1)
=
,
∂x
(x + y)2
∂f
ex ((x + y) cos y − sin y)
=
.
∂y
(x + y)2
Tali derivate parziali esistono e sono continue in tutto l’insieme aperto A.
Da ciò segue che la funzione f è differenziabile in tutto l’insieme A, cioè in
tutto il suo dominio di definizione.
3. Soluzioni
201
Svolgimento esercizio 7. La funzione f è definita, ed è continua, in tutto
R2 . Le derivate parziali di f sono:
∂f
= 2x cos(xy) − x2 y sin(xy),
∂x
∂f
= −x3 sin(xy) − 2.
∂y
Le derivate parziali esistono e sono continue in tutto R2 , di conseguenza la
funzione f è differenziabile in tutto R2 .
Il differenziale della funzione f nel generico punto (x, y) è dato da
∂f
∂f
df (x, y) =
(x, y) dx +
(x, y) dy.
∂x
∂y
Calcolando le derivate parziali nel punto (1, π/2) si trova
∂f
π
∂f
(1, π/2) = − ,
(1, π/2) = −3.
∂x
2
∂y
Il differenziale di f nel punto in questione è quindi
π
df (1, π/2) = − dx − 3 dy.
2
Ricordiamo che con questa scrittura si indica la seguente applicazione lineare:
π
df (1, π/2) : R2 → R,
(h, k) 7→ df (1, π/2)(h, k) = − h − 3 k.
2
Svolgimento esercizio 8. La funzione
f (x, y) = xy sin x − y 2
è definita e continua in tutto R2 . Le sue derivate parziali sono
∂f
= y sin x + xy cos x,
∂x
∂f
= x sin x − 2y.
∂y
Le derivate parziali esistono e sono continue in tutto R2 , quindi f è differenziabile ovunque. Per definizione, l’equazione del piano tangente al grafico
di f nel punto di coordinate (x0 , y0 , z0 = f (x0 , y0 )) è:
∂f
∂f
z = f (x0 , y0 ) +
(x0 , y0 )(x − x0 ) +
(x0 , y0 )(y − y0 ).
∂x
∂y
Nel nostro caso tale equazione diventa:
z = 1 − 2y.
Svolgimento esercizio 9. (1) Calcoliamo il limite
lim
(x,y)→(0,0)
f (x, y) =
lim
(x,y)→(0,0)
xy
y 2 − 2x2
.
x2 + y 2
202
11. Calcolo Differenziale in più Variabili
Passando in coordinate polari, si trova:
lim
xy
(x,y)→(0,0)
y 2 − 2x2
= lim ρ2 sin θ cos θ(sin2 θ − 2 cos2 θ).
ρ→0
x2 + y 2
La funzione
sin θ cos θ(sin2 θ − 2 cos2 θ)
è limitata, dato che le funzioni sin θ e cos θ assumono valori compresi tra
−1 e 1, di conseguenza si ha:
lim ρ2 sin θ cos θ(sin2 θ − 2 cos2 θ) = 0,
ρ→0
da cui si deduce che f è continua nell’origine.
(2) Le derivate parziali di f nei punti (x, y) 6= (0, 0) sono:
∂f
y 5 − 7x2 y 3 − 2x4 y
(x, y) =
,
∂x
(x2 + y 2 )2
∂f
−2x5 + 5x3 y 2 + xy 4
(x, y) =
.
∂y
(x2 + y 2 )2
(3) Usando la definizione di derivata parziale si trova:
∂f
f (0 + h, 0) − f (0, 0)
(0, 0) = lim
= 0.
h→0
∂x
h
Analogamente si ha
∂f
f (0, 0 + h) − f (0, 0)
(0, 0) = lim
= 0.
h→0
∂y
h
Quindi f è derivabile anche nell’origine.
(4) Calcoliamo il limite
∂f
y 5 − 7x2 y 3 − 2x4 y
(x, y) = lim
.
(x,y)→(0,0) ∂x
(x,y)→(0,0)
(x2 + y 2 )2
lim
Passando in coordinate polari, si trova:
y 5 − 7x2 y 3 − 2x4 y
= lim ρ(sin5 θ − 7 cos2 θ sin3 θ − 2 cos4 θ sin θ).
ρ→0
(x,y)→(0,0)
(x2 + y 2 )2
lim
La funzione
sin5 θ − 7 cos2 θ sin3 θ − 2 cos4 θ sin θ
è limitata, dato che le funzioni sin θ e cos θ assumono valori compresi tra
−1 e 1, di conseguenza si ha:
lim ρ(sin5 θ − 7 cos2 θ sin3 θ − 2 cos4 θ sin θ) = 0,
ρ→0
è continua nell’origine. Analogamente si verifica
da cui si deduce che ∂f
∂x
∂f
che anche ∂y è continua nell’origine. La funzione f è quindi differenziabile nell’origine, dato che le sue derivate parziali esistono e sono continue
nell’origine.
3. Soluzioni
203
3.3. Derivate direzionali
Svolgimento esercizio 10. La funzione f è definita per xy > 0, cioè nel
primo e terzo quadrante. Le derivate parziali di f sono:
∂f
= 4x log(xy) + 2x + 2xy cos(x2 ),
∂x
∂f
2x2
=
+ sin(x2 ).
∂y
y
Tali derivate parziali esistono e sono continue in tutto l’insieme (aperto) di
definizione della funzione f . Da ciò segue che la funzione f è differenziabile
in tutto il suo dominio di definizione.
Dato che f è differenziabile, per calcolare le sue derivate direzionali
possiamo usare la formula del gradiente, la quale afferma che
Dw~ f (x, y) = ∇f (x, y) · w,
~
per ogni versore w.
~
Nel nostro caso il vettore ~v = (1, 3) non è un versore, cioè non ha norma
1. Bisogna quindi normalizzarlo, dividendolo per la sua norma. Si ottiene
cosı̀ il versore
~v
1
v̂ =
= √ (1, 3).
k~v k
10
Dalla formula del gradiente si ricava quindi:
Dv̂ f (x, y) = ∇f (x, y) · v̂
2
1
3
2x
2
2
=√
4x log(xy) + 2x + 2xy cos(x ) + √
+ sin(x ) .
10
10 y
Svolgimento esercizio 11. In questo caso per calcolare le derivate direzionali di f nel punto (0, 0) bisogna usare la definizione. Sia dunque
~v = (vx , vy ) un versore qualunque. Si ha:
f (0 + hvx , 0 + hvy ) − f (0, 0)
h→0
h
5 3 2
1 h vx vy
= lim
2 + v 2 )2
h→0 h h4 (vx
y
D~v f (0, 0) = lim
=
vx3 vy2
.
(vx2 + vy2 )2
Quindi la funzione f è derivabile nell’origine rispetto a qualsiasi direzione.
In particolare, dal risultato appena trovato, si deduce che
∂f
(0, 0) = D(1,0) f (0, 0) = 0,
∂x
e
∂f
(0, 0) = D(0,1) f (0, 0) = 0.
∂y
204
11. Calcolo Differenziale in più Variabili
Dato che le derivate parziali di f nell’origine sono nulle, è nullo il gradiente
di f nell’origine, ∇f (0, 0) = (0, 0). Se la funzione f fosse differenziabile
nell’origine si potrebbe allora applicare la formula del gradiente, ottenendo
D~v f (0, 0) = ∇f (0, 0) · ~v = 0,
per ogni versore ~v . Ma abbiamo appena visto che le derivate direzionali di
f nell’origine non sono tutte nulle. Si conclude quindi che f non può essere
differenziabile nell’origine.
Questo stesso risultato si poteva ottenere direttamente ricordando la definizione di differenziale. Infatti, se esistesse il differenziale di f nell’origine,
si avrebbe
df (0, 0) =
∂f
∂f
(0, 0) dx +
(0, 0) dy = 0,
∂x
∂y
inoltre il seguente limite dovrebbe essere nullo:
f (0 + h, 0 + k) − f (0, 0) − df (0, 0)(h, k)
√
= 0.
(h,k)→(0,0)
h2 + k 2
lim
Ma si ha:
f (0 + h, 0 + k) − f (0, 0) − df (0, 0)(h, k)
√
(h,k)→(0,0)
h2 + k 2
lim
=
h3 k 2
√
,
(h,k)→(0,0) (h2 + k 2 )2 h2 + k 2
lim
e si verifica facilmente che questo limite non esiste (infatti se lo calcoliamo
lungo le rette di equazione k = mh si scopre che il valore del limite dipende
dal parametro m, cioè dalla retta scelta).
3.4. Derivate parziali seconde
Svolgimento esercizio 12. Le derivate parziali prime sono:
∂f
= 2x log y + y 2 cos(xy 2 ),
∂x
∂f
x2
=
+ 2xy cos(xy 2 ).
∂y
y
3. Soluzioni
205
Le derivate parziali seconde sono quindi:
∂2f
∂x2
∂2f
∂x∂y
∂2f
∂y∂x
∂2f
∂y 2
2
= 2 log y − y 4 sin(xy 2 ),
2x
− 2xy 3 sin(xy 2 ) + 2y cos(xy 2 ),
y
2x
=
− 2xy 3 sin(xy 2 ) + 2y cos(xy 2 ),
y
x2
= − 2 − 4x2 y 2 sin(xy 2 ) + 2x cos(xy 2 ).
y
=
2
∂ f
∂ f
Si noti che si ha ∂x∂y
= ∂y∂x
, come previsto dal teorema di Schwartz, dato
che le derivate seconde miste sono ovviamente continue.
Svolgimento esercizio 13. Le derivate parziali prime sono:
∂f
= 6x2 y cos z + y 2 z,
∂x
∂f
= 2x3 cos z + 2xyz,
∂y
∂f
= −2x3 y sin z + xy 2 .
∂z
Le derivate parziali seconde sono quindi:
∂2f
= 12xy cos z,
∂x2
∂2f
∂2f
=
= 6x2 cos z + 2yz,
∂x∂y
∂y∂x
∂2f
∂2f
=
= −6x2 y sin z + y 2 ,
∂x∂z
∂z∂x
∂2f
= 2xz,
∂y 2
∂2f
∂2f
∂2f
=
= −2x3 sin z + 2xy,
= −2x3 y cos z.
∂y∂z
∂z∂y
∂z 2
La matrice Hessiana di f è quindi:


12xy cos z
6x2 cos z + 2yz −6x2 y sin z + y 2
2xz
−2x3 sin z + 2xy  .
H(f ) =  6x2 cos z + 2yz
2
2
3
−6x y sin z + y −2x sin z + 2xy
−2x3 y cos z
Svolgimento esercizio 14. La funzione f (x, y) è la stessa dell’esercizio 9.
Nello svolgimento di tale esercizio abbiamo visto che f è continua ovunque
(anche nell’origine), che essa è derivabile ovunque e che le sue derivate
parziali sono date da
 5
2 3
4
 y − 7x y − 2x y se (x, y) 6= (0, 0),
∂f
(x, y) =
(x2 + y 2 )2

∂x
0
se (x, y) = (0, 0),
206
11. Calcolo Differenziale in più Variabili
e

5
3 2
4
 −2x + 5x y + xy
∂f
(x, y) =
(x2 + y 2 )2

∂y
0
se (x, y) 6= (0, 0),
se (x, y) = (0, 0).
Abbiamo poi dimostrato che le due derivate parziali di f sono continue
ovunque (anche nell’origine), e quindi f è differenziabile ovunque.
Siamo ora in grado di calcolare le derivate parziali seconde miste nell’origine della funzione f . Si ha:
∂ ∂f
∂2f
(0, 0) =
(0, 0)
∂x∂y
∂x ∂y
= lim
∂f
(0
∂y
+ h, 0) −
∂f
(0, 0)
∂y
h
−2h5 /h4
= lim
= −2,
h→0
h
h→0
e
∂2f
∂ ∂f
(0, 0) =
(0, 0)
∂y∂x
∂y ∂x
= lim
h→0
∂f
(0, 0
∂x
+ h) −
h
∂f
(0, 0)
∂x
h5 /h4
= 1.
h→0
h
Abbiamo cosı̀ scoperto che le due derivate parziali seconde miste di f
nell’origine non sono uguali:
= lim
∂2f
∂2f
(0, 0) 6=
(0, 0).
∂x∂y
∂y∂x
Ricordando il teorema di Schwarz, possiamo quindi concludere che, anche
se le derivate parziali seconde miste esistono nell’origine, esse non possono
essere continue in tale punto (altrimenti dovrebbero essere necessariamente
uguali).
La funzione f è quindi un esempio di una funzione che è di classe C 1 ,
ma non di classe C 2 , in un intorno dell’origine.
3.5. Serie di Taylor
Svolgimento esercizio 15. Ricordiamo che lo sviluppo in serie di Taylor
al primo ordine di una funzione f (x, y) all’intorno di un punto (x0 , y0 ) è
dato da
√
∂f
∂f
f (x0 + h, y0 + k) = f (x0 , y0 ) +
(x0 , y0 ) h +
(x0 , y0 ) k + o( h2 + k 2 ).
∂x
∂y
3. Soluzioni
207
Nel nostro caso si ha:
f (1, 1) = 0,
∂f
1
= 2x sin(πy) − ,
∂x
x
1
∂f
= πx2 cos(πy) − ,
∂y
y
da cui segue
∂f
∂f
(1, 1) = −1,
(1, 1) = −1 − π.
∂x
∂y
Lo sviluppo in serie di Taylor cercato è quindi
√
f (1 + h, 1 + k) = −h − (1 + π)k + o( h2 + k 2 ).
Svolgimento esercizio 16. Ricordiamo che lo sviluppo in serie di Taylor
al primo ordine di una funzione f (x, y, z) all’intorno di un punto (x0 , y0 , z0 )
è dato da
∂f
∂f
(x0 , y0 , z0 ) h +
(x0 , y0 , z0 ) k
f (x0 + h, y0 + k, z0 + l) = f (x0 , y0 , z0 ) +
∂x
∂y
√
∂f
+
(x0 , y0 , z0 ) l + o( h2 + k 2 + l2 ).
∂z
Nel nostro caso si ha:
f (−1, 1, 1) = −1,
∂f
= y 2 z − 2y sin(πy),
∂x
∂f
= 2xyz + cos(πz/2) − 2x sin(πy) − 2πxy cos(πy),
∂y
∂f
π
= xy 2 − y sin(πz/2),
∂z
2
da cui segue
∂f
∂f
∂f
π
(−1, 1, 1) = 1,
(−1, 1, 1) = −2 − 2π,
(−1, 1, 1) = −1 − .
∂x
∂y
∂z
2
Lo sviluppo in serie di Taylor cercato è quindi
√
f (−1 + h, 1 + k, 1 + l) = −1 + h − 2(1 + π)k − (1 + π/2)l + o( h2 + k 2 + l2 ).
Svolgimento esercizio 17. Ricordiamo che lo sviluppo in serie di Taylor
al secondo ordine di una funzione f (x, y) all’intorno di un punto (x0 , y0 ) è
dato da
∂f
∂f
f (x0 + h, y0 + k) = f (x0 , y0 ) +
(x0 , y0 ) h +
(x0 , y0 ) k
∂x
∂y
1 ∂2f
∂2f
∂2f
2
2
+
(x0 , y0 ) h + 2
(x0 , y0 ) hk + 2 (x0 , y0 ) k
2 ∂x2
∂x∂y
∂y
2
2
+ o(h + k ).
208
11. Calcolo Differenziale in più Variabili
Nel nostro caso si ha:
f (0, 1) = 0,
∂f
= ex sin(xy) + yex cos(xy),
∂x
∂f
= xex cos(xy),
∂y
da cui segue
∂f
∂f
(0, 1) = 1,
(0, 1) = 0.
∂x
∂y
Le derivate seconde sono:
∂2f
= ex sin(xy) + 2yex cos(xy) − y 2 ex sin(xy),
∂x2
∂2f
= xex cos(xy) − xyex sin(xy) + ex cos(xy),
∂x∂y
∂2f
= −x2 ex sin(xy),
∂y 2
da cui segue
∂2f
(0, 1) = 2,
∂x2
∂2f
(0, 1) = 1,
∂x∂y
∂2f
(0, 1) = 0.
∂y 2
Lo sviluppo in serie di Taylor cercato è quindi
f (0 + h, 1 + k) = h + h2 + hk + o(h2 + k 2 ).
Svolgimento esercizio 18. Ricordiamo che lo sviluppo in serie di Taylor al
secondo ordine di una funzione f (x, y, z) all’intorno di un punto (x0 , y0 , z0 )
è dato da
∂f
f (x0 + h, y0 + k, z0 + l) = f (x0 , y0 , z0 ) +
(x0 , y0 , z0 ) h
∂x
∂f
∂f
+
(x0 , y0 , z0 ) k +
(x0 , y0 , z0 ) l
∂y
∂z
1 ∂2f
∂2f
2
+
(x
,
y
,
z
)
h
+
(x0 , y0 , z0 ) k 2
0 0 0
2 ∂x2
∂y 2
∂2f
∂2f
+ 2 (x0 , y0 , z0 ) l2 + 2
(x0 , y0 , z0 ) hk
∂z
∂x∂y
∂2f
∂2f
+2
(x0 , y0 , z0 ) hl + 2
(x0 , y0 , z0 ) kl
∂x∂z
∂y∂z
+ o(h2 + k 2 + l2 ).
Nel nostro caso si ha:
f (1, 1, 0) = 2,
3. Soluzioni
209
∂f
= 4x cos(yz) − yz cos(xz),
∂x
∂f
= −2x2 z sin(yz) − sin(xz),
∂y
∂f
= −2x2 y sin(yz) − xy cos(xz),
∂z
da cui segue
∂f
(1, 1, 0) = 4,
∂x
∂f
(1, 1, 0) = 0,
∂y
∂f
(1, 1, 0) = −1.
∂z
Le derivate seconde sono:
∂2f
∂x2
∂2f
∂y 2
∂2f
∂z 2
∂2f
∂x∂y
∂2f
∂x∂z
∂2f
∂y∂z
= 4 cos(yz) − yz 2 sin(xz),
= −2x2 z 2 cos(yz),
= −2x2 y 2 cos(yz) + x2 y sin(xz),
= −4xz sin(yz) − z cos(xz),
= −4xy sin(yz) + xyz sin(xz) − y cos(xz),
= −2x2 yz cos(yz) − 2x2 sin(yz) − x cos(xz),
da cui segue
∂2f
(1, 1, 0) = 4,
∂x2
∂2f
(1, 1, 0) = 0,
∂y 2
∂2f
(1, 1, 0) = −2,
∂z 2
∂2f
∂2f
(1, 1, 0) = 0,
(1, 1, 0) = −1,
∂x∂y
∂x∂z
Lo sviluppo in serie di Taylor cercato è quindi
∂2f
(1, 1, 0) = −1.
∂y∂z
f (1 + h, 1 + k, 0 + l) = 2 + 4h − l + 2h2 − l2 − hl − kl + o(h2 + k 2 + l2 ).
3.6. Massimi e minimi liberi
Svolgimento esercizio 19. Le derivate parziali della funzione f sono
∂f
= 3x2 + 3y 2 − 15,
∂x
∂f
= 6xy − 12.
∂y
210
11. Calcolo Differenziale in più Variabili
I punti critici si trovano risolvendo il sistema

∂f


= 3x2 + 3y 2 − 15 = 0

∂x
∂f


= 6xy − 12 = 0

∂y
Questo sistema ammette quattro soluzioni, date dai punti di coordinate
(2, 1), (−2, −1), (1, 2) e (−1, −2).
La matrice Hessiana di f è
6x 6y
H(f ) =
6y 6x
quindi si ha:
12 6
−12 −6
H(f )(2, 1) =
,
H(f )(−2, −1) =
,
6 12
−6 −12
e
6 12
−6 −12
H(f )(1, 2) =
,
H(f )(−1, −2) =
.
12 6
−12 −6
La matrice H(f )(2, 1) è definita positiva, quindi (2, 1) è un punto di minimo
relativo. La matrice H(f )(−2, −1) è definita negativa, quindi (−2, −1) è
un punto di massimo relativo. Le matrici H(f )(1, 2) e H(f )(−1, −2) sono
indefinite, quindi (1, 2) e (−1, −2) non sono né punti di massimo né punti
di minimo relativo (sono punti di sella).
Infine, per quanto riguarda gli estremi assoluti, si vede facilemente che
f non ammette né minimo né massimo assoluti, dato che si ha, ad esempio,
lim f (x, 0) = −∞,
x→−∞
e
lim f (x, 0) = +∞,
x→+∞
cioè dato che f assume, nel suo dominio di definizione, valori arbitrariamente piccoli e valori arbitrariamente grandi.
Svolgimento esercizio 20. Le derivate parziali della funzione f sono
∂f
∂f
∂f
= x + yz,
= xz + 1,
= xy − 1.
∂x
∂y
∂z
I punti critici si trovano risolvendo il sistema

∂f


= x + yz = 0


∂x


 ∂f
= xz + 1 = 0

∂y




∂f


= xy − 1 = 0.
∂z
Si trova un solo punto critico, di coordinate (1, 1, −1).
3. Soluzioni
211
La matrice Hessiana di f è


1 z y
H(f ) = z 0 x
y x 0
quindi si ha


1 −1 1
H(f )(0, 0) = −1 0 1 .
1
1 0
1 −1
=
La catena dei minori principali è data da ∆1 = 1 > 0, ∆2 = −1 0 −1 < 0, ∆3 = det H(f )(0, 0) = −3 < 0. Da ciò si deduce che la matrice
H(f )(0, 0) è indefinita, e quindi il punto (0, 0) non è né un punto di massimo
né un punto di minimo relativo.
Svolgimento esercizio 21. Le derivate parziali della funzione f sono
∂f
= 3x2 + y 2 − 4x,
∂x
∂f
= 2xy.
∂y
I punti critici si trovano risolvendo il sistema

∂f


= 3x2 + y 2 − 4x = 0

∂x
∂f


= 2xy = 0.

∂y
Si trovano due punti critici, di coordinate (0, 0) e (4/3, 0), rispettivamente.
La matrice Hessiana di f è
6x − 4 2y
H(f ) =
2y
2x
quindi si ha
e
−4 0
H(f )(0, 0) =
0 0
4 0
H(f )(4/3, 0) =
.
0 8/3
La matrice H(f )(4/3, 0) è definita positiva, quindi il punto (4/3, 0) è un
punto di minimo relativo per la funzione f . La matrice H(f )(0, 0) invece è
semidefinita negativa, quindi siamo in presenza di un caso dubbio: in questo
modo non possiamo affermare nulla sulla natura del punto critico (0, 0).
Procediamo in un altro modo. Osserviamo che f (0, 0) = 0, quindi cerchiamo di scoprire se, in un intorno di (0, 0) la funzione f assume valori
212
11. Calcolo Differenziale in più Variabili
+
−1
y
−
–1
+
−
−
−
−
−
−
−
–1
−
1
−
+
x
2
3
−
+
Figura 1. Studio del segno di f (x, y).
positivi o negativi. In altre parole, cerchiamo di risolvere la disequazione
f (x, y) > 0. A tal scopo osserviamo che
f (x, y) = x(x2 + y 2 − 2x)
è il prodotto di due polinomi, quindi per risolvere la disequazione f (x, y) > 0
è sufficiente studiare il segno dei polinomi x e x2 + y 2 − 2x.
L’equazione x2 + y 2 − 2x = 0 rappresenta un cerchio di raggio 1 centrato
nel punto (1, 0). Si verifica facilmente che il polinomio x2 + y 2 − 2x assume
valori negativi nei punti interni al cerchio e valori positivi nei punti esterni.
Utilizzando la regola dei segni si deduce quindi che il segno di f (x, y) è
quello descritto in figura 1.
Si vede quindi che in ogni intorno dell’origine la funzione f assume sia
valori positivi, cioè più grandi di f (0, 0), che valori negativi, cioè più piccoli
di f (0, 0). Da ciò si deduce che il punto critico (0, 0) non è né un punto di
minimo né un punto di massimo per f .
Svolgimento esercizio 22. Le derivate parziali della funzione f sono
∂f
= −2xy 2 + 12xy − 4x3 ,
∂x
∂f
= 12y 2 − 16y − 2x2 y + 6x2 .
∂y
Si ha effettivamente ∂f
(0, 0) = 0 e ∂f
(0, 0) = 0, quindi (0, 0) è proprio un
∂x
∂y
punto critico per f .
La matrice Hessiana di f è
−2y 2 + 12y − 12x2
−4xy + 12x
H(f ) =
−4xy + 12x
24y − 16 − 2x2
quindi si ha
H(f )(0, 0) =
0 0
.
0 −16
3. Soluzioni
213
2
−
+
−
–2
−
−y1
+
−
+
−
−
−
+
−
−
0
−
−
− x
−
2
Figura 2. Studio del segno di f (x, y).
Questa matrice è semidefinita negativa, quindi siamo in presenza di un caso
dubbio: in questo modo non possiamo affermare nulla sulla natura del punto
critico (0, 0).
Procediamo in un altro modo. Osserviamo che f (0, 0) = 0, quindi cerchiamo di scoprire se, in un intorno di (0, 0) la funzione f assume valori positivi o negativi. In altre parole, cerchiamo di risolvere la disequazione f (x, y) > 0. A tal scopo osserviamo che il polinomio f (x, y) =
4y 3 − 8y 2 − x2 y 2 + 6x2 y − x4 si scompone come segue:
f (x, y) = (x2 + y 2 − 2y)(4y − x2 ),
quindi per risolvere la disequazione f (x, y) > 0 è sufficiente studiare il segno
dei polinomi x2 + y 2 − 2y e 4y − x2 .
L’equazione x2 + y 2 − 2y = 0 rappresenta un cerchio di raggio 1 centrato
nel punto (0, 1). Si verifica facilmente che il polinomio x2 + y 2 − 2y assume
valori negativi nei punti interni al cerchio e valori positivi nei punti esterni.
L’equazione 4y − x2 = 0 rappresenta una parabola con il vertice nell’origine, avente come asse l’asse delle y e con la concavità rivolta verso l’alto. Si
verifica facilmente che il polinomio 4y − x2 assume valori negativi nei punti
del piano che si trovano “sotto” il grafico della parabola e valori positivi nei
punti del piano che si trovano “sopra” il grafico della parabola.
Utilizzando la regola dei segni si deduce che il segno di f (x, y) è quello
descritto in figura 2.
Si vede quindi che in ogni intorno dell’origine la funzione f assume sia
valori positivi, cioè più grandi di f (0, 0), che valori negativi, cioè più piccoli
di f (0, 0). Da ciò si deduce che il punto critico (0, 0) non è né un punto di
minimo né un punto di massimo per f .
Osservazione: Se consideriamo la restrizione della funzione f (x, y) all’asse
delle x, otteniamo la funzione f (x, 0) = −x4 , la quale ha evidentemente un
massimo relativo (e anche assoluto) nel punto (0, 0). Analogamente, se
consideriamo la restrizione della funzione f (x, y) all’asse delle y, si ottiene
la funzione F (y) = f (0, y) = 4y 3 − 8y 2 . La derivata seconda di questa
funzione è F 00 (y) = 24y − 16, quindi F 00 (0) = −16 < 0, da cui si deduce che
anche la restrizione di f all’asse delle y ha un massimo relativo nel punto
214
11. Calcolo Differenziale in più Variabili
(0, 0). Per terminare, consideriamo la restrizione di f (x, y) a una qualunque
retta di equazione y = mx, con m 6= 0. Si ottiene la funzione
G(x) = f (x, mx) = −(m2 + 1)x4 + (4m3 + 6m)x3 − 8m2 x2 .
La derivata seconda di questa funzione è
G00 (x) = −12(m2 + 1)x2 + 6(4m3 + 6m)x − 16m2 ,
quindi G00 (0) = −16m2 < 0, da cui si deduce che anche la restrizione di f a
una qualunque retta di equazione y = mx ha un massimo relativo nel punto
(0, 0).
In conclusione, abbiamo visto che la funzione f (x, y) non ha nell’origine
né un massimo né un minimo relativo, tuttavia la sua restrizione a una
qualsiasi retta passante per l’origine ammette sempre un massimo relativo
nell’origine. Questo fatto quindi non è sufficiente per affermare che il punto
(0, 0) è un punto di massimo relativo per una funzione f .
Svolgimento esercizio 23. Le derivate parziali della funzione f sono
∂f
= 12x3 − 8xy,
∂x
∂f
= −4x2 + 2y.
∂y
I punti critici si trovano risolvendo il sistema

∂f


= 12x3 − 8xy = 0

∂x
∂f


= −4x2 + 2y = 0.

∂y
L’unica soluzione di questo sistema è il punto di coordinate (0, 0).
La matrice Hessiana di f è
36x2 − 8y −8x
H(f ) =
−8x
2
e si ha pertanto
0 0
H(f )(0, 0) =
.
0 2
Questa matrice è semidefinita positiva, quindi siamo in presenza di un caso
dubbio: in questo modo non possiamo affermare nulla sulla natura del punto
critico (0, 0).
Procediamo in un altro modo. Osserviamo che f (0, 0) = 0, quindi cerchiamo di scoprire se, in un intorno di (0, 0) la funzione f assume valori
positivi o negativi. In altre parole, cerchiamo di risolvere la disequazione
f (x, y) > 0. A tal scopo osserviamo che il polinomio f (x, y) = 3x4 −4x2 y+y 2
si scompone come segue:
f (x, y) = (y − x2 )(y − 3x2 ),
3. Soluzioni
215
4
−
−
+
+
+
−
−
− + + −
+
+
–2
+
y2
+
+
0
x
2
Figura 3. Studio del segno di f (x, y).
quindi per risolvere la disequazione f (x, y) > 0 è sufficiente studiare il segno
dei polinomi y − x2 e y − 3x2 .
L’equazione y − x2 = 0 rappresenta una parabola con il vertice nell’origine, avente come asse l’asse delle y e con la concavità rivolta verso l’alto. Si
verifica facilmente che il polinomio y − x2 assume valori negativi nei punti
del piano che si trovano “sotto” il grafico della parabola e valori positivi nei
punti del piano che si trovano “sopra” il grafico della parabola.
In modo del tutto analogo, l’equazione y − 3x2 = 0 rappresenta una
parabola con il vertice nell’origine, avente come asse l’asse delle y e con la
concavità rivolta verso l’alto. Si verifica facilmente che il polinomio y − 3x2
assume valori negativi nei punti del piano che si trovano “sotto” il grafico
della parabola e valori positivi nei punti del piano che si trovano “sopra” il
grafico della parabola.
Utilizzando la regola dei segni si deduce che il segno di f (x, y) è quello
descritto in figura 3.
Si vede quindi che in ogni intorno dell’origine la funzione f assume sia
valori positivi, cioè più grandi di f (0, 0), che valori negativi, cioè più piccoli
di f (0, 0). Da ciò si deduce che il punto critico (0, 0) non è né un punto di
minimo né un punto di massimo per f .
Osservazione: Se consideriamo la restrizione della funzione f (x, y) all’asse
delle x, otteniamo la funzione f (x, 0) = 3x4 , la quale ha evidentemente
un minimo relativo (e anche assoluto) nel punto (0, 0). Analogamente, se
consideriamo la restrizione della funzione f (x, y) all’asse delle y, si ottiene la
funzione f (0, y) = y 2 . Anche questa funzione ha evidentemente un minimo
relativo (e anche assoluto) nel punto (0, 0). Per terminare, consideriamo
la restrizione di f (x, y) a una qualunque retta di equazione y = mx, con
216
11. Calcolo Differenziale in più Variabili
m 6= 0. Si ottiene la funzione
F (x) = f (x, mx) = 3x4 − 4mx3 + m2 x2 .
La derivata seconda di questa funzione è
F 00 (x) = 36x2 − 24mx + 2m2 ,
quindi F 00 (0) = 2m2 > 0, da cui si deduce che anche la restrizione di f a
una qualunque retta di equazione y = mx ha un minimo relativo nel punto
(0, 0).
In conclusione abbiamo visto che la funzione f (x, y) pur non avendo nell’origine né un massimo né un minimo relativo, è tale che la sua restrizione
a una qualsiasi retta passante per l’origine ammette sempre un minimo
relativo nell’origine.
Svolgimento esercizio 24. Le derivate parziali della funzione f sono
∂f
= 4x3 − 2xy 2 ,
∂x
∂f
= 4y 3 − 2x2 y.
∂y
I punti critici si trovano risolvendo il sistema

∂f


= 4x3 − 2xy 2 = 0

∂x
∂f


= 4y 3 − 2x2 y = 0.

∂y
L’unica soluzione di questo sistema è il punto di coordinate (0, 0).
La matrice Hessiana di f è
12x2 − 2y 2
−4xy
H(f ) =
−4xy
12y 2 − 2x2
quindi si ha
0 0
H(f )(0, 0) =
.
0 0
Siamo dunque in presenza di un caso dubbio: in questo modo non possiamo
affermare nulla sulla natura del punto critico (0, 0).
Procediamo in un altro modo. Osserviamo che f (0, 0) = 0, quindi cerchiamo di scoprire se, in un intorno di (0, 0) la funzione f assume valori
positivi o negativi. In altre parole, cerchiamo di risolvere la disequazione
f (x, y) > 0. A tal scopo osserviamo che la funzione f (x, y) si può riscrivere
come segue:
f (x, y) = x4 + y 4 − x2 y 2 = (x2 − y 2 )2 + x2 y 2 .
In questo modo si vede che f (x, y) è la somma di due quadrati, e come tale
assume sempre valori ≥ 0.
3. Soluzioni
217
In conclusione si ha: f (x, y) ≥ 0, per ogni (x, y), e f (0, 0) = 0. Si
conclude quindi che il punto (0, 0) è un punto di minimo relativo, e anche
assoluto, per la funzione f .
Svolgimento esercizio 25. Le derivate parziali della funzione f sono
∂f
2
2
= 2xe−(x +y ) (1 − x2 − y 2 ),
∂x
∂f
2
2
= 2ye−(x +y ) (1 − x2 − y 2 ).
∂y
I punti critici si trovano risolvendo il sistema

∂f
2
2


= 2xe−(x +y ) (1 − x2 − y 2 ) = 0

∂x
∂f
2
2


= 2ye−(x +y ) (1 − x2 − y 2 ) = 0.

∂y
2
2
Dato che il fattore e−(x +y ) non si annulla mai, le soluzioni di questo sistema
sono date dal punto di coordinate (0, 0) e da tutti i punti che soddisfano
l’equazione x2 +y 2 = 1, cioè dai punti della circonferenza di raggio 1 centrata
nell’origine.
In questo caso non è necessario determinare le derivate parziali seconde
di f . Notiamo infatti che f (x, y) ≥ 0 per ogni (x, y), e che f (0, 0) = 0. Da
ciò segue che il punto (0, 0) è un punto di minimo relativo, e anche assoluto,
per f . Osserviamo inoltre che
lim f (x, y) = 0,
(x,y)→∞
da cui si deduce che f ammette massimo assoluto. In tutti i punti della
circonferenza di equazione x2 + y 2 = 1 la funzione assume sempre lo stesso
valore, pari a e−1 . Questi sono dunque punti di massimo relativo, e anche
assoluto, per f .
Osservazione: In alternativa si poteva studiare la funzione f (x, y) utilizzando le coordinate polari nel piano. Sostituendo x e y con le espressioni
x = ρ cos θ, y = ρ sin θ, la funzione f (x, y) si riscrive come segue:
2
f (ρ, θ) = ρ2 e−ρ .
Questa funzione dipende effettivamente solo dalla variabile ρ, quindi i suoi
massimi e minimi si trovano con il solito metodo usato per le funzioni di
una sola variabile.
3.7. Funzioni definite implicitamente
Svolgimento esercizio 26. Il teorema del Dini si può applicare nei punti
di Γ in cui il gradiente di f è diverso da zero. Calcoliamo quindi le derivate
218
11. Calcolo Differenziale in più Variabili
parziali di f . Si ha:
∂f
2ye−xy
= xy
,
∂x
e + e−xy
∂f
2xe−xy
= xy
.
∂y
e + e−xy
L’unico punto in cui si annullano entrambe le derivate parziali è il punto di
coordinate (0, 0), tuttavia si ha f (0, 0) = 1 − log(2) 6= 0, quindi il punto in
questione non appartiene alla curva Γ. Si conclude quindi che non ci sono
punti di Γ in cui si annulla il gradiente di f , e quindi si può applicare il
teorema del Dini in ogni punto di Γ.
Il teorema del Dini afferma poi che la curva Γ è rappresentabile come
grafico di una funzione y = y(x) nei punti in cui ∂f
6= 0. Dato che si ha
∂y
∂f
6= 0 per x 6= 0, si conclude che dall’equazione f (x, y) = 0 è possibile
∂y
ricavare y in funzione della variabile x solo nei punti in cui x 6= 0.
dy
Per calcolare la derivata dx
ricordiamo ancora il teorema del Dini, il
quale afferma che è
∂f
(x, y(x))
dy
∂x
(x) = − ∂f
dx
(x, y(x))
∂y
2y(x)e−xy(x)
exy(x) + e−xy(x)
·
exy(x) + e−xy(x)
2xe−xy(x)
y(x)
=−
.
x
=−
2
d y
Per calcolare la derivata seconda dx
2 basta ora derivare l’espressione appena
trovata:
d2 y
d
y(x)
(x) =
−
dx2
dx
x
0
xy (x) − y(x)
=−
x2
2y(x)
=
.
x2
Osserviamo infine che l’equazione f (x, y) = 0 è sufficientemente semplice
da permetterci di ricavare esplicitamente y in funzione di x. Si ha infatti:
f (x, y) = 0 ⇔ 1 + xy = log(exy + e−xy ) ⇔ e1+xy = exy + e−xy .
Moltiplicando ambo i membri per e−xy si ottiene
e = 1 + e−2xy ,
da cui si ricava
−2xy = log(e − 1)
e quindi
y=−
log(e − 1)
,
2x
3. Soluzioni
219
ovviamente con la condizione x 6= 0 (che è esattamente la condizione trovata
utilizzando il teorema del Dini).
A questo punto, nota l’espressione di y in funzione di x, è facile calcolare
dy
d2 y
direttamente le derivate dx
e dx
2 e verificare quindi l’esattezza dei risultati
trovati in precedenza utilizzando il teorema del Dini.
Svolgimento esercizio 27. Si ha f (0, 0) = 0 e f (1, 0) = 0, quindi i punti
(0, 0) e (1, 0) appartengono alla curva Γ. Calcoliamo ora le derivate parziali
di f . Si ha:
∂f
∂f
= −ey + 2x cos y,
= cos y − xey − x2 sin y.
∂x
∂y
Dato che ∂f
(0, 0) = 1 6= 0, in base al teorema del Dini, la curva Γ è
∂y
rappresentabile come grafico di una funzione y = y(x) in un intorno del
punto (0, 0). Inoltre si ha:
0
y (0) =
∂f
(0, 0)
∂x
− ∂f
(0, 0)
∂y
= 1.
Per quanto riguarda il punto (1, 0), si ha ∂f
(1, 0) = 0, quindi, in un intorno
∂y
di tale punto, non è possibile esprimere Γ come grafico di una funzione della
variabile x.
Per calcolare la derivata seconda y 00 (0) possiamo procedere come segue.
Iniziamo derivando rispetto a x l’espressione f (x, y(x)) = 0. Si trova:
y 0 cos y − ey − xy 0 ey + 2x cos y − x2 y 0 sin y = 0.
Derivando ancora rispetto a x l’espressione appena trovata si ottiene:
− (y 0 )2 sin y + y 00 cos y − 2y 0 ey − x(y 0 )2 ey − xy 00 ey
+ 2 cos y − 4xy 0 sin y − x2 (y 0 )2 cos y − x2 y 00 sin y = 0.
Valutando questa espressione nel punto (0, 0) e ricordando che y 0 (0) = 0, si
trova
y 00 (0) = 0.
Osservazione: Osserviamo che l’equazione f (x, y) = 0 è sufficientemente
semplice da permetterci di ricavare esplicitamente x in funzione di y. Si
tratta infatti di una equazione di secondo grado nella variabile x (dipendente
da un parametro y)
x2 cos y − xey + sin y = 0,
da cui si ottiene
p
ey ± e2y − 4 sin y cos y
.
x=
2 cos y
Il grafico di queste due funzioni è rappresentato in figura 4. Osservando la
figura si vede chiaramente che la retta tangente alla curva Γ nel punto di
coordinate (1, 0) è verticale (è questo il significato geometrico del fatto che
220
11. Calcolo Differenziale in più Variabili
1
–1
0
1
2
Figura 4. Grafico di f (x, y) = 0.
∂f
(1, 0)
∂y
= 0). Questa è la ragione per cui, in un intorno del punto (1, 0),
non è possibile esprimere Γ come grafico di una funzione y = y(x).
Svolgimento esercizio 28. Supponiamo che, in un intorno del punto
(1, 1, 0), esistano delle funzioni y = y(x) e z = z(x) tali che valgano le
due identità
( 2
x + log(xy(x)) − x cos z(x) = 0
x2 − y(x)3 + z(x)2 + x2 z(x) = 0.
Derivando rispetto a x si ottiene:

0
 2x + y + xy − cos z + xz 0 sin z = 0
xy

0
2zz + 2x − 3y 2 y 0 + x2 z 0 + 2xz = 0.
Valutando queste espressioni nel punto (1, 1, 0) si trova:
(
2 + y 0 (1) = 0
2 − 3y 0 (1) + z 0 (1) = 0,
da cui si ricava infine
(
y 0 (1) = −2
z 0 (1) = −8.
Abbiamo quindi calcolato le derivate richieste, nell’ipotesi che esistano le
due funzioni y = y(x) e z = z(x) in un intorno del punto (1, 1, 0). Ma, in
base a una versione più sofisticata del teorema del Dini, l’esistenza delle due
derivate y 0 (1) e z 0 (1) è precisamente una condizione sufficiente a garantire
l’esistenza locale delle due funzioni y = y(x) e z = z(x).
Svolgimento esercizio 29. Si ha:
∂f
= 2xy − y 2 cos z + 2z cos y,
∂z
da cui si deduce che
∂f
(1, 1, 0) = 1 6= 0.
∂z
3. Soluzioni
221
In base a una versione più raffinata del teorema del Dini possiamo quindi
affermare che, in un intorno del punto (1, 1, 0), la superficie S è rappresentabile come grafico di una funzione z = z(x, y).
Deriviamo ora, rispetto a x e y, l’identità f (x, y, z(x, y)) = 0. Si ottiene:

∂z
∂z
∂z


− y 2 cos z
+ 2z cos y
=0
 3x2 − 2xy + 2yz + 2xy
∂x
∂x
∂x

 − x2 + 2xz + 2xy ∂z − 2y sin z − y 2 cos z ∂z + 2z cos y ∂z − z 2 sin y = 0.

∂y
∂y
∂y
Valutando queste espressioni nel punto (1, 1, 0) si trova:

∂z


(1, 1) = 0
1 +
∂x
∂z


(1, 1) = 0,
 −1+
∂y
da cui si ricava

∂z


 (1, 1) = −1
∂x
∂z


 (1, 1) = 1.
∂y
3.8. Massimi e minimi vincolati
Svolgimento esercizio 30. Osserviamo innanzi tutto che la funzione f è
continua e l’insieme A è chiuso e limitato. In base al teorema di Weierstrass
siano quindi certi che la funzione f ammette massimo e minimo assoluti in
A.
Per determinare i punti critici di f , vincolati a stare nell’insieme A, utilizziamo il metodo dei moltiplicatori di Lagrange. Construiamo la funzione
Lagrangiana:
L(x, y, λ) = xy + λ(x2 + xy + y 2 − 1).
I punti critici di L si trovano risolvendo il sistema

∂L


= y + 2λx + λy = 0


∂x


 ∂L
= x + λx + 2λy = 0

∂y




∂L


= x2 + xy + y 2 − 1 = 0.
∂λ
Le soluzioni di questo sistema forniscono i seguenti quattro punti critici:
√
√
√
√
(1, −1), (−1, 1), ( 3/3, 3/3), (− 3/3, − 3/3).
Si noti che f (x, y) = f (−x, −y), quindi se un punto (x0 , y0 ) è un punto
critico di f , lo stesso vale per il punto (−x0 , −y0 ).
222
11. Calcolo Differenziale in più Variabili
Valutando la funzione f nei quattro punti trovati, si ha:
√
√
√
√
f (1, −1) = f (−1, 1) = −1, f ( 3/3, 3/3) = f (− 3/3, − 3/3) = 1/3.
Osservando questi valori, e ricordando che, in base al teorema di Weierstrass, la funzione f ammette sicuramente massimo e minimo assoluti in
A, possiamo concludere che i√punti√(1, −1) e√(−1, 1) √
sono i punti di minimo assoluto, mentre i punti ( 3/3, 3/3) e ( 3/3, − 3/3) sono i punti di
massimo assoluto per f nell’insieme A.
Svolgimento esercizio 31. Osserviamo innanzi tutto che la funzione f è
continua e l’insieme A è chiuso e limitato. In base al teorema di Weierstrass
siano quindi certi che la funzione f ammette massimo e minimo assoluti in
A.
L’insieme A è costituito dai punti interni al cerchio di raggio 4 centrato
nell’origine (punti che soddisfano la disequazione x2 + y 2 < 16) e anche dai
punti che si trovano sulla circonferenza (punti che soddisfano l’equazione
x2 + y 2 = 16). Il problema della determinazione degli estremi assoluti di
f in A si scompone quindi in due sottoproblemi: (1) la determinazione
dei massimi e minimi liberi di f che siano contenuti all’interno del cerchio
A; (2) la determinazione dei massimi e minimi di f vincolati a stare sulla
circonferenza di equazione x2 + y 2 = 16.
Iniziamo dal primo problema; la ricerca dei massimi e minimi liberi di
f.
Le derivate parziali della funzione f sono
x(y − 2) −√x2 +y2
∂f
= −p
e
,
∂x
x2 + y 2
∂f
y(y − 2) −√x2 +y2
= 1− p
e
.
∂y
x2 + y 2
Notiamo che le derivate parziali non esistono nel punto di coordinate (0, 0):
la funzione f non è derivabile nell’origine, quindi questo punto dovrà essere
studiato separatamente.
I punti critici di f si trovano risolvendo il sistema

∂f
x(y − 2) −√x2 +y2


p
=
−
e
=0

 ∂x
x2 + y 2

∂f
y(y − 2) −√x2 +y2


= 1− p
e
= 0.

∂y
x2 + y 2
L’unica soluzione di questo sistema è il punto di coordinate (0, 3) (attenzione: risolvendo il sistema si trovano altre soluzioni, che non sono però
accettabili). Effettivamente il punto trovato è interno al cerchio A, quindi
la funzione f ha un solo punto critico all’interno dell’insieme A.
3. Soluzioni
223
Notiamo a questo punto come non sia necessario procedere allo studio
delle derivate parziali seconde per determinare la natura del punto critico
(0, 3). Infatti l’esercizio richiede di determinare i massimi e minimi assoluti
di f e non quelli relativi. Per fare ciò basta calcolare il valore di f nei
punti “interessanti” (punti critici, punti di non-derivabilità, etc.) e prendere
rispettivamente il più grande e il più piccolo tra i valori trovati.
Nel nostro caso si ha: f (0, 3) = e−3 e f (0, 0) = −2 (ricordiamo che (0, 0)
non è un punto critico di f , ma va considerato ugualmente perché f non è
derivabile in (0, 0)).
Passiamo ora al secondo problema: la ricerca dei massimi e minimi di f
vincolati a stare sulla circonferenza di equazione x2 + y 2 = 16.
Dato che tale circonferenza si può parametrizzare come segue
[0, 2π] 3 θ 7→ (4 cos θ, 4 sin θ),
la ricerca dei punti critici di f su questa circonferenza equivale alla ricerca
dei punti critici della funzione
F (θ) = f (4 cos θ, 4 sin θ) = (4 sin θ − 2)e−4 ,
per θ ∈ [0, 2π].
Si ha:
F 0 (θ) = 4e−4 cos θ = 0,
per θ = π/2 e θ = 3π/2. La funzione F (θ) ha dunque due punti critici
nell’intervallo [0, 2π], tuttavia bisogna considerare separatamente anche i
punti corrispondenti ai valori estremi θ = 0 e θ = 2π, perché in tali punti
la funzione F (θ) non è derivabile (questi punti sono i due estremi di un
intervallo chiuso). Si ottengono quindi i seguenti tre punti in cui bisogna
valutare la funzione f : (4, 0) (per θ = 0 e θ = 2π), (0, 4) (per θ = π/2) e
(0, −4) (per θ = 3π/2). I valori di f sono: f (4, 0) = −2e−4 , f (0, 4) = 2e−4
e f (0, −4) = −6e−4 .
Analizzando i valori di f nei cinque punti “interessanti” precedentemente
trovati, si vede subito che f (0, 0) = −2 è il più piccolo, mentre f (0, 3) = e−3
è il più grande. Si conclude quindi che f ha un minimo assoluto nel punto
(0, 0) e un massimo assoluto nel punto (0, 3).
Svolgimento esercizio 32. Iniziamo osservando che, per i punti dell’insieme A, è sempre z 6= −1, quindi la funzione f è definita in tutto l’insieme
A (in realtà f è definita addirittura in un aperto contenente l’insieme A).
L’insieme A è definito dal seguente sistema di equazioni
(
x2 + y 2 = 4(1 + z)2
x + 2z = 2.
Ricavando z dalla seconda equazione e sostituendo nella prima, si ottiene
y 2 = 16 − 8x
224
11. Calcolo Differenziale in più Variabili
1 2
da cui si ricava x = 2 − 18 y 2 , e quindi z = 16
y . Si vede cosı̀ che è possibile
ottenere una parametrizzazione globale dell’insieme A:
1 2
1 2
y 7→ (x(y), y, z(y)) = 2 − y , y, y .
8
16
Componendo la funzione
x
z+1
con questa parametrizzazione, si ottiene la funzione
f (x, y, z) =
32 − 2y 2
.
16 + y 2
Gli estremi (liberi) della funzione h(y) rappresentano quindi gli estremi
(vincolati) della funzione f (x, y, z) nell’insieme A.
Derivando si ottiene:
128y
h0 (y) = −
(16 + y 2 )2
che si annulla solo per y = 0. Da ciò si ricava che x = 2 e z = 0. La
funzione f ha quindi un solo punto critico nell’insieme A, di coordinate
(2, 0, 0). Studiando ora il segno di h0 (y), si scopre che la funzione h(y) è
crescente per y < 0 e decrescente per y > 0. Il punto y = 0 è quindi
un punto di massimo relativo, e anche assoluto, per la funzione h(y). Di
conseguenza il punto di coordinate (2, 0, 0) è di massimo relativo, e anche
assoluto, per la funzione f nell’insieme A.
Infine notiamo che si ha
h(y) = f (x(y), y, z(y)) =
lim h(y) = −2.
y→±∞
La funzione h(y) presenta quindi un asintoto orizzontale, per y → ±∞. Da
ciò si deduce che la funzione h(y) (e quindi anche la funzione f nell’insieme
A) non ammette un minimo assoluto, anche se ammette un estremo inferiore
pari a −2.
Svolgimento esercizio 33. Iniziamo descrivendo l’insieme X. L’equazione
4
4x2 + y 2 = 1
3
rappresenta un’ellisse con centro nell’origine e i cui assi coincidono con gli
assi cartesiani. L’ellisse
interseca gli assi nei quattro punti di coordinate
√
(±1/2, 0) e (0, ± 3/2). La disequazione
4
4x2 + y 2 ≤ 1
3
rappresenta quindi la
parte
di
piano
interna all’ellisse.
√
√
La disequazione 3x − y ≥ 0 equivale a y ≤ 3x ed è quindi
soddisfatta
√
dai punti che si trovano “sotto” la retta di equazione y = 3x.
3. Soluzioni
225
D
B
A
C
Figura 5. L’insieme X.
√
√
√
La retta
y
=
3x
interseca
l’ellisse
nei
due
punti
A
=
(−
2/4,
−
6/4)
√
√
e B = ( 2/4, 6/4). Si conclude quindi che l’insieme X è costituito dalla regione interna alla semi-ellisse che giace “sotto” il segmento AB. La
situazione è rappresentata in figura 5.
Per determinare i massimi e i minimi della funzione f (x, y) = x + y
nell’insieme X utilizzeremo il metodo delle curve di livello. Le curve di
livello della funzione f sono date dall’equazione
f (x, y) = x + y = c,
con c costante. Si tratta quindi di un fascio di rette parallele alla bisettrice
del secondo e quarto quadrante.
Cerchiamo le due rette del fascio che sono tangenti all’ellisse. Dal sistema

x + y = c
4
 4x2 + y 2 = 1
3
si ottiene l’equazione
16x2 − 8cx + 4c2 − 3 = 0.
La condizione di tangenza richiede che sia nullo il discriminante di tale
equazione. I valori di c che annullano il discriminante sono c = ±1. Le due
rette tangenti cercate sono quindi le rette di equazione x+y = −1 e x+y = 1
rispettivamente. Tali rette intersecano l’ellisse nei punti C = (−1/4, −3/4)
e D = (1/4, 3/4) rispettivamente. Ma, dalla descrizione dell’insieme X, si
vede facilmente che il punto D non appartiene all’insieme X (si veda la
226
11. Calcolo Differenziale in più Variabili
figura 5). Si conclude quindi che il punto C = (−1/4, −3/4) è il punto di
minimo assoluto della funzione f (e f (C) = f (−1/4, −3/4) = −1 è il valore
minimo
√ assunto
√ da f ), mentre il massimo assoluto viene raggiunto nel punto
B = ( 2/4, 6/4), e non nel punto D dato che quest’ultimo √
non appartiene
√
all’insieme
X.
Il
valore
massimo
di
f
è
dato
da
f
(B)
=
f
(
2/4,
6/4) =
√
√
( 2 + 6)/4.
Svolgimento esercizio 34. Per risolvere questo esercizio utilizzeremo il
metodo dei moltiplicatori di Lagrange. Ricordiamo, innanzi tutto, che tale
metodo si può applicare solo nei punti non-singolari dell’insieme X. Iniziamo quindi cercando gli eventuali punti singolari di X, che dovranno essere
studiati a parte.
Poniamo g(x, y, z) = z 3 + 3x2 + y 2 + 2z 2 + 2z + 1. L’insieme X è definito
dall’equazione g(x, y, z) = 0 (da ciò deriva che X è un insieme chiuso, ma
non limitato. Il lettore lo verifichi per esercizio). I punti singolari di X sono
quelli in cui si annulla il gradiente di g. Si ha:

∂g


= 6x = 0


∂x


 ∂g
= 2y = 0

∂y




∂g


= 3z 2 + 4z + 2 = 0.
∂z
La terza equazione non ha soluzioni reali, quindi il gradiente di g non si
annulla mai e, di conseguenza, l’insieme X non ha punti singolari. Possiamo
quindi applicare senza problemi il metodo dei moltiplicatori di Lagrange.
La funzione Lagrangiana è
L(x, y, z, λ) = z + λ(z 3 + 3x2 + y 2 + 2z 2 + 2z + 1).
Determiniamone ora i punti critici:

∂L


= 6λx = 0


∂x




∂L


= 2λy = 0

∂y

∂L


= 1 + λ(3z 2 + 4z + 2) = 0


∂z





 ∂L = g(x, y, z) = 0.
∂λ
Se λ = 0 la terza equazione non ha soluzioni. Si deve quindi avere x = y = 0.
La quarta equazione diventa allora
z 3 + 2z 2 + 2z + 1 = 0.
3. Soluzioni
227
Questo polinomio si scompone come segue:
z 3 + 2z 2 + 2z + 1 = (z + 1)(z 2 + z + 1).
Dato che z 2 + z + 1 = 0 non ha soluzioni reali, si conclude che l’unica
soluzione è z = −1. Dalla terza equazione si ricava poi λ = −1, anche se
per i nostri scopi, questa informazione è inutile.
In conclusione, abbiamo visto che esiste un unico punto critico della Lagrangiana, il punto di coordinate (0, 0, −1). Si tratta ora di determinare la
natura di tale punto critico. Osserviamo che, in questo caso, non è possibile applicare il teorema di Weierstrass, in quanto l’insieme X, pur essendo
chiuso, non è limitato. Non è quindi garantita l’esistenza del massimo e
minimo assoluto per la funzione f (ciò è consistente col fatto che abbiamo
trovato un solo punto critico).
Notiamo ora che
∂g
(0, 0, −1) = 1 6= 0,
∂z
quindi, in base al teorema del Dini, in un intorno del punto (0, 0, −1) l’insieme X è rappresentabile come grafico di una funzione del tipo z = z(x, y).
In altre parole, dall’equazione g(x, y, z) = 0 è possibile ricavare, localmente
all’intorno del punto (0, 0, −1), z in funzione di x e y. È quindi possibile esprimere la funzione f (x, y, z) = z, localmente all’intorno del punto
(0, 0, −1), come funzione delle due sole variabili x e y. Poniamo allora
h(x, y) = f (x, y, z(x, y)) = z(x, y),
ove si intende che la funzione h(x, y) è definita solo in un qualche intorno
del punto di coordinate x = 0 e y = 0.
Calcoliamo ora le derivate parziali della funzione h. Derivando l’equazione g(x, y, z(x, y)) = 0 rispetto a x e a y rispettivamente, si ottiene:
(3z 2 + 4z + 2)
∂z
+ 6x = 0
∂x
(3z 2 + 4z + 2)
∂z
+ 2y = 0.
∂y
e
Valutando queste due espressioni nel punto (0, 0, −1) si trova
∂z
(0, 0, −1) = 0,
∂x
∂z
(0, 0, −1) = 0,
∂y
come deve essere, dato che sappiamo che (0, 0, −1) è un punto critico della
Lagrangiana, cioè un punto critico vincolato per la funzione f , e quindi deve
anche essere un punto critico per la funzione h(x, y) = z(x, y).
Per studiare la natura di tale punto critico basta ora determinare la
matrice Hessiana della funzione h(x, y). Derivando ulteriormente, rispetto
228
11. Calcolo Differenziale in più Variabili
a x e a y, le due equazioni precedenti, si ottiene:
∂z
∂2z
∂z ∂z
6z
+4
+ (3z 2 + 4z + 2) 2 + 6 = 0,
∂x
∂x ∂x
∂x
∂z
∂2z
∂z ∂z
6z
+4
+ (3z 2 + 4z + 2)
= 0,
∂y
∂y ∂x
∂x∂y
∂z ∂z
∂2z
∂z
6z
+4
+ (3z 2 + 4z + 2) 2 + 2 = 0,
∂y
∂y ∂y
∂y
e valutando queste tre espressioni nel punto (0, 0, −1) si ottiene
∂2z
∂2z
∂2z
(0,
0,
−1)
=
−6,
(0,
0,
−1)
=
0,
(0, 0, −1) = −2.
∂x2
∂x∂y
∂y 2
La matrice Hessiana, nel punto x = 0 e y = 0, della funzione h(x, y) è quindi
−6 0
H(h)(0, 0) =
.
0 −2
Questa matrice è definita negativa, quindi il punto critico (0, 0, −1) è un
punto di massimo relativo. Il corrispondente valore di f è f (0, 0, −1) = −1.
Per terminare, osserviamo che l’equazione g(x, y, z) = 0 è equivalente
all’equazione
3x2 + y 2 = −(z 3 + 2z 2 + 2z + 1).
Il termine di sinistra è evidentemente sempre ≥ 0, quindi questa equazione
ammette soluzioni se e solo se
z 3 + 2z 2 + 2z + 1 ≤ 0.
Il polinomio z 3 + 2z 2 + 2z + 1 si scompone come segue
z 3 + 2z 2 + 2z + 1 = (z + 1)(z 2 + z + 1),
e il fattore z 2 + z + 1 assume sempre valori positivi, dato che non ha radici
reali. Pertanto la disequazione precedente è equivalente a
z ≤ −1.
Questo dimostra che l’immagine della funzione f (x, y, z) = z, valutata nei
punti dell’insieme X, è
Im(f ) = f (X) =] − ∞, −1] ⊂ R.
Avendo determinato esplicitamente l’immagine di f , si può cosı̀ vedere che
−1 è il massimo assoluto (oltre che relativo) assunto dalla funzione f nell’insieme X. Non esiste invece il minimo assoluto (e nemmeno l’estremo
inferiore) di f . Ciò è compatibile con il fatto che, in questo caso, non è possibile applicare il teorema di Weierstrass (che garantirebbe l’esistenza sia
del massimo che del minimo assoluto) in quanto l’insieme X non è limitato.
Capitolo 12
Funzioni di più Variabili
a Valori Vettoriali
1. Richiami di teoria
1.1. Differenziabilità: la matrice Jacobiana
Una funzione di più variabili a valori vettoriali è una funzione che ha come
dominio un sottoinsieme di Rn e come codominio (un sottoinsieme di) Rm ,
per qualche n e m. Si tratta quindi di una funzione del tipo
f~ : A → Rm ,
~x = (x1 , . . . , xn ) 7→ f~(~x) = ~y = (y1 , . . . , ym ),
ove A ⊂ Rn . Dato che ciascuna delle m componenti del vettore ~y =
(y1 , . . . , ym ) risulta essere funzione delle variabili x1 , x2 , . . . , xn , possiamo
scrivere
yi = fi (x1 , x2 , . . . , xn ),
per i = 1, 2, . . . , m. Le m funzioni fi : A → R cosı̀ ottenute sono dette
le componenti della funzione f~ e si scriverà anche f~ = (f1 , f2 , . . . , fm ). In
questo modo una funzione f~ a valori vettoriali viene identificata con le m
funzioni a valori scalari f1 , f2 , . . . , fm .
Estendiamo ora alle funzioni a valori vettoriali il concetto di differenziabilità.
Definizione 1.1. Sia A un sottoinsieme aperto di Rn , f~ : A → Rm una
funzione, e ~x0 un punto di A. La funzione f~ è differenziabile nel punto ~x0
se lo sono tutte le sue funzioni componenti.
Pertanto, se f~ = (f1 , f2 , . . . , fm ), la funzione f~ è differenziabile in ~x0 se
e solo se valgono le seguenti relazioni:
fi (~x0 + ~h) − fi (~x0 ) =
n
X
∂fi
(~x0 ) hj + o(k~hk),
∂x
j
j=1
per ~h → 0 e per i = 1, 2, . . . , m (ove si è posto ~h = (h1 , h2 , . . . , hn )).
230
12. Funzioni di più Variabili a Valori Vettoriali
Se scriviamo in colonna i vettori


f1 (~x)
 f2 (~x) 

f~(~x) = 
 ...  ,

h1
h 
~h =  .2 
 .. 

hn
fm (~x)
e se introduciamo la matrice
 ∂f1
(~x)
∂x1
 ∂f2 (~x)
 ∂x1
Jf~(~x) = 

..
.
∂fm
(~x)
∂x1
∂f1
(~x)
∂x2
∂f2
(~x)
∂x2
···
···
...
..
.
∂fm
(~x) · · ·
∂x2

∂f1
(~x)
∂xn
∂f2
(~x) 

∂xn
.. 
. 
∂fm
(~x)
∂xn
il sistema composto dalle m equazioni precedenti si può riscrivere in forma
vettoriale come segue:
f~(~x0 + ~h) − f~(~x0 ) = J ~(~x0 ) · ~h + o(k~hk),
f
ove il prodotto Jf~(~x0 )·~h è il solito prodotto righe per colonne (di una matrice
per un vettore colonna).
Diamo ora la seguente definizione:
Definizione 1.2. La matrice
 ∂f1 ∂f1
∂f1 
· · · ∂x
∂x1
∂x2
n
 ∂f2 ∂f2 · · · ∂f2 

∂xn 
Jf~ =  ∂x. 1 ∂x. 2 .
.. 
..
..
 ..
. 
∂fm
∂x1
∂fm
∂x2
···
∂fm
∂xn
è detta la matrice jacobiana della funzione f~.
Definizione 1.3. Se la funzione f~ è differenziabile nel punto ~x0 ∈ A, il suo
differenziale in ~x0 è la seguente funzione lineare:
df~(~x0 ) : Rn → Rm , ~h 7→ J ~(~x0 ) · ~h.
f
Osservazione 1.4. Si noti che il differenziale di f~ in ~x0 è una funzione
lineare definita su tutto Rn , indipendentemente dal fatto che la funzione f~
sia definita solo su un sottoinsieme aperto A ⊂ Rn . Sappiamo poi che ogni
funzione lineare da Rn a Rm può essere rappresentata da una matrice con
m righe e n colonne. La definizione precedente afferma semplicemente che
la matrice jacobiana Jf~(~x0 ) è la matrice cha rappresenta (rispetto alle basi
canoniche) la funzione lineare chiamata differenziale di f~ in ~x0 .
Ricordiamo che l’esistenza di tutte le derivate parziali prime di una funzione in un punto non è sufficiente a garantire la differenziabilità della funzione stessa in tale punto. In altri termini, anche se esiste la matrice jacobiana Jf~(~x0 ) non è detto che la funzione f~ sia differenziabile in ~x0 . Una
1. Richiami di teoria
231
condizione sufficiente a garantire la differenziabilità di una funzione in un
punto è espressa dalla seguente proposizione:
Proposizione 1.5. Se tutti gli elementi della matrice jacobiana di f~, cioè
tutte le derivate parziali prime di tutte le funzioni componenti di f~, esistono
e sono continue in un intorno di un punto ~x0 ∈ A, allora la funzione f~ è
differenziabile in ~x0 . Quindi se tutti gli elementi della matrice jacobiana di
f~ esistono e sono continui in tutto l’insieme aperto A, allora la funzione f~
è differenziabile in tutto A.
Utilizzando le matrici jacobiane, la regola per la differenziazione delle
funzioni composte si può scrivere in un modo particolarmente semplice.
Siano f~ : Rn → Rm e ~g : Rm → Rk due funzioni e consideriamo la
funzione composta
~g ◦ f~ : Rn → Rk .
Teorema 1.6. Se f~ è differenziabile nel punto ~x0 ∈ Rn e ~g è differenziabile
nel punto ~y0 = f~(~x0 ) ∈ Rm , la funzione composta ~g ◦ f~ è differenziabile nel
punto ~x0 e la sua matrice jacobiana è data da
J~g◦f~(~x0 ) = J~g (f~(~x0 )) · Jf~(~x0 ),
ove il prodotto tra matrici J~g (f~(~x0 )) · Jf~(~x0 ) è il solito prodotto righe per
colonne.
Se poniamo ~y = f~(~x) e ~z = (~g ◦ f~)(~x) = ~g (f~(~x)), eseguendo il prodotto
tra matrici J~g (~y0 ) · Jf~(~x0 ), si ottiene la seguente formula, che fornisce una
regola esplicita per la derivazione delle funzioni composte :
m
X ∂zj
∂yl
∂zj
(~x0 ) =
(f~(~x0 ))
(~x0 ),
∂xi
∂yl
∂xi
l=1
per i = 1, . . . , n e j = 1, . . . , k.
1.2. Superficie
Vediamo ora alcuni esempi di funzioni di più variabili a valori vettoriali.
Ricordiamo che abbiamo definito il concetto di curva in Rn (in forma parametrica) come una funzione ~r : I → Rn , dove I è un intervallo di R.
Analogamente possiamo definire il concetto di superficie in Rn :
Definizione 1.7. Una superficie S (di classe C r ), in forma parametrica, in
Rn è una funzione di classe C r
~r : A → Rn ,
dove A è un sottoinsieme aperto di R2 . Scriveremo
~r(u, v) = x1 (u, v), x2 (u, v), . . . , xn (u, v) ,
232
12. Funzioni di più Variabili a Valori Vettoriali
S
∂~
r
∂v
∂~
r
∂u
Figura 1. Vettori tangenti alla superficie S.
dove le funzioni xi (u, v), per i = 1, . . . , n, sono le funzioni componenti della
funzione ~r(u, v).
Se la funzione ~r è almeno di classe C 1 , possiamo considerare le due
derivate parziali
∂~r
∂x1 ∂x2
∂xn
=
,
,...,
∂u
∂u ∂u
∂u
e
∂x1 ∂x2
∂~r
∂xn
=
,
,...,
.
∂v
∂v ∂v
∂v
∂~
r
Il vettore ∂u
è un vettore tangente alla curva ottenuta sulla superficie S
facendo variare solo la variabile u (e tenendo fisso il valore di v). Analoga∂~
r
mente, il vettore ∂v
è un vettore tangente alla curva ottenuta facendo variare
solo la variabile v (e tenendo fisso il valore di u). Si ottengono in questo
modo due vettori tangenti alla superficie S (si veda l’esempio in figura 1,
che rappresenta una superficie in R3 ). Se questi due vettori generano un
piano, questo deve essere il piano tangente alla superficie S (questo accade
se e solo se entrambi i vettori tangenti sono diversi da zero e se non sono
paralleli tra loro).
Consideriamo ora la matrice jacobiana di ~r:
 ∂x ∂x 
1
∂u
 ∂x2

J~r =  ∂u
.
 ..
∂xn
∂u
1
∂v
∂x2 
∂v 
..  .
. 
∂xn
∂v
Le colonne della matrice jacobiana sono precisamente i due vettori tangenti
∂~
r
∂~
r
e ∂v
. La condizione che questi due vettori generino un piano (cioè che
∂u
siano linearmente indipendenti) equivale quindi a richiedere che il rango
della matrice jacobiana sia pari a 2.
Si arriva cosı̀ alla seguente definizione di una superficie regolare (cioè
una superficie che ammette un piano tangente in ogni suo punto):
Definizione 1.8. Una superficie S in Rn , parametrizzata da una funzione
~r : A → Rn , è detta regolare se la funzione ~r è differenziabile in A ⊂ R2 e
se la matrice jacobiana di ~r ha rango massimo (cioè 2) in tutto l’insieme A.
1. Richiami di teoria
233
La precedente definizione è piuttosto restrittiva. Spesso accade infatti
che la matrice jacobiana di ~r abbia rango massimo in tutti i punti di A tranne
in qualche punto isolato. Si parla allora di punti singolari e di superficie
singolari:
Definizione 1.9. Una superficie S come sopra, tale che esistano dei punti
isolati di A in cui il rango della matrice jacobiana di ~r è minore di 2, è detta
singolare. I punti di A in cui il rango della matrice jacobiana di ~r non è
massimo sono detti punti singolari.
D’ora in poi ci occuperemo solo delle superficie in R3 di classe C r , con
r ≥ 1. Sia dunque S una superficie in R3 , parametrizzata da una funzione
di classe C r
~r : A → R3 .
∂~
r
∂~
r
Consideriamo i due vettori tangenti a S dati da ∂u
e ∂v
. Dato che stiamo
3
considerando vettori di R , è ben definito il loro prodotto vettoriale
∂~r ∂~r
∧
.
∂u ∂v
∂~
r
∂~
r
Il vettore ~n cosı̀ definito è un vettore ortogonale ai due vettori ∂u
e ∂v
tangenti alla superficie S, e quindi è un vettore ortogonale al piano tangente
∂~
r
a S, quando questo esiste. Si noti che ~n 6= 0 se e solo se i due vettori ∂u
e
∂~
r
sono linearmente indipendenti, cioè se e solo se la matrice jacobiana di
∂v
~r ha rango massimo. Si ottiene cosı̀ il seguente criterio per la regolarità di
una superficie in R3 :
Proposizione 1.10. Una superficie S in R3 , parametrizzata da
~n =
~r : A → R3 ,
è regolare se e solo se il vettore
∂~r ∂~r
∧
∂u ∂v
è diverso da zero in tutti i punti di A. Se S non è regolare, i punti di A in
cui si annulla il vettore ~n sono i punti singolari di S.
Il vettore normale ~n, oltre a fornire una condizione per la regolarità di
una superficie, risulta essere estremamente utile anche per la determinazione
del cosiddetto “elemento infinitesimo di area” su una superficie S.
Consideriamo il rettangolo “infinitesimo” dR, contenuto in A ⊂ R2 , di
vertici (u, v), (u + du, v), (u, v + dv) e (u + du, v + dv), e quindi di area pari
a du dv. Questo rettangolo viene trasformato dalla funzione ~r : A → R3
in un quadrilatero curvilineo dQ, anch’esso “infinitesimo”, di vertici ~r(u, v),
~r(u+du, v), ~r(u, v+dv) e ~r(u+du, v+dv) (si veda la figura 2). Considerando
lo sviluppo in serie di Taylor al primo ordine, si ha
~n =
~r(u + du, v) ≈ ~r(u, v) +
∂~r
du
∂u
234
12. Funzioni di più Variabili a Valori Vettoriali
~
r (u,v+dv)
A
~
r (u,v)
dQ
S
~
r (u+du,v+dv)
~r
~
r(u+du,v)
v
dv dR
du
u
Figura 2. Trasformazione dell’elemento infinitesimo di area.
e
~r(u, v + dv) ≈ ~r(u, v) +
∂~r
dv.
∂v
Si può cosı̀ concludere che, a meno di infinitesimi di ordine superiore al
primo, l’area del quadrilatero curvilineo dQ coincide con l’area del paralle∂~
r
∂~
r
logramma generato dai due vettori ∂u
du e ∂v
dv. Ma quest’ultima area è
pari alla norma del prodotto vettoriale dei due vettori che costituiscono i
lati di tale parallelogramma, quindi si ha:
∂~r
∂~r ∂~r ∂~
r
dS = Area(dQ) ≈ ∂u du ∧ ∂v dv = ∂u ∧ ∂v du dv = k~nk du dv.
Si scopre quindi che, nella trasformazione operata dalla funzione ~r, un rettangolo “infinitesimo” dR di area du dv viene trasformato in un quadrilatero curvilineo “infinitesimo” dQ la cui area è data da k~nk du dv (a meno
di infinitesimi di ordine superiore al primo). La norma del vettore normale
~n rappresenta quindi il fattore di scala per cui viene moltiplicata un’area
infinitesima tramite la trasformazione operata dalla funzione ~r.
Occupiamoci ora di due esempi particolarmente importanti di superficie.
1.2.1. Superficie grafico di una funzione di due variabili
Sia A un sottoinsieme aperto di R2 e sia f : A → R una funzione di classe
C r , con r ≥ 1. Indichiamo con S la superficie grafico della funzione f :
S = {(x, y, z) ∈ R3 | (x, y) ∈ A, z = f (x, y)}.
Cerchiamo ora una parametrizzazione di S. A tal fine introduciamo due
variabili u e v e poniamo x = u e y = v (stiamo semplicemente cambiando
i nomi delle variabili indipendenti). L’equazione z = f (x, y) diventa ora
z = f (u, v). Si ottiene in questo modo la seguente parametrizzazione della
1. Richiami di teoria
235
superficie S:


x = u
y=v

 z = f (u, v),
al variare di (u, v) ∈ A. In altre parole, la superficie S è parametrizzata
dalla funzione
~r : A → R3 ,
(u, v) 7→ ~r(u, v) = (u, v, f (u, v)).
I due vettori tangenti sono
∂~r
=
∂u
∂f
1, 0,
∂u
e
∂f
∂~r
= 0, 1,
∂v
∂v
e il vettore normale ~n è dato da
∂~r ∂~r
∂f
∂f
~n =
∧
= −
,− ,1 .
∂u ∂v
∂u ∂v
Notiamo che l’ultima componente di ~n è costante (pari a 1), quindi il vettore
~n non si annulla mai. Da ciò discende che la superficie S non ha punti
singolari.
Calcoliamo infine l’espressione che assume l’elemento infinitesimo di area:
s 2
2
∂f
∂f
dS = k~nk dudv =
+
+ 1 du dv.
∂u
∂v
1.2.2. Superficie di rotazione
Consideriamo ora una superficie S ottenuta dalla rotazione di una curva
γ attorno a una retta r. Per semplicità analizzeremo solo il caso in cui la
retta r (cioè l’asse di rotazione) coincide con l’asse z e la curva γ è contenuta
nel piano yz. Nella rotazione della curva γ attorno all’asse z, ogni punto
P = (0, yP , zP ) di γ descrive un cerchio CP contenuto nel piano di equazione
z = zP , centrato nel punto OP = (0, 0, zP ) e di raggio RP pari alla distanza
di P dall’asse z, cioè RP = |yP | (la situazione è descritta in figura 3). Questo
cerchio si può descrivere in forma parametrica come segue:


 x = yP cos θ
CP : y = yP sin θ
con 0 ≤ θ < 2π.

z =z
P
Al variare del punto P lungo la curva γ, l’insieme dei cerchi cosı̀ ottenuti
descrive la superficie di rotazione S.
236
12. Funzioni di più Variabili a Valori Vettoriali
S
z
γ
OP
P
CP
y
x
Figura 3. Una superficie di rotazione.
Se la curva γ è descritta in forma parametrica da una funzione del tipo
γ : [a, b] 3 t 7→ y(t), z(t) ,
sostituendo y(t) e z(t) al posto di yP e zP nel sistema precedente, si ottiene
l’espressione parametrica della superficie S:


 x = y(t) cos θ
S : y = y(t) sin θ
con a ≤ t ≤ b, 0 ≤ θ < 2π.

 z = z(t)
Riassumendo, possiamo affermare che la superficie S ottenuta dalla rotazione di una curva γ (contenuta nel piano yz) attorno all’asse z è parametrizzata dalla funzione
~r(t, θ) = y(t) cos θ, y(t) sin θ, z(t) ,
con a ≤ t ≤ b e 0 ≤ θ < 2π, ove si è indicata con (y(t), z(t)) la parametrizzazione di γ.
A questo punto possiamo determinare i vettori tangenti alla superficie
S:
∂~r
= y 0 (t) cos θ, y 0 (t) sin θ, z 0 (t) ,
∂t
∂~r
= − y(t) sin θ, y(t) cos θ, 0 ,
∂θ
e il vettore normale
∂~r ∂~r
~n =
∧
= − y(t)z 0 (t) cos θ, −y(t)z 0 (t) sin θ, y(t)y 0 (t) .
∂t ∂θ
Possiamo osservare che gli eventuali punti della superficie S con y = 0, cioè
gli eventuali punti di intersezione di S con l’asse di rotazione, sono punti
singolari (in essi si annulla il vettore ~n).
1. Richiami di teoria
237
Calcoliamo infine l’elemento infinitesimo di area:
p
dS = k~nk dt dθ = |y(t)| y 0 (t)2 + z 0 (t)2 dt dθ.
p
(Ricordiamo qui che l’espressione y 0 (t)2 + z 0 (t)2 dt non è altro che l’elemento infinitesimo di lunghezza sulla curva γ, detto anche lunghezza d’arco
elementare, o differenziale d’arco).
1.3. Trasformazioni di coordinate
Consideriamo in questa sezione un tipo particolare di funzioni a valori
vettoriali, note come trasformazioni di coordinate.
Definizione 1.11. Sia A un aperto di Rn . Una trasformazione regolare di
coordinate, definita in A, è una funzione di classe C 1
f~ : A → Rn
tale che la sua matrice jacobiana Jf~ abbia determinante diverso da zero in
ogni punto di A. Se invece il determinante di Jf~ si annulla in qualche punto
di A, la trasformazione di coordinate è detta singolare e i punti in cui questo
accade sono detti punti singolari della trasformazione di coordinate.
Una delle conseguenze più importanti del fatto che il determinante della matrice jacobiana di f~ sia diverso da zero è il seguente teorema di
invertibilità locale:
Teorema 1.12. Sia f~ : A → Rn una trasformazione di coordinate. Se
~x0 ∈ A è tale che det Jf~(~x0 ) 6= 0, allora esistono un intorno U di ~x0 in A
e un intorno V di f~(~x0 ) in Rn tali che la funzione indotta f~ : U → V sia
una biiezione. Esiste pertanto la funzione inversa f~−1 : V → U ed essa è
di classe C 1 . In particolare, se la trasformazione di coordinate f~ è regolare,
essa è localmente invertibile.
Osservazione 1.13. Osserviamo che il fatto che una funzione f : A → B
sia localmente invertibile, cioè che essa sia invertibile all’intorno di ogni
punto del suo dominio, non implica che essa sia globalmente invertibile,
cioè che esista la sua funzione inversa f −1 : B → A.
Il teorema precedente afferma quindi che se una trasformazione di coordinate
(y1 , y2 , . . . , yn ) = f~(x1 , x2 , . . . , xn )
è regolare, è possibile ricavare le variabili x1 , x2 , . . . , xn in funzione delle
variabili y1 , y2 , . . . , yn (cioè invertire la trasformazione di coordinate), localmente all’intorno di ogni punto. Ovviamente non c’è però nessuna ricetta
che permetta di scrivere esplicitamente la trasformazione inversa.
Studiamo ora come viene trasformato un elemento infinitesimo di volume
da una trasformazione regolare di coordinate.
238
12. Funzioni di più Variabili a Valori Vettoriali
dQ
f~
dP
dz
dx
dy
Figura 4. Trasformazione dell’elemento di volume.
Consideriamo un parallelepipedo n-dimensionale “infinitesimo” dP , contenuto in A ⊂ Rn , avente un vertice nel punto (x1 , x2 , . . . , xn ) e i lati paralleli
agli assi coordinati, di lunghezza dx1 , dx2 , . . . , dxn rispettivamente. Il volume n-dimensionale di questo parallelepipedo è quindi pari a dx1 dx2 · · · dxn .
Questo parallelepipedo n-dimensionale dP viene trasformato dalla funzione
f~ : A → Rn in un parallelepipedo curvilineo n-dimensionale dQ, anch’esso
“infinitesimo”, i cui vertici sono i trasformati tramite f~ dei vertici del parallelepipedo dP , cioè sono i punti f~(x1 , x2 , . . . , xn ), f~(x1 + dx1 , x2 , . . . , xn ),
f~(x1 , x2 + dx2 , . . . , xn ), etc. (si veda la figura 4, che rappresenta il caso tridimensionale). Considerando lo sviluppo in serie di Taylor al primo ordine,
si ha:
∂ f~
f~(x1 + dx1 , x2 , . . . , xn ) ≈ f~(x1 , x2 , . . . , xn ) +
dx1
∂x1
∂ f~
f~(x1 , x2 + dx2 , . . . , xn ) ≈ f~(x1 , x2 , . . . , xn ) +
dx2
∂x2
·········
∂ f~
f~(x1 , x2 , . . . , xn + dxn ) ≈ f~(x1 , x2 , . . . , xn ) +
dxn .
∂xn
Si può cosı̀ concludere che, a meno di infinitesimi di ordine superiore al
primo, il volume n-dimensionale del parallelepipedo curvilineo dQ coincide
con il volume n-dimensionale del parallelepipedo n-dimensionale generato
∂ f~
∂ f~
∂ f~
dx1 , ∂x
dx2 , . . . , ∂x
dxn . Ma quest’ultimo volume è pari al
dai vettori ∂x
n
1
2
valore assoluto del determinante della matrice che ha come colonne i vettori
2. Esercizi
∂ f~
∂x1
dx1 ,
∂ f~
∂x2
dx2 , . . . ,
239
∂ f~
∂xn
dxn . Si ha quindi:
 ∂f1
∂f1
dx1 ∂x
dx2 . . .
∂x1
2
 ∂f2 dx1 ∂f2 dx2 . . .

∂x2
Vol(dQ) ≈ det  ∂x1 .
..
..
 ..
.
.
∂fn
∂fn
dx1 ∂x2 dx2 . . .
∂x1
∂f1
∂xn
∂f2
∂xn

dxn dxn 

.. 
. 
∂fn
dxn ∂xn
= | det Jf~| dx1 dx2 · · · dxn .
Si scopre quindi che, nella trasformazione di coordinate operata dalla funzione f~, un parallelepipedo n-dimensionale “infinitesimo” dP di volume
n-dimensionale dx1 dx2 · · · dxn viene trasformato in un parallelepipedo curvilineo n-dimensionale “infinitesimo” dQ il cui volume n-dimensionale è
dato da | det Jf~| dx1 dx2 · · · dxn (a meno di infinitesimi di ordine superiore
al primo). Il valore assoluto del determinante della matrice jacobiana di f~
rappresenta quindi il fattore di scala per cui viene moltiplicato un volume
infinitesimo tramite la trasformazione di coordinate operata dalla funzione
f~.
2. Esercizi
2.1. Differenziabilità: la matrice Jacobiana
Esercizio 1. Sia f~ : R3 → R2 la funzione definita da
f~(x1 , x2 , x3 ) = (x1 + x2 cos(x23 ), 2x21 x2 x3 ).
Si scriva la matrice jacobiana di f~ e si dica se f~ è differenziabile in tutto il
suo dominio di definizione.
Esercizio 2. Sia f~ : R2 → R3 la funzione definita da
f~(x1 , x2 ) = (x1 log(1 + x22 ), −x2 sin(x1 ), x21 x2 ).
Si determini il differenziale della funzione f~ nel punto (π/2, 0). Si calcoli
poi df~(π/2, 0)(2, −1).
2.2. Superficie
Esercizio 3. Determinare il vettore normale ~n, i punti singolari e l’elemento
infinitesimo di area della sfera di raggio R parametrizzata da
(θ, φ) 7→ ~r(θ, φ) = (R sin φ cos θ, R sin φ sin θ, R cos φ),
per 0 ≤ θ < 2π e 0 ≤ φ ≤ π.
240
12. Funzioni di più Variabili a Valori Vettoriali
Esercizio 4. Determinare il vettore normale ~n, i punti singolari e l’elemento
infinitesimo di area del cono parametrizzato da
(t, θ) 7→ ~r(t, θ) = (t cos θ, t sin θ, t),
per t ∈ R e 0 ≤ θ < 2π.
Esercizio 5. Si scriva la matrice jacobiana, il vettore normale e l’elemento
infinitesimo di area della superficie grafico della funzione z = f (x, y) = x2 y 3 .
Esercizio 6. Nello spazio R3 sia γ la circonferenza di raggio r, contenuta
nel piano yz e centrata nel punto di coordinate (0, R, 0), con 0 < r < R. Sia
S la superficie generata dalla rotazione della curva γ attorno all’asse z (tale
superficie è detta toro). Si determini il vettore normale ~n, i punti singolari
e l’elemento infinitesimo di area di S.
Esercizio 7. Nello spazio R3 sia γ l’arco di parabola, contenuta nel piano
yz, di equazione z = y 2 − 2y + 1, con 0 ≤ y ≤ 3. Sia S la superficie
generata dalla rotazione della curva γ attorno all’asse z. Si determini il
vettore normale ~n, i punti singolari e l’elemento infinitesimo di area di S.
2.3. Trasformazioni di coordinate
Esercizio 8. (Coordinate polari) Si consideri la seguente trasformazione
di coordinate in R2 :
x = ρ cos θ
y = ρ sin θ,
definita per ρ ≥ 0 e 0 ≤ θ < 2π.
Si determinino i punti singolari di questa trasformazione di coordinate e
si esprima l’elemento infinitesimo di area dx dy nelle coordinate ρ e θ.
Esercizio 9. (Coordinate cilindriche) Si consideri la seguente trasformazione di coordinate in R3 :


 x = ρ cos θ
y = ρ sin θ

 z = z,
definita per ρ ≥ 0, 0 ≤ θ < 2π e ∀z.
Si determinino i punti singolari di questa trasformazione di coordinate e
si esprima l’elemento infinitesimo di volume dx dy dz nelle coordinate ρ, θ,
z.
Esercizio 10. (Coordinate sferiche) Si consideri la seguente trasformazione di coordinate in R3 :

 x = ρ sin φ cos θ

y = ρ sin φ sin θ

 z = ρ cos φ,
3. Soluzioni
241
definita per ρ ≥ 0, 0 ≤ φ ≤ π e 0 ≤ θ < 2π.
Si determinino i punti singolari di questa trasformazione di coordinate e
si esprima l’elemento infinitesimo di volume dx dy dz nelle coordinate ρ, φ,
θ.
Esercizio 11. Si consideri la seguente trasformazione di coordinate in R2 :
(
x = u3
√
y = v,
definita per u ≥ 0 e v ≥ 0.
Si determinino i punti singolari di questa trasformazione di coordinate e
si esprima l’elemento infinitesimo di area dx dy nelle coordinate u, v.
3. Soluzioni
3.1. Differenziabilità: la matrice Jacobiana
Svolgimento esercizio 1. Le funzioni componenti di f~ sono f1 (x1 , x2 , x3 ) =
x1 +x2 cos(x23 ) e f2 (x1 , x2 , x3 ) = 2x21 x2 x3 . La matrice jacobiana di f~ è quindi
!
∂f1
∂x1
∂f2
∂x1
Jf~ =
=
∂f1
∂x2
∂f2
∂x2
∂f1
∂x3
∂f2
∂x3
1
cos(x23 ) −2x2 x3 sin(x23 )
.
4x1 x2 x3 2x21 x3
2x21 x2
Il dominio di definizione di f~ è R3 . Dato che tutti gli elementi della matrice
jacobiana sono funzioni definite e continue in R3 , possiamo concludere che
la funzione f~ è differenziabile in tutto il suo dominio di definizione.
Svolgimento esercizio 2. Scriviamo innanzi tutto la matrice jacobiana di
f~:

2x1 x2 
log(1 + x22 )
1+x22
Jf~ =  −x2 cos x1 − sin x1  ,
2x1 x2
x21
da cui segue che


0
0
Jf~(π/2, 0) = 0 −1  .
0 π 2 /4
Il differenziale della funzione f~ nel punto (π/2, 0) è la funzione lineare
df~(π/2, 0) : R2 → R3
242
12. Funzioni di più Variabili a Valori Vettoriali
la cui matrice (rispetto alle basi canoniche) è la matrice Jf~(π/2, 0). Si ha
quindi:




0
0
0
h
df~(π/2, 0)(h1 , h2 ) = 0 −1  1 =  −h2  .
h2
0 π 2 /4
π 2 h2 /4
Da ciò si deduce subito che
df~(π/2, 0)(2, −1) = (0, 1, −π 2 /4).
3.2. Superficie
Svolgimento esercizio 3. Determiniamo i due vettori tangenti:
∂~r
= (−R sin φ sin θ, R sin φ cos θ, 0),
∂θ
∂~r
~v2 =
= (R cos φ cos θ, R cos φ sin θ, −R sin φ).
∂φ
~v1 =
Il vettore normale è quindi
~n = ~v1 ∧ ~v2
~k
~
ı
~

= −R sin φ sin θ R sin φ cos θ
0
R cos φ cos θ R cos φ sin θ −R sin φ
= (−R2 sin2 φ cos θ, −R2 sin2 φ sin θ, −R2 sin φ cos θ)
= −R sin φ(R sin φ cos θ, R sin φ sin θ, R cos φ)
= −R sin φ ~r(θ, φ).
I punti singolari sono quelli in cui si annulla il vettore ~n. Questo accade
se e solo se sin φ = 0, cioè per φ = 0 e per φ = π. I punti corrispondenti
sulla sfera sono i due punti N e S le cui coordinate sono date da N =
~r(θ, 0) = (0, 0, R) e S = ~r(θ, π) = (0, 0, −R), si tratta cioè dei due poli
Nord e Sud rispettivamente. Ovviamente, dal punto di vista geometrico,
non accade niente di speciale nei due poli Nord e Sud (una sfera è un oggetto
perfettamente simmetrico, tutti i suoi punti godono delle stesse proprietà),
è solo la parametrizzazione scelta che non è regolare in quei punti (infatti in
quei due punti si incontrano tutte le curve caratterizzate da θ = costante,
cioè tutti i meridiani). La situazione è descritta in figura 5.
Una volta determinato il vettore normale ~n, il calcolo dell’elemento
infinitesimo di area è banale. Si ha infatti:
dS = k~nk dθ dφ = R2 sin φ dθ dφ.
3. Soluzioni
243
N
Figura 5. La sfera parametrizzata.
Svolgimento esercizio 4. Determiniamo i due vettori tangenti:
∂~r
= (cos θ, sin θ, 1),
∂t
∂~r
~v2 =
= (−t sin θ, t cos θ, 0).
∂θ
~v1 =
Il vettore normale è
~n = ~v1 ∧ ~v2
~ı
~k ~

= cos θ
sin θ 1
−t sin θ t cos θ 0
= (−t cos θ, −t sin θ, t)
= t (− cos θ, − sin θ, 1).
I punti singolari sono quelli in cui si annulla il vettore ~n. Questo accade
se e solo se t = 0. Il punto corrispondente sul cono è il punto V le cui
coordinate sono date da V = ~r(0, θ) = (0, 0, 0); si tratta del vertice del
cono. In questo caso, a differenza di quanto visto per i poli Nord e Sud
della sfera, la singolarità presente nel vertice del cono non dipende dalla
parametrizzazione usata, ma si tratta di una proprietà intrinseca all’oggetto
geometrico cono. La situazione è descritta in figura 6.
Una volta determinato il vettore normale ~n il calcolo dell’elemento infinitesimo di area è banale. Si ha infatti:
√
dS = k~nk dt dθ = t 2 dt dθ.
Svolgimento esercizio 5. Sia S la superficie grafico della funzione z =
f (x, y) = x2 y 3 . La prima cosa da fare è determinare una parametrizzazione
di S. Il modo ovvio di farlo è semplicemente quello di “cambiare i nomi delle
variabili indipendenti”: se poniamo x = u e y = v, l’equazione z = x2 y 3
diventa z = u2 v 3 . Si ottiene cosı̀ la seguente descrizione di S in forma
244
12. Funzioni di più Variabili a Valori Vettoriali
2
1
V
z0
–1
–2
–1
–2
–2
–1
0x
0
y
1
1
2 2
Figura 6. Il cono parametrizzato.
parametrica:


x = u
y=v

 z = u2 v 3 ,
al variare di (u, v) ∈ R2 . In altre parole, la superficie S è parametrizzata
dalla funzione
~r : R2 → R3 ,
(u, v) 7→ ~r(u, v) = (u, v, u2 v 3 ).
La matrice jacobiana è quindi

1
0
1 .
J~r =  0
3
2uv 3u2 v 2

I due vettori tangenti sono dati da
∂~r
= (1, 0, 2uv 3 ),
∂u
∂~r
= (0, 1, 3u2 v 2 )
∂v
e il vettore normale è
~n =
∂~r ∂~r
∧
= (−2uv 3 , −3u2 v 2 , 1).
∂u ∂v
Si noti come, in questo caso, il vettore normale ~n non si annulli mai (l’ultima
componente è costante e uguale a 1), quindi non ci sono punti singolari sulla
superficie S.
Infine, l’elemento infinitesimo di area sulla superficie S è dato da
√
dS = k~nk du dv = 4u2 v 6 + 9u4 v 4 + 1 du dv.
3. Soluzioni
245
1
–4
z0
–1
–2
–4
0x
–2
0
y
2
2
4 4
Figura 7. Il toro.
Svolgimento esercizio 6. La circonferenza γ è parametrizzata da
y(t) = R + r cos t
z(t) = r sin t,
con 0 ≤ t < 2π. Da ciò segue che una parametrizzazione della superficie S
è data da:


 x = y(t) cos θ = (R + r cos t) cos θ
y = y(t) sin θ = (R + r cos t) sin θ

 z = z(t) = r sin t,
cioè S è parametrizzata dalla funzione
~r(t, θ) = (R + r cos t) cos θ, (R + r cos t) sin θ, r sin t ,
con 0 ≤ t < 2π e 0 ≤ θ < 2π. La superficie di rotazione S (detta toro) è
rappresentata in figura 7.
I due vettori tangenti sono quindi
∂~r
= (−r sin t cos θ, −r sin t sin θ, r cos t),
∂t
∂~r
= − (R + r cos t) sin θ, (R + r cos t) cos θ, 0 ,
∂θ
e il vettore normale è
∂~r ∂~r
~n =
∧
= −r(R + r cos t)(cos t cos θ, cos t sin θ, sin t).
∂t ∂θ
Si verifica facilmente che il vettore normale ~n non si annulla mai, quindi
non ci sono punti singolari sulla superficie S.
Infine, l’elemento infinitesimo di area su S è dato da
dS = k~nk dt dθ = r(R + r cos t) dt dθ.
Svolgimento esercizio 7. L’arco di parabola γ è parametrizzato da
(
y(t) = t
z(t) = t2 − 2t + 1,
246
12. Funzioni di più Variabili a Valori Vettoriali
4
z2
0
–3
–2
–1
–3
–2
–1
0x
0
y
1
1
2
2
3
3
Figura 8. La superficie di rotazione S.
con 0 ≤ t ≤ 3. Da ciò segue che una parametrizzazione della superficie S è
data da:


 x = y(t) cos θ = t cos θ
y = y(t) sin θ = t sin θ


z = z(t) = t2 − 2t + 1,
cioè S è parametrizzata dalla funzione
~r(t, θ) = (t cos θ, t sin θ, t2 − 2t + 1),
con 0 ≤ t ≤ 3 e 0 ≤ θ < 2π. La superficie di rotazione S è rappresentata in
figura 8.
I due vettori tangenti sono quindi
∂~r
= (cos θ, sin θ, 2t − 2),
∂t
∂~r
= (−t sin θ, t cos θ, 0),
∂θ
e il vettore normale è
~n =
∂~r ∂~r
∧
= t − (2t − 2) cos θ, −(2t − 2) sin θ, 1 .
∂t ∂θ
Il vettore ~n si annulla se e solo se t = 0, che corrisponde al punto di
coordinate (0, 0, 1). Questo è l’unico punto singolare della superficie S.
Infine, l’elemento infinitesimo di area su S è dato da
√
dS = k~nk dt dθ = t 4t2 − 8t + 5 dt dθ.
3. Soluzioni
247
3.3. Trasformazioni di coordinate
Svolgimento esercizio 8. (Coordinate polari) La trasformazione di
coordinate in questione è espressa dalla funzione
f~ : (ρ, θ) 7→ (ρ cos θ, ρ sin θ) = (x, y).
La matrice jacobiana di f~ è
Jf~ =
∂x
∂ρ
∂y
∂ρ
∂x
∂θ
∂y
∂θ
!
=
cos θ −ρ sin θ
.
sin θ ρ cos θ
Si ha
det Jf~ = ρ.
I punti singolari della trasformazione di coordinate sono quelli in cui si
annulla il determinante della matrice jacobiana. Esiste quindi un unico
punto singolare, dato da ρ = 0, e cioè da (x, y) = (0, 0). Si conclude
pertanto che l’origine è l’unico punto singolare per le coordinate polari nel
piano.
Per la trasformazione dell’elemento infinitesimo di area vale la seguente
formula:
dx dy = | det Jf~| dρ dθ = ρ dρ dθ.
Svolgimento esercizio 9. (Coordinate cilindriche) La trasformazione
di coordinate in questione è espressa dalla funzione
f~ : (ρ, θ, z) 7→ (ρ cos θ, ρ sin θ, z) = (x, y, z).
La matrice jacobiana di f~ è

Jf~ =
∂x
∂ρ
 ∂y
 ∂ρ
∂z
∂ρ
∂x
∂θ
∂y
∂θ
∂z
∂θ

∂x
∂z
∂y 
∂z 
∂z
∂z


cos θ −ρ sin θ 0
=  sin θ ρ cos θ 0 .
0
0
1
Si ha
det Jf~ = ρ.
I punti singolari della trasformazione di coordinate sono quelli in cui si
annulla il determinante della matrice jacobiana, cioè sono tutti i punti determinati dall’equazione ρ = 0. Si tratta di tutti i punti che stanno sull’asse
delle z. Si conclude pertanto che l’asse z è una retta di punti singolari per
le coordinate cilindriche nello spazio.
Per la trasformazione dell’elemento infinitesimo di volume vale la seguente formula:
dx dy dz = | det Jf~| dρ dθ dz = ρ dρ dθ dz.
248
12. Funzioni di più Variabili a Valori Vettoriali
Svolgimento esercizio 10. (Coordinate sferiche) La trasformazione di
coordinate in questione è espressa dalla funzione
f~ : (ρ, φ, θ) 7→ (ρ sin φ cos θ, ρ sin φ sin θ, ρ cos φ) = (x, y, z).
La matrice jacobiana di f~ è


sin φ cos θ ρ cos φ cos θ −ρ sin φ sin θ
Jf~ =  sin φ sin θ ρ cos φ sin θ ρ sin φ cos θ  .
cos φ
−ρ sin φ
0
Si ha
det Jf~ = ρ2 sin φ.
I punti singolari della trasformazione di coordinate sono quelli in cui si
annulla il determinante della matrice jacobiana, cioè sono i punti tali che
ρ = 0 oppure sin φ = 0. Si tratta dei punti che stanno sull’asse delle z. Si
conclude pertanto che l’asse z è una retta di punti singolari per le coordinate
sferiche nello spazio.
Per la trasformazione dell’elemento infinitesimo di volume vale la seguente formula:
dx dy dz = | det Jf~| dρ dφ dθ = ρ2 sin φ dρ dφ dθ.
Svolgimento esercizio 11. La trasformazione di coordinate in questione
è espressa dalla funzione
√
f~ : (u, v) 7→ (u3 , v) = (x, y),
con u ≥ 0 e v ≥ 0.
La matrice jacobiana di f~ è
Jf~ =
3u2
0
0
1
√
2 v
.
Si ha
3u2
det Jf~ = √ .
2 v
Per u = 0 (che corrisponde a x = 0) si annulla il determinante della matrice
jacobiana. Tali punti sono dunque punti singolari della trasformazione di
coordinate. Si noti però che per v = 0 si annulla il denominatore della
derivata ∂y
, quindi in tali punti la funzione non è derivabile. Di conseguen∂v
za anche i punti che soddisfano v = 0 (cioè y = 0) sono punti singolari,
non perché in tali punti si annulla il determinante della matrice jacobiana,
ma semplicemente perché in essi non esiste la matrice jacobiana, cioè la
trasformazione di coordinate non è derivabile nei punti in cui v = 0.
In conclusione, abbiamo visto che la trasformazione di coordinate in
questione è singolare in tutti i punti degli assi x e y.
3. Soluzioni
Infine, per la trasformazione dell’elemento infinitesimo di area si ha:
3u2
dx dy = | det Jf~| du dv = √ du dv.
2 v
249
Capitolo 13
Calcolo Integrale
1. Richiami di teoria
1.1. Integrali doppi
Ricordiamo brevemente la definizione dell’integrale (di Riemann) di una
funzione di una variabile.
Sia I = [a, b] un intervallo di R e sia f : I → R una funzione. Per
definire l’integrale di f esteso all’intervallo I, si divide l’intervallo I in N
intervallini uguali J1 , J2 , . . . , JN , di lunghezza ` = b−a
, si prende poi, per
N
ogni intervallino Ji un punto xi ∈ Ji (si veda la figura 1), e si considera la
seguente somma:
N
X
S(N ) =
f (xi )`.
i=1
Si considera poi il limite, per N → +∞, della somma S(N ) e, se questo
limite esiste finito e non dipende dalla scelta dei punti xi , si pone
Z
f (x) dx = lim S(N ).
N →+∞
I
Dalla costruzione fatta, si deduce che tale integrale rappresenta l’area della
regione di piano compresa tra l’asse x e il grafico della funzione f , dove si
y
f (xi )
Ji
O
a
xi
Figura 1.
b
x
252
13. Calcolo Integrale
y
R
d
Pi
Ji
c
O
a
b
x
Figura 2.
considerano positive le area che stanno sopra l’asse delle x e negative quelle
che stanno sotto.
Per quanto riguarda l’esistenza del suddetto limite, si dimostra il seguente risultato:
Teorema 1.1. Se f : I → R è una funzione continua definita nell’intervallo
I ⊂ R, allora esiste l’integrale di f esteso a I.
Ci proponiamo ora di estendere questa costruzione al caso di funzioni di
più variabili. Iniziamo considerando il caso delle funzioni di due variabili.
L’analogo bidimensionale di un intervallo di R è un rettangolo. Sia dunque R = [a, b] × [c, d] un rettangolo in R2 e sia f : R → R una funzione.
Dividiamo il rettangolo R in N rettangolini uguali J1 , J2 , . . . , JN , e prendiamo, in ogni rettangolino Ji un punto Pi = (xi , yi ) ∈ Ji (si veda la figura 2).
Consideriamo poi la seguente somma:
S(N ) =
N
X
f (xi , yi ) Area(Ji ).
i=1
Se il limite di S(N ), per N → +∞, esiste finito e non dipende dalla
scelta dei punti Pi , si pone
ZZ
f (x, y) dx dy = lim S(N ).
R
N →+∞
La notazione utilizzata è particolarmente suggestiva: il prodotto dx dy rappresenta l’elemento infinitesimo di area nel piano (pensato come l’area di
un rettangolino infinitesimo di lati dx e dy), quindi moltiplicando dx dy per
f (x, y) si ottiene il volume di un parallelepipedo infinitesimo di base dx dy
e di altezza f (x, y). Infine, sommando i volumi di tutti questi parallelepipedi infinitesimi si ottiene il volume della regione compresa tra il piano xy
e il grafico della funzione f , ove si considerano positivi i volumi che stanno
sopra il piano xy e negativi quelli che stanno sotto. Si noti come questa
1. Richiami di teoria
253
R
y
f˜=0
Ω
f˜=f
O
x
Figura 3.
interpretazione geometrica dell’integrale di una funzione di due variabili sia
del tutto analoga a quella dell’integrale di una funzione di una variabile.
Anche in questo caso si può dimostrare il seguente risultato:
Teorema 1.2. Sia f : R → R una funzione continua, definita su un
rettangolo R ⊂ R2 . Allora esiste l’integrale di f esteso a R.
Tuttavia, se nel caso di funzioni di una variabile saperle integrare su
degli intervalli poteva essere soddisfacente, nel caso di funzioni di due variabili è certamente troppo restrittivo poterle integrare solo su delle regioni
rettangolari del piano. Si pone allora il problema di estendere la definizione
di integrale a delle regioni limitate qualsiasi del piano.
Un’idea per affrontare questo problema potrebbe essere la seguente. Sia
f : Ω → R una funzione continua definita su un insieme limitato Ω. Consideriamo un rettangolo R sufficientemente grande da contenere Ω. Estendiamo
la definizione di f a tutto il rettangolo R nel modo seguente:
(
f (x, y) se (x, y) ∈ Ω,
f˜(x, y) =
0
se (x, y) 6∈ Ω.
La nuova funzione f˜ : R → R coincide con f nell’insieme Ω ed è nulla all’esterno (si veda la figura 3). In base all’interpretazione geometrica
dell’integrale doppio descritta in precedenza, ha quindi senso porre
ZZ
ZZ
f (x, y) dx dy =
f˜(x, y) dx dy,
Ω
R
dato che, nella regione di R esterna a Ω il contributo di f˜ all’integrale che
compare nel membro di destra dell’uguaglianza precedente è nullo.
In questo modo la definizione dell’integrale di una funzione f su una qualunque regione limitata Ω ⊂ R2 è ricondotta alla definizione dell’integrale
di una funzione su un rettangolo. Osserviamo però che, anche se la funzione f è continua in tutto Ω, la nuova funzione f˜ non sarà più, in generale,
254
13. Calcolo Integrale
y
y
O
x
O
(a) Insieme y-semplice
ma non x-semplice.
x
(b) Insieme x-semplice
ma non y-semplice.
y
y
O
x
O
(c) Insieme y-semplice
e x-semplice.
x
(d) Insieme né y-semplice
né x-semplice.
Figura 4.
continua nel rettangolo R, e quindi l’esistenza dell’integrale di f˜ su R (e di
conseguenza l’esistenza dell’integrale di f su Ω) non è più garantita.
Si possono adottare delle strategie più sofisticate per definire l’integrale
di una funzione f su un sottoinsieme Ω di R2 , tuttavia, qualunque sia la
strategia che si voglia seguire, si trovano sempre dei sottoinsiemi del piano
talmente irregolari da far si che non sia possibile integrare su di essi neppure
funzioni estremamente semplici, come ad esempio la funzione costante pari
a 1 (questi insiemi si dicono non-misurabili).
Ci proponiamo quindi un compito meno ambizioso: definire l’integrale
di una funzione di due variabili f (x, y) solo su una ben determinata classe
di sottoinsiemi di R2 (classe, tuttavia, sufficientemente estesa da contenere
tutti i casi di interesse pratico).
Definizione 1.3. Un sottoinsieme A di R2 è detto y-semplice se è del tipo
A = {(x, y) | a ≤ x ≤ b, h1 (x) ≤ y ≤ h2 (x)},
ove h1 e h2 sono due funzioni continue definite nell’intervallo [a, b].
Analogamente, un sottoinsieme B di R2 è detto x-semplice se è del tipo
B = {(x, y) | c ≤ y ≤ d, k1 (y) ≤ x ≤ k2 (y)},
ove k1 e k2 sono due funzioni continue definite nell’intervallo [c, d].
Infine, un sottoinsieme di R2 è detto semplice se è y-semplice oppure
x-semplice (si veda la figura 4).
Si può dimostrare il seguente risultato fondamentale:
Teorema 1.4. Se A ⊂ R2 è un insieme y-semplice, dato da
A = {(x, y) | a ≤ x ≤ b, h1 (x) ≤ y ≤ h2 (x)},
1. Richiami di teoria
255
e f : A → R è una funzione continua, allora f è integrabile in A e si ha:
!
ZZ
Z b
Z h2 (x)
f (x, y) dx dy =
dx
f (x, y) dy .
A
a
h1 (x)
Analogamente, se B ⊂ R2 è un insieme x-semplice, dato da
B = {(x, y) | c ≤ y ≤ d, k1 (y) ≤ x ≤ k2 (y)},
e f : B → R è una funzione continua, allora f è integrabile in B e si ha:
!
Z k2 (y)
ZZ
Z d
f (x, y) dx dy =
dy
f (x, y) dx .
B
c
k1 (y)
Infine, se C è un insieme sia y-semplice che x-semplice, e f : C → R è
una funzione continua, allora valgono entrambe le formule precedenti e i due
risultati coincidono.
Notiamo a questo punto la seguente proprietà additiva dell’integrale: se
A e B sono due regioni del piano che si intersecano al più lungo il bordo, e
se f è una funzione definita in A ∪ B, allora si ha:
ZZ
ZZ
ZZ
f (x, y) dx dy =
f (x, y) dx dy +
f (x, y) dx dy.
A∪B
A
B
Grazie a questa proprietà possiamo estendere la definizione di integrale di
una funzione anche a insiemi che non siano semplici, purché sia possibile
rappresentarli come unione di un numero finito di sottoinsiemi semplici che
si intersecano a due a due al più lungo il loro bordo. Diamo quindi la
seguente definizione:
Definizione 1.5. Un sottoinsieme Ω di R2 è detto regolare se esiste un
numero finito di insiemi semplici A1 , A2 , . . . , An , per qualche intero n, tali
che
n
[
Ω=
Ai ,
i=1
e, per ogni i e j, con i 6= j, gli insiemi Ai e Aj si intersechino al più lungo
il bordo.
Se Ω è un insieme regolare come sopra, e f : Ω → R è una funzione
continua, si pone
ZZ
n ZZ
X
f (x, y) dx dy =
f (x, y) dx dy.
Ω
i=1
Ai
Si può dimostare che questa definizione è ben posta, nel senso che non
dipende dalla decomposizione di Ω come unione di insiemi semplici usata
per calcolare l’integrale.
Abbiamo cosı̀ definito la nozione di integrale di una funzione continua su
un insieme regolare. Ovviamente la classe degli insiemi regolari non contiene
tutti i sottoinsiemi di R2 , ma risulta sufficientemente ampia da contenere
256
13. Calcolo Integrale
essenzialmente tutti i casi di interesse pratico. A titolo di esempio, notiamo
che l’insieme rappresentato in figura 4 (d) è regolare (ma non semplice). Lo
studente è invitato a individuare una sua decomposizione in sottoinsiemi
semplici.
Come caso particolare, possiamo usare gli integrali doppi per definire il
concetto di area di un insieme regolare.
Definizione 1.6. Sia Ω un sottoinsieme regolare di R2 . L’area di Ω è
definita ponendo
ZZ
Area(Ω) =
dx dy.
Ω
Osservazione 1.7. Osserviamo che il problema dell’esistenza di insiemi
non-misurabili, cioè di insiemi Ω tali che non esista l’integrale
ZZ
dx dy,
Ω
è intrinseco alla teoria stessa dell’integrazione. Citiamo, a tal proposito, il
paradosso di Banach-Tarski, il quale afferma che dati due qualunque sottoinsiemi limitati a interno non vuoto A e B di Rn (n ≥ 3), è possibile
suddividere A in un numero finito di sottoinsiemi a due a due disgiunti e
riarrangiare quest’ultimi, con movimenti rigidi, per formare B. Evidentemente tali sottoinsiemi non possono essere misurabili! (Paradossi analoghi
esistono anche per n = 1 e n = 2). Come conseguenza di ciò si ottiene il
fatto che non esiste nessuna misura numerabilmente additiva ed invariante
per traslazioni, definita su tutti i sottoinsiemi di Rn , e per cui l’ipercubo
[0, 1]n abbia misura unitaria. Per una trattazione di questi risultati si rimanda, ad esempio, a S. Wagon, “The Banach-Tarski Paradox,” Encyclopedia
of Mathematics and its Applications, Vol. 24, Cambridge University Press,
1985.
1.1.1. Il cambiamento di variabili negli integrali doppi
Sia Ω un sottoinsieme regolare di R2 e sia f : Ω → R una funzione continua.
Consideriamo una trasformazione di coordinate
~r : (u, v) 7→ x(u, v), y(u, v) .
Se componiamo la funzione f (x, y) con la funzione ~r(u, v), otteniamo una
nuova funzione delle due variabili u e v, data da f (x(u, v), y(u, v)). Sappiamo inoltre che, nella trasformazione di coordinate operata dalla funzione ~r, l’elemento infinitesimo di area dx dy si trasforma come segue (vedi
Capitolo 12, Sezione 1.3):
dx dy = | det J~r (u, v)| du dv.
1. Richiami di teoria
z
257
f (P )
S
dS
P
y
x
Figura 5.
Da questi fatti si deduce la seguente formula per il cambiamento di variabili
negli integrali doppi:
ZZ
ZZ
f (x, y) dx dy =
f x(u, v), y(u, v) | det J~r (u, v)| du dv,
Ω
Ω0
ove Ω0 = ~r−1 (Ω), cioè Ω0 è sempre lo stesso dominio regolare Ω, espresso
però nelle nuove coordinate u e v.
1.2. Integrali di superficie
Sia S ⊂ R3 una superficie e sia f : S → R una funzione definita su S. Ci
proponiamo di definire l’integrale di f esteso a S. La procedura da seguire è
simile a quella usata per una superficie piana, cioè per un sottoinsieme di R2 .
L’idea è sempre la stessa: si considera un elemento infinitesimo di area dS
sulla superficie S e lo si moltiplica per il valore della funzione f calcolata
in un qualche punto P interno a tale elemento di superficie. Si ottiene
cosı̀ la quantità f (P ) dS, che rappresenta il volume di un parallelepipedo
infinitesimo di base dS e altezza f (P ) (si veda la figura 5). Sommando poi
tutti questi volumi infinitesimi si ottiene ciò che si definisce come l’integrale
di f esteso a S:
ZZ
f dS.
S
Il problema è ora quello di capire come si possa calcolare un tale integrale.
Supponiamo che la superficie S sia parametrizzata dalla funzione
~r : A → R3 , (u, v) 7→ x(u, v), y(u, v), z(u, v) ,
258
13. Calcolo Integrale
ove A è un sottoinsieme di R2 . Se componiamo la funzione f : S → R con
la parametrizzazione ~r di S, otteniamo una nuova funzione delle variabili
u e v, f (x(u, v), y(u, v), z(u, v)). Sappiamo inoltre che, in termini della
parametrizzazione ~r, l’elemento infinitesimo di area sulla superficie S è dato
da
dS = k~nk du dv,
∂~
r
∂~
r
ove ~n = ∂u
∧ ∂v
è il vettore normale a S. Si ottiene cosı̀ la seguente
uguaglianza, che può essere usata come definizione dell’integrale di f esteso
alla superficie S:
ZZ
ZZ
f dS =
f x(u, v), y(u, v), z(u, v) k~nk du dv.
S
A
Osservazione 1.8. Si può dimostrare che questa definizione è ben posta,
nel senso che l’integrale di f esteso a S non dipende dalla parametrizzazione
della superficie S usata per calcolarlo.
1.3. Integrali tripli
L’estensione della definizione di integrale dal caso di una funzione di due
variabili a quello di una funzione di tre variabili non presenta particolari
problemi. Si procede per analogia con quanto fatto nel caso di due variabili.
L’analogo tridimensionale di un rettangolo di R2 è un parallelepipedo.
Sia dunque Q = [a, b] × [c, d] × [e, f ] un parallelepipedo in R3 e sia f :
Q → R una funzione. Dividiamo il parallelepipedo Q in N parallelepipedi
uguali J1 , J2 , . . . , JN , e prendiamo, in ogni parallelepipedo Ji un punto Pi =
(xi , yi , zi ) ∈ Ji . Consideriamo poi la seguente somma:
S(N ) =
N
X
f (xi , yi , zi ) Vol(Ji ).
i=1
Se il limite di S(N ), per N → +∞, esiste finito e non dipende dalla scelta
dei punti Pi , si pone
ZZZ
f (x, y, z) dx dy dz = lim S(N ).
Q
N →+∞
Come per le funzioni di due variabili, si dimostra il seguente risultato:
Teorema 1.9. Sia f : Q → R una funzione continua, definita in un
parallelepipedo Q ⊂ R3 . Allora esiste l’integrale di f esteso a Q.
Come nel caso delle funzioni di due variabili, si può cercare di estendere
la definizione di integrale a delle regioni limitate qualsiasi dello spazio nel
modo seguente.
Sia f : Ω → R una funzione continua definita su un insieme limitato
Ω ⊂ R3 . Consideriamo un parallelepipedo Q sufficientemente grande da
1. Richiami di teoria
259
contenere Ω. Estendiamo la definizione di f a tutto il parallelepipedo Q nel
modo seguente:
(
f (x, y, z) se (x, y, z) ∈ Ω,
f˜(x, y, z) =
0
se (x, y, z) 6∈ Ω.
La nuova funzione f˜ : Q → R coincide con f nell’insieme Ω ed è nulla
all’esterno di Ω. Ha senso quindi porre
ZZZ
ZZZ
f (x, y, z) dx dy dz =
f˜(x, y, z) dx dy dz,
Ω
Q
dato che, nella regione di Q esterna a Ω il contributo di f˜ all’integrale che
compare nel membro di destra dell’uguaglianza precedente è nullo.
In questo modo la definizione dell’integrale di una funzione f su una
qualunque regione limitata Ω ⊂ R3 è ricondotta alla definizione dell’integrale di una funzione su un parallelepipedo. Osserviamo però che, anche se
la funzione f è continua in tutto Ω, la nuova funzione f˜ non sarà più, in
generale, continua nel parallelepipedo Q, e quindi l’esistenza dell’integrale
di f˜ su Q (e di conseguenza l’esistenza dell’integrale di f su Ω) non è più
garantita.
Ci proponiamo quindi un compito meno ambizioso: definire l’integrale
di una funzione di tre variabili f (x, y, z) solo su una ben determinata classe
di sottoinsiemi di R3 .
Definizione 1.10. Un sottoinsieme A di R3 è detto z-semplice se è del tipo
A = {(x, y, z) | (x, y) ∈ A0 , h1 (x, y) ≤ z ≤ h2 (x, y)},
ove A0 ⊂ R2 è un insieme semplice e h1 e h2 sono due funzioni continue
definite in A0 . In modo del tutto analogo si possono poi definire gli insiemi
x-semplici e y-semplici.
Un sottoinsieme A di R3 è detto semplice se è z-semplice, oppure ysemplice, oppure x-semplice.
Si può dimostrare il seguente risultato fondamentale:
Teorema 1.11. Se A ⊂ R3 è un insieme z-semplice, dato da
A = {(x, y, z) | (x, y) ∈ A0 , h1 (x, y) ≤ z ≤ h2 (x, y)},
e f : A → R è una funzione continua, allora f è integrabile in A e si ha:
!
ZZ
ZZZ
Z h2 (x,y)
f (x, y, z) dx dy dz =
dx dy
f (x, y, z) dz .
A
A0
h1 (x,y)
Valgono ovviamente dei risultati analoghi per gli insiemi y-semplici e quelli
x-semplici.
Il calcolo di un integrale triplo è cosı̀ ricondotto al calcolo di un integrale
semplice seguito da quello di un integrale doppio. Quest’ultimo, a sua volta,
può essere decomposto in due integrali semplici come visto in precedenza.
260
13. Calcolo Integrale
Esiste anche un’altra possibile decomposizione di un integrale triplo. Se
A ⊂ R3 è un insieme z-semplice, indichiamo con Az̄ l’intersezione di A con
il piano di equazione z = z̄, cioè
Az̄ = {(x, y, z) ∈ A | z = z̄}.
Se tutti gli insiemi Az sono regolari, si ha:
ZZZ
Z zmax Z Z
f (x, y, z) dx dy dz =
dz
A
zmin
f (x, y, z) dx dy ,
Az
ove abbiamo indicato con zmin e zmax i valori minimo a massimo assunti
dalla variabile z nell’insieme A.
In questo caso si esegue quindi prima un integrale doppio esteso allo
strato Az e poi un integrale semplice.
Esempio 1.12. Per illustrare quest’ultimo metodo di integrazione consideriamo il seguente problema: calcolare il volume di una sfera di raggio r in
R3 .
Sia S 3 (r) ⊂ R3 la sfera di raggio r centrata nell’origine:
S 3 (r) : x2 + y 2 + z 2 ≤ r2 .
Il suo volume è dato dal seguente integrale triplo:
ZZZ
3
dx dy dz.
Vol(S (r)) =
S 3 (r)
Lo strato S 3 (r)z̄ ottenuto intersecando la sfera con il piano di equazione
z = z̄ è costituito dalle soluzioni del seguente sistema:
(
x2 + y 2 + z 2 ≤ r 2
z = z̄,
da cui si ricava
S 3 (r)z̄ : x2 + y 2 ≤ r2 − z̄ 2 .
√
Si scopre quindi che S 3 (r)z̄ è un cerchio di raggio r0 = r2 − z̄ 2 , se −r ≤
z̄ ≤ r, altrimenti è l’insieme vuoto (si veda la figura 6).
Il precedente integrale triplo può quindi essere calcolato come segue:
ZZZ
Z r
ZZ
dx dy dz =
dz
dx dy.
S 3 (r)
−r
S 3 (r)z
Notiamo che l’integrale doppio
ZZ
dx dy
S 3 (r)z
√
rappresenta l’area del cerchio S 3 (r)z di raggio r0 = r2 − z 2 , e quindi si ha:
ZZ
2
dx dy = πr0 = π(r2 − z 2 ).
S 3 (r)z
1. Richiami di teoria
261
z
z̄
r0
r
y
x
Figura 6.
Possiamo ora completare il calcolo del volume della sfera:
ZZZ
3
Vol(S (r)) =
dx dy dz
S 3 (r)
Z r
ZZ
=
dz
dx dy
−r
S 3 (r)z
Z r
=π
(r2 − z 2 )dz
−r
r
z3
2
=π r z−
3 −r
4
= πr3 .
3
Anche nel caso degli integrali tripli è possibile estendere la definizione
dell’integrale di una funzione continua a una classe più ampia di insiemi:
Definizione 1.13. Un sottoinsieme Ω di R3 è detto regolare se esiste un
numero finito di insiemi semplici A1 , A2 , . . . , An , per qualche intero n, tali
che
Ω=
n
[
Ai ,
i=1
e, per ogni i e j, con i 6= j, gli insiemi Ai e Aj si intersechino al più lungo
il bordo.
262
13. Calcolo Integrale
Se Ω è un insieme regolare come sopra, e f : Ω → R è una funzione
continua, si pone
ZZZ
n ZZZ
X
f (x, y, z) dx dy dz =
f (x, y, z) dx dy dz.
Ω
i=1
Ai
Si può dimostare che questa definizione è ben posta, nel senso che non
dipende dalla decomposizione di Ω come unione di insiemi semplici usata
per calcolare l’integrale.
Come caso particolare, possiamo usare gli integrali tripli per definire il
concetto di volume di un insieme regolare.
Definizione 1.14. Sia Ω un sottoinsieme regolare di R3 . Il volume di Ω è
definito ponendo
ZZZ
Vol(Ω) =
dx dy dz.
Ω
1.3.1. Il cambiamento di variabili negli integrali tripli
Sia Ω un sottoinsieme regolare di R3 e sia f : Ω → R una funzione continua.
Consideriamo una trasformazione di coordinate
~r : (u, v, w) 7→ x(u, v, w), y(u, v, w), z(u, v, w) .
Se componiamo la funzione f (x, y, z) con la funzione ~r(u, v, w), otteniamo
una nuova funzione delle variabili u, v e w, data da
f x(u, v, w), y(u, v, w), z(u, v, w) .
Sappiamo inoltre che, nella trasformazione di coordinate operata dalla funzione ~r, l’elemento infinitesimo di volume dx dy dz si trasforma come segue
(vedi Capitolo 12, Sezione 1.3):
dx dy dz = | det J~r (u, v, w)| du dv dw.
Da ciò si deduce la seguente formula per il cambiamento di variabili negli
integrali tripli:
ZZZ
ZZZ
f (x, y, z) dx dy dz =
f ~r(u, v, w) | det J~r (u, v, w)| du dv dw,
Ω0
Ω
0
−1
0
ove Ω = ~r (Ω), cioè Ω è sempre lo stesso dominio regolare Ω, espresso
però nelle nuove coordinate u, v e w.
1.4. Integrali in Rn
Avendo visto come si definiscono gli integrali per le funzioni di due o tre
variabili non dovrebbe essere difficile immaginare come si possano estendere
le definizioni e i risultati precedenti al caso di funzioni di n variabili. Non
entriamo nei dettagli ma osserviamo solo che si possono ottenere dei risultati
1. Richiami di teoria
263
del tutto analoghi a quelli già visti in dimensione 2 o 3. In particolare si
può ottenere il seguente risultato fondamentale:
Teorema 1.15. Sia Ω un sottoinsieme regolare di Rn e sia f : Ω → R una
funzione continua. Allora esiste l’integrale di f esteso a Ω.
In particolare, si può definire il volume (n-dimensionale) di un insieme
regolare Ω ⊂ Rn come segue:
ZZ Z
Vol(Ω) =
· · · dx1 dx2 · · · dxn .
Ω
L’integrale di una funzione di n variabili su un insieme regolare Ω si può poi
decomporre in tanti integrali semplici in modo del tutto analogo a quanto
visto per gli integrali doppi e tripli. Anche in questo caso non entriamo nei
dettagli, ma illustriamo la procedura da seguire con due semplici esempi.
Esempio 1.16. La 4-sfera. Ci proponiamo di calcolare il volume di una
sfera di raggio r in R4 . Sia dunque S 4 (r) ⊂ R4 la sfera di raggio r centrata
nell’origine:
S 4 (r) : x2 + y 2 + z 2 + w2 ≤ r2 .
Il suo volume è dato dal seguente integrale:
ZZZZ
4
Vol(S (r)) =
dx dy dz dw.
S 4 (r)
Lo strato S 4 (r)w̄ ottenuto intersecando la sfera con l’iperpiano di equazione
w = w̄ è costituito dalle soluzioni del seguente sistema:
(
x2 + y 2 + z 2 + w 2 ≤ r 2
w = w̄,
da cui si ricava
S 4 (r)w̄ : x2 + y 2 + z 2 ≤ r2 − w̄2 .
4
0
Si
√ scopre quindi che S (r)w̄ è una sfera tridimensionale di raggio r =
r2 − w̄2 , se −r ≤ w̄ ≤ r, altrimenti è l’insieme vuoto.
L’integrale che fornisce il volume della 4-sfera può quindi essere calcolato
come segue:
ZZZZ
Z r
ZZZ
dx dy dz dw =
dw
dx dy dz.
S 4 (r)
−r
S 4 (r)w
Notiamo che l’integrale triplo
ZZZ
dx dy dz
S 4 (r)w
rappresenta
il volume della sfera tridimensionale S 4 (r)w di raggio r0 =
√
r2 − w2 , e quindi si ha:
ZZZ
4
4 p
3
dx dy dz = πr0 = π (r2 − w2 )3 .
3
3
S 4 (r)w
264
13. Calcolo Integrale
Per il calcolo del volume della 4-sfera si ottiene quindi:
ZZZZ
4
Vol(S (r)) =
dx dy dz dw
S 4 (r)
Z r
ZZZ
=
dw
dx dy dz
−r
S 4 (r)w
Z rp
4
= π
(r2 − w2 )3 dw
3
−r
s
Z r w 2 3
4 3
dw.
= πr
1−
3
r
−r
Quest’ultimo integrale si può calcolare mediante il cambiamento di variabili
w
= sin φ,
r
da cui si ottiene dw = r cos φ dφ. Effettuando questo cambiamento di variabili, e rideterminando gli estremi di integrazione in funzione della variabile
φ, si ottiene:
s
Z r w 2 3
4
4
3
Vol(S (r)) = πr
1−
dw
3
r
−r
Z
q
4 3 π/2
(1 − sin2 φ)3 r cos φ dφ
= πr
3
−π/2
Z π/2
4
= πr4
cos4 φ dφ.
3
−π/2
Occupiamoci ora del calcolo del seguente integrale:
Z
cos4 φ dφ.
Questo integrale si può calcolare integrando per parti, come segue:
Z
Z
4
cos φ dφ = cos3 φ cos φ dφ
Z
3
= cos φ sin φ + 3 sin2 φ cos2 φ dφ
Z
3
= cos φ sin φ + 3(1 − cos2 φ) cos2 φ dφ
Z
Z
3
2
= cos φ sin φ + 3 cos φ dφ − 3 cos4 φ dφ.
1. Richiami di teoria
265
R
Portando tutti i termini che contengono l’integrale cos4 φ dφ a primo
membro, si ottiene
Z
Z
4
3
4 cos φ dφ = cos φ sin φ + 3 cos2 φ dφ.
Rimane ora da calcolare l’integrale
Z
cos2 φ dφ.
Questo si può calcolare integrando per parti in modo del tutto analogo a
quanto appena visto, e si trova
Z
1
cos2 φ dφ = (φ + sin φ cos φ).
2
Sostituendo nell’espressione precedente si trova quindi
Z
1
3
cos4 φ dφ = cos3 φ sin φ + (φ + sin φ cos φ).
4
8
Da ciò segue che
Z π/2
3
cos4 φ dφ = π.
8
−π/2
Possiamo cosı̀ completare il calcolo del volume della 4-sfera, ottenendo:
Z
4 4 π/2
1
4
Vol(S (r)) = πr
cos4 φ dφ = π 2 r4 .
3
2
−π/2
Esempio 1.17. La 5-sfera. In questo secondo esempio ci proponiamo di
calcolare il volume di una sfera di raggio r in R5 . Sia dunque S 5 (r) ⊂ R5
la sfera di raggio r centrata nell’origine:
S 5 (r) : x2 + y 2 + z 2 + w2 + t2 ≤ r2 .
Il suo volume è dato dal seguente integrale:
ZZ Z
5
Vol(S (r)) =
···
dx dy dz dw dt.
S 5 (r)
Lo strato S 5 (r)t̄ ottenuto intersecando la sfera con l’iperpiano di equazione
t = t̄ è costituito dalle soluzioni del seguente sistema:
(
x2 + y 2 + z 2 + w2 + t2 ≤ r2
t = t̄,
da cui si ricava
S 5 (r)t̄ : x2 + y 2 + z 2 + w2 ≤ r2 − t̄2 .
5
0
Si
√ scopre quindi che S (r)t̄ è una sfera quadridimensionale di raggio r =
r2 − t̄2 , se −r ≤ t̄ ≤ r, altrimenti è l’insieme vuoto.
266
13. Calcolo Integrale
L’integrale che fornisce il volume della 5-sfera può quindi essere calcolato
come segue:
ZZ Z
Z r ZZZZ
···
dx dy dz dw dt =
dt
dx dy dz dw.
S 5 (r)
−r
S 5 (r)t
Notiamo che l’integrale quadruplo
ZZZZ
dx dy dz dw
S 5 (r)t
rappresenta
il volume della sfera quadridimensionale S 5 (r)t di raggio r0 =
√
r2 − t2 . Questo volume è stato calcolato nell’esempio precedente, e si ha
quindi:
ZZZZ
1
1
4
dx dy dz dw = π 2 r0 = π 2 (r2 − t2 )2 .
2
2
S 5 (r)t
Possiamo ora calcolare il volume della 5-sfera come segue:
ZZ Z
5
Vol(S (r)) =
···
dx dy dz dw dt
S 5 (r)
Z r ZZZZ
=
dt
dx dy dz dw
−r
S 5 (r)t
Z
1 2 r 2
(r − t2 )2 dt
= π
2
Z−r
1 2 r 4
= π
(r − 2r2 t2 + t4 ) dt
2
−r
8 2 5
=
π r .
15
Osservazione 1.18. Per terminare, osserviamo che, operando in modo del
tutto analogo a quanto fatto nei due esempi precedenti, si può calcolare il
volume n-dimensionale della sfera S n (r) di raggio r in Rn . Le formule che
si trovano sono diverse a seconda che la dimensione n sia pari o dispari. Si
ha:
2p π p 2p
2p
Vol(S (r)) =
r ,
(2p)!!
se n = 2p è pari, e
Vol(S 2p+1 (r)) =
2p+1 π p 2p+1
r
,
(2p + 1)!!
se n = 2p + 1 è dispari, ove il simbolo m!! indica il semifattoriale di un
numero intero m, definito da
m!! = m(m − 2)(m − 4) · · · .
2. Esercizi
267
2. Esercizi
2.1. Integrali doppi
Esercizio 1. Sia I = [a, b] un intervallo di R e sia f : I → R una funzione
continua e positiva. Sia A la parte di piano compresa tra l’asse x e il grafico
della funzione f , cioè
A = {(x, y) | a ≤ x ≤ b, 0 ≤ y ≤ f (x)}.
Si determini l’area dell’insieme A per mezzo di un integrale doppio.
Esercizio 2. Sia D la regione limitata del piano compresa tra la retta
y = 2x e la parabola y = x2 . Si calcoli il seguente integrale:
ZZ
xy dx dy.
D
2
Esercizio 3. Sia T ⊂ R il trapezio di vertici A = (2, 1), B = (4, 0),
C = (4, 4) e D = (2, 3). Si calcoli il seguente integrale:
ZZ
xy dx dy.
T
Esercizio 4. Si calcoli il seguente integrale doppio
ZZ
(x − y) dx dy,
D
ove D è la regione interna al triangolo di vertici (2, 1), (6, 3) e (5, 4).
Esercizio 5. Si calcoli il seguente integrale doppio:
ZZ
xy dx dy,
D
ove D è la regione interna al semicerchio di raggio 2 centrato nel punto (0, 3)
e contenuto nel semipiano x ≥ 0.
Esercizio 6. Calcolare il volume del solido delimitato dai cinque piani
di equazione: π1 : z = 0, π2 : y = 0, π3 : x = 1, π4 : x − y = 0,
π5 : x − y − z + 1 = 0.
Esercizio 7. Calcolare l’integrale doppio
ZZ
dx dy
√
I=
,
4−x
D
dove D è il cerchio di raggio 2, tangente agli assi coordinati e contenuto nel
primo quadrante.
Esercizio 8. Calcolare il volume del solido limitato dal paraboloide ellittico
z = 2x2 + y 2 + 1, dal piano x + y = 1 e dai piani coordinati.
Esercizio 9. Calcolare il volume della semisfera, contenuta nel semispazio
z ≥ 0, centrata nell’origine e di raggio R.
268
13. Calcolo Integrale
Esercizio 10. Si calcoli l’area di un cerchio di raggio R, utilizzando le
coordinate polari.
Esercizio 11. Si calcoli il seguente integrale:
ZZ
xy 2
dx dy,
2
2
D x +y
ove D = {(x, y) | x2 + y 2 ≤ 4, x > 0, y > 0} (si usino le coordinate polari).
Esercizio 12. Calcolare il seguente integrale:
ZZ
xy
dx dy,
2
2
D x +y
ove D = {(x, y) | 1 ≤ x2 + y 2 ≤ 4; y ≥ 0; x ≥ y}.
Esercizio 13. Si calcoli l’area del seguente insieme D:
D = {(x, y) | 0 ≤ y ≤ x, 2x ≤ x2 + y 2 ≤ 4x}.
Esercizio 14. Siano a, b, p, q ∈ R dei numeri fissati, con 0 < a < b e
0 < p < q. Si calcoli l’area del seguente insieme D:
D = {(x, y) | x > 0, y > 0, a2 y ≤ x3 ≤ b2 y, p2 x ≤ y 3 ≤ q 2 x}.
2.2. Integrali di superficie
Esercizio
15. Indichiamo con S la superficie parametrizzata da x = u2 ,
√
y = 2uv, z = v 2 , per u ∈ [−1, 1] e v ∈ [−2, 2]. Si determinino i punti
singolari e l’area della superficie S.
Esercizio 16. Si calcoli l’area della superficie sferica di raggio R.
Esercizio 17. Si calcoli l’area della superficie del toro (in funzione dei due
raggi).
Esercizio 18. Calcolare la lunghezza L dell’arco di cicloide Γ parametrizzato da
x(t) = 2(t − sin t)
y(t) = 2(1 − cos t),
per t ∈ [0, 2π]. Calcolare inoltre l’area della superficie S generata da una
rotazione completa della curva Γ attorno all’asse x.
2.3. Integrali tripli
Esercizio 19. Si calcoli il volume di un cono circolare di raggio di base r e
altezza h.
Esercizio 20. Si calcoli il volume di una sfera di raggio R, utilizzando le
coordinate sferiche.
Esercizio 21. Si calcoli il volume dell’ellissoide E di semiassi a, b e c.
3. Soluzioni
269
3. Soluzioni
3.1. Integrali doppi
Svolgimento esercizio 1. Per definizione, si ha
ZZ
dx dy.
Area(A) =
A
Dato che l’insieme A è y-semplice, questo integrale si può decomporre come
segue:
ZZ
Z
b
dx dy =
Z
dx
A
a
f (x)
Z
b
dy =
0
a
f (x)
dx y 0 =
Z
b
f (x) dx.
a
Si
R b ritrova, in questo modo, la solita interpretazione geometrica dell’integrale
f (x) dx come l’area della regione di piano compresa tra l’asse x e il grafico
a
della funzione f .
Svolgimento esercizio 2. La retta y = 2x e la parabola y = x2 si
intersecano nei punti (0, 0) e (2, 4). Si ha quindi:
D = {(x, y) | 0 ≤ x ≤ 2, x2 ≤ y ≤ 2x}.
L’insieme D è dunque y-semplice (in effetti è anche x-semplice), e l’integrale
doppio si può calcolare come segue:
ZZ
Z
xy dx dy =
D
2
Z
2x
dx
xy dy
2x
Z 2
1 2
=
x dx
y
2
0
x2
Z 2
1
=
x(4x2 − x4 ) dx
2
0
2
1 4 x6
8
=
x −
= .
2
6 0 3
0
x2
Svolgimento esercizio 3. La retta AB ha equazione y = −x/2 + 2 e la
retta CD ha equazione y = x/2 + 2. Gli altri due lati del trapezio sono
verticali e le loro equazioni sono: AD : x = 2, BC : x = 4. Il trapezio T
può quindi essere descritto come segue (lo studente è invitato a disegnare
la figura):
T = {(x, y) | 2 ≤ x ≤ 4, −x/2 + 2 ≤ y ≤ x/2 + 2}.
270
13. Calcolo Integrale
L’insieme T è dunque y-semplice e l’integrale da calcolare può essere decomposto come segue:
ZZ
4
Z
xy dx dy =
Z
x/2+2
dx
T
xy dy
−x/2+2
2
4
Z
=
2
1 2
x dx
y
2
4
Z
x/2+2
−x/2+2
1
x dx (x/2 + 2)2 − (−x/2 + 2)2
2
=
2
4
Z
2x2 dx
=
2
x3
=2
3
4
=
2
112
.
3
Svolgimento esercizio 4. Indichiamo con A = (2, 1), B = (6, 3) e C =
(5, 4) i vertici del triangolo D. L’insieme D in questione è sia x-semplice che
y-semplice. Calcoliamo l’integrale considerando D come insieme y-semplice.
La retta AB ha equazione y = x/2. La retta AC ha equazione y = x − 1.
Infine, la retta BC ha equazione y = 9 − x. Per calcolare l’integrale è
conveniente dividere il triangolo D in due triangoli più piccoli nel modo
seguente: dal punto C tracciamo una retta verticale (di equazione x = 5)
che incontra il lato AB nel punto E = (5, 5/2). Chiamiamo D1 il triangolo
di vertici ACE e D2 il triangolo di vertici BCE (lo studente è invitato a
disegnare la figura). In questo modo si ha:
ZZ
ZZ
(x − y) dx dy =
D
ZZ
(x − y) dx dy +
D1
(x − y) dx dy.
D2
I due integrali in questione si calcolano ora come segue:
ZZ
Z
5
(x − y) dx dy =
D1
Z
x−1
(x − y) dy
dx
2
x/2
x−1
y2
=
dx xy −
2 x/2
2
Z 5
1 2 1
=
x −
dx
8
2
2
5
1 3 1
27
=
x − x = ,
24
2 2
8
Z
5
3. Soluzioni
e
ZZ
Z
6
(x − y) dx dy =
D2
Z
9−x
(x − y) dy
dx
5
271
x/2
9−x
y2
=
dx xy −
2 x/2
5
Z 6
81
15 2
=
−
x + 18x −
dx
8
2
5
6
5 3
81
13
2
= − x + 9x −
x = .
8
2
8
5
Sommando i due valori trovati, si ha infine
ZZ
27 13
(x − y) dx dy =
+
= 5.
8
8
D
Z
6
Svolgimento esercizio 5. La circonferenza di centro C = (0, 3) e raggio
r = 2 ha equazione
x2 + (y − 3)2 = 4,
da cui si ricava, per la semicirconferenza contenuta nel semipiano x ≥ 0,
p
p
x = 4 − (y − 3)2 = −y 2 + 6y − 5.
L’insieme D è quindi x-semplice, e precisamente si ha:
p
D = {(x, y) | 1 ≤ y ≤ 5, 0 ≤ x ≤ −y 2 + 6y − 5 }.
L’integrale doppio da calcolare si può quindi scomporre come segue:
ZZ
Z 5
Z √−y2 +6y−5
xy dx dy =
dy
xy dx
D
1
0
2 √−y2 +6y−5
Z 5
x
=
y dy
2 0
1
Z 5
1
=
(−y 3 + 6y 2 − 5y) dy
2 1
4
5
1
y
5 2
3
=
− + 2y − y
2
4
2
1
= 16.
Svolgimento esercizio 6. Il piano π1 è il piano xy, il piano π2 è il piano
xz e il piano π3 è il piano passante per il punto A = (1, 0, 0) e parallelo al
piano yz. Consideriamo ora il piano π4 , la cui equazione è x = y. Si tratta
del piano contenente l’asse z e la retta di equazione x = y nel piano xy. Il
solido individuato da questi quattro piani è quindi un parallelepipedo che
ha come base il triangolo T , contenuto nel piano xy, di vertici O = (0, 0, 0),
A = (1, 0, 0) e B = (1, 1, 0) (è indispensabile, a questo punto, disegnare la
272
13. Calcolo Integrale
figura). Il quinto piano π5 seziona questo parallelepipedo, determinando in
questo modo il solido di cui si vuole calcolare il volume. Dall’equazione di
π5 si ricava z = x − y + 1 e, da quanto detto fin’ora, segue che il volume
cercato è dato dal seguente integrale:
ZZ
V =
(x − y + 1) dx dy.
T
Dato che il triangolo T è un insieme y-semplice (in effetti è anche xsemplice), questo integrale doppio si può calcolare come segue:
ZZ
Z 1 Z x
(x − y + 1) dx dy =
dx
(x − y + 1) dy
T
0
0
x
Z 1 y2
=
dx xy −
+y
2
0
0
Z 1 2
x
2
=
+ x dx = .
2
3
0
Svolgimento esercizio 7. Il cerchio D in questione ha raggio 2 e centro
nel punto C = (2, 2). La sua equazione è quindi
(x − 2)2 + (y − 2)2 = 4,
cioè
x2 + y 2 − 4x − 4y + 4 = 0.
L’insieme D è sia x-semplice che y-semplice. Se lo pensiamo come insieme
y-semplice, dall’equazione del cerchio ricaviamo
√
y = 2 ± 4x − x2 ,
e si ha dunque
D = {(x, y) | 0 ≤ x ≤ 4, 2 −
√
4x − x2 ≤ y ≤ 2 +
√
4x − x2 }.
L’integrale in questione si calcola quindi come segue:
ZZ
Z 4 Z 2+√4x−x2
dx dy
dy
√
√
=
dx
√
4−x
4−x
D
0
2− 4x−x2
Z 4
√
dx 2+ 4x−x2
√
=
y √
2
4 − x 2− 4x−x
0
√
Z 4
2 4x − x2
√
dx
=
4−x
0
Z 4
√
32
=2
x dx = .
3
0
Svolgimento esercizio 8. La base del solido in questione è il triangolo
T , contenuto nel piano xy, di vertici (0, 0, 0), (1, 0, 0) e (0, 1, 0) (si invita il
3. Soluzioni
273
lettore a disegnare la figura). Il volume cercato è quindi dato dal seguente
integrale:
ZZ
V =
(2x2 + y 2 + 1) dx dy.
T
Il triangolo T è y-semplice (e anche x-semplice), quindi si ha:
ZZ
Z 1 Z 1−x
2
2
(2x + y + 1) dx dy =
dx
(2x2 + y 2 + 1) dy
T
0
Z
0
1
1−x
y3
2
dx 2x y +
+y
3
0
1
1
(1 − x)(7x2 − 2x + 4)dx
3
=
0
Z
=
0
3
= .
4
Svolgimento esercizio 9. L’equazione della sfera di raggio R, centrata
nell’origine, è
x2 + y 2 + z 2 = R 2 ,
da cui si ricava, per la semisfera contenuta nel semispazio z ≥ 0,
p
z = R 2 − x2 − y 2 ,
ove questa funzione è definita nel cerchio Ω, contenuto nel piano xy, centrato
nell’origine e di raggio R:
Ω = {(x, y) | x2 + y 2 ≤ R2 }.
Il volume della semisfera in questione è quindi dato da
ZZ p
V =
R2 − x2 − y 2 dx dy.
Ω
L’insieme Ω è sia x-semplice che y-semplice. Considerandolo come insieme
y-semplice, l’integrale doppio si può calcolare come segue:
Z R
Z √R2 −x2 p
ZZ p
R2 − x2 − y 2 dx dy =
dx √
R2 − x2 − y 2 dy
Ω
−R
− R2 −x2
Iniziamo dunque calcolando il seguente integrale indefinito:
Z p
R2 − x2 − y 2 dy.
Se poniamo A2 = R2 − x2 , si ha:
Z p
Z p
Z r
y 2
R2 − x2 − y 2 dy =
A2 − y 2 dy = A
1−
dy.
A
274
13. Calcolo Integrale
Quest’ultimo integrale si può calcolare mediante la sostituzione
ottenendo:
Z r
Z p
y 2
2
A
1−
dy = A
1 − sin2 t cos t dt
A
Z
2
=A
cos2 t dt
=
y
A
= sin t,
A2
(t + sin t cos t),
2
ove si è usata l’uguaglianza
Z
1
cos2 t dt = (t + sin t cos t).
2
Da quanto visto, si ottiene:
t=π/2
Z √R2 −x2 p
2
2
R
−
x
π
R2 − x2 − y 2 dy =
t + sin t cos t
= (R2 − x2 ).
√
2
2
− R2 −x2
t=−π/2
Possiamo ora completare il calcolo dell’integrale doppio:
ZZ p
Z
π R 2
4
2
2
2
R − x − y dx dy =
(R − x2 )dx = πR3 .
2 −R
6
Ω
Il volume di una semisfera di raggio R è dunque V = 46 πR3 , da cui segue che
il volume di una sfera di raggio R è 34 πR3 . Per concludere, osserviamo che
il calcolo del volume della semisfera risulterebbe estremamente più semplice
utilizzando le coordinate sferiche.
Svolgimento esercizio 10. Sia Ω il cerchio di raggio R centrato nell’origine:
Ω = {(x, y) | x2 + y 2 ≤ R2 }.
Se introduciamo le coordinate polari ρ e θ, legate alle coordinate cartesiane
x e y dalla trasformazione di coordinate
x = ρ cos θ,
y = ρ sin θ,
il cerchio Ω è descritto come segue:
Ω0 = {(ρ, θ) | 0 ≤ ρ ≤ R, 0 ≤ θ ≤ 2π}.
In coordinate polari il cerchio Ω diventa quindi il rettangolo Ω0 .
Ricordiamo ora che l’elemento di area dx dy è espresso, in coordinate
polari, dalla formula
dx dy = ρ dρ dθ.
3. Soluzioni
275
Siamo ora in grado di calcolare l’area A del cerchio Ω di raggio R:
ZZ
A=
dx dy
Z ZΩ
=
ρ dρ dθ
Ω0
Z R Z 2π
=
dρ
ρ dθ
0
0
Z R
= 2π
ρ dρ = πR2 .
0
Svolgimento esercizio 11. Effettuiamo il cambiamento di variabili
x = ρ cos θ,
y = ρ sin θ.
Sappiamo che l’elemento di area dx dy è espresso, in coordinate polari, dalla
formula
dx dy = ρ dρ dθ.
L’insieme D = {(x, y) | x2 + y 2 ≤ 4, x > 0, y > 0} è il quarto del cerchio di
raggio 2, centrato nell’origine, contenuto nel primo quadrante. Bisogna ora
calcolare l’insieme D0 , che non è altro che lo stesso insieme D espresso però
usando le coordinate polari. Si vede immediatamente che si ha:
D0 = {(ρ, θ) | 0 < ρ ≤ 2, 0 < θ < π/2}.
L’insieme D0 è dunque un rettangolo, e l’integrale doppio si può ora calcolare
come segue:
ZZ
ZZ
xy 2
ρ cos θρ2 sin2 θ
dx
dy
=
ρ dρ dθ
2
2
ρ2
D x +y
D0
ZZ
=
ρ2 cos θ sin2 θ dρ dθ
Z
D0
2
=
Z
π/2
ρ2 cos θ sin2 θ dθ
dρ
0
Z
0
2
=
0
Z
=
0
2
1 3
ρ dρ
sin θ
3
2
π/2
0
1 2
8
ρ dρ = .
3
9
Svolgimento esercizio 12. Per calcolare questo integrale conviene usare
le coordinate polari. Effettuiamo quindi il cambiamento di variabili
x = ρ cos θ,
y = ρ sin θ.
276
13. Calcolo Integrale
Sappiamo che l’elemento di area dx dy è espresso, in coordinate polari, dalla
formula
dx dy = ρ dρ dθ.
Bisogna ora calcolare l’insieme D0 , cioè l’insieme D espresso in coordinate
polari. Le disequazioni 1 ≤ x2 + y 2 ≤ 4 diventano, in coordinate polari,
1 ≤ ρ2 ≤ 4, cioè 1 ≤ ρ ≤ 2. La disequazione y ≥ 0 è equivalente a sin θ ≥ 0,
cioè 0 ≤ θ ≤ π. Infine, la disequazione x ≥ y è equivalente a cos θ ≥ sin θ,
le cui soluzioni sono date da 0 ≤ θ ≤ π/4 (ove si è tenuto conto del fatto
che, in precedenza, si era trovato 0 ≤ θ ≤ π).
L’insieme D0 è dunque dato da:
D0 = {(ρ, θ) | 1 ≤ ρ ≤ 2, 0 ≤ θ ≤ π/4}.
Possiamo ora calcolare l’integrale doppio come segue:
ZZ
ZZ
xy
dx dy =
ρ cos θ sin θ dρ dθ
2
2
D x +y
D0
Z 2 Z π/4
=
dρ
ρ cos θ sin θ dθ
1
Z
0
2
1
=
dρ
ρ sin2 θ
2
1
Z
1 2
3
=
ρ dρ = .
4 1
8
Svolgimento esercizio 13. Si ha:
ZZ
Area(D) =
dx dy.
π/4
0
D
Sebbene questo integrale si possa calcolare usando le coordinate cartesiane x e y, risulta più conveniente passare in coordinate polari ρ e θ. La
trasformazione di coordinate è data da
x = ρ cos θ,
y = ρ sin θ.
L’elemento di area dx dy è espresso, in coordinate polari, dalla formula
dx dy = ρ dρ dθ.
Bisogna ora calcolare l’insieme D0 , cioè l’insieme D espresso in coordinate
polari. Le disequazioni 0 ≤ y ≤ x diventano, in coordinate polari, 0 ≤
ρ sin θ ≤ ρ cos θ, che sono equivalenti al sistema
sin θ ≥ 0
cos θ ≥ sin θ.
Le soluzioni di questo sistema sono date da 0 ≤ θ ≤ π/4.
Rimangono ora le disequazioni 2x ≤ x2 + y 2 ≤ 4x che, in coordinate
polari, diventano 2ρ cos θ ≤ ρ2 ≤ 4ρ cos θ, cioè 2 cos θ ≤ ρ ≤ 4 cos θ.
3. Soluzioni
277
L’insieme D0 è dunque dato da:
D0 = {(ρ, θ) | 2 cos θ ≤ ρ ≤ 4 cos θ, 0 ≤ θ ≤ π/4}.
Da questa descrizione si deduce che D0 è un insieme ρ-semplice.
Disponiamo ora di tutte le informazioni necessarie per poter calcolare
l’integrale doppio:
ZZ
dx dy
Area(D) =
D
ZZ
=
ρ dρ dθ
Z
D0
π/4
=
Z
4 cos θ
dθ
ρ dρ
0
Z
2 cos θ
π/4
=
0
Z
=
1 2
dθ
ρ
2
4 cos θ
2 cos θ
π/4
6 cos2 θ dθ
0
h
iπ/4
= 3 θ + sin θ cos θ
0
3
3
= π+ ,
4
2
ove si è usata la (nota) uguaglianza
Z
1
cos2 θ dθ = (θ + sin θ cos θ).
2
Svolgimento esercizio 14. Data la forma dell’insieme D, per calcolare
l’integrale
ZZ
Area(D) =
dx dy,
D
conviene effettuare un cambiamento di variabili. Poniamo u = x3 /y e v =
y 3 /x. Invertendo la trasformazione di coordinate, cioè ricavando x e y in
funzione di u e v, si trova
(
x = (u3 v)1/8 ,
y = (uv 3 )1/8 .
Possiamo ora scrivere la matrice jacobiana della trasformazione di coordinate:
∂x ∂x 3 2 3 −7/8 1 3 3 −7/8 u v(u v)
u (u v)
∂v
= 81 3 3 −7/8 38 2 3 −7/8 .
J = ∂u
∂y
∂y
v
(uv
)
uv
(uv )
8
8
∂u
∂v
Il determinante della matrice jacobiana è
1
det J = √ ,
8 uv
278
13. Calcolo Integrale
e quindi l’elemento infinitesimo di area si trasforma come segue:
1
dx dy = √ du dv.
8 uv
Bisogna ora determinare l’insieme D0 , cioè l’insieme D espresso nelle nuove
coordinate u e v.
3
Le disequazioni a2 y ≤ x3 ≤ b2 y sono equivalenti a a2 ≤ xy ≤ b2 , che
diventano a2 ≤ u ≤ b2 . Analogamente, le disequazioni p2 x ≤ y 3 ≤ q 2 x sono
3
equivalenti a p2 ≤ yx ≤ q 2 , che diventano p2 ≤ v ≤ q 2 . L’insieme D0 è
quindi dato da:
D0 = {(u, v) | a2 ≤ u ≤ b2 , p2 ≤ v ≤ q 2 }.
Nelle nuove coordinate u e v l’insieme D0 è dunque un rettangolo.
Possiamo finalmente procedere al calcolo dell’area dell’insieme D:
ZZ
Area(D) =
dx dy
D
ZZ
1
√ du dv
=
D0 8 uv
Z b2 Z q2
1
√ dv
=
du
a2
p2 8 uv
Z b2
Z q2
1
1
1
√ du
√ dv
=
8 a2
u
v
p2
2
2
h
i
h
i
√ q
1 √ b
=
2 u
2 v
8
a2
p2
1
= (b − a)(q − p).
2
3.2. Integrali di superficie
Svolgimento esercizio 15. Chiamiamo ~r la funzione
√
~r(u, v) = (u2 , 2uv, v 2 ),
che parametrizza la superficie S. Si ha:
√
∂~r
= (2u, 2v, 0),
∂u
√
∂~r
= (0, 2u, 2v).
∂v
Il vettore normale ~n è quindi dato da
√
√
∂~r ∂~r
~n =
∧
= (2 2v 2 , −4uv, 2 2u2 ).
∂u ∂v
3. Soluzioni
279
I punti singolari sono quelli in cui il vettore ~n è nullo, il che accade solo se
u = v = 0. Quindi l’unico punto singolare di S è il punto di coordinate
~r(0, 0) = (0, 0, 0), cioè l’origine. Infine l’area A di S è data dal seguente
integrale:
ZZ
A=
k~nk du dv,
D
ove D =√{(u, v) | − 1 ≤ u ≤ 1, −2 ≤ v ≤ 2}. La norma del vettore ~n è
k~nk = 2 2(u2 + v 2 ), quindi si ha
√
ZZ √
Z 2
√ Z 1
80 2
2
2
2
2
A=
2 2(u + v ) du dv = 2 2
du
(u + v ) dv =
.
3
D
−1
−2
Svolgimento esercizio 16. Sia S la superficie sferica di raggio R centrata
nell’origine. Abbiamo già visto, in uno degli esercizi del Capitolo 12, che la
superficie S è parametrizzata dalla funzione
(θ, φ) 7→ ~r(θ, φ) = (R sin φ cos θ, R sin φ sin θ, R cos φ),
per 0 ≤ θ < 2π e 0 ≤ φ ≤ π. L’insieme di definizione della funzione ~r è
dunque il rettangolo
Ω = {(θ, φ) | 0 ≤ θ < 2π, 0 ≤ φ ≤ π}.
Determiniamo i due vettori tangenti:
∂~r
= (−R sin φ sin θ, R sin φ cos θ, 0),
∂θ
∂~r
~v2 =
= (R cos φ cos θ, R cos φ sin θ, −R sin φ).
∂φ
~v1 =
Il vettore normale è quindi
~n = ~v1 ∧ ~v2
~k
~
ı
~

= −R sin φ sin θ R sin φ cos θ
0
R cos φ cos θ R cos φ sin θ −R sin φ
= (−R2 sin2 φ cos θ, −R2 sin2 φ sin θ, −R2 sin φ cos θ)
= −R sin φ(R sin φ cos θ, R sin φ sin θ, R cos φ)
= −R sin φ ~r(θ, φ).
Possiamo ora calcolare l’elemento infinitesimo di area sulla superficie S:
dS = k~nk dθ dφ = R2 sin φ dθ dφ.
280
13. Calcolo Integrale
L’area della superficie S è quindi data dal seguente integrale:
ZZ
Area(S) =
dS
S
ZZ
=
R2 sin φ dθ dφ
Ω
Z π
Z 2π
2
=R
sin φ dφ
dθ
0
0
Z π
2
= 2πR
sin φ dφ
0
2
= 4πR .
Svolgimento esercizio 17. Abbiamo già visto, in uno degli esercizi del
Capitolo 12, che il toro T è parametrizzato da


 x = (R + r cos t) cos θ
y = (R + r cos t) sin θ

 z = r sin t,
cioè dalla funzione
~r(t, θ) = (R + r cos t) cos θ, (R + r cos t) sin θ, r sin t ,
con 0 ≤ t < 2π e 0 ≤ θ < 2π (ove abbiamo indicato con r e R i due raggi
che individuano il toro). L’insieme di definizione della funzione ~r è dunque
il rettangolo
Ω = {(t, θ) | 0 ≤ t < 2π, 0 ≤ θ < 2π}.
Determiniamo i due vettori tangenti:
∂~r
= (−r sin t cos θ, −r sin t sin θ, r cos t),
∂t
∂~r
= − (R + r cos t) sin θ, (R + r cos t) cos θ, 0 .
∂θ
Il vettore normale è quindi
~n =
∂~r ∂~r
∧
= −r(R + r cos t)(cos t cos θ, cos t sin θ, sin t).
∂t ∂θ
Possiamo ora calcolare l’elemento infinitesimo di area sulla superficie del
toro:
dS = k~nk dt dθ = r(R + r cos t) dt dθ.
3. Soluzioni
281
L’area del toro T è quindi data dal seguente integrale:
ZZ
Area(T ) =
dS
T
ZZ
=
r(R + r cos t) dt dθ
Z 2π
=r
dt
(R + r cos t) dθ
0
0
Z 2π
= 2πr
(R + r cos t) dt
0
2π
= 2πr Rt + r sin t 0
Ω
Z 2π
= (2πr)(2πR) = 4π 2 rR.
Svolgimento esercizio 18. Si ha x0 (t) = 2(1 − cos t) e y 0 (t) = 2 sin t. L’elemento infinitesimo di lunghezza d` sulla curva Γ (detto anche differenziale
d’arco) è dato da:
d` =
√ √
x0 (t)2 + y 0 (t)2 dt = 2 2 1 − cos t dt.
p
La lunghezza L = L(Γ) si calcola quindi come segue:
√ Z 2π √
L = d` = 2 2
1 − cos t dt
Γ
0
r
√ Z 2π
t
=2 2
2 sin2 dt
2
0
2π
√
√
t
= 16,
= 2 2 −2 2 cos
2 0
Z
dove si è usata la nota formula
t
1 − cos t = 2 sin2 .
2
Sia ora S la superficie generata da una rotazione completa della curva Γ
attorno all’asse x. Un punto P = (xP , yP ) su Γ descrive, nella rotazione
di Γ attorno all’asse x, una circonferenza di lunghezza pari a 2πyP . Da ciò
segue che un trattino infinitesimo di lunghezza d` sulla curva Γ descrive una
superficie infinitesima la cui area è data da 2πyP d`, a meno di infinitesimi
di ordine superiore al primo. Da ciò segue che l’area della superficie S è
282
13. Calcolo Integrale
data dal seguente integrale:
Z
Area(S) = 2πy(t) d`(t)
Γ
Z 2π
√ √
= 2π
2(1 − cos t) 2 2 1 − cos t dt
0
√ Z 2π
= 8π 2
(1 − cos t)3/2 dt
0
√ Z 2π √
t
= 8π 2
2 2 sin3 dt
2
Z π0
= 64π
sin3 u du,
0
ove si è usata l’identità
1 − cos t = 2 sin2
t
2
e si è posto poi u = t/2.
Quest’ultimo integrale si calcola facilmente integrando per parti, ottenendo
Z
1
sin3 u du = − cos u (sin2 u + 2).
3
Sviluppando i calcoli, si trova infine che l’area della superficie S è pari a
256
π.
3
Per terminare, notiamo come, operando nel modo descritto sopra, non
sia necessario determinare una parametrizzazione della superficie S al fine
di calcolare l’elemento infinitesimo di area dS per ottenere poi, tramite un
integrale doppio, l’area di S.
3.3. Integrali tripli
Svolgimento esercizio 19. Sia C un cono circolare di raggio di base r e
altezza h. Fissiamo il sistema di riferimento in modo che la base del cono
sia contenuta nel piano xy e l’asse del cono coincida con l’asse z.
Il volume del cono C è dato dal seguente integrale triplo:
ZZZ
Vol(C ) =
dx dy dz.
C
Per calcolare questo integrale utilizziamo il metodo di integrazione per
strati:
ZZZ
Z h ZZ
dx dy dz =
dz
dx dy.
C
0
Cz
Lo strato Cz , ottenuto intersecando il cono con il piano parallelo al piano
xy passante per il punto di coordinate (0, 0, z), è un cerchio il cui raggio r0
3. Soluzioni
283
si verifica facilmente essere dato da
r0 =
r(h − z)
.
h
Si ha dunque:
ZZ
2
dx dy = πr0 =
Cz
πr2
(h − z)2 .
h2
Possiamo ora completare il calcolo del volume del cono:
ZZZ
Vol(C ) =
dx dy dz
C
Z h ZZ
=
dz
dx dy
Cz
0
2
=
πr
h2
Z
h
(h − z)2 dz
0
h
πr
1
3
= 2 − (h − z)
h
3
0
1
= πhr2 .
3
2
Svolgimento esercizio 20. Sia S la sfera di raggio R centrata nell’origine:
S = {(x, y, z) | x2 + y 2 + z 2 ≤ R2 }.
Se introduciamo le coordinate sferiche ρ, φ e θ, legate alle coordinate cartesiane x, y, z dalla trasformazione di coordinate


 x = ρ sin φ cos θ
y = ρ sin φ sin θ

 z = ρ cos φ,
con ρ ≥ 0, 0 ≤ φ ≤ π e 0 ≤ θ < 2π, la sfera S è descritta come segue:
S 0 = {(ρ, φ, θ) | 0 ≤ ρ ≤ R, 0 ≤ φ ≤ π, 0 ≤ θ ≤ 2π}.
In coordinate sferiche la sfera S diventa quindi il parallelepipedo S 0 .
Ricordiamo ora che l’elemento di volume dx dy dz è espresso, in coordinate sferiche, dalla formula
dx dy dz = ρ2 sin φ dρ dφ dθ.
284
13. Calcolo Integrale
Siamo ora in grado di calcolare il volume della sfera S:
ZZZ
Vol(S) =
dx dy dz
S
ZZZ
=
ρ2 sin φ dρ dφ dθ
0
S
Z R Z π Z 2π
=
dρ
dφ
ρ2 sin φ dθ
0
0
0
Z R Z π
= 2π
dρ
ρ2 sin φ dφ
0
0
Z R
= 4π
ρ2 dρ
0
1 3
= 4π
ρ
3
R
=
0
4
πR3 .
3
Svolgimento esercizio 21. L’ellissoide E di semiassi a, b e c è definito
dalla seguente disequazione:
E :
x2 y 2 z 2
+ 2 + 2 ≤ 1.
a2
b
c
Se poniamo X = x/a, Y = y/b e Z = z/c, la disequazione precedente
diventa:
E 0 : X 2 + Y 2 + Z 2 ≤ 1.
Nelle nuove coordinate X, Y e Z, l’ellissoide E è quindi diventato una sfera
di raggio 1.
Calcoliamo ora la matrice jacobiana J della precedente trasformazione
di coordinate, che scriviamo nella forma


 x = aX
y = bY

 z = cZ.
Si vede immediatamente che


a 0 0
J = 0 b 0 ,
0 0 c
e quindi det J = abc. Concludiamo quindi che, nella precedente trasformazione di coordinate, l’elemento infinitesimo di volume si trasforma come
segue:
dx dy dz = abc dX dY dZ.
3. Soluzioni
285
Possiamo ora calcolare il volume dell’ellissoide, usando la formula per il
cambiamento di variabili negli integrali tripli:
ZZZ
ZZZ
Vol(E ) =
dx dy dz =
abc dX dY dZ = abc Vol(E 0 ).
E
E0
Dato che, come abbiamo prima osservato, E 0 è una sfera di raggio 1, il suo
volume è noto:
4
Vol(E 0 ) = π.
3
Si conclude quindi che
4
Vol(E ) = π abc.
3
Per terminare, notiamo come, con una semplice trasformazione di coordinate abbiamo potuto determinare il volume dell’ellissoide E senza dover, in
effetti, calcolare alcun integrale.