Lezioni di Algebra Lineare V. Autovalori e autovettori

Versione novembre 2008
Lezioni di Algebra Lineare
V. Autovalori e autovettori
Contenuto
1. Cambiamenti di base
2. Applicazioni lineari, matrici e cambiamenti di base
3. Autovalori e autovettori
2
1. Cambiamenti di base.
Supponiamo di avere due basi B e B 0 dello spazio vettoriale V . Sia dim V = n,
B = {v1 , . . . , vn } e B 0 = {w1 , . . . , wn }. Il problema che affrontiamo in questo
paragrafo è: che relazione c’è tra le coordinate rispetto a B e le coordinate rispetto
a B 0 di un generico vettore v di V ?
Facciamo prima un esempio molto semplice. Supponiamo che V sia Rn , e che
una delle due basi sia la base canonica, che denotiamo con C. In questo caso tutti
i vettori sono espressi in modo naturale in coordinate rispetto a C, cioè per ogni
v ∈ Rn , v = vC . Quindi supponiamo di voler usare una nuova base di Rn , diciamo
B 0 , e di voler passare, per ogni vettore di Rn , dalle coordinate naturali, cioè quelle
rispetto a C, alle coordinate rispetto a B 0 . Chiaramente per i vettori di B 0 la cosa è
immediata: se B 0 = {v1 , . . . , vn }, allora le coordinate di v1 , v2 , . . . , vn rispetto a sè
stessi sono
   
 
1
0
0
0 1
 
   
 
  0
 
 . , . ,..., . ,
 ..   .. 
 .. 
   
 
   
0
0
0
1
rispettivamente. Se v è un vettore qualunque di Rn , per determinare le sue coordinate rispetto a B 0 dobbiamo risolvere il sistema
M x = v,
dove M è la matrice che ha per colonne i vettori di B 0 , scritti in coordianate naturali.
Questo è un sistema a soluzione unica, perché B 0 è una base; in effetti M è una
matrice invertibile e la soluzione del sistema è il vettore
M −1 v.
Otteniamo quindi che, per ogni v ∈ Rn ,
vB0 = M −1 vC ,
e
vC = M v B 0 .
Osserviamo che dalle relazioni precedenti segue che le colonne di M −1 devono essere
i vettori della base canonica C scritti in coordinate rispetto alla base B 0 .
3
Torniamo al caso generale e fissiamo le notazione: per ogni v ∈ V indichiamo
con vB e vB0 i vettori delle coordinate di v rispetto alle basi B e B 0 , rispettivamente,
cioè:

a1
.
vB =  ..  ,
an


b1
.
=  .. 

vB0
bn
dove gli ai e i bi (i = 1, . . . , n) sono gli unici numeri reali tali che
v = a1 v1 + · · · + an vn ,
v = b1 w1 + · · · + bn wn .
Supponiamo di conoscere le coordinate dei vettori di B 0 rispetto a B. Allora per
ogni vettore v possiamo passare direttamente dalle coordinate rispetto a B 0 a quelle
rispetto a B. Infatti, se
w1 = a11 v1 + a21 v2 + · · · + an1 vn , . . . . . . , wn = a1n v1 + a2n v2 + · · · + ann vn ,
da
v = b1 w1 + · · · + bn wn
otteniamo la scrittura di v in funzione della base B sostituendo ai wi le loro espressioni in funzione dei vj scritte sopra. Facendo esplicitamente i calcoli si ottiene
facilmente che, se M = (w1 B | · · · |wn B ), cioè
a11
 a21
M =
 ...

an1
a12
·
..
.
···
···

a1n
· 
,
.. 
. 
·
···
ann
allora
vB = M v B 0 ,
e quindi
vB0 = M −1 vB .
Per l’ultima uguaglianza abbiamo usato il fatto che M è una matrice di rango n,
perché B 0 è una base, quindi M è invertibile.
È immediato verificare che M −1 = (v1B0 | · · · |vnB0 ), cioè: le colonne di M −1 sono
i vettori della base B, scritti in coordinate rispetto alla base B 0 .
Definizione. Le matrici M ed M −1 si chiamano matrici di passaggio dalla base
B 0 alla base B e viceversa.
4
Problemi.
1. Sia C la base canonica di R3 e sia B = {t(1 0 0), t(1 1 0), t(1 1 1)}.
(a) Determinare le matrici di passaggio dalla base B alla base C e viceversa.
(b) Scrivere le coordinate del vettore t(2 5 3) rispetto alla base B.
(c) Scrivere le coordinate del generico vettore t(a b c) di R3 rispetto alla base B.
(d) Se v ∈ R3 ha coordinate t(a0 b0 c0 ) rispetto a B, quali sono le sue coordinate
rispetto a C?
Risoluzione.
(a) La matrice di passaggio da B a C è la matrice M che ha per colonne i vettori
di B scritti rispetto alla base C, cioè

1

M= 0
0
1
1
0

1
1.
1
La matrice di passaggio da C a B è l’inversa di M o, equivalentemente, la matrice
che ha per colonne i vettori della base canonica di R3 scritti in coordinate rispetto a
B. Detti v1 , v2 , v3 i vettori di B, nell’ordine scritto sopra, si ha chiaramente e1 = v1 ,
e2 = v2 − v1 , e3 = v3 − v2 , quindi, rispetto a B, le coordinate di e1 , e2 , e3 sono
(1, 0, 0),t(−1, 1, 0), t(0, −1, 1), rispettivamente. Segue che la matrice di passaggio
da C a B è

M −1
1

= 0
0

−1
0
1 −1  .
0
1
(b) Basta moltiplicare t(2 5 3) per M −1 a sinistra:

  

1 −1
0
2
−3
0
1 −1   5  =  2  .
0
0
1
3
3
Dunque il vettore delle coordinate di t(2 5 3) rispetto a B è t( − 3, 2, 3) (cioè
t
(2 5 3) = −3v1 + 2v2 + 3v3 ).
(c) Analogo al punto precedente:

  

1 −1
0
a
a−b
0
1 −1   b  =  b − c  ,
0
0
1
c
c
quindi le coordinate richieste sono a − b, b − c, c.
5
(d) Basta moltiplicare t(a0 b0 c0 ) a sinistra per M , quindi le coordinate richieste sono
a0 + b0 + c0 , b0 + c0 , c0 .
1
1
4
3
2. Consideriamo le basi di R B1 =
,
, B2 =
,
.
2
1
1
1
(a) Determinare le matrici di passaggio da B1 a B2 e viceversa.
2
(b) Se v ∈ R2 ha coordinate t(a b) rispetto a B1 , quali sono le coordinate di v
rispetto a B2 ?
(c) Se v ∈ R2 ha coordinate t(a0 b0 ) rispetto a B2 , quali sono le coordinate di v
rispetto a B1 ?
Risoluzione. Per risolvere al problema bisogna scrivere i vettori di B1 come combinazione lineare di B2 e viceversa. [Provate a fare il conto direttamente e confrontate
con la soluzione che stiamo per dare.] Poniamo
1 1
4 3
M1 =
M2 =
.
2 1
1 1
x
Se v =
∈ R2 (quindi x, y sono le coordinate di v rispetto alla base canonica),
y
allora M1−1 v è il vettore delle coordinate di v rispetto a B1 , mentre M2−1 v è il
vettore delle coordinate di v rispetto a B2 . Segue che M2−1 M1 ha per colonne le
coordinate dei vettori di B1 rispetto a B2 , quindi è la prima delle matrici richieste.
Analogamente, M1−1 M2 ha per colonne le coordinate dei vettori di B2 rispetto a
B1 , quindi è la matrice di passaggio da B2 a B1 . (Notate che le due matrici sono
l’una l’inversa dell’altra.) Calcolando esplicitamente si ottiene:
−1
1
1 −3
−1
−1
M1 =
M2 =
,
2 −1
−1
4
quindi
M2−1 M1
=
−5
7
−2
3
,
M1−1 M2
=
−3
7
−2
5
.
(b) Se v ∈ R2 ha coordinate t(a b) rispetto a B1 , allora le sue coordinate rispetto a
B2 sono
M2−1 M1
a
−5a − 2b
=
.
b
7a + 3b
(c) Se v ∈ R2 ha coordinate t(a0 b0 ) rispetto a B2 , allora le sue coordinate rispetto
a B1 sono
M1−1 M2
a0
b0
=
−3a0 − 2b0
7a0 + 5b0
.
6
2. Applicazioni lineari, matrici e cambiamenti di base.
Supponiamo che V e W siano due spazi vettoriali e che
f :V →W
sia un’applicazione lineare da V in W .
Abbiamo visto che nel caso particolare in cui V e W sono spazi vettoriali di tipo
Rk l’applicazione f è rappresentata da una matrice. Lo stesso vale qualunque siano
gli spazi V e W , una volta fissate una base di V e una base di W .
Supponiamo BV = {v1 , . . . , vn } sia una base di V , e supponiamo fissata anche
una base BW di W . Rappresentiamo quindi ogni vettore v ∈ V con il suo vettore
v (in Rn ) di coordinate rispetto a BV e ogni vettore di W con il suo vettore w (in
Rm ) di coordinate rispetto a BW . Consideriamo quindi la matrice
Mf = (f (v1 )| · · · |f (vn ))
(∗)
Per costruzione Mf è una matrice m × n. Se v ∈ V e v = t(a1 · · · an ), allora per
definizione v = a1 v1 + · · · + an vn , quindi f (v) = a1 f (v1 ) + · · · + an f (vn ) e

a1
.
f (v) = a1 f (v1 ) + · · · + an f (vn ) = Mf  ..  = LMf (v).
an

Otteniamo quindi che:
se fissiamo una base di V e una base di W , allora ogni applicazione lineare f di
V in W è rappresentata dalla moltiplicazione a sinistra per una matrice, cioè è di
tipo LM .
È chiaro che la matrice Mf definita in (∗) non dipende solo f , ma anche dalle
basi scelte.
Definizione. Mf si chiama “la matrice di f rispetto alle basi BV e BW .”
Osservazione. La definizione appena data è coerente con la definizione “matrice
rispetto alle basi canoniche” data in precedenza per le applicazioni da Rm a Rn
7
(III dispensa, pag. 4). Basta osservare che se M è una matrice reale n × m, LM :
Rm → Rn è l’applicazione lineare associata e {e1 , . . . , em } è la base canonica di Rm ,
allora le colonne M sono ordinatamente LM (e1 ), . . . , LM (en ), scritti naturalmente
rispetto alla base canonica di Rn .
Problema. Sia
2
f :R →R
x
x−y
7→
.
y
−x
2
Verificare che f è lineare e scriverne la matrice rispetto alla base canonica di R2 (si
intende sia sul dominio, sia sul codominio).
Se scegliamo come base (sia sul dominio sia sul codominio)
1
2
B=
,
1
1
qual è la matrice di f ?
Risoluzione. Per la prima parte procediamo come nell’esercizio precedente. Abbiamo che
x
1
f
=
y
−1
x
,
y
1
quindi f è lineare perché uguale a LM , con M =
−1
matrice di f rispetto alla base canonica.
−1
0
−1
. Inoltre M è la
0
Per rispondere all’ultima domanda, consideriamo la matrice di passaggio da B
alla base canonica, cioè la matrice
P =
1
1
2
1
Allora la matrice richiesta è
P −1 M P.
Spieghiamo perché. In base alla definizione, per scrivere la matrice di f rispetto a
B dobbiamo calcolare le immagini dei vettori di B e scriverle in coordinate rispetto
alla base B stessa. Visto che f è la moltiplicazione a sinistra per M abbiamo che
1
1 −1
1
0
2
1 −1
2
1
f
=
=
;
f
=
=
1
−1
0
1
−1
1
−1
0
1
−2
Segue che
MP =
1
−1
−1
0
1
1
2
1
=
0
−1
1
−2
,
8
cioè M P è la matrice che ha per colonne le immagini di B. Queste immagini
sono scritte però rispetto alla base canonica e non rispetto alla base B, come ci
servirebbe. Nel Paragrafo 11 abbiamo visto che per passare dalle coordinate canoniche a quelle rispetto a B basta moltiplicare a sinistra per la matrice P −1 , quindi
la matrice richiesta è
P −1 M P,
cioè (i calcoli sono lasciati al lettore per esercizio)
−2
1
−5
3
.
Il procedimento descritto nel problema precedente si generalizza nel seguente enunciato (di cui omettiamo la dimostrazione).
Proposizione. Sia f : V → W un ’applicazione lineare, BV una base di V , BW
0
una base di W , e M la matrice di f rispetto a queste basi. Se BV0 e BW
sono altre
0
due basi di V e W , allora la matrice di f rispetto a BV0 e BW
è
P −1 M Q,
0
dove P e Q sono le matrici di passaggio da BV0 a BV e da BW
a BW , cioè, P è
la matrice che ha per colonne i vettori di BV0 scritti rispetto alla base BV e Q è la
0
scritti rispetto alla base BW .
matrice che ha per colonne i vettori di BW
Corollario. Sia f : Rn → Rn un endomorfismo e sia M la matrice di f rispetto
alla base canonica (in partenza e in arrivo). Se B è un’altra base di Rn , allora la
matrice di f rispetto a B (in partenza e in arrivo), è
P −1 M P,
dove P è la matrice che ha per colonne i vettori di B, scritti in coordinate naturali.
9
3. Autovalori e Autovettori.
Supponiamo che V sia uno spazio vettoriale reale di dimensione n e che
f :V →V
sia un’applicazione lineare, cioè un endomorfismo di V .
Definizione 1. Un autovettore di f è un vettore v ∈ V diverso dal vettore nullo
tale che
f v = αv
per un certo scalare α.
Se v è un autovettore di f e α ∈ R è il numero reale tale che f v = αv, allora diciamo
che α è un autovalore di f e che v è un autovettore relativo all’autovalore α.
Osservazioni.
1. La relazione f 0 = α0 è vera per ogni numero reale α, ma 0 non è un autovettore,
per definizione.
2. È chiaro che un autovettore, essendo non nullo per definizione, è relativo ad un
unico autovalore.
Se fissiamo una base in V allora possiamo identificare V con Rn e realizzare
f come un’applicazione di tipo LM , moltiplicazione a sinistra per una matrice M
(n × n).
Allora il vettore v 6= 0 è un autovettore di f se e solo se
M v = αv
(∗)
per un certo α ∈ R. Se I è la matrice identità n × n, allora
αv = (αI)v,
quindi, sommando −(αI)v alla (∗), otteniamo M v − (αI)v = 0 e, applicando la
proprietà distributiva,
(M − αI)v = 0.
10
Poiché v 6= 0 per definizione, la relazione precedente dice in particolare che il sistema
omogeneo
(M − αI)x = 0
ha soluzioni non nulle e quindi, per la Proposizione 4 della IV dispensa (pag. 12),
det (M − αI) = 0
(∗∗)
Poiché, viceversa, se det (M − αI) = 0 allora (M − αI)x = 0 ha delle soluzioni non
nulle, invertendo i passaggi otteniamo il risultato seguente.
Proposizione 1. Sia M la matrice di f rispetto a una qualunque base di V . Allora
il numero α ∈ R è un autovalore di f se e solo se
det (M − αI) = 0.
Se α è un autovalore di f , allora gli autovettori di f relativi a α sono le soluzioni
non nulle del sistema omogeneo
(M − αI)x = 0.
Definizione 2. Sia M una matrice reale n × n. Un autovettore di M è un vettore
v ∈ Rn diverso dal vettore nullo tale che
M v = αv
per un certo scalare α.
Se v è un autovettore di M e α ∈ R è il numero reale tale che M v = αv, allora diciamo che α è un autovalore di M e che v è un autovettore relativo all’autovalore α.
Dunque la Proposizione 1 dice che gli autovalori e gli autovettori di f (che non
dipendono dalla scelta della base) corrispondono agli autovalori e agli autovettori
della matrice di f rispetto a una qualunque base fissata.
La Proposizione 1 fornisce uno strumento per calcolare gli autovalori e gli autovettori di f . In più, dice quanti sono al massimo gli autovalori di f . Vale infatti
il fatto seguente.
11
Proposizione 2. Sia M una matrice n × n. Allora
χM (λ) =def det (M − λI)
è un polinomio di grado n nell’indeterminata λ.
Gli autovalori di M sono le radici di questo polinomio.
In particolare, gli autovalori di M sono al massimo n.
La seconda parte della Proposizione 2 segue direttamente dalla Proposizione 1.
La prima parte non è difficile da dimostrare, ma qui non ne diamo alcuna dimostrazione. Provate a capire perché è vera in generale, dopo avere letto l’esempio
seguente.

1

Esempio 1. Sia M = 4
7

1
M − λI =  4
7
2
5
8
2
5
8

3
6 . Allora
9
 
λ
3
6 − 0
0
9
0
λ
0
 
0
1−λ
0 =  4
7
λ

2
3
5−λ
6 .
8
9−λ
Con lo sviluppo di Lalace rispetto alla prima riga otteniamo:
χM (λ) = (1 − λ)[(5 − λ)(9 − λ) − 48] − 2[4(9 − λ) − 42] + 3[32 − 7(5 − λ)].
È chiaro che non vi sono termini di grado maggiore 3 e che solo il primo addendo
fornisce un contributo al termine di grado 3. Precisamente, il termine principale di
χM (λ) è −λ3 .
Definizione 3. Il polinomio χM (λ) definito nella Proposizione 2 si chiama il
polinomio caratteristico della matrice M .
Se cambiamo la scelta della base, come sappiamo dalla seconda parte delle lezioni,
la matrice M cambia in C −1 M C, dove C è la matrice del canbiamento di base. Il
polinomio caratteristico di C −1 M C è
det (C −1 M C − λI).
12
Osserviamo che C −1 IC = I, quindi, per la proprietà distributiva, C −1 M C − λI =
C −1 (M − λI)C. Utilizzando il Teorema di Binet, otteniamo che il determinante di
questa matrice è
det (C −1 (M − λI)C) = det (C −1 )det (M − λI)det C = (det C)−1 det (M − λI)det C
= det (M − λI).
Otteniamo quindi il risultato seguente.
Proposizione 3. Se M e C sono matrici n × n e C è invertibile, allora M e
C −1 M C hanno lo stesso polinomio caratteristico.
Quindi se le matrici M e M 0 rappresentano il medesimo endomorfismo f di V
rispetto a due basi diverse, allora M e M 0 hanno lo stesso polinomio caratteristico.
Grazie alla Proposizione 3, possiamo definire il polinomio caratteristico di un
endomorfismo.
Definizione 30 . Il polinomio caratteristico di f è il polinomio caratteristico della
matrice di f rispetto a una qualunque base di V .
La Proposizione 1 può essere rienunciata nel modo seguente.
Teorema 1. Gli autovalori di f sono le radici del suo polinomio caratteristico.
Gli autovettori di f relativi all’autovalore α sono gli elementi non nulli del sottospazio vettoriale ker (f − αId), dove Id è l’applicazione identità di V in sè.
Esempio 1. Sia
f : R3 → R3


 
2x + z
x
 y  7→  2y + 3z  .
x
−z
La matrice di f rispetto alla base canonica di R3 è


2 0
1
M = 0 2
3
0 0 −1
quindi il polinomio caratteristico di f è
2 − λ
0
1
0
2−λ
3 = (−1 − λ)(2 − λ)2
0
0
−1 − λ 13
Quindi f ha come autovalori −1 e 2.
Per calcolare gli autovettori di f dobbiamo calcolare esplicitamente gli spazi nulli
delle matrici M − (−1)I e M − 2I: gli elementi non nulli di questi spazi sono gli
autovettori.
Calcoliamo prima gli autovettori relativi a −1. Risolviamo quindi il sistema
omogeneo
(M + I)x = 0.
La matrice dei coefficienti è

3 0

M +I = 0 3
0 0

1
3,
0
quindi risolvendo il sistema si trova
Perciò
x = − 13 z
.
y = −z

 1 

 −3z
N (M + I) =  −z  | z ∈ R ,


z
e quindi l’insieme degli autovettori relativi a −1 è
 1 

 −3z

 −z  | z ∈ R, z 6= 0 .


z
Calcoliamo ora gli autovettori relativi a 2 risolvendo il sistema omogeneo
(M − 2I)x = 0.
La matrice dei coefficienti è

0
M − 2I =  0
0
0
0
0

1
3,
−3
quindi risolvendo il sistema si trova semplicemente
{z = 0 ,
14
mentre x e y sono libere. Perciò
 

 x



N (M − 2I) =
y | x, y ∈ R


0
e l’insieme degli autovettori relativi a 2 è
 

 x

 y  | x, y ∈ R, (x, y) 6= (0, 0) .


0
Algebra: fatti da ricordare e complementi.
Sia p(x) un polinomio a coefficienti reali nell’indeterminata x. Indichiamo con
deg p(x) il grado di p(x).
• Definizione A. Una radice reale di p(x) è un numero reale α tale che p(α) = 0
(dove p(α) è il numero reale ottenuto sostituendo α all’indeterminata x).
• Teorema A. Il numero reale α è una radice di p(x) se e solo se p(x) è divisibile
per (x − α), cioè se e solo se esiste un polinomio a coefficienti reali q(x) (di grado
n − 1) tale che
p(x) = (x − α)q(x).
(∗)
Supponiamo che α sia una radice di p(x) e consideriamo la fattorizzazione (∗).
Se α è radice anche del polinomio q(x), allora possiamo fattorizzare anche q(x) in
accordo con il Teorema A, diciamo q(x) = (x − α)q2 (x) (con deg q2 (x) = n − 2).
Induttivamente otteniamo la fattorizzazione
p(x) = (x − α)mα s(x),
dove mα è un intero positivo e s(x) è un polinomio, di grado n − mα , non divisibile
per (x − α). L’intero mα si chiama la molteplicità della radice α del polinomio p(x).
• Definizione B. La molteplicità della radice α del polinomio p(x) è il massimo
degli interi m tali che p(x) è divisibile per (x − α)m .
15
Esempio 2. Consideriamo il polinomio
p(x) = (x − 1)(x2 + x − 2)(x2 + 1).
Il fattore x2 +x−2 ha come radici reali 1 e −2, quindi si fattorizza come (x−1)(x+2),
mentre il fattore x2 + 1 non ha radici reali e quindi è irriducibile. Ne segue che
p(x) = (x − 1)2 (x + 2)(x2 + 1)
e che le radici di p(x) sono 1, con molteplicità 2, e −2, con molteplicità 1.
• Terminologia: quante radici reali ha un polinomio. Di solito, quando
diciamo che il polinomio reale p(x) ha k radici reali sottintendiamo che contiamo le
radici con la loro molteplicità. Ad esempio per il polinomio dell’Esempio 2 diciamo
che ha 3 radici reali (1 contata due volte, e −2 contata una volta). Se invece
contiamo la radici senza tenere conte della molteplicità, allora specifichiamo che
stiamo contando le radici distinte. Ad esempio il polinomio dell’Esempio 2 ha 2
radici reali distinte.
• Teorema B. Se deg p(x) = n, allora p(x) ha al massimo n radici reali (contate
con molteplicità).
Torniamo agli autovalori.
Definizione 4. Sia α un autovalore dell’endomorfismo f . La molteplicità algebrica
di α è la molteplicità di α come radice del polinomio caratteristico di f .
Abbiamo un’altra nozione di molteplicità di un autovalore.
Definizione 5. Sia α un autovalore dell’endomorfismo f . La molteplicità geometrica di α è la dimensione del sottospazio vettoriale ker (f − αId).
Per definizione di autovalore, se α è un autovalore di f allora ker (f − αId) è un
sottospazio non nullo, quindi la molteplicità geometrica di α è necessariamente un
intero strettamente positivo.
La traduzione nel linguaggio delle matrici delle precedenti definizioni è la seguente:
16
Definizione 40 +50 . Sia α un autovalore della matrice M .
La molteplicità algebrica dell’autovalore α è la sua molteplicità come radice del
polinomio caratteristico det (M − λI).
La molteplicità geometrica di α è la dimensione dello spazio nullo N (M − αI).
Esempio 3. Sia
f : R3 → R3
 


x
2x + y
 y  7→  2y  .
x
2z
La matrice di f rispetto alla base canonica di

2 1

M= 0 2
0 0
R3 è

0
0
2
quindi il polinomio caratteristico di f è
2 − λ
1
0 0
2−λ
0 = (2 − λ)3 .
0
0
2 − λ
Quindi f ha come unico autovalore 2, con molteplicità algebrica 3.
La molteplicità geometrica di 2 è

0
M − 2I =  0
0
la dimensione dello spazio nullo della matrice
   
0
1 0
x
0 0y  = 0.
z
0
0 0
Sappiamo che in generale, se A è una matrice n × n, allora dim N (A) = n − rk A,
quindi la molteplicità geometrica di 2 è
3 − rk (M − 2I) = 3 − 1 = 2.
Esercizio 1. Considerate le due matrici



2 0
2 1 0



M1 = 0 2 1 ; M3 = 0 2
0 0
0 0 2

0
0.
2
Verificate che entrambe hanno lo stesso polinomio caratteristico della matrice M
dell’Esempio 3 e che la molteplicità dell’autovalore 2 è 1 per la matrice M1 e 3 per
la matrice M3 .
17
Supponiamo che B = {v1 , . . . , vn } sia una base dello spazio vettoriale V tale che
la matrice M di f rispetto a B sia diagonale, poniamo


α1 0 . . . . . .
0
.. 

 0 α2
0 ...
. 
 .
.. 
.
.

..
..
M =
 ..
0
. .
 .

..
..
 ..
.
. 0 
0 ... ...
0 αn
Per definizione le colonne di M sono le coordinate di f (v1 ), . . . , f (vn ) rispetto a B, e
quindi otteniamo che f (vi ) = αi vi , per i = 1, . . . , n. Questo vuol dire che v1 , . . . vn
sono autovettori di f , relativi agli autovalori α1 , . . . , αn , rispettivamente.
Viceversa, è chiaro che la matrice di f rispetto ad una base costituita di autovettori è una matrice diagonale e che i termini diagonali di questa matrice sono
autovalori di f .
Definizione 6. L’endomorfismo f si dice diagonalizzabile se esiste una base di f
costituita di autovettori, cioè una base rispetto alla quale f ha matrice diagonale.
La matrice reale quadrata M si dice diagonalizzabile se esiste una matrice reale
invertibile C tale che C −1 M C è una matrice diagonale.
Osservazione 3. Se M è la matrice di f rispetto a una qualunque base, allora f
è diagonalizzabile se e solo se M è diagonalizzabile. Il “solo se” è immediato dalla
definizione; il “se” segue dal fatto che ogni matrice invertibile è la matrice di un
cambiamento di base (perché ?).
Esempi.
4. L’applicazione f dell’Esempio 3 non è diagonalizzabile. Infatti il suo unico
autovalore, 2, ha molteplicità geometrica 2. Questo vuol dire che lo spazio nullo
di (M − 2I) ha dimensione 2, quindi, poiché gli autovettori appartengono a questo
spazio nullo, un insieme linearmente indipendente di autovettori ha al massimo 2
elementi: ne segue che non può esistere una base di R3 costituita di autovettori di
f.
5. Consideriamo l’applicazione lineare
 


x
2x
f : R3 → R3  y  7→  x + 3y  .
z
2x + 3z
18
La matrice di f rispetto alla base canonica è

2

M= 1
2

0 0
3 0,
0 3
quindi il polinomio caratteristico di f è
2 − λ
1
2
0
0 3−λ
0 = (2 − λ)(3 − λ)2 .
0
3 − λ
Gli autovalori sono quindi 2, con molteplicità algebrica 1, e 3, con molteplicità
algebrica 1. Le molteplicità geometriche sono:
per 2

0 0
3

dim R − rk (M − 2I) = 3 − rk 1 1
2 0

0
0  = 3 − 2 = 1,
1
e per 3

−1 0
dim R3 − rk (M − 3I) = 3 − rk  1 0
2 0

0
0  = 3 − 1 = 2.
0
Quindi sappiamo che possiamo trovare un insieme indipendente di 2 autovettori relativi a 2, cosı̀ come ovviamente possiamo trovare un autovettore relativo a 3 (non
nullo per definizione). Se mettendo insieme i tre autovettori cosı̀ trovati ottenessimo
ancora un insieme linearmente inidipendente, avremmo una base di autovettori e
potremmo diagonalizzare f . In realtà succede proprio questo: calcoliamo esplicitamente gli autovettori di f . Risolviamo il sistema (M − 2I)x = 0.
x+y =0
; ci conviene lasciare libera la x, otteniamo:
2x + 2z = 0
y = −x
, quindi
z = −x



x


N (M − 2I) =  −x  | x ∈ R .


−x
Risolvendo (M − 3I)x = 0 troviamo solo la condizione { x = 0 , mentre y e z sono
libere, quindi
 

 0

N (M − 3I) =  y  | y, z ∈ R .


z
19


1
Una base di N (M − 2I) è costituita ad esempio dal singolo vettore  −1 , mentre
−1
   
0 
 0



una base di N (M − 3I) è, ad esempio,
1 , 0  . Ora è evidente che i tre


0
1
autovettori cosı̀ trovati sono linearmente indipendenti, perché si vede immediatamente che il determinante della matrice

1

C = −1
−1
0
1
0

0
0
1
è uguale a 1, quindi

    
1
0
0 






B=
−1 , 1 , 0 


−1
0
1
è una base di R3 costituita di autovettori, relativi a 2, a 3, a 3, rispettivamente.
Questo dice che f è diagonalizzabile, precisamente che la matrice di f rispetto a B
è la matrice diagonale

2

D= 0
0

0 0
3 0.
0 3
In più, poiché la matrice C scritta sopra è la matrice di passaggio dalla base B alla
base canonica, abbiamo che
D = C −1 M C.
Definizione 7. L’endomorfismo f si dice triangolarizzabile se esiste una base di
V rispetto alla quale f ha matrice triangolare.
La matrice reale quadrata M si dice triangolarizzabile se esiste una matrice reale
invertibile C tale che C −1 M C sia una matrice triangolare.
Osservazione 4. Come per la diagonalizzabilità, vale il fatto seguente: se M è la
matrice di f rispetto a una qualunque base, allora f è triangolarizzabile se e solo
se M è triangolarizzabile.
A questo punto punto enunciamo i due teoremi fondamentali di questa sezione.
Del primo teorema non daremo alcuna dimostrazione.
un’idea abbastanza dettagliata della dimostrazione.
Per il secondo daremo
20
Teorema 2. Sia V uno spazio vettoriale reale di dimensione n e sia f un endomofirsmo di v. Allora f è triangolarizzabile se e solo se il suo polinomio caratteristico ha n radici reali (contate con molteplicità).
Teorema 3. Sia V uno spazio vettoriale reale di dimensione n e sia f un endomofirsmo di v. Allora f è diagonalizzabile se e solo se valgono entrambe le
condizioni seguenti:
(1) il polinomio caratteristico di f ha n radici reali (contate con molteplicità);
(2) per ogni autovalore di f la molteplicità geometrica coincide con la molteplicità algebrica.
Osservazione 5. Dire che un polinomio p(x) di grado n ha n radici reali (contate
con molteplicità) equivale a dire che p(x) ha una fattorizzazione del tipo
p(x) = c(x − α1 )m1 · · · (x − αk )mk ,
dove c è una costante reale, α1 , . . . , αk sono le radici reali distinte di p(x) e m1 , . . . ,
mk sono le loro molteplicità. Osserviamo che l’uguaglianza scritta sopra implica
che
n = m1 + · · · + mk .
La dimostrazione del Teorema 3 è basata sui due risultati seguenti.
Lemma 1. Per ogni autovalore dell’endomorfismo f la molteplicità geometrica
non supera la molteplicità algebrica.
Lemma 2. Supponiamo che α1 , . . . , αk siano autovalori distinti dell’endomorfismo
(i)
(i)
f e che, per i = 1, . . . , k, {v1 , . . . , vni } sia un insieme linearmente indipendente
di autovettori relativi a αi . Allora
k
[
(i)
{v1 , . . . , vn(i)i }
i=1
è un insieme linearmente indipendente.
Vediamo come si deduce il Teorema 3 utilizzando i due Lemmi precedenti.
21
Supponiamo che f sia diagonalizzabile. Allora per definizione esiste una base B
di V costituita di autovettori di f . Supponiamo che α1 , . . . , αk siano gli autovalori
distinti di f e supponiamo che in B vi siano esattamente ni autovettori relativi a
αi , per i = 1, . . . , k. Allora
n1 + · · · + nk = |B| = n.
Sia ora mi la molteplicità algebrica di αi , per i = 1, . . . , k. Poiché il polinomio
caratteristico di f , che ha grado n, è divisibile per (x − αi )mi , dobbiamo avere
m1 + · · · + mk ≤ n.
Ma per il Lemma 1 si ha
ni ≤ mi ,
per i = 1, . . . , k,
quindi dalle due relazioni precedenti otteniamo che
ni = mi
per i = 1, . . . , k
e
m1 + · · · + mk = n.
Ed è chiaro che la condizione ni = m1 è la condizione (2) del Teorema 3; mentre la
condizione m1 + · · · + mk = n equivale alla condizione (1).
Supponiamo ora che valgano le condizioni (1) e (2) del Teorema 3. Allora, il
polinomio caratteristico di f è di tipo
c(x − α1 )m1 · · · (x − αk )mk ,
dove c è una costante reale e α1 , . . . , αk sono gli autovalori distinti di f , di molteplicità algebriche m1 , . . . , mk rispettivamente. Si ha quindi
m1 + · · · + mk = n.
Ora per ipotesi la molteplicità geometrica di αi coincide con mi quindi, per definizione di molteplicità geometrica, dim ker (f − αi Id) = mi , per i = 1, . . . , k. Poiché gli
elementi non nulli di ker (f − αi Id) sono gli autovettori relativi a αi , una base
(i)
(i)
}
{v1 , . . . , vm
i
22
di ker (f − αi Id) è un insieme linearmente indipendente di mi autovettori relativi
a αi . A questo punto, il Lemma 2 ci assicura che che
k
[
(i)
(i)
{v1 , . . . , vm
},
i
i=1
è un insieme linearmente indipendente di m1 + · · · + mk autovettori di f , e poiché
m1 + · · · + mk = n = dim V , questo insieme è una base di V . Quindi f è diagonalizzabile.