Endomorfismi 1 Endomorfismi diagonalizzabili, autovalori, autovettori Sia K un campo, una matrice A ∈ ogni i 6= j, ovvero se è del tipo: d1 0 0 d2 A = .. .. . . 0 0 Mn (K) è detta diagonale se aij = 0 per ··· ··· .. . 0 0 .. . · · · dn , di ∈ K, Sia V uno spazio vettoriale di dimensione n su K. Un endomorfismo definito su V è una applicazione lineare di V in sé stesso. Un endomorfismo f si dice diagonalizzabile se esiste un riferimento R di V tale che la matrice associata a f rispetto a R è una matrice diagonale. Rispetto a tale riferimento la rappresentazione matriciale Y = AX di f è data da: y 1 = d 1 x1 , y 2 = d 2 x2 , ··· y n = d n xn , e dunque assume una forma particolarmente semplice. Obiettivo fondamentale a cui siamo interessati è determinare condizioni necessarie e sufficienti affinché un endomorfismo sia diagonalizzabile. 1 Siano A e A0 due matrici quadrate di ordine n su un campo K, si dice che A è simile ad A0 se esiste una matrice invertibile P ∈ Mn (K) tale che: A0 = P −1 AP. Si verifica facilmente che la similitudine tra matrici è una relazione di equivalenza. Teorema 1.1. Sia f : V −→ V un endomorfismo. Siano R e R0 due riferimenti di V e siano A e A0 le matrici associate a f rispetto a R e R0 . Le matrici A e A0 sono simili. Dimostrazione. Sia P la matrice associata all’endomorfismo identico: idV : v ∈ V −→ v ∈ V rispetto ai riferimenti R e R0 . La matrice associata a f ◦idV , rispetto a R e R0 è la matrice prodotto A0 P . La matrice associata a idV ◦f , rispetto a R e R0 è P A. Essendo f ◦idV = idV ◦f , si ha A0 P = P A. Posto R = (e1 , e2 , . . . , en ), le colonne di P sono date da: φR0 (e1 ), φR0 (e2 ), . . . , φR0 (en ), ed essendo φR0 un isomorfismo e i vettori e1 , e2 , . . . , en linearmente indipendenti si ha che le colonne di P sono linearmente indipendenti, ovvero |P | = 6 0. La matrice P è dunque invertibile e si ha: A = P −1 A0 P. 2 Sia V uno spazio vettoriale su un campo K e sia f : V −→ V un endomorfismo. Un vettore non nullo v ∈ V è detto autovettore di f se esiste un elemento k ∈ K tale che: f (v) = kv, l’elemento k è detto autovalore di f . Dunque un autovettore di f è un vettore non nullo che viene trasformato, mediante f , in un vettore ad esso proporzionale. Proposizione 1.2. Ad ogni autovettore è associato un unico autovalore. 2 Dimostrazione. Sia f : V −→ V un endomorfismo, sia v un autovettore di f e siano k1 e k2 due autovalori associati a v. Dalle relazioni: f (v) = k1 v, f (v) = k2 v, segue che (k1 − k2 )v = 0, ed essendo v 6= 0, per la legge di annullamento del prodotto si ha k1 = k2 . 2 Proposizione 1.3. Sia V uno spazio vettoriale su un campo K, sia f un endomorfismo definito su V e sia k ∈ K un autovalore di f . L’insieme: Vk = {v ∈ V : f (v) = kv}, è un sottospazio vettoriale di V . Dimostrazione. Osserviamo che Vk è costituito dall’insieme di tutti gli autovettori di f associati all’autovalore k e dal vettore nullo di V . Siano v, v0 ∈ Vk , allora f (v) = kv e f (v0 ) = kv0 , da cui segue f (v + v0 ) = f (v) + f (v0 ) = kv + kv0 = k(v + v0 ), e quindi v + v0 ∈ Vk . Siano ora t ∈ K e v ∈ Vk , allora f (v) = kv, da cui segue: f (tv) = tf (v) = t(kv) = (tk)v = (kt)v = k(tv), 2 quindi tv ∈ Vk . Il sottospazio vettoriale Vk , definito nella proposizione precedente, è detto autospazio di f associato all’autovalore k. Vedremo ora che l’esistenza in V di una base di autovettori garantisce la diagonalizzabilità di un endomorfismo. Teorema 1.4. Un endomorfismo f : V −→ V è diagonalizzabile se, e solo se, V possiede una base di autovettori di f . 3 Dimostrazione. L’endomorfismo f è un riferimento R = (e1 , e2 , . . . , en ) di V è una matrice diagonale, ovvero: d1 0 0 d2 A = .. .. . . 0 0 diagonalizzabile se, e solo se, esiste rispetto a cui la matrice associata A ··· ··· .. . 0 0 .. . · · · dn . Se C1 , . . . , Cn denotano le colonne di A, si ha che: d1 0 C1 = φR (f (e1 )) = .. , C2 = φR (f (e2 )) = . 0 0 0 Cn = φR (f (en )) = .. . . dn 0 d2 .. . , ..., 0 Dire che A è una matrice diagonale equivale dunque ad affermare che: f (e1 ) = d1 e1 , f (e2 ) = d2 e2 , . . . f (en ) = dn en . Ne segue che f è diagonalizzabile se, e solo se, lo spazio vettoriale V possiede una base B = [e1 , e2 , . . . , en ] formata da autovettori di f . 2 Proposizione 1.5. Sia f : V −→ V un endomorfismo, sia R un riferimento di V e sia A la matrice associata a f rispetto a R. Se k ∈ K è un autovalore di f , allora l’autospazio Vk è rappresentato, rispetto al riferimento R dal sistema lineare omogeneo: (A − kIn )X = 0. Dimostrazione. Sia v ∈ V e siano X = φR (v), Y = φR (f (v)) = AX. Valgono le seguenti equivalenze: v ∈ Vk ⇔ f (v) = kv ⇔ φR (f (v)) = φR (kv) = kφR (v) ⇔ AX = kX ⇔ (A − kIn )X = 0. 2 4 2 Polinomio caratteristico Sia f : V −→ V un endomorfismo, sia R = (e1 , e2 , . . . , en ) un riferimento di V e sia A la matrice associata a f rispetto a R. Il polinomio pA (t) = |A − tIn | è detto polinomio caratteristico di f . Osserviamo che se A = (aij ), allora pA (t) = a11 − t a12 ··· a1n a21 a22 − t · · · a2n .. .. .. .. . . . . an1 an2 · · · ann − t risulta essere un polinomio di grado n sul campo K. Osserviamo inoltre che il polinomio caratteristico non dipende dalla scelta del riferimento, infatti se R0 = (e01 , e02 , . . . , e0n ) è un altro riferimento di V e A0 è la matrice associata a f rispetto a R0 , dal teorema 1.1 segue che le matrici A e A0 sono simili, ovvero A0 = P −1 AP , con P matrice invertibile. Dunque si ha: pA0 (t) = |A0 −tIn | = |P −1 AP −tIn | = |P −1 AP −tIn P −1 P | = |P −1 AP −P −1 tIn P | = |P −1 (A − tIn )P | = |P −1 ||A − tIn ||P | = |A − tIn | = pA (t). 2 In base a tale risultato il polinomio caratteristico di un endomorfismo sarà nel seguito denotato con p(t). Teorema 2.1. Sia f : V −→ V un endomorfismo. Gli autovalori di f sono tutte e sole le radici del polinomio caratteristico appartenenti al campo K. Dimostrazione. Un elemento k ∈ K è un autovalore di f se, e solo se, esiste un vettore non nullo v ∈ V tale che f (v) = kv. Ricordando che rispetto a un riferimento R di V , l’autospazio Vk è rappresentato dal sistema omogeneo (A − kIn )X = 0, si ha: k è un autovalore di f ⇔ Vk 6= {0} ⇔ dimVk > 0 5 ⇔ n − ρ(A − kIn ) > 0 ⇔ |A − kIn | = 0 ⇔ p(k) = 0. 2 Sia k ∈ K un autovalore di un endomorfismo f : V −→ V e sia p(t) il polinomio caratteristico di f , si definisce molteplicità algebrica dell’autovalore k, e si denota con ak , il massimo esponente m tale che p(t) è divisibile per (t − k)m , ovvero p(t) = (t − k)m g(t), e g(t) non è divisibile per il polinomio t − k, cioè, in base al Teorema di Ruffini, g(k) 6= 0. Si definisce inoltre molteplicità geometrica dell’autovalore k, e si denota con gk , la dimensione dell’autospazio Vk . Esiste una relazione di diseguaglianza tra la molteplicità algebrica e la molteplicità geometrica di un autovalore, come mostrato dal seguente: Teorema 2.2. Sia k ∈ K un autovalore di un endomorfismo f : V −→ V . Allora si ha: 1 ≤ gk ≤ ak . Dimostrazione. Poiché k è un autovalore di f , per definizione si ha che Vk 6= {0}, e quindi gk = dimVk ≥ 1. Poniamo r = gk e sia B 0 = [v1 , . . . , vr ] una base di Vk . Essendo B 0 linearmente indipendente esso è contenuto in una base B = [v1 , . . . , vr , vr+1 , . . . , vn ] di V , dove n denota la dimensione di V . Poiché f (v1 ) = kv1 , . . . , f (vr ) = kvr , la matrice associata a f rispetto al riferimento R = (v1 , . . . , vr , vr+1 , . . . , vn ) assume la forma: k 0 · · · 0 a1,r+1 · · · a1n 0 k · · · 0 a2,r+1 · · · a2n . . .. .. .. .. .. . . . . . . . . . 0 · · · 0 k ar,r+1 · · · arn , 0 · · · 0 0 ar+1,r+1 · · · ar+1,n . . .. .. .. .. .. .. .. . . . . . 0 · · · 0 0 an,r+1 · · · an,n 6 e dunque il polinomio caratteristico di f è dato da: p(t) = k−t 0 ··· 0 a1,r+1 0 k − t ··· 0 a2,r+1 .. .. .. .. .. . . . . . 0 ··· 0 k−t ar,r+1 0 ··· 0 0 ar+1,r+1 − t .. .. .. .. .. . . . . . 0 ··· 0 0 an,r+1 ··· ··· .. . a1n a2n .. . ··· ··· .. . arn . ar+1,n .. . · · · ann − t Applicando r volte il teorema di Laplace si trae: p(t) = (k − t)r g(t). Poiché p(t) è divisibile per (k − t)r , esso risulta divisibile anche per (t − k)r , ed essendo ak il massimo esponente m tale che p(t) è divisibile per (t − k)m , si ha che ak ≥ r = gk . 2 3 Caratterizzazione degli endomorfismi diagonalizzabili In questo paragrafo determineremo una condizione necessaria e sufficiente affinché un endomorfismo sia diagonalizzabile, espressa in termini del polinomio caratteristico, delle sue radici e molteplicità. Teorema 3.1. Sia f : V −→ V un endomorfismo e siano k1 , . . . , kt autovalori distinti di f . Gli autospazi Vk1 , . . . , Vkt sono sommandi diretti. Dimostrazione. Procediamo per induzione su t. Sia t = 2 e siano k1 , k2 autovalori distinti di f . Se v ∈ Vk1 ∩ Vk2 allora f (v) = k1 v = k2 v, da cui (k1 − k2 )v = 0. Essendo k1 e k2 autovalori distinti risulta v = 0 e quindi Vk1 ∩ Vk2 = {0}. Gli autospazi Vk1 e Vk1 sono dunque sommandi diretti. Supponiamo ora il risultato vero per t − 1 autovalori e dimostriamolo per t autovalori distinti. Occorre dimostrare che ogni vettore della somma Vk1 + Vk2 + · · · + Vkt si esprime in unico modo come somma di vettori appartenenti 7 ciascuno a un Vki . Sia allora v ∈ Vk1 + Vk2 + · · · + Vkt e supponiamo che v si possa esprimere nei due modi seguenti: v = v1 + v2 + · · · + vt = v10 + v20 + · · · + vt0 , con vi , vi0 ∈ Vki , per i = 1, . . . , t. Posto wi = vi − vi0 , si ha ovviamente che wi ∈ Vki e inoltre: w1 + w2 + · · · + wt = 0. (1) Applicando ad ambo i membri della (1) l’endomorfismo f si ha: k1 w1 + k2 w2 + · · · + kt wt = 0. (2) Moltiplicando ambo i membri della (1) per lo scalare k1 si ha: k1 w1 + k1 w2 + · · · + k1 wt = 0. (3) Sottraendo membro a membro (3) e (2) si ha: (k1 − k2 )w2 + · · · + (k1 − kt )wt = 0. (4) Il vettore (k1 − k2 )w2 + · · · + (k1 − kt )wt appartiene alla somma Vk2 + · · · + Vkt che, per l’ipotesi di induzione, è diretta. Ogni vettore di Vk2 ⊕ · · · ⊕ Vkt si esprime dunque in unico modo come somma di un vettore di Vk2 , uno di Vk3 , . . . , uno di Vkt . Poiché il vettore nullo di Vk2 ⊕ · · · ⊕ Vkt è esprimibile come somma dei vettori nulli di Vki , per i = 2, . . . , t, (ciascuno dei quali ovviamente coincide con il vettore nullo di V ), dalla (4) si trae: (k1 − k2 )w2 = 0, . . . , (k1 − kt )wt = 0, ed essendo gli autovalori distinti, si ha w2 = 0, . . . , wt = 0. Dalla (1) segue inoltre w1 = 0. Poiché ogni vettore wi è nullo risulta vi = vi0 per ogni i = 1, 2, . . . , t e dunque la somma degli autospazi Vk1 , Vk2 , . . . , Vkt è diretta. 2 Teorema 3.2. Sia V uno spazio vettoriale di dimensione n su un campo K e sia f : V −→ V un endomorfismo. f è diagonalizzabile se, e solo se, il polinomio caratteristico di f ha tutte le radici nel campo K, ciascuna di esse con molteplicità algebrica uguale alla molteplicità geometrica. 8 Dimostrazione. Se f è diagonalizzabile allora V possiede una base B = [v1 , v2 , . . . , vn ] di autovettori di f , dunque f (vi ) = ki0 vi per ogni i = 1, . . . , n. Gli elementi k10 , . . . , kn0 sono autovalori di f . Siano k1 , . . . , kt , con t ≤ n, gli elementi distinti tra k10 , . . . , kn0 e sia Bi l’insieme formato dagli autovettori della base B corrispondenti all’autovalore ki , per ogni i = 1, . . . , t. Denotiamo con si la cardinalità dell’insieme Bi . Essendo: B = B1 ∪ B2 ∪ · · · ∪ Bt , ne segue che s1 + s2 + · · · + st = n. Inoltre poiché Bi è un sistema linearmente indipendente contenuto nell’autospazio Vki , si ha: si ≤ dimVki = gki ≤ aki . Sommando membro a membro queste disuguaglianze si ottiene: n = s1 + s2 + · · · + st ≤ gk1 + gk2 + · · · + gkt ≤ ak1 + ak2 + · · · + akt ≤ n. Dunque deve essere: ak1 + ak2 + · · · + akt = n, gk1 + gk2 + · · · + gkt = n. Dalla prima uguaglianza sege che il polinomio caratteristico p(t) di f ha tutte le radici nel campo K. Essendo inoltre gki ≤ aki , dalle due uguaglianze precedenti, si ha che aki = gki per ogni i = 1, . . . , t. Quindi tutte le radici di p(t), ovvero k1 , . . . , kt , hanno molteplicità algebrica uguale a quella geometrica. Supponiamo inversamente che il polinomio catatteristico p(t) di f abbia tutte le radici in K, ciascuna con molteplicità algebrica uguale a quella geometrica. Siano k1 , . . . , kt le radici distinte di p(t), essendo per ipotesi k1 , . . . , kt ∈ K , si trae: ak1 + ak2 + · · · + akt = n, ed essendo inoltre, per ipotesi, aki = gki per ogni i = 1, . . . t, si ha: gk1 + gk2 + · · · + gkt = n. Gli autospazi Vk1 , . . . , Vkt sono sommandi diretti, dunque: dim(Vk1 ⊕Vk2 ⊕· · ·⊕Vkt ) = dimVk1 +dimVk2 +· · ·+dimVkt = gk1 +gk2 +· · ·+gkt = n, 9 ovvero Vk1 ⊕ Vk2 ⊕ · · · ⊕ Vkt = V . Sia ora Bi una base di Vki per ogni i = 1, . . . , t. L’insieme: B = B1 ∪ B2 ∪ · · · ∪ Bt è una base di V formata da autovettori di f . L’endomorfismo f risulta pertanto diagonalizzabile. 2 Osservazione. Sia f : V −→ V un endomorfismo e siano k1 , k2 , . . . , kt gli autovalori distinti di f . Dalla dimostrazione del teorema precedente segue che f è diagonalizzabile se, e solo se, V = Vk1 ⊕ Vk2 ⊕ · · · ⊕ Vkt . 4 Endomorfismi diagonalizzabili che commutano In questo paragrafo determineremo una condizione necessaria e sufficiente affinché due endomorfismi di uno spazio vettoriale V siano simultaneamente diagonalizzabili, ovvero esista un riferimento di V rispetto a cui le matrici associate ai due endomorfismi siano entrambe diagonali. Teorema. Siano f : V −→ V e g : V −→ V due endomorfismi diagonalizzabili. Lo spazio vettoriale V possiede una base di autovettori comuni a f e g se, e solo se, f ◦ g = g ◦ f . Dimostrazione. Supponiamo che esista in V una base B = [e1 , e2 , . . . , en ] formata da autovettori comuni a f e g, ovvero, per i = 1, . . . , n si ha: f (ei ) = ki ei , g(ei ) = λi ei . Gli endomorfismi f ◦ g e g ◦ f agiscono sui vettori di B al seguente modo: f ◦ g(ei ) = f (g(ei )) = f (λi ei ) = λi f (ei ) = λi ki ei , g ◦ f (ei ) = g(f (ei )) = g(ki ei ) = ki g(ei ) = ki λi ei . 10 Da cui segue f ◦ g(ei ) = g ◦ f (ei ). Poiché le applicazioni lineari f ◦ g e g ◦ f assumono gli stessi valori sui vettori della base B, ne segue che f ◦ g = g ◦ f . Viceversa supponiamo che f ◦g = g ◦f . Siano k1 , . . . , kt gli autovalori distinti di f . Poiché f è diagonalizzabile, V è somma diretta degli autospazi di f corrispondenti a tali autovalori, ovvero: V = Vk1 ⊕ Vk2 ⊕ · · · ⊕ Vkt . (5) Per ogni vettore v ∈ Vki , si ha f (v) = ki v, dunque: f (g(v)) = g(f (v)) = g(ki v) = ki g(v), da cui segue che g(v) ∈ Vki . Dunque l’applicazione g, ristretta a Vki è ancora un endomorfismo. Siano λ1 , . . . , λs gli autovalori distinti di g. Poiché g è diagonalizzabile si ha: V = Vλ1 ⊕ Vλ2 ⊕ · · · ⊕ Vλs . Allora ogni vettore v ∈ Vki si decompone in unico modo come somma dei seguenti vettori: v = v1 + v2 + · · · + vs , (6) dove vj ∈ Vλj , per j = 1, . . . , s. Per induzione vogliamo dimostrare che ogni vettore vj appartiene a Vki . Per s = 1 si ha v = v1 , dunque v1 ∈ Vki . Supponiamo che l’asserto sia vero per s − 1 vettori vj e dimostriamolo per s vettori. Applicando g ad ambo i membri della (6) si ottiene: g(v) = λ1 v1 + λ2 v2 + · · · + λs vs , (7) inoltre, moltiplicando ambo i membri della (6) per λ1 , si ottiene: λ1 v = λ1 v1 + λ1 v2 + · · · + λ1 vs . (8) Sottraendo membro a membro (7) e (8) si ha: g(v) − λ1 v = (λ2 − λ1 )v2 + · · · + (λs − λ1 )vs . (9) Poiché il vettore g(v) − λ1 v appartiene a Vki , per l’ipotesi di induzione si ha che: (λ2 − λ1 )v2 ∈ Vki , . . . , (λs − λ1 )vs ∈ Vki , 11 da cui segue che v2 ∈ Vki , . . . , vs ∈ Vki . Dalla (6) si trae che anche v1 ∈ Vki , resta pertanto provato l’asserto se v si esprime come somma di s vettori. Poiché, per la (6), ogni vettore di Vki si esprime in unico modo come somma di un vettore di Vki ∩ Vλ1 , un vettore di Vki ∩ Vλ2 , . . . , e un vettore di Vki ∩ Vλs , ne segue che: Vki = (Vki ∩ Vλ1 ) ⊕ (Vki ∩ Vλ2 ) ⊕ · · · ⊕ (Vki ∩ Vλs ). Se D1 denota una base di Vki ∩ Vλ1 , D2 una base di Vki ∩ Vλ2 , . . . , Ds una base di Vki ∩ Vλs , allora l’unione D1 ∪ D2 ∪ · · · ∪ Ds = Bi è una base di Vki formata da autovettori comuni a f e g (per ogni i = 1, . . . , t). Dalla (5) segue che l’unione: B1 ∪ B2 ∪ · · · ∪ Bt è una base di V formata da autovettori comuni a f e g. 12 2