Versione novembre 2008 Lezioni di Algebra Lineare V. Autovalori e autovettori Contenuto 1. Cambiamenti di base 2. Applicazioni lineari, matrici e cambiamenti di base 3. Autovalori e autovettori 2 1. Cambiamenti di base. Supponiamo di avere due basi B e B 0 dello spazio vettoriale V . Sia dim V = n, B = {v1 , . . . , vn } e B 0 = {w1 , . . . , wn }. Il problema che affrontiamo in questo paragrafo è: che relazione c’è tra le coordinate rispetto a B e le coordinate rispetto a B 0 di un generico vettore v di V ? Facciamo prima un esempio molto semplice. Supponiamo che V sia Rn , e che una delle due basi sia la base canonica, che denotiamo con C. In questo caso tutti i vettori sono espressi in modo naturale in coordinate rispetto a C, cioè per ogni v ∈ Rn , v = vC . Quindi supponiamo di voler usare una nuova base di Rn , diciamo B 0 , e di voler passare, per ogni vettore di Rn , dalle coordinate naturali, cioè quelle rispetto a C, alle coordinate rispetto a B 0 . Chiaramente per i vettori di B 0 la cosa è immediata: se B 0 = {v1 , . . . , vn }, allora le coordinate di v1 , v2 , . . . , vn rispetto a sè stessi sono 1 0 0 0 1 0 . , . ,..., . , .. .. .. 0 0 0 1 rispettivamente. Se v è un vettore qualunque di Rn , per determinare le sue coordinate rispetto a B 0 dobbiamo risolvere il sistema M x = v, dove M è la matrice che ha per colonne i vettori di B 0 , scritti in coordianate naturali. Questo è un sistema a soluzione unica, perché B 0 è una base; in effetti M è una matrice invertibile e la soluzione del sistema è il vettore M −1 v. Otteniamo quindi che, per ogni v ∈ Rn , vB0 = M −1 vC , e vC = M v B 0 . Osserviamo che dalle relazioni precedenti segue che le colonne di M −1 devono essere i vettori della base canonica C scritti in coordinate rispetto alla base B 0 . 3 Torniamo al caso generale e fissiamo le notazione: per ogni v ∈ V indichiamo con vB e vB0 i vettori delle coordinate di v rispetto alle basi B e B 0 , rispettivamente, cioè: a1 . vB = .. , an b1 . = .. vB0 bn dove gli ai e i bi (i = 1, . . . , n) sono gli unici numeri reali tali che v = a1 v1 + · · · + an vn , v = b1 w1 + · · · + bn wn . Supponiamo di conoscere le coordinate dei vettori di B 0 rispetto a B. Allora per ogni vettore v possiamo passare direttamente dalle coordinate rispetto a B 0 a quelle rispetto a B. Infatti, se w1 = a11 v1 + a21 v2 + · · · + an1 vn , . . . . . . , wn = a1n v1 + a2n v2 + · · · + ann vn , da v = b1 w1 + · · · + bn wn otteniamo la scrittura di v in funzione della base B sostituendo ai wi le loro espressioni in funzione dei vj scritte sopra. Facendo esplicitamente i calcoli si ottiene facilmente che, se M = (w1 B | · · · |wn B ), cioè a11 a21 M = ... an1 a12 · .. . ··· ··· a1n · , .. . · ··· ann allora vB = M v B 0 , e quindi vB0 = M −1 vB . Per l’ultima uguaglianza abbiamo usato il fatto che M è una matrice di rango n, perché B 0 è una base, quindi M è invertibile. È immediato verificare che M −1 = (v1B0 | · · · |vnB0 ), cioè: le colonne di M −1 sono i vettori della base B, scritti in coordinate rispetto alla base B 0 . Definizione. Le matrici M ed M −1 si chiamano matrici di passaggio dalla base B 0 alla base B e viceversa. 4 Problemi. 1. Sia C la base canonica di R3 e sia B = {t(1 0 0), t(1 1 0), t(1 1 1)}. (a) Determinare le matrici di passaggio dalla base B alla base C e viceversa. (b) Scrivere le coordinate del vettore t(2 5 3) rispetto alla base B. (c) Scrivere le coordinate del generico vettore t(a b c) di R3 rispetto alla base B. (d) Se v ∈ R3 ha coordinate t(a0 b0 c0 ) rispetto a B, quali sono le sue coordinate rispetto a C? Risoluzione. (a) La matrice di passaggio da B a C è la matrice M che ha per colonne i vettori di B scritti rispetto alla base C, cioè 1 M= 0 0 1 1 0 1 1. 1 La matrice di passaggio da C a B è l’inversa di M o, equivalentemente, la matrice che ha per colonne i vettori della base canonica di R3 scritti in coordinate rispetto a B. Detti v1 , v2 , v3 i vettori di B, nell’ordine scritto sopra, si ha chiaramente e1 = v1 , e2 = v2 − v1 , e3 = v3 − v2 , quindi, rispetto a B, le coordinate di e1 , e2 , e3 sono (1, 0, 0),t(−1, 1, 0), t(0, −1, 1), rispettivamente. Segue che la matrice di passaggio da C a B è M −1 1 = 0 0 −1 0 1 −1 . 0 1 (b) Basta moltiplicare t(2 5 3) per M −1 a sinistra: 1 −1 0 2 −3 0 1 −1 5 = 2 . 0 0 1 3 3 Dunque il vettore delle coordinate di t(2 5 3) rispetto a B è t( − 3, 2, 3) (cioè t (2 5 3) = −3v1 + 2v2 + 3v3 ). (c) Analogo al punto precedente: 1 −1 0 a a−b 0 1 −1 b = b − c , 0 0 1 c c quindi le coordinate richieste sono a − b, b − c, c. 5 (d) Basta moltiplicare t(a0 b0 c0 ) a sinistra per M , quindi le coordinate richieste sono a0 + b0 + c0 , b0 + c0 , c0 . 1 1 4 3 2. Consideriamo le basi di R B1 = , , B2 = , . 2 1 1 1 (a) Determinare le matrici di passaggio da B1 a B2 e viceversa. 2 (b) Se v ∈ R2 ha coordinate t(a b) rispetto a B1 , quali sono le coordinate di v rispetto a B2 ? (c) Se v ∈ R2 ha coordinate t(a0 b0 ) rispetto a B2 , quali sono le coordinate di v rispetto a B1 ? Risoluzione. Per risolvere al problema bisogna scrivere i vettori di B1 come combinazione lineare di B2 e viceversa. [Provate a fare il conto direttamente e confrontate con la soluzione che stiamo per dare.] Poniamo 1 1 4 3 M1 = M2 = . 2 1 1 1 x Se v = ∈ R2 (quindi x, y sono le coordinate di v rispetto alla base canonica), y allora M1−1 v è il vettore delle coordinate di v rispetto a B1 , mentre M2−1 v è il vettore delle coordinate di v rispetto a B2 . Segue che M2−1 M1 ha per colonne le coordinate dei vettori di B1 rispetto a B2 , quindi è la prima delle matrici richieste. Analogamente, M1−1 M2 ha per colonne le coordinate dei vettori di B2 rispetto a B1 , quindi è la matrice di passaggio da B2 a B1 . (Notate che le due matrici sono l’una l’inversa dell’altra.) Calcolando esplicitamente si ottiene: −1 1 1 −3 −1 −1 M1 = M2 = , 2 −1 −1 4 quindi M2−1 M1 = −5 7 −2 3 , M1−1 M2 = −3 7 −2 5 . (b) Se v ∈ R2 ha coordinate t(a b) rispetto a B1 , allora le sue coordinate rispetto a B2 sono M2−1 M1 a −5a − 2b = . b 7a + 3b (c) Se v ∈ R2 ha coordinate t(a0 b0 ) rispetto a B2 , allora le sue coordinate rispetto a B1 sono M1−1 M2 a0 b0 = −3a0 − 2b0 7a0 + 5b0 . 6 2. Applicazioni lineari, matrici e cambiamenti di base. Supponiamo che V e W siano due spazi vettoriali e che f :V →W sia un’applicazione lineare da V in W . Abbiamo visto che nel caso particolare in cui V e W sono spazi vettoriali di tipo Rk l’applicazione f è rappresentata da una matrice. Lo stesso vale qualunque siano gli spazi V e W , una volta fissate una base di V e una base di W . Supponiamo BV = {v1 , . . . , vn } sia una base di V , e supponiamo fissata anche una base BW di W . Rappresentiamo quindi ogni vettore v ∈ V con il suo vettore v (in Rn ) di coordinate rispetto a BV e ogni vettore di W con il suo vettore w (in Rm ) di coordinate rispetto a BW . Consideriamo quindi la matrice Mf = (f (v1 )| · · · |f (vn )) (∗) Per costruzione Mf è una matrice m × n. Se v ∈ V e v = t(a1 · · · an ), allora per definizione v = a1 v1 + · · · + an vn , quindi f (v) = a1 f (v1 ) + · · · + an f (vn ) e a1 . f (v) = a1 f (v1 ) + · · · + an f (vn ) = Mf .. = LMf (v). an Otteniamo quindi che: se fissiamo una base di V e una base di W , allora ogni applicazione lineare f di V in W è rappresentata dalla moltiplicazione a sinistra per una matrice, cioè è di tipo LM . È chiaro che la matrice Mf definita in (∗) non dipende solo f , ma anche dalle basi scelte. Definizione. Mf si chiama “la matrice di f rispetto alle basi BV e BW .” Osservazione. La definizione appena data è coerente con la definizione “matrice rispetto alle basi canoniche” data in precedenza per le applicazioni da Rm a Rn 7 (III dispensa, pag. 4). Basta osservare che se M è una matrice reale n × m, LM : Rm → Rn è l’applicazione lineare associata e {e1 , . . . , em } è la base canonica di Rm , allora le colonne M sono ordinatamente LM (e1 ), . . . , LM (en ), scritti naturalmente rispetto alla base canonica di Rn . Problema. Sia 2 f :R →R x x−y 7→ . y −x 2 Verificare che f è lineare e scriverne la matrice rispetto alla base canonica di R2 (si intende sia sul dominio, sia sul codominio). Se scegliamo come base (sia sul dominio sia sul codominio) 1 2 B= , 1 1 qual è la matrice di f ? Risoluzione. Per la prima parte procediamo come nell’esercizio precedente. Abbiamo che x 1 f = y −1 x , y 1 quindi f è lineare perché uguale a LM , con M = −1 matrice di f rispetto alla base canonica. −1 0 −1 . Inoltre M è la 0 Per rispondere all’ultima domanda, consideriamo la matrice di passaggio da B alla base canonica, cioè la matrice P = 1 1 2 1 Allora la matrice richiesta è P −1 M P. Spieghiamo perché. In base alla definizione, per scrivere la matrice di f rispetto a B dobbiamo calcolare le immagini dei vettori di B e scriverle in coordinate rispetto alla base B stessa. Visto che f è la moltiplicazione a sinistra per M abbiamo che 1 1 −1 1 0 2 1 −1 2 1 f = = ; f = = 1 −1 0 1 −1 1 −1 0 1 −2 Segue che MP = 1 −1 −1 0 1 1 2 1 = 0 −1 1 −2 , 8 cioè M P è la matrice che ha per colonne le immagini di B. Queste immagini sono scritte però rispetto alla base canonica e non rispetto alla base B, come ci servirebbe. Nel Paragrafo 11 abbiamo visto che per passare dalle coordinate canoniche a quelle rispetto a B basta moltiplicare a sinistra per la matrice P −1 , quindi la matrice richiesta è P −1 M P, cioè (i calcoli sono lasciati al lettore per esercizio) −2 1 −5 3 . Il procedimento descritto nel problema precedente si generalizza nel seguente enunciato (di cui omettiamo la dimostrazione). Proposizione. Sia f : V → W un ’applicazione lineare, BV una base di V , BW 0 una base di W , e M la matrice di f rispetto a queste basi. Se BV0 e BW sono altre 0 due basi di V e W , allora la matrice di f rispetto a BV0 e BW è P −1 M Q, 0 dove P e Q sono le matrici di passaggio da BV0 a BV e da BW a BW , cioè, P è la matrice che ha per colonne i vettori di BV0 scritti rispetto alla base BV e Q è la 0 scritti rispetto alla base BW . matrice che ha per colonne i vettori di BW Corollario. Sia f : Rn → Rn un endomorfismo e sia M la matrice di f rispetto alla base canonica (in partenza e in arrivo). Se B è un’altra base di Rn , allora la matrice di f rispetto a B (in partenza e in arrivo), è P −1 M P, dove P è la matrice che ha per colonne i vettori di B, scritti in coordinate naturali. 9 3. Autovalori e Autovettori. Supponiamo che V sia uno spazio vettoriale reale di dimensione n e che f :V →V sia un’applicazione lineare, cioè un endomorfismo di V . Definizione 1. Un autovettore di f è un vettore v ∈ V diverso dal vettore nullo tale che f v = αv per un certo scalare α. Se v è un autovettore di f e α ∈ R è il numero reale tale che f v = αv, allora diciamo che α è un autovalore di f e che v è un autovettore relativo all’autovalore α. Osservazioni. 1. La relazione f 0 = α0 è vera per ogni numero reale α, ma 0 non è un autovettore, per definizione. 2. È chiaro che un autovettore, essendo non nullo per definizione, è relativo ad un unico autovalore. Se fissiamo una base in V allora possiamo identificare V con Rn e realizzare f come un’applicazione di tipo LM , moltiplicazione a sinistra per una matrice M (n × n). Allora il vettore v 6= 0 è un autovettore di f se e solo se M v = αv (∗) per un certo α ∈ R. Se I è la matrice identità n × n, allora αv = (αI)v, quindi, sommando −(αI)v alla (∗), otteniamo M v − (αI)v = 0 e, applicando la proprietà distributiva, (M − αI)v = 0. 10 Poiché v 6= 0 per definizione, la relazione precedente dice in particolare che il sistema omogeneo (M − αI)x = 0 ha soluzioni non nulle e quindi, per la Proposizione 4 della IV dispensa (pag. 12), det (M − αI) = 0 (∗∗) Poiché, viceversa, se det (M − αI) = 0 allora (M − αI)x = 0 ha delle soluzioni non nulle, invertendo i passaggi otteniamo il risultato seguente. Proposizione 1. Sia M la matrice di f rispetto a una qualunque base di V . Allora il numero α ∈ R è un autovalore di f se e solo se det (M − αI) = 0. Se α è un autovalore di f , allora gli autovettori di f relativi a α sono le soluzioni non nulle del sistema omogeneo (M − αI)x = 0. Definizione 2. Sia M una matrice reale n × n. Un autovettore di M è un vettore v ∈ Rn diverso dal vettore nullo tale che M v = αv per un certo scalare α. Se v è un autovettore di M e α ∈ R è il numero reale tale che M v = αv, allora diciamo che α è un autovalore di M e che v è un autovettore relativo all’autovalore α. Dunque la Proposizione 1 dice che gli autovalori e gli autovettori di f (che non dipendono dalla scelta della base) corrispondono agli autovalori e agli autovettori della matrice di f rispetto a una qualunque base fissata. La Proposizione 1 fornisce uno strumento per calcolare gli autovalori e gli autovettori di f . In più, dice quanti sono al massimo gli autovalori di f . Vale infatti il fatto seguente. 11 Proposizione 2. Sia M una matrice n × n. Allora χM (λ) =def det (M − λI) è un polinomio di grado n nell’indeterminata λ. Gli autovalori di M sono le radici di questo polinomio. In particolare, gli autovalori di M sono al massimo n. La seconda parte della Proposizione 2 segue direttamente dalla Proposizione 1. La prima parte non è difficile da dimostrare, ma qui non ne diamo alcuna dimostrazione. Provate a capire perché è vera in generale, dopo avere letto l’esempio seguente. 1 Esempio 1. Sia M = 4 7 1 M − λI = 4 7 2 5 8 2 5 8 3 6 . Allora 9 λ 3 6 − 0 0 9 0 λ 0 0 1−λ 0 = 4 7 λ 2 3 5−λ 6 . 8 9−λ Con lo sviluppo di Lalace rispetto alla prima riga otteniamo: χM (λ) = (1 − λ)[(5 − λ)(9 − λ) − 48] − 2[4(9 − λ) − 42] + 3[32 − 7(5 − λ)]. È chiaro che non vi sono termini di grado maggiore 3 e che solo il primo addendo fornisce un contributo al termine di grado 3. Precisamente, il termine principale di χM (λ) è −λ3 . Definizione 3. Il polinomio χM (λ) definito nella Proposizione 2 si chiama il polinomio caratteristico della matrice M . Se cambiamo la scelta della base, come sappiamo dalla seconda parte delle lezioni, la matrice M cambia in C −1 M C, dove C è la matrice del canbiamento di base. Il polinomio caratteristico di C −1 M C è det (C −1 M C − λI). 12 Osserviamo che C −1 IC = I, quindi, per la proprietà distributiva, C −1 M C − λI = C −1 (M − λI)C. Utilizzando il Teorema di Binet, otteniamo che il determinante di questa matrice è det (C −1 (M − λI)C) = det (C −1 )det (M − λI)det C = (det C)−1 det (M − λI)det C = det (M − λI). Otteniamo quindi il risultato seguente. Proposizione 3. Se M e C sono matrici n × n e C è invertibile, allora M e C −1 M C hanno lo stesso polinomio caratteristico. Quindi se le matrici M e M 0 rappresentano il medesimo endomorfismo f di V rispetto a due basi diverse, allora M e M 0 hanno lo stesso polinomio caratteristico. Grazie alla Proposizione 3, possiamo definire il polinomio caratteristico di un endomorfismo. Definizione 30 . Il polinomio caratteristico di f è il polinomio caratteristico della matrice di f rispetto a una qualunque base di V . La Proposizione 1 può essere rienunciata nel modo seguente. Teorema 1. Gli autovalori di f sono le radici del suo polinomio caratteristico. Gli autovettori di f relativi all’autovalore α sono gli elementi non nulli del sottospazio vettoriale ker (f − αId), dove Id è l’applicazione identità di V in sè. Esempio 1. Sia f : R3 → R3 2x + z x y 7→ 2y + 3z . x −z La matrice di f rispetto alla base canonica di R3 è 2 0 1 M = 0 2 3 0 0 −1 quindi il polinomio caratteristico di f è 2 − λ 0 1 0 2−λ 3 = (−1 − λ)(2 − λ)2 0 0 −1 − λ 13 Quindi f ha come autovalori −1 e 2. Per calcolare gli autovettori di f dobbiamo calcolare esplicitamente gli spazi nulli delle matrici M − (−1)I e M − 2I: gli elementi non nulli di questi spazi sono gli autovettori. Calcoliamo prima gli autovettori relativi a −1. Risolviamo quindi il sistema omogeneo (M + I)x = 0. La matrice dei coefficienti è 3 0 M +I = 0 3 0 0 1 3, 0 quindi risolvendo il sistema si trova Perciò x = − 13 z . y = −z 1 −3z N (M + I) = −z | z ∈ R , z e quindi l’insieme degli autovettori relativi a −1 è 1 −3z −z | z ∈ R, z 6= 0 . z Calcoliamo ora gli autovettori relativi a 2 risolvendo il sistema omogeneo (M − 2I)x = 0. La matrice dei coefficienti è 0 M − 2I = 0 0 0 0 0 1 3, −3 quindi risolvendo il sistema si trova semplicemente {z = 0 , 14 mentre x e y sono libere. Perciò x N (M − 2I) = y | x, y ∈ R 0 e l’insieme degli autovettori relativi a 2 è x y | x, y ∈ R, (x, y) 6= (0, 0) . 0 Algebra: fatti da ricordare e complementi. Sia p(x) un polinomio a coefficienti reali nell’indeterminata x. Indichiamo con deg p(x) il grado di p(x). • Definizione A. Una radice reale di p(x) è un numero reale α tale che p(α) = 0 (dove p(α) è il numero reale ottenuto sostituendo α all’indeterminata x). • Teorema A. Il numero reale α è una radice di p(x) se e solo se p(x) è divisibile per (x − α), cioè se e solo se esiste un polinomio a coefficienti reali q(x) (di grado n − 1) tale che p(x) = (x − α)q(x). (∗) Supponiamo che α sia una radice di p(x) e consideriamo la fattorizzazione (∗). Se α è radice anche del polinomio q(x), allora possiamo fattorizzare anche q(x) in accordo con il Teorema A, diciamo q(x) = (x − α)q2 (x) (con deg q2 (x) = n − 2). Induttivamente otteniamo la fattorizzazione p(x) = (x − α)mα s(x), dove mα è un intero positivo e s(x) è un polinomio, di grado n − mα , non divisibile per (x − α). L’intero mα si chiama la molteplicità della radice α del polinomio p(x). • Definizione B. La molteplicità della radice α del polinomio p(x) è il massimo degli interi m tali che p(x) è divisibile per (x − α)m . 15 Esempio 2. Consideriamo il polinomio p(x) = (x − 1)(x2 + x − 2)(x2 + 1). Il fattore x2 +x−2 ha come radici reali 1 e −2, quindi si fattorizza come (x−1)(x+2), mentre il fattore x2 + 1 non ha radici reali e quindi è irriducibile. Ne segue che p(x) = (x − 1)2 (x + 2)(x2 + 1) e che le radici di p(x) sono 1, con molteplicità 2, e −2, con molteplicità 1. • Terminologia: quante radici reali ha un polinomio. Di solito, quando diciamo che il polinomio reale p(x) ha k radici reali sottintendiamo che contiamo le radici con la loro molteplicità. Ad esempio per il polinomio dell’Esempio 2 diciamo che ha 3 radici reali (1 contata due volte, e −2 contata una volta). Se invece contiamo la radici senza tenere conte della molteplicità, allora specifichiamo che stiamo contando le radici distinte. Ad esempio il polinomio dell’Esempio 2 ha 2 radici reali distinte. • Teorema B. Se deg p(x) = n, allora p(x) ha al massimo n radici reali (contate con molteplicità). Torniamo agli autovalori. Definizione 4. Sia α un autovalore dell’endomorfismo f . La molteplicità algebrica di α è la molteplicità di α come radice del polinomio caratteristico di f . Abbiamo un’altra nozione di molteplicità di un autovalore. Definizione 5. Sia α un autovalore dell’endomorfismo f . La molteplicità geometrica di α è la dimensione del sottospazio vettoriale ker (f − αId). Per definizione di autovalore, se α è un autovalore di f allora ker (f − αId) è un sottospazio non nullo, quindi la molteplicità geometrica di α è necessariamente un intero strettamente positivo. La traduzione nel linguaggio delle matrici delle precedenti definizioni è la seguente: 16 Definizione 40 +50 . Sia α un autovalore della matrice M . La molteplicità algebrica dell’autovalore α è la sua molteplicità come radice del polinomio caratteristico det (M − λI). La molteplicità geometrica di α è la dimensione dello spazio nullo N (M − αI). Esempio 3. Sia f : R3 → R3 x 2x + y y 7→ 2y . x 2z La matrice di f rispetto alla base canonica di 2 1 M= 0 2 0 0 R3 è 0 0 2 quindi il polinomio caratteristico di f è 2 − λ 1 0 0 2−λ 0 = (2 − λ)3 . 0 0 2 − λ Quindi f ha come unico autovalore 2, con molteplicità algebrica 3. La molteplicità geometrica di 2 è 0 M − 2I = 0 0 la dimensione dello spazio nullo della matrice 0 1 0 x 0 0y = 0. z 0 0 0 Sappiamo che in generale, se A è una matrice n × n, allora dim N (A) = n − rk A, quindi la molteplicità geometrica di 2 è 3 − rk (M − 2I) = 3 − 1 = 2. Esercizio 1. Considerate le due matrici 2 0 2 1 0 M1 = 0 2 1 ; M3 = 0 2 0 0 0 0 2 0 0. 2 Verificate che entrambe hanno lo stesso polinomio caratteristico della matrice M dell’Esempio 3 e che la molteplicità dell’autovalore 2 è 1 per la matrice M1 e 3 per la matrice M3 . 17 Supponiamo che B = {v1 , . . . , vn } sia una base dello spazio vettoriale V tale che la matrice M di f rispetto a B sia diagonale, poniamo α1 0 . . . . . . 0 .. 0 α2 0 ... . . .. . . .. .. M = .. 0 . . . .. .. .. . . 0 0 ... ... 0 αn Per definizione le colonne di M sono le coordinate di f (v1 ), . . . , f (vn ) rispetto a B, e quindi otteniamo che f (vi ) = αi vi , per i = 1, . . . , n. Questo vuol dire che v1 , . . . vn sono autovettori di f , relativi agli autovalori α1 , . . . , αn , rispettivamente. Viceversa, è chiaro che la matrice di f rispetto ad una base costituita di autovettori è una matrice diagonale e che i termini diagonali di questa matrice sono autovalori di f . Definizione 6. L’endomorfismo f si dice diagonalizzabile se esiste una base di f costituita di autovettori, cioè una base rispetto alla quale f ha matrice diagonale. La matrice reale quadrata M si dice diagonalizzabile se esiste una matrice reale invertibile C tale che C −1 M C è una matrice diagonale. Osservazione 3. Se M è la matrice di f rispetto a una qualunque base, allora f è diagonalizzabile se e solo se M è diagonalizzabile. Il “solo se” è immediato dalla definizione; il “se” segue dal fatto che ogni matrice invertibile è la matrice di un cambiamento di base (perché ?). Esempi. 4. L’applicazione f dell’Esempio 3 non è diagonalizzabile. Infatti il suo unico autovalore, 2, ha molteplicità geometrica 2. Questo vuol dire che lo spazio nullo di (M − 2I) ha dimensione 2, quindi, poiché gli autovettori appartengono a questo spazio nullo, un insieme linearmente indipendente di autovettori ha al massimo 2 elementi: ne segue che non può esistere una base di R3 costituita di autovettori di f. 5. Consideriamo l’applicazione lineare x 2x f : R3 → R3 y 7→ x + 3y . z 2x + 3z 18 La matrice di f rispetto alla base canonica è 2 M= 1 2 0 0 3 0, 0 3 quindi il polinomio caratteristico di f è 2 − λ 1 2 0 0 3−λ 0 = (2 − λ)(3 − λ)2 . 0 3 − λ Gli autovalori sono quindi 2, con molteplicità algebrica 1, e 3, con molteplicità algebrica 1. Le molteplicità geometriche sono: per 2 0 0 3 dim R − rk (M − 2I) = 3 − rk 1 1 2 0 0 0 = 3 − 2 = 1, 1 e per 3 −1 0 dim R3 − rk (M − 3I) = 3 − rk 1 0 2 0 0 0 = 3 − 1 = 2. 0 Quindi sappiamo che possiamo trovare un insieme indipendente di 2 autovettori relativi a 2, cosı̀ come ovviamente possiamo trovare un autovettore relativo a 3 (non nullo per definizione). Se mettendo insieme i tre autovettori cosı̀ trovati ottenessimo ancora un insieme linearmente inidipendente, avremmo una base di autovettori e potremmo diagonalizzare f . In realtà succede proprio questo: calcoliamo esplicitamente gli autovettori di f . Risolviamo il sistema (M − 2I)x = 0. x+y =0 ; ci conviene lasciare libera la x, otteniamo: 2x + 2z = 0 y = −x , quindi z = −x x N (M − 2I) = −x | x ∈ R . −x Risolvendo (M − 3I)x = 0 troviamo solo la condizione { x = 0 , mentre y e z sono libere, quindi 0 N (M − 3I) = y | y, z ∈ R . z 19 1 Una base di N (M − 2I) è costituita ad esempio dal singolo vettore −1 , mentre −1 0 0 una base di N (M − 3I) è, ad esempio, 1 , 0 . Ora è evidente che i tre 0 1 autovettori cosı̀ trovati sono linearmente indipendenti, perché si vede immediatamente che il determinante della matrice 1 C = −1 −1 0 1 0 0 0 1 è uguale a 1, quindi 1 0 0 B= −1 , 1 , 0 −1 0 1 è una base di R3 costituita di autovettori, relativi a 2, a 3, a 3, rispettivamente. Questo dice che f è diagonalizzabile, precisamente che la matrice di f rispetto a B è la matrice diagonale 2 D= 0 0 0 0 3 0. 0 3 In più, poiché la matrice C scritta sopra è la matrice di passaggio dalla base B alla base canonica, abbiamo che D = C −1 M C. Definizione 7. L’endomorfismo f si dice triangolarizzabile se esiste una base di V rispetto alla quale f ha matrice triangolare. La matrice reale quadrata M si dice triangolarizzabile se esiste una matrice reale invertibile C tale che C −1 M C sia una matrice triangolare. Osservazione 4. Come per la diagonalizzabilità, vale il fatto seguente: se M è la matrice di f rispetto a una qualunque base, allora f è triangolarizzabile se e solo se M è triangolarizzabile. A questo punto punto enunciamo i due teoremi fondamentali di questa sezione. Del primo teorema non daremo alcuna dimostrazione. un’idea abbastanza dettagliata della dimostrazione. Per il secondo daremo 20 Teorema 2. Sia V uno spazio vettoriale reale di dimensione n e sia f un endomofirsmo di v. Allora f è triangolarizzabile se e solo se il suo polinomio caratteristico ha n radici reali (contate con molteplicità). Teorema 3. Sia V uno spazio vettoriale reale di dimensione n e sia f un endomofirsmo di v. Allora f è diagonalizzabile se e solo se valgono entrambe le condizioni seguenti: (1) il polinomio caratteristico di f ha n radici reali (contate con molteplicità); (2) per ogni autovalore di f la molteplicità geometrica coincide con la molteplicità algebrica. Osservazione 5. Dire che un polinomio p(x) di grado n ha n radici reali (contate con molteplicità) equivale a dire che p(x) ha una fattorizzazione del tipo p(x) = c(x − α1 )m1 · · · (x − αk )mk , dove c è una costante reale, α1 , . . . , αk sono le radici reali distinte di p(x) e m1 , . . . , mk sono le loro molteplicità. Osserviamo che l’uguaglianza scritta sopra implica che n = m1 + · · · + mk . La dimostrazione del Teorema 3 è basata sui due risultati seguenti. Lemma 1. Per ogni autovalore dell’endomorfismo f la molteplicità geometrica non supera la molteplicità algebrica. Lemma 2. Supponiamo che α1 , . . . , αk siano autovalori distinti dell’endomorfismo (i) (i) f e che, per i = 1, . . . , k, {v1 , . . . , vni } sia un insieme linearmente indipendente di autovettori relativi a αi . Allora k [ (i) {v1 , . . . , vn(i)i } i=1 è un insieme linearmente indipendente. Vediamo come si deduce il Teorema 3 utilizzando i due Lemmi precedenti. 21 Supponiamo che f sia diagonalizzabile. Allora per definizione esiste una base B di V costituita di autovettori di f . Supponiamo che α1 , . . . , αk siano gli autovalori distinti di f e supponiamo che in B vi siano esattamente ni autovettori relativi a αi , per i = 1, . . . , k. Allora n1 + · · · + nk = |B| = n. Sia ora mi la molteplicità algebrica di αi , per i = 1, . . . , k. Poiché il polinomio caratteristico di f , che ha grado n, è divisibile per (x − αi )mi , dobbiamo avere m1 + · · · + mk ≤ n. Ma per il Lemma 1 si ha ni ≤ mi , per i = 1, . . . , k, quindi dalle due relazioni precedenti otteniamo che ni = mi per i = 1, . . . , k e m1 + · · · + mk = n. Ed è chiaro che la condizione ni = m1 è la condizione (2) del Teorema 3; mentre la condizione m1 + · · · + mk = n equivale alla condizione (1). Supponiamo ora che valgano le condizioni (1) e (2) del Teorema 3. Allora, il polinomio caratteristico di f è di tipo c(x − α1 )m1 · · · (x − αk )mk , dove c è una costante reale e α1 , . . . , αk sono gli autovalori distinti di f , di molteplicità algebriche m1 , . . . , mk rispettivamente. Si ha quindi m1 + · · · + mk = n. Ora per ipotesi la molteplicità geometrica di αi coincide con mi quindi, per definizione di molteplicità geometrica, dim ker (f − αi Id) = mi , per i = 1, . . . , k. Poiché gli elementi non nulli di ker (f − αi Id) sono gli autovettori relativi a αi , una base (i) (i) } {v1 , . . . , vm i 22 di ker (f − αi Id) è un insieme linearmente indipendente di mi autovettori relativi a αi . A questo punto, il Lemma 2 ci assicura che che k [ (i) (i) {v1 , . . . , vm }, i i=1 è un insieme linearmente indipendente di m1 + · · · + mk autovettori di f , e poiché m1 + · · · + mk = n = dim V , questo insieme è una base di V . Quindi f è diagonalizzabile.