POLINOMIO MINIMO E FORMA CANONICA DI JORDAN NOTA AGGIUNTIVA PER IL CORSO DI GEOMETRIA ANALITICA E ALGEBRA LINEARE — A.A. 2008-2009 — DOCENTE: PAOLO LISCA Avvertenza: indicheremo sempre con V uno spazio vettoriale diverso da {0} e di dimensione finita su un corpo K ⊆ C. 1. Polinomio minimo Sia L : V → V un operatore lineare. Si verifica facilmente che l’insieme JL = {f (t) ∈ K[t] | f (L) = 0} ⊆ K[t] è un ideale. Poiché per il teorema di Cayley–Hamilton il polinomio caratteristico pL (t) si annulla su L , JL 6= {0} . L’unico generatore monico mL (t) ∈ K[t] dell’ideale JL è, per definizione, il polinomio minimo di L . Osserviamo che mL (t), essendo un generatore di JL , divide ogni polinomio che si annulla su L . Quindi mL (t) è quell’unico polinomio monico che (i) si annulla su L e (ii) divide tutti i polinomi che si annullano su L . Inoltre, poiché pL (t) ∈ JL , ne segue che mL (t) divide pL (t). Lemma 1.1. Sia L : V → V un operatore lineare. Il polinomio minimo e il polinomio caratteristico di L hanno le stesse radici in K . Dimostrazione. Poiché il polinomio minimo divide il polinomio caratteristico, è chiaro che le radici del primo sono anche radici del secondo. Viceversa, se pL (λ) = 0 allora per qualche λ ∈ K allora esiste v ∈ V \ {0} tale che L(v) = λv . Siccome per ogni polinomio f (t) ∈ K[t] si ha f (L)(v) = f (λ)v , abbiamo in particolare 0 = mL (L)(v) = mL (λ)v , e quindi mL (λ) = 0 . Teorema 1.2. Sia L : V → V un operatore lineare. Il polinomio minimo e il polinomio caratteristico di L hanno gli stessi fattori irriducibili (come polinomi a coefficienti in K ). Dimostrazione. Si fissi una base qualunque di V , e sia A la matrice associata ad L rispetto a tale base. Dalla definizione segue subito che pL (t) = pA (t). Poiché, come è facile verificare, l’insieme dei polinomi in K[t] che si annullano su L coincide con l’insieme di quelli che si annullano su A, abbiamo mL (t) = mA (t). Dunque è sufficiente dimostrare l’enunciato per le matrici quadrate a coefficienti in K . Poiché K ⊆ C, abbiamo Mn (K) ⊆ Mn (C). Quindi, una matrice A ∈ Mn (K) può essere considerata non solo come un operatore lineare da Kn a Kn , ma anche come C un operatore lineare da Cn in Cn . Indichiamo con mC A (t) e pA (t), rispettivamente, il polinomio minimo ed il polinomio caratteristico di A come operatore lineare da Cn a Cn . Dalla definizione segue subito che pA (t) = pC A (t), e poiché mA (A) = 0 il polinomio mC (t) divide m (t) in C[t]. A A Ragionando per assurdo, sia q(t) un fattore irriducibile di pA (t) che non compare nella fattorizzazione di mA (t) in K[t]. Abbiamo allora a(t)q(t)+b(t)mA (t) = 1 per 1 qualche a(t), b(t) ∈ K[t]. Questa relazione implica che q(t) ed mA (t) non hanno radici complesse in comune. D’altronde le radici complesse di q(t) sono ovviamente anche radici di pA (t) = pC A (t) le quali, per il lemma 1, sono a loro volta radici di C mC (t) e quindi, poiché m A A (t) divide mA (t) in C[t], anche radici di mA (t). Questa contraddizione conclude la dimostrazione. 2. Forma canonica di Jordan Un operatore lineare L : V → V si dice ciclico se esiste v ∈ V tale che l’insieme {v, L(v), . . . , Ln−1 (v)} , è una base di V . Si noti che, necessariamente, n = dim V . Un operatore lineare L : V → V si dice nilpotente se Lm = 0 per qualche m ∈ N. Lemma 2.1. Sia L : V → V un operatore ciclico e nilpotente e sia n = dim V . Allora Ln = 0 e V possiede una base rispetto alla quale L ha matrice: 0 0 0 ··· 0 1 0 0 · · · 0 0 1 0 · · · 0 (2.1) .. . .. . . .. 0 0 ··· 1 0 Dimostrazione. Sia v ∈ V un vettore tale che {v, L(v), . . . , Ln−1 (v)} ⊆ V è una base. Dall’indipendenza degli elementi di tale base segue che il grado del polinomio minimo mL (t) è non inferiore ad n, ovvero la dimensione di V . D’altronde, poiché il polinomio minimo divide il polinomio caratteristico, il grado di mL (t) non può essere superiore ad n. Quindi il grado di mL (t) è n. Inoltre, poiché L è nilpotente, mL (t) deve dividere tm per qualche m ∈ N e quindi mL (t) = tn . Dunque abbiamo Ln = 0 e in particolare Ln (v) = 0 . Ne segue subito che la matrice associata alla base {v, L(v), . . . , Ln−1 (v)} è quella indicata. Lemma 2.2. Sia L : V → V un operatore lineare nilpotente. Allora V è somma diretta di sottospazi L –invarianti tali che la restrizione di L a ciascuno di essi è ciclico e nilpotente. Dimostrazione. Supponiamo Lm = 0 , Lm−1 6= 0 per qualche m ∈ N (concordando che L0 = idV per definizione). Sia (m−1) (m−1) , . . . , vdm−1 } ⊆ Lm−1 (V ) {v1 una base di Lm−1 (V ), e siano (m−2) v1 (m−2) tali che L(vi (m−1) ) = vi (m−2) , . . . , vdm−1 ∈ Lm−2 (V ) per i = 1, . . . , dm−1 . Osserviamo che i vettori (m−2) (m−1) (m−1) (m−2) , . . . , vdm−1 v1 , . . . , vdm−1 , v1 sono linearmente indipendenti in Lm−2 (V ). Infatti, se sussistesse una relazione di dipendenza lineare (m−1) a1 v1 (m−2) (m−1) + · · · + adm−1 vdm−1 + b1 v1 allora applicando l’operatore L otterremmo: (m−1) b1 v1 (m−1) + · · · + bdm−1 vdm−1 = 0. 2 (m−2) + · · · + bdm−1 vdm−1 = 0 (m−1) , avremmo b1 = · · · = bdm−1 = Perciò, per l’indipendenza lineare dei vettori vi 0 e dalla prima relazione, per lo stesso motivo, a1 = · · · = adm−1 = 0 . Quindi è possibile completare l’insieme (m−2) dm−1 }i=1 (m−1) dm−1 }i=1 ∪ {vi (m−1) dm−1 }i=1 ∪ {vi {vi ad una base {vi (m−2) dm−2 }i=1 (m−2) di Lm−2 (V ). Inoltre, a meno di sottrarre ad ogni vettore vj (m−2) opportuna combinazione lineare di vettori vj (m−2) che L(vj con j > dm−1 una con j ≤ dm−1 , si può supporre ) = 0 per ogni j > dm−1 . (m−3) dm−2 }i=1 in Lm−3 (V ) tali che Analogamente, esistono vettori {vi (m−3) L(vi (m−2) ) = vi i = 1, . . . , dm−2 . , Inoltre, se sussistesse una relazione lineare (m−1) a1 v1 (m−2) (m−1) + · · · + adm−1 vdm−1 + b1 v1 (m−2) + · · · + bdm−2 vdm−2 + (m−3) c1 v1 (m−3) + · · · + cdm−2 vdm−2 = 0, applicando l’operatore L si concluderebbe, in particolare, che i coefficienti ci sono tutti nulli e quindi, per l’indipendenza dei vettori coinvolti nella risultante relazione lineare, che tutti i coefficienti sono nulli. Applicando il teorema del completamento (m−3) dm−3 }i=1 ⊆ Lm−3 (V ) tale che si vede quindi che esiste un insieme {vi • Lm−3 (V ) ha una base della forma (m−1) dm−1 }i=1 {vi (m−3) • L(vi (m−2) ) = vi (m−2) dm−2 }i=1 ∪ {vi (m−3) dm−3 }i=1 , ∪ {vi per i = 1, . . . , dm−2 . (m−3) , per i > dm−2 , una opportuna comA meno di sottrarre ad ogni vettore vi (m−3) (m−2) dm−1 ) sia una }i=1 , si può supporre che L(vi binazione lineare dei vettori {vi (m−2) dm−2 }i=1 per ogni i > dm−2 . A meno di sotcombinazione lineare dei vettori {vi (m−3) , per i > dm−2 , una opportuna combinazione trarre ulteriormente ad ogni vi (m−3) (m−3) dm−2 ) = 0 per }i=1 , si può inoltre supporre che L(vi lineare dei vettori {vi ogni i > dm−2 . Ragionando in modo analogo per induzione si trovano, per h = 0, . . . , m − 1 , (h) h ⊆ Lh (V ) tali che sottoinsiemi {vi }di=1 • • • Sm−1 (j) dj h j=h {vi }i=1 è una base di L (V ), (h+1) (h) per i = 1, . . . , dh+1 e L(vi ) = vi (h) L(vi ) = 0 per i = dh+1 + 1, . . . , dh . Se indichiamo ora con Vi , per i = 1, . . . , d0 , il sottospazio di V generato dai vettori (j) vi per j ≥ 0 , è evidente dalla costruzione che ogni Vi è L –invariante e che la restrizione di L ad ogni Vi è nilpotente e ciclico. Inoltre V è chiaramente somma diretta dei Vi . Lemma 2.3. Sia L : V → V un operatore ciclico e nilpotente, e sia n = dim V . Allora dim Lk (V ) = n − k per ogni k ≤ n. 3 Dimostrazione. Sia v, L(v), . . . , Ln−1 (v) una base di V . Poiché per il lemma 2.1 Ln = 0 , abbiamo Lk (V ) = hLk (v), Lk+1 (v), . . . , Ln−1 (v)i per ogni k ≤ n. Dunque i vettori Lk (v), Lk+1 (v), . . . , Ln−1 (v) ∈ Lk (V ) generano Lk (V ) e sono linearmente indipendenti. Lemma 2.4. Sia V = U1 ⊕ · · · ⊕ Ur = W1 ⊕ · · · ⊕ Ws e, posto mi = dim Ui , i = 1, . . . , r e nj = dim Wj , j = 1, . . . , s, si supponga che m1 ≥ m2 ≥ · · · ≥ mr e n1 ≥ n2 ≥ · · · ≥ ns . Sia L : V → V un operatore lineare tale che ogni sottospazio Ui e Wj è L –invariante ed ogni restrizione L|Ui e L|Wj è un operatore ciclico e nilpotente. Allora r = s e mi = ni per ogni i = 1, . . . , r . Dimostrazione. Se l’enunciato fosse falso esisterebbe un primo indice i tale che mi 6= ni . Senza perdita di generalità possiamo supporre mi < ni . Allora, poiché mi Lmi (Uj ) = {0} per ogni j ≥ i , abbiamo Lmi (V ) = ⊕i−1 (Uj ) e quindi, per il j=1 L lemma 2.3, dim Lmi (V ) = (2.2) i−1 X (mj − mi ). j=1 D’altra parte Lmi (V ) = ⊕sj=1 Lmi (Wj ), perciò, sempre per il lemma 2.3, (2.3) dim L mi (V ) ≥ i X (nj − mi ) = ni − mi + i−1 X (nj − mi ). j=1 j=1 Ma mj = nj per j = 1, . . . , i − 1 , quindi la (2.2) e la (2.3) contraddicono la disuguaglianza mi < ni . Un blocco di Jordan con autovalore α è una matrice quadrata del tipo α 0 0 ··· 0 1 α 0 · · · 0 Jα = 0 1 α · · · 0 .. . . . . .. . 0 0 ··· 1 α Teorema 2.5. Sia V uno spazio vettoriale complesso, L : V → V un operatore lineare, e sia mL (t) = (t − α1 )m1 · · · (t − αk )mk . Allora V = Z1 ⊕ · · · ⊕ Zk , dove Zi = ker(L − αi I)mi , i = 1, . . . , k , ed ogni sottospazio Zi è somma diretta di sottospazi L –invarianti Nij , j = 1, . . . , hi , ognuno dei quali possiede una base rispetto alla quale la restrizione di L ha matrice data da un blocco di Jordan di tipo Jαi . Inoltre, i numeri hi e le dimensioni dei sottospazi Nij sono univocamente determinati da L . Dimostrazione. Sia mL (t) = (t − α1 )m1 · · · (t − αk )mk , dove αi 6= αj per i 6= j . In base al teorema 6, cap. 12, del testo sappiamo che V = Z1 ⊕ · · · ⊕ Zk , dove e i = (L − αi I)|Zi è Zi = ker(L − αi I)mi ⊆ V per i = 1, . . . , k . L’operatore L chiaramente nilpotente, quindi per i lemmi 2.1 e 2.2 Zi = Ni1 ⊕· · ·⊕Nihi per qualche e i –invariante (e pertanto L –invariante) e hi , dove ogni Nij ⊆ Zi è un sottospazio L e i |Nij è di tipo (2.1). Ne segue possiede una base rispetto alla quale la matrice di L che, rispetto a tale base, la matrice associata ad L|Nij è un blocco di Jordan Jαi . Inoltre, per il lemma 2.4 applicato agli operatori L|Zi , i numeri hi e le dimensioni degli Nij sono univocamente determinati dall’operatore L . 4 Corollario 2.6 (Forma canonica di Jordan). Ogni matrice n × n a coefficienti complessi è coniugata ad una matrice a blocchi B1 0 · · · 0 0 B2 · · · 0 B= . .. , . .. .. . 0 0 · · · Bs dove ogni Bi è un blocco di Jordan. La matrice B è univocamente determinata a meno di permutazioni dei blocchi. Dimostrazione. Il corollario è una immediata conseguenza del teorema 2.5. I dettagli della semplice dimostrazione sono lasciati per esercizio. 5