POLINOMIO MINIMO E FORMA CANONICA DI JORDAN

POLINOMIO MINIMO E FORMA CANONICA DI JORDAN
NOTA AGGIUNTIVA PER IL CORSO DI GEOMETRIA ANALITICA
E ALGEBRA LINEARE — A.A. 2008-2009 — DOCENTE: PAOLO LISCA
Avvertenza: indicheremo sempre con V uno spazio vettoriale diverso da {0} e di
dimensione finita su un corpo K ⊆ C.
1. Polinomio minimo
Sia L : V → V un operatore lineare. Si verifica facilmente che l’insieme
JL = {f (t) ∈ K[t] | f (L) = 0} ⊆ K[t]
è un ideale. Poiché per il teorema di Cayley–Hamilton il polinomio caratteristico
pL (t) si annulla su L , JL 6= {0} . L’unico generatore monico mL (t) ∈ K[t] dell’ideale JL è, per definizione, il polinomio minimo di L . Osserviamo che mL (t),
essendo un generatore di JL , divide ogni polinomio che si annulla su L . Quindi
mL (t) è quell’unico polinomio monico che (i) si annulla su L e (ii) divide tutti i
polinomi che si annullano su L . Inoltre, poiché pL (t) ∈ JL , ne segue che mL (t)
divide pL (t).
Lemma 1.1. Sia L : V → V un operatore lineare. Il polinomio minimo e il
polinomio caratteristico di L hanno le stesse radici in K .
Dimostrazione. Poiché il polinomio minimo divide il polinomio caratteristico, è
chiaro che le radici del primo sono anche radici del secondo.
Viceversa, se pL (λ) = 0 allora per qualche λ ∈ K allora esiste v ∈ V \ {0} tale
che L(v) = λv . Siccome per ogni polinomio f (t) ∈ K[t] si ha f (L)(v) = f (λ)v ,
abbiamo in particolare 0 = mL (L)(v) = mL (λ)v , e quindi mL (λ) = 0 .
Teorema 1.2. Sia L : V → V un operatore lineare. Il polinomio minimo e il
polinomio caratteristico di L hanno gli stessi fattori irriducibili (come polinomi a
coefficienti in K ).
Dimostrazione. Si fissi una base qualunque di V , e sia A la matrice associata ad
L rispetto a tale base. Dalla definizione segue subito che pL (t) = pA (t). Poiché,
come è facile verificare, l’insieme dei polinomi in K[t] che si annullano su L coincide
con l’insieme di quelli che si annullano su A, abbiamo mL (t) = mA (t). Dunque è
sufficiente dimostrare l’enunciato per le matrici quadrate a coefficienti in K .
Poiché K ⊆ C, abbiamo Mn (K) ⊆ Mn (C). Quindi, una matrice A ∈ Mn (K) può
essere considerata non solo come un operatore lineare da Kn a Kn , ma anche come
C
un operatore lineare da Cn in Cn . Indichiamo con mC
A (t) e pA (t), rispettivamente,
il polinomio minimo ed il polinomio caratteristico di A come operatore lineare da
Cn a Cn . Dalla definizione segue subito che pA (t) = pC
A (t), e poiché mA (A) = 0
il polinomio mC
(t)
divide
m
(t)
in
C[t].
A
A
Ragionando per assurdo, sia q(t) un fattore irriducibile di pA (t) che non compare
nella fattorizzazione di mA (t) in K[t]. Abbiamo allora a(t)q(t)+b(t)mA (t) = 1 per
1
qualche a(t), b(t) ∈ K[t]. Questa relazione implica che q(t) ed mA (t) non hanno
radici complesse in comune. D’altronde le radici complesse di q(t) sono ovviamente
anche radici di pA (t) = pC
A (t) le quali, per il lemma 1, sono a loro volta radici di
C
mC
(t)
e
quindi,
poiché
m
A
A (t) divide mA (t) in C[t], anche radici di mA (t). Questa
contraddizione conclude la dimostrazione.
2. Forma canonica di Jordan
Un operatore lineare L : V → V si dice ciclico se esiste v ∈ V tale che l’insieme
{v, L(v), . . . , Ln−1 (v)} , è una base di V . Si noti che, necessariamente, n = dim V .
Un operatore lineare L : V → V si dice nilpotente se Lm = 0 per qualche m ∈ N.
Lemma 2.1. Sia L : V → V un operatore ciclico e nilpotente e sia n = dim V .
Allora Ln = 0 e V possiede una base rispetto alla quale L ha matrice:


0 0 0 ··· 0
1 0 0 · · · 0


0 1 0 · · · 0
(2.1)


 ..
.
..
.
. .. 
0
0 ···
1
0
Dimostrazione. Sia v ∈ V un vettore tale che
{v, L(v), . . . , Ln−1 (v)} ⊆ V
è una base. Dall’indipendenza degli elementi di tale base segue che il grado del
polinomio minimo mL (t) è non inferiore ad n, ovvero la dimensione di V . D’altronde, poiché il polinomio minimo divide il polinomio caratteristico, il grado di
mL (t) non può essere superiore ad n. Quindi il grado di mL (t) è n. Inoltre, poiché
L è nilpotente, mL (t) deve dividere tm per qualche m ∈ N e quindi mL (t) = tn .
Dunque abbiamo Ln = 0 e in particolare Ln (v) = 0 . Ne segue subito che la matrice
associata alla base {v, L(v), . . . , Ln−1 (v)} è quella indicata.
Lemma 2.2. Sia L : V → V un operatore lineare nilpotente. Allora V è somma
diretta di sottospazi L –invarianti tali che la restrizione di L a ciascuno di essi è
ciclico e nilpotente.
Dimostrazione. Supponiamo Lm = 0 , Lm−1 6= 0 per qualche m ∈ N (concordando
che L0 = idV per definizione). Sia
(m−1)
(m−1)
, . . . , vdm−1 } ⊆ Lm−1 (V )
{v1
una base di Lm−1 (V ), e siano
(m−2)
v1
(m−2)
tali che L(vi
(m−1)
) = vi
(m−2)
, . . . , vdm−1 ∈ Lm−2 (V )
per i = 1, . . . , dm−1 . Osserviamo che i vettori
(m−2)
(m−1)
(m−1) (m−2)
, . . . , vdm−1
v1
, . . . , vdm−1 , v1
sono linearmente indipendenti in Lm−2 (V ). Infatti, se sussistesse una relazione di
dipendenza lineare
(m−1)
a1 v1
(m−2)
(m−1)
+ · · · + adm−1 vdm−1 + b1 v1
allora applicando l’operatore L otterremmo:
(m−1)
b1 v1
(m−1)
+ · · · + bdm−1 vdm−1 = 0.
2
(m−2)
+ · · · + bdm−1 vdm−1 = 0
(m−1)
, avremmo b1 = · · · = bdm−1 =
Perciò, per l’indipendenza lineare dei vettori vi
0 e dalla prima relazione, per lo stesso motivo, a1 = · · · = adm−1 = 0 . Quindi è
possibile completare l’insieme
(m−2) dm−1
}i=1
(m−1) dm−1
}i=1
∪ {vi
(m−1) dm−1
}i=1
∪ {vi
{vi
ad una base
{vi
(m−2) dm−2
}i=1
(m−2)
di Lm−2 (V ). Inoltre, a meno di sottrarre ad ogni vettore vj
(m−2)
opportuna combinazione lineare di vettori vj
(m−2)
che L(vj
con j > dm−1 una
con j ≤ dm−1 , si può supporre
) = 0 per ogni j > dm−1 .
(m−3) dm−2
}i=1
in Lm−3 (V ) tali che
Analogamente, esistono vettori {vi
(m−3)
L(vi
(m−2)
) = vi
i = 1, . . . , dm−2 .
,
Inoltre, se sussistesse una relazione lineare
(m−1)
a1 v1
(m−2)
(m−1)
+ · · · + adm−1 vdm−1 + b1 v1
(m−2)
+ · · · + bdm−2 vdm−2 +
(m−3)
c1 v1
(m−3)
+ · · · + cdm−2 vdm−2 = 0,
applicando l’operatore L si concluderebbe, in particolare, che i coefficienti ci sono
tutti nulli e quindi, per l’indipendenza dei vettori coinvolti nella risultante relazione
lineare, che tutti i coefficienti sono nulli. Applicando il teorema del completamento
(m−3) dm−3
}i=1 ⊆ Lm−3 (V ) tale che
si vede quindi che esiste un insieme {vi
• Lm−3 (V ) ha una base della forma
(m−1) dm−1
}i=1
{vi
(m−3)
• L(vi
(m−2)
) = vi
(m−2) dm−2
}i=1
∪ {vi
(m−3) dm−3
}i=1 ,
∪ {vi
per i = 1, . . . , dm−2 .
(m−3)
, per i > dm−2 , una opportuna comA meno di sottrarre ad ogni vettore vi
(m−3)
(m−2) dm−1
) sia una
}i=1 , si può supporre che L(vi
binazione lineare dei vettori {vi
(m−2) dm−2
}i=1 per ogni i > dm−2 . A meno di sotcombinazione lineare dei vettori {vi
(m−3)
, per i > dm−2 , una opportuna combinazione
trarre ulteriormente ad ogni vi
(m−3)
(m−3) dm−2
) = 0 per
}i=1 , si può inoltre supporre che L(vi
lineare dei vettori {vi
ogni i > dm−2 .
Ragionando in modo analogo per induzione si trovano, per h = 0, . . . , m − 1 ,
(h) h
⊆ Lh (V ) tali che
sottoinsiemi {vi }di=1
•
•
•
Sm−1
(j) dj
h
j=h {vi }i=1 è una base di L (V ),
(h+1)
(h)
per i = 1, . . . , dh+1 e
L(vi ) = vi
(h)
L(vi ) = 0 per i = dh+1 + 1, . . . , dh .
Se indichiamo ora con Vi , per i = 1, . . . , d0 , il sottospazio di V generato dai vettori
(j)
vi per j ≥ 0 , è evidente dalla costruzione che ogni Vi è L –invariante e che la
restrizione di L ad ogni Vi è nilpotente e ciclico. Inoltre V è chiaramente somma
diretta dei Vi .
Lemma 2.3. Sia L : V → V un operatore ciclico e nilpotente, e sia n = dim V .
Allora dim Lk (V ) = n − k per ogni k ≤ n.
3
Dimostrazione. Sia v, L(v), . . . , Ln−1 (v) una base di V . Poiché per il lemma 2.1
Ln = 0 , abbiamo Lk (V ) = hLk (v), Lk+1 (v), . . . , Ln−1 (v)i per ogni k ≤ n. Dunque
i vettori Lk (v), Lk+1 (v), . . . , Ln−1 (v) ∈ Lk (V ) generano Lk (V ) e sono linearmente
indipendenti.
Lemma 2.4. Sia V = U1 ⊕ · · · ⊕ Ur = W1 ⊕ · · · ⊕ Ws e, posto mi = dim Ui ,
i = 1, . . . , r e nj = dim Wj , j = 1, . . . , s, si supponga che m1 ≥ m2 ≥ · · · ≥ mr e
n1 ≥ n2 ≥ · · · ≥ ns . Sia L : V → V un operatore lineare tale che ogni sottospazio
Ui e Wj è L –invariante ed ogni restrizione L|Ui e L|Wj è un operatore ciclico e
nilpotente. Allora r = s e mi = ni per ogni i = 1, . . . , r .
Dimostrazione. Se l’enunciato fosse falso esisterebbe un primo indice i tale che
mi 6= ni . Senza perdita di generalità possiamo supporre mi < ni . Allora, poiché
mi
Lmi (Uj ) = {0} per ogni j ≥ i , abbiamo Lmi (V ) = ⊕i−1
(Uj ) e quindi, per il
j=1 L
lemma 2.3,
dim Lmi (V ) =
(2.2)
i−1
X
(mj − mi ).
j=1
D’altra parte Lmi (V ) = ⊕sj=1 Lmi (Wj ), perciò, sempre per il lemma 2.3,
(2.3)
dim L
mi
(V ) ≥
i
X
(nj − mi ) = ni − mi +
i−1
X
(nj − mi ).
j=1
j=1
Ma mj = nj per j = 1, . . . , i − 1 , quindi la (2.2) e la (2.3) contraddicono la
disuguaglianza mi < ni .
Un blocco di Jordan con autovalore α è una matrice quadrata del tipo


α 0 0 ··· 0
1 α 0 · · · 0




Jα =  0 1 α · · · 0 
 ..
.
.
. . .. 
.

0 0 ···
1 α
Teorema 2.5. Sia V uno spazio vettoriale complesso, L : V → V un operatore
lineare, e sia mL (t) = (t − α1 )m1 · · · (t − αk )mk . Allora V = Z1 ⊕ · · · ⊕ Zk ,
dove Zi = ker(L − αi I)mi , i = 1, . . . , k , ed ogni sottospazio Zi è somma diretta
di sottospazi L –invarianti Nij , j = 1, . . . , hi , ognuno dei quali possiede una base
rispetto alla quale la restrizione di L ha matrice data da un blocco di Jordan di tipo
Jαi . Inoltre, i numeri hi e le dimensioni dei sottospazi Nij sono univocamente
determinati da L .
Dimostrazione. Sia mL (t) = (t − α1 )m1 · · · (t − αk )mk , dove αi 6= αj per i 6= j .
In base al teorema 6, cap. 12, del testo sappiamo che V = Z1 ⊕ · · · ⊕ Zk , dove
e i = (L − αi I)|Zi è
Zi = ker(L − αi I)mi ⊆ V per i = 1, . . . , k . L’operatore L
chiaramente nilpotente, quindi per i lemmi 2.1 e 2.2 Zi = Ni1 ⊕· · ·⊕Nihi per qualche
e i –invariante (e pertanto L –invariante) e
hi , dove ogni Nij ⊆ Zi è un sottospazio L
e i |Nij è di tipo (2.1). Ne segue
possiede una base rispetto alla quale la matrice di L
che, rispetto a tale base, la matrice associata ad L|Nij è un blocco di Jordan Jαi .
Inoltre, per il lemma 2.4 applicato agli operatori L|Zi , i numeri hi e le dimensioni
degli Nij sono univocamente determinati dall’operatore L .
4
Corollario 2.6 (Forma canonica di Jordan). Ogni matrice n × n a coefficienti
complessi è coniugata ad una matrice a blocchi


B1 0 · · ·
0
 0 B2 · · ·
0


B= .
..  ,
.
..
 ..
. 
0
0 · · · Bs
dove ogni Bi è un blocco di Jordan. La matrice B è univocamente determinata a
meno di permutazioni dei blocchi.
Dimostrazione. Il corollario è una immediata conseguenza del teorema 2.5. I dettagli della semplice dimostrazione sono lasciati per esercizio.
5