APPUNTI DI ALGEBRA LINEARE 1. Anello delle Matrici Definizione

APPUNTI DI ALGEBRA LINEARE
VER. 1.1.0
VINCENZO C. NARDOZZA
1. Anello delle Matrici
Definizione 1.1. Siano m, n ∈ N ed R un anello commutativo con unità. Diciamo
matrice m × n a coefficienti in R ogni tabella fatta da m righe ed n colonne nei cui
m · n posti siano posizionati elementi di R.
• Se m = n, la matrice si dice quadrata.
• Se m = 1 la matrice si dice matrice riga.
• Se n = 1 la matrice si dice matrice colonna
• L’insieme delle matrici m × n a coefficienti in R si indica con Mm×n (R).
2 2 3
Esempio 1.2. La tabella
è una matrice 2 × 3 a coefficienti in Z (ma
1 0 2
anche a coefficienti in Q, R, C). La matrice
1 2 3 4
è una matrice riga, la matrice

1
 2 
 
 3  ∈ M5×1 (R)
 
 4 
√
5

è una matrice colonna a coefficienti in R.
I posti in cui compaiono i numeri di una matrice sono detti case. Una matrice
m × n ha mn case. La casa (i, j) sarà posta all’incrocio tra la riga i e la colonna
j. L’elemento di R che compare nella casa (i, j) viene detto l’entrata (i, j) della
matrice.
Per convenzione, fissati m, n, R, una matrice di Mm×n (R) verrà indicata in
grassetto con una lettera minuscola. Inoltre, scriveremo


a11 a12 . . . a1n
 a21 a22 . . . a2n 


a = (aij ) per indicare a =  .
..
.. 
 ..
.
. 
am1 am2 . . . amn
Definizione 1.3. (Somma tra matrici)
Siano a, b ∈ Mm×n (R), con a = (aij ) e b = (bij ). La matrice
a + b := (aij + bij ) ∈ Mm×n (R)
è detta la somma delle matrici a e b.
1
2
VINCENZO C. NARDOZZA
Osservazione 1.4. Si noti che per poter essere sommate, le matrici date devono
avere la stessa forma. Se ciò avviene, la loro somma è la matrice della stessa forma
avente come entrata (i, j) la somma delle entrate (i, j) in a e b.
1 2 3
1 −2 0
Esempio 1.5. Siano a :=
eb=
. Allora
3 2 1
0 1 −1
2 0 3
a+b=
3 3 0
E’ immediato provare che
Lemma 1.6. L’addizione tra matrici è associativa e commutativa. La matrice 0
avente 0R in tutte le case è detta matrice nulla m × n ed è l’elemento neutro per
tale operazione. La matrice opposta della matrice a = (aij ) è la matrice (−aij ), e
verrà indicata con −a.
Possiamo definire un prodotto tra matrici, ma la cosa è più elaborata. Il prototipo di tale prodotto è il seguente:
Definizione 1.7. Siano r = (r1,j ), c = (ci,1 ) una matrice riga e una matrice
colonna, rispettivamente. Se la lunghezza n di r coincide con l’altezza di c si pone
(1)
r · c :=
n
X
r1,j cj,1 = r1,1 c1,1 + r1,2 c2,1 + · · · + r1,n cn,1 ∈ F.
j=1
 
3
Esempio 1.8. Siano r = 1 2 3 , c = 2. Allora
1
 
3
r · c = 1 2 3 · 2 = 1 · 3 + 2 · 2 + 3 · 1 = 3 + 4 + 3 = 10
1
Fatto questo, si dà la seguente definizione di prodotto tra matrici:
Definizione 1.9. Siano a := (aij ) ∈ Mm×n (R) e b := (bhk ) ∈ Mn×p (R). Si
definisce


n
X
a · b := 
aij bjk  ∈ Mm×p (R).
j=1
Commento: in proposito al prodotto tra matrici, si noti che
• la lunghezza n di (ogni) riga della matrice a deve coincidere con l’altezza
di (ogni) colonna della matrice b;
• l’entrata (i, k) della matrice a · b è il prodotto (1) tra la riga i-ma ri di a e
la colonna k-ma ck di b, cioè


r1 · c1 r1 · c2 . . . r1 · cp
 r2 · c1 r2 · c2 . . . r2 · cp 


a·b= .
..
..  ∈ Mm×p (R).
.
 .
.
. 
rm · c1 rm · c2 . . . rm · cp
VER. 1.1.0
APPUNTI DI ALGEBRA LINEARE
Esempio 1.10. Siano a =
0
3
1
4

2
2
, b = 1
5
0
1
1
7
7
4
3
2
6
5
7
3

8
7 matrici a coefficienti
8
in Z9 . Allora
a·b=
1
1
5
2
∈ M2×4 (Z9 )
Per esempio, l’entrata (2, 3) della matrice prodotto è ottenuta moltiplicando secondo
(1) la riga 2 di a con la colonna 3 di b:
3 · 6 + 4 · 5 + 5 · 7 = 1 ∈ Z9 .
Definizione 1.11. Sia n ∈ N. Indichiamo con 1n la matrice avente 1R nelle case
(i, i) per ogni i = 1, . . . , n e 0R altrove.
Lemma 1.12. Siano a ∈ Mm×n (R), b ∈ Mn×p (R) e c ∈ Mp×q (R). Allora
(1) (a · b) · c = a · (b · c) ∈ Mm×q (R);
(2) 1m a = a · 1n = a.
Focalizziamo ora la nostra attenzione sulle matrici quadrate:
Proposizione 1.13. Sia n ∈ N. La terna ordinata (Mn (R), +, ·) è un anello con
unità 1n , detto anello delle matrici quadrate di taglia n su R.
Osservazione 1.14. Anche se R è commutativo, l’anello Mn (R) è non commutativo non appena n > 2. Invece, M1 (R) è un anello isomorfo ad R.
E’ possibile in effetti definire anche un’altra “operazione” per matrici, la cosiddetta moltiplicazione per scalari: se α ∈ R e a = (aij ) ∈ Mm×n (R) poniamo
αa := (αaij ) ∈ Mm×n (R).
In merito a ciò, si noti che basta definire α · 1m come la matrice avente α nelle case
(i, i) per ogni i = 1, . . . , m per avere
αa = (α1m )a.
Una matrice del tipo α1m si dice una matrice scalare.
Alla luce di questo prodotto, alcune matrici sono particolarmente semplici e
simultaneamente importanti:
Definizione 1.15. Sia n > 2, e siano i, j ∈ {1, . . . , n}. Indichiamo con eij la
matrice di Mn (R) avente 1R come entrata (i, j) e 0R altrove.
Le matrici eij , per i, j ∈ {1, . . . , n}, si dicono le matrici unità di taglia n.
Esempio 1.16. Le matrici
1
e11 =
0
0
e21 =
1
unità di taglia 2 sono le seguenti:
0
0 1
e12 =
0
0 0
0
0 0
e22 =
0
0 1
Proposizione 1.17. Sia a = (aij ) ∈ Mn (R). Allora a =
Pn
particolare 1n = i=1 eii .
Pn
i,j=1
aij eij . In
4
VINCENZO C. NARDOZZA
Il prodotto di matrici unità è particolarmente semplice. Detto
(
1 se u = v
δuv :=
0 altrimenti
(delta di Kronecker), si ha infatti
Lemma 1.18. Siano eij , ehk ∈ Mn (R). Allora
eij ehk = δjh eik .
2. Trasformazioni elementari
Da questa sezione in poi e salvo esplicita indicazione contraria le matrici considerate saranno a coefficienti in un campo F . Alcune delle considerazioni che
faremo saranno valide anche nel contesto più generale di matrici a coefficienti in un
anello commutativo, ma non è scopo di questi appunti entrare nei distinguo di tali
generalità.
Lo scopo di questa sezione è introdurre un insieme particolare e importante di
matrici quadrate. La loro definizione è la seguente
Definizione 2.1. Sia F un campo, n > 2. Poniamo
• Rij (a) := 1n + aeij per ogni i, j ∈ {1, . . . , n} con i 6= j e a ∈ F ;
• Tij := 1n − eii − ejj + eij + eji per ogni i, j ∈ {1, . . . , n} con i 6= j;
• Mi (α) := 1n − eii + αeii per ogni i ∈ {1, . . . , n} e α ∈ F ∗ .
Le matrici Rij (a), Tij , Mi (α) si dicono le matrici di trasformazioni elementari per
righe di taglia n.
Commento: Che forma hanno le matrici di trasformazioni elementari?
• Le matrici Rij (a) hanno tutti 1 sulla diagonale principale (le case (1, 1),
(2, 2),. . . , (n, n)), a nella casa (i, j) e altrove tutti 0;
• le matrici Tij sono ottenute scambiando tra loro le righe i e j della matrice
1n ;
• Le matrici Mi (α) hanno entrate non nulle solo sulla diagonale principale,
ed esse sono tutte 1 tranne che l’entrata (i, i), dove c’è α.
Le matrici di trasformazioni elementari esplicano il loro effetto nella moltiplicazione
a sinistra di una data matrice. Precisamente, sia a ∈ Mn×p (F ) una matrice (non
necessariamente quadrata, ma con n righe), e sia t una matrice di trasformazioni
elementari di taglia n. Detta b := ta la matrice prodotto, si ha
• se t = Rij (a) allora b è ottenuta da a sommando alla riga i-ma ri di a la
riga j-ma di a moltiplicata per a, arj ;
• se t = Tij , allora b è ottenuta da a scambiandone le righe i e j;
• se t = Mi (α) allora b è ottenuta da a moltiplicandone per α la riga i-ma.
1 2 3
Esempio 2.2. Sia a =
∈ M2×3 (Z7 ). Calcoliamo i prodotti R12 (3)a,
4 5 6
T12 a, M2 (3)a.
1+3·4 2+3·5 3+3·6
6 3 0
• R12 (3)a =
=
: alla riga 1 di a
4
5
6
4 5 6
sommiamo
la riga2 dopo averla moltiplicata per 3.
4 5 6
• T12 a =
: abbiamo scambiato di posto le righe 1 e 2 di a;
1 2 3
VER. 1.1.0
APPUNTI DI ALGEBRA LINEARE
5
1
2
3
1 2 3
=
: abbiamo moltiplicato per 3
3·4 3·5 3·6
5 1 4
la seconda riga di a.
Le matrici elementari considerate erano
1 3
0 1
1 0
R12 (3) =
, T12 =
, M2 (3) =
.
0 1
1 0
0 3
• M2 (3)a =
Il lettore può verificare che facendo esplicitamente le moltiplicazioni righe per
colonne si ottengono gli stessi risultati annunciati.
2
Convenzione: quando nel seguito partiremo da una matrice assegnata a ed
effettueremo una moltiplicazione ta con una matrice di trasformazioni elementari
t, diremo che abbiamo effettuato una trasformazione elementare t su a, usando la
stessa notazione che usiamo per t ma senza usare il grassetto (t).
Esempio 2.3. Riprendendo l’esempio precedente scriveremo, per esempio,
1 2 3
6 3 0
6 3 0
1 3 5
→
→
→
4 5 6 R12 (3) 4 5 6 M2 (2) 1 3 5 T12 6 3 0
per indicare la matrice T12 · M1 (2) · R12 (3) · a, ottenuta da a effettuando successivamente le operazioni elementari R12 (3), poi M1 (2) e infine T12 .
Definizione 2.4. (Matrici in forma normale)
Sia N ∈ Mm×n (F ). Si dice che N è in forma normale se N = 0 o, se N 6= 0, se
sussistono tutte le seguenti condizioni:
(1) esiste p ∈ {1, . . . m} tale che le righe (p + 1)-ma, (p + 2)-ma, . . . , m-ma di
N sono tutte nulle;
(2) per ogni i 6 p esiste 1 6 γ(i) 6 n tale che aiγ(i) = 1 ma aij = 0 se j < γ(i);
(3) è γ(1) < γ(2) < · · · < γ(p);
(4) ahγ(i) = 0 per ogni h < i.
In tal caso gli elementi a1γ(1) , a2γ(2) , . . . , apγ(p) si dicono i pivot di N.
Osservazione 2.5. Una matrice in forma normale e non nulla è perciò del tipo
1
2
3
4
0...0
γ(1)
1
∗...∗
γ(2)
0
1
γ(3)
0
0
1
∗...∗
∗...∗
∗...∗
∗...∗
∗...∗
γ(4)
0
0
0
1
∗...
∗...
∗...
∗...
..
.
(le entrate non segnate sono tutte nulle; le entrate con ∗ possono essere non nulle).
Esempio 2.6. La matrice

0
0

N=
0
0
0
0
0
0
0
0
1
0
0
0
0
2
0
0
0
0
0
1
0
0
0
0
0
1
0
0
1
2
3
0
0
0
0
0
1
0

1
1

2

4
0
è in forma normale. Qui, p = 4, e la sequenza γ(1) < γ(2) < γ(3) < γ(4) è
3 < 5 < 6 < 8.
6
VINCENZO C. NARDOZZA
Il motivo dell’introduzione delle trasformazioni elementari è il seguente:
Teorema 2.7. (Riduzione a forma normale)
Sia a ∈ Mm×n (F ). Allora esiste una successione finita di trasformazioni elementari
sulle righe che porta da a a una matrice in forma normale N. Inoltre, la matrice
N non dipende dalla particolare sequenza seguita ma dipende solo da a.
Osservazione 2.8. Dire che t1 , t2 , . . . , tk è una sequenza che porta la matrice a
a una forma normale N vuol dire che tk . . . t2 t1 a = N. Posto q := tk . . . t2 t1 , ciò
vuol dire qa = N.
Ci possono essere più sequenze che portano a in forma normale, cioè più matrici
q ottenute come prodotto di matrici di trasformazioni elementari tali che qa sia in
forma normale. Tuttavia, come specificato nel Teorema precedente, se q e q0 sono
due di esse, risulta
qa = N = q0 a.
2
L’unicità della forma normale di una matrice consente di dare la seguente
Definizione 2.9. Si dice rango di una matrice a ∈ Mm×n (F ), e si indica con rk(a),
il numero di pivot della sua forma normale.
Osservazione 2.10. Dato che su ogni riga e ogni colonna ci può essere al più un
solo pivot, risulta che rk(a) 6 min{m, n}. Inoltre, la matrice nulla è l’unica ad
avere rango 0.
In particolare, si ha
Lemma 2.11. Siano a ∈ Mn (F ) ed N la forma normale di a. Allora
(1) rk(a) < n ⇐⇒ l’ultima riga di N è nulla;
(2) rk(a) = n ⇐⇒ N = 1n .
Dimostrazione. Il primo punto è ovvio.
Per il secondo, si noti che siccome la matrice è quadrata, l’unico modo per disporre gli n pivot in N è di allinearli lungo la diagonale principale. Automaticamente
in tal caso la matrice ottenuta è la matrice 1n .
L’importanza di quest’ultimo risultato sarà evidente nella sezione seguente.
3. Matrici invertibili
In un anello, l’insieme degli elementi invertibili è sempre un sottoinsieme importante di cui tener conto. Nel caso di anelli non commutativi, la questione della
determinazione degli elementi invertibili è complicata dalla considerazione che, in
generale, ab = 1 ; ba = 1.1 Noi in questa sezione limiteremo le nostre considerazioni agli anelli Mn (F ) di matrici quadrate a entrate in un campo F , con
un’unica rapida incursione nel caso Mn (R) con R anello commutativo con unità
(nella sezione dedicata ai determinanti).
Cominciamo lo studio delle matrici invertibili con una definizione:
Definizione 3.1. Si pone
GLn (F ) := {a ∈ Mn (F ) | a è invertibile in Mn (F )},
e si chiama gruppo Generale Lineare di ordine n su F .
1In effetti si possono dare esempi in cui ab = 1 epperò ba 6= 1!
VER. 1.1.0
APPUNTI DI ALGEBRA LINEARE
7
Osservazione 3.2. In termini più espliciti, data a ∈ Mn (F ) si ha
a ∈ GLn (F ) ⇐⇒ ∃b ∈ Mn (F ) tale che ab = ba = 1n .
Come accade in generale, se a è invertibile, allora ha uno ed un solo inverso. La
matrice b è quindi unica, e la si denota senza ambiguità con a−1 .
Isoliamo un caso facile da dirimere:
Corollario 3.3. GL1 (F ) = {(α) ∈ M1 (F ) | α 6= 0} ∼
= F ∗.
Nel seguito, assumeremo n > 2 per considerare solo i casi significativi.
Il primo passo per determinare GLn (F ) è elencare alcuni elementi importanti:
Proposizione 3.4. Siano nel seguito a ∈ F , α ∈ F ∗ , i, j ∈ {1, . . . , n} con i 6= j.
(1) 1n ∈ GLn (F );
(2) le matrici di trasformazioni elementari Rij (a), Tij , Mi (α) sono invertibili;
(3) tutti i prodotti di matrici di trasformazioni elementari sono matrici invertibili.
Dimostrazione. Il punto (1) è ovvio: l’identità di un anello è sempre invertibile.
Per il punto (2) possiamo esibire esplicitamente gli inversi:
Rij (a)−1 = Rij (−a),
T−1
ij = Tij ,
Mi (α)−1 = Mi (α−1 ).
La verifica di questo semplice fatto è lasciata al lettore. La cosa importante da
notare è che l’inversa di una matrice di trasformazioni elementari è ancora una
matrice di trasformazioni elementari.
Infine, sia q = t1 t2 . . . tk un prodotto di k > 2 matrici di trasformazioni elemen−1 −1
tari. Allora è immediato verificare che la matrice t−1
k · . . . t2 t1 è l’inversa di q.
Si noti che anch’essa è un prodotto di matrici di trasformazioni elementari.
L’invertibilità è completamente caratterizzata dal rango:
Proposizione 3.5. (invertibilità e rango)
Sia a ∈ Mn (F ). Allora
a ∈ GLn (F ) ⇐⇒ rk(a) = n.
Inoltre, a è un divisore di 0 se e solo se 0 < rk(a) < n.
Dimostrazione. Sia N la forma normale di a e sia q la matrice associata a una sequenza di trasformazioni elementari che porta a in forma normale. Allora qa = N.
a ∈ GLn (F ) ⇒ rk(a) = n : Supponiamo per assurdo che rk(a) < n. Allora l’ultima riga di N è nulla per il Lemma 2.11 ⇒ enn N = 0. Ma notato che siccome a, q
sono invertibili anche N = qa è invertibile si ha
enn N = 0 ⇒ enn NN−1 = 0N−1 = 0⇒enn = 0
∃N−1
e questo è falso. Perciò rk(a) = n.
rk(a) = n ⇒ a ∈ GLn (F ) : rk(a) = n ⇒ N = 1n per il Lemma 2.11. Allora
qa = 1n e dato che q è invertibile si ha a = q−1 (perchè?). Perciò a è invertibile
e la sua inversa è q.
L’ultima parte dell’enunciato è immediata: se a è un divisore di zero non può
essere invertibile, e quindi rk(a) < n. Viceversa, se rk(a) < n, abbiamo già trovato
che d := enn q è non nulla (perchè?) e da = enn N = 0.
Analogamente, qaenn = 0 e quindi aenn = 0, e enn è un co-divisore destro di
zero per a.
8
VINCENZO C. NARDOZZA
Da questa Proposizione si hanno i seguenti corollari:
Corollario 3.6. Se a ∈ Mn (F ), allora
• o a = 0n
• o a è invertibile
• o a è un divisore di zero.
In altri termini
Mn (F ) = {0n } ] GLn (F ) ] D(Mn (F )),
dove D(Mn (F )) è l’insieme dei divisori di zero in Mn (F ) e ] indica un’unione tra
insiemi disgiunti.
Dimostrazione. La collocazione di a è decisa dal suo rango: rk(a) = 0 ⇐⇒
a = 0. Se 0 < rk(a) < n allora a è un divisore di zero. Se rk(a) = n allora a è
invertibile.
Corollario 3.7. Siano a, b ∈ Mn (F ). Allora
ab = 1n ⇒ ba = 1n .
Dimostrazione. Se ab = 1, allora a 6= 0 e così rk(a) > 0. Se rk(a) < n allora a è
un divisore di zero e quindi esiste una matrice d 6= 0 tale che da = 0. Ma allora
d = d1n = dab = 0b = 0,
assurdo. Pertanto rk(a) = n e quindi
b = (a−1 a)b = a−1 (ab) = a−1 ⇒ ba = 1n .
Osservazione 3.8. E’, questa, una cosa che come già sottolineato è sicuramente
non ovvia e non automatica per anelli non commutativi.
Corollario 3.9. Le matrici invertibili di Mn (F ) sono precisamente le matrici
prodotto di matrici di trasformazioni elementari.
Dimostrazione. La matrice 1n è prodotto di trasformazioni elementari: per esempio, 1n = T12 · T12 . Se a ∈ GLn (F ) ed è diversa da 1n allora esiste una matrice q
ottenuta come prodotto di matrici di trasformazioni elementari tale che qa = 1n .
Perciò a−1 = q. Ciò equivale a a = q−1 . Dato che l’inversa di un prodotto di
matrici di trasformazioni elementari è ancora un prodotto di matrici di trasformazioni elementari (si veda in merito quanto notato nel corso della dimostrazione della
Proposizione 3.4) , si ha quanto voluto.
Osservazione 3.10. Ciò consente di controllare l’invertibilità di una assegnata
matrice e, nel caso, automaticamente di invertire la stessa. Basta infatti eseguire
una sequenza t1 , t2 , . . . , tk che porti la matrice assegnata in forma normale. Se
la forma normale è 1n , allora la matrice data è invertibile. La stessa sequenza
t1 , t2 , . . . , tk applicata alla matrice 1n dà la matrice q che è l’inversa di a.
Esempio 3.11. Si decida se la matrice


2 3 4
a := 5 6 0 ∈ M3 (Z7 )
1 2 4
è invertibile e in caso affermativo si determini la sua inversa.
VER. 1.1.0
APPUNTI DI ALGEBRA LINEARE
9
Svolgimento
La tavola degli inversi degli elementi di Z7 è la seguente:
1
1
2
4
3
5
6
6
Fatto questo mettiamo a in forma normale tramite trasformazioni elementari sulle
righe:








2 3 4
1 5 2
1 5 2
1 5 2
5 6 0 → 5 6 0 → 0 2 4 → 0 1 2
21 (2)
1 2 4 M1 (4) 1 2 4 R
0 4 2 M2 (4) 0 4 2
R31 (6)




1 0 6
1 0 0
→ 0 1 2 → 0 1 0
R12 (2)
13 (1)
0 0 1 R
0 0 1
R32 (3)
R23 (5)
Quindi
q = R23 (5)R13 (1)R32 (3)R12 (2)M2 (4)R31 (6)R21 (2)M1 (4)
è la matrice inversa di a. Per conoscerla esplicitamente, basta effettuare le stesse
operazioni elementari sulla matrice 1n :








4 0 0
4 0 0
4 0 0
1 0 0
0 1 0 → 0 1 0 → 1 1 0 → 4 4 0
21 (2)
3 0 1 M2 (4) 3 0 1
0 0 1 M1 (4) 0 0 1 R
R31 (6)




5 1 0
6 6 1
→ 4 4 0 → 2 1 5
R12 (2)
13 (1)
1 5 1 R
1 5 1
R32 (3)
R23 (5)
Il lettore può provare a controllare che qa = 13 effettuando direttamente il prodotto
tra matrici.
2
Nell’esempio, abbiamo usato il modo più sistematico per ottenere la forma normale di a. A seconda dei casi, si possono usare altre sequenze, che accorciano
la procedura. Il risultato ottenuto scegliendo un’altra sequenza è di variare la
fattorizzazione di q, mentre non cambia q.
4. Sistemi Lineari
Un sistema lineare di m equazioni in n incognite a coefficienti nel campo F è il
problema di determinare gli elementi (α1 , α2 , . . . , αn ) ∈ F n = F × F × · · · × F tali
|
{z
}
n volte
che le m identità
n
X
j=1
a1j αj = c1 ,
n
X
j=1
a2j αj = c2 ,
...
,
n
X
amj αj = cm ,
j=1
i cui coefficienti aij , ci sono in F , siano tutte contemporaneamente soddisfatte.
Un sistema lineare è rappresentato in forma compatta come
Pn
j=1 aij xj = ci
i = 1, . . . , m
10
VINCENZO C. NARDOZZA
e in forma più esplicita da

a11 x1



 a21 x1
..

.



am1 x1
+a12 x2
+a22 x2
...
...
+a1n xn
+a2n xn
= c1
= c2
+am2 x2
...
+amn xn
= cm
E’ chiaro che tutte le informazioni essenziali per il problema sono contenute solo
nei suoi coefficienti, non nel nome delle incognite. Precisamente detta a la matrice
dei coefficienti


a11 a12 . . . a1n
 a21 a22 . . . a1n 


a :=  .
..
.. 
 ..
.
. 
am1

am2
...
amn

c1
 c2 
 
e detta c :=  .  la colonna dei termini noti,
 .. 
cm
il sistema può essere riscritto compattamente
come un’equazione lineare avente
 
x1
 x2 
 
ax = c.
come incognita la colonna x :=  . :
 .. 
xn
Tale informazione sul problema può essere codificata ancora un po’ più compattamente introducendo la definizione seguente:
Definizione 4.1. Sia ax = c un sistema lineare di m equazioni in n incognite a
coefficienti in F . La matrice s ottenuta aggiungendo alle colonne di a la colonna
dei termini noti in ultima posizione si dice la matrice completa del sistema.
Si noti che s ∈ Mm×(n+1) (F ). Nel seguito, la rappresenteremo come s = (a | c)
per evidenziare il ruolo diverso che a e c giocano nel problema.
La matrice completa del sistema gioca un ruolo essenziale nella risolubilità del
sistema lineare e, una volta che essa sia stata controllata, nella determinazione delle
sue soluzioni.
L’osservazione principale è riassunta nel seguente
Lemma 4.2. Sia ax = c un sistema lineare di m equazioni in n incognite a
coefficienti in F ed s la sua matrice completa.
(1) se t è una matrice di trasformazioni elementari in Mm (F ), allora il sistema
di matrice completa s0 = ts è equivalente al sistema di matrice completa s;
(2) se N = (a0 |c0 ) è la forma normale della matrice s = (a|c), il sistema
a0 x = c0 è equivalente al sistema ax = c.
Dimostrazione. E’ facile rendersi conto che le trasformazioni elementari sulle righe corrispondono a trasformazioni sul sistema che conservano l’equivalenza tra i
problemi. Esplicitamente, si ha
• sia t = Rij (a). Allora ts è la matrice ottenuta da s sommando alla riga i di
s la sua j-ma riga dopo averla moltiplicata per a ∈ F . Pertanto il sistema
APPUNTI DI ALGEBRA LINEARE
VER. 1.1.0
11
che ha come matrice completa ts è il sistema ottenuto sommando membro
a membro la i-ma equazione alla j-ma dopo aver moltiplicata quest’ultima
per a ∈ F , e pertanto è equivalente al sistema di partenza;
• sia t = Mi (α). Allora ts è la matrice ottenuta da s moltiplicandone per
α ∈ F ∗ la riga i-ma ⇒ il sistema di matrice completa ts è ottenuto dal
sistema di partenza moltiplicandone per α l’i-ma equazione, e pertanto è
equivalente ad esso;
• se infine t = Tij allora ts è ottenuta da s scambiano tra loro le righe i e j
⇒ il sistema associato a ts è ottenuto dal sistema originale scambiando di
posto le equazioni i e j, e quindi manifestamente è equivalente al sistema
di partenza.
Se N è la forma normale di s ⇒ N = qs dove q = t1 . . . tk è un prodotto di matrici di
trasformazioni elementari ti ⇐⇒ N è la matrice completa del sistema ottenuta da s
effettuando la sequenza tk , . . . , t2 , t1 (in quest’ordine!) di trasformazioni elementari
sulle righe. Dato che a ogni passo la matrice che si ottiene è associata a un sistema
lineare equivalente al sistema originale, si ha quanto voluto.
Il punto in tutto ciò è che è assai facile decidere se il sistema è risolubile e quali
eventualmente siano le sue soluzioni se la sua matrice completa è in forma normale.
Si ha infatti
Lemma 4.3. Sia ax = c un sistema la cui matrice completa s sia in forma
normale. Esso è risolubile ⇐⇒ nessun pivot cade nella colonna dei termini noti.
Inoltre, se il sistema è risolubile, siano p = rk(s) e sia (γ(1), . . . , γ(p)), la
sequenza delle colonne in cui sono collocati i pivot delle prime righe.
Allora le soluzioni del sistema sono le n-ple (y1 , . . . , yn ) ∈ F n tali che
• se j = γ(i) ∈ {γ(1), . . . , γ(p)} allora
X
yγ(i) = ci −
aih yh ;
h>γ(i)
• se j 6∈ {γ(1), . . . , γ(p)} allora yj è un qualunque elemento di F .
n−p
In particolare, il sistema lineare ha |F |
soluzioni distinte, dipendenti da n − p
parametri liberi yj al variare di j in {1, . . . , n} \ {γ(1), . . . , γ(p)}.
Dimostrazione. Sotto la p-ma riga ci sono solo righe nulle. Se l’ultimo pivot cade
nella colonna dei termini noti, l’ultima equazione del sistema è 0 = 1, che non
ammette soluzioni e quindi il sistema è incompatibile, cioè non ha soluzioni.
Se ciò non accade, la i-ma equazione del sistema in forma normale sarà
X
aiγ(i) xγ(i) +
aih xh = ci .
h>γ(i)
Notato che aiγ(i) = 1 perchè è il pivot della i-ma riga di s, si ha
X
xγ(i) = ci −
aih xh .
h>γ(i)
Si noti che se h ∈ {γ(1), . . . , γ(p)} è aih = 0. Per ogni assegnazione delle variabili xj con j ∈
/ {γ(1), . . . , γ(p)} si ha allora un’assegnazione forzata per le variabili
xγ(1) , . . . , xγ(p) , ottenendo una soluzione del sistema. Dato che ciascuna delle variabili “libere” xj (con j ∈
/ {γ(1), . . . , γ(p)}) può essere assegnata in |F | modi differenti
e le n-ple ordinate che si ottengono sono tutte distinte, si ha quanto asserito.
12
VINCENZO C. NARDOZZA
Osservazione 4.4. Parlando in termini informali, il rango della matrice completa
del sistema ci dice quante sono le equazioni effettivamente essenziali. Ognuna di
esse “inchioda” una incognita (quella corrispondente al pivot). Quelle rimanenti
sono invece libere di assumere uno qualunque dei valori possibili in F .
Se il campo è infinito, un sistema risolubile ha una sola o infinite soluzioni, senza
possibilità intermedie. L’unicità si ha quando ci sono tante equazioni essenziali
quante le incognite disponibili: esse saranno tutte inchiodate a un valore particolare.
Se almeno una variabile resta libera di variare (se cioè n − p > 0) allora essa darà
a luogo a infinite soluzioni.
E’ prassi nella terminologia usuale esprimere questa situazione dicendo (con
abuso di notazione) che il sistema ha ∞n−p soluzioni.
Se il campo è finito, naturalmente, un sistema lineare a coefficienti in esso ha sempre necessariamente un insieme finito di soluzioni (alla peggio, esso ha 0 soluzioni).
2
Esempio 4.5. Si dica se il seguente sistema lineare a coefficienti in Z7

 x1 +2x2 +3x3 = 4
2x1
+3x3 = 5

3x1 +2x2
=6
è compatibile e, se si, si dica quante e quali sono le sue soluzioni
Svolgimento
La matrice dei coefficienti, la colonna dei termini noti e la matrice
rispettivamente





1 2 3
4
1 2 3
a =  2 0 3 ,
c =  5 ,
s= 2 0 3
3 2 0
3 2 0
6
Tramite una sequenza di trasformazioni
della matrice completa s:

1
N = 0
0
completa sono

4
5 
6
elementari, arriviamo alla forma normale
0
1
0
0
0
1

0
3 ,
4
corrispondente al sistema lineare

 x1
x2

x3
=0
=3
=4
che ha come unica soluzione (0, 3, 4) ∈ (Z7 )3 . Si noti che qui p = 3, n − p = 0 e
effettivamente 70 = 1.
Esempio 4.6. Si dica se il seguente sistema lineare a coefficienti in Z7

 5x1 +2x2 +2x3 = 2
3x1 +4x2 +4x3 = 4

6x1 +6x2 +2x3 = 5
è compatibile e, se si, si dica quante e quali sono le sue soluzioni
Svolgimento
VER. 1.1.0
APPUNTI DI ALGEBRA LINEARE
La matrice dei coefficienti, la colonna dei termini noti e la matrice
rispettivamente





2
5 2 2
5 2 2
a =  3 4 4 ,
c =  4 ,
s= 3 4 4
6 6 2
6 6 2
5
Tramite una sequenza di trasformazioni
della matrice completa s:

1
N = 0
0
corrispondente al sistema lineare
x1
x2
13
completa sono

2
4 
5
elementari, arriviamo alla forma normale
2
3
0

4
5 ,
0
+2x3
+3x3
=4
=5
0
1
0
in cui x3 può variare liberamente in tutto Z7 . Ognuna delle 7 possibili assegnazioni
di x3 dà luogo a una assegnazione forzata di x1 e x2 :
(
x1 = 4 − 2y
posto x3 = y ∈ Z7 allora dev’essere
.
x2 = 5 − 3y
L’insieme delle soluzioni è allora
{(4+5y, 5+4y, y) | y ∈ Z7 } = {(4, 5, 0), (2, 2, 1), (0, 6, 2), (5, 3, 3), (3, 0, 4), (1, 4, 5), (6, 1, 6)}.
Si noti, di nuovo, che p = 2, n − p = 1 e effettivamente ci sono 71 soluzioni distinte
del sistema.
Esempio 4.7. Si dica se il seguente sistema lineare a coefficienti in Z7

 5x1 +2x2 +2x3 = 4
3x1 +4x2 +4x3 = 5

6x1 +6x2 +2x3 = 6
è compatibile e, se si, si dica quante e quali sono le sue soluzioni
Svolgimento
La matrice dei coefficienti, la colonna dei termini noti e la matrice
rispettivamente





5 2 2
4
5 2 2
a =  3 4 4 ,
c =  5 ,
s= 3 4 4
6 6 2
6 6 2
6
completa sono

4
5 
6
Tramite una sequenza di trasformazioni elementari, arriviamo alla forma normale
della matrice completa s:


1 0 2 0
N = 0 1 3 0 ,
0 0 0 1
corrispondente al sistema lineare equivalente a quello dato

+2x3 = 0
 x1
x2 +3x3 = 0

0
=1
in cui la terza equazione non ammette soluzioni. Il sistema pertanto è incompatibile.
14
VINCENZO C. NARDOZZA
Si noti che anche in questo caso p = 3 e n − p = 0, ma stavolta NON ci sono
soluzioni, perchè la loro esistenza dipende NON SOLO da qual è il rango della
matrice completa del sistema, ma anche da dove compaiono i suoi pivot
La formulazione di questo principio in termini classici è la seguente:
Teorema 4.8. (Rouchè-Capelli)
Un sistema lineare di m equazioni in n incognite è compatibile se e solo se il rango
della matrice completa del sistema uguaglia il rango della matrice dei coefficienti.
In tal caso, detto p tale rango, le soluzioni del sistema dipendono da n − p
parametri liberi.
Dimostrazione. Basta notare che dire rk(s) = rk(a) equivale a dire che tutti i pivot
presenti nella forma normale N di s compaiono nelle prime n colonne, e cioè che
nella ultima colonna di N non compare un pivot.
5. Unicità della forma normale di una matrice
La chiave per accedere a buona parte dei risultati operativi ottenuti era costituita dal Teorema 2.7, di riduzione a forma normale. La prima parte del Teorema
non necessita di una dimostrazione (basta ragionare per induzione con un po’ di
coerenza, ripetendo quanto fatto negli esempi, per provare che ogni matrice o è
in forma normale o può essere messa in forma normale dopo un numero finito di
passi). Il fatto non ovvio è che la forma normale alla quale si arriva è unica, a
prescindere dalla particolare sequenza di trasformazioni elementari seguite. La dimostrazione di ciò non è inclusa nel programma del corso, ma ho ritenuto utile
inserirla in questa sezione per completezza, oltre che per soddisfare la curiosità di
studenti particolarmente diligenti.
Fissiamo Mm×n (F ) e sia V = M1×n (F ). In altri termini, V è l’insieme delle
matrici riga di lunghezza n. Sappiamo che (V, +) è un gruppo abeliano, e inoltre
si ha che ∀ α ∈ F , ∀ r ∈ V è αr ∈ V . Invece che parlare di matrici riga useremo
spesso il termine più semplice di vettori, specificando eventualmente la lunghezza
n di ciascuno di essi. Inoltre, chiameremo scalari gli elementi di F .
Sia poi E l’insieme delle trasformazioni elementari; sappiamo che T−1
ij = Tij ,
Mi (α)−1 = Mi (α−1 ) e Rij (u) = Rij (−u), per cui E ⊆ GLm (F ). Di conseguenza,
risulta H := hE i 6 GLn (F ). Inoltre, se la matrice b è stata ottenuta da a attraverso
una sequenza di trasformazioni elementari sulle righe, ciò vuol dire che esiste un
q ∈ H tale che b = qa. Ciò in particolare comporta che se n è una matrice in
forma normale ottenuta da a attraverso una sequenza di trasformazioni elementari,
allora n = qa per una certa q ∈ H.
Introduciamo una relazione di equivalenza in Mm×n (F ):
Proposizione 5.1. Per ogni a, b ∈ Mm×n (F ) scriviamo a ∼H b se esiste q ∈ H
tale che b = qa. La relazione introdotta è una relazione di equivalenza.
Dimostrazione. E’ un semplice esercizio.
In questa maniera, l’insieme Mm×n (F ) è ripartito in classi di equivalenza rispetto
la relazione ∼H , e in [a]∼H ci sono tutte le matrici che possono essere ottenute da
a tramite una sequenza finita di trasformazioni elementari. Tra esse, sicuramente
ci sarà una matrice in forma normale. Il nostro scopo in questo paragrafo sarà
raggiunto se riusciremo a provare che esattamente una matrice in forma normale è
presente in ciascuna classe di equivalenza.
VER. 1.1.0
APPUNTI DI ALGEBRA LINEARE
15
Per caratterizzare meglio le matrici di [a]∼H abbiamo bisogno della seguente
Definizione 5.2. Siano r1 , . . . , rk ∈ V . Per ogni α1 , . . . , αk ∈ F il vettore
α1 r1 + α2 r2 + · · · + αk rk =
k
X
αi ri ∈ V
i=1
sarà detto una combinazione F -lineare dei vettori dati.
Lemma 5.3. Assegnati i vettori r1 , . . . , rk ∈ V , ogni combinazione F -lineare di
combinazioni F -lineari dei vettori ri (i = 1, . . . , k) è ancora una combinazione
F -lineare dei vettori ri assegnati.
Pk
Pk
Dimostrazione. Siano v1 = j=1 α1,j rj , . . . , vh = j=1 αh,j rj vettori combinazioni F -lineari dei vettori r1 , . . . , rk , per certi αi,j ∈ F . Per ogni λ1 , . . . , λh ∈ F si
ha che
h
X
λi vi =
h
X
i=1
i=1
=
λi
k
X
h X
k
X
λi αi,j rj
i=1 j=1
j=1
k
h
X
X
j=1
αi,j rj =
!
λi αi,j
rj ,
i=1
combinazione F -lineare degli rj secondo gli scalari
h
X
i=1
λi αi,1 , . . . ,
h
X
λi αi,k
i=1
Se a ∈ Mm×n (F ), le sue righe formano un insieme di m vettori, univocamente
assegnato. Come notazione, se a ∈ R scriveremo ai per denotare la riga i-ma di a.
Proposizione 5.4. Assegnata una matrice a ∈ Mm×n (F ), ogni trasformazione
elementare sulle righe di a restituisce una matrice le cui righe sono combinazioni
F -lineari delle righe di a.
Dimostrazione. Basta esaminare l’effetto delle singole trasformazioni elementari
sulle righe di a. Per esempio, se la trasformazione eseguita è Rij (u), allora la
matrice b = Rij (u)a avrà le stesse righe di a, eccezion fatta per la riga i, che sarà
data da ai + uaj . Quindi se h 6= i risulta
bh = 0a1 + · · · + 0ah−1 + 1ah + 0ah+1 + · · · + 0am
mentre la riga i di b sarà
bi = 0a1 + · · · + 0ai−1 + 1ai + 0ai+1 + · · · + 0aj−1 + uaj + 0aj+1 + · · · + 0am .
Analogamente, il lettore può scrivere le righe di Mi (α)a e di Tij a come combinazione F -lineare delle righe di a.
Corollario 5.5. Se a, b ∈ Mm×n (F ) e a ∼H b allora ogni riga di b è combinazione
F -lineare delle righe di a.
16
VINCENZO C. NARDOZZA
Allora se n, n0 sono matrici in forma normale ottenute da a, è n ∼H a ∼H n0 , e
quindi n ∼H n0 . In particolare, deve accadere che ciascuna riga di n0 è combinazione
F -lineare delle righe di n e viceversa. Proveremo che questo fatto comporta che
n = n0 . Da questo punto possiamo lavorare direttamente con matrici in forma
normale, e per comodità spezziamo la dimostrazione in due parti:
Proposizione 5.6. Siano a, b matrici in forma normale. Se a ∼H b allora a e b
hanno lo stesso numero di pivot, ed essi sono collocati nelle medesime case.
Dimostrazione. Se a = 0 allora b = 0 e viceversa. In tal caso, l’asserto è ovvio.
Supponiamo quindi che a 6= 0 e sia (γa (1), γa (2), . . . , γa (p)) la sequenza delle colonne dei pivot di a. Analogamente sia (γb (1), γb (2), . . . , γb (q)) la sequenza delle
colonne dei pivot di b. Vogliamo provare che p = q e che le due sequenze sono
uguali. Si noti che poichè a 6= 0 anche b 6= 0, per cui p, q > 1. Sia t = min{p, q}.
Poichè a ∼H b, per il Corollario 5.5 si ha che la prima riga di b è combinazione
F -lineare delle righe di a, e quindi per certi scalari α1 , . . . , αm ∈ F si ha
b1 =
m
X
αj aj .
j=1
Notiamo che, poichè la somma di vettori è effettuata
Pm componente per componente, nella h-ma colonna della combinazione lineare j=1 αj aj si ha l’entrata
m
X
αj ajh = α1 a1h + α2 a2h + . . . αm amh ,
j=1
e quindi dall’uguaglianza b1 =
b1h =
m
X
Pm
j=1
αj aj si ha che per ogni h = 1, . . . , n risulta
αj ajh = α1 a1h + α2 a2h + . . . αm amh .
j=1
In particolare, nella colonna γb (1) si ha l’entrata b1,γb (1) = 1, pivot di b relativo
alla sua prima riga, e quindi
1 = α1 a1,γb (1) + α2 a2,γb (1) + · · · + αm am,γb (1) .
Se γb (1) < γa (1), allora la colonna γb (1)-ma di a è nulla, per cui per ogni i =
1, . . . , m risulta ai,γb (1) = 0, da cui l’uguaglianza precedente darebbe 1 = 0, assurdo.
Pm
Quindi γb (1) > γa (1). Invertendo i ruoli di a e b, scrivendo cioè a1 = i=1 βi bi ,
si deduce che γa (1) > γb (1). Pertanto γa (1) = γb (1), e quindi sulla prima riga sia
a che b hanno il pivot nella stessa posizione.
Induttivamente, supponiamo che per ogni 1 6 i 6 t − 1 risulti γa (i) = γb (i) =:
γ(i) e proviamo che γa (i + 1) = γb (i + 1). Come prima, la riga bi+1 è combinazione
F -lineare delle righe di a, per cui per certi scalari α1 , . . . , αm ∈ F si può scrivere
bi+1 =
m
X
αj aj .
j=1
In particolare, nella colonna γb (i + 1) si ha l’entrata bi+1,γb (i+1) = 1, pivot di b
relativo alla sua riga (i + 1)-esima, e quindi
1 = α1 a1,γb (i+1) + α2 a2,γb (i+1) + · · · + αm am,γb (i+1) .
VER. 1.1.0
APPUNTI DI ALGEBRA LINEARE
17
Il valore degli scalari αj si può ottenere guardando le colonne γ(1), . . . , γ(i):
0=
bi+1,γ(1)
= α1 a1,γ(1) + α2 a2,γ(1) + · · · + αm am,γ(1) = α1
0=
bi+1,γ(2)
= α1 a1,γ(2) + α2 a2,γ(2) + · · · + αm am,γ(2) = α2
..
.
0=
bi+1,γ(i)
..
.
= α1 a1,γ(i) + α2 a2,γ(i) + · · · + αm am,γ(i) = αi
perchè per definizione di matrice in forma normale nella colonna γ(j) di a l’unica
entrata non nulla è il pivot, posizionato in (j, γ(j)). Quindi α1 = α2 = · · · = αi = 0,
e si ha
1 = αi+1 ai+1,γb (i+1) + αi+2 ai+2,γb (i+1) + · · · + αm am,γb (i+1) .
In questa uguaglianza, se γb (i + 1) < γa (i + 1) allora ai+1,γb (i+1) = ai+2,γb (i+1) =
· · · = am,γb (i+1) = 0, per cui si ottiene 1 = 0, assurdo. Perciò dev’essere γb (i + 1) >
γa (i + 1) e di nuovo, invertendo i ruoli, si ha γa (i + 1) > γb (i + 1). Pertanto
anche γa (i + 1) = γb (i + 1), e possiamo concludere che per ogni 1 6 j 6 t risulta
γa (j) = γb (j) =: γ(j).
Resta da provare che p = q. Supponiamo per assurdo che p < q, e quindi che
t = p. Allora la riga p + 1 di b è non nulla, e per certi scalari α1 , . . . , αm si ha
bp+1 =
m
X
αi ai .
i=1
In particolare, la prima entrata non nulla di bp+1 sarà il pivot di tale riga, collocato
in (p + 1, γb (p + 1)), e quindi
1 = α1 a1,γb (p+1) + α2 a2,γb (p+1) + · · · + αm am,γb (p+1) .
Ma le righe ap+1 , . . . , am sono tutte nulle, per cui
1 = α1 a1,γb (p+1) + α2 a2,γb (p+1) + · · · + αp ap,γb (p+1) .
Inoltre, come prima, gli scalari α1 , . . . , αp si ottengono guardando le colonne γ(1),
γ(2), . . . , γ(p) e si scopre che α1 = · · · = αp = 0. Ne segue che 1 = 0, assurdo.
Non potendo essere p < q, necessariamente è p > q. Invertendo i ruoli di a e b, si
ha q > p, da cui p = q.
Osservazione 5.7. Anche se non abbiamo ancora provato che a = b, già possiamo
concludere che il rango di una matrice è ben definito. Infatti, se n e n0 sono forme
normali associate alla matrice a, risulterà che n ∼H n0 e per quanto visto n e n0
devono avere lo stesso numero di pivot, collocati nelle stesse case.
2
Per concludere, resta solo da provare che
Proposizione 5.8. Se a,b sono in forma normale e a ∼H b allora a = b.
Dimostrazione. Dal risultato precedente, sappiamo che a e b hanno lo stesso numero di pivot, ed essi sono collocati nelle stesse case (i, γ(i)) per ogni riga non nulla
i. Supponiamo che vi siano p > 1 pivot (altrimenti, a = b = 0 e non c’è nulla da
provare). Sicuramente, le righe sotto la p-esima sono nulle, e quindi uguali, in a
18
VINCENZO C. NARDOZZA
e b. Poi, per ogni i ∈ {1, . . . , p}, la riga i-ma di b è combinazione F -lineare delle
righe a1 , . . . , ap , per cui
bi =
p
X
αj aj
(α1 , . . . , αp ∈ F ).
j=1
Gli scalari possono essere dedotti guardando in corrispondenza delle posizioni dei
pivot. Infatti, tanto in a quanto in b, l’unica entrata non nulla della colonna γ(j)
è il pivot della riga j, in posizione (j, γ(j)). Perciò per ogni j 6= i si ha
0 = bi,γ(j) = α1 a1,γ(j) + α2 a2,γ(j) + · · · + αj aj,γ(j) + · · · + αp ap,γ(j) = αj
e quindi αj = 0, da cui bi = αi ai . D’altra parte, per lo stesso motivo,
1 = biγ(i) = αi aiγ(i) = αi ,
e quindi bi = ai per ogni i = 1, . . . , p.
6. Determinanti
In questa sezione torniamo a considerare la situazione più generale di matrici
quadrate a coefficienti in un anello commutativo con unità R.
In questa sezione, le matrici saranno indicate con le lettere grassetto maiuscole.
Cominciamo con una convenzione:
Definizione 6.1. Sia A ∈ Mn (R), e siano i, j ∈ {1, . . . , n}. Indichiamo con Aij
la matrice ottenuta da A cancellandone la riga i e la colonna j.
2
Si noti che pertanto Aij ∈ Mn−1 (R).


1 2 3
Esempio 6.2. Sia A = 4 5 6 ∈ M3 (Z10 ). Allora
7 8 9
5 6
• A11 =
∈ M2 (Z10 );
8 9
1 2
• A23 =
∈ M2 (Z10 ).
7 8
In generale, una matrice quadrata di taglia n dà luogo a n2 matrici Aij .
2
Diamo ora la seguente definizione ricorsiva sulla taglia n delle matrici quadrate:
Definizione 6.3. Sia A = (aij ) ∈ Mn (R). Poniamo
• det(A) := P
a11 ∈ R se n = 1;
n
• det(A) := j=1 (−1)1+j a1j det(A1j ) ∈ R se n > 2.
L’elemento det(A) ∈ R si dice il determinante della matrice A.
2
Esempio
6.4. Calcoliamo il determinante di una matrice quadrata di taglia 2: se
a11 a12
A=
si ha dalla definizione
a21 a22
det(A) = (−1)1+1 a11 det(A11 ) + (−1)1+2 a12 det(A12 )
= a11 a22 − a12 a22 ∈ R
Si noti che ora sappiamo calcolare direttamente il determinante di una matrice 2×2
senza dover passare dalla definizione: è l’elemento di R che si ottiene moltiplicando
APPUNTI DI ALGEBRA LINEARE
VER. 1.1.0
19
gli elementi della diagonale principale a cui viene sottratto il prodotto degli elementi
sull’altra diagonale.
Usiamo 
questo fatto percalcolare il determinante di una matrice 3 × 3:
a11 a12 a13
se A = a21 a22 a23  si ha
a31 a32 a33
det(A) = (−1)1+1 a11 det(A11 ) + (−1)1+2 a12 det(A12 ) + (−1)1+3 a13 det(A13 )
a22 a23
a21 a23
a21 a22
= a11 det
− a12 det
+ a13 det
a32 a33
a31 a33
a31 a32
= a11 (a22 a33 − a23 a32 ) − a12 (a21 a33 − a23 a31 ) + a13 (a21 a32 − a22 a31 )
= (a11 a22 a33 + a12 a23 a31 + a21 a23 a13 ) − (a13 a22 a31 + a12 a21 a33 + a23 a32 a11 ).
La formula è molto più complicata da spiegare, ma si può notare che l’elemento
det(A) ∈ R è stato ottenuto formando una somma algebrica di prodotti; ogni
prodotto ha tre fattori presi da A. I prodotti che hanno segno + sono quelli
ottenuti prendendo i fattori nei posti contrassegnati da •:






· · •
· • ·
• · ·
• · · 
 · · • ,
· • · ,
· • ·
• · ·
· · •
cioè gli elementi che stanno sulla diagonale principale e quelli che stanno sui triangoli
aventi base parallela ad essa.
I prodotti preceduti da segno −, similmente, sono i seguenti






· • ·
• · ·
· · •
• · ·  ,
 · · •
· • · ,
· · •
· • ·
• · ·
cioè quelli ottenuti prendendo gli elementi sulla diagonale secondaria e quelli sui
triangoli aventi base parallela ad essa (regola di Sarrus).
Osservazione 6.5. Ognuno degli addendi del determinante di una matrice di
ordine 3 è
• un prodotto di 3 addendi
• in ogni addendo, ognuno dei tre fattori proviene da una riga e una colonna
distinte.
Questa cosa è un fatto generale, cioè
• se A ha taglia n, allora det(A) è una somma algebrica di addendi;
• ogni addendo è un prodotto di n fattori, ciascuno scelto in una riga e una
colonna diversa dagli altri (non ci sono cioè due fattori che provengono dalla
stessa riga o dalla stessa colonna).
Tuttavia non abbiamo nè tempo nè interesse in questa sede di approfondire questa
discussione valida in generale.
2
Per matrici di taglia n > 4 non c’è vantaggio nello scrivere una formula per
il calcolo diretto del determinante, in quanto essa sarebbe non più semplice da
applicare che la definizione stessa.
Definizione 6.6. (Trasposta e matrici simmetriche)
Sia A = (aij ). Si dice trasposta della matrice A, e si indica con AT , la matrice
(bij ) tale che per ogni i, j 6 n sia bij = aji .
20
VINCENZO C. NARDOZZA
Si dice poi che A è simmetrica se A = AT .
Osservazione 6.7. In altri termini, la trasposta di A è la matrice ottenuta da A
effettuando una riflessione delle sue entrate lungo la diagonale principale.




1 2 3
1 4 7
Esempio 6.8. Sia A := 4 5 6. Allora AT = 2 5 8 .
2
7 8 9
3 6 9
Definizione 6.9. (Complementi algebrici)
Sia A = (aij ) ∈ Mn (R), con n > 2. Si dice complemento algebrico di aij l’elemento
γij := (−1)i+j det(Aij ) ∈ R.
La matrice Γ := (γij ) ∈ Mn (R) si dice la matrice dei complementi algebrici di A.
Osservazione 6.10. Utilizzando la nozione di complemento algebrico, la definizione di determinante di una matrice di taglia n > 2 può essere riscritta come
n
X
a1j γ1j .
det(A) =
j=1
2
La relazione tra una data matrice e la sua matrice dei complementi algebrici è
espressa nel seguente importante
Teorema 6.11. (Formule di Laplace)
Siano n > 2, A = (aij ) ∈ Mn (R) e Γ = (γij ) la matrice dei complementi algebrici
di A.
Allora per ogni i1 , i2 , j1 , j2 ∈ {1, . . . , n} risulta
(
n
X
0
se i1 6= i2
ai1 j γi2 j =
det(A) se i1 = i2
j=1
(
n
X
0
se j1 6= j2
aij1 γij2 =
det(A) se j1 = j2
i=1
Queste formule in apparenza complicate hanno due serie conseguenze:
Corollario 6.12. Scelto i ∈ {1, . . . , n}, si ha
det(A) =
n
X
aij γij .
j=1
La precedente espressione viene detta sviluppo di det(A) lungo la riga i. Analogamente, scelto un qualunque indice di colonna j ∈ {1, . . . , n}, si ha
det(A) =
n
X
aij γij
i=1
ed essa vien detta sviluppo di det(A) lungo la colonna j.
Nella definizione di determinante, in effetti noi abbiamo effettuato lo sviluppo del
determinante lungo la prima riga. Il precedente corollario dice che avremmo potuto
dare la definizione scegliendo una riga qualunque o anche una colonna qualunque:
il risultato sarebbe stato lo stesso.
APPUNTI DI ALGEBRA LINEARE
VER. 1.1.0
21
Osservazione 6.13. Alla luce di quanto detto, si capisce che al fine di calcolare il
determinante di una matrice è comodo scegliere di sviluppare il determinante lungo
una riga o una colonna in cui il numero di entrate nulle è il massimo possibile.
Esempio 6.14. Il lettore può calcolare per esercizio il determinante di alcune
matrici particolari. Qui di seguito diamo il risultato:
• det(1n ) = 1;
• det(Rij (a)) = 1;
• det(Tij ) = −1;
• det(Mi (α)) = α;
• det(α1n ) = αn per ogni α ∈ R.
In generale, una matrice è detta triangolare (inferiore o superiore) se tutte le entrate
da uno stesso lato della diagonale principale (tutte al di sopra o tutte al di sotto
rispettivamente) sono nulle. Gli esempi considerati rientravano tutti in questo tipo
di matrici.
E’ un facile ma istruttivo esercizio provare che se A è triangolare allora det(A) =
a11 a22 . . . ann , cioè il determinante è il prodotto degli elementi della diagonale
principale.
Esempio 6.15. Calcoliamo il determinante della matrice


1 2 0 4
 2 2 0 4

A=
4 3 1 7 ∈ M4 (Z10 ).
3 2 0 5
Usando la definizione direttamente, dobbiamo calcolare
det(A) = 1 · det(A11 ) − 2 · det(A12 ) + 0 · det(A13 ) − 4 · det(A14 )






2 0 4
2 2 0
2 0 4
= det 3 1 7 − 2 det 4 1 7 − 4 det 4 3 1
3 0 5
3 2 0
2 0 5
= −8 − 2 · (−2) − 4 · (6 − 4) = 2 + 4 + 2 = 8 ∈ Z10 .
Abbiamo dovuto calcolare 3 determinanti di ordine 3. Avremmo invece potuto agire
più intelligentemente e sviluppare il determinante lungo la 3-a colonna, ottenendo
det(A) = (−1)3+3 det(A33 ) (gli altri addendi sono nulli)


1 2 4
= det 2 2 4 = (10 + 6 + 4) − (4 + 8 + 0) = −2 = 8 ∈ Z10 .
3 2 5
Osservazione 6.16. Sempre alla luce di quanto detto, è chiaro che se una matrice
ha una riga o una colonna nulla, il suo determinante è nullo. Inoltre, è parimenti
chiaro che det(A) = det(AT ), quale che sia la matrice A.
2
Come si è visto, il calcolo di un determinante è cosa che coinvolge una quantità
di moltiplicazioni rapidamente crescente al crescere della taglia della matrice. E’ un
buon esercizio calcolare esplicitamente quante moltiplicazioni sono necessarie per il
determinante di una matrice di ordine n.
La cosa sarebbe più semplice se fosse vero che det(A + B) = det(A)
Pn+ det(B).
Si vede però subito che ciò non vale non appena n > 2: 1n = e11 + ( i=2 eii ) ma
22
VINCENZO C. NARDOZZA
Pn
mentre det(1n ) = 1 è det(e11 ) = det( i=2 eii ) = 0. La formula importante che ci
consente una effettiva semplificazione nel calcolo è la seguente:
Teorema 6.17. (Binet)
Per ogni A, B ∈ Mn (R) risulta
det(AB) = det(A) · det(B).
Osservazione 6.18. In cosa consiste l’utilità di questa formula? A prima vista
non sembra una buona idea quella di calcolare i determinanti di due matrici al fine
di calcolare il determinante di una matrice della stessa taglia (AB)!
Invece, se tramite una sequenza di trasformazioni elementari sappiamo mettere
A in forma triangolare A0 , il calcolo del det(A) è semplificato dalla formula di
Binet e dal fatto che già conosciamo il determinante delle matrici di trasformazioni
elementari. Per essere più specifici, se A0 = t1 . . . tk A, si ha velocemente
det(A0 ) = det(t1 ) · det(t2 ) . . . det(tk ) · det(A),
il che ci dà indicazioni sul valore det(A).
Osservazione 6.19. Attenzione: nel nostro contesto generale di matrici a coefficienti in un anello commutativo con unità R, le matrici di trasformazioni elementari
non sono più necessariamente invertibili! Per la precisione, non siamo più sicuri che
le Mi (α) siano invertibili! In effetti, ciò accade se e solo se α ∈ U (R). Perciò non
possiamo in genere effettuare il calcolo più semplice
−1
−1
0
det(A) = det(t−1
k ) . . . det(t2 ) det(t1 ) det(A ).
La formula di Binet comunque ci dà come
Corollario 6.20. Se A ∈ Mn (R) è invertibile, allora det(A) ∈ U (R) e
−1
det(A−1 ) = det(A)
.
Dimostrazione. Poichè A è invertibile, si ha
A · A−1 = 1n
e per la formula di Binet segue
det(A) · det(A−1 ) = det(1n )
e pertanto, posto d := det(A) ∈ R e d0 := det(A−1 ) ∈ R si ha
dd0 = 1.
Quindi d = det(A) ∈ U (R) e d0 = d−1 .
Per chiudere questa sezione, torniamo al problema originale: come individuare
le matrici invertibili a coefficienti in R?
Definizione 6.21. Siano n > 2, A ∈ Mn (R) e Γ = (γij ) la sua matrice dei
complementi algebrici. Diciamo matrice aggiunta di A, e la indichiamo con adj(A),
la trasposta di Γ.
Il Teorema che ci serve è il seguente, la seconda seria conseguenza delle formule
di Laplace
Teorema 6.22. Sia A ∈ Mn (R). Allora
A · adj(A) = det(A)1n .
VER. 1.1.0
APPUNTI DI ALGEBRA LINEARE
23
Dimostrazione. E’ un’immediata conseguenza delle formule di Laplace: detta A =
(aij ), adj(A) = (αij ) e posto d = det(A), risulta
!
!
n
n
X
X
A · adj(A) = (aij )(αij ) =
aik αkj =
aik γjk = (δij d) = d · 1n ,
k=1
k=1
dove δij è il delta di Kronecker.
Corollario 6.23. La matrice A è invertibile in Mn (R) ⇐⇒ det(A) è invertibile
in R. In tal caso risulta
A−1 = det(A)−1 · adj(A).
Osservazione 6.24. Nel caso particolare in cui R = F è un campo, ciò si traduce
nell’affermazione A è invertibile ⇐⇒ il suo determinante è non nullo. Inoltre,
il precedente corollario dà un altro modo per calcolare l’inversa di una matrice
assegnata.
Esempio 6.25. Si decida quale delle due matrici
2 1
2
a=
,
b=
5 2
3
3
2
è invertibile in M2 (Z) e se ne calcoli l’inversa.
Svolgimento
Dato che U (Z) = {±1}, le uniche matrici invertibili in M2 (Z) sono quelle il cui
determinante è 1 o −1. Dato che det(a) = 4 − 5 = −1, essa è invertibile. Per invertirla, possiamo ancora usare le trasformazioni elementari, con l’unica avvertenza
che le uniche Mi (α) a disposizione sono quelle per cui α = ±1. Per esempio:
2 1
2 1
1 0
1 0
→
→
→
.
5 2 R21 (−2) 1 0 T12 2 1 R21 (−2) 0 1
Applicando la stessa sequenza a
inversa di a:
1 0
1
→
0 1 R21 (−2) −2
partire dalla matrice 12 otteniamo la matrice
0
−2
→
1 T12 1
1
−2
→
0 R21 (−2) 5
1
.
−2
Ci saremmo potuti arrivare usando bene le trasformazioni elementari lecite, senza
avere a disposizione il concetto di determinante. Naturalmente possiamo anche
calcolare a−1 = (det(a))−1 · adj(a): la matrice dei complementi algebrici è
2 −5
Γ=
,
−1 2
la sua trasposta è perciò
adj(a) =
2
−5
−1
2
−2 1
.
5 −2
Invece, avremmo cercato invano una sequenza di trasformazioni elementari che
portasse b in forma normale: non esiste una siffatta sequenza. La certezza di ciò ce
la da solo il determinante: poichè det(b) = 4 − 9 = −5 ∈
/ U (Z), b non è invertibile
in Z.
e quindi a−1 =
24
VINCENZO C. NARDOZZA
7. Esercizi
Esercizio 7.1. Date le matrici
1 2
−1
a=
,b=
−1 2
1
2
1
,c=
1
1
1
−1
,
calcolare il valore delle seguenti espressioni:
(1)
(2)
(3)
(4)
(5)
(6)
(7)
a + 2b + 3c;
ab
c2
b2 − 4ac;
(a − b)2
a2 − 2ab + b2 ;
a2 − ab − ba + b2 .


0 1 2
Esercizio 7.2. Sia a := 1 2 3 ∈ M3 (R). Sappiamo che le operazioni ele2 3 4
mentari sulle righe R13 (−2), M2 (2), T23 corrispondono a effettuare delle moltiplicazioni del tipo ba, per opportune matrici b. Dette R13 (−2), M2 (2) e T23 tali
matrici,
(1) esplicitamente, chi sono R13 (−2), M2 (2) e T23 ?
(2) Cosa accade facendo invece ab per b ∈ {R13 (−2), M2 (2), T23 }?
(3) Si determini, se esiste, una matrice quadrata c tale che ac abbia la terza
colonna pari alla seconda colonna di a aumentata di 3 volte la prima.
1 a
1 b
Esercizio 7.3. Si calcoli il prodotto
.
0 1
0 1
n
1 1
Esercizio 7.4. Si calcoli
.
0 1
Esercizio 7.5. Si trovi una formula per esprimere la potenza
n

1 1 1
0 1 1
0 0 1
e la si provi per induzione.
Esercizio 7.6. Siano a, b matrici quadrate.
(1) Quando è vero che (a + b)(a − b) = a2 − b2 ?
(2) Espandere la potenza (a + b)3 .
Esercizio 7.7. Per ciascuno dei casi, determinare le matrici quadrate a coefficienti
in Q che commutano con la data matrice
1 0
(1)
0 0
0 1
(2)
0 0
2 0
(3)
0 6
APPUNTI DI ALGEBRA LINEARE
1
0
2
(5)
0
(4)
VER. 1.1.0
25
3
1
3
6


2 3
Esercizio 7.8. Sia a := 1 2 ∈ M3×2 (Q).
2 5
(1) Trovare infinite matrici b tali che ba = 12 ;
(2) provare che non esiste nessuna matrice c tale che ac = 13 .
Esercizio 7.9. Si riducano a forma normale le seguenti matrici reali, tenendo
traccia delle operazioni elementari effettuate sulle righe:
1 3
1 3
(1)
,
;
3 1
1 3
1 1 1 1
(2)
;
3 1 1 2


0 2 1
 0 2 2 

(3) 
 0 2 2 ;
0 2 1
√


0
1 −1 √2
 0
2 −1 
1

√
(4) 
 2
0 −1
1 
−1
2
2
1
Esercizio 7.10. Calcolare, se possibile, le inverse delle seguenti matrici a coefficienti inR:
2 3
2 2
2 1
2 −1
1
9
(1)
,
,
,
,
;
0 1
1 1
3 1
1 −1
0 −1

 
 
 

4
2 3
1 1 1
1 2 0
1 3 0
(2)  0 1 1 ,  0 1 1 ,  1 2 2 ,  4 −1 4 .
1
0 1
1 1 2
1 2 0
0 0 1
Quali di esse sono invertibili anche su Z2 , Z3 , Z4 , Z5 ? In tali casi si determinino le
loro inverse.
Esercizio 7.11. Date le matrici a, b a coefficienti in F = Z2 , calcolare
ab, a + b, a − b,
dove
1 1
(1) a =
1 0
1 1
(2) a =  1 0
0 1
1 −1
,b=
;
 1 1

1
1
1 −1
0 , b =  1
1
1 .
−1
1 −1
1
Esercizio 7.12. Calcolare, se possibile, le inverse delle seguenti matrici a coefficienti in Z2 :
1 1
0 1
1 1
1 −1
1
0
(1)
,
,
,
,
;
0 1
1 1
1 1
1 −1
0 −1
26
VINCENZO C. NARDOZZA

1
(2)  0
0
1
1
0
 
0
1
1 ,  0
1
1
0
1
0
 
1
0
1 ,  1
0
1
1
0
1
 
1
0
0 ,  0
0
1

0 1
−1 0 .
0 1
Esercizio 7.13. Si esibisca, se esiste, una matrice razionale (cioè a coefficienti in
Q) A opportuna tale che AB sia una matrice in forma normale, dove


1 3 1 −1
2 
B =  −1 0 1
2 3 0 −3
Si risponda all’analoga domanda considerando la matrice B in M3×4 (Z9 ) o M3×4 (Z11 ).
Esercizio 7.14. Si determini il rango delle seguenti matrici reali:
1 1
1 1
(1)
,
;
1 1
0 1
1 3
2 −1
(2)
;
3 1 −1
2

 

1 0
0
2 −2 1
√1
1
0 2 ;
(3)  2 1 √ 3 ,  −2
0 −2
0 1
1
1
3
−
1


h 0 1
(4)  2 h 2 , dove h ∈ R.
1 1 2
Esercizio 7.15. Si dica quali delle seguenti matrici quadrate sono invertibili. Si
calcoli l’inversa di quelle invertibili e si determini una matrice X tale che X · A = 0
per le matrici A che non sono invertibili.
1 √0
1 1
1 1
(1)
,
,
(Matrici reali);
1 2
2 2
1
3

 

0 1 1
1 1 1
(2)  1 1 2 ,  1 0 1  (matrici su Z3 );
1 1 0
1 2 3


2 0 −1 2
 0 0 −1 1 
 (matrice su Z7 ).
(3) 
 −3 1
0 2 
3 1 −1 6
Esercizio 7.16. Si dica per quali valori di

1
0
 0
h

 h−1 2
0
0
h ∈ R la matrice

2 0
0 1 

0 2 
1 2
è invertibile, e se ne determini l’inversa. Si risponda alla domanda considerando
invece il campo base F ∈ {Z2 , Z5 , Z11 , Z13 } ( e di conseguenza h ∈ F ).
1 1
Esercizio 7.17. Sia a =
, e sia f : M2×1 (R) → M2×1 (R) definita
1 2
tramite
x
x
f:
→a·
.
y
y
f è iniettiva? E’ suriettiva?
VER. 1.1.0
APPUNTI DI ALGEBRA LINEARE
27
a b
| a, b ∈ Z3 . Si provi che
−b a
R è un anello rispetto le usuali operazioni tra matrici;
R è commutativo
R è un campo
R∼
= GF (9), scrivendo un esplicito isomorfismo di campi.
Esercizio 7.18. Sia R :=
(1)
(2)
(3)
(4)
Esercizio 7.19. Si determinino tutte le soluzioni dell’equazione x1 +x2 +2x3 −x4 =
3 a coefficienti in Z23 . Quante sono?
Esercizio 7.20. Si risolvano i seguenti sistemi lineari su F ∈ {Q, Z2 , Z3 , Z5 , Z7 , Z11 }

+ 2z =
0
 x
x − y + 3z =
1
(1)

y + 2z = −2

 2x + 3y − z = −3
x
+ z =
0
(2)

x + 2y − z = −2

y − z = 0



x
+ 3z = 2
(3)
 x + 3y + 2z = 2


x + 2y + z = 2
Esercizio 7.21. Si risolvano i seguenti sistemi lineari omogenei su F ∈ {Q, Z2 , Z3 , Z5 , Z7 , Z11 }

x + 2y + 3z − t = 0



y + 2z + t = 0
(1)
x
−
y
+ 2t = 0



x
+ 3z
= 0

 x + y + z + t = 0
x + 2y + 3z − t = 0
(2)

x − 2y − 5z + 7t = 0
Esercizio 7.22. Si discutano i
F ∈ {Q, Z2 , Z3 , Z5 , Z7 , Z11 }:

 hx + y − 2hz
− y + hz
(1)

hx
+
z

hx + y + z



y − z
(2)
hx
+ 2z



2y + hz
seguenti sistemi lineari al variare di h in F , per
= 0
= 0
= 0
+ 2t =
+ ht =
+ 2t =
+ 2t =
0
h
h
0
Esercizio 7.23. Si discuta il seguente sistema lineare al variare dei parametri h, k
nel campo F , controllando separatamente i casi F = Q, F = Z2 , F = Z3 , F = Z5 .

y
=
−h
 kx −
kx −
y
= k−1

kx + (h − k)y = 1 − k
28
VINCENZO C. NARDOZZA
Esercizio 7.24. Discutere e risolvere, al variare del parametro λ ∈ Z13 , il sistema
lineare seguente:

+3x2
+λx3 = λ + 4
 2(λ + 1)x1
(4λ − 1)x1 +(λ + 1)x2 +(2λ − 1)x3 = 2λ + 2

(5λ − 4)x1 +(λ + 1)x2 +(3λ − 4)x3 = λ − 1
Esercizio 7.25. Discutere e risolvere, al variare del
lineare seguente:

2x1
+x2
+x3 =



3x1
−x2 +2x3 =
x1 +2x2 +3x3 =



5x1 +λx2
−x3 =
parametro λ ∈ Z17 , il sistema
2
6
2
3λ
Esercizio 7.26. Calcolare il determinante delle seguenti matrici
1
α
(1)
∈ M2 (GF (9)) dove α2 = 2;
2
−
α
3
1 1
(2)
;
1 −1


2 0 1
(3) 0 1 0
1 0 2


1 0 0 0
5 2 0 0

(4) 
8 6 3 0
0 9 7 4
1 4 1 3
2 3 5 0


(5) 
4 1 0 0
2 0 0 0


1 2 5 6
3 1 7 7

(6) 
0 0 2 3.
4 1 2 5
Esercizio 7.27. Sia a1 := (1) ∈ M1 (F ) e ricorsivamente an :=
n > 2. Si calcoli per induzione su n il determinante det(an ).
Esercizio 7.28. Calcolare

1
2


det  3
 ..
.
2
2
3
3
3
3
...
...
...
..
.
n
n
n
...

n
n

n
.
.. 
.
n
0
an−1
1
per
0