APPUNTI DI ALGEBRA LINEARE VER. 1.1.0 VINCENZO C. NARDOZZA 1. Anello delle Matrici Definizione 1.1. Siano m, n ∈ N ed R un anello commutativo con unità. Diciamo matrice m × n a coefficienti in R ogni tabella fatta da m righe ed n colonne nei cui m · n posti siano posizionati elementi di R. • Se m = n, la matrice si dice quadrata. • Se m = 1 la matrice si dice matrice riga. • Se n = 1 la matrice si dice matrice colonna • L’insieme delle matrici m × n a coefficienti in R si indica con Mm×n (R). 2 2 3 Esempio 1.2. La tabella è una matrice 2 × 3 a coefficienti in Z (ma 1 0 2 anche a coefficienti in Q, R, C). La matrice 1 2 3 4 è una matrice riga, la matrice 1 2 3 ∈ M5×1 (R) 4 √ 5 è una matrice colonna a coefficienti in R. I posti in cui compaiono i numeri di una matrice sono detti case. Una matrice m × n ha mn case. La casa (i, j) sarà posta all’incrocio tra la riga i e la colonna j. L’elemento di R che compare nella casa (i, j) viene detto l’entrata (i, j) della matrice. Per convenzione, fissati m, n, R, una matrice di Mm×n (R) verrà indicata in grassetto con una lettera minuscola. Inoltre, scriveremo a11 a12 . . . a1n a21 a22 . . . a2n a = (aij ) per indicare a = . .. .. .. . . am1 am2 . . . amn Definizione 1.3. (Somma tra matrici) Siano a, b ∈ Mm×n (R), con a = (aij ) e b = (bij ). La matrice a + b := (aij + bij ) ∈ Mm×n (R) è detta la somma delle matrici a e b. 1 2 VINCENZO C. NARDOZZA Osservazione 1.4. Si noti che per poter essere sommate, le matrici date devono avere la stessa forma. Se ciò avviene, la loro somma è la matrice della stessa forma avente come entrata (i, j) la somma delle entrate (i, j) in a e b. 1 2 3 1 −2 0 Esempio 1.5. Siano a := eb= . Allora 3 2 1 0 1 −1 2 0 3 a+b= 3 3 0 E’ immediato provare che Lemma 1.6. L’addizione tra matrici è associativa e commutativa. La matrice 0 avente 0R in tutte le case è detta matrice nulla m × n ed è l’elemento neutro per tale operazione. La matrice opposta della matrice a = (aij ) è la matrice (−aij ), e verrà indicata con −a. Possiamo definire un prodotto tra matrici, ma la cosa è più elaborata. Il prototipo di tale prodotto è il seguente: Definizione 1.7. Siano r = (r1,j ), c = (ci,1 ) una matrice riga e una matrice colonna, rispettivamente. Se la lunghezza n di r coincide con l’altezza di c si pone (1) r · c := n X r1,j cj,1 = r1,1 c1,1 + r1,2 c2,1 + · · · + r1,n cn,1 ∈ F. j=1 3 Esempio 1.8. Siano r = 1 2 3 , c = 2. Allora 1 3 r · c = 1 2 3 · 2 = 1 · 3 + 2 · 2 + 3 · 1 = 3 + 4 + 3 = 10 1 Fatto questo, si dà la seguente definizione di prodotto tra matrici: Definizione 1.9. Siano a := (aij ) ∈ Mm×n (R) e b := (bhk ) ∈ Mn×p (R). Si definisce n X a · b := aij bjk ∈ Mm×p (R). j=1 Commento: in proposito al prodotto tra matrici, si noti che • la lunghezza n di (ogni) riga della matrice a deve coincidere con l’altezza di (ogni) colonna della matrice b; • l’entrata (i, k) della matrice a · b è il prodotto (1) tra la riga i-ma ri di a e la colonna k-ma ck di b, cioè r1 · c1 r1 · c2 . . . r1 · cp r2 · c1 r2 · c2 . . . r2 · cp a·b= . .. .. ∈ Mm×p (R). . . . . rm · c1 rm · c2 . . . rm · cp VER. 1.1.0 APPUNTI DI ALGEBRA LINEARE Esempio 1.10. Siano a = 0 3 1 4 2 2 , b = 1 5 0 1 1 7 7 4 3 2 6 5 7 3 8 7 matrici a coefficienti 8 in Z9 . Allora a·b= 1 1 5 2 ∈ M2×4 (Z9 ) Per esempio, l’entrata (2, 3) della matrice prodotto è ottenuta moltiplicando secondo (1) la riga 2 di a con la colonna 3 di b: 3 · 6 + 4 · 5 + 5 · 7 = 1 ∈ Z9 . Definizione 1.11. Sia n ∈ N. Indichiamo con 1n la matrice avente 1R nelle case (i, i) per ogni i = 1, . . . , n e 0R altrove. Lemma 1.12. Siano a ∈ Mm×n (R), b ∈ Mn×p (R) e c ∈ Mp×q (R). Allora (1) (a · b) · c = a · (b · c) ∈ Mm×q (R); (2) 1m a = a · 1n = a. Focalizziamo ora la nostra attenzione sulle matrici quadrate: Proposizione 1.13. Sia n ∈ N. La terna ordinata (Mn (R), +, ·) è un anello con unità 1n , detto anello delle matrici quadrate di taglia n su R. Osservazione 1.14. Anche se R è commutativo, l’anello Mn (R) è non commutativo non appena n > 2. Invece, M1 (R) è un anello isomorfo ad R. E’ possibile in effetti definire anche un’altra “operazione” per matrici, la cosiddetta moltiplicazione per scalari: se α ∈ R e a = (aij ) ∈ Mm×n (R) poniamo αa := (αaij ) ∈ Mm×n (R). In merito a ciò, si noti che basta definire α · 1m come la matrice avente α nelle case (i, i) per ogni i = 1, . . . , m per avere αa = (α1m )a. Una matrice del tipo α1m si dice una matrice scalare. Alla luce di questo prodotto, alcune matrici sono particolarmente semplici e simultaneamente importanti: Definizione 1.15. Sia n > 2, e siano i, j ∈ {1, . . . , n}. Indichiamo con eij la matrice di Mn (R) avente 1R come entrata (i, j) e 0R altrove. Le matrici eij , per i, j ∈ {1, . . . , n}, si dicono le matrici unità di taglia n. Esempio 1.16. Le matrici 1 e11 = 0 0 e21 = 1 unità di taglia 2 sono le seguenti: 0 0 1 e12 = 0 0 0 0 0 0 e22 = 0 0 1 Proposizione 1.17. Sia a = (aij ) ∈ Mn (R). Allora a = Pn particolare 1n = i=1 eii . Pn i,j=1 aij eij . In 4 VINCENZO C. NARDOZZA Il prodotto di matrici unità è particolarmente semplice. Detto ( 1 se u = v δuv := 0 altrimenti (delta di Kronecker), si ha infatti Lemma 1.18. Siano eij , ehk ∈ Mn (R). Allora eij ehk = δjh eik . 2. Trasformazioni elementari Da questa sezione in poi e salvo esplicita indicazione contraria le matrici considerate saranno a coefficienti in un campo F . Alcune delle considerazioni che faremo saranno valide anche nel contesto più generale di matrici a coefficienti in un anello commutativo, ma non è scopo di questi appunti entrare nei distinguo di tali generalità. Lo scopo di questa sezione è introdurre un insieme particolare e importante di matrici quadrate. La loro definizione è la seguente Definizione 2.1. Sia F un campo, n > 2. Poniamo • Rij (a) := 1n + aeij per ogni i, j ∈ {1, . . . , n} con i 6= j e a ∈ F ; • Tij := 1n − eii − ejj + eij + eji per ogni i, j ∈ {1, . . . , n} con i 6= j; • Mi (α) := 1n − eii + αeii per ogni i ∈ {1, . . . , n} e α ∈ F ∗ . Le matrici Rij (a), Tij , Mi (α) si dicono le matrici di trasformazioni elementari per righe di taglia n. Commento: Che forma hanno le matrici di trasformazioni elementari? • Le matrici Rij (a) hanno tutti 1 sulla diagonale principale (le case (1, 1), (2, 2),. . . , (n, n)), a nella casa (i, j) e altrove tutti 0; • le matrici Tij sono ottenute scambiando tra loro le righe i e j della matrice 1n ; • Le matrici Mi (α) hanno entrate non nulle solo sulla diagonale principale, ed esse sono tutte 1 tranne che l’entrata (i, i), dove c’è α. Le matrici di trasformazioni elementari esplicano il loro effetto nella moltiplicazione a sinistra di una data matrice. Precisamente, sia a ∈ Mn×p (F ) una matrice (non necessariamente quadrata, ma con n righe), e sia t una matrice di trasformazioni elementari di taglia n. Detta b := ta la matrice prodotto, si ha • se t = Rij (a) allora b è ottenuta da a sommando alla riga i-ma ri di a la riga j-ma di a moltiplicata per a, arj ; • se t = Tij , allora b è ottenuta da a scambiandone le righe i e j; • se t = Mi (α) allora b è ottenuta da a moltiplicandone per α la riga i-ma. 1 2 3 Esempio 2.2. Sia a = ∈ M2×3 (Z7 ). Calcoliamo i prodotti R12 (3)a, 4 5 6 T12 a, M2 (3)a. 1+3·4 2+3·5 3+3·6 6 3 0 • R12 (3)a = = : alla riga 1 di a 4 5 6 4 5 6 sommiamo la riga2 dopo averla moltiplicata per 3. 4 5 6 • T12 a = : abbiamo scambiato di posto le righe 1 e 2 di a; 1 2 3 VER. 1.1.0 APPUNTI DI ALGEBRA LINEARE 5 1 2 3 1 2 3 = : abbiamo moltiplicato per 3 3·4 3·5 3·6 5 1 4 la seconda riga di a. Le matrici elementari considerate erano 1 3 0 1 1 0 R12 (3) = , T12 = , M2 (3) = . 0 1 1 0 0 3 • M2 (3)a = Il lettore può verificare che facendo esplicitamente le moltiplicazioni righe per colonne si ottengono gli stessi risultati annunciati. 2 Convenzione: quando nel seguito partiremo da una matrice assegnata a ed effettueremo una moltiplicazione ta con una matrice di trasformazioni elementari t, diremo che abbiamo effettuato una trasformazione elementare t su a, usando la stessa notazione che usiamo per t ma senza usare il grassetto (t). Esempio 2.3. Riprendendo l’esempio precedente scriveremo, per esempio, 1 2 3 6 3 0 6 3 0 1 3 5 → → → 4 5 6 R12 (3) 4 5 6 M2 (2) 1 3 5 T12 6 3 0 per indicare la matrice T12 · M1 (2) · R12 (3) · a, ottenuta da a effettuando successivamente le operazioni elementari R12 (3), poi M1 (2) e infine T12 . Definizione 2.4. (Matrici in forma normale) Sia N ∈ Mm×n (F ). Si dice che N è in forma normale se N = 0 o, se N 6= 0, se sussistono tutte le seguenti condizioni: (1) esiste p ∈ {1, . . . m} tale che le righe (p + 1)-ma, (p + 2)-ma, . . . , m-ma di N sono tutte nulle; (2) per ogni i 6 p esiste 1 6 γ(i) 6 n tale che aiγ(i) = 1 ma aij = 0 se j < γ(i); (3) è γ(1) < γ(2) < · · · < γ(p); (4) ahγ(i) = 0 per ogni h < i. In tal caso gli elementi a1γ(1) , a2γ(2) , . . . , apγ(p) si dicono i pivot di N. Osservazione 2.5. Una matrice in forma normale e non nulla è perciò del tipo 1 2 3 4 0...0 γ(1) 1 ∗...∗ γ(2) 0 1 γ(3) 0 0 1 ∗...∗ ∗...∗ ∗...∗ ∗...∗ ∗...∗ γ(4) 0 0 0 1 ∗... ∗... ∗... ∗... .. . (le entrate non segnate sono tutte nulle; le entrate con ∗ possono essere non nulle). Esempio 2.6. La matrice 0 0 N= 0 0 0 0 0 0 0 0 1 0 0 0 0 2 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1 2 3 0 0 0 0 0 1 0 1 1 2 4 0 è in forma normale. Qui, p = 4, e la sequenza γ(1) < γ(2) < γ(3) < γ(4) è 3 < 5 < 6 < 8. 6 VINCENZO C. NARDOZZA Il motivo dell’introduzione delle trasformazioni elementari è il seguente: Teorema 2.7. (Riduzione a forma normale) Sia a ∈ Mm×n (F ). Allora esiste una successione finita di trasformazioni elementari sulle righe che porta da a a una matrice in forma normale N. Inoltre, la matrice N non dipende dalla particolare sequenza seguita ma dipende solo da a. Osservazione 2.8. Dire che t1 , t2 , . . . , tk è una sequenza che porta la matrice a a una forma normale N vuol dire che tk . . . t2 t1 a = N. Posto q := tk . . . t2 t1 , ciò vuol dire qa = N. Ci possono essere più sequenze che portano a in forma normale, cioè più matrici q ottenute come prodotto di matrici di trasformazioni elementari tali che qa sia in forma normale. Tuttavia, come specificato nel Teorema precedente, se q e q0 sono due di esse, risulta qa = N = q0 a. 2 L’unicità della forma normale di una matrice consente di dare la seguente Definizione 2.9. Si dice rango di una matrice a ∈ Mm×n (F ), e si indica con rk(a), il numero di pivot della sua forma normale. Osservazione 2.10. Dato che su ogni riga e ogni colonna ci può essere al più un solo pivot, risulta che rk(a) 6 min{m, n}. Inoltre, la matrice nulla è l’unica ad avere rango 0. In particolare, si ha Lemma 2.11. Siano a ∈ Mn (F ) ed N la forma normale di a. Allora (1) rk(a) < n ⇐⇒ l’ultima riga di N è nulla; (2) rk(a) = n ⇐⇒ N = 1n . Dimostrazione. Il primo punto è ovvio. Per il secondo, si noti che siccome la matrice è quadrata, l’unico modo per disporre gli n pivot in N è di allinearli lungo la diagonale principale. Automaticamente in tal caso la matrice ottenuta è la matrice 1n . L’importanza di quest’ultimo risultato sarà evidente nella sezione seguente. 3. Matrici invertibili In un anello, l’insieme degli elementi invertibili è sempre un sottoinsieme importante di cui tener conto. Nel caso di anelli non commutativi, la questione della determinazione degli elementi invertibili è complicata dalla considerazione che, in generale, ab = 1 ; ba = 1.1 Noi in questa sezione limiteremo le nostre considerazioni agli anelli Mn (F ) di matrici quadrate a entrate in un campo F , con un’unica rapida incursione nel caso Mn (R) con R anello commutativo con unità (nella sezione dedicata ai determinanti). Cominciamo lo studio delle matrici invertibili con una definizione: Definizione 3.1. Si pone GLn (F ) := {a ∈ Mn (F ) | a è invertibile in Mn (F )}, e si chiama gruppo Generale Lineare di ordine n su F . 1In effetti si possono dare esempi in cui ab = 1 epperò ba 6= 1! VER. 1.1.0 APPUNTI DI ALGEBRA LINEARE 7 Osservazione 3.2. In termini più espliciti, data a ∈ Mn (F ) si ha a ∈ GLn (F ) ⇐⇒ ∃b ∈ Mn (F ) tale che ab = ba = 1n . Come accade in generale, se a è invertibile, allora ha uno ed un solo inverso. La matrice b è quindi unica, e la si denota senza ambiguità con a−1 . Isoliamo un caso facile da dirimere: Corollario 3.3. GL1 (F ) = {(α) ∈ M1 (F ) | α 6= 0} ∼ = F ∗. Nel seguito, assumeremo n > 2 per considerare solo i casi significativi. Il primo passo per determinare GLn (F ) è elencare alcuni elementi importanti: Proposizione 3.4. Siano nel seguito a ∈ F , α ∈ F ∗ , i, j ∈ {1, . . . , n} con i 6= j. (1) 1n ∈ GLn (F ); (2) le matrici di trasformazioni elementari Rij (a), Tij , Mi (α) sono invertibili; (3) tutti i prodotti di matrici di trasformazioni elementari sono matrici invertibili. Dimostrazione. Il punto (1) è ovvio: l’identità di un anello è sempre invertibile. Per il punto (2) possiamo esibire esplicitamente gli inversi: Rij (a)−1 = Rij (−a), T−1 ij = Tij , Mi (α)−1 = Mi (α−1 ). La verifica di questo semplice fatto è lasciata al lettore. La cosa importante da notare è che l’inversa di una matrice di trasformazioni elementari è ancora una matrice di trasformazioni elementari. Infine, sia q = t1 t2 . . . tk un prodotto di k > 2 matrici di trasformazioni elemen−1 −1 tari. Allora è immediato verificare che la matrice t−1 k · . . . t2 t1 è l’inversa di q. Si noti che anch’essa è un prodotto di matrici di trasformazioni elementari. L’invertibilità è completamente caratterizzata dal rango: Proposizione 3.5. (invertibilità e rango) Sia a ∈ Mn (F ). Allora a ∈ GLn (F ) ⇐⇒ rk(a) = n. Inoltre, a è un divisore di 0 se e solo se 0 < rk(a) < n. Dimostrazione. Sia N la forma normale di a e sia q la matrice associata a una sequenza di trasformazioni elementari che porta a in forma normale. Allora qa = N. a ∈ GLn (F ) ⇒ rk(a) = n : Supponiamo per assurdo che rk(a) < n. Allora l’ultima riga di N è nulla per il Lemma 2.11 ⇒ enn N = 0. Ma notato che siccome a, q sono invertibili anche N = qa è invertibile si ha enn N = 0 ⇒ enn NN−1 = 0N−1 = 0⇒enn = 0 ∃N−1 e questo è falso. Perciò rk(a) = n. rk(a) = n ⇒ a ∈ GLn (F ) : rk(a) = n ⇒ N = 1n per il Lemma 2.11. Allora qa = 1n e dato che q è invertibile si ha a = q−1 (perchè?). Perciò a è invertibile e la sua inversa è q. L’ultima parte dell’enunciato è immediata: se a è un divisore di zero non può essere invertibile, e quindi rk(a) < n. Viceversa, se rk(a) < n, abbiamo già trovato che d := enn q è non nulla (perchè?) e da = enn N = 0. Analogamente, qaenn = 0 e quindi aenn = 0, e enn è un co-divisore destro di zero per a. 8 VINCENZO C. NARDOZZA Da questa Proposizione si hanno i seguenti corollari: Corollario 3.6. Se a ∈ Mn (F ), allora • o a = 0n • o a è invertibile • o a è un divisore di zero. In altri termini Mn (F ) = {0n } ] GLn (F ) ] D(Mn (F )), dove D(Mn (F )) è l’insieme dei divisori di zero in Mn (F ) e ] indica un’unione tra insiemi disgiunti. Dimostrazione. La collocazione di a è decisa dal suo rango: rk(a) = 0 ⇐⇒ a = 0. Se 0 < rk(a) < n allora a è un divisore di zero. Se rk(a) = n allora a è invertibile. Corollario 3.7. Siano a, b ∈ Mn (F ). Allora ab = 1n ⇒ ba = 1n . Dimostrazione. Se ab = 1, allora a 6= 0 e così rk(a) > 0. Se rk(a) < n allora a è un divisore di zero e quindi esiste una matrice d 6= 0 tale che da = 0. Ma allora d = d1n = dab = 0b = 0, assurdo. Pertanto rk(a) = n e quindi b = (a−1 a)b = a−1 (ab) = a−1 ⇒ ba = 1n . Osservazione 3.8. E’, questa, una cosa che come già sottolineato è sicuramente non ovvia e non automatica per anelli non commutativi. Corollario 3.9. Le matrici invertibili di Mn (F ) sono precisamente le matrici prodotto di matrici di trasformazioni elementari. Dimostrazione. La matrice 1n è prodotto di trasformazioni elementari: per esempio, 1n = T12 · T12 . Se a ∈ GLn (F ) ed è diversa da 1n allora esiste una matrice q ottenuta come prodotto di matrici di trasformazioni elementari tale che qa = 1n . Perciò a−1 = q. Ciò equivale a a = q−1 . Dato che l’inversa di un prodotto di matrici di trasformazioni elementari è ancora un prodotto di matrici di trasformazioni elementari (si veda in merito quanto notato nel corso della dimostrazione della Proposizione 3.4) , si ha quanto voluto. Osservazione 3.10. Ciò consente di controllare l’invertibilità di una assegnata matrice e, nel caso, automaticamente di invertire la stessa. Basta infatti eseguire una sequenza t1 , t2 , . . . , tk che porti la matrice assegnata in forma normale. Se la forma normale è 1n , allora la matrice data è invertibile. La stessa sequenza t1 , t2 , . . . , tk applicata alla matrice 1n dà la matrice q che è l’inversa di a. Esempio 3.11. Si decida se la matrice 2 3 4 a := 5 6 0 ∈ M3 (Z7 ) 1 2 4 è invertibile e in caso affermativo si determini la sua inversa. VER. 1.1.0 APPUNTI DI ALGEBRA LINEARE 9 Svolgimento La tavola degli inversi degli elementi di Z7 è la seguente: 1 1 2 4 3 5 6 6 Fatto questo mettiamo a in forma normale tramite trasformazioni elementari sulle righe: 2 3 4 1 5 2 1 5 2 1 5 2 5 6 0 → 5 6 0 → 0 2 4 → 0 1 2 21 (2) 1 2 4 M1 (4) 1 2 4 R 0 4 2 M2 (4) 0 4 2 R31 (6) 1 0 6 1 0 0 → 0 1 2 → 0 1 0 R12 (2) 13 (1) 0 0 1 R 0 0 1 R32 (3) R23 (5) Quindi q = R23 (5)R13 (1)R32 (3)R12 (2)M2 (4)R31 (6)R21 (2)M1 (4) è la matrice inversa di a. Per conoscerla esplicitamente, basta effettuare le stesse operazioni elementari sulla matrice 1n : 4 0 0 4 0 0 4 0 0 1 0 0 0 1 0 → 0 1 0 → 1 1 0 → 4 4 0 21 (2) 3 0 1 M2 (4) 3 0 1 0 0 1 M1 (4) 0 0 1 R R31 (6) 5 1 0 6 6 1 → 4 4 0 → 2 1 5 R12 (2) 13 (1) 1 5 1 R 1 5 1 R32 (3) R23 (5) Il lettore può provare a controllare che qa = 13 effettuando direttamente il prodotto tra matrici. 2 Nell’esempio, abbiamo usato il modo più sistematico per ottenere la forma normale di a. A seconda dei casi, si possono usare altre sequenze, che accorciano la procedura. Il risultato ottenuto scegliendo un’altra sequenza è di variare la fattorizzazione di q, mentre non cambia q. 4. Sistemi Lineari Un sistema lineare di m equazioni in n incognite a coefficienti nel campo F è il problema di determinare gli elementi (α1 , α2 , . . . , αn ) ∈ F n = F × F × · · · × F tali | {z } n volte che le m identità n X j=1 a1j αj = c1 , n X j=1 a2j αj = c2 , ... , n X amj αj = cm , j=1 i cui coefficienti aij , ci sono in F , siano tutte contemporaneamente soddisfatte. Un sistema lineare è rappresentato in forma compatta come Pn j=1 aij xj = ci i = 1, . . . , m 10 VINCENZO C. NARDOZZA e in forma più esplicita da a11 x1 a21 x1 .. . am1 x1 +a12 x2 +a22 x2 ... ... +a1n xn +a2n xn = c1 = c2 +am2 x2 ... +amn xn = cm E’ chiaro che tutte le informazioni essenziali per il problema sono contenute solo nei suoi coefficienti, non nel nome delle incognite. Precisamente detta a la matrice dei coefficienti a11 a12 . . . a1n a21 a22 . . . a1n a := . .. .. .. . . am1 am2 ... amn c1 c2 e detta c := . la colonna dei termini noti, .. cm il sistema può essere riscritto compattamente come un’equazione lineare avente x1 x2 ax = c. come incognita la colonna x := . : .. xn Tale informazione sul problema può essere codificata ancora un po’ più compattamente introducendo la definizione seguente: Definizione 4.1. Sia ax = c un sistema lineare di m equazioni in n incognite a coefficienti in F . La matrice s ottenuta aggiungendo alle colonne di a la colonna dei termini noti in ultima posizione si dice la matrice completa del sistema. Si noti che s ∈ Mm×(n+1) (F ). Nel seguito, la rappresenteremo come s = (a | c) per evidenziare il ruolo diverso che a e c giocano nel problema. La matrice completa del sistema gioca un ruolo essenziale nella risolubilità del sistema lineare e, una volta che essa sia stata controllata, nella determinazione delle sue soluzioni. L’osservazione principale è riassunta nel seguente Lemma 4.2. Sia ax = c un sistema lineare di m equazioni in n incognite a coefficienti in F ed s la sua matrice completa. (1) se t è una matrice di trasformazioni elementari in Mm (F ), allora il sistema di matrice completa s0 = ts è equivalente al sistema di matrice completa s; (2) se N = (a0 |c0 ) è la forma normale della matrice s = (a|c), il sistema a0 x = c0 è equivalente al sistema ax = c. Dimostrazione. E’ facile rendersi conto che le trasformazioni elementari sulle righe corrispondono a trasformazioni sul sistema che conservano l’equivalenza tra i problemi. Esplicitamente, si ha • sia t = Rij (a). Allora ts è la matrice ottenuta da s sommando alla riga i di s la sua j-ma riga dopo averla moltiplicata per a ∈ F . Pertanto il sistema APPUNTI DI ALGEBRA LINEARE VER. 1.1.0 11 che ha come matrice completa ts è il sistema ottenuto sommando membro a membro la i-ma equazione alla j-ma dopo aver moltiplicata quest’ultima per a ∈ F , e pertanto è equivalente al sistema di partenza; • sia t = Mi (α). Allora ts è la matrice ottenuta da s moltiplicandone per α ∈ F ∗ la riga i-ma ⇒ il sistema di matrice completa ts è ottenuto dal sistema di partenza moltiplicandone per α l’i-ma equazione, e pertanto è equivalente ad esso; • se infine t = Tij allora ts è ottenuta da s scambiano tra loro le righe i e j ⇒ il sistema associato a ts è ottenuto dal sistema originale scambiando di posto le equazioni i e j, e quindi manifestamente è equivalente al sistema di partenza. Se N è la forma normale di s ⇒ N = qs dove q = t1 . . . tk è un prodotto di matrici di trasformazioni elementari ti ⇐⇒ N è la matrice completa del sistema ottenuta da s effettuando la sequenza tk , . . . , t2 , t1 (in quest’ordine!) di trasformazioni elementari sulle righe. Dato che a ogni passo la matrice che si ottiene è associata a un sistema lineare equivalente al sistema originale, si ha quanto voluto. Il punto in tutto ciò è che è assai facile decidere se il sistema è risolubile e quali eventualmente siano le sue soluzioni se la sua matrice completa è in forma normale. Si ha infatti Lemma 4.3. Sia ax = c un sistema la cui matrice completa s sia in forma normale. Esso è risolubile ⇐⇒ nessun pivot cade nella colonna dei termini noti. Inoltre, se il sistema è risolubile, siano p = rk(s) e sia (γ(1), . . . , γ(p)), la sequenza delle colonne in cui sono collocati i pivot delle prime righe. Allora le soluzioni del sistema sono le n-ple (y1 , . . . , yn ) ∈ F n tali che • se j = γ(i) ∈ {γ(1), . . . , γ(p)} allora X yγ(i) = ci − aih yh ; h>γ(i) • se j 6∈ {γ(1), . . . , γ(p)} allora yj è un qualunque elemento di F . n−p In particolare, il sistema lineare ha |F | soluzioni distinte, dipendenti da n − p parametri liberi yj al variare di j in {1, . . . , n} \ {γ(1), . . . , γ(p)}. Dimostrazione. Sotto la p-ma riga ci sono solo righe nulle. Se l’ultimo pivot cade nella colonna dei termini noti, l’ultima equazione del sistema è 0 = 1, che non ammette soluzioni e quindi il sistema è incompatibile, cioè non ha soluzioni. Se ciò non accade, la i-ma equazione del sistema in forma normale sarà X aiγ(i) xγ(i) + aih xh = ci . h>γ(i) Notato che aiγ(i) = 1 perchè è il pivot della i-ma riga di s, si ha X xγ(i) = ci − aih xh . h>γ(i) Si noti che se h ∈ {γ(1), . . . , γ(p)} è aih = 0. Per ogni assegnazione delle variabili xj con j ∈ / {γ(1), . . . , γ(p)} si ha allora un’assegnazione forzata per le variabili xγ(1) , . . . , xγ(p) , ottenendo una soluzione del sistema. Dato che ciascuna delle variabili “libere” xj (con j ∈ / {γ(1), . . . , γ(p)}) può essere assegnata in |F | modi differenti e le n-ple ordinate che si ottengono sono tutte distinte, si ha quanto asserito. 12 VINCENZO C. NARDOZZA Osservazione 4.4. Parlando in termini informali, il rango della matrice completa del sistema ci dice quante sono le equazioni effettivamente essenziali. Ognuna di esse “inchioda” una incognita (quella corrispondente al pivot). Quelle rimanenti sono invece libere di assumere uno qualunque dei valori possibili in F . Se il campo è infinito, un sistema risolubile ha una sola o infinite soluzioni, senza possibilità intermedie. L’unicità si ha quando ci sono tante equazioni essenziali quante le incognite disponibili: esse saranno tutte inchiodate a un valore particolare. Se almeno una variabile resta libera di variare (se cioè n − p > 0) allora essa darà a luogo a infinite soluzioni. E’ prassi nella terminologia usuale esprimere questa situazione dicendo (con abuso di notazione) che il sistema ha ∞n−p soluzioni. Se il campo è finito, naturalmente, un sistema lineare a coefficienti in esso ha sempre necessariamente un insieme finito di soluzioni (alla peggio, esso ha 0 soluzioni). 2 Esempio 4.5. Si dica se il seguente sistema lineare a coefficienti in Z7 x1 +2x2 +3x3 = 4 2x1 +3x3 = 5 3x1 +2x2 =6 è compatibile e, se si, si dica quante e quali sono le sue soluzioni Svolgimento La matrice dei coefficienti, la colonna dei termini noti e la matrice rispettivamente 1 2 3 4 1 2 3 a = 2 0 3 , c = 5 , s= 2 0 3 3 2 0 3 2 0 6 Tramite una sequenza di trasformazioni della matrice completa s: 1 N = 0 0 completa sono 4 5 6 elementari, arriviamo alla forma normale 0 1 0 0 0 1 0 3 , 4 corrispondente al sistema lineare x1 x2 x3 =0 =3 =4 che ha come unica soluzione (0, 3, 4) ∈ (Z7 )3 . Si noti che qui p = 3, n − p = 0 e effettivamente 70 = 1. Esempio 4.6. Si dica se il seguente sistema lineare a coefficienti in Z7 5x1 +2x2 +2x3 = 2 3x1 +4x2 +4x3 = 4 6x1 +6x2 +2x3 = 5 è compatibile e, se si, si dica quante e quali sono le sue soluzioni Svolgimento VER. 1.1.0 APPUNTI DI ALGEBRA LINEARE La matrice dei coefficienti, la colonna dei termini noti e la matrice rispettivamente 2 5 2 2 5 2 2 a = 3 4 4 , c = 4 , s= 3 4 4 6 6 2 6 6 2 5 Tramite una sequenza di trasformazioni della matrice completa s: 1 N = 0 0 corrispondente al sistema lineare x1 x2 13 completa sono 2 4 5 elementari, arriviamo alla forma normale 2 3 0 4 5 , 0 +2x3 +3x3 =4 =5 0 1 0 in cui x3 può variare liberamente in tutto Z7 . Ognuna delle 7 possibili assegnazioni di x3 dà luogo a una assegnazione forzata di x1 e x2 : ( x1 = 4 − 2y posto x3 = y ∈ Z7 allora dev’essere . x2 = 5 − 3y L’insieme delle soluzioni è allora {(4+5y, 5+4y, y) | y ∈ Z7 } = {(4, 5, 0), (2, 2, 1), (0, 6, 2), (5, 3, 3), (3, 0, 4), (1, 4, 5), (6, 1, 6)}. Si noti, di nuovo, che p = 2, n − p = 1 e effettivamente ci sono 71 soluzioni distinte del sistema. Esempio 4.7. Si dica se il seguente sistema lineare a coefficienti in Z7 5x1 +2x2 +2x3 = 4 3x1 +4x2 +4x3 = 5 6x1 +6x2 +2x3 = 6 è compatibile e, se si, si dica quante e quali sono le sue soluzioni Svolgimento La matrice dei coefficienti, la colonna dei termini noti e la matrice rispettivamente 5 2 2 4 5 2 2 a = 3 4 4 , c = 5 , s= 3 4 4 6 6 2 6 6 2 6 completa sono 4 5 6 Tramite una sequenza di trasformazioni elementari, arriviamo alla forma normale della matrice completa s: 1 0 2 0 N = 0 1 3 0 , 0 0 0 1 corrispondente al sistema lineare equivalente a quello dato +2x3 = 0 x1 x2 +3x3 = 0 0 =1 in cui la terza equazione non ammette soluzioni. Il sistema pertanto è incompatibile. 14 VINCENZO C. NARDOZZA Si noti che anche in questo caso p = 3 e n − p = 0, ma stavolta NON ci sono soluzioni, perchè la loro esistenza dipende NON SOLO da qual è il rango della matrice completa del sistema, ma anche da dove compaiono i suoi pivot La formulazione di questo principio in termini classici è la seguente: Teorema 4.8. (Rouchè-Capelli) Un sistema lineare di m equazioni in n incognite è compatibile se e solo se il rango della matrice completa del sistema uguaglia il rango della matrice dei coefficienti. In tal caso, detto p tale rango, le soluzioni del sistema dipendono da n − p parametri liberi. Dimostrazione. Basta notare che dire rk(s) = rk(a) equivale a dire che tutti i pivot presenti nella forma normale N di s compaiono nelle prime n colonne, e cioè che nella ultima colonna di N non compare un pivot. 5. Unicità della forma normale di una matrice La chiave per accedere a buona parte dei risultati operativi ottenuti era costituita dal Teorema 2.7, di riduzione a forma normale. La prima parte del Teorema non necessita di una dimostrazione (basta ragionare per induzione con un po’ di coerenza, ripetendo quanto fatto negli esempi, per provare che ogni matrice o è in forma normale o può essere messa in forma normale dopo un numero finito di passi). Il fatto non ovvio è che la forma normale alla quale si arriva è unica, a prescindere dalla particolare sequenza di trasformazioni elementari seguite. La dimostrazione di ciò non è inclusa nel programma del corso, ma ho ritenuto utile inserirla in questa sezione per completezza, oltre che per soddisfare la curiosità di studenti particolarmente diligenti. Fissiamo Mm×n (F ) e sia V = M1×n (F ). In altri termini, V è l’insieme delle matrici riga di lunghezza n. Sappiamo che (V, +) è un gruppo abeliano, e inoltre si ha che ∀ α ∈ F , ∀ r ∈ V è αr ∈ V . Invece che parlare di matrici riga useremo spesso il termine più semplice di vettori, specificando eventualmente la lunghezza n di ciascuno di essi. Inoltre, chiameremo scalari gli elementi di F . Sia poi E l’insieme delle trasformazioni elementari; sappiamo che T−1 ij = Tij , Mi (α)−1 = Mi (α−1 ) e Rij (u) = Rij (−u), per cui E ⊆ GLm (F ). Di conseguenza, risulta H := hE i 6 GLn (F ). Inoltre, se la matrice b è stata ottenuta da a attraverso una sequenza di trasformazioni elementari sulle righe, ciò vuol dire che esiste un q ∈ H tale che b = qa. Ciò in particolare comporta che se n è una matrice in forma normale ottenuta da a attraverso una sequenza di trasformazioni elementari, allora n = qa per una certa q ∈ H. Introduciamo una relazione di equivalenza in Mm×n (F ): Proposizione 5.1. Per ogni a, b ∈ Mm×n (F ) scriviamo a ∼H b se esiste q ∈ H tale che b = qa. La relazione introdotta è una relazione di equivalenza. Dimostrazione. E’ un semplice esercizio. In questa maniera, l’insieme Mm×n (F ) è ripartito in classi di equivalenza rispetto la relazione ∼H , e in [a]∼H ci sono tutte le matrici che possono essere ottenute da a tramite una sequenza finita di trasformazioni elementari. Tra esse, sicuramente ci sarà una matrice in forma normale. Il nostro scopo in questo paragrafo sarà raggiunto se riusciremo a provare che esattamente una matrice in forma normale è presente in ciascuna classe di equivalenza. VER. 1.1.0 APPUNTI DI ALGEBRA LINEARE 15 Per caratterizzare meglio le matrici di [a]∼H abbiamo bisogno della seguente Definizione 5.2. Siano r1 , . . . , rk ∈ V . Per ogni α1 , . . . , αk ∈ F il vettore α1 r1 + α2 r2 + · · · + αk rk = k X αi ri ∈ V i=1 sarà detto una combinazione F -lineare dei vettori dati. Lemma 5.3. Assegnati i vettori r1 , . . . , rk ∈ V , ogni combinazione F -lineare di combinazioni F -lineari dei vettori ri (i = 1, . . . , k) è ancora una combinazione F -lineare dei vettori ri assegnati. Pk Pk Dimostrazione. Siano v1 = j=1 α1,j rj , . . . , vh = j=1 αh,j rj vettori combinazioni F -lineari dei vettori r1 , . . . , rk , per certi αi,j ∈ F . Per ogni λ1 , . . . , λh ∈ F si ha che h X λi vi = h X i=1 i=1 = λi k X h X k X λi αi,j rj i=1 j=1 j=1 k h X X j=1 αi,j rj = ! λi αi,j rj , i=1 combinazione F -lineare degli rj secondo gli scalari h X i=1 λi αi,1 , . . . , h X λi αi,k i=1 Se a ∈ Mm×n (F ), le sue righe formano un insieme di m vettori, univocamente assegnato. Come notazione, se a ∈ R scriveremo ai per denotare la riga i-ma di a. Proposizione 5.4. Assegnata una matrice a ∈ Mm×n (F ), ogni trasformazione elementare sulle righe di a restituisce una matrice le cui righe sono combinazioni F -lineari delle righe di a. Dimostrazione. Basta esaminare l’effetto delle singole trasformazioni elementari sulle righe di a. Per esempio, se la trasformazione eseguita è Rij (u), allora la matrice b = Rij (u)a avrà le stesse righe di a, eccezion fatta per la riga i, che sarà data da ai + uaj . Quindi se h 6= i risulta bh = 0a1 + · · · + 0ah−1 + 1ah + 0ah+1 + · · · + 0am mentre la riga i di b sarà bi = 0a1 + · · · + 0ai−1 + 1ai + 0ai+1 + · · · + 0aj−1 + uaj + 0aj+1 + · · · + 0am . Analogamente, il lettore può scrivere le righe di Mi (α)a e di Tij a come combinazione F -lineare delle righe di a. Corollario 5.5. Se a, b ∈ Mm×n (F ) e a ∼H b allora ogni riga di b è combinazione F -lineare delle righe di a. 16 VINCENZO C. NARDOZZA Allora se n, n0 sono matrici in forma normale ottenute da a, è n ∼H a ∼H n0 , e quindi n ∼H n0 . In particolare, deve accadere che ciascuna riga di n0 è combinazione F -lineare delle righe di n e viceversa. Proveremo che questo fatto comporta che n = n0 . Da questo punto possiamo lavorare direttamente con matrici in forma normale, e per comodità spezziamo la dimostrazione in due parti: Proposizione 5.6. Siano a, b matrici in forma normale. Se a ∼H b allora a e b hanno lo stesso numero di pivot, ed essi sono collocati nelle medesime case. Dimostrazione. Se a = 0 allora b = 0 e viceversa. In tal caso, l’asserto è ovvio. Supponiamo quindi che a 6= 0 e sia (γa (1), γa (2), . . . , γa (p)) la sequenza delle colonne dei pivot di a. Analogamente sia (γb (1), γb (2), . . . , γb (q)) la sequenza delle colonne dei pivot di b. Vogliamo provare che p = q e che le due sequenze sono uguali. Si noti che poichè a 6= 0 anche b 6= 0, per cui p, q > 1. Sia t = min{p, q}. Poichè a ∼H b, per il Corollario 5.5 si ha che la prima riga di b è combinazione F -lineare delle righe di a, e quindi per certi scalari α1 , . . . , αm ∈ F si ha b1 = m X αj aj . j=1 Notiamo che, poichè la somma di vettori è effettuata Pm componente per componente, nella h-ma colonna della combinazione lineare j=1 αj aj si ha l’entrata m X αj ajh = α1 a1h + α2 a2h + . . . αm amh , j=1 e quindi dall’uguaglianza b1 = b1h = m X Pm j=1 αj aj si ha che per ogni h = 1, . . . , n risulta αj ajh = α1 a1h + α2 a2h + . . . αm amh . j=1 In particolare, nella colonna γb (1) si ha l’entrata b1,γb (1) = 1, pivot di b relativo alla sua prima riga, e quindi 1 = α1 a1,γb (1) + α2 a2,γb (1) + · · · + αm am,γb (1) . Se γb (1) < γa (1), allora la colonna γb (1)-ma di a è nulla, per cui per ogni i = 1, . . . , m risulta ai,γb (1) = 0, da cui l’uguaglianza precedente darebbe 1 = 0, assurdo. Pm Quindi γb (1) > γa (1). Invertendo i ruoli di a e b, scrivendo cioè a1 = i=1 βi bi , si deduce che γa (1) > γb (1). Pertanto γa (1) = γb (1), e quindi sulla prima riga sia a che b hanno il pivot nella stessa posizione. Induttivamente, supponiamo che per ogni 1 6 i 6 t − 1 risulti γa (i) = γb (i) =: γ(i) e proviamo che γa (i + 1) = γb (i + 1). Come prima, la riga bi+1 è combinazione F -lineare delle righe di a, per cui per certi scalari α1 , . . . , αm ∈ F si può scrivere bi+1 = m X αj aj . j=1 In particolare, nella colonna γb (i + 1) si ha l’entrata bi+1,γb (i+1) = 1, pivot di b relativo alla sua riga (i + 1)-esima, e quindi 1 = α1 a1,γb (i+1) + α2 a2,γb (i+1) + · · · + αm am,γb (i+1) . VER. 1.1.0 APPUNTI DI ALGEBRA LINEARE 17 Il valore degli scalari αj si può ottenere guardando le colonne γ(1), . . . , γ(i): 0= bi+1,γ(1) = α1 a1,γ(1) + α2 a2,γ(1) + · · · + αm am,γ(1) = α1 0= bi+1,γ(2) = α1 a1,γ(2) + α2 a2,γ(2) + · · · + αm am,γ(2) = α2 .. . 0= bi+1,γ(i) .. . = α1 a1,γ(i) + α2 a2,γ(i) + · · · + αm am,γ(i) = αi perchè per definizione di matrice in forma normale nella colonna γ(j) di a l’unica entrata non nulla è il pivot, posizionato in (j, γ(j)). Quindi α1 = α2 = · · · = αi = 0, e si ha 1 = αi+1 ai+1,γb (i+1) + αi+2 ai+2,γb (i+1) + · · · + αm am,γb (i+1) . In questa uguaglianza, se γb (i + 1) < γa (i + 1) allora ai+1,γb (i+1) = ai+2,γb (i+1) = · · · = am,γb (i+1) = 0, per cui si ottiene 1 = 0, assurdo. Perciò dev’essere γb (i + 1) > γa (i + 1) e di nuovo, invertendo i ruoli, si ha γa (i + 1) > γb (i + 1). Pertanto anche γa (i + 1) = γb (i + 1), e possiamo concludere che per ogni 1 6 j 6 t risulta γa (j) = γb (j) =: γ(j). Resta da provare che p = q. Supponiamo per assurdo che p < q, e quindi che t = p. Allora la riga p + 1 di b è non nulla, e per certi scalari α1 , . . . , αm si ha bp+1 = m X αi ai . i=1 In particolare, la prima entrata non nulla di bp+1 sarà il pivot di tale riga, collocato in (p + 1, γb (p + 1)), e quindi 1 = α1 a1,γb (p+1) + α2 a2,γb (p+1) + · · · + αm am,γb (p+1) . Ma le righe ap+1 , . . . , am sono tutte nulle, per cui 1 = α1 a1,γb (p+1) + α2 a2,γb (p+1) + · · · + αp ap,γb (p+1) . Inoltre, come prima, gli scalari α1 , . . . , αp si ottengono guardando le colonne γ(1), γ(2), . . . , γ(p) e si scopre che α1 = · · · = αp = 0. Ne segue che 1 = 0, assurdo. Non potendo essere p < q, necessariamente è p > q. Invertendo i ruoli di a e b, si ha q > p, da cui p = q. Osservazione 5.7. Anche se non abbiamo ancora provato che a = b, già possiamo concludere che il rango di una matrice è ben definito. Infatti, se n e n0 sono forme normali associate alla matrice a, risulterà che n ∼H n0 e per quanto visto n e n0 devono avere lo stesso numero di pivot, collocati nelle stesse case. 2 Per concludere, resta solo da provare che Proposizione 5.8. Se a,b sono in forma normale e a ∼H b allora a = b. Dimostrazione. Dal risultato precedente, sappiamo che a e b hanno lo stesso numero di pivot, ed essi sono collocati nelle stesse case (i, γ(i)) per ogni riga non nulla i. Supponiamo che vi siano p > 1 pivot (altrimenti, a = b = 0 e non c’è nulla da provare). Sicuramente, le righe sotto la p-esima sono nulle, e quindi uguali, in a 18 VINCENZO C. NARDOZZA e b. Poi, per ogni i ∈ {1, . . . , p}, la riga i-ma di b è combinazione F -lineare delle righe a1 , . . . , ap , per cui bi = p X αj aj (α1 , . . . , αp ∈ F ). j=1 Gli scalari possono essere dedotti guardando in corrispondenza delle posizioni dei pivot. Infatti, tanto in a quanto in b, l’unica entrata non nulla della colonna γ(j) è il pivot della riga j, in posizione (j, γ(j)). Perciò per ogni j 6= i si ha 0 = bi,γ(j) = α1 a1,γ(j) + α2 a2,γ(j) + · · · + αj aj,γ(j) + · · · + αp ap,γ(j) = αj e quindi αj = 0, da cui bi = αi ai . D’altra parte, per lo stesso motivo, 1 = biγ(i) = αi aiγ(i) = αi , e quindi bi = ai per ogni i = 1, . . . , p. 6. Determinanti In questa sezione torniamo a considerare la situazione più generale di matrici quadrate a coefficienti in un anello commutativo con unità R. In questa sezione, le matrici saranno indicate con le lettere grassetto maiuscole. Cominciamo con una convenzione: Definizione 6.1. Sia A ∈ Mn (R), e siano i, j ∈ {1, . . . , n}. Indichiamo con Aij la matrice ottenuta da A cancellandone la riga i e la colonna j. 2 Si noti che pertanto Aij ∈ Mn−1 (R). 1 2 3 Esempio 6.2. Sia A = 4 5 6 ∈ M3 (Z10 ). Allora 7 8 9 5 6 • A11 = ∈ M2 (Z10 ); 8 9 1 2 • A23 = ∈ M2 (Z10 ). 7 8 In generale, una matrice quadrata di taglia n dà luogo a n2 matrici Aij . 2 Diamo ora la seguente definizione ricorsiva sulla taglia n delle matrici quadrate: Definizione 6.3. Sia A = (aij ) ∈ Mn (R). Poniamo • det(A) := P a11 ∈ R se n = 1; n • det(A) := j=1 (−1)1+j a1j det(A1j ) ∈ R se n > 2. L’elemento det(A) ∈ R si dice il determinante della matrice A. 2 Esempio 6.4. Calcoliamo il determinante di una matrice quadrata di taglia 2: se a11 a12 A= si ha dalla definizione a21 a22 det(A) = (−1)1+1 a11 det(A11 ) + (−1)1+2 a12 det(A12 ) = a11 a22 − a12 a22 ∈ R Si noti che ora sappiamo calcolare direttamente il determinante di una matrice 2×2 senza dover passare dalla definizione: è l’elemento di R che si ottiene moltiplicando APPUNTI DI ALGEBRA LINEARE VER. 1.1.0 19 gli elementi della diagonale principale a cui viene sottratto il prodotto degli elementi sull’altra diagonale. Usiamo questo fatto percalcolare il determinante di una matrice 3 × 3: a11 a12 a13 se A = a21 a22 a23 si ha a31 a32 a33 det(A) = (−1)1+1 a11 det(A11 ) + (−1)1+2 a12 det(A12 ) + (−1)1+3 a13 det(A13 ) a22 a23 a21 a23 a21 a22 = a11 det − a12 det + a13 det a32 a33 a31 a33 a31 a32 = a11 (a22 a33 − a23 a32 ) − a12 (a21 a33 − a23 a31 ) + a13 (a21 a32 − a22 a31 ) = (a11 a22 a33 + a12 a23 a31 + a21 a23 a13 ) − (a13 a22 a31 + a12 a21 a33 + a23 a32 a11 ). La formula è molto più complicata da spiegare, ma si può notare che l’elemento det(A) ∈ R è stato ottenuto formando una somma algebrica di prodotti; ogni prodotto ha tre fattori presi da A. I prodotti che hanno segno + sono quelli ottenuti prendendo i fattori nei posti contrassegnati da •: · · • · • · • · · • · · · · • , · • · , · • · • · · · · • cioè gli elementi che stanno sulla diagonale principale e quelli che stanno sui triangoli aventi base parallela ad essa. I prodotti preceduti da segno −, similmente, sono i seguenti · • · • · · · · • • · · , · · • · • · , · · • · • · • · · cioè quelli ottenuti prendendo gli elementi sulla diagonale secondaria e quelli sui triangoli aventi base parallela ad essa (regola di Sarrus). Osservazione 6.5. Ognuno degli addendi del determinante di una matrice di ordine 3 è • un prodotto di 3 addendi • in ogni addendo, ognuno dei tre fattori proviene da una riga e una colonna distinte. Questa cosa è un fatto generale, cioè • se A ha taglia n, allora det(A) è una somma algebrica di addendi; • ogni addendo è un prodotto di n fattori, ciascuno scelto in una riga e una colonna diversa dagli altri (non ci sono cioè due fattori che provengono dalla stessa riga o dalla stessa colonna). Tuttavia non abbiamo nè tempo nè interesse in questa sede di approfondire questa discussione valida in generale. 2 Per matrici di taglia n > 4 non c’è vantaggio nello scrivere una formula per il calcolo diretto del determinante, in quanto essa sarebbe non più semplice da applicare che la definizione stessa. Definizione 6.6. (Trasposta e matrici simmetriche) Sia A = (aij ). Si dice trasposta della matrice A, e si indica con AT , la matrice (bij ) tale che per ogni i, j 6 n sia bij = aji . 20 VINCENZO C. NARDOZZA Si dice poi che A è simmetrica se A = AT . Osservazione 6.7. In altri termini, la trasposta di A è la matrice ottenuta da A effettuando una riflessione delle sue entrate lungo la diagonale principale. 1 2 3 1 4 7 Esempio 6.8. Sia A := 4 5 6. Allora AT = 2 5 8 . 2 7 8 9 3 6 9 Definizione 6.9. (Complementi algebrici) Sia A = (aij ) ∈ Mn (R), con n > 2. Si dice complemento algebrico di aij l’elemento γij := (−1)i+j det(Aij ) ∈ R. La matrice Γ := (γij ) ∈ Mn (R) si dice la matrice dei complementi algebrici di A. Osservazione 6.10. Utilizzando la nozione di complemento algebrico, la definizione di determinante di una matrice di taglia n > 2 può essere riscritta come n X a1j γ1j . det(A) = j=1 2 La relazione tra una data matrice e la sua matrice dei complementi algebrici è espressa nel seguente importante Teorema 6.11. (Formule di Laplace) Siano n > 2, A = (aij ) ∈ Mn (R) e Γ = (γij ) la matrice dei complementi algebrici di A. Allora per ogni i1 , i2 , j1 , j2 ∈ {1, . . . , n} risulta ( n X 0 se i1 6= i2 ai1 j γi2 j = det(A) se i1 = i2 j=1 ( n X 0 se j1 6= j2 aij1 γij2 = det(A) se j1 = j2 i=1 Queste formule in apparenza complicate hanno due serie conseguenze: Corollario 6.12. Scelto i ∈ {1, . . . , n}, si ha det(A) = n X aij γij . j=1 La precedente espressione viene detta sviluppo di det(A) lungo la riga i. Analogamente, scelto un qualunque indice di colonna j ∈ {1, . . . , n}, si ha det(A) = n X aij γij i=1 ed essa vien detta sviluppo di det(A) lungo la colonna j. Nella definizione di determinante, in effetti noi abbiamo effettuato lo sviluppo del determinante lungo la prima riga. Il precedente corollario dice che avremmo potuto dare la definizione scegliendo una riga qualunque o anche una colonna qualunque: il risultato sarebbe stato lo stesso. APPUNTI DI ALGEBRA LINEARE VER. 1.1.0 21 Osservazione 6.13. Alla luce di quanto detto, si capisce che al fine di calcolare il determinante di una matrice è comodo scegliere di sviluppare il determinante lungo una riga o una colonna in cui il numero di entrate nulle è il massimo possibile. Esempio 6.14. Il lettore può calcolare per esercizio il determinante di alcune matrici particolari. Qui di seguito diamo il risultato: • det(1n ) = 1; • det(Rij (a)) = 1; • det(Tij ) = −1; • det(Mi (α)) = α; • det(α1n ) = αn per ogni α ∈ R. In generale, una matrice è detta triangolare (inferiore o superiore) se tutte le entrate da uno stesso lato della diagonale principale (tutte al di sopra o tutte al di sotto rispettivamente) sono nulle. Gli esempi considerati rientravano tutti in questo tipo di matrici. E’ un facile ma istruttivo esercizio provare che se A è triangolare allora det(A) = a11 a22 . . . ann , cioè il determinante è il prodotto degli elementi della diagonale principale. Esempio 6.15. Calcoliamo il determinante della matrice 1 2 0 4 2 2 0 4 A= 4 3 1 7 ∈ M4 (Z10 ). 3 2 0 5 Usando la definizione direttamente, dobbiamo calcolare det(A) = 1 · det(A11 ) − 2 · det(A12 ) + 0 · det(A13 ) − 4 · det(A14 ) 2 0 4 2 2 0 2 0 4 = det 3 1 7 − 2 det 4 1 7 − 4 det 4 3 1 3 0 5 3 2 0 2 0 5 = −8 − 2 · (−2) − 4 · (6 − 4) = 2 + 4 + 2 = 8 ∈ Z10 . Abbiamo dovuto calcolare 3 determinanti di ordine 3. Avremmo invece potuto agire più intelligentemente e sviluppare il determinante lungo la 3-a colonna, ottenendo det(A) = (−1)3+3 det(A33 ) (gli altri addendi sono nulli) 1 2 4 = det 2 2 4 = (10 + 6 + 4) − (4 + 8 + 0) = −2 = 8 ∈ Z10 . 3 2 5 Osservazione 6.16. Sempre alla luce di quanto detto, è chiaro che se una matrice ha una riga o una colonna nulla, il suo determinante è nullo. Inoltre, è parimenti chiaro che det(A) = det(AT ), quale che sia la matrice A. 2 Come si è visto, il calcolo di un determinante è cosa che coinvolge una quantità di moltiplicazioni rapidamente crescente al crescere della taglia della matrice. E’ un buon esercizio calcolare esplicitamente quante moltiplicazioni sono necessarie per il determinante di una matrice di ordine n. La cosa sarebbe più semplice se fosse vero che det(A + B) = det(A) Pn+ det(B). Si vede però subito che ciò non vale non appena n > 2: 1n = e11 + ( i=2 eii ) ma 22 VINCENZO C. NARDOZZA Pn mentre det(1n ) = 1 è det(e11 ) = det( i=2 eii ) = 0. La formula importante che ci consente una effettiva semplificazione nel calcolo è la seguente: Teorema 6.17. (Binet) Per ogni A, B ∈ Mn (R) risulta det(AB) = det(A) · det(B). Osservazione 6.18. In cosa consiste l’utilità di questa formula? A prima vista non sembra una buona idea quella di calcolare i determinanti di due matrici al fine di calcolare il determinante di una matrice della stessa taglia (AB)! Invece, se tramite una sequenza di trasformazioni elementari sappiamo mettere A in forma triangolare A0 , il calcolo del det(A) è semplificato dalla formula di Binet e dal fatto che già conosciamo il determinante delle matrici di trasformazioni elementari. Per essere più specifici, se A0 = t1 . . . tk A, si ha velocemente det(A0 ) = det(t1 ) · det(t2 ) . . . det(tk ) · det(A), il che ci dà indicazioni sul valore det(A). Osservazione 6.19. Attenzione: nel nostro contesto generale di matrici a coefficienti in un anello commutativo con unità R, le matrici di trasformazioni elementari non sono più necessariamente invertibili! Per la precisione, non siamo più sicuri che le Mi (α) siano invertibili! In effetti, ciò accade se e solo se α ∈ U (R). Perciò non possiamo in genere effettuare il calcolo più semplice −1 −1 0 det(A) = det(t−1 k ) . . . det(t2 ) det(t1 ) det(A ). La formula di Binet comunque ci dà come Corollario 6.20. Se A ∈ Mn (R) è invertibile, allora det(A) ∈ U (R) e −1 det(A−1 ) = det(A) . Dimostrazione. Poichè A è invertibile, si ha A · A−1 = 1n e per la formula di Binet segue det(A) · det(A−1 ) = det(1n ) e pertanto, posto d := det(A) ∈ R e d0 := det(A−1 ) ∈ R si ha dd0 = 1. Quindi d = det(A) ∈ U (R) e d0 = d−1 . Per chiudere questa sezione, torniamo al problema originale: come individuare le matrici invertibili a coefficienti in R? Definizione 6.21. Siano n > 2, A ∈ Mn (R) e Γ = (γij ) la sua matrice dei complementi algebrici. Diciamo matrice aggiunta di A, e la indichiamo con adj(A), la trasposta di Γ. Il Teorema che ci serve è il seguente, la seconda seria conseguenza delle formule di Laplace Teorema 6.22. Sia A ∈ Mn (R). Allora A · adj(A) = det(A)1n . VER. 1.1.0 APPUNTI DI ALGEBRA LINEARE 23 Dimostrazione. E’ un’immediata conseguenza delle formule di Laplace: detta A = (aij ), adj(A) = (αij ) e posto d = det(A), risulta ! ! n n X X A · adj(A) = (aij )(αij ) = aik αkj = aik γjk = (δij d) = d · 1n , k=1 k=1 dove δij è il delta di Kronecker. Corollario 6.23. La matrice A è invertibile in Mn (R) ⇐⇒ det(A) è invertibile in R. In tal caso risulta A−1 = det(A)−1 · adj(A). Osservazione 6.24. Nel caso particolare in cui R = F è un campo, ciò si traduce nell’affermazione A è invertibile ⇐⇒ il suo determinante è non nullo. Inoltre, il precedente corollario dà un altro modo per calcolare l’inversa di una matrice assegnata. Esempio 6.25. Si decida quale delle due matrici 2 1 2 a= , b= 5 2 3 3 2 è invertibile in M2 (Z) e se ne calcoli l’inversa. Svolgimento Dato che U (Z) = {±1}, le uniche matrici invertibili in M2 (Z) sono quelle il cui determinante è 1 o −1. Dato che det(a) = 4 − 5 = −1, essa è invertibile. Per invertirla, possiamo ancora usare le trasformazioni elementari, con l’unica avvertenza che le uniche Mi (α) a disposizione sono quelle per cui α = ±1. Per esempio: 2 1 2 1 1 0 1 0 → → → . 5 2 R21 (−2) 1 0 T12 2 1 R21 (−2) 0 1 Applicando la stessa sequenza a inversa di a: 1 0 1 → 0 1 R21 (−2) −2 partire dalla matrice 12 otteniamo la matrice 0 −2 → 1 T12 1 1 −2 → 0 R21 (−2) 5 1 . −2 Ci saremmo potuti arrivare usando bene le trasformazioni elementari lecite, senza avere a disposizione il concetto di determinante. Naturalmente possiamo anche calcolare a−1 = (det(a))−1 · adj(a): la matrice dei complementi algebrici è 2 −5 Γ= , −1 2 la sua trasposta è perciò adj(a) = 2 −5 −1 2 −2 1 . 5 −2 Invece, avremmo cercato invano una sequenza di trasformazioni elementari che portasse b in forma normale: non esiste una siffatta sequenza. La certezza di ciò ce la da solo il determinante: poichè det(b) = 4 − 9 = −5 ∈ / U (Z), b non è invertibile in Z. e quindi a−1 = 24 VINCENZO C. NARDOZZA 7. Esercizi Esercizio 7.1. Date le matrici 1 2 −1 a= ,b= −1 2 1 2 1 ,c= 1 1 1 −1 , calcolare il valore delle seguenti espressioni: (1) (2) (3) (4) (5) (6) (7) a + 2b + 3c; ab c2 b2 − 4ac; (a − b)2 a2 − 2ab + b2 ; a2 − ab − ba + b2 . 0 1 2 Esercizio 7.2. Sia a := 1 2 3 ∈ M3 (R). Sappiamo che le operazioni ele2 3 4 mentari sulle righe R13 (−2), M2 (2), T23 corrispondono a effettuare delle moltiplicazioni del tipo ba, per opportune matrici b. Dette R13 (−2), M2 (2) e T23 tali matrici, (1) esplicitamente, chi sono R13 (−2), M2 (2) e T23 ? (2) Cosa accade facendo invece ab per b ∈ {R13 (−2), M2 (2), T23 }? (3) Si determini, se esiste, una matrice quadrata c tale che ac abbia la terza colonna pari alla seconda colonna di a aumentata di 3 volte la prima. 1 a 1 b Esercizio 7.3. Si calcoli il prodotto . 0 1 0 1 n 1 1 Esercizio 7.4. Si calcoli . 0 1 Esercizio 7.5. Si trovi una formula per esprimere la potenza n 1 1 1 0 1 1 0 0 1 e la si provi per induzione. Esercizio 7.6. Siano a, b matrici quadrate. (1) Quando è vero che (a + b)(a − b) = a2 − b2 ? (2) Espandere la potenza (a + b)3 . Esercizio 7.7. Per ciascuno dei casi, determinare le matrici quadrate a coefficienti in Q che commutano con la data matrice 1 0 (1) 0 0 0 1 (2) 0 0 2 0 (3) 0 6 APPUNTI DI ALGEBRA LINEARE 1 0 2 (5) 0 (4) VER. 1.1.0 25 3 1 3 6 2 3 Esercizio 7.8. Sia a := 1 2 ∈ M3×2 (Q). 2 5 (1) Trovare infinite matrici b tali che ba = 12 ; (2) provare che non esiste nessuna matrice c tale che ac = 13 . Esercizio 7.9. Si riducano a forma normale le seguenti matrici reali, tenendo traccia delle operazioni elementari effettuate sulle righe: 1 3 1 3 (1) , ; 3 1 1 3 1 1 1 1 (2) ; 3 1 1 2 0 2 1 0 2 2 (3) 0 2 2 ; 0 2 1 √ 0 1 −1 √2 0 2 −1 1 √ (4) 2 0 −1 1 −1 2 2 1 Esercizio 7.10. Calcolare, se possibile, le inverse delle seguenti matrici a coefficienti inR: 2 3 2 2 2 1 2 −1 1 9 (1) , , , , ; 0 1 1 1 3 1 1 −1 0 −1 4 2 3 1 1 1 1 2 0 1 3 0 (2) 0 1 1 , 0 1 1 , 1 2 2 , 4 −1 4 . 1 0 1 1 1 2 1 2 0 0 0 1 Quali di esse sono invertibili anche su Z2 , Z3 , Z4 , Z5 ? In tali casi si determinino le loro inverse. Esercizio 7.11. Date le matrici a, b a coefficienti in F = Z2 , calcolare ab, a + b, a − b, dove 1 1 (1) a = 1 0 1 1 (2) a = 1 0 0 1 1 −1 ,b= ; 1 1 1 1 1 −1 0 , b = 1 1 1 . −1 1 −1 1 Esercizio 7.12. Calcolare, se possibile, le inverse delle seguenti matrici a coefficienti in Z2 : 1 1 0 1 1 1 1 −1 1 0 (1) , , , , ; 0 1 1 1 1 1 1 −1 0 −1 26 VINCENZO C. NARDOZZA 1 (2) 0 0 1 1 0 0 1 1 , 0 1 1 0 1 0 1 0 1 , 1 0 1 1 0 1 1 0 0 , 0 0 1 0 1 −1 0 . 0 1 Esercizio 7.13. Si esibisca, se esiste, una matrice razionale (cioè a coefficienti in Q) A opportuna tale che AB sia una matrice in forma normale, dove 1 3 1 −1 2 B = −1 0 1 2 3 0 −3 Si risponda all’analoga domanda considerando la matrice B in M3×4 (Z9 ) o M3×4 (Z11 ). Esercizio 7.14. Si determini il rango delle seguenti matrici reali: 1 1 1 1 (1) , ; 1 1 0 1 1 3 2 −1 (2) ; 3 1 −1 2 1 0 0 2 −2 1 √1 1 0 2 ; (3) 2 1 √ 3 , −2 0 −2 0 1 1 1 3 − 1 h 0 1 (4) 2 h 2 , dove h ∈ R. 1 1 2 Esercizio 7.15. Si dica quali delle seguenti matrici quadrate sono invertibili. Si calcoli l’inversa di quelle invertibili e si determini una matrice X tale che X · A = 0 per le matrici A che non sono invertibili. 1 √0 1 1 1 1 (1) , , (Matrici reali); 1 2 2 2 1 3 0 1 1 1 1 1 (2) 1 1 2 , 1 0 1 (matrici su Z3 ); 1 1 0 1 2 3 2 0 −1 2 0 0 −1 1 (matrice su Z7 ). (3) −3 1 0 2 3 1 −1 6 Esercizio 7.16. Si dica per quali valori di 1 0 0 h h−1 2 0 0 h ∈ R la matrice 2 0 0 1 0 2 1 2 è invertibile, e se ne determini l’inversa. Si risponda alla domanda considerando invece il campo base F ∈ {Z2 , Z5 , Z11 , Z13 } ( e di conseguenza h ∈ F ). 1 1 Esercizio 7.17. Sia a = , e sia f : M2×1 (R) → M2×1 (R) definita 1 2 tramite x x f: →a· . y y f è iniettiva? E’ suriettiva? VER. 1.1.0 APPUNTI DI ALGEBRA LINEARE 27 a b | a, b ∈ Z3 . Si provi che −b a R è un anello rispetto le usuali operazioni tra matrici; R è commutativo R è un campo R∼ = GF (9), scrivendo un esplicito isomorfismo di campi. Esercizio 7.18. Sia R := (1) (2) (3) (4) Esercizio 7.19. Si determinino tutte le soluzioni dell’equazione x1 +x2 +2x3 −x4 = 3 a coefficienti in Z23 . Quante sono? Esercizio 7.20. Si risolvano i seguenti sistemi lineari su F ∈ {Q, Z2 , Z3 , Z5 , Z7 , Z11 } + 2z = 0 x x − y + 3z = 1 (1) y + 2z = −2 2x + 3y − z = −3 x + z = 0 (2) x + 2y − z = −2 y − z = 0 x + 3z = 2 (3) x + 3y + 2z = 2 x + 2y + z = 2 Esercizio 7.21. Si risolvano i seguenti sistemi lineari omogenei su F ∈ {Q, Z2 , Z3 , Z5 , Z7 , Z11 } x + 2y + 3z − t = 0 y + 2z + t = 0 (1) x − y + 2t = 0 x + 3z = 0 x + y + z + t = 0 x + 2y + 3z − t = 0 (2) x − 2y − 5z + 7t = 0 Esercizio 7.22. Si discutano i F ∈ {Q, Z2 , Z3 , Z5 , Z7 , Z11 }: hx + y − 2hz − y + hz (1) hx + z hx + y + z y − z (2) hx + 2z 2y + hz seguenti sistemi lineari al variare di h in F , per = 0 = 0 = 0 + 2t = + ht = + 2t = + 2t = 0 h h 0 Esercizio 7.23. Si discuta il seguente sistema lineare al variare dei parametri h, k nel campo F , controllando separatamente i casi F = Q, F = Z2 , F = Z3 , F = Z5 . y = −h kx − kx − y = k−1 kx + (h − k)y = 1 − k 28 VINCENZO C. NARDOZZA Esercizio 7.24. Discutere e risolvere, al variare del parametro λ ∈ Z13 , il sistema lineare seguente: +3x2 +λx3 = λ + 4 2(λ + 1)x1 (4λ − 1)x1 +(λ + 1)x2 +(2λ − 1)x3 = 2λ + 2 (5λ − 4)x1 +(λ + 1)x2 +(3λ − 4)x3 = λ − 1 Esercizio 7.25. Discutere e risolvere, al variare del lineare seguente: 2x1 +x2 +x3 = 3x1 −x2 +2x3 = x1 +2x2 +3x3 = 5x1 +λx2 −x3 = parametro λ ∈ Z17 , il sistema 2 6 2 3λ Esercizio 7.26. Calcolare il determinante delle seguenti matrici 1 α (1) ∈ M2 (GF (9)) dove α2 = 2; 2 − α 3 1 1 (2) ; 1 −1 2 0 1 (3) 0 1 0 1 0 2 1 0 0 0 5 2 0 0 (4) 8 6 3 0 0 9 7 4 1 4 1 3 2 3 5 0 (5) 4 1 0 0 2 0 0 0 1 2 5 6 3 1 7 7 (6) 0 0 2 3. 4 1 2 5 Esercizio 7.27. Sia a1 := (1) ∈ M1 (F ) e ricorsivamente an := n > 2. Si calcoli per induzione su n il determinante det(an ). Esercizio 7.28. Calcolare 1 2 det 3 .. . 2 2 3 3 3 3 ... ... ... .. . n n n ... n n n . .. . n 0 an−1 1 per 0