Lezione 5: Applicazioni Lineari Le applicazioni lineari sono funzioni tra spazi vettoriali che ne rispettano la struttura, cioe’ che conservano le operazioni di somma tra vettori e moltiplicazione di un vettore per uno scalare. Come vedremo le applicazioni lineari si rappresentano in modo molto efficiente attraverso le matrici. Lo scopo di questa lezione e’ quella di introdurre il concetto di applicazione lineare e capire come sia possibile associare in modo biunivoco ad ogni applicazione lineare tra due spazi vettoriali con basi fissate una matrice. 1 Definizione di applicazione lineare In analisi matematica abbiamo studiato le funzioni reali a valori reali: sono leggi che associano ad un numero reale in un certo insieme, il dominio della funzione, un altro numero reale, nel codominio della funzione. Ad esempio f : R −→ R, f (x) = x2 e’ una funzione che ben conosciamo da R a R, il suo grafico e’ la parabola y = x2 . Come sappiamo R e’ anche uno spazio vettoriale, quindi f e’ una funzione tra lo spazio vettoriale di partenza R e lo spazio vettoriale di arrivo R. Pero’ questa funzione non si comporta bene rispetto alla struttura di spazio vettoriale di R. Infatti se noi prendiamo due vettori u e v e ne facciamo la somma u + v, abbiamo subito che f (u + v) 6= f (u) + f (v) (se lo studente disegna un grafico e applica la regola del parallelogramma se ne accorge immediatamente). Nello stesso modo possiamo vedere che anche la moltiplicazione per uno scalare non e’ rispettata. Ad esempio consideriamo f (2 · 3) = 62 6= 2 · f (3) = 2 · 9. Ci sono invece altre funzioni f : R −→ R che invece si comportano “bene” rispetto alla struttura di spazio vettoriale, cioe’ f (u+v) = f (u)+f (v) e f (λv) = λf (v). Vediamo un esempio, prendiamo la funzione f (x) = 3x. Osserviamo subito che f (x + y) = 3(x + y) = 3x + 3y = f (x) + f (y) ed inoltre che f (λx) = 3λx = λ(3x) = λf (x). Come vedremo tra poco, chiamiamo applicazioni lineari quelle funzioni tra spazi vettoriali che ne rispettano la struttura, cioe’ la somma di vettori ha per immagine tramite f la somma delle immagini dei vettori e il prodotto di un vettore per uno scalare ha per immagine il prodotto dello scalare per l’immagine del vettore. 1 Prima della definizione formale di applicazione lineare richiamiamo la definizione di funzione e di immagine. Definizione 1.1. Definiamo funzione f tra due insiemi A e B una legge che associa ad un elemento di A uno ed un solo elemento di B e denotiamo questa legge come: f : A −→ B a 7→ f (a) L’insieme A è il dominio della funzione, mentre l’insieme B è il codominio della funzione. Definiamo immagine di un elemento a ∈ A l’elemento f (a) ∈ B. L’insieme delle immagini di tutti gli elementi di A si dice immagine di f e si indica con Im(f ) o talvolta con f (A). Non tutte le leggi che associano elementi di un insieme elementi di un’altro insieme sono funzioni. Ad esempio, posso definire una legge che va dall’insieme A degli esseri umani all’insieme B degli esseri umani (A e B possono essere lo stesso insieme) che ad ogni persona associa i fratelli. Questa non e’ una funzione (qualcuno puo’ avere piu’ di un fratello!). Un altro esempio. Consideriamo la legge che va dall’insieme dei numeri naturali all’insieme dei numeri naturali che ad ogni numero associa i numeri suoi divisori. Anche questa legge non e’ una funzione. Andiamo ora a definire le applicazioni lineari. Definizione 1.2. Sia f : V −→ W una funzione, f si dice una applicazione lineare se: 1. f (u + v) = f (u) + f (v), per ogni u e v in V , 2. f (λu) = λf (u) per ogni λ ∈ R, u ∈ V . Proposizione 1.3. Sia f : V → W un’applicazione lineare. Allora f (0V ) = 0W . Proof. Sia v un qualsiasi vettore di V . Si ha: f (0V ) = f (v + (−v)) = f (v) − f (v) = 0W 2 Esempio 1.4. 1. Sia f : R2 −→ R2 , f (x, y) = (x+1, x−y). f e’ lineare? Devo vedere se sono verificate le proprieta’ (1) e (2) della definizione 1.2. Vediamo la proprieta’ (1). f ((x, y) + (x′ , y ′)) = f (x + x′ , y + y ′ ) = (x + x′ + 1, y + y ′ ). D’altra parte: f (x, y) + f (x′ , y ′) = (x + 1, y) + (x′ + 1, y ′) = (x + x′ + 2, y + y ′). Dunque la funzione data non e’ una applicazione lineare. Potevamo concludere anche in modo piu’ rapido osservando che f (0, 0) = 1 6= 0, dunque per la proposizione precedente l’applicazione non e’ lineare. 2. Sia D : R[x] −→ R[x], D(p(x)) = p′ (x), cioe’ una funzione che ad un polinomio associa la sua derivata. Dall’analisi sappiamo che D(p(x) + q(x)) = D(p(x) + q(x)), cioe’ la derivata della somma di due polinomi e’ la somma delle derivate. Inoltre sappiamo anche che D(kp(x)) = kD(p(x)), k ∈ R e cioe’ che possiamo tirar fuori ogni costante dalla derivata (comunque lo studente puo’ anche verificare direttamente sui polinomi queste proprieta’). Quindi abbiamo dimostrato che la derivata D e’ una applicazione lineare. Invitiamo lo studente a verificare in modo analogo, che anche l’integrale e’ un’applicazione lineare da R[x] a R[x]. 4. L’applicazione identica id : V → V definita da: v 7→ v e’ una applicazione lineare. 5. L’applicazione nulla T : V → V definita da: v 7→ 0V e’ una applicazione lineare. 6. Data una base B = {v1 , . . . , vn } di V l’applicazione che associa ad ogni vettore v = λ1 v1 + . . . + λn vn le sue coordinate (λ1 , . . . , λn ) e’ una applicazione lineare (verificarlo per esercizio). T :V →V v = λ1 v1 + . . . + λn vn 7→ (λ1 , . . . , λn ). 7. Ad ogni matrice A ∈ Mm×n possiamo associare l’applicazione lineare LA : Rn → Rm definita da: 3 x1 x2 .. 7→ x1 A1 + x2 A2 + . . . xn An , . xn ove A1 , A2 , . . . , An sono i vettori colonna di A. Si noti che: a1 n a1 2 a1 1 a2 n a2 2 a2 1 1 n x1 A + . . . + xn A = x1 .. + x2 .. + . . . + xn .. = . . . am n am 2 am 1 a1 1 x1 + a1 2 x2 + . . . + a1 n xn a2 1 x1 + a2 2 x2 + . . . + a2 n xn = = .. . am 1 x1 + am 2 x2 + . . . + am n xn a1 1 a2 1 = .. . a1 2 a2 2 .. . am 1 am 2 x1 x1 · · · a1 n · · · a2 n x2 x2 = A . . .. .. .. . . .. xn xn · · · am n (prodotto righe per colonne). x1 x1 x2 x2 Cioè LA .. = A .. . . . xn xn 2 1 0 si ha che LA : R3 → R2 è definita da: Ad esempio se A = −1 1 3 x1 2x + x 0 1 2 1 2 = + x3 LA x2 = x1 + x2 −x1 + x2 + 3x3 −3 1 −1 x3 x1 2 1 0 x2 . = −1 1 3 x3 Si noti che si ha: 4 1 0 0 2 1 0 LA 0 = , LA 1 = , LA 0 = , −1 1 −3 0 0 1 0 0 1 0 1 0 e in generale se e1 = .. , e2 = .. , . . . , en = .. è la base ca . . . 1 0 0 nonica di Rn si ha che LA (ei ) = Ai . Ci chiediamo ora come deve essere fatta una funzione f : R −→ R, affinche’ sia lineare. Sia f (1) = a ∈ R. Osserviamo che, per la proprieta’ (1), f (x) = xf (1) = ax. Dunque le uniche applicazioni lineari da R a R hanno come grafico una retta passante per l’origine (da cui appunto il nome di “applicazione lineare”). Questo esempio e’ particolarmente istruttivo perche’ ci ha mostrato che, per conoscere completamente un’applicazione lineare da R a R, e’ sufficiente conoscerne un solo valore; noi abbiamo scelto f (1), ma lo studente puo’ convincersi che qualunque altro punto (purche’ diverso da zero) ci avrebbe determinato completamente f . Cio’ e’ vero in generale, cioe’ un’applicazione lineare e’ completamente determinata conoscendone solo alcuni valori e precisamente i valori corrispondenti ai vettori di una base del dominio (e infatti qualunque numero diverso da zero e’ base di R). Questo fatto basilare e’ codificato dal seguente teorema. Teorema 1.5. Siano V e W due spazi vettoriali. Se {v1 , . . . , vn } è una base di V e {w1 , . . . , wn } un arbitrario insieme di vettori di W allora esiste ed è unica l’applicazione lineare L : V → W tale che L(v1 ) = w1 , . . . , L(vn ) = wn . Proof. Conosciamo i valori L(v1 ) = w1 . . . L(vn ) = wn e vogliamo mostrare che tali valori determinano in modo unico L(v) per ogni v ∈ V . Definiamo innanzitutto L(v) per un generico v ∈ V . Poiche’ {v1 , . . . , vn } e’ base di V esistono, e sono unici, gli scalari α1 . . . αn (coordinate di v) tali che v = α1 v1 + · · · + αn vn . Definiamo pertanto: L(v) = α1 w1 + · · · + αn wn . Dobbiamo mostrare che L cosi’ definita e’ lineare e che e’ unica. Verifichiamo prima le proprieta’ di linearita’ e’ cioe’: L(u + v) = L(u) + L(v), 5 L(λu) = λL(u) Se u = β1 v1 + · · · + βn vn e v = α1 v1 + · · · + αn vn allora: L(u + v) = (α1 + β1 )v1 + . . . (αn + βn )vn = L(u) + L(v). Analogamente: L(λu) = λβ1 v1 + · · · + λβn vn = λL(u). Ora l’unicita’. Supponiamo che esista L′ lineare con L′ (v1 ) = w1 , . . . , L′ (vn ) = wn . Allora per linearita’ abbiamo: L′ (v) = L′ (α1 v1 + · · · + αn vn ) = α1 L′ (v1 ) + · · · + αn L′ (vn ) = = α1 w1 + · · · + αn wn = L(v). Corollario 1.6. Siano V e W due spazi vettoriali. Se due applicazioni lineari T, S : V → W coincidono su di una base di V allora coincidono su tutto V . Come vedremo il teorema 1.5 e’ fondamentale per stabilire una corrispondenza biunivoca tra applicazioni lineari tra spazi vettoriali con basi fissate e matrici. Prima di procedere vorrei che si apprezzasse il fatto straordinario che una applicazione lineare da Rn a Rm e’ nota se si conoscono i suoi valori su di un insieme di n elementi! Se ricordiamo le funzioni che abbiamo studiato nell’analisi, cio’ e’ ben lontano dal vero, cioe’ nello studio di funzione f : R −→ R non basta conoscere un valore di f ma e’ necessario studiare faticosamente i suoi massimi e minimi, gli asintoti etc. etc. La differenza qui e’ che stiamo considerando applicazioni lineari e cioe’ funzioni con proprieta’ estremamente restrittive sul loro comportamento. 2 Applicazioni lineari e matrici In questa sezione vogliamo esaminare diversi modi di scrivere e rappresentare le applicazioni lineari tra due spazi vettoriali V e W , con una attenzione particolare al caso di V = Rn e W = Rm . Dal teorema 1.5 sappiamo che una applicazione lineare e’ determinata univocamente dal suoi valori su di una qualsiasi base. Vediamo in pratica come cio’ accade. 6 Esempio 2.1. Si consideri l’applicazione lineare f : R2 −→ R3 tale che f (e1 ) = e2 + e3 , f (e2 ) = 2e1 − e2 + e3 . (Nota: ricordiamo che ei denotano i vettori della base canonica che ad esempio nel caso di R2 sono e1 = (1, 0) e e2 = (0, 1), mentre nel caso di R3 sono e1 = (1, 0, 0), e2 = (0, 1, 0), e3 = (0, 0, 1)). Ci chiediamo come calcolare f (x, y) per un generico vettore (x, y). Dalle proprieta’ (1) e (2) della definizione di applicazione lineare abbiamo che: f (x, y) = f (x(1, 0) + y(0, 1)) = f (xe1 + ye2 ) = xf (e1 ) + yf (e2) = = x(e2 + e3 ) + y(2e1 − e2 + e3 ) = x(0, 1, 1) + y(2, −1, 1) = = (2y, x − y, x + y). Vediamo ora cio’ che accade in generale. Sia f : Rn −→ Rm data sulla base canonica da: f (e1 ) = a11 e1 + · · · + am1 em . . . f (en ) = a1n e1 + · · · + amn em Ci chiediamo come possiamo esprimere f (x1 , . . . , xn ) cioe’ come possiamo scrivere l’immagine di un qualsiasi vettore (x1 . . . xn ∈ Rn . Procediamo esattamente come nell’esempio, il ragionamento e’ lo stesso, solo piu’ complicato da scriversi in generale. f (x1 , . . . , xn ) = f (x1 e1 + · · · + en xn ) = x1 f (e1 ) + · · · + xn f (en ) = = x1 (a11 e1 + · · · + am1 em ) + · · · + xn (a1n e1 + · · · + amn em ) = = (a11 x1 + · · · + a1n xn , a21 x1 + · · · + a2n xn , . . . , am1 x1 + · · · + amn xn ). Facciamo un ulteriore passo, notando che f (x1 , . . . , xn ) si puo’ anche scrivere in modo piu’ compatto usando la notazione di moltiplicazione righe per colonne: a11 . . . a1n x1 x1 .. , A = ... f ... = A ... , . am1 . . . amn xn xn in pratica cioe’ abbiamo appena dimostrato che f e’ proprio l’applicazione LA associata ad A descritta nell’esempio 1.4, punto 7. 7 Abbiamo dimostrato il seguente teorema fondamentale per lo svolgimento degli esercizi. Teorema 2.2. Data f : Rn −→ Rm applicazione lineare, fissiamo in Rn e Rm le rispettive basi canoniche che indichiamo con i simboli ei . Allora possiamo equivalentemente rappresentare f in uno dei seguenti tre modi (che individuano tutte e sole le forme con cui scrivere le applicazioni lineari da Rn a Rm ): 1. f (e1 ) = a11 e1 + · · · + am1 em , .. . f (en ) = a1n e1 + · · · + amn em ; 2. f (x1 . . . xn ) = (a11 x1 + · · · + a1n xn , a21 x1 + · · · + a2n xn , . . . , am1 x1 + · · · + amn xn ); 3. f (x) = Ax con x1 a11 . . . a1n .. . x = ... A = ... . xn am1 . . . amn Corollario 2.3. Esiste una corrispondenza biunivoca tra le matrici m × n e le applicazioni lineari tra gli spazi vettoriali Rn e Rm ove si siano fissate in entrambi gli spazi le basi canoniche per rappresentare i vettori. Piu’ precisamente all’applicazione lineare f (x1 , . . . , xn ) = (a11 x1 + · · · + a1n xn , a21 x1 + · · · + a2n xn , . . . , am1 x1 + · · · + amn xn ) e’ associata la matrice: a11 . . . a1n .. , A = ... . am1 . . . amn e viceversa. 8