Lezione 5: Applicazioni Lineari 1 Definizione di applicazione lineare

Lezione 5: Applicazioni Lineari
Le applicazioni lineari sono funzioni tra spazi vettoriali che ne rispettano
la struttura, cioe’ che conservano le operazioni di somma tra vettori e moltiplicazione di un vettore per uno scalare. Come vedremo le applicazioni lineari
si rappresentano in modo molto efficiente attraverso le matrici. Lo scopo di
questa lezione e’ quella di introdurre il concetto di applicazione lineare e
capire come sia possibile associare in modo biunivoco ad ogni applicazione
lineare tra due spazi vettoriali con basi fissate una matrice.
1
Definizione di applicazione lineare
In analisi matematica abbiamo studiato le funzioni reali a valori reali: sono
leggi che associano ad un numero reale in un certo insieme, il dominio della
funzione, un altro numero reale, nel codominio della funzione.
Ad esempio f : R −→ R, f (x) = x2 e’ una funzione che ben conosciamo
da R a R, il suo grafico e’ la parabola y = x2 . Come sappiamo R e’ anche
uno spazio vettoriale, quindi f e’ una funzione tra lo spazio vettoriale di
partenza R e lo spazio vettoriale di arrivo R. Pero’ questa funzione non si
comporta bene rispetto alla struttura di spazio vettoriale di R. Infatti se
noi prendiamo due vettori u e v e ne facciamo la somma u + v, abbiamo
subito che f (u + v) 6= f (u) + f (v) (se lo studente disegna un grafico e applica
la regola del parallelogramma se ne accorge immediatamente). Nello stesso
modo possiamo vedere che anche la moltiplicazione per uno scalare non e’
rispettata. Ad esempio consideriamo f (2 · 3) = 62 6= 2 · f (3) = 2 · 9.
Ci sono invece altre funzioni f : R −→ R che invece si comportano
“bene” rispetto alla struttura di spazio vettoriale, cioe’ f (u+v) = f (u)+f (v)
e f (λv) = λf (v). Vediamo un esempio, prendiamo la funzione f (x) = 3x.
Osserviamo subito che f (x + y) = 3(x + y) = 3x + 3y = f (x) + f (y) ed inoltre
che f (λx) = 3λx = λ(3x) = λf (x).
Come vedremo tra poco, chiamiamo applicazioni lineari quelle funzioni
tra spazi vettoriali che ne rispettano la struttura, cioe’ la somma di vettori
ha per immagine tramite f la somma delle immagini dei vettori e il prodotto
di un vettore per uno scalare ha per immagine il prodotto dello scalare per
l’immagine del vettore.
1
Prima della definizione formale di applicazione lineare richiamiamo la
definizione di funzione e di immagine.
Definizione 1.1. Definiamo funzione f tra due insiemi A e B una legge
che associa ad un elemento di A uno ed un solo elemento di B e denotiamo
questa legge come:
f : A −→ B
a
7→ f (a)
L’insieme A è il dominio della funzione, mentre l’insieme B è il codominio
della funzione. Definiamo immagine di un elemento a ∈ A l’elemento f (a) ∈
B. L’insieme delle immagini di tutti gli elementi di A si dice immagine di f
e si indica con Im(f ) o talvolta con f (A).
Non tutte le leggi che associano elementi di un insieme elementi di un’altro
insieme sono funzioni. Ad esempio, posso definire una legge che va dall’insieme
A degli esseri umani all’insieme B degli esseri umani (A e B possono essere
lo stesso insieme) che ad ogni persona associa i fratelli. Questa non e’ una
funzione (qualcuno puo’ avere piu’ di un fratello!).
Un altro esempio. Consideriamo la legge che va dall’insieme dei numeri
naturali all’insieme dei numeri naturali che ad ogni numero associa i numeri
suoi divisori. Anche questa legge non e’ una funzione.
Andiamo ora a definire le applicazioni lineari.
Definizione 1.2. Sia f : V −→ W una funzione, f si dice una applicazione
lineare se:
1. f (u + v) = f (u) + f (v), per ogni u e v in V ,
2. f (λu) = λf (u) per ogni λ ∈ R, u ∈ V .
Proposizione 1.3. Sia f : V → W un’applicazione lineare. Allora f (0V ) =
0W .
Proof. Sia v un qualsiasi vettore di V . Si ha:
f (0V ) = f (v + (−v)) = f (v) − f (v) = 0W
2
Esempio 1.4.
1. Sia f : R2 −→ R2 , f (x, y) = (x+1, x−y). f e’ lineare?
Devo vedere se sono verificate le proprieta’ (1) e (2) della definizione
1.2. Vediamo la proprieta’ (1).
f ((x, y) + (x′ , y ′)) = f (x + x′ , y + y ′ ) = (x + x′ + 1, y + y ′ ).
D’altra parte:
f (x, y) + f (x′ , y ′) = (x + 1, y) + (x′ + 1, y ′) = (x + x′ + 2, y + y ′).
Dunque la funzione data non e’ una applicazione lineare.
Potevamo concludere anche in modo piu’ rapido osservando che f (0, 0) =
1 6= 0, dunque per la proposizione precedente l’applicazione non e’ lineare.
2. Sia D : R[x] −→ R[x], D(p(x)) = p′ (x), cioe’ una funzione che ad un
polinomio associa la sua derivata. Dall’analisi sappiamo che D(p(x) +
q(x)) = D(p(x) + q(x)), cioe’ la derivata della somma di due polinomi
e’ la somma delle derivate. Inoltre sappiamo anche che D(kp(x)) =
kD(p(x)), k ∈ R e cioe’ che possiamo tirar fuori ogni costante dalla
derivata (comunque lo studente puo’ anche verificare direttamente sui
polinomi queste proprieta’). Quindi abbiamo dimostrato che la derivata
D e’ una applicazione lineare. Invitiamo lo studente a verificare in modo
analogo, che anche l’integrale e’ un’applicazione lineare da R[x] a R[x].
4. L’applicazione identica id : V → V definita da: v 7→ v e’ una applicazione lineare.
5. L’applicazione nulla T : V → V definita da: v 7→ 0V e’ una applicazione lineare.
6. Data una base B = {v1 , . . . , vn } di V l’applicazione che associa ad
ogni vettore v = λ1 v1 + . . . + λn vn le sue coordinate (λ1 , . . . , λn ) e’ una
applicazione lineare (verificarlo per esercizio).
T :V →V
v = λ1 v1 + . . . + λn vn 7→ (λ1 , . . . , λn ).
7. Ad ogni matrice A ∈ Mm×n possiamo associare l’applicazione lineare
LA : Rn → Rm definita da:
3


x1
 x2 
 
 ..  7→ x1 A1 + x2 A2 + . . . xn An ,
.
xn
ove A1 , A2 , . . . , An sono i vettori colonna di A. Si noti che:






a1 n
a1 2
a1 1
 a2 n 
 a2 2 
 a2 1 






1
n
x1 A + . . . + xn A = x1  ..  + x2  ..  + . . . + xn  ..  =
 . 
 . 
 . 
am n
am 2
am 1


a1 1 x1 + a1 2 x2 + . . . + a1 n xn
 a2 1 x1 + a2 2 x2 + . . . + a2 n xn 


=
=
..


.
am 1 x1 + am 2 x2 + . . . + am n xn

a1 1
 a2 1

=  ..
 .
a1 2
a2 2
..
.
am 1 am 2
 
 
x1
x1
· · · a1 n





· · · a2 n   x2 
 x2 
=
A




.
.
..
..
 .. 
.
.   .. 
xn
xn
· · · am n
(prodotto righe per colonne).
 
 
x1
x1
 x2 
x2 
 
 
Cioè LA  ..  = A  .. .
.
.
xn
xn
2 1 0
si ha che LA : R3 → R2 è definita da:
Ad esempio se A =
−1 1 3
 
x1
2x
+
x
0
1
2
1
2
=
+ x3
LA x2  = x1
+ x2
−x1 + x2 + 3x3
−3
1
−1
x3
 
x1
2 1 0  
x2 .
=
−1 1 3
x3
Si noti che si ha:
4
 
 
 
1
0
0
2
1
0
LA 0 =
, LA 1 =
, LA 0 =
,
−1
1
−3
0
0
1

 
 
 

0 
0
1




0
1

0
 
 
 
e in generale se e1 =  ..  , e2 =  ..  , . . . , en =  ..  è la base ca
 . 
.
.





1 
0
0
nonica di Rn si ha che LA (ei ) = Ai .
Ci chiediamo ora come deve essere fatta una funzione f : R −→ R,
affinche’ sia lineare. Sia f (1) = a ∈ R. Osserviamo che, per la proprieta’ (1), f (x) = xf (1) = ax. Dunque le uniche applicazioni lineari da R a R
hanno come grafico una retta passante per l’origine (da cui appunto il nome di
“applicazione lineare”). Questo esempio e’ particolarmente istruttivo perche’
ci ha mostrato che, per conoscere completamente un’applicazione lineare da
R a R, e’ sufficiente conoscerne un solo valore; noi abbiamo scelto f (1), ma
lo studente puo’ convincersi che qualunque altro punto (purche’ diverso da
zero) ci avrebbe determinato completamente f . Cio’ e’ vero in generale, cioe’
un’applicazione lineare e’ completamente determinata conoscendone solo alcuni valori e precisamente i valori corrispondenti ai vettori di una base del
dominio (e infatti qualunque numero diverso da zero e’ base di R). Questo
fatto basilare e’ codificato dal seguente teorema.
Teorema 1.5. Siano V e W due spazi vettoriali. Se {v1 , . . . , vn } è una base
di V e {w1 , . . . , wn } un arbitrario insieme di vettori di W allora esiste ed è
unica l’applicazione lineare L : V → W tale che L(v1 ) = w1 , . . . , L(vn ) =
wn .
Proof. Conosciamo i valori L(v1 ) = w1 . . . L(vn ) = wn e vogliamo mostrare
che tali valori determinano in modo unico L(v) per ogni v ∈ V . Definiamo
innanzitutto L(v) per un generico v ∈ V . Poiche’ {v1 , . . . , vn } e’ base di
V esistono, e sono unici, gli scalari α1 . . . αn (coordinate di v) tali che v =
α1 v1 + · · · + αn vn . Definiamo pertanto:
L(v) = α1 w1 + · · · + αn wn .
Dobbiamo mostrare che L cosi’ definita e’ lineare e che e’ unica. Verifichiamo
prima le proprieta’ di linearita’ e’ cioe’:
L(u + v) = L(u) + L(v),
5
L(λu) = λL(u)
Se u = β1 v1 + · · · + βn vn e v = α1 v1 + · · · + αn vn allora:
L(u + v) = (α1 + β1 )v1 + . . . (αn + βn )vn = L(u) + L(v).
Analogamente:
L(λu) = λβ1 v1 + · · · + λβn vn = λL(u).
Ora l’unicita’. Supponiamo che esista L′ lineare con L′ (v1 ) = w1 , . . . , L′ (vn ) =
wn . Allora per linearita’ abbiamo:
L′ (v) = L′ (α1 v1 + · · · + αn vn ) = α1 L′ (v1 ) + · · · + αn L′ (vn ) =
= α1 w1 + · · · + αn wn = L(v).
Corollario 1.6. Siano V e W due spazi vettoriali. Se due applicazioni lineari
T, S : V → W coincidono su di una base di V allora coincidono su tutto V .
Come vedremo il teorema 1.5 e’ fondamentale per stabilire una corrispondenza biunivoca tra applicazioni lineari tra spazi vettoriali con basi fissate e
matrici. Prima di procedere vorrei che si apprezzasse il fatto straordinario
che una applicazione lineare da Rn a Rm e’ nota se si conoscono i suoi valori
su di un insieme di n elementi! Se ricordiamo le funzioni che abbiamo studiato nell’analisi, cio’ e’ ben lontano dal vero, cioe’ nello studio di funzione
f : R −→ R non basta conoscere un valore di f ma e’ necessario studiare
faticosamente i suoi massimi e minimi, gli asintoti etc. etc. La differenza qui
e’ che stiamo considerando applicazioni lineari e cioe’ funzioni con proprieta’
estremamente restrittive sul loro comportamento.
2
Applicazioni lineari e matrici
In questa sezione vogliamo esaminare diversi modi di scrivere e rappresentare
le applicazioni lineari tra due spazi vettoriali V e W , con una attenzione
particolare al caso di V = Rn e W = Rm . Dal teorema 1.5 sappiamo che
una applicazione lineare e’ determinata univocamente dal suoi valori su di
una qualsiasi base. Vediamo in pratica come cio’ accade.
6
Esempio 2.1. Si consideri l’applicazione lineare f : R2 −→ R3 tale che
f (e1 ) = e2 + e3 , f (e2 ) = 2e1 − e2 + e3 . (Nota: ricordiamo che ei denotano
i vettori della base canonica che ad esempio nel caso di R2 sono e1 = (1, 0)
e e2 = (0, 1), mentre nel caso di R3 sono e1 = (1, 0, 0), e2 = (0, 1, 0), e3 =
(0, 0, 1)). Ci chiediamo come calcolare f (x, y) per un generico vettore (x, y).
Dalle proprieta’ (1) e (2) della definizione di applicazione lineare abbiamo
che:
f (x, y) = f (x(1, 0) + y(0, 1)) = f (xe1 + ye2 ) = xf (e1 ) + yf (e2) =
= x(e2 + e3 ) + y(2e1 − e2 + e3 ) = x(0, 1, 1) + y(2, −1, 1) =
= (2y, x − y, x + y).
Vediamo ora cio’ che accade in generale.
Sia f : Rn −→ Rm data sulla base canonica da:
f (e1 ) = a11 e1 + · · · + am1 em . . . f (en ) = a1n e1 + · · · + amn em
Ci chiediamo come possiamo esprimere f (x1 , . . . , xn ) cioe’ come possiamo
scrivere l’immagine di un qualsiasi vettore (x1 . . . xn ∈ Rn .
Procediamo esattamente come nell’esempio, il ragionamento e’ lo stesso,
solo piu’ complicato da scriversi in generale.
f (x1 , . . . , xn ) = f (x1 e1 + · · · + en xn ) = x1 f (e1 ) + · · · + xn f (en ) =
= x1 (a11 e1 + · · · + am1 em ) + · · · + xn (a1n e1 + · · · + amn em ) =
= (a11 x1 + · · · + a1n xn , a21 x1 + · · · + a2n xn , . . . , am1 x1 + · · · + amn xn ).
Facciamo un ulteriore passo, notando che f (x1 , . . . , xn ) si puo’ anche scrivere in modo piu’ compatto usando la notazione di moltiplicazione righe per
colonne:


 
 
a11 . . . a1n
x1
x1

 
 
..  ,
A =  ...
f  ...  = A  ...  ,
. 
am1 . . . amn
xn
xn
in pratica cioe’ abbiamo appena dimostrato che f e’ proprio l’applicazione
LA associata ad A descritta nell’esempio 1.4, punto 7.
7
Abbiamo dimostrato il seguente teorema fondamentale per lo svolgimento
degli esercizi.
Teorema 2.2. Data f : Rn −→ Rm applicazione lineare, fissiamo in Rn
e Rm le rispettive basi canoniche che indichiamo con i simboli ei . Allora
possiamo equivalentemente rappresentare f in uno dei seguenti tre modi (che
individuano tutte e sole le forme con cui scrivere le applicazioni lineari da
Rn a Rm ):
1. f (e1 ) = a11 e1 + · · · + am1 em ,
..
.
f (en ) = a1n e1 + · · · + amn em ;
2. f (x1 . . . xn ) = (a11 x1 + · · · + a1n xn , a21 x1 + · · · + a2n xn , . . . , am1 x1 + · · · +
amn xn );
3. f (x) = Ax con
 


x1
a11 . . . a1n
 

..  .
x =  ... 
A =  ...
. 
xn
am1 . . . amn
Corollario 2.3. Esiste una corrispondenza biunivoca tra le matrici m × n
e le applicazioni lineari tra gli spazi vettoriali Rn e Rm ove si siano fissate in entrambi gli spazi le basi canoniche per rappresentare i vettori. Piu’
precisamente all’applicazione lineare f (x1 , . . . , xn ) = (a11 x1 + · · · + a1n xn ,
a21 x1 + · · · + a2n xn , . . . , am1 x1 + · · · + amn xn ) e’ associata la matrice:


a11 . . . a1n

..  ,
A =  ...
. 
am1 . . . amn
e viceversa.
8