LEZIONI DI ALGEBRA LINEARE PER LE APPLICAZIONI

LEZIONI DI ALGEBRA LINEARE PER LE
APPLICAZIONI FINANZIARIE
FLAVIO ANGELINI
Sommario. Queste note hanno lo scopo di indicare a studenti di
Economia interessati alla finanza quantitativa i concetti essenziali
di algebra lineare utili alle applicazioni finanziarie, come lo studio
di modelli multi-dimensionali e l’analisi fattoriale. In particolare
sono rivolte agli studenti del corso di Metodi matematici per i
modelli finanziari del Corso di Laurea Specialistica in Finanza della Facoltà di Economia dell’Università di Perugia. Si danno per
assunti i concetti di spazio vettoriale, basi e matrici. Il tutto, formulato in dimensione due per semplicità di trattazione e di calcolo,
si estende in dimensione superiore.
1. Applicazioni lineari
1.1. Definizione. Iniziamo con la definizione generale:
Definizione 1.1. Una funzione L : Rn → Rm si dice applicazione o
trasformazione lineare se, presi comunque due numeri reali α e β e due
vettori x e y in Rn , si ha:
(1.1)
L(αx + βy) = αL(x) + βL(y).
Un’applicazione lineare è una funzione di n variabili, le coordinate
del vettore x ∈ Rn , a m valori, le coordinate del vettore z = L(x) ∈
Rm , che soddisfa la condizione 1.1. Geometricamente, un’applicazione
lineare trasforma rette in rette, non le distorce.
Dalla definizione si vede subito che la composizione di applicazioni
lineari è un’applicazione lineare.
Il nucleo dell’applicazione NL ⊆ Rn è definito come l’insieme dei
vettori x ∈ Rn tali che L(x) = 0. Il nucleo si dimostra essere un sottospazio di Rn . L’immagine dell’applicazione L(Rn ) ⊆ Rm è l’insieme
di tutti i vettori z ∈ Rm per i quali esiste x ∈ Rn tale che L(x) = z; in
altre parole sono tutti i vettori di Rm raggiunti da L. Anche l’immagine è un sottospazio, però di Rm . La dimensione dell’immagine L(Rn )
si dice il rango dell’applicazione:
dim(L(Rn )) = rango(L).
1
2
FLAVIO ANGELINI
Da ora in poi ci concentriamo sul caso n = m e, per semplicità,
trattiamo il caso n = 2:
L : R2 → R2 .
In questo caso lo spazio di partenza e di arrivo coincidono. L’applicazione L può essere vista come un movimento del piano R2 , ad esempio
una rotazione, uno ”stiramento” o una riflessione.
1.2. Rappresentazione matriciale. Siano e1 e e2 due vettori che
formano una base di R2 ; ad esempio, ma non necessariamente, la base
canonica. Un vettore x ∈ R2 si scrive dunque come
x = x1 e1 + x2 e2 .
Perciò, dalla definizione (1.1),
L(x) = L(e1 )x1 + L(e2 )x2 .
Definiamo la matrice
A = (L(e1 ) L(e2 )) .
µ
¶
x1
Scriviamo il generico vettore x =
in coordinate rispetto alla
x2
base. Si ha
L(x) = A ∗ x,
dove ∗ indica il prodotto righe per colonne tra matrici. I vettori saranno
sempre pensati come vettori colonna in questa note.
Insomma, per determinare un’applicazione lineare basta sapere dove
vanno i vettori di una base. Come si vede, la matrice A dipende dalla
base scelta: infatti le sue colonne sono formate dalle immagini dei
vettori della base:
µ
¶
µ
¶
a11
a12
L(e1 ) =
, L(e2 ) =
.
a21
a22
Si noti l’equivalenza tra il rango di L e il rango della matrice A
rango(L) = rango(A).
Infatti, se i vettori L(e1 ) e L(e2 ) sono linearmente indipendenti il rango
di A è due; l’immagine di L è tutto R2 , dunque ha dimensione due. Se
non lo sono il rango di A è uno e l’immagine di L è la retta passante
per l’origine e direzione L(e1 ), o L(e2 ) che è la stessa. Escludiamo il
caso non interessante di rango zero, che capita solo all’applicazione che
restringe tutto lo spazio nel vettore nullo, l’applicazione nulla.
Si noti che se si cambia base, la matrice A cambia. Però non cambia
il rango.
ALGEBRA LINEARE
3
µ
¶ µ ¶
0
1
Esempio 1.2. Sia L l’applicazione che manda i vettori
e
0
1
µ ¶
µ
¶
3
0
della base canonica rispettivamente in
= 3e1 e
= −1e2 .
0
−1
La matrice associata è dunque
µ
¶
3 0
A=
.
0 −1
µ ¶
1
L’immagine del vettore x =
è
2
µ
¶
3
L(x) = A ∗ x =
.
−2
Equivalentemente:
µ
¶
L(x) = L(e1 ) + 2L(e2 ) =
3
0
µ
+2
0
−1
¶
µ
=
3
−2
¶
.
x2
6
¢̧
¢
x
¢
e2 6¢
¢
1
¢ eQ
Q
A ∗ e2 ? QQ
A ∗ e1- x1
Q
Q
Q
A∗x
QQ
s
µ
1
0
¶ µ ¶
0
e
1
Esempio 1.3. Sia L l’applicazione che manda i vettori
µ ¶ µ ¶
1
3
della base canonica, rispettivamente in
e
. La matrice
3
1
associata è dunque
µ
¶
1 3
A=
.
3 1
µ ¶
µ
¶
1
−1
Determiniamo l’immagine dei vettori v1 =
e v2 =
. Si
1
1
ha:
µ ¶
4
L(v1 ) = A ∗ v1 =
= 4v1 ;
4
4
FLAVIO ANGELINI
µ
L(v2 ) = A ∗ v2 =
2
−2
¶
= −2v2 ;
Dunque: se utilizziamo la base canonica la matrice associata è A; se
invece utilizziamo come base i vettori v1 e v2 la matrice che rappresenta
L è
µ
¶
4 0
B=
0 −2
che ha il pregio di essere più comoda. Una matrice cosı̀ fatta (con tutti
zeri fuori dalla diagonale) si dice appunto matrice diagonale.
y2
x2
6
6
A ∗ v1
µ
¡
¡
v2
¡
¡v1
I
@
µ
¡
@¡
@
@
R
@
cambio base
-
¡
v2 6
v1
- x1
-
B ∗ v1- y1
B ∗ v2
A ∗ v2
?
Esempio 1.4. La matrice associata all’applicazione I(x) = x per ogni
x ∈ R2 , cioè l’applicazione identità, è la matrice identità
µ
I=
1 0
0 1
¶
.
Dato λ ∈ R, la matrice associata all’applicazione L(x) = λI(x) = λx
per ogni x ∈ R2 , cioè l’applicazione che allunga tutto di λ, ribaltando
se λ < 0 (o accorcia se |λ| < 1), è
µ
Λ=
λ 0
0 λ
¶
.
Si noti che queste due applicazioni lineari, anche se si cambia base, si
rappresentano sempre con la stessa matrice.
ALGEBRA LINEARE
x2
λ=2
6
λe2
e2
5
¡
µ λx
¡
6
¡
¡ x
6 ¡
µ
¡ e1 λe1
¡ -
- x1
Esempio 1.5. Un’applicazione lineare rappresentata da una matrice
µ
¶
cos(θ) − sin(θ)
R=
,
sin(θ) cos(θ)
per un θ fissato, rappresenta una rotazione di angolo θ. Ad esempio,
per θ = π2 , si ha
µ
¶
0 −1
R=
,
1 0
la quale ruota i vettori della base appunto di 90 gradi.
x2
6
¾
θ
6e2 = R ∗ e1
R ∗ e2 ¾
e1
-
- x1
Dunque, data un’applicazione lineare, per ognuna delle infinite possibili basi, esiste una matrice che la rappresenta.
Definizione 1.6. Due matrici si dicono equivalenti se definiscono la
stessa applicazione lineare.
Enunciamo, senza preoccuparci troppo di dimostrare (si veda l’esercizio (3) di Esercizi 1.3), il seguente
Risultato 1.7. Due matrici A e B sono equivalenti se esiste una
matrice V invertibile, cioè con determinante diverso da zero, tale che
A = V ∗ B ∗ V −1 .
6
FLAVIO ANGELINI
La matrice V rappresenta il passaggio da una base all’altra, ovvero da
un sistema di coordinate ad un altro. Più precisamente, se v1 e v2 sono
un’altra base, in coordinate rispetto alla base di partenza, si ha:
V = (v1 v2 ) .
Abbiamo detto che la composizione di due applicazioni lineari è ancora lineare. La matrice che la rappresenta è il prodotto righe per colonne
delle matrici, nell’ordine giusto. Se A rappresenta l’applicazione L e B
l’applicazione M , allora M ◦ L è rappresentata dalla matrice B ∗ A.
Provate ora degli esercizi.
1.3. Esercizi.
(1) Dire quale dei seguenti insiemi di vettori formano una base dello
spazio a cui appartengono:
{(1, 3), (2, 3)}; {(1, 3), (2, 6)}; {(−1, 0), (0, −1)};
{(1, 0, 1), (0, 1, 2)}; {(1, 0, 1), (0, 1, 0), (0, 1, 0)};
{(1, 0, 1), (0, 1, 0), (1, 1, 1)}.
(2) Date le applicazioni lineari rappresentate, rispetto a una fissata
base, dalle matrici fornite di seguito, determinare l’immagine
dei vettori della base, l’immagine dei vettori (1, 1) e (1, −1) e il
nucleo dell’applicazione:
µ
¶ µ
¶ µ
¶
4 −2
1 −2
4 −2
;
;
.
1 −5
2 −4
−2 4
(3) Data le applicazioni lineari dell’esercizio precedente, determinare
le matrici che le rappresentano rispetto alla base formata dai
vettori {(1, 1), (1, −1)}. Che relazione hanno con le matrici date
nell’esercizio precedente?
(4) Data l’applicazione lineare rappresentata dalla matrice
√
µ √
¶
√2/2 −√ 2/2 ,
2/2
2/2
mostrare geometricamente che si tratta di una rotazione del
piano e determinarne l’angolo (suggerimento: mostrare le immagini dei vettori della base).
(5) Scrivere la matrice che rappresenta l’applicazione lineare che
riflette il piano rispetto a:
(a) l’asse x;
(b) la bisettrice del primo e terzo quadrante;
ALGEBRA LINEARE
7
2. Autovalori e autovettori
Iniziamo con la definizione.
Definizione 2.1. Un autovettore di una trasformazione lineare
L : R2 → R2
è un vettore x 6= 0 ∈ R2 per il quale esiste uno scalare λ tale che
(2.1)
L(x) = λx
Il numero λ è detto autovalore di L relativo all’autovettore x.
Si noti che se x è un autovettore lo è anche ogni suo multiplo con
lo stesso autovalore. Quindi, se esiste un autovettore c’è almeno una
retta di autovettori. In parole povere un autovettore è un vettore che
non viene ruotato da L, rimane sulla sua direzione, cambiando verso se
λ < 0. Si pensi ad esempio ad una riflessione del piano rispetto a una
retta passante per l’origine, come quelle dell’esercizio (5) di Esercizi
1.3. Tutti i vettori della retta vengono tenuti fermi dalla riflessione. La
retta è dunque formata da tutti autovettori con autovalore 1. La retta
si può definire un autospazio. C’è un altro autovalore con relativa retta
di autovettori che si può vedere geometricamente. Quale?
Tutti i vettori x ∈ NL diversi dal vettore nullo, se ci sono, sono
autovettori con autovalore 0. In altre parole, dire che l’applicazione
L ha nucleo non banale, cioè non formato solo dal vettore nullo, è la
stessa cosa di dire che 0 è autovalore di L relativo a ogni vettore del
nucleo.
µ ¶
1
Nell’Esempio 1.2 il vettore
è un autovettore con autovalore
0
µ ¶
0
λ1 = 3, mentre il vettore
è un autovettore con autovalore λ2 =
1
µ ¶
1
è un autovettore con autovalore
−1. Nell’Esempio 1.3, il vettore
1
µ
¶
−1
λ1 = 4 e il vettore
è un autovettore con autovalore λ1 = −2.
1
In entrambi i casi dell’Esempio 1.4, ogni vettore di R2 è un autovettore,
con autovalore 1 nel caso dell’identità e λ nel secondo caso.
2.1. Perché? Vediamo ora l’importanza dei concetti di autovalore e
autovettore. Consideriamo un’applicazione lineare L rappresentata
dalla matrice A rispetto a una fissata base. Supponiamo che esistano
due autovettori di L che formano una base di R2 , ovvero due autovettori linearmente indipendenti. Siano dunque v1 e v2 tali autovettori
8
FLAVIO ANGELINI
con autovalori rispettivamente λ1 e λ2 , cioè
L(v1 ) = λ1 v1
L(v2 ) = λ2 v2
o, se esprimiamo v1 e v2 rispetto alla base di partenza,
A ∗ v1 = λ1 v1
A ∗ v2 = λ2 v2 .
Si noti che λ1 e λ2 non sono necessariamente diversi. In più dimensioni
possono anche essere uguali, mentre in dimensione due il caso non è
molto interessante perché significa che L = λI, la quale, come già detto,
si rappresenta sempre con la stessa matrice λI; era quindi già in forma
diagonale e non c’era nulla da fare. Se rappresentiamo l’applicazione
L rispetto alla base formata dai due autovettori, otteniamo la matrice
µ
¶
λ1 0
D=
.
0 λ2
Questo è quello che accade negli Esempi 1.2 e 1.3. Nel primo esempio
era facile perchè partivamo già con una base di autovettori. Nel secondo
abbiamo dovuto cambiare base.
Le matrici diagonali sono molto belle.
• È facile calcolarne il determinante, anche se la matrice è enorme:
è il prodotto degli elementi sulla diagonale.
• Si vede subito il rango: è il numero di elementi diverso da zero.
• Se rappresentano una forma quadratica, si vede subito che segno
ha la forma associata. Basta guardare i segni degli elementi
(vedi §4.4).
• Se rappresentano la matrice di varianza-covarianza di variabili
aleatorie, tali variabili hanno a due a due correlazione nulla.
2.2. Come si trovano autovalori e autovettori? Innanzitutto autovalori e autovettori non sempre esistono 1. Dalla definizione, bisogna
cercare λ tale che
L(x) − λx = 0
per un x 6= 0, cioè tale che
(L − λI)(x) = 0.
Stiamo dunque cercando quei numeri λ tali che il nucleo dell’applicazione L − λI è non banale. Rappresentando L con la matrice A,
1Si
intende autovalori reali e autovettori a componenti reali. Il caso complesso
non ci interessa.
ALGEBRA LINEARE
9
bisogna cercare λ tale che il sistema
(2.2)
(A − λI) ∗ x = 0
ammetta soluzione non banale. Ma questo è semplicemente un sistema
omogeneo di due equazioni in due incognite, il quale ammette sempre
la soluzione 0 che però non ci interessa. Ammette soluzioni non banali
quando
det(A − λI) = 0.
La funzione
P (λ) = det(A − λI)
è una funzione polinomiale in λ e si chiama polinomio caratteristico di
A. Nel nostro caso è un polinomio di grado due. Cosı̀ è facile vedere se
ci sono soluzioni reali e calcolarle. Dopodiché, se vogliamo calcolare gli
autovettori, dobbiamo fissare i valori di λ ottenuti e risolvere il sistema
(2.2). Tale procedimento si può scrivere in un algoritmo.
Algoritmo per il calcolo di autovalori e autovettori
• Calcolo polinomio caratteristico
det(A − λI).
• Calcolo soluzioni λi di
det(A − λI) = 0.
Se le soluzioni sono complesse (coniugate), non ci sono autovettori reali
e l’algoritmo termina.
Altrimenti, per i = 1, 2
• Calcolo soluzioni x di
(A − λi I) ∗ x = 0.
Fine
Vediamo tale procedura con un esempio.
Esempio 2.2. Sia
µ
A=
la matrice dell’Esempio 1.2.
1 3
3 1
¶
,
10
FLAVIO ANGELINI
• Calcolo polinomio caratteristico:
¶
µ
1−λ
3
A − λI =
3
1−λ
e dunque
det(A − λI) = (1 − λ)(1 − λ) − 9.
• Calcolo soluzioni λi di
det(A − λI) = [(1 − λ) + 3] [(1 − λ) − 3] = 0.
In questo caso le soluzioni si vedono subito perchè l’equazione
si è scritta come differenza di quadrati. Sono
λ1 = 4 , λ2 = −2.
Se non lo avessimo spezzato come differenza di quadrati, cosa
che non si può fare in generale, sarebbe venuto
det(A − λI) = λ2 − 2λ − 8 = 0.
Per i = 1
• Calcolo soluzioni x di
(A − λ1 I) ∗ x = (A − 4I) ∗ x = 0,
cioè
½
(1 − 4)x1 + 3x2
3x1 + (1 − 4)x2
½
−3x1 + 3x2 =
3x1 − 3x2 =
= 0
= 0
0
.
0
Una soluzione è x1 = 1 e x2 = 1, cioè il vettore v1 =
Le altre sono tutti i vettori multipli di v1 .
Per i = 2
• Calcolo soluzioni x di
(A − λ2 I) ∗ x = (A + 2I) ∗ x = 0,
cioè
½
3x1 + 3x2 = 0
.
3x1 + 3x2 = 0
µ
¶
−1
Le soluzioni sono v2 =
e tutti i suoi multipli.
1
Fine
Vediamo ora un caso in cui gli autovettori non ci sono.
µ
1
1
¶
.
ALGEBRA LINEARE
Esempio 2.3. Sia
µ
R=
0 1
−1 0
11
¶
,
la rotazione dell’Esempio 1.5.
• Calcolo polinomio caratteristico:
µ
¶
−λ 1
A − λI =
−1 −λ
e dunque
det(A − λI) = λ2 + 1.
• Calcolo soluzioni λi di
det(A − λI) = λ2 + 1 = 0.
Le soluzioni sono complesse
λ1 = i , λ2 = −i.
L’algoritmo si interrompe.
Infatti, se andate a calcolare le soluzioni x di
(A − λi I) ∗ x = 0,
2
vengono autovettori complessi, quindi non appartenenti
µ
¶ a R . Ad es1
empio per λ1 = i si otterrebbe il vettore v2 =
. Tutto torna
−i
però, dato che la matrice in questione rappresenta una rotazione che
non tiene ferma nessuna retta.
3. Teorema spettrale per matrici simmetriche
Siamo interessati a studiare matrici simmetriche. In finanza sono importanti le matrici di varianza-covarianza dei rendimenti di un mercato
di titoli; queste sono matrici simmetriche definite positive 2.
Teorema 3.1. Per le matrici simmetriche è sempre possibile trovare
una base di autovettori. Dunque, sono sempre diagonalizzabili. In più,
si può sempre trovare una base ortogonale, cioè formata da autovettori
ortogonali tra di loro.
Per il Risultato 1.7, ciò è equivalente alla seguente affermazione: per
ogni matrice simmetrica A è sempre possibile scrivere
(3.1)
A = V ∗ D ∗ V −1 ,
con:
2O
dovrebbero essere definite positive: se la matrice di varianza-covarianza è
stimata, ad esempio sulle serie storiche dei rendimenti, nessuno assicura che risulti
definita positiva, ma ora non ce ne preoccupiamo.
12
FLAVIO ANGELINI
(1)
µ
D=
λ1 0
0 λ2
¶
,
matrice diagonale, λ1 e λ2 autovalori di A;
(2) V = (v1 v2 ) è una matrice 2 × 2, dove v1 (la prima colonna)
è l’autovettore di A relativo all’autovalore λ1 e v2 (la seconda
colonna) l’autovettore di A relativo all’autovalore λ2 (vettori
espressi rispetto alla base di partenza);
(3) i due autovettori v1 e v2 sono ortogonali.
Se prendiamo i due autovettori dell’ultimo punto anche di norma
uno, cosa che si può sempre fare, si può vedere che l’equazione (3.1)
diventa
A = V ∗ D ∗ V T,
dove V T indica la matrice trasposta; cioè V −1 = V T .
Dunque, A e D sono equivalenti e la matrice V rappresenta il cambio
di base. Tale cambio di base non è nient’altro che una rotazione.
Non vogliamo dimostrare il Teorema, anche se chi ha capito fin qui
capirebbe anche la dimostrazione del Teorema, che non è complicatissima. A noi potrebbe bastare capire che, in generale:
• se troviamo una base di autovettori, allora possiamo mettere la
matrice in forma diagonale;
e sapere che
• le matrici simmetriche hanno sempre una base di autovettori.
Quindi sono sempre ”diagonalizzabili”. In più, tali autovettori
sono tra loro ortogonali.
Meglio se sappiamo anche che
• la matrice di partenza è uguale a
V ∗ D ∗ V T,
con D matrice diagonale con gli autovalori sulla diagonale e V
matrice formata da colonne di autovettori di norma uno.
Poi ci è sufficiente convincerci del risultato con un esempio e magari
con qualche esercizio 3.
Esempio 3.2. Guardiamo all’Esempio 1.3. Stiamo dicendo che la
solita matrice
µ
¶
1 3
A=
3 1
3Oppure
usando la function ”eig” di MATLAB, vedi il §3.2.
ALGEBRA LINEARE
13
µ
ha due autovettori indipendenti. E lo sapevamo già, sono v1 =
µ
¶
−1
e v2 =
. In più, sono ortogonali. Vero.
1
Inoltre, la matrice si può scrivere come
µ
¶
4 0
∗ V −1
A=V ∗
0 −2
con
¶
µ
1 −1
.
V =
1 1
1
1
¶
Verificate (dovete invertire la matrice V , che noia). Le due colonne di
V sono ortogonali. Se le volete anche entrambe di norma uno, allora
dovete prendere
√ ¶
µ √
1/√2 −1/√ 2
V =
,
1/ 2 1/ 2
che poi altri non è che la rotazione dell’esercizio (4) di Esercizi 1.3 che
manda i vettori della base canonica nei due autovettori. Ora dovete
fare
µ
¶
4 0
V ∗
∗ V T,
0 −2
senza dunque bisogno di invertire V , solo comodamente trasporla.
Viene?
3.1. Esercizi.
(1) Date le matrici
µ
¶ µ
¶ µ
¶
3
0
9 0
2
2
;
;
;
0 −1
0 1
2 −1
µ
¶ µ
¶ µ
¶
4 2
5 3
4 2
;
;
,
2 3
3 0
2 1
trovarne autovalori e autovettori.
(2) Provate per una volta a determinare gli autovalori e gli autovettori di una matrice 3 × 3:


2 0 0
 0 3 1 .
0 1 4
(3) Verficate che le matrici degli esercizi precedenti possono essere
diagonalizzate, ovvero che gli autovettori formano una base.
Scrivete la matrice diagonale equivalente alla matrice data.
14
FLAVIO ANGELINI
(4) Per le matrici degli esercizi precedenti, trovate la matrice V del
Teorema spettrale e controllate se V è formata da vettori colonna ortogonali tra loro. Verificate il Teorema. Cioè verificate che
V ∗D ∗V T , con D matrice diagonale trovata nell’esercizio precedente. Attenzione: dovete prendere autovettori di norma uno,
altrimenti dovete calcolare V −1 .
3.2. Autovalori e autovettori in MATLAB. MATLAB ha la funzione ”eig”: data una matrice A, il comando [V, D] = eig(A) restituisce
la matrice diagonale D con elementi gli autovalori di A (dal più piccolo
al più grande) e la matrice V con colonne gli autovettori di A. Provatela
su qualcuno degli esercizi per verificare i vostri conti e controllate anche
che A = V ∗ D ∗ V 0 (V 0 è la trasposta in MATLAB).
4. Applicazioni
4.1. Modelli di mercato. Consideriamo una variabile aleatoria bidimensionale
µ
¶
X1
X=
.
X2
Si pensi ad esempio ai rendimenti di due titoli del mercato azionario o
alle variazioni di tassi d’interesse con due diverse scadenze. Sia
µ
¶
E1
E=
,
E2
con E1 = E[X1 ] e E2 = E[X2 ], il vettore dei valori attesi e
µ
¶
σ11 σ12
Σ=
σ12 σ22
la matrice di varianza-covarianza, la quale è dunque simmetrica e definita positiva. Per il Teorema spettrale, tale matrice è diagonalizzabile.
Sia
µ
¶
λ1 0
D=
0 λ2
la matrice diagonale equivalente a Σ. Sistemiamo in modo che λ1 >
λ2 ≥ 0. Sia V = (v1 v2 ) la matrice contenente gli autovettori ortonormali, cioè ortogonali tra loro e di norma uno. Per cui
(4.1)
Σ = V ∗ D ∗ V T.
Modello a un fattore. Sia F1 una variabile con media 0 e varianza
1. Non deve essere necessariamente normale, ma spesso nei modelli lo
è. Approssimiamo la variabile X che descrive il mercato con
p
X̃ = E + v1 λ1 F1 .
ALGEBRA LINEARE
Per componenti si ha
½
15
√
X̃1 = E1 + v11 √λ1 F1
.
X̃2 = E2 + v21 λ1 F1
Si pensi ad esempio al modello CAPM in cui si utilizza il rendimento
IM del portafoglio di mercato
p
λ1 F1 = IM − E[IM ].
√
In tal caso λ1 rappresenta la deviazione standard del portafoglio di
mercato e il vettore v1 ha come componenti i ”beta” dei due titoli 4.
Ora la matrice di varianza-covarianza di X̃ è
µ
¶
2
λ1 v11 v21 λ1
v11
Σ1 =
.
2
v11 v21 λ1 v21
λ1
Dunque, nel modello a un fattore, che descrive il mercato tramite X̃, la
matrice di varianza-covarianza è Σ1 . Tale matrice ha rango uno, infatti
ha determinante uguale a zero. Se si guarda bene si vede che
µ
¶
λ1 0
Σ1 = V
V T.
0 0
Se la matrice di varianza-covarianza Σ ha rango due, cioè λ2 > 0, allora
il modello proposto non spiega tutta la varianza. Si sta trascurando
il contributo di λ2 alla varianza. Nel linguaggio del CAPM, stiamo
considerando solo il rischio ”sistematico” e non il ”rischio specifico”
dei due titoli. Nel nostro caso stiamo spiegando i movimenti delle due
variabili X1 e X2 solamente con un fattore esplicativo F1 , considerando
solo il rischio legato a tale fattore. Questo porta ad una semplificazione
dell’analisi, soprattutto se immaginate di estendere il caso a un numero
elevato di variabili, come succede in finanza. Ora, se λ2 è ”piccolo”
in confronto a λ1 il modello ”spiega” bene il mercato, altrimenti ci
vorrebbe un modello a più fattori. Il rapporto
λ1
λ1 + λ2
fornisce la percentuale di varianza ”spiegata” dal modello.
In ogni caso il modello proposto è il miglior modello lineare a un
fattore per ”spiegare” la varianza del mercato. Infatti si può dimostrare
che ha una matrice di varianza-covarianza di rango uno la più ”vicina”
5
possibile a quella della variabile bi-dimensionale X.
√
è detto che si possa sempre dare al fattore λ1 F1 un significato finanziario
cosı̀ concreto come il rendimento di un portafoglio di mercato.
5A questo ”vicina” è possibile dare un significato più preciso con concetti di
distanza tra matrici.
4Non
16
FLAVIO ANGELINI
Modello a due fattori. Aggiungiamo un fattore F2 , a media 0 e
varianza 1 e a correlazione 0 con F1 . Il modello diventa
p
p
X̃ = v1 λ1 F1 + v2 λ2 F2 .
Per componenti si ha
½
√
√
X̃1 = v11 √λ1 F1 + v12 √λ2 F2
.
X̃2 = v21 λ1 F1 + v22 λ2 F2
Si può calcolare la matrice di varianza-covarianza di X̃, la quale risulta
(verificare: basta applicare le regole di calcolo per la varianza e la
covarianza di somme di variabili aleatorie)
V ∗ D ∗ V T.
Dunque, per la (4.1) è uguale a Σ: la varianza del mercato è totalmente
spiegata, var(X̃) = var(X). Le variabili F1 e F2 si possono prendere in
modo che X̃ = X in distribuzione 6. Ad esempio, se X è una normale
bivariata, basta prendere F1 e F2 normali. Il vantaggio qui è solo di
avere due variabili F1 e F2 che hanno media 0, varianza 1 e che sono
incorrelate.
Bisogna sempre però pensare al caso di un numero elevato di variabili. In questo caso che, come detto, rappresenta la norma in problemi di finanza applicata, anche avere due fattori potrebbe semplificare
molto l’analisi, pur spiegando meglio di un solo fattore il mercato. In
mercati complessi si può aggiungere anche un terzo fattore.
Il modello (a uno, due o tre fattori) fornirà una riduzione della dimensione delle variabili esplicative e quindi una semplificazione. Tra
i modelli con la stessa dimensione sarà quello che spiegherà meglio la
varianza del mercato.
La scelta della dimensione dipenderà dal solito ”trade-off”, in finanza
come in altri campi, tra un modello sufficientemente semplice da essere
agevolmente trattabile e un modello abbastanza ricco da interpretare
al meglio i movimenti del mercato.
4.2. Esercizio. Sia
µ
¶
5% 4%
Σ=
4% 5%
la matrice di varianza-covarianza di un mercato con due titoli. Determinare autovalori e autovettori. Scrivere poi un modello a un fattore e un modello a due fattori. Quanto bene il modello a un fattore
rappresenta tale mercato?
6Avere
la stessa varianza non vuol dire avere la stessa distribuzione.
ALGEBRA LINEARE
17
4.3. Applicazione. Lo script ”pca2s”, scaricabile dalla pagina del corso http://www.unipg.it/angelini/mmmf.htm, effettua l’analisi sulla serie delle variazioni dei tassi d’interesse italiani con scadenze 2 e 10
anni, estratti dai tassi swap con il bootstrapping. Mostra, anche graficamente, i due autovettori, gli autovalori e la varianza spiegata da un
solo fattore. Il primo autovettore viene negativo, ma si può pensare
positivo, e ha le componenti molto vicine. Il secondo ha una componente positiva e una negativa. Il primo fattore rappresenta dunque uno
shift parallelo, perché produce un movimento uguale per i due tassi in
considerazione. Il secondo fattore rappresenta un twist in cui il tasso
a breve si muove in direzione opposta a quello a lunga.
4.4. Studio del segno di una forma quadratica. Sia A una matrice
simmetrica e Q(x) = xT ∗ A ∗ x la forma quadratica associata. Il
Teorema spettrale ci permette di scrivere
Q(x) = xT ∗ V ∗ D ∗ V T ∗ x = (V T ∗ x)T ∗ A ∗ (V T ∗ x).
Ora, se indichiamo con y = V T ∗ x, ovvero cambiamo coordinate,
abbiamo
Q(y) = yT ∗ D ∗ y.
Studiare il segno di Q al variare di x è la stessa cosa che studiarne il
segno al variare di y; questo perché V T è invertibile e dunque V T ∗ x
raggiunge tutti gli y. Dunque basta studiare il segno della matrice
diagonale D, che è facile.
In conclusione, per studiare il segno di una matrice simmetrica, basta
calcolare gli autovalori e guardarne i segni. In dimensione 2 abbiamo
(1) Segni concordi ⇒ definita, positiva se positivi, negativa se negativi;
(2) Segni discordi ⇒ indefinita;
(3) un autovalore 0 ⇒ semidefinita, positiva se l’altro positivo,
negativa se negativo.
4.5. Esercizi. Studiare il segno delle forme quadratiche definite dalle
matrici degli esercizi (1) e (2) di Esercizi 3.1 utilizzando la diagonalizzazione. Verificate che fornisca la stessa risposta del test che già
conoscete.
Sezione di Finanza Matematica, Dipartimento di Economia, Finanza
e Statistica, Università di Perugia
E-mail address: [email protected]