LEZIONI DI ALGEBRA LINEARE PER LE APPLICAZIONI FINANZIARIE FLAVIO ANGELINI Sommario. Queste note hanno lo scopo di indicare a studenti di Economia interessati alla finanza quantitativa i concetti essenziali di algebra lineare utili alle applicazioni finanziarie, come lo studio di modelli multi-dimensionali e l’analisi fattoriale. In particolare sono rivolte agli studenti del corso di Metodi matematici per i modelli finanziari del Corso di Laurea Specialistica in Finanza della Facoltà di Economia dell’Università di Perugia. Si danno per assunti i concetti di spazio vettoriale, basi e matrici. Il tutto, formulato in dimensione due per semplicità di trattazione e di calcolo, si estende in dimensione superiore. 1. Applicazioni lineari 1.1. Definizione. Iniziamo con la definizione generale: Definizione 1.1. Una funzione L : Rn → Rm si dice applicazione o trasformazione lineare se, presi comunque due numeri reali α e β e due vettori x e y in Rn , si ha: (1.1) L(αx + βy) = αL(x) + βL(y). Un’applicazione lineare è una funzione di n variabili, le coordinate del vettore x ∈ Rn , a m valori, le coordinate del vettore z = L(x) ∈ Rm , che soddisfa la condizione 1.1. Geometricamente, un’applicazione lineare trasforma rette in rette, non le distorce. Dalla definizione si vede subito che la composizione di applicazioni lineari è un’applicazione lineare. Il nucleo dell’applicazione NL ⊆ Rn è definito come l’insieme dei vettori x ∈ Rn tali che L(x) = 0. Il nucleo si dimostra essere un sottospazio di Rn . L’immagine dell’applicazione L(Rn ) ⊆ Rm è l’insieme di tutti i vettori z ∈ Rm per i quali esiste x ∈ Rn tale che L(x) = z; in altre parole sono tutti i vettori di Rm raggiunti da L. Anche l’immagine è un sottospazio, però di Rm . La dimensione dell’immagine L(Rn ) si dice il rango dell’applicazione: dim(L(Rn )) = rango(L). 1 2 FLAVIO ANGELINI Da ora in poi ci concentriamo sul caso n = m e, per semplicità, trattiamo il caso n = 2: L : R2 → R2 . In questo caso lo spazio di partenza e di arrivo coincidono. L’applicazione L può essere vista come un movimento del piano R2 , ad esempio una rotazione, uno ”stiramento” o una riflessione. 1.2. Rappresentazione matriciale. Siano e1 e e2 due vettori che formano una base di R2 ; ad esempio, ma non necessariamente, la base canonica. Un vettore x ∈ R2 si scrive dunque come x = x1 e1 + x2 e2 . Perciò, dalla definizione (1.1), L(x) = L(e1 )x1 + L(e2 )x2 . Definiamo la matrice A = (L(e1 ) L(e2 )) . µ ¶ x1 Scriviamo il generico vettore x = in coordinate rispetto alla x2 base. Si ha L(x) = A ∗ x, dove ∗ indica il prodotto righe per colonne tra matrici. I vettori saranno sempre pensati come vettori colonna in questa note. Insomma, per determinare un’applicazione lineare basta sapere dove vanno i vettori di una base. Come si vede, la matrice A dipende dalla base scelta: infatti le sue colonne sono formate dalle immagini dei vettori della base: µ ¶ µ ¶ a11 a12 L(e1 ) = , L(e2 ) = . a21 a22 Si noti l’equivalenza tra il rango di L e il rango della matrice A rango(L) = rango(A). Infatti, se i vettori L(e1 ) e L(e2 ) sono linearmente indipendenti il rango di A è due; l’immagine di L è tutto R2 , dunque ha dimensione due. Se non lo sono il rango di A è uno e l’immagine di L è la retta passante per l’origine e direzione L(e1 ), o L(e2 ) che è la stessa. Escludiamo il caso non interessante di rango zero, che capita solo all’applicazione che restringe tutto lo spazio nel vettore nullo, l’applicazione nulla. Si noti che se si cambia base, la matrice A cambia. Però non cambia il rango. ALGEBRA LINEARE 3 µ ¶ µ ¶ 0 1 Esempio 1.2. Sia L l’applicazione che manda i vettori e 0 1 µ ¶ µ ¶ 3 0 della base canonica rispettivamente in = 3e1 e = −1e2 . 0 −1 La matrice associata è dunque µ ¶ 3 0 A= . 0 −1 µ ¶ 1 L’immagine del vettore x = è 2 µ ¶ 3 L(x) = A ∗ x = . −2 Equivalentemente: µ ¶ L(x) = L(e1 ) + 2L(e2 ) = 3 0 µ +2 0 −1 ¶ µ = 3 −2 ¶ . x2 6 ¢̧ ¢ x ¢ e2 6¢ ¢ 1 ¢ eQ Q A ∗ e2 ? QQ A ∗ e1- x1 Q Q Q A∗x QQ s µ 1 0 ¶ µ ¶ 0 e 1 Esempio 1.3. Sia L l’applicazione che manda i vettori µ ¶ µ ¶ 1 3 della base canonica, rispettivamente in e . La matrice 3 1 associata è dunque µ ¶ 1 3 A= . 3 1 µ ¶ µ ¶ 1 −1 Determiniamo l’immagine dei vettori v1 = e v2 = . Si 1 1 ha: µ ¶ 4 L(v1 ) = A ∗ v1 = = 4v1 ; 4 4 FLAVIO ANGELINI µ L(v2 ) = A ∗ v2 = 2 −2 ¶ = −2v2 ; Dunque: se utilizziamo la base canonica la matrice associata è A; se invece utilizziamo come base i vettori v1 e v2 la matrice che rappresenta L è µ ¶ 4 0 B= 0 −2 che ha il pregio di essere più comoda. Una matrice cosı̀ fatta (con tutti zeri fuori dalla diagonale) si dice appunto matrice diagonale. y2 x2 6 6 A ∗ v1 µ ¡ ¡ v2 ¡ ¡v1 I @ µ ¡ @¡ @ @ R @ cambio base - ¡ v2 6 v1 - x1 - B ∗ v1- y1 B ∗ v2 A ∗ v2 ? Esempio 1.4. La matrice associata all’applicazione I(x) = x per ogni x ∈ R2 , cioè l’applicazione identità, è la matrice identità µ I= 1 0 0 1 ¶ . Dato λ ∈ R, la matrice associata all’applicazione L(x) = λI(x) = λx per ogni x ∈ R2 , cioè l’applicazione che allunga tutto di λ, ribaltando se λ < 0 (o accorcia se |λ| < 1), è µ Λ= λ 0 0 λ ¶ . Si noti che queste due applicazioni lineari, anche se si cambia base, si rappresentano sempre con la stessa matrice. ALGEBRA LINEARE x2 λ=2 6 λe2 e2 5 ¡ µ λx ¡ 6 ¡ ¡ x 6 ¡ µ ¡ e1 λe1 ¡ - - x1 Esempio 1.5. Un’applicazione lineare rappresentata da una matrice µ ¶ cos(θ) − sin(θ) R= , sin(θ) cos(θ) per un θ fissato, rappresenta una rotazione di angolo θ. Ad esempio, per θ = π2 , si ha µ ¶ 0 −1 R= , 1 0 la quale ruota i vettori della base appunto di 90 gradi. x2 6 ¾ θ 6e2 = R ∗ e1 R ∗ e2 ¾ e1 - - x1 Dunque, data un’applicazione lineare, per ognuna delle infinite possibili basi, esiste una matrice che la rappresenta. Definizione 1.6. Due matrici si dicono equivalenti se definiscono la stessa applicazione lineare. Enunciamo, senza preoccuparci troppo di dimostrare (si veda l’esercizio (3) di Esercizi 1.3), il seguente Risultato 1.7. Due matrici A e B sono equivalenti se esiste una matrice V invertibile, cioè con determinante diverso da zero, tale che A = V ∗ B ∗ V −1 . 6 FLAVIO ANGELINI La matrice V rappresenta il passaggio da una base all’altra, ovvero da un sistema di coordinate ad un altro. Più precisamente, se v1 e v2 sono un’altra base, in coordinate rispetto alla base di partenza, si ha: V = (v1 v2 ) . Abbiamo detto che la composizione di due applicazioni lineari è ancora lineare. La matrice che la rappresenta è il prodotto righe per colonne delle matrici, nell’ordine giusto. Se A rappresenta l’applicazione L e B l’applicazione M , allora M ◦ L è rappresentata dalla matrice B ∗ A. Provate ora degli esercizi. 1.3. Esercizi. (1) Dire quale dei seguenti insiemi di vettori formano una base dello spazio a cui appartengono: {(1, 3), (2, 3)}; {(1, 3), (2, 6)}; {(−1, 0), (0, −1)}; {(1, 0, 1), (0, 1, 2)}; {(1, 0, 1), (0, 1, 0), (0, 1, 0)}; {(1, 0, 1), (0, 1, 0), (1, 1, 1)}. (2) Date le applicazioni lineari rappresentate, rispetto a una fissata base, dalle matrici fornite di seguito, determinare l’immagine dei vettori della base, l’immagine dei vettori (1, 1) e (1, −1) e il nucleo dell’applicazione: µ ¶ µ ¶ µ ¶ 4 −2 1 −2 4 −2 ; ; . 1 −5 2 −4 −2 4 (3) Data le applicazioni lineari dell’esercizio precedente, determinare le matrici che le rappresentano rispetto alla base formata dai vettori {(1, 1), (1, −1)}. Che relazione hanno con le matrici date nell’esercizio precedente? (4) Data l’applicazione lineare rappresentata dalla matrice √ µ √ ¶ √2/2 −√ 2/2 , 2/2 2/2 mostrare geometricamente che si tratta di una rotazione del piano e determinarne l’angolo (suggerimento: mostrare le immagini dei vettori della base). (5) Scrivere la matrice che rappresenta l’applicazione lineare che riflette il piano rispetto a: (a) l’asse x; (b) la bisettrice del primo e terzo quadrante; ALGEBRA LINEARE 7 2. Autovalori e autovettori Iniziamo con la definizione. Definizione 2.1. Un autovettore di una trasformazione lineare L : R2 → R2 è un vettore x 6= 0 ∈ R2 per il quale esiste uno scalare λ tale che (2.1) L(x) = λx Il numero λ è detto autovalore di L relativo all’autovettore x. Si noti che se x è un autovettore lo è anche ogni suo multiplo con lo stesso autovalore. Quindi, se esiste un autovettore c’è almeno una retta di autovettori. In parole povere un autovettore è un vettore che non viene ruotato da L, rimane sulla sua direzione, cambiando verso se λ < 0. Si pensi ad esempio ad una riflessione del piano rispetto a una retta passante per l’origine, come quelle dell’esercizio (5) di Esercizi 1.3. Tutti i vettori della retta vengono tenuti fermi dalla riflessione. La retta è dunque formata da tutti autovettori con autovalore 1. La retta si può definire un autospazio. C’è un altro autovalore con relativa retta di autovettori che si può vedere geometricamente. Quale? Tutti i vettori x ∈ NL diversi dal vettore nullo, se ci sono, sono autovettori con autovalore 0. In altre parole, dire che l’applicazione L ha nucleo non banale, cioè non formato solo dal vettore nullo, è la stessa cosa di dire che 0 è autovalore di L relativo a ogni vettore del nucleo. µ ¶ 1 Nell’Esempio 1.2 il vettore è un autovettore con autovalore 0 µ ¶ 0 λ1 = 3, mentre il vettore è un autovettore con autovalore λ2 = 1 µ ¶ 1 è un autovettore con autovalore −1. Nell’Esempio 1.3, il vettore 1 µ ¶ −1 λ1 = 4 e il vettore è un autovettore con autovalore λ1 = −2. 1 In entrambi i casi dell’Esempio 1.4, ogni vettore di R2 è un autovettore, con autovalore 1 nel caso dell’identità e λ nel secondo caso. 2.1. Perché? Vediamo ora l’importanza dei concetti di autovalore e autovettore. Consideriamo un’applicazione lineare L rappresentata dalla matrice A rispetto a una fissata base. Supponiamo che esistano due autovettori di L che formano una base di R2 , ovvero due autovettori linearmente indipendenti. Siano dunque v1 e v2 tali autovettori 8 FLAVIO ANGELINI con autovalori rispettivamente λ1 e λ2 , cioè L(v1 ) = λ1 v1 L(v2 ) = λ2 v2 o, se esprimiamo v1 e v2 rispetto alla base di partenza, A ∗ v1 = λ1 v1 A ∗ v2 = λ2 v2 . Si noti che λ1 e λ2 non sono necessariamente diversi. In più dimensioni possono anche essere uguali, mentre in dimensione due il caso non è molto interessante perché significa che L = λI, la quale, come già detto, si rappresenta sempre con la stessa matrice λI; era quindi già in forma diagonale e non c’era nulla da fare. Se rappresentiamo l’applicazione L rispetto alla base formata dai due autovettori, otteniamo la matrice µ ¶ λ1 0 D= . 0 λ2 Questo è quello che accade negli Esempi 1.2 e 1.3. Nel primo esempio era facile perchè partivamo già con una base di autovettori. Nel secondo abbiamo dovuto cambiare base. Le matrici diagonali sono molto belle. • È facile calcolarne il determinante, anche se la matrice è enorme: è il prodotto degli elementi sulla diagonale. • Si vede subito il rango: è il numero di elementi diverso da zero. • Se rappresentano una forma quadratica, si vede subito che segno ha la forma associata. Basta guardare i segni degli elementi (vedi §4.4). • Se rappresentano la matrice di varianza-covarianza di variabili aleatorie, tali variabili hanno a due a due correlazione nulla. 2.2. Come si trovano autovalori e autovettori? Innanzitutto autovalori e autovettori non sempre esistono 1. Dalla definizione, bisogna cercare λ tale che L(x) − λx = 0 per un x 6= 0, cioè tale che (L − λI)(x) = 0. Stiamo dunque cercando quei numeri λ tali che il nucleo dell’applicazione L − λI è non banale. Rappresentando L con la matrice A, 1Si intende autovalori reali e autovettori a componenti reali. Il caso complesso non ci interessa. ALGEBRA LINEARE 9 bisogna cercare λ tale che il sistema (2.2) (A − λI) ∗ x = 0 ammetta soluzione non banale. Ma questo è semplicemente un sistema omogeneo di due equazioni in due incognite, il quale ammette sempre la soluzione 0 che però non ci interessa. Ammette soluzioni non banali quando det(A − λI) = 0. La funzione P (λ) = det(A − λI) è una funzione polinomiale in λ e si chiama polinomio caratteristico di A. Nel nostro caso è un polinomio di grado due. Cosı̀ è facile vedere se ci sono soluzioni reali e calcolarle. Dopodiché, se vogliamo calcolare gli autovettori, dobbiamo fissare i valori di λ ottenuti e risolvere il sistema (2.2). Tale procedimento si può scrivere in un algoritmo. Algoritmo per il calcolo di autovalori e autovettori • Calcolo polinomio caratteristico det(A − λI). • Calcolo soluzioni λi di det(A − λI) = 0. Se le soluzioni sono complesse (coniugate), non ci sono autovettori reali e l’algoritmo termina. Altrimenti, per i = 1, 2 • Calcolo soluzioni x di (A − λi I) ∗ x = 0. Fine Vediamo tale procedura con un esempio. Esempio 2.2. Sia µ A= la matrice dell’Esempio 1.2. 1 3 3 1 ¶ , 10 FLAVIO ANGELINI • Calcolo polinomio caratteristico: ¶ µ 1−λ 3 A − λI = 3 1−λ e dunque det(A − λI) = (1 − λ)(1 − λ) − 9. • Calcolo soluzioni λi di det(A − λI) = [(1 − λ) + 3] [(1 − λ) − 3] = 0. In questo caso le soluzioni si vedono subito perchè l’equazione si è scritta come differenza di quadrati. Sono λ1 = 4 , λ2 = −2. Se non lo avessimo spezzato come differenza di quadrati, cosa che non si può fare in generale, sarebbe venuto det(A − λI) = λ2 − 2λ − 8 = 0. Per i = 1 • Calcolo soluzioni x di (A − λ1 I) ∗ x = (A − 4I) ∗ x = 0, cioè ½ (1 − 4)x1 + 3x2 3x1 + (1 − 4)x2 ½ −3x1 + 3x2 = 3x1 − 3x2 = = 0 = 0 0 . 0 Una soluzione è x1 = 1 e x2 = 1, cioè il vettore v1 = Le altre sono tutti i vettori multipli di v1 . Per i = 2 • Calcolo soluzioni x di (A − λ2 I) ∗ x = (A + 2I) ∗ x = 0, cioè ½ 3x1 + 3x2 = 0 . 3x1 + 3x2 = 0 µ ¶ −1 Le soluzioni sono v2 = e tutti i suoi multipli. 1 Fine Vediamo ora un caso in cui gli autovettori non ci sono. µ 1 1 ¶ . ALGEBRA LINEARE Esempio 2.3. Sia µ R= 0 1 −1 0 11 ¶ , la rotazione dell’Esempio 1.5. • Calcolo polinomio caratteristico: µ ¶ −λ 1 A − λI = −1 −λ e dunque det(A − λI) = λ2 + 1. • Calcolo soluzioni λi di det(A − λI) = λ2 + 1 = 0. Le soluzioni sono complesse λ1 = i , λ2 = −i. L’algoritmo si interrompe. Infatti, se andate a calcolare le soluzioni x di (A − λi I) ∗ x = 0, 2 vengono autovettori complessi, quindi non appartenenti µ ¶ a R . Ad es1 empio per λ1 = i si otterrebbe il vettore v2 = . Tutto torna −i però, dato che la matrice in questione rappresenta una rotazione che non tiene ferma nessuna retta. 3. Teorema spettrale per matrici simmetriche Siamo interessati a studiare matrici simmetriche. In finanza sono importanti le matrici di varianza-covarianza dei rendimenti di un mercato di titoli; queste sono matrici simmetriche definite positive 2. Teorema 3.1. Per le matrici simmetriche è sempre possibile trovare una base di autovettori. Dunque, sono sempre diagonalizzabili. In più, si può sempre trovare una base ortogonale, cioè formata da autovettori ortogonali tra di loro. Per il Risultato 1.7, ciò è equivalente alla seguente affermazione: per ogni matrice simmetrica A è sempre possibile scrivere (3.1) A = V ∗ D ∗ V −1 , con: 2O dovrebbero essere definite positive: se la matrice di varianza-covarianza è stimata, ad esempio sulle serie storiche dei rendimenti, nessuno assicura che risulti definita positiva, ma ora non ce ne preoccupiamo. 12 FLAVIO ANGELINI (1) µ D= λ1 0 0 λ2 ¶ , matrice diagonale, λ1 e λ2 autovalori di A; (2) V = (v1 v2 ) è una matrice 2 × 2, dove v1 (la prima colonna) è l’autovettore di A relativo all’autovalore λ1 e v2 (la seconda colonna) l’autovettore di A relativo all’autovalore λ2 (vettori espressi rispetto alla base di partenza); (3) i due autovettori v1 e v2 sono ortogonali. Se prendiamo i due autovettori dell’ultimo punto anche di norma uno, cosa che si può sempre fare, si può vedere che l’equazione (3.1) diventa A = V ∗ D ∗ V T, dove V T indica la matrice trasposta; cioè V −1 = V T . Dunque, A e D sono equivalenti e la matrice V rappresenta il cambio di base. Tale cambio di base non è nient’altro che una rotazione. Non vogliamo dimostrare il Teorema, anche se chi ha capito fin qui capirebbe anche la dimostrazione del Teorema, che non è complicatissima. A noi potrebbe bastare capire che, in generale: • se troviamo una base di autovettori, allora possiamo mettere la matrice in forma diagonale; e sapere che • le matrici simmetriche hanno sempre una base di autovettori. Quindi sono sempre ”diagonalizzabili”. In più, tali autovettori sono tra loro ortogonali. Meglio se sappiamo anche che • la matrice di partenza è uguale a V ∗ D ∗ V T, con D matrice diagonale con gli autovalori sulla diagonale e V matrice formata da colonne di autovettori di norma uno. Poi ci è sufficiente convincerci del risultato con un esempio e magari con qualche esercizio 3. Esempio 3.2. Guardiamo all’Esempio 1.3. Stiamo dicendo che la solita matrice µ ¶ 1 3 A= 3 1 3Oppure usando la function ”eig” di MATLAB, vedi il §3.2. ALGEBRA LINEARE 13 µ ha due autovettori indipendenti. E lo sapevamo già, sono v1 = µ ¶ −1 e v2 = . In più, sono ortogonali. Vero. 1 Inoltre, la matrice si può scrivere come µ ¶ 4 0 ∗ V −1 A=V ∗ 0 −2 con ¶ µ 1 −1 . V = 1 1 1 1 ¶ Verificate (dovete invertire la matrice V , che noia). Le due colonne di V sono ortogonali. Se le volete anche entrambe di norma uno, allora dovete prendere √ ¶ µ √ 1/√2 −1/√ 2 V = , 1/ 2 1/ 2 che poi altri non è che la rotazione dell’esercizio (4) di Esercizi 1.3 che manda i vettori della base canonica nei due autovettori. Ora dovete fare µ ¶ 4 0 V ∗ ∗ V T, 0 −2 senza dunque bisogno di invertire V , solo comodamente trasporla. Viene? 3.1. Esercizi. (1) Date le matrici µ ¶ µ ¶ µ ¶ 3 0 9 0 2 2 ; ; ; 0 −1 0 1 2 −1 µ ¶ µ ¶ µ ¶ 4 2 5 3 4 2 ; ; , 2 3 3 0 2 1 trovarne autovalori e autovettori. (2) Provate per una volta a determinare gli autovalori e gli autovettori di una matrice 3 × 3: 2 0 0 0 3 1 . 0 1 4 (3) Verficate che le matrici degli esercizi precedenti possono essere diagonalizzate, ovvero che gli autovettori formano una base. Scrivete la matrice diagonale equivalente alla matrice data. 14 FLAVIO ANGELINI (4) Per le matrici degli esercizi precedenti, trovate la matrice V del Teorema spettrale e controllate se V è formata da vettori colonna ortogonali tra loro. Verificate il Teorema. Cioè verificate che V ∗D ∗V T , con D matrice diagonale trovata nell’esercizio precedente. Attenzione: dovete prendere autovettori di norma uno, altrimenti dovete calcolare V −1 . 3.2. Autovalori e autovettori in MATLAB. MATLAB ha la funzione ”eig”: data una matrice A, il comando [V, D] = eig(A) restituisce la matrice diagonale D con elementi gli autovalori di A (dal più piccolo al più grande) e la matrice V con colonne gli autovettori di A. Provatela su qualcuno degli esercizi per verificare i vostri conti e controllate anche che A = V ∗ D ∗ V 0 (V 0 è la trasposta in MATLAB). 4. Applicazioni 4.1. Modelli di mercato. Consideriamo una variabile aleatoria bidimensionale µ ¶ X1 X= . X2 Si pensi ad esempio ai rendimenti di due titoli del mercato azionario o alle variazioni di tassi d’interesse con due diverse scadenze. Sia µ ¶ E1 E= , E2 con E1 = E[X1 ] e E2 = E[X2 ], il vettore dei valori attesi e µ ¶ σ11 σ12 Σ= σ12 σ22 la matrice di varianza-covarianza, la quale è dunque simmetrica e definita positiva. Per il Teorema spettrale, tale matrice è diagonalizzabile. Sia µ ¶ λ1 0 D= 0 λ2 la matrice diagonale equivalente a Σ. Sistemiamo in modo che λ1 > λ2 ≥ 0. Sia V = (v1 v2 ) la matrice contenente gli autovettori ortonormali, cioè ortogonali tra loro e di norma uno. Per cui (4.1) Σ = V ∗ D ∗ V T. Modello a un fattore. Sia F1 una variabile con media 0 e varianza 1. Non deve essere necessariamente normale, ma spesso nei modelli lo è. Approssimiamo la variabile X che descrive il mercato con p X̃ = E + v1 λ1 F1 . ALGEBRA LINEARE Per componenti si ha ½ 15 √ X̃1 = E1 + v11 √λ1 F1 . X̃2 = E2 + v21 λ1 F1 Si pensi ad esempio al modello CAPM in cui si utilizza il rendimento IM del portafoglio di mercato p λ1 F1 = IM − E[IM ]. √ In tal caso λ1 rappresenta la deviazione standard del portafoglio di mercato e il vettore v1 ha come componenti i ”beta” dei due titoli 4. Ora la matrice di varianza-covarianza di X̃ è µ ¶ 2 λ1 v11 v21 λ1 v11 Σ1 = . 2 v11 v21 λ1 v21 λ1 Dunque, nel modello a un fattore, che descrive il mercato tramite X̃, la matrice di varianza-covarianza è Σ1 . Tale matrice ha rango uno, infatti ha determinante uguale a zero. Se si guarda bene si vede che µ ¶ λ1 0 Σ1 = V V T. 0 0 Se la matrice di varianza-covarianza Σ ha rango due, cioè λ2 > 0, allora il modello proposto non spiega tutta la varianza. Si sta trascurando il contributo di λ2 alla varianza. Nel linguaggio del CAPM, stiamo considerando solo il rischio ”sistematico” e non il ”rischio specifico” dei due titoli. Nel nostro caso stiamo spiegando i movimenti delle due variabili X1 e X2 solamente con un fattore esplicativo F1 , considerando solo il rischio legato a tale fattore. Questo porta ad una semplificazione dell’analisi, soprattutto se immaginate di estendere il caso a un numero elevato di variabili, come succede in finanza. Ora, se λ2 è ”piccolo” in confronto a λ1 il modello ”spiega” bene il mercato, altrimenti ci vorrebbe un modello a più fattori. Il rapporto λ1 λ1 + λ2 fornisce la percentuale di varianza ”spiegata” dal modello. In ogni caso il modello proposto è il miglior modello lineare a un fattore per ”spiegare” la varianza del mercato. Infatti si può dimostrare che ha una matrice di varianza-covarianza di rango uno la più ”vicina” 5 possibile a quella della variabile bi-dimensionale X. √ è detto che si possa sempre dare al fattore λ1 F1 un significato finanziario cosı̀ concreto come il rendimento di un portafoglio di mercato. 5A questo ”vicina” è possibile dare un significato più preciso con concetti di distanza tra matrici. 4Non 16 FLAVIO ANGELINI Modello a due fattori. Aggiungiamo un fattore F2 , a media 0 e varianza 1 e a correlazione 0 con F1 . Il modello diventa p p X̃ = v1 λ1 F1 + v2 λ2 F2 . Per componenti si ha ½ √ √ X̃1 = v11 √λ1 F1 + v12 √λ2 F2 . X̃2 = v21 λ1 F1 + v22 λ2 F2 Si può calcolare la matrice di varianza-covarianza di X̃, la quale risulta (verificare: basta applicare le regole di calcolo per la varianza e la covarianza di somme di variabili aleatorie) V ∗ D ∗ V T. Dunque, per la (4.1) è uguale a Σ: la varianza del mercato è totalmente spiegata, var(X̃) = var(X). Le variabili F1 e F2 si possono prendere in modo che X̃ = X in distribuzione 6. Ad esempio, se X è una normale bivariata, basta prendere F1 e F2 normali. Il vantaggio qui è solo di avere due variabili F1 e F2 che hanno media 0, varianza 1 e che sono incorrelate. Bisogna sempre però pensare al caso di un numero elevato di variabili. In questo caso che, come detto, rappresenta la norma in problemi di finanza applicata, anche avere due fattori potrebbe semplificare molto l’analisi, pur spiegando meglio di un solo fattore il mercato. In mercati complessi si può aggiungere anche un terzo fattore. Il modello (a uno, due o tre fattori) fornirà una riduzione della dimensione delle variabili esplicative e quindi una semplificazione. Tra i modelli con la stessa dimensione sarà quello che spiegherà meglio la varianza del mercato. La scelta della dimensione dipenderà dal solito ”trade-off”, in finanza come in altri campi, tra un modello sufficientemente semplice da essere agevolmente trattabile e un modello abbastanza ricco da interpretare al meglio i movimenti del mercato. 4.2. Esercizio. Sia µ ¶ 5% 4% Σ= 4% 5% la matrice di varianza-covarianza di un mercato con due titoli. Determinare autovalori e autovettori. Scrivere poi un modello a un fattore e un modello a due fattori. Quanto bene il modello a un fattore rappresenta tale mercato? 6Avere la stessa varianza non vuol dire avere la stessa distribuzione. ALGEBRA LINEARE 17 4.3. Applicazione. Lo script ”pca2s”, scaricabile dalla pagina del corso http://www.unipg.it/angelini/mmmf.htm, effettua l’analisi sulla serie delle variazioni dei tassi d’interesse italiani con scadenze 2 e 10 anni, estratti dai tassi swap con il bootstrapping. Mostra, anche graficamente, i due autovettori, gli autovalori e la varianza spiegata da un solo fattore. Il primo autovettore viene negativo, ma si può pensare positivo, e ha le componenti molto vicine. Il secondo ha una componente positiva e una negativa. Il primo fattore rappresenta dunque uno shift parallelo, perché produce un movimento uguale per i due tassi in considerazione. Il secondo fattore rappresenta un twist in cui il tasso a breve si muove in direzione opposta a quello a lunga. 4.4. Studio del segno di una forma quadratica. Sia A una matrice simmetrica e Q(x) = xT ∗ A ∗ x la forma quadratica associata. Il Teorema spettrale ci permette di scrivere Q(x) = xT ∗ V ∗ D ∗ V T ∗ x = (V T ∗ x)T ∗ A ∗ (V T ∗ x). Ora, se indichiamo con y = V T ∗ x, ovvero cambiamo coordinate, abbiamo Q(y) = yT ∗ D ∗ y. Studiare il segno di Q al variare di x è la stessa cosa che studiarne il segno al variare di y; questo perché V T è invertibile e dunque V T ∗ x raggiunge tutti gli y. Dunque basta studiare il segno della matrice diagonale D, che è facile. In conclusione, per studiare il segno di una matrice simmetrica, basta calcolare gli autovalori e guardarne i segni. In dimensione 2 abbiamo (1) Segni concordi ⇒ definita, positiva se positivi, negativa se negativi; (2) Segni discordi ⇒ indefinita; (3) un autovalore 0 ⇒ semidefinita, positiva se l’altro positivo, negativa se negativo. 4.5. Esercizi. Studiare il segno delle forme quadratiche definite dalle matrici degli esercizi (1) e (2) di Esercizi 3.1 utilizzando la diagonalizzazione. Verificate che fornisca la stessa risposta del test che già conoscete. Sezione di Finanza Matematica, Dipartimento di Economia, Finanza e Statistica, Università di Perugia E-mail address: [email protected]