4 Rischio di credito Definizione 3 Il rischio di credito è il rischio derivante dal cambiamento di valore associato a cambiamenti inattesi della qualità del credito. Obiettivo del credit risk management: creare un “cuscinetto” di capitale di riserva, da utilizzare per far fronte alle perdite derivanti da tali cambiamenti. Gli ingredienti di base per identificare la rischiosità di una singola controparte sono: (i) la Probabilità di Default (PD); (ii) la Loss Given Default (LGD); (iii) la Exposure At Default (EAD). La normativa di vigilanza. Il primo accordo di Basilea (1988) prevedeva che il capitale di riserva fosse almeno pari all’8% delle attività ponderate in base al rischio. Come è stabilita la ponderazione? 100% per tutti gli impieghi a clientela, 20% per i prestiti a banche, 0% per i prestiti allo Stato. Problema: un peso solo per tutta la clientela privati può trasformarsi in un incentivo a prestare ai clienti più rischiosi, che richiedono la stessa riserva di capitale dei clienti meno rischiosi, ma producono margini più elevati. Da qui la necessità di un nuovo accordo (noto come “Basilea 2”). Esso è basato su una radicale riforma del criterio dell’8%. In Basilea 2 ci sono due (tre) approcci alternativi: (1) approccio standard: le banche che non hanno sistemi di rating interni useranno rating esterni, certificati dalle autorità di vigilanza; il capitale richiesto è pari all’8%, pesato come segue: da 20 a 150% per imprese o banche; da 0 a 150% per Stati sovrani; 100% per clientela priva di rating. (2) approccio dei rating interni, suddiviso in: (2a) approccio di base: la banca elabora un proprio sistema di rating (trasparente, documentato, verificabile, periodicamente revisionato) per 30 misurare la PD; LGD ed EAD sono misurate con parametri fissati dalle autorità. (2b) approccio avanzato: anche LGD ed EAD sono stimate internamente dalla banca. Lo possono adottare solo le banche che siano in grado di dimostrare la correttezza, la coerenza, la trasparenza e l’efficacia delle metodologie adottate, basate su dati storici sufficientemente numerosi. 4.1 Rating Come si determina la PD? Ci sono due possibilità: (i) calcolo sulla base di dati di mercato. L’esempio più noto è la cosiddetta Expected Default Frequency (EDF) di Moody’s|KMV; (ii) modelli di natura statistica: calcolo sulla base di rating. I rating sono una misura del merito di credito di un’azienda. Per le aziende “più grandi” sono pubblicamente disponibili rating prodotti dalle agenzie (Moody’s, S&P, Fitch). Soprattutto in Europa, tuttavia, la stragrande maggioranza delle controparti non ha un rating di agenzia, e dunque i rating sono calcolati internamente dalle banche; a tale scopo si utilizzano tecniche statistiche (analisi discriminante, regressione logistica,...) che stimano un rating interno sulla base di variabili esplicative quantitative (principalmente tratte dai bilanci delle aziende) e qualitative (qualità del management, struttura dell’azienda, situazione politica e sociale del Paese in cui l’azienda ha sede). Il tipo di problema ed i dati disponibili portano a preferire metodologie appartenenti alla famiglia dei metodi di analisi discriminante o di regressione logistica (logit, probit). Infatti: a) la quantità che si vuole stimare (la PD) è una probabilità, dunque una quantità compresa fra 0 e 1; b) la variabile dipendente è l’indicatore dell’evento def ault, che assume valore 1 per le imprese insolventi e 0 per le imprese in bonis; 31 c) le variabili indipendenti sono tipicamente ratio basati su dati di bilancio, cioè variabili quantitative continue. Ne consegue che la regressione ordinaria non è appropriata in quanto non dà garanzia di ottenere una stima della variabile dipendente compresa fra 0 e 1. Storicamente, la prima applicazione è basata sull’analisi discriminante: Z-score (Altman 1968): Z = 1.2X1 + 1.4X2 + 3.3X3 + 0.6X4 + X5 , dove: X1 : capitale circolante / totale attivo, X2 : utili non distribuiti / totale attivo, X3 : utili ante interessi e imposte / totale attivo, X4 : valore di mercato del patrimonio / valore contabile dei debiti a lungo termine, X5 : fatturato / totale attivo. Soglia: 1.81; le imprese il cui score Z è maggiore della soglia vengono classificate in bonis, le altre insolventi. Questi modelli hanno poi preso il nome di modelli di scoring. I modelli correntemente utilizzati sono prevalentemente basati sulla regressione logistica. Oltre alle variabili di bilancio, tra le variabili indipendenti vengono considerate variabili dummy che riflettono fattori geo-settoriali ed indici basati sui dati andamentali; la variabile dipendente è l’indicatore di def ault. Si stimano poi i parametri della relazione: 0 eX P (1D = 1) = f (X) = . 1 + e X0 Esistono poi mappature (calcolate dalle agenzie di rating) che associano ai rating una PD; a grandi linee, tali mappature sono costruite come segue: (i) per ciascuna classe di rating, si calcola il tasso medio di default su un periodo di tempo “lungo”; 32 (ii) si stima una regressione lineare semplice fra il logaritmo del tasso medio di default appena calcolato (variabile dipendente) e il rating (variabile indipendente): log(D̄) = α + βR + ², dove D̄ è il tasso di default medio e R è il rating; (iii) infine, le PD corrispondenti a ciascuna classe di rating sono stimate sulla base della retta di regressione. 4.2 La distribuzione delle perdite La distribuzione di perdita del portafoglio assume un ruolo fondamentale nel credit risk management. La perdita L̃ è una variabile aleatoria definita come segue: L̃ = EAD × LGD × L, dove 1 con prob. π (se la controparte f allisce), L = 1D = 0 con prob. 1 − π (se la controparte non f allisce), D è l’evento “la controparte fallisce in un certo intervallo temporale”, π = P (D) = P D è la probabilità di default relativa al medesimo intervallo temporale. La perdita attesa (Expected Loss) non è altro che il valore atteso di L̃; se si ipotizza che EAD e LGD siano delle costanti, si ha: E(L̃) = EAD × LGD × P (D). Oltre alla perdita attesa ed inattesa, l’altra quantità centrale è il Capitale a Rischio (CaR), dato dalla differenza fra il quantile α e la perdita attesa: CaRα = qα − EL, dove qα : P (L̃ptf ≤ qα ) ≥ α. Quando si passa a trattare un portafoglio di N prestiti, è necessario introdurre la perdita di portafoglio: L̃ptf = N X i=1 L̃i = N X EADi × LGDi × Li . i=1 33 Si verifica facilmente che, se EADi e LGDi sono costanti, la perdita attesa è data da E(L̃ptf ) = N X E(L̃i ) = i=1 N X EADi × LGDi × P Di . i=1 Per analizzare il rischio, al solito, non è sufficiente limitarsi alla perdita attesa; si calcola allora anche la perdita inattesa, definita come la deviazione standard della v.c. L̃: U Lptf v u N q uX = var(L̃) = t EADi EADj LGDi LGDj cov(Li , Lj ). i,j=1 La covarianza fra i default può essere riscritta come segue: q cov(Li , Lj ) = ρij × P Di (1 − P Di )P Dj (1 − P Dj ), dove ρij = corr(1Di , 1Dj ) è la correlazione fra i def ault (default correlation). Quindi (il quadrato della) perdita inattesa è uguale a U L2ptf = var(L̃) = N X q EADi EADj LGDi LGDj DPi (1 − DPi )DPj (1 − DPj )ρij . i,j=1 Nel caso di due soli prestiti, con P D1 = π1 , P D2 = π2 , ρ12 = ρ, LGD1 = LGD2 = EAD1 = EAD2 = 1, si ha p U L2ptf = π1 (1 − π1 ) + π2 (1 − π2 ) + 2ρ π1 (1 − π1 )π2 (1 − π2 ). Consideriamo 3 casi: (i) ρ = 0; diversificazione perfetta. (ii) ρ > 0; il default dell’una incrementa la PD dell’altra. Infatti: P (L2 = 1, L1 = 1) E(L1 L2 ) = = P (L1 = 1) π1 π1 π2 + cov(L1 , L2 ) cov(L1 , L2 ) = = π2 + . π1 π1 P (L2 = 1|L1 = 1) = Dunque, il def ault dell’una ha un impatto sull’altra attività in portafoglio. In particolare, nel caso estremo ρ = 1 e con π1 = π2 = π, si ha p U Lptf = 2 π(1 − π), vale a dire che il portafoglio contiene il rischio di una sola controparte ma con intensità doppia; in questo caso il def ault di una controparte implica il def ault dell’altra con probabilità 1. 34 (iii) ρ < 0; è speculare al caso (ii): il default dell’una diminuisce la PD dell’altra. Prima di analizzare il modello di Merton, che costituisce un fondamentale prerequisito alla studio della correlazione fra i def ault, consideriamo per completezza il caso (poco realistico) di indipendenza fra le v.c. di pedita relative alle singole controparti. Il modello di Bernoulli. Un vettore N -dimensionale L è una statistica di perdita bernoulliana se le sue distribuzioni marginali sono v.c. bernoulliane, vale a dire Li ∼ Bin(1; πi ), dove πi = P Di , i = 1, . . . , N . Le variabili L = PN 0 i=1 Li e L = L/N sono rispettivamente la perdita assoluta e percentuale di portafoglio. (a) Il caso più semplice: controparti indipendenti con PD uniforme. Li ∼ Bin(1; π), (Li )i=1,...,N indipendenti, i = 1, . . . , N. Ne segue che L ∼ Bin(N ; π). (b) Se le controparti sono indipendenti ma con PD diverse, vale a dire Li ∼ Bin(1; πi ), abbiamo E(L) = (Li )i=1,...,N indipendenti, PN i=1 πi , var(L) = PN i=1 πi (1 i = 1, . . . , N, − πi ). Si noti tuttavia che la distribuzione di L in questo caso non è più binomiale. 4.3 Il modello di Merton Il modello di Merton è il principale rappresentante della classe degli asset value models, che spiegano il default con la diminuzione del valore delle attività dell’azienda. Si ipotizza che il processo stocastico delle attività dell’azienda sia un moto browniano geometrico; inoltre, si assume che l’azienda si finanzi tramite un prestito ottenuto da una banca oppure tramite l’emissione di un’obbligazione. Il def ault si verifica sulla base della seguente condizione: se alla scadenza il valore delle attività è insufficiente a rimborsare i creditori, l’azienda fallisce. In particolare, Robert Merton introduce, nel 1974, un modello fondato su una struttura finanziaria semplificata dell’impresa debitrice: attivo (At ) 35 finanziato con capitale di rischio (Et ) ed una passività (un’obbligazione oppure un prestito concesso da una banca) con valore di mercato Dt e valore di rimborso F : At = Et + Dt , t ∈ [0, T ]. Per il detentore del debito, il rischio consiste nella probabilità che alla scadenza T il valore dell’attivo (AT ) sia inferiore al valore di rimborso del prestito (F ); tale rischio sarà dunque misurato dalla probabilità P (AT < F ). La probabilità in questione, che rappresenta la PD dell’impresa, è tanto maggiore quanto più: - il rapporto F/A0 è alto; - la volatilità del rendimento delle attività dell’impresa (σA ) è alta; - la scadenza T è lontana. Al tempo 0 si ha A0 = E0 + D0 . Si può inoltre affermare che P (AT < F ) > 0 ⇐⇒ D0 = F e−(r+πr )T ⇐⇒ D0 < F e−rT , dove r è il tasso di interesse risk-free e πr è il premio al rischio. Le equivalenze in questione devono essere valide perché il detentore del debito vuole una compensazione per il rischio che si assume. Si noti che, sfruttando l’ipotesi di moto browniano geometrico delle attività dell’azienda e applicando il lemma di Itô, si ricava che la distribuzione dell’attivo al tempo t è data da At = A0 emt+σA Zt , 2 /2, Z ∼ N (0, t) e µ è il tasso di rendimento dell’attivo dove m = µ − σA t dell’impresa. Quindi ¶ µ µ µ ¶ ¶ log(F/A0 ) − mT F √ − mT = Φ pT = P (AT < F ) = P σA ZT < log . A0 σA T (20) Il payout alla scadenza del detentore del debito è pari a min{AT − F, 0}, che è il payout di una posizione corta in un’opzione put europea su A con strike F e scadenza T . Come può il detentore del debito coprire tale rischio di credito? Non è difficile verificare che la protezione è data dall’assunzione di una posizione lunga (acquisto) in un’opzione put su A con strike F e scadenza T . In tal caso infatti, alla scadenza T , il payout del detentore del 36 debito è comunque F , a prescindere dal fatto che l’azienda fallisca o meno; cashf low e payout del detentore del debito sono riassunti nella seguente tabella. Valore attivo t=0 A0 Cashflow Payout debt holder debt holder −D0 (prestito denaro) −D0 − P0 −P0 (acquisto put) t=T AT < F AT (recovery) F F − AT (payout put) t=T AT ≥ F F (nominale) F 0 (opzione scade senza valore) Dunque, considerando anche la copertura ottenuta tramite l’acquisto dell’opzione, il portafoglio del detentore del debito è costituito da un’opzione put e da un prestito. Il suo valore in t = 0 è dato da D0 + P0 (A0 , σA , F, T, r) ed abbiamo appena verificato che il suo payout risk-free è F . Dal momento che abbiamo assunto valide le ipotesi alla base della formula di Black & Scholes, ed in particolare il principio di non arbitraggio, il tasso al quale deve essere scontato il payout del portafoglio è il tasso risk-free. Ne segue che: D0 + P0 (A0 , σA , F, T, r) = F e−rT , ovvero D0 = F e−rT − P0 (A0 , σA , F, T, r). In conclusione, il valore scontato del debito è il valore scontato (al tasso riskfree) del nominale meno il prezzo dell’opzione put necessaria per coprirsi dal rischio di credito. Abbiamo cosı̀ interpretato una delle componenti del bilancio dell’azienda dal punto di vista della teoria delle opzioni. L’aspetto rilevante del modello consiste nel fatto che anche l’altra componente, vale a dire il capitale di rischio, è suscettibile di un’interpretazione analoga: se alla scadenza AT ≥ F , gli azionisti hanno il diritto di liquidare l’azienda, cioè di ripagare il 37 debito e assumere la proprietà delle attività rimanenti. In particolare, alla scadenza T le uniche due possibilità sono le seguenti: (i) AT < F : dal momento che il valore delle attività non è sufficiente a ripagare i detentori del debito, si verifica il def ault; non ci sono attività che possano essere acquisite dagli azionisti, il cui payof f è nullo; (ii) AT ≥ F : in questo caso se gli azionisti liquidano l’azienda ne ricavano, dopo aver rimborsato i detentori del debito, un profitto netto pari ad AT − F . Riunendo i due casi in una singola formula, si ha che il payof f netto degli azionisti è dato da max{AT −F, 0}; questo è il ben noto payof f di un’opzione call europea su A con strike F e scadenza T , il cui prezzo a t = 0, che indichiamo con E0 = C0 (A0 , σA , F, T, r), può essere calcolato tramite la formula di Black & Scholes. Riassumendo, dal punto di vista dell’azienda il capitale di rischio può essere descritto dalla vendita di un’opzione call agli azionisti; la posizione degli azionisti è una call lunga sull’attivo dell’azienda. I risultati fin qui ottenuti, tuttavia, non risolvono il problema principale che caratterizza i modelli a valore dell’attivo: il processo del valore dell’attivo non è osservabile. D’altra parte, ciò che è osservabile sul mercato è il valore del capitale di rischio, e dunque non sorprende che la ricerca si sia ben presto concentrata sul problema di ricavare il valore dell’attivo dal valore dell’equity. La soluzione proposta da Merton (1974) è stata successivamente estesa ed integrata sia dal punto di vista teorico che da quello applicativo; anticipando fin d’ora un caso particolarmente importante, il modello di Moody’s|KMV si discosta, nel calcolo delle probabilità di def ault, dal modello di Merton, che è basato su ipotesi piuttosto restrittive. Si osservi che il processo del valore dell’equity è osservabile ed è dato dalla capitalizzazione di mercato; sulla base di dati di mercato si può anche stimare la volatilità σE dell’equity; un’altra informazione disponibile è il valore contabile delle passività. Sulla base di questi tre elementi (valore di mercato dell’equity, volatilità dell’equity e valore contabile delle passività), 38 si vuole inferire il processo del valore dell’attivo At . Ora, si è visto che l’equity può essere visto come un’opzione call sull’attivo dell’azienda, in possesso degli azionisti. Lo strike F è determinato dal valore contabile delle passività e la scadenza è posta uguale all’orizzonte temporale considerato (tipicamente pari ad un anno). Sulla base di tale interpretazione si ha Et = Ct (At , σA , F, T, r), t ∈ [0, T ]. Tale formula può essere invertita, in modo tale da trovare la soluzione per At , che risulterà essere funzione di σA , F, T e r. Risulta quindi evidente che resta da risolvere un’ultima difficoltà: dal momento che il processo del valore dell’attivo non è osservabile, anche la sua volatilità è ignota. La derivazione della volatilità dell’attivo utilizza vari risultati del calcolo stocastico, e la sua formalizzazione matematica presenta una notevole complessità; in questa sede sarà sufficiente precisare che essa può essere ricavata a partire dal valore dell’equity e dalla sua volatilità. Pregi: (i) identifica con precisione le variabili rilevanti per la determinazione della PD: rapporto fra valore del debito e valore dell’attivo, volatilità del valore dell’attivo; (ii) permette di ricavare in modo oggettivo la PD e il rendimento da richiedere a fronte della concessione di un prestito. Difetti: (i) ipotizza un’unica forma di passività; (ii) indaga solo il rischio di insolvenza; (iii) At e σA non sono osservabili sul mercato; (iv) si basa sulle ipotesi della formula di B&S; in particolare, le ipotesi di costanza del tasso di interesse risk-free e di mercato perfetto (che implica l’immediata eliminazione delle possibilità di arbitraggio), sono alquanto irrealistiche; (v) la barriera di def ault è costante. 39 Infine, è necessario un chiarimento per quanto riguarda la PD (20). A seconda dello scopo che ci si prefigge, essa può essere calcolata in due modi diversi. 1. Se lo scopo è il pricing, per esempio di un bond soggetto a rischio di credito, allora è necessaria la probabilità risk-neutral: ³ ´ σ2 log(F/A0 ) − r − 2A T , √ pT = P (AT < F ) = Φ σA T (21) dove r è il tasso di interesse risk-free. Ciò è dato dal fatto che il modello di Merton utilizza la formula di B&S per prezzare il prestito e l’equity, e dunque, per quanto attiene il pricing, “vive” in un mondo risk-neutral. Per inciso, il prezzo al tempo 0 di un bond zero-coupon con scadenza T soggetto a rischio di credito è dato da v(0, T ) = vrf (0, T )[(1 − LGD) + LGD · (1 − pT )], dove vrf (0, T ) è il prezzo di uno zero-coupon risk-free con la stessa scadenza e pT è la P D (21), vale a dire la P D risk-neutral relativa al periodo (0, T ). 2. Se invece l’obiettivo consiste in calcolare la PD “reale”, come accade normalmente per scopi di risk management, allora è necessario calcolare la PD effettiva: ³ log(F/A0 ) − µ − √ pT = P (AT < F ) = Φ σA T 2 σA 2 ´ T , dove µ è il tasso di rendimento atteso dell’attivo dell’impresa. Osservazione. Riassumiamo le conclusioni del modello di Merton. (1) Il detentore del debito ha una posizione corta in un’opzione put europea su A con strike F e scadenza T ; il valore del debito è pari a: Dt = F e−r(T −t) − Pt (At , σA , F, T − t, r). (22) (2) Il detentore del capitale di rischio ha una posizione lunga in un’opzione call europea su A con strike F e scadenza T : Et = Ct (At , σA , F, T − t, r). 40 (23) Considerando che un aumento della volatilità causa un aumento del prezzo sia della put che della call, ne segue che detentori del debito e del capitale di rischio avranno preferenze per il rischio contrastanti: i detentori del debito preferiranno bassa volatilità, perché cosı̀ sarà meno probabile che l’opzione venga esercitata alla scadenza; gli azionisti preferiranno alta volatilità, perché cosı̀ il guadagno associato alla posizione lunga nell’opzione call sarà più alto. Da un punto di vista logico i passi da seguire per applicare il modello sono i seguenti: (i) stimare la volatilità dell’attivo σA sulla base di valore contabile delle passività, valore di mercato dell’equity e volatilità dell’equity; (ii) invertire la (22) per ottenere At o, più precisamente, µ, che determina completamente, assieme alla volatilità σA , il processo At ; si noti che questo passo è necessario solo per calcolare la “vera” PD. (iii) utilizzare la (23) per prezzare il debito dell’azienda. 4.4 La correlazione fra i default Le versioni (a) e (b) del modello bernoulliano presentate in precedenza sono entrambe irrealistiche, in quanto non è plausibile ipotizzare che i def ault siano indipendenti. E’ quindi necessario introdurre modelli più complessi. Osservazione. Perché non si può continuare ad utilizzare il modello Bernoulliano introdotto in precedenza ipotizzando che le v.c. Li siano correlate? Perché dovremmo stimare una matrice di correlazione enorme con poche osservazioni (default). Dunque il problema è legato alla disponibilità di dati. Problema: costruire un modello per la distribuzione del valore totale del portafoglio. Il P&L di un portafoglio è volatile; come spiegare le perdite? Le possibilità sono essenzialmente due: (a) Cattive condizioni economiche generali; (b) condizioni economiche generali buone, ma un singolo importante default; 41 Nel primo caso esiste un fattore comune che spiega la perdita (rischio sistematico); il secondo è un esempio di rischio idiosincratico. Cerchiamo allora di capire meglio la struttura della dipendenza fra i def ault. E’ ragionevole supporre che in un certo stato dell’economia i def ault siano indipendenti (indipendenza condizionata), ma nel lungo periodo (unconditionally) non lo siano. A tale proposito, consideriamo le possibili cause di default. 1. Sistematiche (condizioni di ambiente / mercato): • macroeconomiche globali; • macroeconomiche nazionali e regionali; • settoriali; 2. Non sistematiche (condizioni specifiche del debitore): • posizionamento nel mercato / settore; • solidità della struttura finanziaria; • comportamento (qualità del management). Nell’analisi del rischio di un portafoglio crediti, dobbiamo considerare: (i) la distribuzione non condizionata delle perdite sull’intero ciclo, cioè la probabilità che una data perdita si realizzi in un periodo del ciclo “scelto a caso” (stimata “senza conoscere” lo stato dell’economia); (ii) la distribuzione condizionata al verificarsi di un determinato stato dell’economia, cioè la probabilità di una data perdita nel periodo in cui si verifica quel determinato stato. Stimando oggi in base alla distribuzione delle insolvenze cumulate sul periodo da oggi a coprire un intero ciclo, si ottengono: • distribuzione non condizionata; • PD e rating di lungo periodo (through the cycle). Stimando oggi in base alla distribuzione delle insolvenze in un periodo, si ottengono: 42 • distribuzione condizionata allo stato dell’economia osservato (o presunto) oggi; • PD e rating point in time. In caso di portafogli con elevatissimo frazionamento (es. fidi su carte di credito, mutui retail) il rischio non sistematico della distribuzione condizionata tende ad essere irrilevante: l’uso di valori medi di PD è ragionevolmente accurato, grazie alla compensazione tra errori di approssimazione di segno opposto. Questa ipotesi è più realistica se si lavora con portafogli poco esposti al rischio sistematico come tende a verificarsi ancora nel retail (ciò riduce alla radice il problema di corretta specificazione del modello). In situazioni di frazionamento elevato ma non estremo (es. prestiti a medie imprese) la presenza di rischio non sistematico è rilevante. In caso di portafogli concentrati (es. prestiti large corporate) questo aspetto è di importanza cruciale. 4.5 Il modello a mistura bernoulliana E’ l’estensione al continuo del modello introdotto in precedenza. Statistica di perdita L = (L1 , . . . , LN )0 , Li ∼ Bin(1, Pi ), dove ora Pi è una variabile casuale: P = (P1 , . . . , PN )0 ∼ F . Data una realizzazione p = (p1 , . . . , pN )0 di P, le variabili L1 , . . . , LN sono indipendenti. Formalmente: (Li |Pi = pi ) ∼ Bin(1; pi ), (Li |P = p)i=1,...,N indipendenti. Distribuzione condizionata congiunta delle variabili Li : P (L1 = l1 , . . . , LN = lN |P = p) = N Y plii (1 − pi )1−li . i=1 Ricordando che, per esempio nel caso discreto, P (X = x|Y = y)P (Y = y) = P (X = x, Y = y), P (X = x) = M X P (X = x, Y = yj ) = j=1 M X P (X = x|Y = yj )P (Y = yj ), j=1 (24) 43 dove M è il numero di valori assunti da Y , la distribuzione non condizionata delle variabili Li si ottiene sommando: P (L1 = l1 , . . . , LN = lN ) = M Y N X pliji (1 − pij )1−li · pij , j=1 i=1 dove M = # stati del mondo. Nel caso continuo si tratta semplicemente di integrare anziché sommare: Z P (L1 = l1 , . . . , LN = lN ) = N Y [0,1]N plii (1 − pi )1−li f (p1 , . . . , pN )dp1 · · · dpN , i=1 dove li ∈ {0, 1}. Esempio (v. file esempio PD.xls). In questo caso il prodotto delle probabilità di default medie delle singole classi è minore o uguale alla probabilità congiunta di default. Poiché P (LAAA = 1 ∩ LBBB = 1) = E(LAAA LBBB ) > P (LAAA = 1) · P (LBBB = 1) = = E(LAAA ) · E(LBBB ), e ricordando che cov(LAAA LBBB ) = E(LAAA LBBB ) − E(LAAA ) · E(LBBB ), se ne deduce che cov(LAAA LBBB ) > 0 e quindi anche corr(LAAA LBBB ) > 0. Default correlation vs. asset correlation. Il coefficiente di correlazione lineare fra le v.c. Li e Lj (noto in questo caso come default correlation) è dato da cov(Li Lj ) E(Lij ) − E(Li )E(Lj ) pij − pi pj ρD = p =p =p . var(Li )var(Lj ) pi (1 − pi )pj (1 − pj ) pi (1 − pi )pj (1 − pj ) Assumendo che per l’evoluzione nel tempo dei rendimenti normalizzati dell’attivo valga il modello di Merton si ha: r ∼ NN (0, R), dove R è la matrice di correlazione dei rendimenti, pi = E(Li ) = E(1{ri <fi } ) = P (ri < fi ) (dove fi = log(Fi /A0 )), pij = P (ri < fi , rj < fj ), da cui si ricava la default correlation: pij − pi pj . pi (1 − pi )pj (1 − pj ) ρD ij = p 44 D’altra parte le v.c. ri , rj hanno distribuzione congiunta normale bivariata con correlazione Rij . Quindi Z pij = Z fi −∞ fj −∞ fRij (ri , rj )dri drj , dove fRij (·) è la densità normale bivariata di valore atteso nullo, varianza unitaria e covarianza Rij . Dunque la correlazione dei rendimenti influenza la correlazione dei default in quanto “entra” nella PD congiunta pij . Per esempio, con N = 2, R12 = R e p1 = p2 = .01, si ottiene R ρD 0.1 0.0094 0.2 0.0241 0.3 0.0461 In generale: asset correlation molto maggiore di default correlation! 4.6 Il modello fattoriale (i) fattori latenti determinano la perdita media nel mercato o in alcuni suoi settori; in un portafoglio sufficientemente grande, la perdita è determinata solo dallo stato di questi fattori; (ii) condizionatamente a tali fattori, perdite su singoli asset sono indipendenti; (iii) anche conoscendo i valori assunti dai fattori (cioè lo stato del mondo), non conosciamo esattamente la perdita sul nostro portafoglio; (iv) l’errore è dato dal rischio idiosincratico, la cui rilevanza cresce: (a) quando il portafoglio è piccolo; (b) quando il portafoglio contiene alcune esposizioni molto grandi. Ingredienti necessari per costruire un modello di portafoglio: 45 (i) la specificazione degli stati del mondo, cioè quali valori i fattori possono assumere e con quali probabilità (in generale si tratta di una distribuzione continua); (ii) la specificazione della funzione che individua la probabilità di default condizionata. Il modello fattoriale da un punto di vista statistico. Il modello fattoriale è un modello statistico che si prefigge di spiegare la correlazione fra N variabili tramite K < N fattori sottostanti. Per l’i-esima variabile casuale si ha ri = K X Rij Yj + Zi , i = 1, . . . , N. j=1 Tuttavia la specificità del modello si apprezza analizzando il caso multivariato: r = (N × 1) R Y + (N × K) (K × 1) Z, (N × 1) 2 )) e corr(Y, Z) = I . La dove Y ∼ NK (0, I), Z ∼ NN (0, diag(σ12 , . . . , σN N 2 ), si noti matrice R contiene i pesi dei fattori. Posto Σ = diag(σ12 , . . . , σN che cov(r) = RR0 + Σ, Parametri da stimare: R e Σ. Ne segue che il numero di parametri da stimare si riduce considerevolmente. In particolare, var(ri ) = K X 2 Rij + σi2 , i = 1, . . . , N. j=1 Dunque la varianza dell’i-esima variabile è data dalla somma di una parte “condivisa” con le altre variabili tramite i fattori comuni e di una parte specifica (unica per l’i-esima variabile). Si noti infine che il Capital Asset Pricing Model è un modello fattoriale in cui K = 1. Il fattore è il rendimento del portafoglio di mercato: ri − rf = βi (rM − rf ) + Zi , 46 i = 1, . . . , N, 2 ), Z ∼ N (0, σ 2 ). Quindi var(r ) = dove rf è il tasso risk-free, rM ∼ N (0, σM i i i 2 + σ 2 ; nel caso multivariato: βi2 σM i r − rf = B(rM − rf ) + Z, dove, in aggiunta alle ipotesi già esplicitate, cov(rM , Zi ) = 0 e cov(Zi , Zj ) = 2 . 0. Ne segue che cov(ri , rj ) = βi βj σM 4.7 Il modello di Vasicek Il modello fattoriale “più semplice”, nonché il modello regolamentare, è il modello bernoulliano ad un fattore con probabilità di default e correlazione uniformi, introdotto da Vasicek nel 1987. Il singolo fattore rappresenta le condizioni economiche generali. Ipotesi del modello di Vasicek (i) Il modello si basa su un solo fattore ed ipotizza correlazione uniforme: ri = √ √ RY + 1 − RZi . Inoltre: (ii) ri ∼ N (0, 1), (iii) Y ∼ N (0, 1), (v) cov(Zi , Zj ) = 0, (iv) Zi ∼ N (0, 1), (vi) cov(Y, Zi ) = 0. Ne segue che (i) corr(ri , rj ) = R; (ii) cov(ri , Y ) = √ R; (iii) var(ri ) rischio totale = R · var(Yi ) rischio sistematico + (1 − R) · var(Zi ). rischio specif ico R esprime la percentuale di rischio spiegata dal fattore ed è quindi interpretabile come coefficiente di determinazione di un modello di regressione ⇒ analogo al CAPM! 47 Nel setup del modello di Merton si ha dunque: ri < fi ⇐⇒ √ √ 1 − RZi < fi − RY, i = 1, . . . , N. Poiché pi = Φ(fi ), si ha che fi = Φ−1 (pi ), e quindi la condizione precedente diventa √ √ √ √ 1 − RZi < fi − RY ⇐⇒ 1 − RZi < Φ−1 (pi ) − RY, oppure √ Φ−1 (pi ) − RY √ Zi < . 1−R Dato il valore del fattore Y , la probabilità condizionata di default per la singola controparte è infine data da: à def pi (Y ) = P (ri < fi |Y = y) = P ! à ! √ √ fi − R · y fi − R · y √ =Φ , Zi < √ 1−R 1−R (25) dove fi = Φ−1 (pi ). Si noti che la (25) è la formula utilizzata nel modello Basilea 2 per determinare il requisito di capitale. Infatti Ki = LGDi · p(Y )i,stress − LGDi · pi , dove p(Y )i,stress è data dalla (25) con un valore “negativo” di y: y = Φ−1 (0.001): ! à ! à √ √ fi − R · y fi − R · Φ−1 (0.001) √ √ =Φ . p(Y )i,stress = P Zi < 1−R 1−R Osservazioni. (i) R = 0 ⇒ pi (Y ) = Φ(Φ−1 (pi )) = pi ; C’è solo rischio specifico! (ii) p(Y ) = 1 R=1⇒ p(Y ) = 0 C’è solo rischio sistematico! 48 (quando y < fi ) (quando y > fi ); La PD condizionata come funzione di Y (p = 0.003, R = 0.2) La PD condizionata come funzione di p (R = 0.2, Y = −3) 1 0.8 0.6 0.4 0.2 −2 −1 0 1 2 3 0 4 La PD condizionata come funzione di p (R = 0.2, Y = 0) 0 0.2 0.4 0.6 0.8 1 La PD condizionata come funzione di p (R = 0.2, Y = 3) 1 0.8 0.6 0.4 0.2 0.2 0.4 0.6 0.8 0 1 0 0.2 0.4 0.6 0.8 1 (iii) in generale, cioè per R ∈ (0, 1), la probabilità di default unconditional si ottiene “mediando” rispetto ai possibili valori del fattore, vale a dire, formalmente, integrando rispetto alla distribuzione del fattore: Z pi = EY (pi (Y )) = pi (y)φ(y)dy. R L’evoluzione della probabilità condizionata p(Y ) in funzione di Y (cioè dello stato dell’economia) e di p è rappresentata nella figura seguente. 4.8 La distribuzione delle perdite per il portafoglio PN Introduciamo ora la perdita percentuale di portafoglio L(N ) = i=1 wi · Pp LGDi · Li , dove wi = EADi /( i=1 EADi ). Il contributo fondamentale di Vasicek è consistito nell’aver dimostrato che in un portafoglio con PD e correlazione uniformi, vale a dire pi = p, Ri = R (i = 1, . . . , N ), la conditional percentage loss distribution converge all’aumentare di N e che la forma limite è p(Y ): à lim L N →∞ (N ) def = L = p(Y ) = Φ ! √ f − R·Y √ , 1−R Osservazioni. 49 dove f = Φ−1 (p). (26) 1. (p = 0.003, R = 0.0001) 2. (p = 0.003, R = 0.05) 5000 4000 3. (p = 0.003, R = 0.2) 300 1200 250 1000 200 800 150 600 100 400 3000 2000 1000 0 50 0 0.005 0.01 0.015 0.02 0 200 0 0.005 0.01 0.015 0.02 0 0 5 10 15 20 −3 x 10 4. (p = 0.003, R = 0.9999) 5. (p = 0.01, R = 0.05) 500 100 400 80 300 60 200 40 100 20 6. (p = 0.05, R = 0.05) 20 15 10 0 0 0.2 0.4 0.6 0.8 1 0 5 0 0.01 0.02 0.03 0.04 0 0 0.05 0.1 0.15 0.2 (a) Nella distribuzione limite, l’aleatorietà della perdita percentuale di portafoglio dipende solo dall’aleatorietà del fattore Y ; in altre parole, aumentando il numero di controparti il rischio specifico è completamente eliminato. (b) Il risultato espresso dalla (26) non dipende dalla particolare distribuzione di probabilità scelta per il fattore Y ; tuttavia, sotto l’ipotesi Y ∼ N (0, 1), la densità di p(Y ) si ricava in forma chiusa, che dipende dai due parametri p e R e che indicheremo con fp,R (·); è di particolare interesse esaminare in dettaglio quattro casi limite. (i) R = 0 ⇒ limN →∞ fp,0 = δp , dove δp identifica una distribuzione di probabilità degenere, cioè una distribuzione di probabilità che assume il valore p con probabilità 1. Ciò significa che per N → ∞ siamo certi che la perdita percentuale di portafoglio è uguale a p; (ii) R = 1 ⇒ fp,1 = Bin(1; p); in altri termini, per ogni N possiamo rimpiazzare la perdita percentuale di portafoglio con L1 ∼ Bin(1; p) ed è dunque ovvio che anche L = Bin(1; p); (iii) p = 0 ⇒ f0,R = δ0 ; tutte le controparti sopravvivono con certezza; (iv) p = 1 ⇒ f1,R = δ1 ; tutte le controparti falliscono con certezza. 50 Per la distribuzione L è molto semplice calcolare Expected Loss, Unexpected Loss e Capitale a Rischio, in quanto sia il valore atteso che i quantili sono calcolabili analiticamente; in particolare il quantile α è dato da à ! √ Φ−1 (p) − R · qα (Y ) √ qα (L) = Φ , 1−R dove qα (Y ) è il quantile α di Y , e valore atteso e varianza sono dati da E(L) = p, var(L) = Φ2 (Φ−1 (p), Φ−1 (p); R), dove Φ2 (·, ·; R) è la funzione di ripartizione della normale bivariata con valore atteso nullo, varianza unitaria e correlazione R. 51