Corso di Statistica Aziendale APPUNTI SULL’ANALISI STATISTICA DEI BILANCI Laura Grassini 1. Il bilancio e gli indici di bilancio Introduzione 1.1 Lo stato patrimoniale 1.2 Il conto economico 1.3 Indici di bilancio 1.4 Schemi per l’interpretazione degli indici di bilancio 1 3 7 11 16 2. L’analisi statistica dei dati di bilancio. Introduzione e analisi univariata Introduzione 2.1 Comparazioni di bilancio e analisi statistica 2.2 Analisi univariata: i valori medi 2.3 Caratteristiche delle distribuzioni empiriche dei ratio 19 19 21 26 3 Analisi statistica multivariata dei dati di bilancio. Applicazione delle componenti principali per un’analisi della concorrenza 3.1 Presupposti teorici 29 3.2 L’analisi statistica: aspetti generali 30 3.3 Analisi preliminare dei dati 33 3.4 L’analisi in componenti principali (ACP) 34 I 4. Analisi statistica multivariata dei dati di bilancio. Modelli statistici per la previsione delle insolvenze. Un caso di studio Introduzione 41 4.1 Premesse teoriche generali: insolvenza e cause di insolvenza 43 4.2 Analisi statistica dei bilanci e insolvenza: una breve rassegna 45 4.3 L’analisi discriminante per lo studio dell’insolvenza 50 4.4 Un caso di studio 57 5. Nota metodologica. Analisi delle componenti principali (ACP) Introduzione 5.1 Aspetti algebrici coinvolti nell’ACP 5.2 L’ACP 5.3 La scelta del numero di componenti 5.4 Interpretazione delle componenti selezionate 5.5 ACP: matrice S o matrice R ? 5.6 Esempi numerici 65 65 66 69 70 71 73 6. Nota metodologica. Analisi discriminante (AD) Introduzione 6.1 Analisi discriminante e problemi classificatori 6.1.1 Teoria decisionale 6.1.2 La funzione discriminante 6.1.3 Funzione discriminante e AD normale 6.1.4 Funzione discriminante e AD logistica 6.2 Stima della funzione discriminante (AD normale) 6.3 Verifica della capacità classificatoria della funzione discriminante 6.4 Esempio numerico 79 80 80 82 84 86 87 89 91 Bibliografia 95 Siti Internet di interesse 97 II Indici di bilancio 1. 1 Il bilancio e gli indici di bilancio Introduzione 1.1 Lo stato patrimoniale 1.2 Il conto economico 1.3 Indici di bilancio 1.4 Schemi per l’interpretazione degli indici di bilancio Introduzione L'analisi di bilancio è quel complesso di elaborazioni svolte sul bilancio per interpretarne i dati, allo scopo di valutare la situazione (economica, finanziaria, reddituale) in cui un'azienda si trova e per prendere decisioni sulle gestioni e strategie future. Infatti, l'analisi di bilancio è sia strumento di analisi consuntiva (e quindi opera sui bilanci di fine esercizio) sia strumento di analisi prospettica quando opera sui budget alternativi che un'azienda può prefigurare. L'analisi di bilancio presuppone la possibilità di operare comparazioni nel tempo (per studiare la dinamica aziendale), nello spazio (analisi di settore, della concorrenza, etc.). E’ importante sottolineare che le analisi e le comparazioni di bilancio hanno un diverso grado di estensione e di profondità in relazione agli obiettivi dei soggetti per i quali si compie l’analisi, e all’accessibilità ai dati interni contabili ed extracontabili. Oggetto dell'analisi di bilancio sono: - lo stato patrimoniale, che registra la consistenza delle fonti e degli impieghi del patrimonio aziendale alla fine di ogni periodo contabile (gli stock al 31/12 di ogni anno), e che informa sulla capacità dell'azienda a fronteggiare gli impegni finanziari; - il conto economico che riporta i flussi di ricavo e di costo dell'esercizio (periodo annuale) e che informa sulla capacità dell'azienda a produrre reddito, sull’economicità dell’attività produttiva, ecc. 2 - Indici di bilancio la nota integrativa che informa su aspetti quali: i criteri di valutazione di alcune poste contabili, e che ha lo scopo di rendere più trasparente il bilancio. L'analisi di bilancio richiede i seguenti presupposti: (1) presupposti oggettivi connessi alla qualità dei dati di bilancio (trasparenza) e (2) presupposti soggettivi relativi alla preparazione e posizione dell'analista. Sul punto (1) dobbiamo dire che molti miglioramenti sono stati ottenuti attraverso il recepimento della IV e della VII Direttiva CEE mediante il d.l. n. 127 del 9/4/91 (che ha determinato la modifica degli articoli 2424 e 2425 del Codice Civile). Tuttavia, per condurre una significativa analisi è necessario operare degli aggiustamenti (detti riclassificazioni) nelle poste di bilancio per ricondurci ai principali schemi interpretativi suggeriti dagli studiosi di economia aziendale. Sul punto (2) si tende a distinguere fra analisi interna (ovvero effettuata dall'azienda sulla propria gestione) e esterna (ovvero effettuata da un organismo esterno all'azienda). Chiaramente si configurano situazioni informative molto diverse che, nel caso di analisi esterna, dipendono fortemente dalla forza contrattuale dell'ente esterno. Le tecniche più usate per l'analisi di bilancio si basano sulla determinazione di rapporti (o ratios da cui il termine anglosassone financial ratio analysis) o differenze fra poste contabili allo scopo di costruire indicatori significativi della situazione aziendale, nei vari aspetti operativi, finanziari, come meglio vedremo in seguito. I principali limiti dell'analisi di bilancio vanno ricondotti a: 1) staticità del bilancio e quindi limiti nella rappresentazione di realtà a meno di non disporre di serie storiche di bilanci (di regola annuali o, più raramente, infra-annuali); 2) problema della qualità del dato nel senso della rilevanza teorica (che significato informativo ha un determinato indice?) e dell'accuratezza (le poste di bilancio che si usano per calcolare l’indice di bilancio sono accurate?)1; 1 Per ‘rilevanza teorica’ intendiamo la pertinenza della grandezza empirica (es. il rapporto di bilancio) nel misurare un determinato elemento definito in via teorica Indici di bilancio 3 3) problemi legati alla comparabilità dei bilanci nel tempo e fra più aziende. In questo capitolo esamineremo la struttura del bilancio prevista dalla legge e introdurremo gli schemi interpretativi più usati (sia per lo stato patrimoniale sia per il conto economico). La descrizione del bilancio viene fatta con riferimento anche al problema della qualità del dato poiché si tratta di interpretare e utilizzare i dati amministrativi a fini informativi e cioè ai fini della costruzione indicatori o modelli di comportamento significativi. 1.1 Lo stato patrimoniale La struttura dello Stato Patrimoniale dettata dalle norme tende a distinguere aree di valori secondo il grado di liquidità ovvero di esigibilità dei crediti (sezione attivo) e di estinzione dei debiti (sezione passivo). Tab. 1.1.1 Stato patrimoniale (da art. 2424 Codice Civile) ATTIVO (impieghi) PASSIVO (fonti) A) Crediti vs. soci A) Patrimonio netto I Capitale B) Immobilizzazioni II-VII Riserve I Materiali IX Utile (perdita) II Immateriali B) Fondi rischi e oneri III Finanziarie C) Disponibilità I Rimanenze II Crediti III Att. fin. non immob. IV Disponibilità liquide D) Ratei e risconti TOTALE ATTIVO C) Tratt. fine rapporto (TFR) D) Debiti E) Ratei e risconti TOTALE PASSIVO Questa struttura si ispira ad uno schema interpretativo che consente una distinzione delle poste rispetto al grado di liquidità ovvero al (es. la redditività). Per accuratezza intendiamo, in questo caso, la correttezza delle poste contabili registrate sul bilancio. Accuratezza e rilevanza teorica sono caratteristiche che definiscono la qualità del dato contabile come informazione statistica. 4 Indici di bilancio tempo per il compimento della rotazione da posizione non numeraria a posizione numeraria, che determina il cosiddetto ciclo operativo. Ciò, relativamente alla sezione attivo, è descritto nello schema seguente da cui si deduce che per tempo breve si dovrebbe intendere il periodo della durata del ciclo operativo (che comprende tutte le fasi: dall’acquisizione di materiali all’esecuzione monetaria dei crediti). Accade, tuttavia, che il ciclo operativo muti fortemente in funzione del tipo di attività svolta dall'azienda. Si adotta, pertanto, un ciclo convenzionale di durata uguale all'esercizio contabile. Fig. 1.1.1 Ciclo operativo e sezione dell’attivo IMPIEGHI NUMERARI (cassa) 2° realizzo investimento IMPIEGHI NON NUMERARI (fattori produttivi) IMPIEGHI NUMERARI (crediti) 1° realizzo trasformazione IMPIEGHI NON NUMERA (prodotto) In base al concetto di ciclo operativo, la struttura dell'attivo viene così distinta in: • attivo fisso: realizzo oltre il tempo breve; • attivo (capitale) circolante (anche attivo corrente): che comprende l’attivo a breve termine (le cosiddette disponibilità) e la liquidità immediata. La composizione dell’attivo fisso è descritta nella Tab. 1.1.2. Brevemente, si ricorda che le immobilizzazioni tecniche riguardano la specifica attività dell'azienda (es. locali dove si svolge la produzione) mentre le immobilizzazioni patrimoniali riguardano attività collaterali che non sono direttamente connesse con la produzione (es. affitto di abitazioni civili in possesso dell’azienda); Indici di bilancio 5 La voce fondo ammortamento contiene gli accantonamenti di fondi che vengono accumulati negli anni per recuperare il valore delle immobilizzazioni che, col tempo si deprezzano (es. gli impianti). Nella vecchia normativa, il fondo ammortamento compariva nella sezione passiva mentre attualmente esso è inserito, col segno negativo, nell'attivo patrimoniale ed è riferito specificatamente ad ogni cespite ammortizzabile. Il fondo ammortamento va così a diminuire il valore delle immobilizzazioni, fornendo il cosiddetto attivo fisso netto (immobilizzazioni nette). Tab. 1.1.2 Composizione dell’attivo fisso Immobilizzazioni Immobilizzazioni tecniche finanziarie partecipazioni Materiali: crediti medio/lungo terreni fabbricati – fondi svalutazione attrezzature mobili ufficio – fondo ammortamento Immateriali: ricerca e sviluppo pubblicità licenze diritti su brevetti – fondo ammortamento Immobilizzazioni patrimoniali terreni immobili civili – fondo ammortamento La Tab. 1.1.3 descrive la composizione dell'attivo circolante. Ovviamente, la somma dell’attivo fisso e dell’attivo circolante fornisce il totale attivo. 6 Indici di bilancio Tab. 1.1.4 Composizione dell'attivo circolante Magazzino Liquidità differita materie crediti vs. clienti prodotti finiti e non finiti ratei attivi anticipi a fornitori altri crediti a breve risconti attivi – anticipi a clienti – fondi svalutazione – fondi svalutazione Liquidità immediata denaro in cassa depositi in banca (c/c, etc.) assimilati denaro – fondi svalutazione Analogamente a quanto fatto per la sezione attivo, lo schema interpretativo della sezione passivo dello stato patrimoniale si ispira al criterio del tempo di estinzione dei debiti. Tab. 1.1.4 Composizione del passivo (fonti) Passivo stabile Passivo consolidato (mezzi propri) (capitale di credito a medio e lungo termine) capitale di rischio mutui riserve di capitale presiti obbligazionari riserve di utili fondo TFR debiti operativi medio/lungo Passivo corrente (capitale di credito a breve) debiti vs. fornitori ratei passivi debiti fin. a breve quote a breve TFR utile da distribuire Confrontando gli schemi interpretativi con quello che riproduce la struttura dello Stato Patrimoniale dettata dalla normativa vigente (v. Tab. 1.1.1), si deduce che tale struttura riesce solo in parte a rispettare detti schemi. Infatti, nella pratica corrente, ai fini dell'analisi di bilancio, è necessario ricorrere a correzioni delle poste, dette riclassificazioni. Queste operazioni hanno lo scopo di garantire essenzialmente la rilevanza teorica del dato. Le più frequenti riclassificazioni che vengono effettuate riguardano: 1) collocazione dei ratei e risconti attivi e passivi, rispettivamente, nelle voci di attivo circolante e passivo a breve; 2) il fatto che parte di alcune poste dell'attivo circolante sono in realtà fisse (es. la voce magazzino può contenere scorte di prodotti ormai invendibili oppure è previsto un limite inferiore di stoccaggio dei materiali o delle merci). Analogamente, alcune poste del passivo a breve sono in realtà a lungo (es. scoperto di c/c per un periodo superiore all’anno); Indici di bilancio 7 3) il fatto che poste dell'attivo fisso o di debito a lungo termine siano in realtà da considerarsi voci di breve termine (es. TFR quando si prevede che entro l’anno ci saranno uscite del personale per raggiunta anzianità). A conclusione di questo paragrafo, presentiamo la Tab. 1.1.5 che riporta, in forma molto sintetica, i dati di uno stato patrimoniale. Tali dati ci serviranno per introdurre alcuni indici di bilancio e per le successive esemplificazioni numeriche. Tab. 1.1.5 Stato patrimoniale (azienda XXX; valori in Euro) ATTIVO 1998 1999 PASSIVO 1998 Cassa Crediti a breve Magazzino Attivo corrente 1550 31130 76980 109660 Immobilizzaz. -F.do ammort. Att. fisso netto 43170 -14620 28550 Totale attivo 138210 4000 17800 47600 69400 Debiti vs. fornitori Debiti fin. a breve Altri a breve Imposte dirette Passivo corrente 1999 14320 23890 9330 10650 58190 6850 16000 6870 4160 33880 21600 21600 22800 22800 Capitale proprio 8320 Riserve capitale 10360 Utili non distribuiti 39740 Tot capitale netto 58420 94870 Totale passivo 138210 7610 1940 28640 38190 94870 37110 -11640 Debiti a lungo t. 25470 Passivo consolidato 1.2 Il conto economico L’articolo 2425 del Codice Civile regolamenta la struttura del conto economico (v. Tab. 1.2.1). In particolare, esso stabilisce la classificazione dei costi per causa (per natura) e la forma cosiddetta scalare (successivi saldi ricavi-costi relativi alle diverse gestioni) anziché a sezioni contrapposte (costi vs. ricavi). 8 Indici di bilancio Tab. 1.2.1 Struttura del conto economico (in forma sintetica) A: valore della produzione (venduta) – B: costi della produzione (ottenuta) (A–B) Differenza fra ricavi e costi C: proventi e oneri finanziari D: rettifiche di valore delle attività finanziaria E: proventi e oneri straordinari (A–B)+C+D+E: Risultato di esercizio prima delle imposte – Imposte d'esercizio Utile (reddito) d'esercizio dopo la tassazione La struttura dettata nella normativa si ispira allo schema descritto nella Tab. 1.2.2, che distingue la gestione di esercizio nelle varie aree che contribuiscono alla produzione del reddito da un lato e all’insorgenza dei costi, dall’altro. Tab. 1.2.2 La distinzione delle aree gestionali AREA Ricavi, costi (proventi oneri) Caratteristica (operativa, tipica) operativi Finanziaria finanziari Extracaratteristica (atipica, atipici patrimoniale) Straordinaria eccezionali TOTALE SALDO ricavi–costi Reddito operativo + saldo area finanziario + saldo area extratipica + saldo area straordinaria Reddito d'esercizio prima delle imposte Schematicamente abbiamo quanto di seguito descritto. • Area operativa. Fra i ricavi troviamo: valore della produzione venduta (fatturato), rimanenze, incremento di valore di beni destinati alla produzione (es. immobili). Fra i costi: costi per materie prime, costi per servizi, per il personale, materiale di consumo, ammortamenti, svalutazioni, accantonamenti per rischi operativi. • Area atipica. Fra i proventi abbiamo: proventi da partecipazione, locazioni di immobili, rivalutazioni. Fra gli oneri: costi e oneri, svalutazioni. • Area finanziaria. Fra i proventi: es. da c/c bancari, BOT, CCT. Fra gli oneri: interessi passivi. Indici di bilancio • 9 Area straordinaria. Essa concerne eventi straordinari nel senso di: a) non usuali, eccezionali rispetto a situazione 'normali' (dismissione di strumenti, beni, etc.) b) valori relativi ad esercizi precedenti come il recupero crediti c) valori dipendenti da una modifica dei criteri di valutazione (es. la valutazione delle scorte). Si tratta, nel complesso, di fatti straordinari riguardanti qualunque area gestionale (tipica e non). Tenendo presente lo schema suggerito dalla dottrina, la struttura stabilita dalla normativa (v. Tab. 1.2.1) rimane in parte insoddisfacente in quanto: 1) il concetto di area straordinaria rileva di fatto, oltre agli eventi eccezionali (nel senso appena detto), anche fatti relativi all’area atipica/patrimoniale; 2) affinché il confronto costi/ricavi operativi dia informazioni corrette e significative, è necessario che i costi e i ricavi si riferiscano ai medesimi eventi (es. costi e ricavi della produzione ottenuta durante l'esercizio, oppure costi e ricavi della produzione venduta durante l’esercizio). Anche per il conto economico è necessario effettuare delle riclassificazioni secondo schemi proposti dalla letteratura. In questa sede ci limitiamo a riportare il modello a valore aggiunto che classifica i costi per natura e cioè in relazione al tipo di fattore produttivo utilizzato (costo del fattore lavoro, del capitale fisso ecc.). Una grandezza molto significativa che scaturisce da questo schema è il valore aggiunto, che rappresenta il valore prodotto dalla gestione caratteristica una volta dedotti i costi di materie prime e servizi. Ritroviamo in questo schema un aggregato a noi già noto perché usato nella contabilità economica nazionale. Anche in questo caso, infatti, il valore aggiunto è ricavato come differenza fra la produzione ottenuta e costi per materie ecc., ed è quella parte del valore della produzione che serve per la copertura dei costi relativi ai fattori produttivi (lavoro, capitale operativo, di credito, di rischio). 10 Indici di bilancio La Tab. 1.2.6, infine, riporta una rappresentazione sintetica di un conto economico, i cui dati verranno in seguito usati a fini esemplificativi. Tab. 1.2.5 Conto economico a valore aggiunto 1.1 Fatturato 1.2 (–sconti, abbuoni, resi) 1. Fatturato netto 2.1 Rimanenze finali di prodotti 2.2 (–esistenze iniziali di prodotti) 2. Altri ricavi 3. PRODOTTO DI ESERCIZIO (1+2) 4. – Consumo di materie 5. MARGINE INDUSTRIALE LORDO (3-4) 6. – Spese operative 7. VALORE AGGIUNTO (5-6) 8. – Salari, stipendi, contributi, accanton. TFR 9. MARGINE OPERATIVO LORDO (7-8) 10. – Quote ammortamento 11 REDDITO OPERATIVO (9-10) 12. SALDO AREA FINANZIARIA (proventi-oneri fin.) 13. SALDO AREA EXTRA CARATTERISTICA 14. SALDO AREA STRAORDINARIA 15. RISULTATO PRIMA DELLE IMPOSTE (11+12+13+14) 16. – Oneri tributari 17. UTILE/PERDITA DI ESERCIZIO Tab. 1.2.6 Conto economico. Azienda XXX. POSTE CONTABILI Fatturato netto (fatturato–sconti, abbuoni, resi) – Costo della produzione – Spese commerciali e amministrative etc. Totale costi operativi Reddito operativo lordo - quote ammortamento Reddito operativo netto – oneri finanziari Reddito prima delle tasse – Oneri tributari Utile d'esercizio (reddito globale netto) 1996 214250 151580 25270 176850 37400 2980 34420 2420 32000 16100 15900 1995 150070 107800 19040 126840 23230 3000 20230 1530 18700 9000 9700 Indici di bilancio 11 1.3 Indici di bilancio Come si è già accennato, l'analisi mediante indici di bilancio aiuta ad interpretare i valori contabili riportati nello stato patrimoniale e nel conto economico. E, la determinazione dei ratio risponde, fra l’altro, all’esigenza di eliminare eventuali differenze dimensionali esistenti fra le varie aziende, per la costruzione di misure più correttamente comparabili. Ad esempio, riveste poco significato il confronto fra il risultato operativo di due imprese quando queste hanno un differente ammontare di risorse investito nell’attività. Possiamo distinguere due tipi di approcci ai fini del calcolo degli indici o ratio (rapporto fra poste). (a) Approccio verticale: gli indici sono determinati a partire da dati appartenenti alla stessa sezione del medesimo documento contabile (conto economico, stato patrimoniale). Un esempio di questo procedimento è la rappresentazione dello stato patrimoniale in valori percentuali. Da questa sono ricavabili informazioni sulla struttura delle fonti e degli impieghi dell'azienda. Tab 1.3.1 Composizione percentuale dello stato patrimoniale. Azienda XXX ATTIVO 1996 1995 PASSIVO 1996 1995 Cassa Crediti a breve Magazzino Attivo corrente 1.4 28.4 70.2 79.3 5.8 25.6 68.6 73.1 Passivo corrente 42.1 35.7 Attivo fisso netto 20.6 26.8 Passivo consolidato 15.6 24.0 100.0 100.0 42.3 100.0 40.3 100.0 Totale attivo Capitale netto Totale passivo (in grassetto: % calcolate sul totale di sezione) Una rappresentazione analoga può essere ottenuta per il conto economico. Di particolare interesse è, ad esempio, la composizione percentuale delle varie componenti di costo della gestione tipica. Gli indici così calcolati sono un esempio di rapporti di composizione. 12 Indici di bilancio (b) Approccio orizzontale: gli indici sono calcolati su poste appartenenti a: (i) differenti sezioni del medesimo conto oppure (ii) differenti documenti contabili. Un esempio del caso (i) è il confronto fra le componenti dell'attivo e del passivo che sono omologhe rispetto all'orizzonte temporale (attività fisse vs. passivo consolidato o permanente, attività correnti vs. passività correnti), in base al principio che le fonti a lungo (breve) dovrebbero finanziare impieghi a lungo (breve). Un esempio del caso (ii) è il confronto fra grandezze flusso (es. reddito operativo) e grandezze fondo (es. capitale investito nella gestione operativa) che hanno contribuito all'attività dell'azienda. Su questi aspetti si tornerà più avanti, nel corso della descrizione dei principali ratio aziendali usati nella pratica. Secondo il tipo di informazione fornita, generalmente si tende a distinguere quattro categorie di indici: 1) indici di struttura finanziaria a breve (liquidità): misurano la capacità dell'azienda a soddisfare impegni a breve ed esprimono la struttura delle fonti a breve; 2) indici di struttura finanziaria a lungo termine: misurano il grado di impiego di fonti finanziarie a lungo termine e la struttura delle attività; 3) indici di redditività: misurano la capacità dell’azienda di generare reddito; 4) indici di attività (rotazione, turnover): misurano l'intensità di impiego delle risorse aziendali. A questi possono essere aggiunti gli indici di bilancio che, derivanti dall’approccio verticale, misurano la struttura del capitale e del patrimonio aziendale (es. quota di attivo fisso, ecc.). 1.3.1 Indici di struttura finanziaria a breve Questi indici sono principalmente focalizzati sull'analisi della struttura del capitale circolante di un'azienda. Alcuni di essi sono presentati nella tabella seguente. Come si può vedere se l'attivo è maggiore del passivo il current ratio (CR) assume valori superiori a 1. I principali problemi connessi con l'uso di questo indice riguardano l'eventuale presenza fra le poste Indici di bilancio 13 correnti coinvolte, di componenti che, in realtà, sono di lungo termine (es. scorte invendibili nell'attivo corrente, e cioè comprese nella voce ‘magazzino’) e dell'assenza di componenti breve poiché sono registrate sotto voci a lungo termine (v. l'esempio del TFR sopra). Tab. 1.3.2 Indici di struttura finanziaria a breve. Azienda XXX. Indice Descrizione 1996 Current ratio (CR) attivo corrente/passivo corrente 1.90 Quick ratio (QR) liquidità/passivo corrente 0.56 Quoziente di tesoreria liquidità immediate/passivo corrente 0.27 1995 2.00 0.64 0.12 Il quoziente di tesoreria e il quick ratio QR non contengono la voce ‘magazzino’ e quindi risolvono, in parte, i problemi appena richiamati. Facciamo notare che i tre indici appena introdotti operano un confronto di poste contabili appartenenti a sezioni opposte dello stato patrimoniale (approccio orizzontale), ma simili rispetto alla durata. E’ importante sottolineare che anche la composizione percentuale del capitale circolante (approccio verticale) informa sulla struttura finanziaria a breve. Per la nostra azienda XXX, la cassa, ad esempio, è passata dal 5.8% del 1995 al 1.4% del 96 denotando così una diminuzione di liquidità (segnalata del resto anche dal quoziente di tesoreria in Tab. 1.3.2). 1.3.2 Indici di struttura a lungo termine Questi indici informano sulla capacità dell'azienda a sostenere gli impegni a lungo termine. Possiamo distinguere due tipi di indici a seconda che si misuri la forza aziendale attraverso (i) le attività (capitale, stock) o attraverso (ii) il flusso di reddito prodotto. Tab. 1.3.3 Indici di struttura finanziaria a lungo. Azienda XXX. Indice Descrizione 1996 Incidenza debiti totale debiti/totale passivo 0.58 Indice indebitamento totale debiti/capitale netto 1.37 Copertura oneri finanziari reddito lordo*/oneri finanziari 14.00 * reddito d’esercizio al lordo di oneri finanziari e tributari 1995 0.60 1.48 13.00 14 Indici di bilancio Il ratio di incidenza dei debiti è un indice molto generale di struttura finanziaria in quanto il numeratore contabilizza sia i debiti a breve sia quelli a lungo termine (il capitale di credito: passivo corrente e passivo consolidato). Esso informa sulla quota di risorse fornita dai finanziatori esterni. L’indice di indebitamento viene talvolta indicato anche come rapporto di indebitamente o, in lingua anglosassone, debt/equity ratio. Dal punto di vista dei creditori, un valore basso costituisce un segnale positivo in quanto evidenzia la capacità dell'azienda a sopportare gli impegni con fondi propri (conferiti dai soci e prodotti all'interno dell'azienda). Dal punto di vista di chi ha conferito il capitale di rischio, un valore basso può essere visto negativamente in quanto un'azienda forte può ottenere credito a basso costo e quindi può sfruttare questa possibilità per aumentare le risorse. Com’è noto, infatti, il ricorso a capitale di credito può essere una leva (detta appunto 'leva finanziaria') per accrescere la redditività aziendale. Per valutare la capacità aziendale a sostenere gli oneri finanziari (indicati in seguito con OF) generati dai prestiti a lungo termine, si può usare l’indice di copertura degli OF. Questo ratio, che impiega due grandezze flusso, può essere visto anche come un indice di rotazione. Alcuni analisti preferiscono usare il reddito d'esercizio al lordo degli OF ma al netto dell’imposizione fiscale. Ai fini della comparabilità spazio/tempo, converrebbe usare il reddito al lordo degli oneri tributari e non comprendere l’eventuale quota straordinaria di reddito. 1.3.3 Indici di attività (rotazione, turnover) Questi indici misurano il grado di utilizzo delle risorse aziendali. In genere sono definiti, mediante l’approccio orizzontale, come il rapporto fra grandezza flusso (dal conto economico) e grandezza stock (dallo stato patrimoniale). Il valore dello stock può essere riferito all'istante iniziale (1 gennaio), finale (31 dicembre) oppure può essere una media dei due valori (o di più valori infra-annuali). Tab. 1.3.4 Indici di rotazione. Azienda XXX. Indice Descrizione Turnover magazzino fatturato/magazzino Turnover capitale circolante fatturato/capitale circolante Turnover del capitale fatturato/totale attivo 1996 2.8 1.9 1.5 1995 3.1 2.2 1.6 Indici di bilancio 15 Riguardo al turnover di magazzino, si può osservare che, trattandosi di valori monetari, il costo del venduto può essere una figura maggiormente comparabile col magazzino di quanto non lo sia il fatturato. Il turnover del magazzino aiuta a interpretare l'indicazione fornita dalla composizione del capitale circolante. Infatti, un aumento della voce ‘magazzino’ (in %) in corrispondenza di un aumento delle vendite (e quindi aumento o costanza del turnover), significa che l'azienda vuole essere pronta a soddisfare la crescente domanda di prodotti. In caso invece di diminuzione delle vendite (e quindi del valore del turnover), segnala che si stanno accumulando scorte che rischiano di essere invendibili oppure che, per essere alienate, possono richiedere uno sconto sul prezzo. Il valore 2.8 per il turnover di magazzino significa che il fatturato riesce a recuperare circa 3 volte il valore delle scorte. Il reciproco di un indice di rotazione dà un indice di durata. Se la grandezza flusso è riferita all'intervallo di 1 anno si ricavano durate in unità-anno. Ad esempio, il reciproco del turnover di magazzino per il 1996, che è circa 0.36, indica che il magazzino viene 'ricostituito' in una porzione di 0.36 unità anno (circa 130 giorni, assumendo 360 giorni per anno). 1.3.4 Indici di redditività Gli indici di redditività misurano la capacità dell'azienda a ricavare reddito dall'impiego delle risorse. Poiché, come abbiamo visto, differenti aree gestionali possono produrre reddito, la letteratura propone indici di redditività che mettono in luce il contributo delle diverse gestioni al reddito globale. Dal punto di vista statistico questi ratio possono essere considerati come ‘indici di derivazione’ e possono essere composti sia come rapporti fra grandezze flusso, sia come rapporti fra flusso e stock. Il ROI (return of investment), è un indice di redditività operativa o tipica. Esso misura la capacità dell'attività tipica dell'azienda ad attrarre capitale (proprio e di credito) ed è espressione della politica industriale (processo produttivo, distributivo, ecc.) dell'azienda. Il ROI è il rapporto fra reddito operativo e capitale investito nell'attività 16 Indici di bilancio tipica. Analogo al ROI è il ROA (return on assets) che ha, però, al denominatore il totale attivo. Esso è più semplice da calcolare. Il ROE (return on equity) dà una misura della redditività delle varie gestioni aziendali rispetto al capitale di rischio. Ai fini della comparabilità spazio/tempo è preferibile usare il reddito al lordo degli oneri tributari ed eliminare le eventuali quote straordinarie. Il valore del ROE dovrebbe essere confrontato col rendimento di investimenti alternativi in modo da capire se è conveniente investire nell'azienda. In questo senso il ROE misura la capacità dell'azienda ad attrarre capitale di rischio. Il ROS (return of sales) misura la redditività delle vendite. A differenza dei due indici sopra descritti, il ROS coinvolge due grandezze flusso. La tabella seguente riporta i valori degli indici di redditività dell'azienda XXX. A tale proposito si precisa che il reddito operativo è stato calcolato dal prospetto del conto economico sommando gli oneri finanziari (che fanno parte dell'area finanziaria) al reddito prima delle tasse (per il 1996: 320000+2420). Tab. 1.3.5 Indici di redditività. Azienda XXX Indice Descrizione ROA reddito operativo/totale attivo ROS reddito operativo/fatturato ROE reddito d’esercizio/capitale netto 1996 0.25 0.16 0.27 1995 0.21 0.13 0.25 1.4 Schemi per l'interpretazione degli indici La letteratura aziendalistica sottolinea la necessità di interpretare i valori degli indici costruendo degli schemi organici, che mettano in luce i legami che esistono fra questi. Tali schemi, basati sulle identità contabili implicite nel bilancio, aiutano sia ad interpretare i dati consuntivi aziendali ma anche a mettere in luce le azioni da intraprendere per il futuro se si tratta di bilanci preventivi. Vediamo, a titolo esemplificativo e utilizzando il ROA come indice di redditività operativa, due schemi frequentemente usati: (a) quello che esprime i contributi delle varie gestioni alla redditività aziendale (relazione fra ROE, ROA e indebitamento) e (b) quello che approfondisce lo studio della redditività operativa. Indici di bilancio 17 Riguardo al punto (a), ovvero all’analisi della redditività aziendale nelle sue componenti gestionali, consideriamo le due situazioni qui sotto descritte. 1) Il capitale è investito interamente nella gestione tipica; c'è il ricorso al capitale di credito e β è l'indice di indebitamento (β=totale debiti/capitale netto); 0<γ<1 è il tasso di interesse sul capitale di credito (ovviamente si tratta di un tasso medio di indebitamento); non c'è imposizione tributaria. In questo caso si ha: ROE≡ROA + β (ROA – γ) Alla formula si giunge tenendo conto che: Tot. debiti≡β x Capitale netto Î Totale attivo≡(1+β) x Capitale netto Oneri finanziari≡ γ x Tot. debiti Î OF≡γ x β x Capitale netto Reddito d'esercizio≡Reddito operativo – OF 2) Il capitale è investito interamente nella gestione tipica; c'è il ricorso al capitale di credito e β è l'indice di indebitamento; 0<γ<1 è il tasso di interesse sul capitale di credito; c'è imposizione tributaria e 0<α<1 è l'aliquota fiscale. In questo caso si ha: ROE ≡ (ROA + β (ROA – γ)) (1–α) La formula appena introdotta esprime il contributo di varie aree gestionali alla redditività globale, misurata in forma sintetica dal ROE. La situazione di redditività di un’azienda, ai fini del confronto nel tempo o cross section, può essere in prima battuta esaminata attraverso il ROE, per poi venire approfondita mediante la relazione ROE-ROA. Si può, ad esempio, verificare se la redditività operativa ha consentito quello che viene in letteratura chiamato effetto leva, e che è espresso da [β (ROA– γ)]. Come è noto, infatti, se ROA>γ, un valore alto di β ha un effetto positivo sul ROE. L’analisi può ulteriormente scendere nel particolare: ad esempio guardando alla redditività operativa (punto (b)). Infatti, anche il ROA può essere visto come una espressione di sintesi delle varie operazioni coinvolte nell’attività operativa. Sfruttando i legami contabili, possiamo scrivere: 18 Indici di bilancio ROA≡ ROS x Turnover del capitale Brevemente vogliamo ricordare come questa espressione sia in grado di evidenziare due diversi comportamenti delle aziende: • • quella orientata prevalentemente ad un aumento del ROS: qualità elevata, prezzi alti, bassi volumi di vendita; quella orientata prevalentemente ad un aumento del Turnover: concorrenza basata su prezzi bassi e qualità non eccellente (e quindi con poche risorse dedicate a questo aspetto), ma con alti volumi di vendita. Sulla base delle relazioni fra ratio qui esaminate, ai nostri scopi, è importante fare le seguenti considerazioni: 1) gli schemi di interpretazione dei dati di bilancio, proposti dalla letteratura aziendalistica, individuano una vera e propria gerarchia fra gli indici, in relazione alla loro capacità di sintesi. La natura di detta sintesi trova giustificazione e pieno significato nelle identità contabili che implicitamente scaturiscono dalla struttura del bilancio; 2) gli schemi di interpretazione del bilancio suggeriscono la necessità di procedere all’analisi simultanea di una molteplicità di indici. Attraverso questo procedimento, i vari indici trovano una loro precisa collocazione in uno schema organico che consente una corretta lettura dei dati. Un esempio di particolare efficacia è il seguente. Un valore relativamente alto (ma non patologico) di β non è necessariamente un segnale di rischio se non viene interpretato accanto ai livelli di redditività dell’azienda. Analisi statistica dei bilanci 2. 19 L’analisi statistica dei dati di bilancio. Introduzione e analisi univariata Introduzione 2.1 Comparazioni di bilancio e analisi statistica 2.2 Analisi univariata: i valori medi 2.3 Caratteristiche delle distribuzioni empiriche dei ratio Introduzione Nei paragrafi precedenti sono stati introdotti i principali indici di bilancio che hanno lo scopo di fornire una misura quantitativa di fenomeni e aspetti significativi della situazione economico-finanziaria di un’azienda. In questo capitolo cercheremo di delineare l’impiego dei metodi statistici in relazione ad alcuni scopi che l’analisi di bilancio si prefigge. 2.1 Comparazioni di bilancio e analisi statistica Come abbiamo già accennato, l’analisi di bilancio può essere rivolta verso l’esterno, per esaminare l’ambiente competitivo in cui un’azienda opera e, in particolare, per conoscere le prestazioni dei propri concorrenti, i loro punti di forza e di debolezza. Analisi di bilancio di questo tipo sono condotte anche dagli istituti di credito per valutare i clienti ai quali concedere finanziamenti e da parte di istituti di ricerca economica nel contesto di studi di settore di più ampio respiro. L’analisi di bilancio riferita a più imprese (appartenenti al medesimo settore oppure aziende simili per area geografica, dimensioni, ecc.) può offrire utili conoscenze riguardo alla posizione relativa occupata da una data azienda nel settore (o nell’area geografica, ecc.) o riguardo a eventuali somiglianze o differenze fra imprese operanti in settori diversi. La comparazione fra indici di bilancio di una singola azienda e dati aggregati, inoltre, può essere utile quando un’impresa deve decidere se entrare in un nuovo settore o vuole confrontarsi con i dati medi del settore di appartenenza per comprendere se i suoi risultati si allineano 20 Analisi statistica dei bilanci con quelli del settore o, ancora, per analizzare le tendenze del settore stesso. La situazione occupata da un’azienda può essere valutata anche confrontando gli indici di bilancio con i cosiddetti quozienti tipo o standard. I quozienti standard sono i valori che, in una situazione normale di settore, assumono gli indici di bilancio. Tali quozienti standard vengono determinati mediante il calcolo di valori medi su gruppi di imprese che evidenziano, per l’appunto, comportamenti normali (imprese non eccessivamente in situazione critica né in posizione di eccellenza). Ovviamente, il quoziente standard è sottoposto a un continuo aggiornamento per il mutare delle condizioni ambientali. Tenendo presente le varie finalità che l’analisi di bilancio riferita a più imprese può avere e i criteri, dettati dalle disciplina aziendali, per la determinazione e interpretazione degli indici di bilancio, possiamo schematicamente indicare alcuni ruoli che la statistica può rivestire in merito. 1) Analisi statistica univariata. Con riferimento ai dati di bilancio di un gruppo di imprese, essa consente lo studio della distribuzione dell’indice di bilancio ed il calcolo di valori medi quali: indici di posizione, indici di variabilità. La lettura dei valori medi (ad es. ROE, ROI ecc. medi di settore) potrebbe essere condotta applicando gli schemi interpretativi prima esposti, per la valutazione, quindi, dello stato di salute del settore aggregato. 2) Analisi statistica multivariata. Abbiamo già sottolineato la necessità di interpretare i dati di bilancio mediante una lettura simultanea di più indici significativi. E, come abbiamo visto, sono disponibili schemi interpretativi basati su una struttura gerarchica degli indici di bilancio, in relazione al loro livello di sintesi. L’analisi inizia ad un grado elevato di sintesi per poi scendere più nel particolare. Ebbene, tali schemi appaiono rigidi e statici in quanto basati esclusivamente sulle identità contabili, sempre (per definizione) verificate all’interno del bilancio. I metodi statistici multivariati possono offrire elementi di sintesi sulla base, non delle identità, bensì sui legami di interrelazioni che sussistono fra gli indici. Queste interrelazioni sono evidentemente influenzate anche dall’esistenza di legami contabili, e pertanto, esprimono la coerenza interna dei dati di bilancio. Tali metodi appaiono più flessibili, in quanto adattabili alle Analisi statistica dei bilanci 21 specifiche finalità dell’analisi e capaci di fornire chiavi di lettura maggiormente calate nella realtà del fenomeno indagato. E’ importante sottolineare che la decisione per un’analisi multivariata non esclude la necessità di effettuare uno studio univariato: anzi questo deve essere sempre condotto anche se solo come esame preliminare dei dati osservati. Riguardo al modo di procedere nell’analisi statistica multivariata, possiamo distinguere due diversi approcci, ciascuno dei quali può rivelarsi conveniente in relazione alle particolari finalità dello studio. A) Approccio esplorativo. Esso consiste, in senso molto generale, nell’individuazione di strutture interne ai dati di osservazione, strutture che possono evidenziare somiglianze fra gruppi di unità (nel nostro caso le aziende) oppure legami di interdipendenza fra variabili (nel nostro caso gli indici di bilancio o altre caratteristiche possedute dalle aziende). Tale approccio consente di esaminare i dati secondo ‘prospettive’ o ‘punti di osservazione’ che facilitano lo studio simultaneo di più variabili e più unità. In questo scritto mostreremo l’impiego di un procedimento esplorativo multivariato (il metodo delle componenti principali), nell’ambito di un caso di analisi della concorrenza. B) Approccio confermativo. Si tratta di specificare un modello probabilistico che si ritiene possa avere generato i dati di osservazione. Tale modello deve essere stimato e verificato (confermato) sui dati empirici mediante il riscorso ai metodi dell’inferenza statistica. In generale, lo scopo principale è quello di specificare e stimare modelli che descrivono il comportamento delle aziende. Relativamente a questo ambito di analisi, svolgeremo un caso di studio concernente l’impiego dell’analisi discriminante per la previsione delle insolvenze aziendali (modelli di credit scoring). 2.2 Analisi univariata: i valori medi Nell’analisi finanziaria, il calcolo dei ratio di bilancio risponde all’esigenza di eliminare eventuali differenze dimensionali esistenti fra le varie aziende, per la costruzione di misure più correttamente comparabili. Ad esempio, riveste poco significato il confronto fra il risultato operativo di due imprese quando queste hanno un differente ammontare di risorse investito nell’attività. L'efficacia deflativa del ratio ha importanti implicazioni anche nella formulazione di un corretto indice di posizione o valore medio. 22 Analisi statistica dei bilanci Si consideri un gruppo di n aziende; per ogni unità i (i=1,…,n), è stato calcolato l’indice di bilancio ri=Yi/Xi. (dove Xi>0). In questo caso si pone spesso la questione se, come indice medio di posizione, sia più corretto calcolare la media aritmetica semplice: (1/n)Σi ri =(1/n)ΣiYi/Xi oppure il rapporto fra i due aggregati (numeratore e denominatore) ovvero fra le due medie o fra i due rispettivi totali: Σi Yi /ΣiXi=)Σiri Xi/ΣiXi che, come si vede, è la media aritmetica ponderata dei ratio, con pesi pari a Xi. Un possibile criterio di scelta fra questi due tipi di media ci viene fornito ricorrendo alla modellistica statistica. Supponiamo che gli n valori ri siano stati generati dal seguente modello, dove r rappresenta il valore medio di riferimento: (2.2.1) MOD1 ri = Yi/Xi= r + ei E(ei)=0 V(ei)=σ2 costante per ogni i. L'applicazione del metodo dei minimi quadrati (che fornisce il migliore stimatore lineare e corretto di r), ci dà la media aritmetica semplice degli ri come stima di r. Infatti, la media aritmetica dei ratio verifica l'espressione: min r Σi (Yi/Xi–r)2 MOD1 implica (poiché V(ei) è ipotizzata costante) che, all'aumentare della dimensione del denominatore, i valori ri tendono a esibire la stessa dispersione intorno a r. Se invece i valori ri sono generati dal modello: (2.2.2) MOD2 ri =r+ εi E(εi)=0 V(εi)=σ2/Xi il migliore stimatore lineare e corretto di r è fornito dal metodo dei minimi quadrati ponderati. Tale stima è la media aritmetica ponderata dei ri con pesi pari a Xi e cioè: Analisi statistica dei bilanci 23 ΣiYi/ΣiXi = Σi riXi /ΣiXi . Si ritrova una grandezza già introdotta sopra: il ratio per l’aggregato delle unità nel suo insieme ovvero il rapporto fra la media (o il totale) di Y e la media (o il totale) di X. Come si è detto, tale risultato si ottiene stimando r dalla (2.2.2) mediante il metodo dei minimi quadrati ponderati, e cioè risolvendo in r l'espressione: min r Σi (Yi/Xi–r)2Xi implica (poiché V(εi) è ipotizzata decrescente in Xi) che, all'aumentare della dimensione del denominatore, i valori ri tendono a esibire una dispersione minore intorno a r. A titolo esemplificativo riportiamo il grafico per gli indici CR e ROS relativo ad un gruppo di 200 aziende operanti nelle regioni dell’Italia del nord-est. Come si può vedere dalla Fig. 2.2.1, all'aumentare delle passività correnti (denominatore del current ratio) il valore di questo tenda a stabilizzarsi. Pertanto sembra adeguato il modello MOD2; la linea orizzontale è la stima di r mediante la media aritmetica ponderata, che è pari a 1.214. La diminuzione della variabilità dei valori del ratio all'aumentare del denominatore non è altrettanto marcata per il ROS (Fig. 2.2.2). La stima del valore medio è stata quindi ottenuta ipotizzando il modello MOD1. La linea orizzontale rappresenta la media aritmetica dei ratio ed è uguala a 0.05. Nella pratica si tende ad utilizzare la media ponderata per il suo significato più immediato: essa rappresenta infatti l'indice di bilancio per l'intero aggregato delle aziende. La validità di questi tipi di media può essere messa in discussione dalla presenza di valori eccezionali o anomali (outlier). Un outlier è una unità che si comporta in maniera molto diversa dalla maggioranza delle osservazioni (es. un valore troppo elevato e distante dalla gran massa dei valori). MOD2 24 Analisi statistica dei bilanci Fig. 2.2.1 Indice CR (current ratio) 3 Current ratio (ri) 2,5 2 1,5 1 0,5 0 5000 10000 15000 20000 25000 30000 35000 40000 Passivo corrente (Xi) Fig. 2.2.2 Indice ROS 0,25 0,2 ROS 0,15 0,1 0,05 0 0 20000 40000 60000 Fatturato 80000 100000 Analisi statistica dei bilanci 25 La presenza di (numerosi) outlier nelle distribuzioni empiriche dei ratio è stata evidenziata da vari studi. Generalmente si ritiene che le unità anomale non debbano essere eliminate nell'analisi statistica in quanto contribuiscono a caratterizzare la distribuzione stessa. Tuttavia le medie come quelle viste in precedenza, tendono ad essere influenzate, anche in modo abbastanza pesante, dalla presenza di outliers e rischiano di perdere il significato di indice medio di posizione. In questo caso possiamo adottare le seguenti alternative. 1) Ricorso ad altri indici di posizione più resistenti ai valori eccezionali. Primi fra tutti: mediana e quartili (percentili, ecc.). Il calcolo di questi indici di posizione per le distribuzioni empiriche degli indici di bilancio è molto frequente (v. ad esempio le pubblicazioni a cura della Centrale dei Bilanci dell’ABI; www.centraledeibilanci.it) in quanto fornisce informazioni riguardo alla posizione relativa occupata da una data azienda. 2) Analisi della distribuzione empirica del ratio allo scopo di individuare i valori eccezionali. Questo procedimento, a nostro avviso, è di particolare efficacia per descrivere la struttura delle osservazioni. Seguendo questa impostazione, gli outlier individuati (soprattutto se adeguatamente numerosi) potrebbero andare a costituire gruppi di unità portatrici di peculiari caratteristiche e rappresentare significativi elementi di riferimento. E, nel contempo, le unità non outlier potrebbero esprimere quella situazione di ‘normale gestione’ rispetto alla quale diventerebbe possibile calcolare i quozienti standard. 2.3 Caratteristiche delle distribuzioni empiriche dei ratio In questo paragrafo delineiamo, ricorrendo a vari strumenti statistici (grafici, indici di forma) le principali caratteristiche delle distribuzioni empiriche dei rapporti di bilancio. Iniziamo con la rappresentazione grafica detta box-plot. Essa è in grado di rappresentare gli indici di posizione, la variabilità della distribuzione, e identificare eventuali valori anomali presenti. La Fig. 2.3.1 è il box plot dei dati relativi all’indice di redditività ROI per 400 aziende operanti nell'Italia settentrionale. Il grafico è costituito da una scatola (box) rappresentata dal primo e terzo quartile. All’interno della scatola è indicata la posizione della mediana (secondo quartile). Un valore della mediana distante dal centro della 26 Analisi statistica dei bilanci scatola è segnale di una distribuzione asimmetrica. L’altezza della scatole esprime lo scarto interquartile; una scatola alta indica quindi una più alta variabilità. Indicando con H l’altezza della scatola, nella figura è stata individuata una zona di valori non anomali, che è distante dalla scatole una quantità H. Le linee (detti baffi o whisker) che partono dalla scatola indicano il range dei valori che stanno all’interno di detto intervallo. Punti distanti dalla scatola più della quantità H ma meno di 2H sono outliers e vengono indicati da un pallino. Valori che si collocando ad una distanza dal box superiore a 2H sono detti valori estremi e sono indicati con un asterisco. La Fig. 2.3.2 schematizza la costruzione del box-plot. La Fig. 2.3.1 evidenzia la presenza di un valore eccezionale che potrebbe essere anche causato da un errore di digitazione dei valori sui quali è stato calcolato il ROI. E’ inoltre presente un gruppo osservazioni anomale in corrispondenza di valori elevati di ROI. Le distribuzioni cross section dei dati di bilancio, seppur riferite a gruppi omogenei di aziende (es. rispetto alla dimensione, al settore di attività, ecc.), sono caratterizzate dalla presenza di una forte asimmetria e da elevata curtosi (oltre che dalla presenza di valori eccezionali come appare nel box plot). Fig. 2.3.1 Box-plot dell’indice ROI 0.4 0.3 0.2 0.1 Non-Outlier Max Non-Outlier Min 75% 25% 0 ROI Mediana Analisi statistica dei bilanci 27 Fig. 2.3.2 Interpretazione del box plot valori eccezionali (estremi) outlier 2H 1.5 H H Non-Outlier Max Non-Outlier Min 1.5 H 75% 25% Mediana Indicando con ri il generico indice di bilancio riferito all’unità i-esima (i=,1…,n), gli indici di asimmetria (o skewness) e curtosi sono generalmente calcolati secondo le formule seguenti: n 3 ∑ (ri − r ) Asimmetria = i =1 s r3 n 4 ∑ (ri − r ) Curtosi = i =1 s r4 −3 dove: n ∑ ri r = i =1 n sr = (ri − r ) 2 n Vale la pena notare che, nel caso di distribuzione normale, i due indici assumono valore zero. Valori positivi dell’indice di asimmetria denotano asimmetria positiva (v. distribuzione χ2). Valori positivi (negativi) dell’indice di curtosi denotano una distribuzione leptocurtica (platicurtica). La tabella seguente riporta i valori degli indici di asimmetria e curtosi per alcuni ratio di bilancio, calcolati sulle 400 osservazioni già descritte. 28 Analisi statistica dei bilanci Tab. 2.3.1 Indici statistici delle distribuzioni di alcuni ratio RATIO ROI ROS CR TURN. ATT. MEDIA VARIANZA 0.092 0.067 1.324 1.428 ASIMMETRIA 0.006 0.003 0.420 0.479 CURTOSI 1.299 1.177 3.392 3.028 3.260 7.395 16.218 21.301 Come si può facilmente vedere, le distribuzioni hanno tutte una asimmetria positiva e sono leptocurtiche. Qui sotto presentiamo il normal probability plot del current ratio. Tale grafico evidenzia, in modo molto chiaro, la non normalità della distribuzione dell'indice di bilancio. Fig. 2.3.3 Normal probability plot per il current ratio 3.5 Normale standard 2.5 1.5 0.5 -0.5 -1.5 -2.5 -3.5 -0.5 0.5 1.5 2.5 3.5 Current Ratio 4.5 5.5 6.5 Analisi delle concorrenza 3. 29 Analisi statistica multivariata dei dati di bilancio. Applicazione delle componenti principali per un’analisi della concorrenza 3.1 Presupposti teorici 3.2 L’analisi statistica: aspetti generali 3.3 Analisi preliminare dei dati 3.4 L’analisi in componenti principali (ACP) 3.1 Presupposti teorici L’analisi della concorrenza è una delle metodologie necessarie per lo sviluppo coerente del processo di formulazione della strategia aziendale. Essa, se basata sulla logica della comparazione interaziendale, dovrebbe essere condotta secondo un’impostazione bifocale: tenendo presente le logiche competitive del settore ed il comportamento degli attori rilevanti. L’ipotesi concettuale sulla quale si fonda questa metodologia di analisi è che in ogni settore sia possibile individuare dei gruppi di imprese che esprimono strategie competitive simili e anche imprese leader i cui risultati sono migliori del resto o della maggioranza dei concorrenti. Gli elementi che, secondo la letteratura e le analisi empiriche, sembrano importanti per valutare la capacità o la forza di competere di un’azienda sono: • la performance economica: grado di redditività dell’azienda; • situazione finanziaria comprendente la situazione di liquidità, il livello di rischio derivante dalla struttura del capitale, l’andamento nel tempo dei flussi di cassa (es. trend crescente, ciclicità, stagionalità, ecc.); • posizione prodotto-mercato dell’azienda: può essere sintetizzata dalla quota di mercato o dal fatturato anche se altri indicatori più complessi sono stati sviluppati; • immobilizzazioni e fonti di approvvigionamento (energia, impianti, ecc.): questo aspetto concerne i livelli di possibile espansione dell’attività; 30 • • • • Analisi della concorrenza risorse umane: struttura del personale anche in termini di età, preparazione, ecc.; programmi R&D la cui portata può essere evidenziata dalla spesa destinata a questa funzione; base tecnologica: questa è importante nella definizione della potenziale espansione dell’attività aziendale; marketing, distribuzione e produzione: livelli di efficienza, efficacia, produttività e relativa possibilità di espansione potenziale. Da quanto sopra elencato, vediamo che informazioni sul comportamento delle aziende possono essere desunte da un’analisi di bilancio di imprese concorrenti. Presupposto fondamentale è evidentemente la corretta definizione dell’ambiente significativo per l’analisi e degli attori ivi operanti (i concorrenti). Questo procedimento conduce, anche se non esclusivamente, ad effettuare una comparazione fra aziende (cross section), e pertanto porta a risultati significativi e di rilievo solo se viene effettuato nei confronti dei concorrenti diretti che possiamo qui definire come tutte le aziende che svolgono la medesima attività e si presentano sui medesimi mercati di sbocco/acquisizione. Alla luce di questa definizione, i concorrenti costituiscono quello che si chiama comparto, che comprende tutte le aziende impegnate in un effettivo e permanente confronto competitivo. 3.2 L’analisi statistica: aspetti generali In questo ambito di applicazione, l’analisi statistica di bilanci di aziende concorrenti, può servire a individuare la posizione che una data azienda occupa nel comparto di interesse. Dalla evidenziazione di eventuali posizioni differenti o simili, si dovrà successivamente risalire ai possibili fattori causali che hanno influito, fattori che possono aver agito anche a livello macro (es. evoluzione del settore). Ai fini di uno studio della concorrenza basato su dati di bilancio, le fasi di un’analisi statistica possono essere così di seguito individuate. Fase 1 Definizione della popolazione di riferimento rispetto al comparto produttivo, al tempo (esercizio), al luogo (es. regione geografica). Analisi delle concorrenza 31 Nel caso qui esemplificato, che riguarda l’azienda XXX del comparto produttivo Tessile operante nel Nord Italia, facciamo riferimento ai dati di bilancio (anno 1994) di un gruppo di 52 aziende operanti, anch’esse, nel Nord Italia. Fase 2 Scelta dei caratteri statistici (variabili) da considerare nell’analisi. Con riferimento ai punti elencati nel primo paragrafo indichiamo gli indici di bilancio che vengono utilizzati. • la performance economica: redditività del capitale proprio (ROE), redditività operativa (ROI); • situazione finanziaria: indici di liquidità (CR:current ratio, QR: quick ratio); indici di leverage (rapporto di indebitamento); • posizione prodotto-mercato: fatturato relativo al totale delle unità analizzate (quota di mercato); • programmi R&D • base tecnologica • marketing ecc. : per queste voci usiamo la quota di attivo rivestita dalla posta di bilancio denominata ‘immobilizzazioni immateriali’. Se l’informazione disponibile è limitata ai dati di bilancio, alcuni importanti aspetti coinvolti nell’analisi della concorrenza non possono essere esaminati. Ad esempio dai dati di bilancio non è disponibile la struttura quali-quantitativa delle risorse umane. La Tab. 3.2.1 riassume gli indici di bilancio appena descritti. Si può osservare che QUOTA non è propriamente un indice di bilancio nel senso tradizionale, in quanto è costruito mediante il rapporto fra il fatturato della singola azienda ed il fatturato dell’aggregato totale. Nella letteratura anglosassone questo tipo di rapporto è detto market based ratio. QUOTA rientra, comunque, fra le misure di performance economica come ROE e ROI. Tab. 3.2.1 Indici (ratio) di bilancio Indice Definizione Categoria Redditività, ROE risultato netto/capitale netto performance ROI risultato operativo/capitale investito QUOTA quota di mercato (in %) Struttura CR attività correnti/passività correnti finanziaria a breve QR liquidità/passività correnti e lungo termine MTCI (passivo corrente+consolidato)/capitale investito Struttura capitale RS immobilizzazioni immateriali*/tot. attivo (in%) * brevetti, spese in ricerca e sviluppo, marketing 32 Analisi della concorrenza Per la struttura finanziaria a breve termine troviamo il CR, il QR e un indice che misura il grado di ricorso al credito (MTCI). Infine, l’indice RS è stato collocato nella categoria della struttura del capitale investito in quanto è un rapporto di composizione della sezione attivo dello stato patrimoniale (approccio verticale). Da notare, infine, che QUOTA e RS sono espressi in termini percentuali. Fase 3 Concerne la scelta dei metodi statistici di analisi nell’ottica di individuare gruppi di imprese che si possano ritenere abbastanza omogenee rispetto alle variabili considerate (imprese che esprimono strategie competitive simili) o che, per la loro posizione rispetto alle altre unità, possano essere considerate imprese leader nel comparto. Per come viene formulata la questione, si richiede l’impiego di metodi statistici multivariati. Infatti l’ottica aziendalistica dell’analisi di bilancio tende a considerare simultanemente più indici di bilancio ovvero più caratteristiche della struttura e gestione aziendale. Tale analisi, opera attraverso schemi interpretativi basati sulle relazioni contabili fra le poste (e, di conseguenza, fra gli indici). Se consideriamo, ad esempio, l’analisi della redditività operativa che scompone il ROI nel prodotto fra gli indici ROS e turnover, nella mente dell’analista è presente una variabile di sintesi del fenomeno (il ROI) che viene scomposta in componenti espressive di aspetti significativi del fenomeno, sfruttando i legami esistenti fra gli indici, legami che sono basati su identità contabili. La caratteristica delle osservazioni (indici di bilancio: variabili quantitative) e la natura prevalentemente esplorativa dello studio (ovvero non esiste un modello di comportamento da verificare) suggerisce l’impiego di un metodo di riduzione dei dati come l’analisi delle componenti principali (ACP) che, nel caso presente, può perseguire i seguenti scopi: 1) le componenti individuate dal metodo possono identificarsi con significative variabili di sintesi del fenomeno. Tali variabili di sintesi avrebbero qui un significato più ampio in quanto non derivano da identità contabili ma dal sistema di interrelazioni fra gli indici espresso dalla corrispondente matrice di covarianza o di correlazione; 2) l’individuazione di gruppi di imprese con caratteristiche simili ovvero di imprese leader può avvenire mediante un’analisi grafica rispetto alle variabili di sintesi individuate attraverso l’ACP. Analisi delle concorrenza 33 3.3 Analisi preliminare dei dati L’applicazione di una metodologia statistica multivariata, come è appunto l’ACP, richiede sempre un’analisi univariata preliminare, volta a studiare le principali caratteristiche distributive delle singole variabili. La Tab. 3.3.1 mostra i valori dei principali indici sintetici: media aritmetica, scarto quadratico medio (SQM), coefficiente di variazione (CV, che è il rapporto fra SQM e media aritmetica), indice di asimmetria e di curtosi (v. capitolo 2). Tab. 3.3.1 Principali caratteristiche distributive degli indici di bilancio Media Minimo Massimo SQM CV Asimm. Curtosi Indici ROE 0.067 -0.279 0.688 0.174 2.595 1.649 5.088 ROI 0.076 -0.012 0.412 0.078 1.024 2.240 5.985 CR 1.309 0.685 3.212 0.495 0.378 1.959 4.564 QR 0.884 0.169 2.256 0.409 0.463 1.597 2.896 MTCI 0.787 0.360 1.034 0.151 0.192 -0.976 0.724 QUOTA(%) 0.903 0.016 6.235 1.258 1.393 2.594 7.076 0.883 0.004 6.120 1.128 1.277 2.756 9.625 RS(%) SQM: scarto quadratico medio; CV=coefficiente di variazione. Dalla Tab. 3.3.1 possiamo notare che, mediamente, la redditività globale espressa dal ROE è pari al 6.7% e quella operativa è pari al 7.6% anche se la presenza di valori negativi denota situazioni di perdita. La struttura finanziaria a breve è mediamente soddisfacente con un CR di poco superiore a 1 e QR vicino a 0.9. In media, l’indebitamento totale raggiunge circa il 79% del capitale investito nella gestione caratteristica (v. indice MTCI). Il mercato si presenta frammentato: la quota di media è inferiore al 1% con una punta massima del 6%. Analogo è l’andamento della percentuale di attivo destinata a spese per la ricerca e per attività di marketing (RS). I valori del CV consentono di confrontare la variabilità di grandezze con scala diversa (QUOTA e RS, a differenza degli altri indici, sono in valori percentuali). Si nota una maggior omogeneità delle unità rispetto alle variabili strutturali QR, CR, MTCI. La più alta variabilità di ROE rispetto a ROI indica un’incidenza differenziata della gestione extra-caratteristica. Gli indici di asimmetria e di curtosi evidenziano una peculiarità delle distribuzioni degli indici di bilancio: l’asimmetria (in prevalenza di tipo positivo) e l’eccessiva curtosi. Tali distribuzioni non verificano, pertanto, due proprietà tipiche della distribuzione normale. Ai fini 34 Analisi della concorrenza dell’applicazione del metodo ACP ciò non rappresenta un problema dal momento che non è necessario introdurre alcun modello probabilistico (e quindi nemmeno quello normale), dato che l’ACP è una metodologia esplorativa di analisi dei dati. 3.4 L’analisi in componenti principali Le fasi per la conduzione e l’interpretazione di una ACP possono essere riassunte nei punti seguenti: 1) scelta della matrice sulla quale condurre l’analisi: di covarianza o di correlazione; 2) estrazione delle componenti e valutazione della capacità di riduzione dei dati; 3) interpretazione delle componenti scelte; 4) analisi dei dati rispetto alle componenti individuate e, attraverso queste, rilettura del fenomeno rispetto alle variabili originarie. 1) Scelta della matrice sulla quale condurre l’ACP. Come sappiamo, i risultati di una ACP sulla matrice di correlazione sono, in generale, diversi da quelli ottenuti usando la matrice di covarianza, pertanto è necessario operare una scelta. Nel caso presente, gli indici di bilancio non sono grandezze espresse in diversa unità di misura in quanto trattasi di ‘numeri puri’ (rapporti fra poste di valori monetari). Tuttavia, i 7 indici di bilancio hanno scala diversa. Infatti QUOTA e RS sono espressi in percentuale, mentre non lo sono, ad esempio, ROE e ROI. Differenze di scala esistono, tuttavia, anche fra ROI e CR: lo scarto quadratico medio di CR è circa 6 volte quello di ROI. In questo caso ci dobbiamo porre la seguente domanda: i valori dello scarto quadratico medio (e quindi della varianza) rispecchiano l’importanza che le variabili hanno, in riferimento al fenomeno indagato? Se la risposta è affermativa possiamo condurre l’ACP sulla matrice di covarianza, altrimenti conviene usare quella di correlazione. La matrice di correlazione è la matrice di varianza e covarianza delle variabili standardizzate, ovvero di variabili che hanno tutte varianza unitaria (e quindi stessa importanza). Nel caso presente optiamo per la matrice di correlazione, che è riportata nella Tab. 3.4.1 (dal momento che è simmetrica, presentiamo solo i valori della parte triangolare inferiore). Tale matrice esprime i legami di associazione (correlazione lineare) fra gli indici e quindi ingloba implicitamente l’effetto di vincoli e identità contabili insite nei dati. Vediamo, ad esempio, una forte correlazione fra gli indici di Analisi delle concorrenza 35 redditività e fra quelli di struttura finanziaria (v. valori in grassetto). Da notare il segno negativo del coefficiente di correlazione lineare fra CR e MTCI e fra QR e MTCI: all’aumentare di MTCI ovvero all’aumentare del grado complessivo di indebitamento, si abbassano i valori di CR e QR. Relazioni molto tenui presentano QUOTA e RS, sia fra loro sia con gli altri ratio. Tab. 3.4.1 Matrice di correlazione ROE ROI CR Indici ROE 1.000 ROI 1.000 0.830 CR -0.002 0.068 1.000 QR 0.034 0.193 0.871 MTCI -0.181 -0.333 -0.782 QUOTA 0.086 0.117 -0.128 RS -0.265 -0.144 -0.155 QR MTCI QUOTA 1.000 -0.749 -0.059 -0.094 1.000 0.002 -0.013 1.000 0.086 RS 1.000 E’ chiaro che l’ACP presuppone la validità della correlazione lineare nel rappresentare i legami fra le variabili. Pertanto lo scatterplot multiplo, riportato in Fig. 3.4.1, può aiutare nella lettura dei valori della matrice di correlazione. Ogni diagramma a punti che compone il grafico riporta, in ascissa, i valori della variabile indicata in alto; in ordinata, i valori della variabile indicata a destra. Sulla diagonale si trovano gli istogrammi di frequenza. Fig. 3.4.1 Scatterplot matrix ROE ROA CR QR MTCI QUOTA RS 36 Analisi della concorrenza Come si può facilmente notare, in alcuni casi la Fig. 3.4.1 non evidenzia chiari legami associativi di tipo lineare come, del resto, già era emerso dalla lettura della matrice di correlazione. La presenza di variabili poco correlate tende a limitare l’efficacia dell’ACP quale metodo di riduzione dei dati. 2) Estrazione delle componenti. La matrice di correlazione, di dimensione 7x7, non evidenzia situazioni di perfetta dipendenza lineare fra variabili, pertanto si avranno 7 autovalori positivi. Questi sono riportati in ordine decrescente, nella Tab. 3.4.2. Come è noto ciascuno di essi esprime la varianza spettante ad una componente principale (agli autovalori più grandi sono associate le componenti più importanti). Dalla Tab. 3.4.2 è importante notare che: • la somma degli autovalori è uguale alla somma delle varianze delle variabili originarie (attenzione: le varianze sono tutte unitarie in quanto si sta usando la matrice di correlazione ovvero si sta lavorando con variabili standardizzate); • la quota di varianza spiegata da ogni componente è data dal rapporto fra il corrispondente autovalore e il totale 7. Dalla Tab. 3.4.2 e dalla Fig. 3.4.2 vediamo che le prime tre componenti assorbono oltre l’81% della varianza totale. Anche il criterio di scelta basato sull’autovalore medio, conduce alla selezione delle prime tre componenti. Il grado di riduzione è del 43% (=3/7): il numero di variabili viene più che dimezzato. Tab. 3.4.2 Porzione di varianza spiegata da ogni componente Autovalori Varianza spiegata Varianza cumulata Componenti COMP1 COMP2 COMP3 COMP4 COMP5 COMP6 COMP7 Totale 2.762 1.827 1.098 0.835 0.226 0.172 0.081 7.000 (%) (%) 39.458 26.098 15.689 11.922 3.226 2.453 1.154 100.000 39.458 65.556 81.245 93.167 96.393 98.846 100.000 L’utilizzo delle prime 3 componenti è soddisfacente anche in termini di quota varianza spiegata delle variabili originarie, espressa dal valore della communality R2 (ovvero indice di determinazione lineare del modello avente come dipendente la variabile originaria e come Analisi delle concorrenza 37 regressori le 3 componenti) in Tab. 3.4.3. Risultati leggermente peggiori si ottengono per QUOTA e RS. 3) Interpretazione delle componenti scelte. Nella Tab. 3.4.3 sono state evidenziate in grassetto le correlazioni più marcate fra componenti e variabili originarie. In base a questi risultati, possiamo derivare il significato delle tre componenti. La prima componente (COMP1) è correlata positivamente con CR, QR e negativamente con MTCI. Essa sintetizza la situazione finanziaria di breve e lungo periodo. Valori elevati di COMP1 segnalano situazioni favorevoli; valori bassi situazioni meno favorevoli (alto indebitamento a lungo e bassa liquidità); La seconda componente (COMP2) è correlata positivamente con ROE e ROI. COMP2 sintetizza il livello di redditività. Valori elevati (bassi) di COMP2 segnalano redditività alta (bassa). La terza componente (COMP3) presenta le più alte correlazioni con QUOTA e RS. COMP3 esprime, quindi, la posizione prodottomercato dell’azienda e il potenziale di espansione dell’azienda. Poiché le correlazioni di COMP3 con QUOTA e RS sono negative, allora valori elevati di COMP3 indicano basse quote di mercato e bassi valori di RS, e viceversa. Fig. 3.4.2 Percentuale di varianza spiegata dalle componenti 100 90 Varianza cumulata (%) 80 70 60 50 40 30 20 10 0 1 2 3 4 Componenti estratte 5 6 7 38 Analisi della concorrenza Tab. 3.4.3 Correlazione fra variabili e componenti COMP1 COMP2 COMP3 Variabili ROE 0.367 0.053 0.875 ROI 0.486 -0.100 0.798 CR -0.395 0.057 0.874 QR -0.314 -0.044 0.885 MTCI 0.149 0.196 -0.892 QUOTA -0.055 0.259 -0.734 RS -0.215 -0.286 -0.709 R2 0.902 0.883 0.923 0.883 0.856 0.609 0.631 5) Analisi dei dati rispetto alle componenti scelte. La Tab. 3.4.4, in colonna, presenta i coefficienti (sono gli autovettori della matrice di correlazione associati ai primi 3 autovalori) che, applicati ai valori standardizzati delle variabili originarie, forniscono i valori delle componenti. Tali coefficienti sono scalati in modo che le componenti principali abbiano varianza unitaria. Tab. 3.4.4 Coefficienti delle componenti principali COMP1 COMP2 Variabili ROE 0.133 0.479 ROI 0.176 0.437 CR 0.316 -0.216 QR 0.320 -0.172 MTCI -0.323 0.082 QUOTA -0.020 0.142 RS -0.078 -0.156 COMP3 0.048 -0.091 0.052 -0.040 0.178 -0.668 -0.646 Ad esempio, il valore di COMP1 per la generica azienda i-esima, viene calcolato come segue: COMP1i= 0.133 ROEi*+ 0.176 ROIi*+ 0.316 CRi*+ 0.320 QRi*– – 0.323 MTCIi*– 0.020 QUOTAi*– 0.078 RSi* dove l’asterisco sta ad indicare il valore standardizzato della variabile e non quello originario. Passando all’analisi grafica dei dati mediante le componenti estratte, vediamo innanzi tutto la Fig. 3.4.3 che riporta le 52 osservazioni rispetto ai valori di COMP1 (in ascissa) e COMP2 (in ordinata). Nel grafico abbiamo evidenziato il punto (0,0) che rappresenta i valori medi di COMP1 e COMP2. Si individuano così quattro quadranti: • quadrante di nord-ovest: redditività (COMP2) sopra la media ma situazione finanziaria (COMP1) inferiore. Qui potrebbero trovarsi, ad esempio, casi di sfruttamento dell’effetto leva finanziaria. Analisi delle concorrenza • 39 quadrante di nord-est: redditività e situazione finanziaria sopra la media; • quadrante di sud-est: redditività sotto la media ma situazione finanziaria sopra; • quadrante di sud-ovest: redditività e situazione finanziaria sotto la media. Qui possono trovarsi casi di sofferenza economica e finanziaria. La Fig. 3.4.3 mostra un addensamento delle unità piuttosto vicino alla media. Tuttavia si notano valori abbastanza eccezionali soprattutto nella parte est. In particolare, i punti del quadrante nord-est segnalano situazioni particolarmente favorevoli che potrebbero meritare un’analisi più approfondita e, eventualmente, uno studio di caso aziendale. La Fig. 3.4.4 riporta i dati rispetto a COMP3 (in ascissa) e COMP2 (in ordinata). Abbiamo scelto questa rappresentazione in alternativa a quella di COMP3 versus COMP1 in quanto appare più interessante esaminare congiuntamente gli elementi di redditività (contenuti in COMP2) e di potenzialità di espansione (COMP3). Lasciamo al lettore l’interpretazione dei quattro quadranti. Ci limitiamo a notare che la maggior parte dei dati si attesta piuttosto vicino alla media. Unità estreme che potrebbero essere rappresentative di qualche situazione da esaminare più a fondo si collocano nel quadrante sud-ovest e nord-est. Fig. 3.4.3 Scatter delle osservazioni rispetto alle prime due componenti 4.5 3.5 COMP2 2.5 1.5 0.5 -0.5 -1.5 -2.5 -2 -1 0 1 COMP1 2 3 40 Analisi della concorrenza Fig. 3.4.3 Scatter delle osservazioni rispetto alla seconda e terza componente 4.5 3.5 2.5 COMP2 1.5 0.5 -0.5 -1.5 -2.5 -4.5 -3.5 -2.5 -1.5 -0.5 0.5 1.5 COMP3 A conclusione di questo capitolo, è importante sottolineare che l’ACP riveste essenzialmente un ruolo strumentale (la riduzione dei dati) offrendo una rappresentazione sintetica della struttura di variabilità delle osservazioni. Le componenti principali hanno unità di misura (origine degli assi e scala) arbitraria e, quindi, è importante soprattutto interpretare la forma del grafico, individuando eventuali unità che si distinguono per la loro posizione. La lettura del fenomeno non finisce qui: la posizione delle unità di particolare interesse deve essere interpretata ritornando ai valori delle variabili originarie. Infatti, i risultati di una ACP dipendono dalla sola struttura di correlazione (di covarianza) in cui la posizione, in termini assoluti, delle variabili originarie (ad esempio, l’entità della media aritmetica) viene persa. Infine, vogliamo far notare che il percorso dello studio è analogo a quello che, tradizionalmente, viene seguito dall’analista aziendale: prima si guarda alle variabili di sintesi (che qui sono rappresentate dalle componenti principali) e successivamente si scende nel dettaglio esaminando altre grandezze che compongono la stessa variabile di sintesi. Previsione insolvenze 4. 41 Analisi statistica multivariata dei dati di bilancio. Modelli statistici per la previsione delle insolvenze. Un caso di studio Introduzione 4.1 Premesse teoriche generali: insolvenza e cause di insolvenza 4.2 Analisi statistica dei bilanci e insolvenza: una breve rassegna 4.3 L’analisi discriminante per lo studio dell’insolvenza 4.4 Un caso di studio Introduzione La concessione di prestiti e la gestione del rischio che ne consegue costituiscono la caratteristica essenziale delle banche e di alcune tipologie di intermediari finanziari come le società di leasing, factoring e di credito al consumo. La fase decisionale che valuta la capacità futura di rimborso del prestito (capitale e interessi) si basa su un ampio insieme informativo inerente alle caratteristiche individuali del richiedente (azienda, soggetto) e alle connotazioni ambientali (es. andamento del settore e/o della regione) in cui il richiedente opera. L’elaborazione di tali informazioni mira all’attribuzione (in modo esplicito, implicito, formalizzato o meno) di una valutazione o punteggio sintetico che vuole rappresentare la probabilità di rimborso. Si può ipotizzare che la probabilità di rimborso regolare dei debiti dipenda da: 1) la capacità reddituale futura dell’impresa (che indichiamo con R); 2) caratteristiche comportamentali del cliente: moralità, sua correttezza personale e volontà di rimborsare regolarmente il prestito (che indichiamo con C). La probabilità di rimborso è quindi pensabile come funzione di R e C: P(rimborso regolare) = F(R,C). in cui R rappresenta, più che altro, elementi oggettivi mentre C può risentire anche di fattori soggettivi. 42 Previsione insolvenze E’ importante osservare che su C può agire direttamente il finanziatore mettendo in atto tutte quelle misure che hanno lo scopo di contenere ex ante il rischio di credito (tipo di contratto, richiesta di garanzie, ecc.). Inoltre, C assume un ruolo relativamente meno importante nelle aziende organizzate in forma societaria e di grandi dimensioni, dove le numerose categorie operanti (management, soci, ecc.) trovano completa convergenza di interessi nella continuazione della vita dell’impresa Pertanto potremo assumere che: P(rimborso regolare)≅ f(R) Elemento fondamentale diventa quindi l’apprezzamento delle potenzialità di reddito e la valutazione delle condizioni economiche, finanziarie e patrimoniali dell’impresa, per capire se la concessione del prestito possa concorrere positivamente alla formazione di reddito della banca. Pertanto in R vediamo coinvolte le principali misure di performance aziendali, mentre la specificazione di f può essere ottenuta ricorrendo ai metodi statistici multivariati, prima fra tutti l’analisi discriminante. Questa metodologia quantitativa consente di sintetizzare in un unico indicatore il profilo dell’impresa, espresso dall’insieme degli indici di bilancio, indicatore che esprime il rischio di insolvenza. In questo capitolo viene delineato brevemente lo sviluppo dei modelli statistici per l’analisi dell’insolvenza e, nell’ultimo paragrafo, viene presentato un caso di studio. La discussione su alcune teorie che stanno alla base del fenomeno dell’insolvenza è utile per giustificare la collocazione dell’analisi prevalentemente a livello micro: il rischio di insolvenza è ipotizzato generalmente essere funzione delle sole caratteristiche individuali (indici di bilancio). Vogliamo precisare che, nel presente capitolo, diamo per scontata la conoscenza dei vari approcci di analisi discriminante, che viene spiegata in modo approfondito nella nota metodologica contenuta nel capitolo 6. 4.1 Premesse teoriche generali: insolvenza e cause di insolvenza La crisi aziendale è una manifestazione di tipo patologico che può svilupparsi in più stadi. Cause principali sono fenomeni di squilibrio e Previsione insolvenze 43 di inefficienza che possono essere di varia natura. Se tali difficoltà non vengono tempestivamente individuate e affrontate, si ha un processo di depauperamento delle varie risorse aziendali che, al di là di certi limiti, esplode nell’incapacità manifesta di fronteggiare gli impegni assunti e cioè nell’insolvenza. Il concetto di insolvenza si presta a diversi approcci di analisi che tengono conto della complessità del sistema aziendale. a) Insolvenza economica: assenza di redditività e stato di inefficienza del ciclo produttivo-commerciale (prodotti antiquati, tecnologie obsolete, rigidità di gestione sono alcune delle cause più frequenti); b) Insolvenza finanziaria: problemi di tesoreria, liquidità e rischio di inesigibilità. Squilibri fra mezzi propri e mezzi di terzi, fra debiti a breve e a lungo, ecc. sono assai frequenti nelle imprese e, a lungo andare, possono sfociare in situazioni di insolvenza. L’insolvenza finanziaria è più facilmente rilevabile attraverso indicatori di rapida consultazione quali, ad esempio, il Bollettino Ufficiale dei Protesti. c) Insolvenza giuridica. Il fallimento è la constatazione giuridica dell’insolvenza finanziaria e rappresenta lo strumento col quale il legislatore dichiara la crisi aziendale e garantisce i diritti dei terzi. Nei casi di crisi reversibile, il legislatore ha previsto lo strumento di amministrazione controllata. Data la complessità con cui si può manifestare, il fenomeno dell’insolvenza può avere cause molteplici. La letteratura economicoaziendale ha individuato varie tipologie di cause che possono minare l’equilibrio aziendale. Esse vengono generalmente classificate secondo due criteri: A) in base al rapporto temporale fra origine della causa e manifestazione dell’insolvenza: cause remote o prossime; B) in base all’ambiente di origine della cause: cause esterne o interne. In merito al punto A), cause remote sono da ricercare in squilibri e inefficienze strutturali e cioè aventi natura di lungo termine. Incapacità del management, cattiva qualità del sistema informativo (relativamente al controllo budgetario, ai processi di programmazione), stile direzionale troppo rigido, squilibri nelle competenze possono costituire esempi di cause remote. Nelle medie e piccole imprese, il vertice imprenditoriale coincide molto spesso con 44 Previsione insolvenze l’assetto proprietario e riassume in sé tutte le funzioni aziendali, spesso senza poter maturare la giusta competenza nelle varie aree. La limitata esperienza in materia di gestione, costituiscono una grave minaccia per la vita dell’azienda. La classificazione del punto B) distingue fra cause derivanti da scelte imprenditoriali sbagliate e cause dovute a forze e fenomeni che sfuggono al dominio degli uomini dell’impresa. Tuttavia accade che, in pratica, neppure mediante uno studio di caso aziendale si riesce a individuare le corrette interazioni fra i due tipi di cause. Certamente la crisi di impresa risulta legata anche all’andamento del ciclo economico (aspetti congiunturali dell’economia) e a cicli di settore. Ad esempio, con riferimento agli ultimi 30 anni, i principali processi di mutamento ambientale che hanno influenzato lo stato di salute delle imprese sono: 1) variazioni spaziali dei livelli di costo del lavoro che hanno favorito i paesi emergenti dell’Asia orientale; 2) i prezzi del petrolio e delle materie prime che hanno subito improvvise impennate negli anni 1973 e 1985; 3) alta instabilità dei cambi valutari che ha agito con effetti altalenanti sui prezzi dei beni destinati all’esportazione; 4) rapidi processi innovativi e accelerazione dell’evoluzione tecnica; 5) fenomeno inflazionistico. Fra le cause interne, gli errori gestionali più ricorrenti che possono compromettere l’equilibrio aziendale riguardano un eccessivo sviluppo del fatturato non accompagnato da un adeguato apporto di capitali permanenti. Questa situazione può degenerare in una crisi se, all’aumentare del fatturato e del conseguente fabbisogno di capitale circolante, salgono i prestiti bancari e con essi gli interessi passivi, ma non crescono allo stesso tempo liquidità, capitale proprio e profitto. Relativamente alle imprese minori che, nel nostro paese, rappresentano circa il 90% del totale, tre sono i punti problematici: (i) il livello di cultura del vertice imprenditoriale; (ii) le difficoltà di accesso alle vie dell’aumento del capitale di rischio; (iii) le difficoltà di accesso al credito a medio-lungo termine, col rischio di sbilanciamento della struttura finanziaria verso il credito bancario a breve. L’incidenza dei finanziamenti a breve sulle passività totali è di circa 39% per le piccole e medie aziende (secondo la classificazione Istat: aziende con meno di 20 addetti) contro il 19% delle grandi. Previsione insolvenze 45 4.2 Analisi statistica dei bilanci e insolvenza: una breve rassegna Per valutare in maniera completa ed esauriente lo stato di salute di un’impresa, è necessario compiere un’analisi che tenga conto delle numerose variabili qualitative (strategie, qualità del management, ecc.) e quantitative (dati di bilancio, dati macroeconomici e/o di settore) che la caratterizzano. In particolare, l’analisi basata sugli indici di bilancio costituisce l’elemento fondamentale dell’approccio più recente alla modellazione del rischio di insolvenza. Il contributo dell’analisi statistica in questo senso può avere: 1) scopi descrittivi ed esplicativi di come si manifesta e si sviluppa una crisi aziendale. Da questa analisi è possibile risalire alle cause che hanno agito nel determinare lo stato di insolvenza; 2) scopi predittivi: costruzione di un modello che valuti il rischio associato ad una data struttura di ratio di bilancio. Questo approccio di studio può identificare quegli indici di bilancio maggiormente significativi a diagnosticare precocemente situazioni di crisi. I primi studi statistici sull’insolvenza aziendale, sono stati condotti negli anni 30, in U.S.A., ad opera di vari autori soprattutto statunitensi. Fino algli anni 60, si è trattato prevalentemente di analisi statistiche univariate dei ratio di bilancio, che si proponevano principalmente di rispondere ai seguenti quesiti: • quale indice, in base ai valori assunti in esercizi precedenti, è in grado di prevedere con congruo anticipo la manifestazione di insolvenza ? • in un campione di imprese reali, quali sono gli indici di bilancio che, più degli altri, presentano distribuzioni diverse fra le imprese sane e fra le imprese insolventi ? Riportiamo, brevemente, i risultati di uno studio condotto da Beaver nel 1966 (cfr. Foster, 1986). Avvalendosi di 79 imprese sofferenti (poiché incorse, nel periodo 1954-64, in uno dei seguenti fenomeni: fallimento, mancato pagamento di obbligazioni in scadenza, mancato pagamento dei dividendi sulle azioni privilegiate), ed un gruppo di 79 imprese sane, il Beaver ha determinato la capacità di alcuni indici di bilancio, nel segnalare precocemente situazioni di crisi, attraverso due tecniche: 46 Previsione insolvenze 1) l’analisi dei profili temporali: esame dell’andamento rispetto al tempo, dei valori medi dell’indice (riferiti a periodi precedenti l’insolvenza) calcolati all’interno dei due gruppi di imprese; 2) il calcolo del valore critico (cut off) dell’indice che separa meglio il gruppo delle aziende sane da quello delle aziende insolventi. La capacità predittiva dell’indice è valutata in base al tasso di errore commesso nel riclassificare, mediante i valori dell’indice, le aziende nei due gruppi originari. L’analisi dei profili consente di rilevare che le medie di alcuni indici hanno andamenti molto differenziati per i due gruppi di imprese. Tale differente comportamento si evidenzia già alcuni anni prima l’evento di insolvenza. Nelle figure seguenti sono rappresentati, a titolo di esempio, gli andamenti di due indici ripresi da Foster (1986). Le due spezzate rappresentano le medie degli indici per i 5 anni precedenti l’insolvenza. Redd.netto/Tot. attivo 0,2 0,1 Sane 0 -0,1 5 4 3 2 1 Insolventi -0,2 Anni precedenti l'insolvenza Tot. Debiti/Tot. passivo 0,8 0,6 Sane 0,4 Insolventi 0,2 5 4 3 2 1 Anni precedenti l'insolvenza Previsione insolvenze 47 In base al criterio 2), Beaver classificò in ordine crescente i valori assunti da ognuno degli indici di bilancio per tutte le aziende (sia il gruppo delle insolventi sia quello delle sane). Per ogni indice calcolò il miglior punto critico (punto di cut-off) che consentiva la migliore riclassificazione delle imprese del campione, nel proprio gruppo di appartenenza. Le operazioni per questa analisi sono quindi: 1) ordinare in senso crescente (o descrescente) i valori del ratio; 2) individuare un valore intermedio k che ripartisce le unità in due set: le unità con valori del ratio inferiori a k e quelle unità con valori superiori; 3) si verifica se tale valore intermedio può essere utilizzato per classificare le unità nei due gruppi originali. Se, ad esempio, si decide che tutte le unità con valore del ratio inferiore a k siano da ritenersi insolventi, si costruisce la seguente tabella di classificazione in base alla quale è possibile calcolare la percentuale totale di errata classificazione che è pari a 100(n01+n10)/n. Gruppi veri Sane Insolventi Gruppi assegnati ratio<k ratio≥k (Insolventi) (Sane) n00 n01 n10 n11 Totale n0 n1 4) il migliore punto di cut-off per un dato indice di bilancio, sarà quel valore per il quale si ottiene la minore percentuale di errata classificazione. A titolo di esempio riportiamo i risultati ottenuti da Beaver per i due indici rappresentati nelle figure precedenti, esaminando i dati di bilancio relativi agli anni precedenti la crisi. Tab. 4.2.1 Errori percentuali di classificazione Indici Anni precedenti l’insolvenza 5 4 3 2 Redd.netto/Tot.attivo 28 29 23 21 Tot.debiti/Tot.passivo 28 27 24 25 1 13 19 Fonte: Foster (1986) L’analisi condotta da Beaver mostrò che alcuni indici di bilancio (soprattutto quelli di liquidità e di indebitamento) sono capaci di 48 Previsione insolvenze segnalare precocemente lo stato di crisi dell'azienda. Inoltre col criterio del cut off, è possibile proporre una regola di classificazione sulla base del valore dell’indice di bilancio. Da questo studio vediamo una peculiarità comune alle ricerche sull’insolvenza: l’impiego di dati retrospettivi. Infatti, individuata la crisi aziendale al tempo t, vengono analizzati i dati di bilancio riferiti ad un anno (o più anni) precedente sia per le imprese insolventi al tempo t sia per quelle sane al tempo t, queste ultime usate come termine di confronto. Il procedimento appare coerente con l’impostazione descritta nell’introduzione: il modello statistico avrebbe infatti lo scopo di prefigurare lo stato di salute futuro dell’azienda. Il limite principale dell’approccio univariato al rischio di insolvenza è quello di considerare ogni singolo indice separatamente dagli altri mentre, come suggerito anche dall’economia aziendale, gli indici sono espressione delle diverse dimensioni del sistema aziendale che sono interconnesse. Lo studio separato dei vari indici conduce anche a difficoltà interpretative in quanto i vari quozienti spesso danno responsi divergenti sulla situazione dell’impresa (una medesima azienda potrebbe risultare classificata nel gruppo delle fallite in base ad un indice e nel gruppo delle sane in base ad un altro indice) rendendo difficile una sua valutazione globale. Per la verità, già prima degli anni 60, ci sono stati dei tentativi di costruzione di un punteggio sintetico, mediante medie aritmetiche ponderate di indici di bilancio (cfr. la rassegna in Teodori, 1989). Tuttavia, in tali contributi, i pesi attribuiti ai vari indici risentono di elementi di natura soggettiva. Inoltre, tale media ponderata non tiene conto delle eventuali interrelazioni (correlazioni) esistenti fra gli indici. Mediante l’analisi statistica multivariata è possibile valutare in senso globale, attraverso un gran numero di indici di bilancio considerati simultaneamente, la situazione economico-finanziaria dell’impresa e di sintetizzare questa valutazione in modo da facilitare l’interpretazione dei risultati e favorire il loro confronto. Previsione insolvenze 49 A partire dalla fine degli anni 60, i lavori basati su metodologie di natura multidimensionale sono divenuti sempre più numerosi. La metodologia più utilizzata è l'analisi discriminante (AD) lineare1. L’AD lineare è stata utilizzata per la prima volta da Altman (1968; 1983), il quale ha ricavato il cosiddetto modello Z-score (si tratta del punteggio della funzione discriminante). I risultati ottenuti furono di gran lunga migliori di quelli di Beaver e il modello riscosse in breve tempo un notevole successo sia sul piano teorico sia su quello pratico, aprendo la strada a numerosi lavori. Accanto alla tecnica della AD, altre metodologie sono state impiegate per affrontare il problema della previsione delle crisi aziendali. Ad esempio, l’AD è stata applicata sulle componenti principali ricavate da un insieme di indici, in modo da ridurre l’analisi ad un minore numero di indicatori (cfr. Rossi, 1984). Più recentemente è stata usata l’analisi discriminante logistica per la previsione delle crisi delle banche (Cannari e Signorini, 1995). Nonostante gli ampi margini di miglioramento ancora possibili, alcuni di questi modelli hanno raggiunto risultati così notevoli da essere ormai ritenuti strumenti indispensabili anche nella pratica aziendale. A dimostrazione della validità operativa raggiunta dalla metodologia in questione, la Centrale dei Bilanci (costituita dalla Banca d’Italia e dall’ABI) ha predisposto per le banche uno strumento basato su funzioni discriminanti per la rapida identificazione delle imprese che si trovano in una difficile situazione economico-finanziaria. Rimandiamo alla nota metodologica (capitolo 6) per la descrizione della tecnica AD. In questa sede esaminiamo le fasi per la costruzione di un modello per la previsione delle insolvenze e uno studio di caso. 4.3 L’analisi discriminante per lo studio dell’insolvenza Lo schema seguente mostra le principali fasi per costruzione di un modello di previsione delle insolvenze basato sull’AD. 1 Tali modelli di previsione delle insolvenze sono detti anche credit scoring adottando una interpretazione estensiva di questo termine rispetto a quanto avviene negli studi anglosassoni dove tale termine è utilizzato per indicare i modelli di finanziamento del credito al consumo. 50 Previsione insolvenze Fig. 4.3.1 Fasi per la costruzione di un modelli di analisi discriminante Definizione del gruppo delle imprese fallite Teorie delle cause di insolvenza Criteri di omogeneità Definizione del gruppo delle imprese sane Criteri di ‘bilanciamento’ Scelta dei ratios Controllo dati contabili Riclassificazioni di bilancio Stima della funzione discriminante Verifica dell’accuratezza classificatoria • analisi interne • analisi esterne Interpretazione della funzione • correlazioni Regola classificatoria Il modello di AD per la previsione dell’insolvenza è generalmente una funzione dei soli ratio di bilancio e, pertanto, si propone di sintetizzare in un unico valore (o punteggio, score) lo stato di salute di un’azienda. Poiché si tratta di un modello di previsione, esso è stimato da dati retrospettivi. Se si tratta di dati precedenti h anni la crisi di insolvenza, il modello, applicato ad aziende in vita, si propone di stimare precocemente (h anni prima) tale crisi. Previsione insolvenze 51 I principali problemi, di natura statistica, che si devono affrontare per la conduzione di una AD al fine di predisporre un modello per la previsione delle insolvenze aziendali, sono i seguenti: 1) 2) 3) 4) 5) 6) la definizione dei gruppi la composizione e formazione del campione la selezione delle variabili la distribuzione dei ratios aziendali il criterio classificatorio i costi di errata classificazione 1) La definizione dei gruppi. Uno dei presupposti dell’impiego dell’AD è che esista una differenza fra le due popolazioni di aziende: quella delle aziende sane e quella delle fallite. Le popolazioni di riferimento possono essere costituite dal portafoglio prestiti di un’azienda di credito, dalle aziende di un determinato settore di attività economica, di un comparto produttivo, ecc. Determinata la popolazione di riferimento, è necessario trovare un criterio in base al quale si individuano, all’interno di essa, i due gruppi di aziende. Il criterio più frequentemente utilizzato è la dichiarazione di fallimento. Individuate le aziende fallite ad un determinato periodo t, si definisce in corrispondenza (secondo dei criteri che vedremo più avanti) la popolazione di aziende sane. Allo scopo di costruire modelli di previsione, verranno utilizzati dati di bilancio riferiti ad un anno (o più) precedente il fallimento. Un’alternativa può essere quella di dichiarare insolvente o anomala l’impresa dichiarata insolvente all’Anagrafe Centrale dei Rischi della Banca d’Italia. Se ci basiamo sul portafoglio crediti di un’azienda di credito, si definiscono insolventi le aziende che, avendo ottenuto un prestito, non lo hanno poi rimborsato. Il portafoglio crediti, tuttavia, contiene solo le imprese affidate e non tiene conto delle caratteristiche di quelle che non sono state giudicate meritevoli di prestito. L’AD condotta su questo tipo di dati produce dei risultati difficilmente generalizzabili. Anche la definizione di impresa sana è abbastanza incerta. Un’impresa in attività non è un dato sufficiente per affermare che essa si trovi in equilibrio economico finanziario. Conseguenze di tali 52 Previsione insolvenze incertezze sono l’incapacità discriminatoria della AD in quanto i due gruppi di aziende non sono ben distinti rispetto ai valori dei ratio. E’ bene precisare che, solitamente, un modello di AD è costruito per una tipologia abbastanza omogenea di aziende (es. manifatturiere del settore tessile). Infatti, la letteratura mostra prestazioni migliori per i modelli cosiddetti ‘di settore’, rispetto a modelli riferiti da imprese più eterogenee. 2) Composizione e formazione del campione In generale, il numero di aziende fallite è relativamente limitato. Per ottenere una numerosità statisticamente adeguata, alcuni autori hanno dovuto cumulare i fallimenti verificatisi in più periodi di tempo (anni). Il raggruppamento delle aziende fallite può presentare un grave inconveniente: alcuni quozienti di bilancio possono subire nel corso degli anni notevoli variazioni, a causa di diversi fattori come l’inflazione, mutamenti tecnologici ecc. Considerare bilanci che sono troppo distanti nel tempo può creare disomogeneità nei dati. La scelta delle aziende sane viene generalmente condizionata alla composizione del gruppo di aziende fallite. Si ritiene, infatti, che i due gruppi di imprese debbano rispettare determinati criteri di omogeneità. Si parla di procedure di bilanciamento o appaiamento che, talvolta, possono richiedere dei procedimenti specifici per la conduzione di un’analisi statistica. I principali criteri di bilanciamento sono basati sulle seguenti caratteristiche aziendali. a) L’oggetto sociale e/o stesso settore di appartenenza; b) La dimensione aziendale. Il fattore dimensionale influisce sulla propensione al fallimento come esposto nel primo paragrafo. Le dimensioni aziendali sono solitamente misurate dall’ammontare del capitale investito, dal fatturato, dal numero dei dipendenti; c) La forma giuridica. Alle varie forme giuridiche corrispondono diversi gradi di responsabilità e diverse composizioni dei soggetti apportatori di capitale, che possono influire in modo rilevante sulla struttura finanziaria e patrimoniale delle aziende. d) L’età dell’azienda. E’ stata empiricamente verificata la maggior propensione a fallire delle imprese relativamente più giovani. Per capire meglio quanto detto si fa il seguente esempio. Poiché l’età dell’azienda può influenzare la propensione all’insolvenza, se i due gruppi di aziende sono diversi rispetto all’età, si rischia di attribuire Previsione insolvenze 53 agli indici di bilancio coinvolti nella AD, anche quegli effetti discriminatori che sono dovuti alla differenza dell’età media dei due gruppi. Concludendo, il campione ha generalmente un disegno stratificato (rispetto all’evento insolvenza/non insolvenza) con frazione di campionamento diversa per i due gruppi di aziende: le sane e le fallite (spesso il campione delle fallite contiene l’intera sottopopolazione) 3) Selezione delle variabili. Dall’esame della letteratura si possono riscontrare tre tipologie di variabili inserite nei modelli di insolvenza: a) indici di bilancio; b) variabili derivate dagli indici di bilancio; c) variabili a livello macro. La tipologia prevalente è quella degli indici di bilancio. L’impiego di questi richiede di affrontare le seguenti problematiche. • Valutazione dell’effetto distorsivo delle politiche di bilancio o window dressing operations sul modello di insolvenza. Specialmente nel contesto italiano dove il bilancio è fortemente fiscal driven occorre prestare attenzione a quelle poste di bilancio nelle quali si annidano sottovalutazioni (sopravvalutazioni) di elementi reddituali o patrimoniali positivi (negativi). • Effetti distorsivi del cambiamento di potere di acquisto della moneta sui valori di bilancio. Su questo punto l’evidenza empirica ha mostrato che l’impiego di dati rettificati rispetto a quelli a valori correnti, non comporta né miglioramenti né peggioramenti significativi. Si preferisce non ricorrere alla rettifica in quanto questa operazione può introdurre ulteriori incertezze senza apprezzabili vantaggi. • La capitalizzazione o meno dei beni in locazione finanziaria. E’ a partire dagli anni 80 che è iniziato un sempre maggior ricorso a questa forma di finanziamento. Su questo punto l’opinione dei vari autori è abbastanza discorde. Fra le variabili derivate dagli indici di bilancio (tipologia b), troviamo: • il trend degli ultimi anni (es. l’andamento del ROE, ecc.) che spesso viene espresso mediante il coefficiente angolare della retta di regressione della serie storica rispetto al tempo; • la variabilità osservata negli ultimi anni (ad es. del ROE, del current ratio, ecc.). Questa viene generalmente espressa dalla varianza della serie storica; 54 Previsione insolvenze • i market based ratio: si tratta di indici derivati dall’informativa di bilancio che hanno al numeratore la grandezza individuale e al denominatore l’aggregato dell’insieme delle aziende. Un esempio è costituito dalla quota di mercato. Fra le variabili (tipologia c) di livello macro (settore, economia nazionale, ecc.), i modelli di previsione delle insolvenze hanno visto l’impiego dell’indice generale dei prezzi al consumo e dell’indice generale della produzione industriale. Poiché gli indici di bilancio sono le variabili maggiormente utilizzate, vogliamo fare ulteriori considerazioni in merito. La scelta degli indici di bilancio deve essere condotta sulla base di teorie dell’insolvenza, studi ed esperienze maturate. La selezione può essere suggerita anche dagli specifici obiettivi perseguiti nello studio. Ad esempio, nello sviluppare modelli per le piccole e medie imprese, si dovrebbero scegliere quegli indici di bilancio che risentono meno delle manipolazioni contabili, si dovrebbe tenere conto del minore contenuto informativo di alcune poste di bilancio, ecc. Successivamente alla stima della funzione discriminante è possibile valutare il contributo di ogni singola variabile alla previsione dell’insolvenza. Non conviene affidare la scelta degli indici di bilancio esclusivamente a procedure automatiche contenute in pacchetti statistici (es. le procedure di tipo stepwise). Dall’analisi dei principali modelli di previsione delle insolvenze aziendali, si individua (Teodori, 1989) la prevalenza degli indici di liquidità. Le ragioni vanno ricercate sia nel fatto che la liquidità è la dimensione strutturale più analizzata da quando si sono sviluppate le analisi di bilancio sia perché non pochi autori inquadrano il fallimento come fenomeno cash-oriented. Gli indici di struttura finanziaria a lungo termine sono riscontrabili in modo particolare nei modelli italiani, segno di una maggiore attenzione ad archi temporali di dimensione più ampia. 4) La distribuzione dei ratio aziendali. Come esposto nella nota metodologica, l’AD normale presuppone la distribuzione normale multivariata delle variabili che, nel nostro caso, sono gli indici di bilancio. Vogliamo precisare che qui si intende la normalità della distribuzione congiunta delle variabili, e non (solo) la normalità della distribuzione del singolo indice di bilancio (distribuzione marginale). Tuttavia, poiché la normalità congiunta Previsione insolvenze 55 implica quella marginale, una verifica empirica può essere ragionevolmente condotta anche mediante un’analisi univariata. Come già esposto nei capitoli precedenti, le distribuzioni statistiche degli indici di bilancio sono caratterizzate da asimmetria e curtosi. Si tratta in genere di situazioni difficilmente riconducibili all’ipotesi di normalità. Di fatto, la verifica della condizione di normalità è stata quasi sempre elusa dalla maggior parte degli studiosi che hanno utilizzato l’AD normale. Tuttavia, alcuni autori (v. la rassegna in Maddala, 1983) hanno verificato un buon funzionamento della AD normale lineare anche nei casi in cui le ipotesi sulla normalità e sull’uguaglianza delle matrice di varianza e covarianza dei gruppi non sono soddisfatte. Inoltre, l’AD normale lineare può trovare una sua giustificazione autonoma in base ad una interpretazione geometrica. Infatti, l’uso del criterio classificatorio basato sulla verosimiglianza massima equivale a quello basato sulla distanza di Mahalanobis (al quadrato) fra la singola unità e il centroide del gruppo. Vogliamo infine osservare che l’impiego dell’AD logistica sarebbe comunque corretto in quanto non richiede alcuna ipotesi distributiva sui ratio di bilancio. 5) Il criterio classificatorio. La scelta fra criterio della verosimiglianza massima e criterio della massima probabilità a posteriori è connesso con: 1) la conoscenza o meno delle probabilità a priori (questa informazione giuoca un ruolo diverso a seconda che si tratti di AD normale e AD logistica). 2) l’accuratezza classificatoria relativa ai due gruppi. Poiché la proporzione dei due gruppi nella popolazione è marcatamente diversa, l’uso del criterio della massima probabilità a posteriori favorisce l’accuratezza classificatoria del gruppo più numeroso (sane) penalizzando quella del gruppo più piccolo (insolventi). Viceversa, l’utilizzo di uguali probabilità a priori consente una più corretta classificazione delle unità appartenenti al gruppo di numerosità minore. Dalle considerazioni qui svolte, si capisce che l’impiego di probabilità a priori uguali o diverse è connesso anche con i costi di errata classificazione che vengono discussi nel punto 5. 56 Previsione insolvenze In ogni caso, al momento dell’impiego del modello a fini predittivi, l’informazione sulle probabilità a priori è da intendersi riferita a tempi futuri e, quindi, anche questa dovrebbe scaturire da un modello di previsione. 5) I costi di errata classificazione. I due tipi di errore di classificazione che possiamo commettere con un modello di analisi discriminante sono: a) classificare un’impresa sana come insolvente (falso positivo); b) classificare un’impresa insolvente come sana (falso negativo). I due tipi di errore non hanno associati costi equivalenti. La diversità dei costi dipende dagli obiettivi che si perseguono con la costruzione di un modello di previsione delle insolvenze. Altman definisce il costo di un falso negativo (FN) come: Costo(FN)= 1–(a+b)/ft dove: a : somma riscossa prima della crisi di insolvenza b : somma riscossa successivamente alla crisi di insolvenza ft : ammontare del prestito erogato fino a 12 mesi precedenti il mancato rimborso. Il costo associato ad un falso positivo (FP) è, secondo lo stesso autore: Costo(FP)= r–i dove r: tasso di interesse sul prestito rifiutato i: tasso di interesse su investimenti alternativi possibili. (generalmente si considera il tasso minimo, riferito ad un investimento a bassissimo di rischio (es. titoli pubblici). La stima dei costi così definiti, effettuata da Altman, ha mostrato che Costo(FN) era circa 31 volte il Costo(FP). Pertanto, nella valutazione della capacità predittiva della funzione discriminante, è opportuno tenere conte anche di questo aspetto. Ad ogni modo, stando a questi Previsione insolvenze 57 risultati, sembra da preferire una più corretta classificazione del gruppo delle aziende insolventi e cioè del gruppo meno numeroso2. 4.4 Un caso di studio Nell’esposizione dello studio di caso e nella costruzione del modello, seguiremo le fasi fondamentali rappresentate nella Fig. 4.3.1. In breve, l’elaborazione del modello ha affrontato i seguenti punti: 1) formazione di un campione di imprese insolventi e di un campione di imprese in vita; 2) riclassificazione dei bilanci e calcolo, per ciascuna impresa, di alcuni indici di bilancio, scelti in base alla letteratura sull’argomento; 3) analisi multivariata del rischio di insolvenza mediante l’AD normale lineare: stima della funzione discriminante e valutazione della sua capacità classificatoria. Poiché l’esposizione ha finalità didattiche, ci limiteremo a considerare un ridotto numero di indici di bilancio e un limitato gruppo di aziende, circoscrivendo l’analisi rispetto al settore produttivo e alla località geografica. E’ bene chiarire che, nella pratica applicativa, è necessario avere a disposizione un numero di osservazioni superiore a quello qui utilizzato, ai fini della validità generale del modello. Oggetto di analisi sono aziende operanti nel settore manifatturiero dell’abbigliamento e biancheria, in una provincia toscana. L’obiettivo è quindi quello di costruire un modello di tipo ‘settoriale’ che ha il vantaggio di riferirsi a unità relativamente omogenee anche in termini di struttura economico-patrimoniale. Sempre per l’esigenza di lavorare con dati omogenei, facciamo riferimento alle sole società di capitale. Il primo passo per la formazione del set di dati riguarda il gruppo delle imprese fallite. Dalla consultazione dei dati disponibili presso la Camera di Commercio della provincia, sono state desunte le seguenti informazioni: 1) nel 1995 sono fallite 11 aziende; 2) nel 1996 sono fallite 13 aziende. 2 E’ importante osservare che i costi di errata classificazione possono essere direttamente inseriti nella AD applicando la regola classificatoria che minimizza il costo atteso di errata classificazione. Questo procedimento non viene descritto nella nota metodologica ma può essere trovato, ad esempio, in Huberty (1994). 58 Previsione insolvenze A causa dell’esiguo numero di casi, è necessario cumulare le unità relativi ai due anni. Inoltre, poiché oggetto di analisi è l’informativa di bilancio precedente l’evento del fallimento, si sono utilizzati i dati relativi al: 1992, per le imprese fallite nel 1995; 1993, per le imprese fallite nel 1996. Lo sfasamento fra 1) e 2) è talmente breve che non dovrebbero sussistere problemi di eterogeneità nei dati contabili. Purtroppo non tutti i bilanci si sono rivelati utili. Ad esempio, alcune delle imprese erano, nell’anno precedente il fallimento, già in liquidazione. Il numero di aziende si è ridotto a 10, come riportato nella Tab. 4.4.1. Pur nella sua estrema limitatezza (in termini di numero di unità), la tabella conferma quanto accennato nel paragrafo 4.1: si nota, infatti, la presenza di aziende di costituzione piuttosto recente. Tab. 4.4.1 Gruppo delle aziende fallite Azienda Anno Anno Capitale investito fallimento costituzione (1994; 1000 L.) A 1995 1991 168630 B 1995 1982 301840 C 1995 1978 432174 D 1995 1980 8756181 E 1995 1990 433015 F 1995 1991 129519 G 1996 1989 3964945 H 1996 1988 1447377 I 1996 1991 1423887 L 1996 1993 571897 Anno riferimento dati 1992 1992 1992 1992 1992 1992 1993 1993 1993 1993 La Tab. 4.4.2 mostra il campione di imprese sane che è stato scelto in modo da garantire una certa comparabilità con quello delle imprese fallite, rispetto alle caratteristiche rappresentate in Tab. 4.4.1. Previsione insolvenze Tab. 4.4.2 Gruppo delle aziende sane Azienda Sana al: Anno Capitale investito costituzione (1994; 1000 L.) 1 1995 1991 469760 2 1995 1982 1249125 3 1995 1988 380977 4 1995 1980 789832 5 1995 1989 256722 6 1995 1991 316754 7 1996 1989 1028442 8 1996 1986 2246773 9 1996 1991 876546 10 1996 1987 1266734 59 Anno riferimento dati 1992 1992 1992 1992 1992 1992 1993 1993 1993 1993 Il nostro set di dati è pertanto costituito, seguendo l’indicazione della maggior parte degli studi, da due gruppi di uguale dimensione, senza riprodurre nel campione la proporzione esistente fra aziende sane e fallite nella popolazione di riferimento. Riguardo agli indici di bilancio scelti, ci limitiamo ai 4 seguenti: • • • • CR: attività correnti/passività correnti (current ratio) DP: tot. debiti/tot. passivo ROA: reddito operativo/tot. attivo RD: fatturato/tot. debiti dove ‘tot. debiti’ indica l’intero indebitamento verso terzi (sia a lungo sia a breve). La Tab. 4.4.3 contiene i dati relativi ai quattro indici di bilancio scelti. 60 Previsione insolvenze Tab. 4.4.3 Indici di bilancio (gruppo 0: aziende sane; gruppo 1: aziende fallite) Azienda Gruppo CR DP ROA FD A 1 0.9576 0.9026 –0.3361 0.6426 B 1 0.7388 1.2028 –0.4035 1.5987 C 1 1.0195 0.9717 0.0902 0.7758 D 1 1.0936 0.8745 0.0900 2.1710 E 1 0.8431 0.9807 0.0136 0.1211 F 1 1.1011 0.8679 0.0345 1.0276 G 1 1.0888 1.0075 0.0410 1.2385 H 1 1.5878 0.9575 –0.0211 2.1222 I 1 1.4209 0.9628 0.0697 1.1224 L 1 0.2549 1.3125 –0.0577 0.0246 1 0 1.2023 0.7730 0.0459 2.0869 2 0 0.9212 0.9748 –0.0055 1.6454 3 0 1.7112 0.7804 0.0889 2.5122 4 0 1.1822 0.9654 0.0272 1.4345 5 0 1.2891 0.9271 0.0939 1.5814 6 0 0.7961 0.9526 0.0644 0.1337 7 0 1.1060 0.9832 0.0858 1.3553 8 0 1.2271 0.9694 0.0604 1.6252 9 0 0.9627 1.0300 0.0124 0.7690 10 0 1.1090 0.8402 0.0558 1.0703 La tabella seguente mostra alcune caratteristiche distributive dei dati relativi ai due gruppi. In particolare si nota il valore negativo della media di ROA per il gruppo delle fallite che registra, mediamente, una minore liquidità (CR), più basso indice di rotazione (FD) e maggiore indebitamento (FD). Dagli indici di asimmetria e curtosi, si può inoltre notare una moderata deviazione dalla normalità3. Tab. 4.4.4 Indici statistici dei dati di Tab. 4.4.3 Ratio Gruppo 1: fallite Media Var. Asimm Curtosi Media . CR 1.011 0.133 –0.552 1.467 1.151 DP 1.004 0.021 1.463 1.479 0.920 ROA –0.048 0.031 –1.525 1.027 0.053 FD 1.084 0.543 0.118 –0.798 1.421 Gruppo 0: sane Var. Asimm Curtosi . 0.062 1.036 2.359 0.008 –0.836 –0.731 0.001 –0.488 –0.733 0.440 –0.399 0.800 3 La verifica dell’ipotesi di normalità (marginale) può essere controllata anche tramite un normal probability plot. Tuttavia, data l’esiguità dei dati (infatti bisognerebbe costruire il grafico separatamente per gruppo), tralasciamo questo tipo di analisi. Previsione insolvenze 61 La matrice di varianza e covarianza within (pooled) W è4: 0.0879 0.0129 − 0.0234 W = 0.0120 − 0.0048 0.0145 0.1392 − 0.0323 0.0041 0.4427 e la distanza di Mahalanobis al quadrato dij di ogni unità i-esima (i=1,2,…,20) dal centroide del gruppo j-esimo (j=0,1) è stimata come: dij = (xi–mj)W–1(xi–mj)’ L’applicazione del metodo della verosimiglianza massima (con matrice di covarianza uguale nei due gruppi) equivale a collocare l’unità nel gruppo col centroide più vicino. I risultati ottenuti sono presentati nella Tab. 4.4.5. Tab. 4.4.5 Riclassificazione delle unità (distanza di Mahalanobis al quadrato) Discriminant Azienda Gruppo Distanza dal Distanza dal Gruppo* ** score Z1 assegnato centroide 0 centroide 1 A 1 14.440 10.31340 1 2.0644 B 1 15.511 10.17260 1 2.6700 C 1 1.123 1.44482 0 –0.1599 D 1 4.314 8.16350 0 –1.9232 E 1 3.861 2.70357 1 0.5795 F 1 1.040 1.94271 0 –0.4505 G 1 0.807 0.69733 1 0.0562 H 1 6.060 5.01925 1 0.5223 I 1 5.392 4.24364 1 0.5757 L 1 11.600 8.56528 1 1.5179 1 0 4.317 8.05411 0 –1.8673 2 0 1.989 3.33157 0 –0.6702 3 0 3.439 5.92591 0 –1.2415 4 0 0.469 0.58959 0 –0.0590 5 0 0.552 1.68914 0 –0.5674 6 0 3.711 3.76116 0 –0.0242 7 0 0.572 1.43902 0 –0.4324 8 0 0.748 1.39211 0 –0.3205 9 0 1.558 0.52944 1 0.5153 10 0 1.379 2.90503 0 –0.7619 * criterio della verosimiglianza massima; ** v. espressione (4.5.1). 4 W è calcolata dividendo la devianza e codevianza interna per i gradi di libertà e non per il totale delle osservazioni (20 osservazioni e 2 gruppi: 20–2=18 gradi di libertà). 62 Previsione insolvenze La quota totale di errata classificazione è 4/20 (3/10 nel gruppo delle aziende fallite e 1/10 nel gruppo delle sane). Ricaviamo ora la funzione discriminante lineare. A tale scopo facciamo riferimento all’espressione (6.1.7) del capitolo 6 poiché i risultati forniti dai package statistici (es. Statistica, SAS) assumono la forma rappresentata nella Tab. 4.4.6: Tab. 4.4.6 Funzione discriminante lineare G1 Formula Ratio G0 CR 63.924 66.433 DP 171.222 176.877 W–1mj’ ROA 7.811 1.626 FD –4.797 –5.801 Costante –112.998 –119.874 –0.5 mjW–1mj’ da cui: 66.433 − 63.927 2.509 176.877 − 171.222 5.655 a= = 1.626 − 7.811 − 6.185 − 5.801 − 4.797 − 1.004 k=–112.998+119.874=6.876 Pertanto, la funzione discriminante lineare è: Z=2.509 CR + 5.655 DP–6.185 ROA–1.004 FD con cut-off uguale a 6.876, di modo che se Z>6.876 l’unità è dichiarata insolvente. Funzione discriminante lineare equivalente è: (4.5.1) Z1=Z–6.876 che ha cut-off zero. In tal caso l’azienda è dichiarata insolvente se Z1>0. I valori del punteggio discriminante Z1 sono stati riportati nella Tab. 4.4.5. Z1 è una misura di rischio di insolvenza, in quanto valori elevati corrispondono ad aziende critiche. Ulteriori analisi sulla capacità discriminante (o predittiva) del modello possono essere condotte esaminando le caratteristiche distributive dei Previsione insolvenze 63 valori di Z1 (o di Z) all’interno dei due gruppi e, eventualmente, effettuando test delle ipotesi (ad esempio un’analisi della varianza per verificare l’ipotesi di uguaglianza delle medie di gruppo di Z1 o Z). Bisogna osservare tuttavia che, a causa della ridotta numerosità di osservazioni, non è possibile proporre un’analisi esterna e quindi, sia la matrice di riclassificazione sia eventuali analisi statistiche sui punteggi discriminanti, devono limitarsi ad un controllo interno. Se si ritiene che il modello sia in grado di classificare in modo adeguato le aziende nei due gruppi, si passa ad interpretare il significato della (4.5.1), rispondendo alla seguente domanda: quali sono gli indici di bilancio più importanti ovvero maggiormente in grado di segnalare situazioni di crisi? Per rendere agevole la trattazione ci limiteremo all’analisi del coefficiente di correlazione lineare fra ogni singolo ratio e il punteggio discriminante (si tratta della correlazione interna ovvero calcolata mediante le varianze e covarianze interne)5. Dalla Tab. 4.4.6 possiamo dedurre quanto segue. • I segni dei legami espressi dai coefficienti di correlazione sono coerenti con le attese. All’aumentare di CR, ROA e FD (segnale di miglioramento della liquidità e redditività) diminuisce il punteggio discriminante (miglioramento dello stato di salute). All’aumentare (diminuire) di DP aumenta (diminuisce) Z ovvero Z1. • Alto indebitamento (complessivo, sia a breve sia a lungo) e bassa redditività appaiono gli elementi più rilevanti nel segnalare situazioni di crisi. Infatti DP e ROA presentano correlazioni più strette col punteggio discriminante. L’impossibilità di condurre un’analisi esterna rende abbastanza incerta la capacità predittiva del nostro modello. Pertanto concludiamo qui la descrizione dello studio di caso. 5 E’ opportuno osservare che i coefficienti della (4.1.1) non sono direttamente confrontabili in quanto risentono della differente scala in cui sono espresse le variabili (v. medie e varianze degli indici di bilancio in Tab. 4.4.3), Inoltre, tali coefficienti misurano l’effetto parziale di ogni singolo ratio tenuti costanti i valori degli altri indici e, quindi, l’interpretazione è meno immediata. Analisi delle componenti principali 5. 65 Nota metodologica. Analisi delle componenti principali (ACP) Introduzione 5.1 Aspetti algebrici coinvolti nell’ACP 5.2 L’ACP 5.3 La scelta del numero di componenti 5.4 Interpretazione delle componenti selezionate 5.5 ACP: matrice S o matrice R ? 5.6 Esempi numerici Introduzione L’analisi delle componenti principali o ACP è un metodo esplorativo di riduzione dei dati. Esplorativo in quanto non contempla la verifica di modelli probabilistici. Metodo di riduzione dei dati in quanto si propone di rappresentare l’insieme delle unità descritto da un set di k variabili osservate su n individui, mediante un numero ridotto p<k di nuove variabili: le componenti principali. Tali componenti principali sono combinazioni lineari delle variabili originarie, fra loro ortogonali e aventi, per convenzione, media nulla e varianza unitaria. La riduzione dei dati non è indolore; qualche informazione viene comunque perduta. Tuttavia, fra tutte le possibili combinazioni lineari che possono essere formate con quel set di n valori assunti dalle k variabili, la componente principale è quella che ha la massima varianza. Quindi, quale metodo di riduzione dei dati, l’ACP cerca di limitare la perdita di informazioni riguardo al grado di variabilità dei dati, espressione questa delle peculiarità individuali. 5.1 Aspetti algebrici coinvolti nell’ACP L’ACP sfrutta alcune proprietà possedute dalle matrici simmetriche definite positive. Data H una matrice simmetrica definita positiva, questa può essere rappresentata attraverso la seguente espressione: (5.1.1) H=ΓΛΓ’ 66 Analisi delle componenti principali dove Λ è una matrice diagonale (kxk) con elementi (λ1,λ2,…,λk), detti autovalori di H; Γ è una matrice (kxk) con vettori colonna (γ1,…,γk) detti autovettori di H, fra loro ortogonali (cioè Γ’Γ=Ι, con Ι matrice identità (kxk)). Ogni coppia j (j=1,…,k) di autovalore-autovettore (e cioè j-esimo elemento della diagonale di Λ e j-esima colonna di Γ) verifica la seguente equazione: (5.1.2) (H-λjI)γj=0 La (5.1.1) è detta anche trasformazione per similitudine (o fattorizzazione o anche diagonalizzazione) della matrice H in quanto, premoltiplicando la (5.1.1) per Γ’ e postmoltiplicando per Γ, si ottiene: (5.1.3) Λ=Γ’Η Γ e H e Λhanno lo stesso determinante e la stessa traccia (somma degli elementi che stanno sulla diagonale): (5.1.4) traccia(H)=traccia(Λ) Inoltre, un’importante proprietà delle matrici simmetriche definite positive risiede nel fatto che gli autovalori sono sempre numeri reali positivi. 5.2 L’ACP Come in tutti i metodi statistici multivariati, il punto di partenza dell’analisi è costituito dalla matrice dei dati X avente n righe (le unità) e k colonne (le variabili, tutte di natura quantitativa): (5.2.1) X:{xij}, i=1,…,n; j=1,…,k; Il simbolo xij rappresenta il valore della variabile j osservato sull’unità i. Ogni riga i della matrice X, che indichiamo con xi, contiene i valori delle k variabili osservate sull’i-iesima unità. Costruiamo, a partire da X, la matrice X*, che contiene gli scarti dei valori dalla corrispondente media aritmetica: Analisi delle componenti principali (5.2.2) 67 X*:{xij*}, i=1,…,n; j=1,…,k; dove xij*=xij–mj e mj è la media aritmetica dei valori relativi alla variabile i. Usando, X* ricaviamo facilmente la matrice di varianza e covarianza S, avente dimensione kxk, che è: (5.2.3) S=(X*’X*)/n Si ricorda che sulla diagonale di S si trovano le varianze delle k variabili, per cui traccia(S) è la somma di tali varianze. Assumiamo qui che S ammetta l’inversa. Costruiamo, infine, la matrice Z, che contiene gli scarti standardizzati: (5.2.4) Z:{zij}, i=1,…,n; j=1,…,k; dove zij=xij/sj e sj è lo scarto quadratico medio dei valori relativi alla variabile i (ovvero è la radice quadrata dell’i-esimo elemento della diagonale di S). La matrice di varianza e covarianza calcolata sui dati di Z è la matrice di correlazione R dei valori originari contenuti in X: (5.2.5) R=(Z’ Z)/n Sulla diagonale principale di R si trovano k termini unitari; pertanto traccia(R) è la somma di k valori 1, e cioè traccia(R)=k. Poiché abbiamo assunto S non singolare, anche R ammette l’inversa. Definiamo quindi la componente principale y come: (5.2.6) y=X* γ dove γ:{γ1,...,γk} è un vettore colonna di k coefficienti da determinare. Da notare che y è un vettore colonna di n valori con media nulla. La (5.2.6) dice che il valore della componente yi corrispondente alla iesima unità è definito come: (5.2.7) yi=xi γ = Σj xij* γj 68 Analisi delle componenti principali I coefficienti in γ sono determinati in modo da massimizzare la varianza dei valori di y che è: (5.2.8) (y’y)/n= (X* γ)’(X* γ)/n=γ’(X*’X*)γ/n=γ’Sγ. con γ’Sγ scalare. Dalla (5.2.7) si capisce che la scala di y dipende da γ. Ciò significa che valori arbitrariamente grandi di γ generano varianze grandi; in questo modo non si può pervenire ad una soluzione unica. E’ quindi necessario introdurre un vincolo sui coefficienti di γ. Il vincolo che viene convenzionalmente usato è: (5.2.9) γ’γ=1. Quindi si costruisce l’espressione F(γ,λ) da massimizzare rispetto a γ e λ, che tiene conto del vincolo (5.2.9): (5.2.10) MAXγ,λ F(γ,λ)=MAXγ,λ {γ’Sγ.– λ (γ’γ–1)} Il simbolo λ è detto moltiplicatore di Lagrange e serve a inglobare il vincolo (5.2.9) nell’operazione di massimo. Calcolando le derivate prime della (5.2.10) rispetto a γ e λ ed uguagliandole a zero, si ricava il seguente sistema di k+1 equazioni1: (5.2.11) δ F(γ,λ)/δγ = 2Sγ–2λ γ = (S–λ Ι)γ=0 δ F(γ,λ)/δλ=γ’γ–1=0 dove I è la matrice identità di dimensione kxk e la derivata prima rispetto a λ non è altro che l’esplicitazione del vincolo (5.2.9). Confrontando la (5.2.11) con la (5.1.2) si deduce immediatamente che λ è autovalore di S e γ è l’autovettore associato. Ma quale autovalore visto che, per le proprietà delle matrici simmetriche e non singolari (come è qui S), S ha k autovalori reali positivi 2? La risposta viene 1 Si fa notare che la (5.2.11) è una derivata rispetto ad un vettore con k componenti e, quindi, trattasi di k equazioni. 2 Condizione per la verifica della (5.2.11) è l’annullamento del determinante della matrice (S–λ Ι). Pertanto, il valore di λ che soddisfa alla (5.2.11) è quello che Analisi delle componenti principali 69 ancora dalla (5.2.11) che ci consente una interpretazione di λ in chiave statistica. Premoltiplicando la (5.2.11) per γ’ e tenendo conto del vincolo (5.2.9), si ottiene: γ’Sγ–λγ’ γ =γ’Sγ–λ=0 da cui: (5.2.12) λ =γ’Sγ e cioè, λ è proprio la varianza che vogliamo massimizzare (v. espressione 5.2.8). Quindi, fra tutti gli autovalori di S, sceglieremo quello più grande. Mediante l’operazione di fattorizzazione descritta nel paragrafo 5.1, possiamo infine esprimere S mediante i suoi autovalori e autovettori come S=ΓΛΓ’, dove Λ è la matrice di varianza e covarianza delle k componenti. Infatti, dato che gli autovettori sono ortogonali fra loro, le componenti sono ortogonali e quindi incorrelate (Λ è diagonale). Inoltre, poiché traccia(S)=traccia(Λ), si deduce che tutte le k componenti recuperano il totale della variabilità dei dati originali, espressa dalla somma delle varianza delle k variabili. Se si estraggono tutti gli autovalori e tutti gli autovettori di S, la matrice Y:{yij}, di dimensione nxk, dei valori assunti dalle k componenti principali è: (5.2.13) Y=X Γ 5.3 La scelta del numero di componenti La riduzione dei dati interviene allorché si decide di selezionare solo alcune componenti: ad esempio p<k. La scelta si orienterà per le p componenti che hanno associata varianza più elevata. I criteri per la scelta del numero p di componenti, tengono conto del grado di efficacia della riduzione dei dati e dell’entità di informazione mantenuta (varianza recuperata o spiegata, in totale e per ogni singola variabile). annulla il determinante della matrice (S–λ Ι). Se detta matrice è di dimensione kxk, il determinante sarà un polinomio in λ di grado k. 70 Analisi delle componenti principali Grado di efficacia della riduzione. Esso può essere espresso semplicemente dal rapporto p/k. Entità dell’informazione mantenuta. Essa può venire espressa attraverso la quota di varianza totale (somma delle varianze delle variabili originarie) spiegata da p componenti. Ipotizzando di avere ordinato le componenti per valori decrescenti delle corrispondenti varianze (λ1>λ2>...>λk), tale quota è data da: (5.3.1) p k j =1 j =1 ∑ λ j/ ∑ λ j Ovviamente, aumentando p si ottiene un valore più alto della (5.3.1) ma, nel contempo, si realizza una minore riduzione dei dati. La scelta è di fatto piuttosto soggettiva, dipendendo anche dal contesto applicativo. In generale potremo essere soddisfatti della riduzione dei dati se (5.3.1) supera 0.75. Un altro criterio di selezione è quello basato sull’autovalore medio, secondo il quale, vengono scelte quelle componenti che hanno associato un autovalore (cioè una varianza) superiore alla media aritmetica dei k autovalori. Non sempre i due criteri appena descritti conducono alle stese decisioni. Un altro elemento che può essere tenuto in considerazione nella scelta delle componenti e nella valutazione dei risultati, è la quota di varianza di ogni singola variabile che viene spiegata dalla p componenti principali selezionate. Tale quota di varianza spiegata non è altro che l’indice di determinazione lineare di ogni variabile originaria rispetto alle p componenti3. 5.4 Interpretazione delle componenti selezionate Operata la scelta del numero di componenti e, se si ritiene che la riduzione dei dati sia soddisfacente, si può passare all’interpretazione delle componenti. Infatti, una ACP è utile quale metodo di riduzione dei dati, a patto che le nuove variabili individuate (le componenti, appunto) esprimano aspetti significativi del fenomeno sotto studio. 3 Si tratta dell’indice di determinazione lineare di un modello lineare che ha come variabile dipendente la variabile originaria i-esima e come regressori le p componenti principali scelte. Analisi delle componenti principali 71 Ai fini interpretativi, ci limitiamo qui a descrivere il criterio basato sulla correlazione lineare fra variabili e componenti. La stretta associazione lineare fra una componente e una variabile indica che al variare dell’una varia anche l’altra: in modo concorde (correlazione positiva) o no (correlazione negativa). Pertanto, una componente che risulta marcatamente correlata con, ad esempio, due delle k variabili, misura, in modo più sintetico, il fenomeno descritto da quelle due variabili. L’interpretazione viene facilitata quando una componente è correlata solo con alcune variabili che, a loro volta, non sono correlate con le altre componenti. Può accadere che alcune variabili siano fortemente correlate con una delle k-p componenti scartate (quelle, cioè, che hanno associata una varianza bassa) e con nessuna delle componenti scelte. Si tratta di variabili di secondo piano: le n unità sotto studio non si differenziano in modo particolarmente significativo rispetto a quelle stesse variabili. Una volta interpretato il significato delle p componenti selezionate, viene effettivamente realizzata la riduzione dei dati. Infatti possiamo così sostituire la matrice nxk dei dati X (ovvero X*) con quella nxk delle componenti, dove: (5.4.1) Y(p)=X* Γ(p) e l’apice (p) sta a significare che sono presenti solo p colonne. L’analisi del fenomeno potrà quindi avvenire attraverso le nuove variabili. La sintesi dell’ACP sarà molto utile tutte le volte che si riusciranno a selezionare 2 o 3 componenti. Infatti, in quelle situazioni, sarà molto facile proporre semplici analisi grafiche che, molto spesso, sono quelle più efficaci. 5.5 ACP: matrice S o matrice R ? Abbiamo visto come l’ACP riesce a riprodurre la somma delle varianze delle variabili originarie, attraverso le k componenti. Nelle applicazioni empiriche abbiamo spesso a che fare con variabili espresse in diversa unità di misura (es. litri, Kg., Lire, Euro): che significato ha in questo caso l’espressione traccia(S) ? Un minimo di attenzione è richiesta per capire che, così facendo, si stanno sommando grandezze espresse in diversa unità di misura. 72 Analisi delle componenti principali Per ovviare a questo problema, quando si ha a che fare con variabili di natura diversa, si preferisce condurre l’ACP su R anziché su S. Questo procedimento equivale a definire la componente principale in funzione degli scarti standardizzati contenuti in Z: (5.5.1) y=Zγ. L’ACP si traduce quindi nella derivazione degli autovalori e autovettori di R invece che di S. Nel complesso, usando R, alcune operazioni e interpretazioni vengono semplificate: • la somma delle varianze delle variabili originarie e quindi la somma degli autovalori di R, è k; • il criterio basato sull’autovalore medio diventa il seguente: si selezionano le componenti che hanno associato un autovalore superiore a 1 (infatti 1 è proprio la media degli autovalori di R); • gli elementi dell’autovettore γ sono direttamente confrontabili in quanto non risentono della scala o dell’unità di misura delle variabili originarie. Il valore γj esprime la variazione della componente dovuta ad una variazione della variabile j-esima, pari a sj, tenuti costanti i valori delle altre variabili. Quindi, all’interno della combinazione lineare che definisce una componente, è possibile valutare il peso relativo rivestito da ogni variabile. E’ bene sottolineare il fatto che, in generale, i risultati di una ACP condotta su R sono diversi da quelli ottenuti da S e che non si può passare dagli uni agli altri attraverso una semplice trasformazione di scala delle componenti. L’efficacia dell’ACP quale metodo di riduzione dei dati è diversa (si ottengono autovalori diversi) e perfino il significato delle componenti può non coincidere. Questo è comprensibile se si pensa al tipo di informazione che viene utilizzata: • traccia(R): le varianze delle k variabili sono tutte uguali a 1. In questo caso ogni variabile presenta la medesima quota di varianza totale, pari a 1/k; • traccia(S): se le varianze delle k variabili originarie sono molto diverse fra loro, ogni variabile i presenta una diversa quota di varianza totale (rapporto fra la varianza della variabile e la traccia(S)). Se, per esempio, una sola variabile ha una varianza pari a oltre l’80% della somma delle varianze, l’ACP tenderà a Analisi delle componenti principali 73 produrre una componente principale, altamente correlata con tale variabile, e che, da sola, assorbirà un’alta quota di varianza. Da questi brevi commenti si deduce che, operando con S in presenza di forti differenze fra i valori delle varianze, si ottengono risultati migliori (sia in termini di riduzione dei dati sia in termini interpretativi) di quelli realizzabili con R. Tuttavia, il rischio di una disparità di trattamento delle variabili originarie, induce a chiederci se l’utilizzo di S possa generare problemi anche in presenza di variabili della stessa natura (stessa unità di misura) ma con varianze fortemente diversificate. In questa circostanza, la decisione su S o R passa per il seguente quesito: la gerarchia delle variabili, implicitamente operata dai valori della varianza, rispecchia il grado di importanza che le variabili stesse rivestono nel contesto analizzato? Se la risposta è sì, allora conviene usare S, anche perché i risultati saranno, nel complesso, migliori. Se la risposta è no allora è preferibile usare R. Un’ultima osservazione che verrà approfondita con la presentazione di esempi applicativi, concerne il fatto che la struttura di correlazione esistente fra le k variabili influenza l’efficacia dell’ACP quale metodo di riduzione dei dati (sia che operi su S sia che operi su R). Infatti, a parità di k, in presenza di alta correlazione fra le variabili originarie, una stessa quota di varianza spiegata tende ad essere riprodotta con un minor numero di componenti rispetto a quanto avviene in una situazione di bassa correlazione. 5.6 Esempi numerici In questo paragrafo presentiamo alcuni esempi di applicazione dell’ACP, compreso un caso numerico. Brevemente delineiamo qui le fasi per la conduzione di una ACP: 1) scelta delle variabili e esame del loro grado di correlazione; 2) decisione in merito all’uso di R o di S; 3) estrazione delle componenti e scelta del numero, verificando l’efficacia della riduzione dei dati; 4) interpretazione delle componenti e relativa analisi del fenomeno sotto studio. 74 Analisi delle componenti principali 5.6.1 Esempio numerico Si consideri la matrice dei dati X relativa alle due variabili X1 e X2, le corrispondenti X* e Z, riportate nella Tab. 5.6.1, e le matrici S e R. Tab. 5.6.1 Matrice dei dati (n=6; k=2) X X* Unità i x1i x2i x1i* x2i* 1 2 1 -2 -0.5 2 2 1 -2 -0.5 3 3 0 -1 -1.5 4 5 2 1 0.5 5 6 2 2 0.5 6 6 3 2 1.5 Media 4.00 1.50 0.00 0.00 SQM 1.73 0.96 1.73 0.96 SQM: scarto quadratico medio S: 3.00 1.33 1.33 0.92 R: Z z1i -1,15 -1,15 -0,58 0,58 1,15 1,15 0.00 1.00 z2i -0,52 -0,52 -1,57 0,52 0,52 1,57 0.00 1.00 1 0.8 0.8 1 Vediamo la marcata differenza fra le varianze delle due variabili (v. diagonale della matrice S). La variabile X1, avendo una varianza più alta, viene ad assumere un’importanza superiore a X2. Ai fini esemplificativi, ricaviamo le componenti principali dalla matrice di correlazione R, eseguendo i vari passaggi algebrici che, nel caso di due sole variabili, sono abbastanza agevoli. Si noti che traccia(R)=2. Per prima cosa, impostiamo la condizione (5.2.11) rispetto a R: (R–λI)γ=0 che è: 1 0.8 λ 0 1 - λ 0.8 0 − = = 0.8 1 0 λ 0.8 1 - λ 0 Essa è verificata da quei valori di λ che annullano il determinante di (R–λI), dato dalla seguente espressione: Analisi delle componenti principali 75 det(R–λI)=(1–λ2)–0.82= λ2–2λ+0.36=0 Come si vede, avendo k=2, il determinante è un’equazione di secondo grado in λ. Le soluzioni sono: λ1=1.8 λ2=0.2 Si verifica immediatamente che λ1+λ2=2. La componente più importante è quella associata all’autovalore 1.8, pari al 90% (1.8/2) della varianza totale. Possiamo quindi realizzare una riduzione dei dati pari a ½ (da 2 variabili a 1 componente). Andiamo a determinare il valore di γ:( γ1, γ2) associato all’autovalore 1.8. Riprendendo la (5.2.11), si ricava il seguente sistema in due equazione e due incognite (gli elementi di γ): (1–1.8) γ1+0.8 γ2 =0 0.8 γ1+(1–1.8) γ2 =0 ÍÎ ÍÎ γ1=γ2 γ1=γ2 Come si vede facilmente, le due equazioni identificano la stessa relazione fra γ1 e γ2. Ciò significa che infinite coppie di valori γ1 e γ2 verificano le due equazioni4. Da ciò si capisce l’utilità del vincolo γ ’γ= γ12+ γ22=1. Pertanto il sistema di equazioni che ci dà il valore γ è: γ1=γ2 γ12+ γ22=1 da cui si ricava γ12=1/2 e quindi γ1=±2−0.5=±0.707. Da questo risultato si capisce che il sistema di riferimento individuato dalle componenti principali è arbitrario. Infatti, è equivalente scegliere la soluzione negativa o quella positiva (si hanno, in corrispondenza, due rappresentazioni speculari). Selezionando la soluzione positiva si ottiene il vettore dei coefficienti γ:(0.707, 0.707). La formula per il calcolo della componente principale associata all’autovalore 1.8 è quindi, per ogni unità i-esima: 4 E’ questo un altro modo di vedere che, senza un vincolo sulle componenti di γ, non si avrebbe una soluzione unica. 76 Analisi delle componenti principali yi= γ1 z1i + γ2 z2i = 0.707 z1i + 0.707 z2i I valori così calcolati su tutte le unità hanno media zero e varianza 1.8. Spesso (e i package statistici così fanno) i coefficienti vengono scalati in modo da ottenere componenti principali con media zero e varianza unitaria. Nel nostro caso si tratterebbe di dividere il vettore γ per lo scarto quadratico medio della componente principale (che, nel nostro caso, è uguale alla radice quadrata di 1.8). Operata questa trasformazione, il valore della componente principale standardizzata, per l’unità i-esima, è: [s]yi= 0.527 z1i + 0.527 z2i dove 0.527=0.707/(1.8)0.5. La Tab 5.6.2 mostra i valori delle due componenti principali, che si ottengono per le 6 unità dell’esempio numerico. Resta da interpretare il significato della componente scelta. I due coefficienti di correlazione lineare fra i valori di questa e delle due variabili sono in questo caso uguali fra loro e pari a 0.95 (è questo, ovviamente, un caso molto particolare). Quindi la componente principale sintetizza in modo concorde (a valori elevati delle variabili corrispondono valori elevati delle due variabili e viceversa) ambedue le variabili. Tab. 5.6.2 Valori della componente principale Componente Unità yi [s]yi 1 -1.19 -0.88 2 -1.19 -0.88 3 -1.52 -1.13 4 0.78 0.59 5 1.19 0.88 6 1.93 1.44 Media 0.00 0.00 Varianza 1.80 1.00 5.6.2 Esempio numerico: confronto fra uso di S e di R Quale sarebbe stato il risultato se si fosse usata la matrice di covarianza S ? Analisi delle componenti principali 77 Ci limitiamo a dire che i due autovalori sono pari a 3.65 e 0.27 (da notare che 3.65+0.27=3.92, somma delle varianze delle due variabili). Pertanto la prima componente principale assorbe circa il 93% (3.65/3.92) della varianza totale. Essa risulta, inoltre, più correlata con la prima variabile (coefficiente di correlazione pari a 0.99) che con la seconda (coefficiente di correlazione pari a 0.87). Da questi risultati si deduce il maggior ruolo rivestito dalla prima variabile che favorisce anche l’efficacia della riduzione dei dati: con S, una sola componente spiega il 93% della varianza mentre con R ne spiega il 90%. 5.6.3 Esempio numerico: correlazione debole Si consideri la seguente matrice di correlazione R: R: 1 0.2 0.2 1 I due autovalori associati sono λ1=1.2, λ2=0.8 ai quali corrisponde, rispettivamente, il 60% (1.2/2) e il 40% (0.8/2) della varianza totale. La quota di varianza spiegata dalla prima componente è inferiore rispetto a quanto ottenuto nell’esempio 5.6.1, in presenza di una forte correlazione fra le due variabili. Analisi discriminante 6. 79 Nota metodologica. Analisi discriminante (AD) Introduzione 6.1 Analisi discriminante e problemi classificatori 6.1.1 Teoria decisionale 6.1.2 La funzione discriminante 6.1.3 Funzione discriminante e AD normale 6.1.4 Funzione discriminante e AD logistica 6.2 Stima della funzione discriminante (AD normale) 6.3 Verifica della capacità classificatoria della funzione discriminante 6.4 Esempio numerico Introduzione L'analisi statistica multivariata di dati di bilancio è frequentemente usata per l'individuazione di imprese a rischio di insolvenza. Dal punto di vista puramente teorico l'insieme dei metodi impiegati in questo ambito rientrano in quelle che potremo definire tecniche classificatorie. Esse si propongono di assegnare un oggetto (nella fattispecie un'impresa) ad uno dei possibili gruppi (spesso si tratta di due soli gruppi: imprese sane ed imprese insolventi) sulla base di una serie di grandezze (variabili) osservate sull'oggetto stesso (es. indici di bilancio). In particolare, nell'ambito della diagnosi precoce del rischio di insolvenza aziendale, la tecnica dell'analisi discriminante (AD) è stata quella più usata, tanto che essa ha travalicato da tempo l'ambito accademico per trasformarsi in un vero e proprio strumento operativo. Il termine discriminante fa riferimento al processo di derivazione di una regola discriminatoria da un insieme di unità delle quali è nota l'appartenenza ai gruppi e sulle quali unità sono state osservate un certo numero di variabili. Gli obiettivi a cui mira la derivazione di questa regola discriminante sono i seguenti. 1) Descrittivi ed esplicativi: tale regola evidenzia le differenze fra i gruppi di imprese, segnalando le variabili che maggiormente sono responsabili di tale differenziazione. L’analisi si limita, pertanto, a spiegare ed interpretare le eventuali differenze emerse fra gruppi di unità. 80 Analisi discriminante 2) Predittivi: tale regola si pone come vera e propria regola classificatoria da applicare ogniqualvolta sia necessario classificare una unità (la cui appartenenza ai gruppi è sconosciuta) in uno dei possibili gruppi. E’ questo lo scopo perseguito nell’utilizzo della AD per la costruzione di modelli per la previsione delle insolvenze aziendali. In questo scritto faremo riferimento principalmente all’obiettivo 2). Nella descrizione dei metodi di AD, proponiamo alcune regole classificatorie, che richiedono la specificazione di un modello probabilistico da stimare e verificare su dati empirici. Pertanto, l’AD viene vista essenzialmente come approccio di natura confermativa. I modelli proposti caratterizzano due tipi di AD: quella che chiameremo normale, perché basata sulla distribuzione normale, e quella logistica (perché basata sulla distribuzione logistica). Come vedremo in queste note, l’AD normale e l’AD logistica sono caratterizzate da due ottiche di analisi diverse. Prima di approfondire queste tematiche, è necessario introdurre alcune regole classificatorie sulle quali verrà incardinata l’analisi statistica. 6.1 Analisi discriminante e problemi classificatori Introduciamo in questo capitolo le basi teoriche sottostanti l'analisi discriminante, considerando la questione classificatoria come un problema decisionale. Inoltre verificheremo le regole decisionali esplicitate al caso di distribuzione normale, descrivendo l'analisi discriminante 'normale' (lineare). Infine, confronteremo la AD normale con quella logistica. 6.1.1 Teoria decisionale Si consideri una popolazione composta da 2 sottopopolazioni o gruppi (disgiunti ed esaustivi) di unità, indicati con G1 e G0 (ad esempio G1: gruppo delle aziende insolventi o fallite e G0: gruppo delle aziende solventi o sane). Sia P(Gj)=pj la probabilità che una generica unità provenga dal gruppo Gj (j=0,1). pj è una probabilità, che non dipende dalle caratteristiche della singola unità e che, pertanto, possiamo considerare come una probabilità a priori. Il valore di pj riproduce la proporzione del gruppo j-esimo all'interno della popolazione. Indicando, quindi, con N la numerosità della popolazione, con Nj il Analisi discriminante 81 numero di unità del gruppo j, si ha: pj=Nj/N. Ovviamente, poiché i due gruppi sono esaustivi e disgiunti, p1+p0=1. Supponiamo di non poter osservare alcuna caratteristica specifica sulle unità della popolazione. In tal caso, estraendo una unità a caso, a quale gruppo converrà assegnarla ? E in base a quale criterio di convenienza? In questa circostanza, la regola decisionale migliore per classificare le unità fra i due gruppi, (migliore nel senso che minimizza la probabilità a priori di errata classificazione), è la seguente: (6.1.1) se p1 > p0 si assegna l’unità a G1 altrimenti a G0. Dal punto di vista applicativo questa soluzione è abbastanza banale in quanto consiste nell’assegnare tutte le unità al gruppo la cui probabilità a priori è più elevata. In tal caso, se p1>p0, p0 sarà la proporzione di unità della popolazione classificate in modo errato. La (6.1.1) è, nella pratica, poco interessante perché frequentemente è possibile osservare alcune informazioni sull’unità estratta, che ci possono aiutare nell’effettuare la classificazione. Tali informazioni vengono qui rappresentate come un vettore (riga) x di q variabili (dati di bilancio relativi ad un'azienda). Ebbene, supponiamo che i q valori x siano determinazioni di una variabile casuale (v.c.) multivariata X avente funzione di probabilità (congiunta) all'interno di ogni gruppo P(x|Gj), j=0,1 (se X è continua si tratterà della funzione di densità di probabilità). Poniamo, inoltre, di estrarre l’unità i e di osservare il vettore di q valori xi. In tal caso possiamo usare la regola classificatoria detta della verosimiglianza massima: (6.1.2) se P(xi |G1) >P(xi |G0) si assegna l’unità i a G1 altrimenti a G0 . Infatti P(xi |Gj) è la verosimiglianza di xi nel gruppo j (j=0,1). L'informazione contenuta in xi, può essere sfruttata per arricchire la nostra conoscenza sull'appartenenza dell'unità ad uno dei due gruppi. Infatti, mediante il teorema di Bayes, possiamo ricavare la cosiddetta probabilità a posteriori di appartenenza dell’unità i al gruppo j: 82 Analisi discriminante P(Gj|xi)=P(xi|Gj) pj/P(xi) j=0,1 dove P(x) = P(x|G1 ) p1 + P(x|G0) p0 è la funzione marginale di probabilità della X (se X è continua si tratterà della funzione di densità marginale). Ovviamente, P(x|Gj) è la funzione di probabilità condizionata al gruppo j. Usando l’espressione della probabilità a posteriori, possiamo applicare la regola decisionale che minimizza la probabilità a posteriori di errata classificazione e cioè: (6.1.3) se P(G1 |xi )>P(G0 |xi ) si assegna l’unità i a G1 altrimenti a G0 Tale regola è detta anche della massima probabilità a posteriori. Poiché P(G1|xi) e P(G0|xi) hanno il medesimo denominatore (cioè P(xi), che è positiva), la (6.1.3) può essere riscritta come: (6.1.4) se P(xi |G1)/P(xi |G0) > p0/p1 si assegna l’unità i a G1 altrimenti a G0 Da notare che, nel caso speciale in cui p1=p0, la (6.1.3) coincide col criterio della verosimiglianza massima. 6.1.2 La funzione discriminante E’ interessante notare che le regole decisionali della verosimiglianza massima e della massima probabilità a posteriori, operano un confronto fra una funzione di xi e una costante. Ad esempio, ponendo (6.1.5) h(xi)= P(xi |G1)/P(xi |G0) k= p0/p1 la (6.1.4) può essere riscritta come segue: se h(xi)>k si assegna l’unità i al gruppo G1 altrimenti a G0. Analisi discriminante 83 La funzione h(xi) è detta funzione discriminante e il punto k è detto punto di cut-off. E' evidente che qualunque funzione che deriva da una trasformazione monotona della h(xi) è una funzione discriminante. Ponendo ad esempio g(xi)=h(xi)–k si perviene alla seguente regola decisionale equivalente alla (6.1.5): se g(xi)>0 si assegna l’unità i a G1 altrimenti a G0. Ancora, una regola equivalente alla (6.1.5) è la seguente: se log(h(xi))>log(k) altrimenti a G0. si assegna l’unità i al gruppo G1 dove, ovviamente, h(xi )>0 e k>0. Riguardo al concetto di funzione discriminante, è importante osservare che h( ) (e, di conseguenza anche le sue trasformazioni sopra esemplificate) ha come argomento un vettore ma dà come risultato uno scalare, sintetizzando quindi l'informazione multivariata fornita dal vettore xi in una sorta di punteggio (discriminant score) individuale dell'unità i. Infatti h(xi) della (6.1.5) è il rapporto fra due grandezze scalari. Nella pratica accade che la forma della funzione discriminante non è completamente nota. Pertanto, si possono prospettare tre possibili approcci parametrici alternativi. 1) Specificazione e stima di una forma parametrica per la P(xi|Gj). In questo caso l’impiego del criterio della verosimiglianza massima è immediato. Per quello della massima probabilità a posteriori si tratterà di derivare P(Gj|xi) usando le probabilità a priori. 2) Specificazione e stima direttamente della P(Gj |xi). In questo caso l’impiego del criterio della massima probabilità a posteriori è immediato. Per quello della verosimiglianza massima sarà necessario ricavare P(xi|Gj) usando le probabilità a priori. 3) Specificazione e stima di una forma parametrica che rappresenta direttamente la h(xi), eventualmente anche senza particolari assunzioni sulla distribuzione della X. Questo modo di procedere può avere dei vantaggi nella misura in cui possiamo scegliere 84 Analisi discriminante forme convenienti dal punto di vista computazionale come ad esempio una h(xi) che sia combinazione lineare delle componenti del vettore xi. In linea generale questo approccio non richiede necessariamente la specificazione di un modello probabilistico. Nei paragrafi seguenti tratteremo delle impostazioni 1) e 2). 6.1.3 Funzione discriminante e AD normale Secondo questo approccio, condizionatamente ad ogni gruppo viene specificata la funzione di probabilità congiunta delle q variabili. Supponendo di avere 2 gruppi G1 e G0, si ipotizza che l'insieme dei q valori del vettore (riga) xi osservato sull'individuo i-esimo siano le determinazioni di una variabile casuale (v.c.) normale multivariata X tale che: X |G 1 ~ MN (µ1, Σ) X |G 0 ~ MN (µ0, Σ) dove MN sta per multinormale e µj e Σ sono, rispettivamente, il vettore (riga) delle medie e la matrice di varianza e covarianza di X nel gruppo j-esimo (i=0,1). Ci limitiamo al caso in cui i due gruppi abbiano la stessa matrice di varianza e covarianza Σ. Allora la verosimiglianza dell’unità i nel gruppo j è: |Σ|-1/2 (2π)q/2 exp {–½(xi–µj)Σ–1(xi–µj)’} dove il segno |Σ| indica l’operazione di determinante e q, si ricorda, è il numero delle variabili. L'applicazione del criterio della verosimiglianza massima, una volta operata la trasformazione logaritmica, ci conduce alla regola di classificazione seguente: (6.1.6) se (xi–µ0)Σ–1(xi–µ0)’> (xi–µ1)Σ–1(xi–µ1)’ si assegna i a G1 altrimenti a G0. L’espressione (xi–µj)Σ–1(xi–µj)’ è una misura di distanza fra il punto individuato da xi nello spazio q-dimensionale e il punto individuato da µj (detto centroide del gruppo j). Essa è il quadrato della cosiddetta Analisi discriminante 85 distanza di Mahalanobis o distanza generalizzata. Si definisce distanza generalizzata in quanto, se Σ è la matrice identità a q dimensioni, la distanza di Mahalanobis coincide con la distanza euclidea nello spazio (euclideo) a q dimensioni. Quindi, nell’ipotesi di distribuzione multinormale con stessa matrice di covarianza interna ai gruppi, la regola della verosimiglianza massima assegna l’unità i-esima al gruppo col centroide meno distante da xi, in termini di distanza di Mahalanobis. Tuttavia, l’espressione (6.1.6) si presta ad ulteriori interpretazioni. Infatti, dopo alcuni passaggi algebrici, si ottiene: (6.1.7) se xi (Σ–1µ1’–Σ–1µ0’)>0.5(µ1Σ–1µ1’–µ0Σ–1µ0’) assegna i a G1 da cui, ponendo a=Σ–1(µ1–µ0)’ e k=–0.5(µ0Σ–1µ0’– µ1Σ–1µ1’), si ricava la regola classificatoria basata su una funzione discriminante linere: se xia>k si assegna l’unità i al gruppo G1 altrimenti a G0. Funzione discriminante equivalente e relativa decisione è: (6.1.8) se xia–k>0 si assegna l’unità i al gruppo G1 altrimenti a G0. Ora, si vede facilmente che xia è una trasformazione lineare di in xi e cioè, è una funzione discriminante lineare (infatti, a è un vettore colonna di q elementi). Il valore assunto da detta funzione (detto discriminant score) è naturalmente uno scalare. L’applicazione del criterio della massima probabilità posteriori conduce ad un diverso punto di cut-off, che è funzione anche delle probabilità a priori: (6.1.9) se xia–k>log(p0/p1) si assegna l’unità i al gruppo G1 altrimenti a G0. Anche l’interpretazione della (6.1.9) può essere fatta anche in funzione della distanza di Mahalanobis. 86 Analisi discriminante 6.1.4 Funzione discriminante e AD logistica Secondo questa impostazione, si ipotizza che la probabilità di appartenenza al gruppo Gj per una unità i, dipenda da alcune sue caratteristiche (vettore xi). Operativamente, si tratta di specificare P(G1|xi) in funzione di xi medesimo mediante una opportuna forma funzionale del tipo: P(G1|xi)=Γ(xi) tale che 0<Γ(xi)<1. La specificazione di Γ(xi), che conduce alla discriminante logistica è la seguente: P(G1|xi)=Γ(xi)=exp(β0+xiβ)/[1+ exp(β0+ xiβ)] dove β0 è l’intercetta (scalare) e β è un vettore (colonna) di coefficienti. L’espressione assegnata a Γ(xi) è la funzione di ripartizione di una variabile casuale logistica standard (avente, cioè, media zero e varianza π2/3) calcolata nel punto (β0+xiβ). Ciò significa che, la probabilità che l’unità con vettore xi appartenga al gruppo G1 è uguale alla probabilità che una variabile casuale logistica standard Z, assuma valori minori o uguali a (β0+xiβ) e cioè P(Z≤β0+xiβ). Con questa specificazione, si ha che: P(G1|xi)/ P(G0|xi)=Γ(xi)/[1–Γ(xi)]=exp(β0+xiβ) da cui è immediata l’applicazione del criterio della massima probabilità a posteriori che ci dà la seguente regola classificatoria: (6.1.10) se exp(β0+xiβ)>1 altrimenti a G0 si assegna i a G1 da cui, operando la trasformazione logaritmica, si ricava la regola equivalente: (6.1.11) se xiβ+β0 >0 si assegna i a G1 altrimenti a G0 Analisi discriminante 87 Anche in questo caso si ricava una funzione discriminante lineare che viene confrontata con il punto di cut-off uguale a zero. Per l’applicazione del criterio della verosimiglianza massima occorre dividere ciascuna probabilità a posteriori per la corrispondente probabilità a priori. Ciò ci porta alla seguente regola che si differenzia dalla (6.1.11) per un diverso punto di cut-off: (6.1.12) se xiβ+β0 >log(p1/p0) si assegna i a G1 altrimenti a G0 6.2 Stima della funzione discriminante (AD normale) La Tab. 6.2.1 riassume le funzioni discriminanti e i punti di cut-off ricavati in corrispondenza dei due approcci e delle due regole classificatorie qui viste. In pratica, tuttavia, accade che i parametri coinvolti nelle regole classificatorie (e cioè: le medie e la matrice di varianza e covarianza comune ai due gruppi per l’AD normale, β e β0 per l’AD logistica) non siano noti. E’ necessario pertanto stimare i parametri sulla base di dati campionari. Tab. 6.2.1 Funzioni discriminanti lineari per AD normale e AD logistica FUNZIONE PUNTO DI CRITERIO MODELLO CLASSIFICATORIO DISCRIMINANTE CUT-OFF Verosim. max. (6.1.8) 0 Multinormale Σ0= Σ1 (approccio 1) Max prob. posteriori (6.1.9) log(p0/p1) Verosim. max. (6.1.12) log(p1/p0) Logistico (approccio 2) 0 Max prob. posteriori (6.1.11) Nella conduzione di un’analisi discriminante, è necessario affrontare le seguenti fasi: 1) stima dei parametri della funzione discriminante; 2) verifica della capacità predittiva della funzione discriminante così stimata. A questo proposito occorre dire che le funzioni stimate non garantiscono sempre risultati soddisfacenti. In particolare, le proprietà ‘ottimali’ delle regole decisionali (come ad esempio la 88 Analisi discriminante minimizzazione della probabilità di errata classificazione) sono garantite dai veri modelli probabilistici e cioè dalle vere forme funzionali e dai veri valori dei parametri. Per questo motivo è necessario, una volta stimata la funzione discriminante secondo uno degli approcci prima delineati, procedere alla verifica della sua capacità classificatoria. In merito alla stima della funzione discriminante, consideriamo il caso più frequente, che consiste nella stima da due campioni, ciascuno estratto da una delle due sottopopolazioni: gruppo G0 e gruppo G1. In queste note descriviamo la procedura di stima per una AD normale nell’ipotesi di uguali matrici di covarianza interne ai gruppi. In tal caso le stime dei parametri sono ottenute come: 1) stima dei vettori delle medie µ0 e µ1: mediante le medie, che indichiamo con m0 e m1, calcolate all’interno dei due campioni; 2) stima della matrice di covarianza comune Σ. La stima di Σ è la matrice di covarianza interna (within o pooled) W, che è la media delle due matrici di covarianza calcolate separatamente sui dati campionari relativi a ciascun gruppo. L’elemento generico shl di W è calcolato quindi come: shl=(n1 s1,hl+ n0 s0,hl)/(n1+n0) dove sj,hl è l’elemento (h,l) della matrice di varianza e covarianza calcolata sul campione del gruppo j e nj è la numerosità del gruppo Gj nel campione (j=0,1). Riassumendo quanto detto fin qui, la validità di una AD normale (lineare) dipende dalle seguenti ipotesi: 1. P(x|G0) e P(x|G1) sono densità normali multivariate; 2. le matrici di varianze e covarianza dei gruppi sono uguali (Σ0=Σ1=Σ); 3. le medie µ0 e µ1 e la matrice di varianza e covarianza Σ sono note. Abbiamo visto che, se la 3 non è verificata, si procede ad una stima dei parametri distributivi. Se l'assunzione 2 è violata si ottiene una funzione discriminante quadratica in x, anziché lineare. Il punto 1, Analisi discriminante 89 inoltre, è difficilmente sostenibile se abbiamo variabili con distribuzione molto diversa dalla normale. Se si ritiene valida l’ipotesi di funzione discriminante lineare, la AD logistica si propone validamente come alternativa alla AD normale in quanto non richiede l’assunto 1. Pertanto, in tal caso, l’AD logistica appare più corretta ai fini della costruzione di modelli per la previsione delle insolvenze poiché gli indici di bilancio che non hanno generalmente distribuzioni di tipo normale. L’AD lineare normale mantiene tuttavia una sua validità se viene interpretata in senso geometrico attraverso la misura di distanza generalizzata o distanza di Mahalanobis. 6.3 Verifica della capacità classificatoria della funzione discriminante La valutazione della capacità classificatoria di un modello di AD, a fini predittivi (es. previsione delle insolvenze aziendali), consiste nella risposta alla seguente domanda: quanto è accurata la regola classificatoria, stimata su un determinato campione, per classificare altri (ovvero futuri) campioni, che devono però ritenersi estratti dalla medesima popolazione del primo (si tratta di verificare la validità del modello stimato nel classificare nuove unità)? I principali procedimenti impiegati per la valutazione della capacità classificatoria di una funzione discriminante si distinguono in analisi interna e analisi esterna. Analisi interna: la capacità classificatoria viene valutata riclassificando le medesime osservazioni usate per la stima della funzione discriminante. Supponendo di avere stimato una funzione discriminante da un campione di n unità, n1 delle quali estratte dal gruppo G1 e n0 estratte dal gruppo G0, si tratta, in pratica, di applicare uno dei criteri classificatori delineati nella Tab. 6.1.1 sulle stesse n unità impiegate per la stima, costruendo la seguente matrice di riclassificazione. Tab. 6.2.1 Matrice di riclassificazione Gruppi Gruppi assegnati veri 0 1 0 n00 n01 Totale n0 90 Analisi discriminante 1 n10 n11 n1 Dalla tabella si possono ricavare le seguenti indicazioni: – proporzione di unità correttamente riclassificate (n00+n11)/n; – proporzione di unità del gruppo 0 correttamente riclassificate n00/n0 – proporzione di unità del gruppo 1 correttamente riclassificate n11/n1 Se il gruppo 1 rappresenta il nostro evento di interesse, ad es. fallimento, allora n01 è il numero dei cosiddetti falsi positivi e n10 è il numero dei falsi negativi. Analisi esterna: la capacità classificatoria viene valutata classificando nuove unità ovvero osservazioni che non sono state usate per la stima della funzione discriminante. Si tratta, in pratica, di costruire un tabella analoga alla 6.2.1 per nuove unità, delle quali è noto il gruppo di appartenenza ma che non hanno partecipato alla stima della funzione discriminante. Un modo per condurre l’analisi esterna è il seguente. Occorre suddividere il campione di osservazioni in due sottocampioni: uno (training sample) viene usato per la stima della funzione discriminate e l'altro (test sample) per la validazione della regola classificatoria. I principali problemi connessi con questo procedimento riguardano la necessità di disporre di un campione di dimensioni adeguate. Si può subito osservare che, ai fini della valutazione della capacità predittiva, è preferibile agire mediante un’analisi esterna in quanto quella interna tende, in generale, a fornire risultati più ottimistici. Se lo scopo della AD fosse di tipo descrittivo, allora sarebbe sufficiente la sola conduzione di un’analisi interna. 6.4 Esempio numerico In questo paragrafo vedremo un esempio di AD normale, nell’ipotesi di stessa matrice di varianza e covarianza interna ai gruppi. Si suppone che la popolazione sia composta da due gruppi della stessa numerosità (di conseguenza p1=p0=0.5), da ognuno dei quali sono state estratte 10 unità e sono state osservate due variabili: X1 e X2. La Tab. 6.4.1 riporta i dati del campione. Analisi discriminante Tab. 6.4.1 Dati dell’esempio numerico di AD normale (lineare) Gruppo Unità X1 X2 Medie Devianze X1 X2 X1 X2 0 1 2 1 0 2 2 1 0 3 3 0 4.00 1.5 18 5.5 0 4 5 2 0 5 6 2 0 6 6 3 0 7 3 2 0 8 5 1 0 9 7 1 0 10 4 0 1 11 6 3 1 12 7 3 1 13 7 2 8.17 3.67 14.8 7.3 1 14 9 4 1 15 10 5 1 16 10 5 1 17 7 4 1 18 9 5 1 19 10 6 1 20 10 4 91 Funzione discriminante 3.05-9.3 3.05-9.3 4.68-9.3 7.66 9.21 9.15 4.54 7.73 10.84 6.24 9.15 10.71 10.78 13.76 15.25 15.25 10.64 13.69 15.18 15.32 Volendo proporre una AD avente fini predittivi, decidiamo di lasciare 8 unità (4 per ogni gruppo) per la verifica della capacità classificatoria della funzione discriminante stimata. Tali osservazioni sono contrassegnate dal carattere corsivo-grassetto. Poiché, nel nostro caso, le proporzioni dei due gruppi sono uguali, il criterio della verosimiglianza massima coincide con quello della massima probabilità a posteriori. Pertanto il criterio classificatorio da usare è dato dalla funzione discriminante (6.1.8) con cut-off uguale a k. Tali grandezze sono funzioni delle medie, delle varianze e delle covarianze delle variabili, che non sono note e devono quindi essere stimate. La Tab 6.4.1 riporta i valori delle medie interne ai gruppi. Si tratta delle stime dei centroidi dei gruppi: m0 = (4 1.5) m1 = (8.17 3.67) 92 Analisi discriminante In base ai dati riportati in tabella, le stime della varianza interna di X1 e di X2 sono: s12=(18+14.8)/12=2.74 s22=(5.5+7.3)/12=1.07 Infine, poiché le codevianze fra X1 e X2 interne ai gruppi 0 e 1 sono rispettivamente 8 e 9.3, la covarianza interna fra le due variabili è: w12= (8+9.3)/12=1.44 Pertanto la matrice di varianza e covarianza pooled (cioè la stima di Σ) è: W: 2.74 1.44 1.44 1.07 la cui matrice inversa è inoltre: W–1: 1.274 –1.678 –1.678 3.193 Si ricorda che abbiamo utilizzato il simbolo W perché si tratta della matrice di varianza e covarianza interna o within. Da questi dati è possibile ricavare il vettore a e k:: a= W–1(m1–m0)= (1.559 –0.068) k=(m1S-1m’1 – m0S-1m’0 )/2 = (25.6–7)/2 = 18.6/2=9.3 La regola classificatoria per una generica unità sulla quale sono osservate le due variabili X1 e X2 è la seguente: se 1.559 X1 – 0.068 X2 – 9.3>0 l’unità è assegnata al gruppo 1 altrimenti al gruppo 0 Tale regola è stata applicata sui dati della Tab. 6.5.1. La colonna ‘Funzione discriminante’ riporta i valori ottenuti dall’espressione: yi= 1.559X1–0.068X2–9.3 Analisi discriminante 93 su ogni unità. Il valore yi viene detto discriminant score. Gli errori di classificazione sono contrassegnati dai valori sottolineati. Vediamo che le unità 9 e 11 verrebbero classificate in modo sbagliato. L’impiego della regola classificatoria stimata a fini predittivi può essere brevemente qui descritto. Supponiamo di voler classificare una nuova unità della quale non conosciamo il gruppo di appartenenza e sulla quale abbiamo osservato i valori X1=2 e X2=2. Ebbene, la funzione discriminante stimata ci fornisce in corrispondenza lo score: y= 1.559 2 – 0.068 2 –9.3<0 Poiché y<0, classificheremo l’unità nel gruppo 0. Bibliografia 95 Bibliografia Altman E.I: (1968), Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy, Journal of Finance, n.23. Altman E.I. (1983), Corporate Financial Distress. A complete Guide to Predicting, Avoiding and Dealing with Bankruptcy, J.Wiley, N.Y. Altman E.I., G.Marco, F. Varetto (1994), Corporate Distress Diagnosis: Comparisons Using Linear Discriminant Analysis and Neural Networks (the Italian experience), Journal of Banking and Finance, n.18. Appettiti S. (1985), L’analisi discriminante e la valutazione della fragilità finanziaria delle imprese, Contributi all’analisi economica della Banca d’Italia, n.3. Banca d’Italia (1995), La Centrale dei Rischi, Collane tematiche istituzionali, Roma. Barnes P: (1987), ‘The Analysis and Use of Financial Ratios: a Review Article’, Journal of Business Finance and Accounting, n. 4, 449-461. Berry R.H., S.Nix (1991), ‘Regression v. Ratio in the Cross-Section Analysis of Financial Statements’, Accounting and Business Research, n.82, 107-117. Brealy R., S. Myers (1988), Principles of Corporate Finance, 3rd ed., McGraw-Hill. Cannari L., L.F.Signorini (1995), L’analisi discriminante per la previsione delle crisi delle micro-banche, Temi di discussione, n.258, Banca d’Italia, Roma. Cannari L., G. Pellegrini, P.Sestito (1996), L’utilizzo di microdati d’impresa per l’analisi economica: alcune metodologie alla luce delle esperienze della Bamca d’Italia’, Temi di discussione, Banca d’Italia, n.286. Centrale dei Bilanci (1995), Un’applicazione delle reti neurali alla diagnosi delle insolvenze, Bancaria,n.4. Ecchia S. (1996), Il rischio di credito. Metodologie avanzate di previsione delle insolvenze, Giappichelli ed., Torino. Ezzamel M., C. Mar-Molinero (1990), ‘The Distributional Properties of Financial Ratios in UK Manufacturing Companies’, Journal of Business Finance and Accounting, n. 1, 1-29. 80 Analisi discriminante Forestieri G. (1986), La previsione delle insolvenze aziendali’, Giuffrè, Milano. Fabbris L. (1983), Analisi esplorativa dei dati multidimensionali, Cleup, Padova. Foster G. (1986), Financial Statement Analysis, Englewood Cliffs. Ganugi P., G. Gozzi, M. Riani (1997), ‘Il monitoraggio delle imprese tessili nella provincia di Prato nell’ambito dell’Osservatorio Bilanci’, Il sistema Prato: analisi e previsioni, Quaderni SIEL, Provincia di Prato, 9-92. Guatri L. (1986), Crisi e risanamento delle imprese, Giuffrè, Milano. Huberty C. (1994), Applied Discriminant Analysis, Wiley. Lev B., S.Sunder (1979), ‘Methodological Issues in the Use of Financial Ratios’, Journal of Accounting and Economics, n. 3, 187-210. Mainly B. F. J. (1986), Multivariate statistical methods: a primer, Chapman and Hall, London. Luerti A. (1992), La previsione dello stato di insolvenza delle imprese. Il modello AL/93 di Credit Scoring elaborato in base alla IV Direttiva CEE, EtasLibri. McDonald B., M.H.Morris (1984), ‘The Statistical Validity of the Ratio Method in Financial Analysis: an Empirical Examination’, Journal of Business Finance and Accounting, n. 11, 89-97. Maddala G.S.(1983), Limited Dependent and Qualitative Variables in Econometrics, Cambridge University Press. Previdi M. (1995), Analisi di bilancio: valutazioni, rating e simulazioni, IPSOA, Milano. Rosenberg E., A.Gleit (1994), Quantitative Methods in Credit Management: a Survey, Journal of Operations Research, n.4. Rossi C. (1988), Indicatori di bilancio, modelli di classificazione e previsione delle insolvenze aziendali, Giuffrè, Milano. Rossi C. (1992), La valutazione delle condizioni di solvibilità delle imprese. Un modello basato sull’analisi discriminatoria’, Cacucci editore, Bari. Salmi T., K. Martikainen (1996), ‘A Review of Financial Ratio Analysis’, The Finnish Journal of Business Economics, n.4, 426-448. Bibliografia 95 Salmi T., I. Virtanen, P. Yli-Olli (1990), ‘On the Classification of Financial Ratios’, Acta Wasaensia, n. 25, University of Vaasa, Finland. Teodori C. (1989), Modelli di previsione nell’analisi economicoaziendale, Giappichelli. Viganò L. (1993), Un modello per la valutazione del rischio creditizio, Il Risparmio, n.4. Vitali O. Siti Internet di interesse http://inforcamere.padova.ccr.it (Home page italiana delle piccole e medie imprese) http://www.sands-trustee.com (modello per la previsione delle insolvenze sviluppato presso la Simon Fraser University, British Columbia) http://ecn01.cineca.it (siti e links di interesse economico a cura del Cineca) http://sogig.ac.uk/subjects (links con vari siti di interesse economico; ricerca per soggetto) http://www.lincoln.ac.nz/acul/aaanz/papers (pubblicazioni di contabilità e finanza a cura dell’Accounting Association of Australia and New Zealand) http://www.bus.olemiss.edu (pubblicazioni, dati, modelli inerenti alla previsione delle insolvenze aziendali)