levine11_57-116 3-04-2002 8:27 Pagina 57 11 Analisi delle serie storiche Introduzione 11.1 11.2 11.3 11.4 11.5 11.6 11.7 11.8 58 L’importanza della previsione a livello aziendale 58 Il modello moltiplicativo classico delle serie storiche 59 Livellamento di una serie storica annuale 61 Il metodo dei minimi quadrati e la previsione 71 Modelli autoregressivi per la determinazione del trend e per la previsione Scelta del modello di previsione 93 Analisi di serie storiche a cadenza mensile o trimestrale 97 Validità e limiti dei metodi di analisi delle serie storiche 106 Riepilogo del capitolo A11.1 84 107 L’uso di Microsoft Excel per l’analisi delle serie storiche 114 ◆ 57 levine11_57-116 3-04-2002 8:27 Pagina 58 OBIETTIVI DEL CAPITOLO ✓ ✓ ✓ Presentare un modello classico per l’analisi delle serie storiche Introdurre una varietà di modelli per la previsione con dati a cadenza annuale Sviluppare modelli previsivi per dati trimestrali o mensili Intr oduzione Nei precedenti capitoli sono stati introdotti e discussi modelli di regressione lineare assai utili a scopi previsivi. Abbiamo visto come l’analisi basata sulla regressione possa costituire un valido supporto nel processo decisionale aziendale. In questo capitolo introdurremo e approfondiremo il concetto di serie storica, molto importante nell’ambito della pianificazione e controllo. Inizieremo presentando serie storiche a cadenza annuale e introducendo due tecniche di livellamento (“smussamento”) per serie siffatte: medie mobili e livellamento (o smorzamento) esponenziale (paragrafo 11.3). Il discorso toccherà poi alcune importanti tecniche di interpolazione e previsione per serie annuali, dal metodo dei minimi quadrati (paragrafo 11.4) a metodologie più avanzate (paragrafo 11.5). Gli stessi metodi saranno poi estesi e adattati all’analisi di serie storiche a cadenza mensile e trimestrale e in particolare al problema della valutazione della componente stagionale (paragrafo 11.7). ◆ APPLICAZIONE: Previsione delle entrate lorde annuali presso la società Eastman Kodak La Eastman Kodak è una delle più importanti società nel campo dell’immagine a livello mondiale. I suoi principi sono: la produzione su vasta scala a basso costo, la distribuzione internazionale dei prodotti, l’uso massiccio della pubblicità e l’attenzione nei confronti del consumatore. I livelli direttivi della Eastman Kodak hanno capito l’importanza della ricerca e della continua e accurata analisi dei risultati in termini di performance della società, fondamentali quando si ha come obiettivo quello di diventare leader nel settore. Nei paragrafi 11.4 e 11.5 di questo capitolo saranno presentati i dati relativi alle entrate lorde annuali della società nel periodo compreso fra il 1975 e il 1998, che verranno utilizzati per fare delle previsioni. Un’analisi di questo tipo può essere di grande aiuto al management della società per comprendere l’evoluzione storica e gli eventuali cambiamenti nei livelli di performance conseguiti, per individuare concretamente la posizione ricoperta dalla Eastman Kodak all’interno del settore e per valutare gli effetti futuri di alcune strategie che la società può decidere di adottare. ◆ ◆ 11.1 58 L’IMPORTANZA CAPITOLO 11 DELLA PREVISIONE A LIVELLO AZIENDALE Poiché le condizioni economiche e del mercato cambiano continuamente nel corso del tempo, gli operatori aziendali devono essere in grado di valutare e prevedere gli effetti di tali cambiamenti sulla salute dell’azienda. È quindi necessario sviluppare delle tecniche di previsione in grado di supportare le scelte e le strategie dell’azienda. L’esigenza di fare previsioni caratterizza in un certo senso le società moderne. I governi devono essere in grado di prevedere l’andamento di fenomeni quali la disoccupazione, l’inflazione, la produzione industriale, il gettito fiscale per poter adottare politiche sociali e fiscali corrette; i responsabili del marketing all’interno di una società devono riuscire a ANALISI DELLE SERIE STORICHE levine11_57-116 3-04-2002 8:27 Pagina 59 prevedere la domanda del prodotto, il volume delle vendite, l’evoluzione dei gusti del consumatore per poter adottare corrette decisioni di politica aziendale; l’amministrazione di un’università deve essere in grado di prevedere l’ammontare delle iscrizioni sulla base delle proiezioni della popolazione e di altri elementi a sua disposizione per poter progettare gli spazi, le strutture (mensa, pensionato). Tipi di metodi di previsione Gli approcci alla previsione sono essenzialmente due: un approccio qualitativo e un approccio quantitativo. I metodi di previsione qualitativi devono essere adottati quando non si dispone di dati storici, per esempio se si vogliono prevedere le entrate di una nuova società. Si tratta naturalmente di metodi altamente soggettivi. Tra le più importanti tecniche di previsione qualitative devono essere ricordate il factor listing method, l’expert opinion, e la Delphi technique (riferimento bibliografico 4). Le tecniche di previsione quantitative al contrario si basano proprio sull’uso di dati storici, dai quali l’analista cerca di comprendere la struttura sottostante del fenomeno per poi utilizzarla a scopi previsivi. A loro volta i metodi di previsione quantitativi possono rientrare in due macro-categorie: metodi basati sulle serie storiche e metodi aleatori. I primi consistono nell’effettuare previsioni sull’andamento futuro di una variabile sulla base delle realizzazioni passate e presenti della variabile in questione. Serie Storica Una serie storica è un insieme di dati numerici registrati ad intervalli regolari di tempo. ◆ 11.2 Esempi di serie storica possono essere rappresentati dai prezzi di chiusura giornalieri di un’azione, dalle pubblicazioni mensili dell’indice dei prezzi al consumo, dai valori trimestrali del prodotto interno lordo oppure dai volumi di vendite annuali realizzati da una certa società. I metodi di previsione aleatori consistono nella determinazione di fattori legati alla variabile di cui si vuole effettuare la previsione. Tali metodi includono la regressione multipla con variabili ritardate, i modelli econometrici, gli indici di diffusione e altri metodi che vanno oltre gli scopi di questo testo (riferimenti bibliografici 5 e 8). Ci concentriamo quindi sull’analisi delle serie storiche. IL MODELLO MOLTIPLICATIVO CLASSICO DELLE SERIE STORICHE Alla base dell’analisi delle serie storiche vi è l’assunzione secondo cui i fattori che hanno influenzato l’andamento della serie nel passato e nel presente continuino a esercitare effetti analoghi anche nel futuro. Di conseguenza l’analista non deve fare altro se non individuare e isolare tali fattori per effettuare previsioni e quindi indirizzare l’attività di pianificazione e controllo aziendali. A tale scopo gli statistici hanno elaborato diversi modelli per disaggregare la serie nelle sue componenti; in questo testo verrà approfondito il modello classico moltiplicativo, che sarà utilizzato a scopi previsivi. Consideriamo a titolo di esempio la serie storica delle entrate lorde realizzate dalla società Eastman Kodak nel periodo di tempo compreso fra il 1975 e il 1998 (Figura 11.1). Volendo dare una prima caratterizzazione dei dati, osserviamo che i valori in questione hanno manifestato una tendenza all’aumento nei 24 anni considerati: questa tendenza di lungo termine all’incremento o al decremento dei valori della serie prende il nome di trend. Chiaramente il trend non esaurisce le informazioni rilevanti sulla serie in questione (o qualsivoglia serie storica) a meno che i dati non si trovino esattamente su una linea retta. Altre due componenti (o fattori) di estrema importanza sono la componente ciclica e quella IL MODELLO MOLTIPLICATIVO CLASSICO DELLE SERIE STORICHE 59 levine11_57-116 3-04-2002 8:27 Pagina 60 FIGURA 11.1 Andamento delle entrate lorde (in milioni di dollari) realizzate dalla società Eastman Kodak nel periodo compreso fra il 1975 e il 1998. Grafico ottenuto in Microsoft Excel. irregolare. La componente ciclica spiega gli scostamenti verso l’alto o verso il basso dei dati rispetto al trend; tali scostamenti possono avere diverse durate, ma solitamente coinvolgono un periodo di tempo compreso fra due e dieci anni. I movimenti ciclici differiscono anche nell’intensità oltre che nella durata e sono spesso strettamente legati ai cicli economici. In via residuale rispetto alle componenti cicliche e di trend è possibile individuare l’ultima componente della serie, la componente irregolare o casuale. Infine, quando i dati non hanno una cadenza annuale e ci troviamo di fronte ad esempio a dati mensili o trimestrali, è necessario tenere conto di un quarto fattore: la stagionalità (equazione (11.2)). Nella Tabella 11.1 sono riassunte le quattro componenti. Nel modello moltiplicativo classico ciascun punto della serie storica è visto come prodotto di queste quattro componenti, come sintetizzato nelle equazioni (11.1) e (11.2) rispettivamente per serie storiche annuali e infra-annuali. Modello moltiplicativo classico per serie storiche annuali Yi Ti Ci Ii (11.1) Dove, nell’anno i Ti valore della componente di trend Ci valore della componente ciclica Ii valore della componente irregolare Modello moltiplicativo classico per serie storiche infra-annuali Yi Ti Si Ci Ii Dove, con riferimento al periodo i (mese o trimestre) Ti valore della componente di trend Ci valore della componente ciclica Ii valore della componente irregolare Si valore della componente stagionale 60 CAPITOLO 11 ANALISI DELLE SERIE STORICHE (11.2) levine11_57-116 3-04-2002 8:27 Pagina 61 Tabella 11.1 Componenti di una serie storica CLASSIFICAZIONE COMPONENTE DELLA COMPONENTE MOTIVI DEFINIZIONE DI INFLUENZA Trend Sistematica tendenza di lungo termine all’incremento o al decremento dei valori della serie Stagionale Sistematica Ciclica Sistematica Irregolare Non sistematica Fluttuazioni periodiche regolari che si ripetono annualmente Scostamenti verso l’alto o verso il basso dei dati rispetto al trend, secondo le fasi di prosperità (picchi positivi), contrazione (dal picco verso il basso), depressione (in discesa verso un picco negativo), ripresa (dal picco negativo verso l’alto) Fluttuazione “residua” di una serie una volta depurata dalle componenti sistematiche DURATA Cambiamenti nella tecnologia, nella popolazione, nella ricchezza o nel valore Condizioni climatiche, usi e costumi sociali e religiosi Interazione di diversi fattori economici diversi anni variazioni nei dati dovute al caso oppure ad eventi straordinari quali scioperi, uragani, alluvioni, assassini politici e così via breve durata 12 mesi (solo per dati infra-annuali) Solitamente da 2 a 10 anni Il primo passo nell’analisi di una serie storica consiste nella rappresentazione grafica dei valori, dalla quale si possono trarre le prime considerazioni di carattere qualitativo sulla serie. Osservando un grafico, infatti, è possibile intuire se i valori della serie manifestino un trend di lungo periodo oppure oscillino intorno a un’immaginaria linea orizzontale, parallela all’asse dei tempi. Nel paragrafo 11.3 saranno presentate alcune tecniche di livellamento adatte a cogliere le tendenze di lungo periodo in serie storiche che non presentano un andamento di trend. In particolare saranno discusse le tecniche di livellamento esponenziale e il metodo basato sulla costruzione di medie mobili. Nei paragrafi successivi vedremo invece alcuni modi per affrontare l’analisi delle serie storiche che seguono un trend, in particolare allo scopo di effettuare previsioni. Nei Paragrafi 11.4 e 11.5 ci occuperemo di serie storiche annuali, mentre nel paragrafo 11.7 ci concentreremo sui metodi di previsione per dati mensili e trimestrali. ◆ 11.3 LIVELLAMENTO DI UNA SERIE STORICA ANNUALE Nella Tabella 11.2 e nella Figura 11.2 sono rappresentate le vendite annuali della General Motors Corporation (GM) nei 24 anni compresi tra il 1975 e il 1998. Esaminando il grafico è difficile stabilire se i valori della serie seguano un trend di lungo periodo, poiché le forti oscillazioni di breve periodo complicano l’impressione d’insieme. In situazioni di questo tipo si rivelano di particolare utilità le tecniche di livellamento a cui si è accennato prima, in grado di favorire una corretta visione delle tendenze di lungo periodo. Le medie mobili Il metodo di livellamento basato sulle medie mobili rappresenta una tecnica altamente soggettiva, in quanto dipende dalla lunghezza del periodo scelto per la costruzione delle medie. Volendo eliminare le fluttuazioni cicliche della serie, l’analista deve in qualche modo stimare la durata media dei cicli all’interno della serie e sulla base di questa stima procedere al calcolo delle medie mobili. Ma vediamo in dettaglio in cosa consiste una media mobile. LIVELLAMENTO DI UNA SERIE STORICA ANNUALE 61 levine11_57-116 3-04-2002 8:27 Pagina 62 Tabella 11.2 Vendite (in milioni di unità) realizzate dalla General Motors Corporation (1975-1998) ANNO VENDITE ANNO VENDITE ANNO VENDITE 1975 1976 1977 1978 1979 1980 1981 1982 6.6 8.6 9.1 9.5 9.0 7.1 6.8 6.2 1983 1984 1985 1986 1987 1988 1989 1990 7.8 8.3 9.3 8.6 7.8 8.1 7.9 7.5 1991 1992 1993 1994 1995 1996 1997 1998 7.4 7.7 7.8 8.4 8.3 8.4 8.8 8.1 Nota: Le vendite sono quelle derivanti da qualunque fonte: macchina, camion, autobus e stabilimento d’oltremare. Fonte: Moody’s Handbook of Common Stocks, 1980, 1989, 1993 and annual reports. Reprinted by permission of Financial Information Services, a division of Financial Communications Company, Inc. Una media mobile di periodo L consiste in una serie di medie aritmetiche calcolate su sequenze di valori osservati di lunghezza L. Indichiamo con MA(L) una media mobile di periodo pari a L. Supponiamo ad esempio di voler calcolare una media mobile con un periodo di 5 anni su una serie di 11 anni. Essendo L = 5 anni, le medie mobili corrispondenti consisteranno in una serie di medie che coinvolgono sequenze consecutive di 5 osservazioni. La prima di tali medie si ottiene quindi sommando i primi 5 valori della serie e dividendo per 5: Y1 Y2 Y3 Y4 Y5 5 La seconda media coinvolge i valori della serie dal secondo al sesto: Y2 Y3 Y4 Y5 Y6 MA(5) 5 MA(5) FIGURA 11.2 Rappresentazione grafica delle vendite (in milioni di unità) realizzate dalla General Motors Corporation (1975-1998). Fonte: dati della Tabella 11.2. 62 CAPITOLO 11 ANALISI DELLE SERIE STORICHE levine11_57-116 3-04-2002 8:27 Pagina 63 Questo processo continua fino al calcolo dell’ultima media che sarà data da: Y7 Y8 Y9 Y10 Y11 MA(5) 5 Quando si ha a che fare con dati annuali, è conveniente che L (lunghezza del periodo di riferimento per il calcolo delle medie mobili) sia un numero dispari. Tracciando il grafico delle medie, ciascun valore ottenuto come media deve essere inserito nel punto centrale della sequenza di tempi coinvolti nella media. Nel nostro caso per esempio, la prima media mobile sarà centrata nel terzo anno, la seconda nel quarto e così via fino all’ultima che si troverà in corrispondenza del nono anno della serie. In questo modo è evidente che la serie delle medie non coinvolgerà i primi due e gli ultimi due anni coperti dai dati (in generale si perdono i primi (L–1)/2 e gli ultimi (L–1)/2 periodi). Esempio 11.1 Calcolo di una media mobile con un periodo di 5 anni I seguenti dati rappresentano le entrate realizzate da una società negli 11 anni compresi fra il 1987 e il 1997. 4.0 5.0 7.0 6.0 8.0 9.0 5.0 2.0 3.5 5.5 6.5 Si calcolino le medie mobili di periodo 5 per questa serie. S OLUZIONE Le 7 medie si ottengono nel modo seguente: Y1 Y2 Y3 Y4 Y5 4.0 5.0 7.0 6.0 8.0 30.0 6.0 5 5 5 Y2 Y3 Y4 Y5 Y6 5.0 7.0 6.0 8.0 9.0 35.0 MA(5) 7.0 5 5 5 Y3 Y4 Y5 Y6 Y7 7.0 6.0 8.0 9.0 5.0 35.0 MA(5) 7.0 5 5 5 Y4 Y5 Y6 Y7 Y8 6.0 8.0 9.0 5.0 2.0 30.0 MA(5) 6.0 5 5 5 Y5 Y6 Y7 Y8 Y9 8.0 9.0 5.0 2.0 3.5 27.5 5.5 MA(5) 5 5 5 Y6 Y7 Y8 Y9 Y10 9.0 5.0 2.0 3.5 5.5 25.0 MA(5) 5.0 5 5 5 Y7 Y8 Y9 Y10 Y11 5.0 2.0 3.5 5.5 6.5 22.5 4.5 MA(5) 5 5 5 MA(5) e devono essere centrate negli anni dal terzo al nono. Nella pratica, le medie mobili di una serie di dati vengono determinate ricorrendo all’ausilio di software (ad esempio, Microsoft Excel) per evitare di perdersi in noiosi calcoli. Nella Tabella 11.3 sono rappresentate le vendite annuali della General Motors nei 24 anni compresi fra il 1975 e il 1998 insieme con le corrispondenti medie mobili di ampiezza 3 e 7. Le stesse sono state anche rappresentate nella Figura 11.3. Osserviamo che nella serie rappresentata nella colonna C (media mobile di ordine 3) mancano il primo e l’ultimo valore, mentre in quella in colonna D (media mobile di ordine 7) i valori mancanti sono i primi tre e gli ultimi tre. LIVELLAMENTO DI UNA SERIE STORICA ANNUALE 63 levine11_57-116 3-04-2002 8:27 Pagina 64 Tabella 11.3 Medie mobili di ordine 3 e di ordine 7 calcolate sulla serie delle vendite della General Motors (1975-1998) Si nota immediatamente dal grafico che la media mobile di ampiezza 7 smussa in misura notevolmente maggiore la serie originaria rispetto a quella di ordine 3. D’altra parte porta a una perdita di valori più consistente (sei contro due). In generale si può dire che c’è un trade-off tra la bontà del livellamento e la completezza della serie “smussata”. Livellamento esponenziale Il livellamento (o smorzamento) esponenziale è un’altra tecnica utilizzata per smussare una serie storica di dati al fine di fornire all’analista un’impressione dei movimenti di lungo terFIGURA 11.3 Rappresentazione grafica in Microsoft Excel delle medie mobili di ordine 3 e di ordine 7 calcolate sulla serie delle vendite della General Motors. Fonte: dati della Tabella 11.2. 64 CAPITOLO 11 ANALISI DELLE SERIE STORICHE levine11_57-116 3-04-2002 8:27 Pagina 65 mine della serie stessa. Il metodo del livellamento esponenziale è di particolare interesse poiché consente di effettuare previsioni di breve termine (ad un periodo) anche su dati che non presentano un evidente andamento di trend, come quelli relativi alle vendite della General Motors presentati nella Tabella e nella Figura 11.3. In questo senso la tecnica di livellamento rappresenta un metodo di analisi più vantaggioso rispetto alla tecnica basata sulle medie mobili. Il metodo del livellamento esponenziale consiste nell’applicazione alla serie dei dati di una media mobile ponderata esponenzialmente. In questo modo, come vedremo, ciascun valore della serie smussata dipende da tutti i valori osservati precedenti, cosa che non accade quando si adotta il metodo basato sulle medie mobili. Inoltre, nel calcolo dei valori della serie livellata, i pesi assegnati a ciascun valore osservato in precedenza non sono costanti, ma decrescono passando dai più recenti a quelli più lontani nel tempo. Così ad esempio nel calcolo del livellamento esponenziale per il periodo i verrà assegnato il peso maggiore al valore osservato nel periodo i – 1, un peso inferiore al valore osservato nel periodo i – 2, e pesi via via decrescenti fino ad arrivare al primo valore osservato della serie, al quale è assegnato il peso minore. Come per le medie mobili, anche il calcolo del livellamento esponenziale può essere facilmente effettuato con l’ausilio di Microsoft Excel o analoghi programmi di calcolo. Concentrandoci per ora sullo smussamento della serie storica osservata (anziché sugli aspetti previsivi), osserviamo che le formule per il livellamento esponenziale di una serie storica si basano su tre soli termini: il valore corrente della serie Yi, il valore della serie smussata calcolato per il periodo precedente, Ei – 1, e un peso, o fattore di smorzamento assegnato soggettivamente, W. Per ogni periodo i si ha quindi la seguente formula per la determinazione della serie smussata: Come ottenere il valore smussato esponenzialmente per il periodo i Ei WYi (1 W)Ei1 (11.3) dove Ei valore della serie smussata esponenzialmente relativo al periodo i Ei1 valore della serie smussata esponenzialmente relativo al periodo i – 1 Yi valore osservato della serie storica nel periodo i W peso o fattore di smorzamento assegnato soggettivamente (0 < W < 1) E1 Y1 La scelta del fattore di smorzamento W è critica in quanto influisce enormemente sui risultati. Si tratta di una scelta soggettiva, tuttavia è possibile seguire la seguente regola pratica: se il nostro scopo è unicamente quello di smussare la serie eliminando le variazioni cicliche e irregolari, conviene adottare un valore basso (prossimo a zero) di W; se invece l’analista vuole anche effettuare una previsione di breve periodo, si rivela più conveniente la scelta di valori elevati (prossimi a uno) di W. Con valori bassi di W infatti vengono meglio evidenziate le tendenze di lungo periodo della serie, mentre valori elevati consentono più precise previsioni di breve periodo. ◆ Livellamento Nella Tabella 11.4 sono presentati i valori della serie relativa alle vendite della General Motors dal 1975 al 1998, smussati esponenzialmente con pesi pari a 0.5 e 0.25 (i valori sono stati ottenuti in Microsoft Excel). Nella Figura 11.4 le due serie livellate sono state rappresentate graficamente insieme con la serie originaria. LIVELLAMENTO DI UNA SERIE STORICA ANNUALE 65 levine11_57-116 3-04-2002 8:27 Pagina 66 Tabella 11.4 Livellamento esponenziale della serie relativa alle vendite realizzate dalla GM nel periodo 1975-1998 Vediamo come è stata determinata la serie smussata con un fattore di smorzamento pari a 0.25. Come punto di partenza consideriamo il primo valore osservato Y1975 = 6.6, che coincide con il primo valore della serie smussata E1975. Quindi, utilizzando il valore osservato della serie nell’anno 1976, è possibile ottenere anche il secondo valore della serie smussata, con l’applicazione della semplice formula: E 1976 WY1976 (1 W)E1975 (0.25)(8.6) (0.75)(6.6) 7.1 milioni Negli anni successivi si procede iterativamente: E 1977 WY1977 (1 W)E1976 (0.25)(9.1) (0.75)(7.1) 7.6 milioni In questo modo si calcolano tutti i valori della serie smussata (ultima colonna della Tabella 11.4). E 1978 WY1978 (1 W)E1977 (0.25)(9.5) (0.75)(7.6) 8.075 milioni ◆ Previsione Se l’analista è interessato a effettuare una previsione di breve periodo, il livellamento esponenziale può essere utilizzato nel seguente modo: il valore smussato relativo al periodo i è adottato come previsione al periodo i + 1. Previsione al periodo i 1 Ŷi1 Ei (11.4) Ad esempio, per prevedere il numero di unità vendute dalla GM nel 1999, possiamo uti- 66 CAPITOLO 11 ANALISI DELLE SERIE STORICHE levine11_57-116 3-04-2002 8:27 Pagina 67 FIGURA 11.4 Grafico delle serie smussate con fattori di smorzamento pari a 0.5 e 0.25 calcolate sulle vendite della GM nel periodo 1975-1998. Fonte: dati della Tabella 11.4. lizzare il valore smussato ottenuto per il 1998 (con un fattore di smorzamento pari a 0.5, avremo Ŷ1999 = 8.32 milioni di unità). Una volta che i dati relativi al 1999 diventano disponibili, l’equazione (11.3) può essere utilizzata per fare una previsione al 2000: E1999 WY1999 (1 W)E1998 Valore corrente smussato (W) (valore corrente osservato) (1 – W) (precedente valore smussato) In termini di previsione si ha: Ŷ 2000 WY1999 (1 W)Ŷ1999 Nuova previsione (W)(valore corrente osservato) (1 W)(previsione corrente) Esercizi del Paragrafo 11.3 11.1 • 11.2 11.3 DATASET OILSUPP • 11.4 Applicando il metodo del livellamento esponenziale alla serie storica delle entrate di una società, supponete di aver ottenuto un valore “smussato” per l’ultimo anno dell’indagine di 32.4 milioni di dollari. Qual è la vostra previsione per l’anno successivo? Considerate una serie storica di valori registrati a partire dal 1955. Applicando una media mobile di ampiezza pari a 9 anni: (a) In quale anno risulterà centrata la prima media mobile? (b) Quanti anni vengono persi nella serie delle medie mobili? Supponete ora di applicare alla stessa serie il livellamento esponenziale con fattore di smorzamento W 0.2. Supponete inoltre che il valore smussato della serie per l’anno 1996 sia dato da: E1996 (0.20)(12.1) (0.80)(9.4). Calcolate il valore successivo della serie smussata (E1997) supponendo che il valore osservato nell’anno in questione sia pari a 11.5 milioni di dollari. I seguenti dati rappresentano il numero annuale di impiegati (in migliaia) presso una società che produce olio. LIVELLAMENTO DI UNA SERIE STORICA ANNUALE 67 levine11_57-116 3-04-2002 8:27 Pagina 68 Numero di impiegati (in migliaia) DATASET 11.5 FOODTIME ANNO NUMERO ANNO NUMERO ANNO NUMERO 1978 1979 1980 1981 1982 1983 1984 1.45 1.55 1.61 1.60 1.74 1.92 1.95 1985 1986 1987 1988 1989 1990 1991 2.04 2.06 1.80 1.73 1.77 1.90 1.82 1992 1993 1994 1995 1996 1997 1.65 1.73 1.88 2.00 2.08 1.88 (a) Rappresentate i dati in un opportuno grafico. (b) Calcolate le medie mobili di ampiezza pari a 3 anni e rappresentatene la serie sullo stesso grafico. (c) Applicate il livellamento esponenziale con fattore di smorzamento W 0.5 e aggiungete la serie smussata al grafico precedente. (d) Sulla base di quanto ottenuto al punto (c), fate una previsione per il 1998. (e) Applicate ora un livellamento esponenziale con fattore di smorzamento W 0.25 e aggiungete la serie smussata al grafico precedente. (f ) Sulla base di quanto ottenuto al punto (e), fate una previsione per il 1998. (g) Confrontate i risultati ottenuti ai punti (d) e (f). Nella seguente tabella sono rappresentate le vendite (in milioni di dollari) realizzate da una società operante nel ramo alimentare negli anni compresi fra il 1972 e il 1997. Vendite annuali (in milioni di dollari) DATASET MEDFAMIN 68 CAPITOLO 11 11.6 ANNO VENDITE ANNO VENDITE ANNO VENDITE 1972 1973 1974 1975 1976 1977 1978 1979 1980 41.6 48.0 51.7 55.9 51.8 57.0 64.4 60.8 56.3 1981 1982 1983 1984 1985 1986 1987 1988 1989 53.2 53.3 51.6 49.0 38.6 37.3 43.8 41.7 38.3 1990 1991 1992 1993 1994 1995 1996 1997 36.4 38.4 42.6 34.8 28.4 23.9 27.8 42.1 (a) Rappresentate i dati in un opportuno grafico. (b) Calcolate le medie mobili di ampiezza pari a 7 anni e rappresentatene la serie sullo stesso grafico. (c) Applicate un livellamento esponenziale con fattore di smorzamento W 0.25 e aggiungete la serie smussata al grafico precedente. (d) Sulla base di quanto ottenuto al punto (c), fate una previsione per il 1998. (e) Applicate ora un livellamento esponenziale con fattore di smorzamento W 0.5 e aggiungete la serie smussata al grafico precedente. (f ) Sulla base di quanto ottenuto al punto (e), fate una previsione per il 1998. (g) Confrontate i risultati ottenuti ai punti (d) e (f). I seguenti dati rappresentano per gli anni 1980-1996 il reddito mediano delle famiglie statunitensi con riferimento alla popolazione considerata nel suo complesso e separatamente rispetto alle 3 razze più diffuse negli Stati Uniti: bianchi, neri e ispanici. ANALISI DELLE SERIE STORICHE levine11_57-116 3-04-2002 8:27 Pagina 69 Reddito familiare mediano (in dollari) negli Stati Uniti ANNO COMPLESSIVO BIANCHI NERI ISPANICI 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 33 763 33 215 33 105 32 900 33 849 34 439 35 642 35 994 36 108 36 575 35 945 34 705 34 261 33 922 34 158 35 082 35 492 35 620 35 094 34 657 34 502 35 709 36 320 37 471 37 924 38 172 38 473 37 492 36 367 36 020 35 788 36 026 36 822 37 161 20 521 19 693 19 642 19 579 20 343 21 609 21 588 21 646 21 760 22 881 22 420 21 665 20 974 21 209 22 261 23 054 23 482 26 025 26 643 24 910 25 057 25 660 25 467 26 272 26 706 27 002 27 737 26 806 26 140 25 271 24 850 24 796 23 535 24 906 Fonte: Statistical Abstract of the United States, 118th ed., 1996, U.S. Department of Commerce, Bureau of the Census, 468. DATASET 11.7 UNEMPLOY (a) Rappresentate i dati in un opportuno grafico. (b) Calcolate le medie mobili di ampiezza pari a 3 anni e rappresentatene la serie sullo stesso grafico. (c) Applicate un livellamento esponenziale con fattore di smorzamento W 0.5 e aggiungete la serie smussata al grafico precedente (d) Sulla base di quanto ottenuto al punto (c), fate una previsione per il 1997. (e) Applicate ora un livellamento esponenziale con fattore di smorzamento W 0.25 e aggiungete la serie smussata al grafico precedente. (f ) Sulla base di quanto ottenuto al punto (e), fate una previsione per il 1997. (g) Confrontate i risultati ottenuti ai punti (d) e (f). (h) Quali conclusioni potete trarre in relazione all’andamento del reddito mediano statunitense, sia complessivo che disaggregato rispetto ai tre gruppi dominanti? I seguenti dati rappresentano il tasso di disoccupazione in sette paesi europei negli anni compresi fra il 1985 e il 1996. Tasso di disoccupazione (1985-1997) ANNO 1985 1986 1987 1988 1989 1990 1991 GRAN BELGIO DENIMARCA FRANCIA ITALIA NETHERLANDS PORTOGALLO BRETAGNA 10.3 10.3 10.0 8.9 7.5 6.7 6.6 7.1 5.4 5.4 6.1 7.4 7.7 8.4 10.2 10.3 10.4 9.9 9.4 9.0 9.5 8.5 9.2 9.9 10.0 10.0 9.1 8.8 8.3 8.3 8.0 7.5 6.9 6.2 5.8 8.7 8.4 6.9 5.5 4.9 4.6 4.0 11.5 11.5 10.6 8.7 7.3 7.0 8.8 (Continua) LIVELLAMENTO DI UNA SERIE STORICA ANNUALE 69 levine11_57-116 3-04-2002 8:27 Pagina 70 Tasso di disoccupazione (1985-1997) (seguito) ANNO GRAN BELGIO DENIMARCA FRANCIA ITALIA NETHERLANDS PORTOGALLO BRETAGNA 1992 1993 1994 1995a 1996a 1997a 7.3 8.9 10.0 9.9 10.1 9.8 9.2 10.1 8.2 6.8 6.1 5.8 10.4 11.7 12.3 11.5 11.7 11.7 9.0 10.3 11.4 11.8 11.8 11.7 5.6 6.6 7.2 7.3 7.2 7.0 4.2 5.7 7.0 7.2 7.4 7.2 10.1 10.4 9.6 8.8 8.4 8.0 a Initial, unrevised estimates. Fonte: Extracted from Table 3 of European Commission’s Panorama of EU Industry 97 1 (1997): 22. DATASET BALPAY 11.8 (a) Rappresentate i dati in un opportuno grafico. (b) Calcolate le medie mobili di ampiezza pari a 3 anni e rappresentatene la serie sullo stesso grafico. (c) Applicate un livellamento esponenziale con fattore di smorzamento W = 0.5 e aggiungete la serie smussata al grafico precedente. (d) Sulla base di quanto ottenuto al punto (c), fate una previsione per il 1998. (e) Applicate ora un livellamento esponenziale con fattore di smorzamento W = 0.25 e aggiungete la serie smussata al grafico precedente. (f ) Sulla base di quanto ottenuto al punto (e), fate una previsione per il 1998. (g) Confrontate i risultati ottenuti ai punti (d) e (f). (h) Cosa potete dire sull’andamento del tasso di disoccupazione in questi sette paesi? I seguenti dati riguardano il New Mexico e rappresentano il valore della bilancia dei pagamenti (differenza fra le spese federali pro capite e le tasse federali pro capite) negli ani compresi fra il 1981 e il 1995. Bilancia dei pagamenti pro capite nel New Mexico (1981-1995) BILANCIA SPESE TASSE DEI PAGAMENTI FEDERALI FEDERALI ANNO FISCALE PRO CAPITE PRO CAPITE PRO CAPITE 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 2961 2913 2426 2881 2919 3218 3322 4336 3496 3545 3462 3632 3709 3343 3300 6212 5983 5853 6309 6414 6670 6635 7461 6578 6653 6739 7079 7272 6915 6935 3251 3069 3427 3428 3495 3452 3313 3125 3083 3108 3277 3447 3563 3572 3635 Fonte: D.P. Moynihan, M.E. Friar, H.B. Leonard, and J.H. Walder, The Federal Budget and the States: Fiscal Year 1995, jointly published by the John F. Kennedy School of Government, Harvard University, and the Office of Senator Daniel Patrick Moynihan, September 30, 1996, 73. 70 CAPITOLO 11 ANALISI DELLE SERIE STORICHE levine11_57-116 3-04-2002 8:27 Pagina 71 (a) Rappresentate i dati in un opportuno grafico. (b) Calcolate le medie mobili di ampiezza pari a 3 anni e rappresentatene la serie sullo stesso grafico. (c) Applicate un livellamento esponenziale con fattore di smorzamento W 0.5 e aggiungete la serie smussata al grafico precedente (d) Sulla base di quanto ottenuto al punto (c), fate una previsione per il 1996. (e) Applicate ora un livellamento esponenziale con fattore di smorzamento W = 0.25 e aggiungete la serie smussata al grafico precedente. (f ) Sulla base di quanto ottenuto al punto (e), fate una previsione per il 1996. (g) Confrontate i risultati ottenuti ai punti (d) e (f). (h) Cosa potete dire sull’andamento delle spese federali, delle entrate federali e della bilancia dei pagamenti in questo stato americano? ◆ 11.4 IL METODO DEI MINIMI QUADRATI E LA PREVISIONE In una serie storica il trend è sicuramente la componente oggetto di maggiore attenzione da parte degli analisti. Lo studio del trend ci consente di effettuare previsioni sull’andamento della serie nel medio e nel lungo periodo; ma anche, una volta eliminata la sua influenza sulla serie, di fare previsioni di breve periodo sull’andamento ciclico generale del mercato. Come si è già accennato in precedenza, è estremamente importante, prima di effettuare l’analisi vera e propria della serie storica, farsi un’idea generale dell’andamento della serie con l’ausilio di rappresentazioni grafiche come quelle già presentate nelle pagine precedenti (Figura 11.1). In ogni caso, se la serie manifesta tendenze di lungo periodo, siano esse di tipo lineare piuttosto che non lineare, ha senso valutare un trend attraverso il noto metodo dei minimi quadrati (paragrafi 9.2 e 10.6). Il trend lineare Si è già visto nel paragrafo 9.2 come il metodo dei minimi quadrati possa essere adottato per individuare una retta del tipo: Ŷi b0 b1Xi (11.5) dove Y rappresenta la variabile dipendente del modello e X la variabile indipendente in modo che i due coefficienti b0 e b1 siano tali da minimizzare la somma delle differenze al quadrato fra il valore osservato della serie e il valore dell’interpolante stessa: n (Y Ŷ ) 2 i i minimo i1 Si è inoltre osservato che l’equazione (11.5) può essere utilizzata per effettuare una previsione dei valori della variabile dipendente Y in corrispondenza di valori della X non osservati, semplicemente sostituendo a X il valore in corrispondenza del quale si vuole prevedere la Y. Quando applichiamo il metodo dei minimi quadrati al problema di determinazione del trend di una serie storica, la variabile indipendente è il tempo, con la convenzione di far partire l’asse delle ascisse (l’asse dei tempi in questo caso) dal primo periodo per il quale sono disponibili i dati e quindi di considerare il primo anno o il primo trimestre o il primo mese come il periodo zero (X = 0). Se ad esempio stiamo lavorando con una serie di 24 anni, al primo verrà assegnato il valore 0, al secondo il valore 1 e così via fino al ventiquattresimo anno a cui sarà assegnato il valore 23. Come esempio riprendiamo la serie storica rappresentata nella Tabella 11.5 e nella IL METODO DEI MINIMI QUADRATI E LA PREVISIONE 71 levine11_57-116 3-04-2002 8:27 Pagina 72 Figura 11.1 e relativa alle entrate lorde (in milioni di dollari correnti) della società Eastman Kodak nei 24 anni compresi fra il 1975 e il 1998. Prima di effettuare l’analisi si presenta il problema, tipico delle serie storiche di prezzi, di trasformare i prezzi correnti in prezzi reali (costanti). Ciascun valore corrente è stato quindi rapportato all’indice dei prezzi al consumo (CPI) e moltiplicato per 100. I risultati sono stati riportati nella Tabella 11.6 e nella Figura 11.5. Una volta codificati i valori della variabile X da 0 a 23 è possibile ottenere facilmente l’espressione della retta interpolante (trend) utilizzando il software Excel: Ŷi 10.8654 0.02506Xi dove l’origine è rappresentata dall’anno 1975 e le unità della variabile X sono di un anno. Nella Figura 11.6 è riportato l’output Excel della regressione. DATASET EASTMANK Tabella 11.5 Entrate lorde (in milioni di dollari correnti) della società Eastman Kodak (1975-1998) ANNO VENDITE ANNO VENDITE ANNO VENDITE ANNO VENDITE 1975 1976 1977 1978 1979 1980 5.0 5.4 6.0 7.0 8.0 9.7 1981 1982 1983 1984 1985 1986 10.3 10.8 10.2 10.6 10.6 11.5 1987 1988 1989 1990 1991 1992 13.3 17.0 18.4 18.9 19.4 20.2 1993 1994 1995 1996 1997 1998 16.3 13.7 15.3 16.2 14.5 13.4 Fonte: Moody’s Handbook of Common Stocks, 1980, 1989, 1993, 1996, 1998. Reprinted by permission of Financial Information Services, a division of Financial Communications Company, Inc. Tabella 11.6 Dalle entrate a prezzi correnti alle entrate a prezzi costanti (riferimento biennio 1982-1984) Fonte: Bureau of Labor Statistics, U.S. Department of Labor, and Moody’s Handbook of Common Stocks, 1980, 1989, 1993, 1996, 1998. Reprinted by permission of Financial Information Services, a division of Financial Communications Company, Inc. 72 CAPITOLO 11 ANALISI DELLE SERIE STORICHE levine11_57-116 3-04-2002 8:27 Pagina 73 Vediamo ora l’interpretazione dei coefficienti della retta di regressione stimata: • • L’intercetta b0 10.8654 rappresenta il valore del trend nell’anno base, vale a dire le entrate lorde (a prezzi costanti 1982-84) della società Eastman Kodak nell’anno 1975. L’inclinazione b1 0.02506 rappresenta l’aumento annuo previsto (in milioni di dollari) nelle entrate lorde della società. Una volta individuato il trend, se vogliamo effettuare una previsione delle entrate per il 1999, è sufficiente sostituire nell’equazione della retta a minimi quadrati al posto della X il valore corrispondente all’anno 1999 (X25 24). Di conseguenza la nostra previsione sarà: 1999: Ŷ25 10.8654 (0.02506)(24) 11.47 milioni di dollari costanti 1982-1984 Nonostante il trend riveli un notevole incremento di lungo periodo della serie considerata, esaminando la Figura 11.7 notiamo che i dati tendono ad allontanarsi in misura molto significativa dal trend. Nasce quindi il sospetto che l’andamento generale della serie possa essere colto meglio con un trend di tipo non lineare. Vediamo ora a confronto due modelli: il primo adatta alla serie un trend quadratico, il secondo un trend esponenziale. FIGURA 11.5 Rappresentazione in un grafico a dispersione sovrapposto delle due serie relative alle entrate della Eastman Kodak a prezzi reali e a prezzi costanti. Grafico realizzato in Microsoft Excel. FIGURA 11.6 Output di Excel del modello di regressione lineare per la determinazione del trend. Fonte: dati della Tabella 11.6. b0 b1 IL METODO DEI MINIMI QUADRATI E LA PREVISIONE 73 levine11_57-116 3-04-2002 8:27 Pagina 74 FIGURA 11.7 Interpolazione della serie delle entrate della Eastman Kodak con un trend lineare. Fonte: dati della Tabella 11.6. Il trend quadratico Il modello quadratico (basato su un polinomio di secondo grado) è il più semplice fra i modelli non lineari. Il trend quadratico si ottiene applicando il metodo dei minimi quadrati introdotto nel paragrafo 10.6: Il trend quadratico Ŷi b0 b1Xi b2X2i (11.6) Dove: b0 intercetta stimata di Y b1 effetto lineare stimato della variabile X sulla variabile Y b2 effetto non lineare stimato della variabile X sulla variabile Y Ancora una volta possiamo utilizzare Microsoft Excel per i calcoli necessari alla determinazione del trend quadratico. Nella Figura 11.8 è riportato l’output Excel della regressione quadratica relativa alle entrate lorde annuali (a prezzi costanti) della Eastman Kodak. Come possiamo leggere dalla tabella Excel, si ottiene: Ŷi 8.5284 0.6624Xi 0.0277X2i dove l’origine è rappresentata dal 1975 e l’unità di misura della variabile X è l’anno. L’equazione del trend quadratico può essere utilizzata a scopi previsivi, semplicemente sostituendo il valore di X assegnato all’anno per il quale interessa una previsione della serie e calcolando il corrispondente valore di Ŷ . Per esempio, se vogliamo prevedere le entrate della Eastman Kodak per il 1999 (X25 24), abbiamo: 1999: Ŷ25 8.5284 0.6624(24) 0.0277(24)2 8.47 milioni di dollari Nella Figura 11.9 sono rappresentati la serie delle entrate della società insieme con il trend quadratico. Il modello quadratico sembra in grado di interpolare la serie meglio di quanto non faccia quello lineare. 74 CAPITOLO 11 ANALISI DELLE SERIE STORICHE levine11_57-116 3-04-2002 8:27 Pagina 75 FIGURA 11.8 Output Excel del modello di regressione quadratica per la determinazione del trend. Fonte: dati della Tabella 11.6. b0 b1 b2 FIGURA 11.9 Interpolazione della serie delle entrate della Eastman Kodak con un trend quadratico. Il trend esponenziale Nel caso in cui i valori di una serie sembrano aumentare a un tasso crescente, in modo tale che la differenza percentuale fra le osservazioni sia costante nel tempo, si rivela utile applicare un modello esponenziale come quello presentato nell’equazione (11.7). Il modello esponenziale Ŷi b0bX1 i (11.7) dove b0 intercetta stimata di Y (b1 1) 100% stima del tasso di crescita annuale composto L’equazione (11.7) con una semplice trasformazione logaritmica assume la forma analitica data dall’equazione (11.8): Il modello esponenziale logŶi log b0 Xi log b1 IL METODO DEI MINIMI QUADRATI E LA PREVISIONE (11.8) 75 levine11_57-116 3-04-2002 8:27 Pagina 76 Osserviamo che l’equazione (11.8) è in forma lineare. Di conseguenza è possibile applicare il metodo dei minimi quadrati alla variabile log Yi e quindi ottenere la stima dell’inclinazione (log b1) e dell’intercetta (log b0). I calcoli saranno effettuati ancora una volta con l’ausilio del software Excel. Nella Figura 11.10 è rappresentato l’output del modello esponenziale relativo alle entrate della Eastman Kodak. Si è quindi ottenuto il seguente risultato: log Ŷi 1.03508 0.0005565Xi Dove l’anno iniziale è il 1975 e l’unità di misura dell’asse delle ascisse è l’anno. I valori di b0 e b1 si ottengono calcolando l’antilogaritmo dei coefficienti stimati della regressione: b0 antilog 1.03508 10.8413 b1 antilog 0.0005565 1.00128 Quindi il trend esponenziale stimato è dato da: Ŷi (10.8413)(1.00128) Xi Dove l’anno iniziale è sempre il 1975 e l’unità dell’asse delle ascisse è l’anno. L’intercetta b0 10.8413 rappresenta il valore stimato del trend nell’anno iniziale (1975); mentre il valore (b1 – 1)*100% = 0.128% rappresenta la stima del tasso di crescita annuale composto nella serie delle entrate della Eastman Kodak. Analogamente a quanto visto nell’applicazione dei modelli precedenti, anche nel caso del modello esponenziale per ottenere la previsione della serie in un istante futuro è sufficiente sostituire il valore di X assegnato all’anno in una delle equazioni (11.7) o (11.8) e calcolare il corrispondente valore della serie stimata Ŷ . Per esempio, se vogliamo prevedere le entrate per il 1999 (X25 = 24) dobbiamo effettuare i seguenti passaggi algebrici: 1999: log Ŷ25 1.03508 (0.0005565)(24) 1.0484 Ŷ25 antilog (1.0484) 11.18 milioni di dollari o 1999: Ŷ25 (10.8413)(1.00128)24 11.18 milioni di dollari Il trend esponenziale stimato è stato rappresentato nella Figura 11.11 insieme con la serie originaria. Possiamo osservare che fra i tre modelli considerati il modello esponenziale si rivela il meno adeguato a rappresentare l’andamento della serie. FIGURA 11.10 Output Excel del modello di regressione esponenziale per la determinazione del trend. Fonte: dati della Tabella 11.6. b0 b1 76 CAPITOLO 11 ANALISI DELLE SERIE STORICHE levine11_57-116 3-04-2002 8:27 Pagina 77 FIGURA 11.11 Interpolazione della serie delle entrate della Eastman Kodak con un trend esponenziale. Scelta del modello attraverso lo strumento delle differenze prime, delle differenze seconde e delle differenze percentuali Nelle pagine precedenti abbiamo cercato di interpolare una serie storica (la serie delle entrate della Eastman Kodak) con tre tipi di trend: lineare, quadratico ed esponenziale. Se vogliamo individuare il modello migliore per i nostri dati possiamo considerare il grafico dal quale scaturisce un’idea d’insieme della capacità del modello di “spiegare” i dati. Esistono anche tecniche più rigorose, basate sul calcolo e sull’analisi delle differenze prime, seconde e percentuali fra i valori della serie. Per comprendere il significato di questo metodo di indagine, è utile riassumere alcune proprietà dei trend analizzati. Riquadro 11.1 Scelta del modello attraverso le differenze prime, seconde e percentuali • Quando le osservazioni sono interpolate perfettamente da un trend lineare, le differenze prime fra i valori della serie sono costanti. Cioè: (Y2 Y1) (Y3 Y2) (Yn Yn1) • Quando le osservazioni sono interpolate perfettamente da un trend quadratico, le differenze seconde fra i valori della serie sono costanti. Cioè: [(Y3 Y2) (Y2 Y1)] [(Y4 Y3) (Y3 Y2)] [(Yn Yn1) (Yn1 Yn2)] • Quando le osservazioni sono interpolate perfettamente da un trend esponenziale, le differenze percentuali fra i valori della serie sono costanti. Cioè: Y Y Y 100% Y Y Y 100% Y Y Y 100% 2 1 1 3 2 2 n n1 n1 Anche se non dobbiamo attenderci che uno dei trend analizzati si adatti perfettamente alla serie, le differenze prime, seconde e percentuali possono rivelarsi un utile strumento IL METODO DEI MINIMI QUADRATI E LA PREVISIONE 77 levine11_57-116 3-04-2002 8:27 Pagina 78 per scegliere il modello appropriato a un insieme di dati. Negli esempi 11.2, 11.3 e 11.4 saranno illustrati dei casi in cui uno dei trend proposto nelle pagine precedenti si adatta perfettamente alle osservazioni. Esempio 11.2 Un modello lineare con perfetto adattamento I seguenti dati rappresentano il numero di passeggeri (in milioni) che annualmente si servono di una compagnia aerea. ANNO Passeggeri 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 30.0 33.0 36.0 39.0 42.0 45.0 48.0 51.0 54.0 57.0 Mostrate, con il metodo delle differenze prime, che il trend lineare fornisce una perfetta interpolazione della serie. S OLUZIONE ANNO 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 30.0 33.0 3.0 36.0 3.0 39.0 3.0 42.0 3.0 45.0 3.0 48.0 3.0 51.0 3.0 54.0 3.0 57.0 3.0 Passeggeri Differenze prime Osserviamo che le differenze fra valori consecutivi della serie sono costanti. Esempio 11.3 Un modello quadratico con perfetto adattamento I seguenti dati rappresentano il numero di passeggeri (in milioni) che annualmente si servono di una compagnia aerea. ANNO Passeggeri 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 30.0 31.0 33.5 37.5 43.0 50.0 58.5 68.5 80.0 93.0 Mostrate, con il metodo delle differenze seconde, che il trend quadratico fornisce una perfetta interpolazione della serie. S OLUZIONE ANNO Passeggeri Differenze prime Differenze seconde 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 30.0 31.0 1.0 33.5 2.5 1.5 37.5 4.0 1.5 43.0 5.5 1.5 50.0 7.0 1.5 58.5 8.5 1.5 68.5 10.0 1.5 80.0 11.5 1.5 93.0 13.0 1.5 Osserviamo che le differenze seconde fra i valori della serie sono costanti. 78 CAPITOLO 11 ANALISI DELLE SERIE STORICHE levine11_57-116 3-04-2002 8:27 Pagina 79 Esempio 11.4 Un modello esponenziale con perfetto adattamento I seguenti dati rappresentano il numero di passeggeri (in milioni) che annualmente si servono di una compagnia aerea. ANNO Passeggeri 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 30.0 31.5 33.1 34.8 36.5 38.3 40.2 42.2 44.3 46.5 Mostrate, con il metodo delle differenze percentuali, che il trend esponenziali fornisce una perfetta interpolazione della serie. S OLUZIONE ANNO 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 Passeggeri 30.0 Differenze prime Differenze percentuali 31.5 1.5 5.0 33.1 1.6 5.0 34.8 1.7 5.0 36.5 1.7 5.0 38.3 1.8 5.0 40.2 1.9 5.0 42.2 2.0 5.0 44.3 2.1 5.0 46.5 2.2 5.0 Osserviamo che le differenze percentuali fra valori consecutivi della serie sono costanti. Nella Tabella 11.7 sono rappresentate le differenze prime, seconde e percentuali relative alla serie delle entrate lorde della società Eastman Kodak. Osservando la tabella possiamo notare che nessuno dei tre modelli confrontati fornisce una perfetta interpolazione delle osservazioni. Tuttavia il trend quadratico sembra da preferire in quanto la serie delle differenze seconde manifesta un andamento più erratico e Tabella 11.7 Confronto fra le differenze prime, seconde e percentuali relative alle entrate lorde (in miliardi di dollari a prezzi costanti 1982-84) della Eastman Kodak ANNO 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 ENTRATE (IN MILIARDI DIFFERENZE DIFFERENZE DIFFERENZE DI DOLLARI) PRIME SECONDE PERCENTUALI 9.3 9.5 9.9 10.7 11.0 11.8 11.3 11.2 10.2 10.2 9.9 10.5 — 0.2 0.4 0.8 0.3 0.8 0.5 0.1 1.0 0.0 0.3 0.6 — — 0.2 0.4 0.5 0.5 1.3 0.4 0.9 1.0 0.3 0.9 ANNO — 2.2 4.2 8.1 2.8 7.3 4.2 0.9 8.9 0.0 2.9 6.1 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 ENTRATE (IN MILIARDI DIFFERENZE DIFFERENZEDIFFERENZE DI DOLLARI) PRIME SECONDE PERCENTUALI 11.7 14.4 14.8 14.5 14.2 14.4 11.3 9.2 10.0 10.3 9.0 8.2 1.2 2.7 0.4 0.3 0.3 0.2 3.1 2.1 0.8 0.3 1.3 0.8 0.6 1.5 2.3 0.7 0.0 0.5 3.3 1.0 2.9 0.5 1.6 0.5 11.4 23.1 2.8 2.0 2.1 1.4 21.5 18.6 8.7 3.0 12.6 8.9 Fonte: Tabella 11.6 di pagina 72. IL METODO DEI MINIMI QUADRATI E LA PREVISIONE 79 levine11_57-116 3-04-2002 8:27 Pagina 80 sembra fluttuare più casualmente al di sotto e al di sopra dell’origine rispetto alle serie delle differenze prime e percentuali. Esercizi del paragrafo 11.4 11.9 DATASET CPI-2 Supponete di applicare il metodo dei minimi quadrati per individuare il trend di una serie annuale contenente 25 osservazioni. (a) Quale valore deve essere assegnato a X in corrispondenza del primo anno della serie? (b) Quale valore deve essere assegnato a X in corrispondenza del quinto anno della serie? (c) Quale valore deve essere assegnato a X in corrispondenza dell’ultimo anno della serie? (d) Quale valore deve essere assegnato a X per effettuare una previsione a 5 anni della serie? • 11.10 Supponete che una serie contenente 20 osservazioni (dal 1980 al 1999): sia caratterizzata dal trend lineare Ŷi 4.0 1.5Xi. (a) Interpretate il significato dell’intercetta b0. (b) Interpretate il significato dell’inclinazione b1. (c) Calcolate il valore del trend corrispondente al quinto anno di osservazione dei dati. (d) Calcolate il valore del trend corrispondente all’ultimo anno di osservazione dei dati. (e) Sulla base del modello proposto, qual è la previsione per i tre anni successivi al periodo di osservazione dei dati? • 11.11 I seguenti dati rappresentano i valori di un indice dei prezzi al consumo (CPI) registrati negli Stati Uniti nei 34 anni compresi tra il 1965 e il 1998 (il periodo base è il 1982-84). L’indice misura la variazione media dei prezzi di un paniere di beni e servizi acquistati da una vasta gamma di consumatori. Indice dei prezzi al consumo ANNO CPI ANNO CPI ANNO CPI 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 31.5 32.4 33.4 34.8 36.7 38.8 40.5 41.8 44.4 49.3 53.8 56.9 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 60.6 65.2 72.6 82.4 90.9 96.5 99.6 103.9 107.6 109.6 113.6 118.3 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 124.0 130.7 136.2 140.3 144.5 148.2 152.4 156.9 160.5 163.0 Fonte: Bureau of Labor Statistics, U.S. Department of Labor. DATASET GDP 80 CAPITOLO 11 (a) Rappresentate i dati in un opportuno grafico. (b) Descrivete i movimenti della serie nei 34 anni considerati. 11.12 Il prodotto interno lordo (GDP) costituisce uno dei più importanti indicatori del benessere economico di un Paese e riassume le spese per il consumo individuale, gli investimenti privati, le esportazioni nette di beni e di servizi e le spese di governo. Nella seguente tabella sono rappresentati i valori del prodotto interno lordo americano registrati nel periodo di 17 anni fra il 1982 e il 1998. ANALISI DELLE SERIE STORICHE levine11_57-116 3-04-2002 8:27 Pagina 81 Prodotto interno lordo (GDP) in dollari costanti. Periodo 1982-1998 ANNO GDP REALE ANNO GDP REALE ANNO GDP REALE 1982 1983 1984 1985 1986 1987 4620.3 4803.7 5140.1 5323.5 5487.7 5649.5 1988 1989 1990 1991 1992 1993 5865,2 6062.0 6136.3 6079.4 6244.4 6386.1 1994 1995 1996 1997 1998 6608.4 6742.2 6906.8 6928.4 7188.4 Fonte: U.S. Bureau of Economic Analysis—see Statistical Abstract of the United States, 118th ed., 1999, Bureau of the Census, U.S. Department of Commerce, 715. DATASET FEDRECPT (a) Rappresentate i dati in un opportuno grafico. (b) Adattate alla serie un trend lineare e riportatelo sul grafico. (c) Quali sono le vostre previsioni del GDP americano per gli anni 1999 e 2000? (d) Cosa potete dire in generale sull’andamento della serie analizzata? • 11.13 Nella seguente tabella sono riportate le entrate federali americane (tasse sul reddito, tasse sulle successioni e donazioni, imposte sul consumo, …) a prezzi correnti, registrate nel periodo compreso fra il 1978 e il 1998. Entrate federali americane a prezzi correnti. Periodo 1982-1998 ANNO ENTRATE ANNO ENTRATE ANNO ENTRATE 1978 1979 1980 1981 1982 1983 1984 399.6 463.3 517.1 599.3 617.8 600.6 666.5 1985 1986 1987 1988 1989 1990 1991 734.2 769.3 854.4 909.3 991.2 1032.0 1055.0 1992 1993 1994 1995 1996 1997 1998a 1091.3 1154.4 1258.6 1351.8 1453.1 1579.3 1657.9 a Stima preliminare. Fonte: U.S. Office of Management and Budget—see Statistical Abstract of the United States, 118th ed., 1998, Bureau of the Census, U.S. Department of Commerce, 339. DATASET JPMORGAN (a) Costruite la serie delle entrate a prezzi costanti dividendo ciascun valore della tabella per il corrispondente valore dell’indice dei prezzi al consumo (Esercizio 11.11) e moltiplicando il risultato per 100. (b) Rappresentate la serie delle entrate a prezzi correnti in un opportuno grafico. (c) Adattate alla serie un trend lineare e riportatelo sul grafico. (d) Quali sono le vostre previsioni per gli anni 1999 e 2000? (e) Ripetete i punti (a)-(d) sulla serie delle entrate a prezzi costanti e confrontate i risultati. 11.14 Nella seguente tabella sono riportati i depositi totali (in milioni di dollari) di una delle più grandi banche americane, la J. P. Morgan, nei 19 anni compresi fra il 1979 e il 1997. Depositi totali (in milioni di dollari) della J. P. Morgan. Periodo 1979-1997 ANNO DEPOSITI ANNO DEPOSITI 1979 1980 1981 30 279 35 594 36 024 1989 1990 1991 39 158 37 557 36 976 (Continua) IL METODO DEI MINIMI QUADRATI E LA PREVISIONE 81 levine11_57-116 3-04-2002 8:27 Pagina 82 Depositi totali (in milioni di dollari) della J. P. Morgan. Periodo 1979-1997 (seguito) ANNO DEPOSITI ANNO DEPOSITI 1982 1983 1984 1985 1986 1987 1988 37 910 38 070 38 760 39 845 42 960 43 987 42 469 1992 1993 1994 1995 1996 1997 32 519 40 402 43 085 46 438 52 724 58 879 Fonte: Moody’s Handbook of Common Stocks, 1989, 1998. (a) (b) (c) (d) (e) DATASET COCACOLA Rappresentate i dati in un opportuno grafico. Adattate alla serie un trend lineare e riportatelo sul grafico. Adattate alla serie un trend quadratico e riportatelo sul grafico. Adattate alla serie un trend esponenziale e riportatelo sul grafico. Quale fra i modelli applicati vi sembra il più appropriato a rappresentare l’andamento dei dati? (f) Usando il modello che ritenete più appropriato, prevedete il valore dei depositi della banca per il 1998. 11.15 Nella seguente tabella sono riportate le entrate a prezzi correnti della società Coca-Cola nei 24 anni compresi fra il 1975 e il 1998. Entrate a prezzi costanti della società Coca-Cola. Periodo 1975-1998 ANNO ENTRATE ANNO ENTRATE ANNO ENTRATE 1975 1976 1977 1978 1979 1980 1981 1982 2.9 3.1 3.6 4.3 4.5 5.3 5.5 5.9 1983 1984 1985 1986 1987 1988 1989 1990 6.6 7.2 7.9 7.0 7.7 8.3 9.0 10.2 1991 1992 1993 1994 1995 1996 1997 1998 11.6 13.0 14.0 16.2 18.0 18.5 18.9 18.8 Fonte: Moody’s Handbook of Common Stocks, 1980, 1989, 1993, 1997. Reprinted by permission of Financial Information Services, a division of Financial Communications Company, Inc. and Standard and Poor’s Corp., New York: McGraw-Hill, Inc., April, 1999. (a) (b) (c) (d) (e) (f ) (g) (h) 82 CAPITOLO 11 ANALISI Rappresentate i dati in un opportuno grafico. Adattate alla serie un trend quadratico e riportatelo sul grafico. Quali sono le vostre previsioni per il 1999 e il 2000? Costruite la serie delle entrate a prezzi costanti dividendo ciascun valore della tabella per il corrispondente valore dell’indice dei prezzi al consumo (Esercizio 11.11) e moltiplicando il risultato per 100. Rappresentate in un grafico la nuova serie. Adattate alla serie delle entrate a prezzi costanti un trend lineare e riportatelo sul grafico. Adattate alla serie un trend quadratico e riportatelo sul grafico. Adattate alla serie un trend esponenziale e riportatelo sul grafico. DELLE SERIE STORICHE levine11_57-116 3-04-2002 DATASET DJIA 8:27 Pagina 83 (i) Usando il modello che ritenete più appropriato, prevedete il valore delle entrate a prezzi costanti per gli anni 1999-2000. (j) Confrontate tale previsione con quella ottenuta nel punto (c). (k) Cosa potete concludere circa l’andamento delle due serie analizzate? 11.16 I dati della seguente tabella rappresentano i valori di chiusura dell’indice Dow Jones Industrial Average (DJIA) nei 20 anni compresi fra il 1979 e il 1998. Valori di chiusura dell’indice DJIA (Dow Jones Industrial Average). Periodo 1979-1998 ANNO 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 DJIA ANNO DJIA 0838.7 0,0964.0 0,0875.0 1046.5 1258.6 1211.6 1546.7 01896.0 1938.8 2168.6 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 2753.2 2633.7 3168.8 3301.1 3754.1 3834.4 5117.1 6448.3 7908.3 9181.4 Fonte: Yahoo.com, June 16, 1999. Reprinted by permission of TIBCO Software. (a) (b) (c) (d) (e) DATASET TSMODEL1 Rappresentate i dati in un opportuno grafico. Adattate alla serie un trend lineare e riportatelo sul grafico. Adattate alla serie un trend quadratico e riportatelo sul grafico. Adattate alla serie un trend esponenziale e riportatelo sul grafico. Quale fra i modelli applicati vi sembra il più appropriato a rappresentare l’andamento dei dati? (f) Usando il modello che ritenete più appropriato, prevedete il valore dell’indice per il 1999. 11.17 Applicando a ciascuna delle serie riportate nella tabella il metodo di scelta del modello basato sulle differenze prime, seconde e percentuali, Serie storica I Serie storica II Serie storica III (a) (b) (c) 11.18 Per 1988 1989 1990 1991 ANNO 1992 1993 1994 1995 1996 1997 10.0 30.0 60.0 15.1 33.1 67.9 24.0 36.4 76.1 36.7 39.9 84.0 53.8 43.9 92.2 100.0 53.2 108.0 129.2 58.2 115.8 162.4 64.5 124.1 199.0 70.7 132.0 74.8 48.2 100.0 Determinate il modello più appropriato a rappresentare l’andamento dei dati Calcolate i coefficienti della corrispondente equazione. Prevedete il valore della serie per l’anno 2000. ciascuna delle tre serie riportate nella tabella, 1988 1989 1990 1991 ANNO 1992 1993 1994 1995 1996 1997 Serie storica I 100.0 Serie storica II 100.0 115.2 115.2 130.1 131.7 144.9 150.8 160.0 174.1 189.8 230.8 204.9 266.1 219.8 305.5 235.0 351.8 175.0 200.0 (a) Rappresentate in due differenti grafici la serie dei dati e il suo logaritmo e confrontate, sulla base del risultato grafico, la bontà dei modelli lineare ed esponenziale. IL METODO DEI MINIMI QUADRATI E LA PREVISIONE 83 levine11_57-116 3-04-2002 8:27 DATASET GROSSREV Pagina 84 (b) Determinate l’equazione del trend che avete scelto per rappresentare i dati. (c) Prevedete il valore della serie per l’anno 2000. 11.19 Nella seguente tabella sono rappresentati i dati relativi alle entrate lorde (a prezzi costanti del 1995) di una società, nel periodo compreso fra il 1984 e il 1987. Entrate annuali lorde a prezzi costanti ANNO ENTRATE ANNO ENTRATE 1984 1985 1986 1987 1988 1989 1990 13.0 14.1 15.7 17.0 18.4 20.9 23.5 1991 1992 1993 1994 1995 1996 1997 26.2 29.0 32.8 36.5 41.0 45.4 50.8 (a) Scegliete il modello che secondo voi rappresenta le osservazioni in modo ottimale, basandovi sul metodo delle differenze prime, seconde e percentuali. (b) Fornite l’equazione del trend corrispondente. (c) Prevedete il valore del trend per l’anno 2000. ◆ 11.5 MODELLI AUTOREGRESSIVI PER LA DETERMINAZIONE DEL TREND E PER LA PREVISIONE 1 Occorre osservare che il livellamento esponenziale (paragrafo 11.3) e i modelli autoregressivi sono dei casi particolari dei modelli ARIMA (modelli autoregressivi integrati a media mobile) sviluppati da Box and Jenkins (op. cit. 3). I modelli autoregressivi1 rappresentano uno strumento molto utile per affrontare il problema della previsione in relazione a una serie storica annuale. Spesso si osserva una forte correlazione fra valori consecutivi di una serie; si parla in questo caso di autocorrelazione, del primo ordine quando si considerano valori adiacenti, del secondo ordine se ci si riferisce alla relazione che intercorre tra i valori della serie a distanza di due periodi e, in generale, del p-esimo ordine se i valori considerati “distano” fra loro p periodi. I modelli autoregressivi consentono appunto di sfruttare questi legami di dipendenza per ottenere utili previsioni del comportamento futuro della serie. Nelle equazioni (11.9), (11.10) e (11.11) sono rappresentati tre importanti modelli autoregressivi: Modello autoregressivo del primo ordine Yi A0 A1Yi1 i (11.9) Modello autoregressivo del secondo ordine Yi A0 A1Yi1 A2Yi2 i (11.10) Modello autoregressivo del p-esimo ordine Yi A0 A1Yi1 A2Yi2 ApYip i dove Yi valore osservato della serie al tempo i 84 CAPITOLO 11 ANALISI DELLE SERIE STORICHE (11.11) levine11_57-116 3-04-2002 8:27 Pagina 85 Yi1 valore osservato della serie al tempo i 1 Yi2 valore osservato della serie al tempo i 2 Yip valore osservato della serie al tempo i p A0 costante da stimare con il metodo dei minimi quadrati A1, A2, . . . , Ap parametri autoregressivi da stimare con il metodo dei minimi quadrati i componente di errore non autocorrelata, di media nulla e con varianza costante Osserviamo che la forma del modello autoregressivo del primo ordine (equazione 11.9) è del tutto simile a quella del modello di regressione lineare semplice (equazione 9.1), così come il modello auto regressivo del p-esimo ordine (equazione 11.11) può essere visto come un modello di regressione multipla (equazione 10.1). In questo contesto i parametri sono stati chiamati A0, A1, …., Ap e le relative stime saranno indicate con le corrispondenti lettere minuscole a0, a1, …, ap. Scegliere fra modelli autoregressivi di diverso ordine significa stabilire l’ampiezza delle relazioni fra osservazioni ritardate con cui si intende lavorare. Il modello autoregressivo del primo ordine coinvolge solo le relazioni fra variabili consecutive della serie storica, nel modello autoregressivo del secondo ordine oltre alle relazioni fra osservazioni consecutive si tiene conto anche dei legami fra osservazioni ritardate di due periodi, e così via fino al modello autoregressivo del p-esimo ordine che coinvolge tutte le relazioni fra variabili che distano 1, 2,.., p periodi. La scelta non è quindi facile; esiste inoltre un trade-off fra la semplicità dei modelli di ordine più basso e l’eventuale maggior capacità esplicativa di quelli di ordine superiore. Occorre inoltre tenere conto della lunghezza della serie (n) rispetto alla quale p, l’ordine del modello, non deve essere eccessivamente elevato. Con l’aiuto dei seguenti esempi sarà infatti chiaro che nella stima di Ap, il coefficiente della p-esima variabile autoregressiva, il numero di osservazioni che entrano in gioco è n – p. Esempio 11.5 Schema dei confronti in un modello autoregressivo del primo ordine Data la seguente serie composta da n = 7 valori annuali consecutivi: Serie 1 2 3 ANNO 4 5 6 7 31 34 37 35 36 43 40 Mostrate i confronti fra osservazioni che entrano in gioco in un modello autoregressivo del primo ordine. S OLUZIONE ANNO, i 1 2 3 4 5 6 7 MODELLI MODELLO AUTOREGRESSIVO (Yi RISPETTO A Yi1) DEL SECONDO ORDINE 31 34 37 35 36 43 40 ↔ ↔ ↔ ↔ ↔ ↔ ↔ … 31 34 37 35 36 43 AUTOREGRESSIVI PER LA DETERMINAZIONE DEL TREND E PER LA PREVISIONE 85 levine11_57-116 3-04-2002 8:27 Pagina 86 Poiché Y1 = 31 è il primo valore della serie, si osserva che nell’analisi della regressione si perde uno dei confronti. Quindi in questo caso (n = 7) il modello autoregressivo del primo ordine viene a basarsi su n – 1 = 6 coppie di osservazioni. Esempio 11.6 Schema dei confronti in un modello autoregressivo del secondo ordine Data la seguente serie composta da n = 7 valori annuali consecutivi: Serie 1 2 3 ANNO 4 5 6 7 31 34 37 35 36 43 40 Mostrate i confronti fra osservazioni che entrano in gioco in un modello autoregressivo del secondo ordine. S OLUZIONE ANNO, MODELLO AUTOREGRESSIVO DEL SECONDO ORDINE i (Yi RISPETTO Yi1 E Yi RISPETTO Yi2) 1 2 3 4 5 6 7 31 34 37 35 36 43 40 ↔ ↔ ↔ ↔ ↔ ↔ ↔ … e 31 31 e 34 34 e 37 37 e 35 35 e 36 36 e 43 43 e 40 ↔ ↔ ↔ ↔ ↔ ↔ ↔ … … 31 34 37 35 36 Poiché Y1 = 31 è il primo valore della serie, si osserva che nell’analisi della regressione si perdono due dei confronti. Quindi in questo caso (n = 7) il modello autoregressivo del secondo ordine viene a basarsi su n – 2 = 5 coppie di osservazioni. Una volta scelto il modello e applicato il metodo dei minimi quadrati per stimare i parametri, occorre definire criteri che consentano di valutare la capacità di adattamento del modello scelto. Una possibilità consiste nello stimare un modello con un numero abbastanza elevato di parametri, per poi stabilire se sia il caso di eliminarne alcuni. Si tratta in pratica di risolvere un problema di verifica di ipotesi sulla significatività dei parametri che via via si vengono a trovare in corrispondenza dell’ultimo ordine del modello. In un modello autoregressivo di ordine p faremo quindi le seguenti ipotesi sul parametro Ap (parametro autoregressivo di ordine massimo): H0: Ap 0 (il parametro di massimo ordine è uguale a zero) H1: Ap 0 (il parametro di massimo ordine è diverso da zero) Il test statistico per la verifica delle due ipotesi è dato dall’equazione (11.2) Test t per la significatività del parametro autoregressivo di ordine massimo t 86 CAPITOLO 11 ANALISI DELLE SERIE STORICHE ap Ap Sap (11.12) levine11_57-116 3-04-2002 8:27 Pagina 87 dove ap stima del parametro autoregressivo di ordine massimo Ap Sap deviazione standard di ap 2 Per ottenere i gradi di libertà dobbiamo sottrarre a n il numero di parametri del modello (p parametri di inclinazione + 1 intercetta) e il numero di confronti fra le osservazioni che vengono “persi” (p nel nostro caso). Si può dimostrare che questo test segue una distribuzione t di Student con n 2p 1 gradi di libertà2. Quindi, fissato il livello di significatività , l’ipotesi nulla deve essere rifiutata se il valore osservato della statistica test è maggiore in modulo del valore critico tn2p1 della distribuzione t di Student corrispondente. Si arriva quindi alla seguente regola decisionale: Rifiutare H0 se t tn2p1 oppure t tn2p1; accettare H0 altrimenti Nella Figura 11.12 sono riportate le regioni di rifiuto e di accettazione del test descritto. Se il valore osservato della statistica test ci porta a non rifiutare l’ipotesi nulla Ap = 0, dobbiamo concludere che il modello analizzato contiene un numero eccessivamente elevato di parametri. La componente autoregressiva di ordine massimo viene quindi scartata e, una volta determinato il nuovo modello, il procedimento deve essere ripetuto sul parametro Ap – 1, che rappresenta il nuovo parametro autoregressivo di massimo ordine. La procedura continua fino a quando l’ipotesi nulla non viene rifiutata. Quando ciò accade, l’analista può essere sicuro della significatività dell’ultimo parametro autoregressivo e può quindi utilizzare il modello selezionato a scopi previsivi. Una volta individuato il numero ottimo di componenti autoregressive con il metodo sopra descritto, è possibile procedere alla stima dei parametri. Il modello autoregressivo del p-esimo ordine stimato Ŷi a0 a1Yi1 a2Yi2 apYip (11.13) dove Ŷi Yi1 Yi2 Yip a0, a1, a2, . . . , ap valore stimato della serie al tempo i valore osservato della serie al tempo i 1 valore osservato della serie al tempo i 2 valore osservato della serie al tempo i p parametri stimati FIGURA 11.12 Regioni di rifiuto e di accettazione di un test di significatività a due code sul parametro autoregressivo di ordine massimo Ap. tn2p1 Regione di rifiuto Valore critico MODELLI 0 Regione di accettazione Ap 0 tn2p1 t Regione di rifiuto Valore critico AUTOREGRESSIVI PER LA DETERMINAZIONE DEL TREND E PER LA PREVISIONE 87 levine11_57-116 3-04-2002 8:28 Pagina 88 Supponiamo ora di trovarci nell’istante n: in che modo il modello può essere utilizzato per effettuare delle stime a j istanti futuri? Utilizzo del modello autoregressivo a scopi previsivi Ŷnj a0 a1Ŷnj1 a2Ŷnj2 apŶnjp (11.14) dove a0, a1, a2, . . . , ap parametri stimati j numero di anni nel futuro Ŷnjp previsione effettuata all’istante n per l’istante Ynjp se j p 0 Ŷnjp valore osservato di Ynjp se j p 0 Osserviamo che, quando applichiamo a scopi previsivi un modello autoregressivo del pesimo ordine, il numero di osservazioni che entrano in gioco della previsione è sempre pari a p, a prescindere dalla distanza j nel futuro del valore che vogliamo prevedere. Quindi se p = 3, una previsione a j periodi successivi all’istante n si baserà unicamente sui valori osservati negli anni n, n – 1, n – 2. Applicando l’equazione (11.14) otteniamo la seguente previsione a un anno: Ŷn1 a0 a1Yn a2Yn1 a3Yn2 La previsione a un anno entra in gioco nella determinazione della previsione a due anni: Ŷn2 a0 a1Ŷn1 a2Yn a3Yn1 Procedendo iterativamente si ottengono le previsioni agli anni successivi: Ŷn3 a0 a1Ŷn2 a2Ŷn1 a3Yn Ŷn4 a0 a1Ŷn3 a2Ŷn2 a3Ŷn1 E così via. Nel Riquadro 11.2 sono sintetizzati i principali passaggi richiesti per l’applicazione del modello autoregressivo: Riquadro 11.2 Analisi di una serie storica annuale attraverso i modelli autoregressivi 88 CAPITOLO 11 ✓ ✓ 1. Scegliete l’ordine p del modello iniziale. ✓ 3. Stimate un modello di regressione multipla con i predittori rappresentati dalle variabili Y ritardate. ✓ 4. Effettuate un test per la significatività del parametro autoregressivo di ordine massimo Ap. (a) Se il test porta a rifiutare l’ipotesi nulla, il modello con p predittori deve essere scelto per rappresentare la serie e per effettuare previsioni (equazioni 11.3 e 11.4). 2. Rappresentate in un foglio di lavoro Microsoft Excel le variabili Yn – 1, Yn – 2, …,Yn – p (predittori) ritardate rispettivamente di 1, 2, …,p periodi (Tabella 11.8). ANALISI DELLE SERIE STORICHE levine11_57-116 3-04-2002 8:28 Pagina 89 (b) Se il test porta ad accettare l’ipotesi nulla, l’ultimo predittore deve essere scartato. Considerate ora il modello con un regressore in meno. Verificate la significatività del parametro autoregressivo di ordine massimo del nuovo modello. La procedura continua fino ad individuare un modello il cui parametro autoregressivo di ordine massimo risulta significativo. ✓ 5. Il modello così selezionato può essere utilizzato per interpolare le osservazioni (equazione 11.3) e per prevedere valori futuri della serie (equazione 11.4). Riprendiamo l’esempio relativo alle entrate lorde a prezzi costanti 1982-84 della società Eastman Kodak per il periodo compreso fra il 1975 e il 1998 (Tabella 11.6). Nella Tabella 11.8 sono riportati, insieme alle osservazioni, i predittori per modelli autoregressivi fino al terzo ordine. Notiamo che nelle variabili ritardate a 1, 2 e 3 periodi vengono persi rispettivamente 1, 2 e 3 valori rispetto alle 24 osservazioni della serie originaria. Esempio 11.7 Scelta del modello autoregressivo appropriato Scegliete il modello autoregressivo più appropriato fra quelli di ordine compreso tra 1 e 3 per interpolare la serie delle entrate lorde della società Eastman Kodak. S OLUZIONE La Tabella 11.8 serve come punto di partenza per la determinazione di un modello autoregressivo del terzo ordine. Il modello stimato, ottenuto con l’ausilio di Microsoft Excel, è: Ŷi 2.7673 1.285Yi1 .5957Yi2 0.0634Yi3 Tabella 11.8 Predittori di modelli autoregressivi del primo, secondo e terzo ordine sulla serie delle entrate lorde della società Eastman Kodak (1975-1998) MODELLI AUTOREGRESSIVI PER LA DETERMINAZIONE DEL TREND E PER LA PREVISIONE 89 levine11_57-116 3-04-2002 8:28 Pagina 90 dove l’origine è rappresentata dal 1978 e l’unità è l’anno. A questo punto conviene applicare il test per la verifica della significatività di A3, il parametro autoregressivo di ordine massimo. Sulla base del modello autoregressivo di ordine 3, il valore della stima di A3 è pari a a3 = 0.0634, con un errore standard Sa3 0.2509. Si vuole quindi verificare l’ipotesi nulla H0: A3 0 contro l’alternativa H1: A3 0 Applicando l’equazione (11.12) otteniamo il valore osservato della statistica test: t a3 0.0634 0.253 Sa3 0.25089 Con = 0.05, il valore critico della distribuzione t di Student con n – 2p –1 =17 gradi di libertà è pari a t17 = 2.1098. Poiché |t|= 0.253 < t17 = 2.1098 (e anche p-value = 0.803 > = 0.05) l’ipotesi nulla, secondo cui il parametro A3 sarebbe uguale a zero, non può essere rifiutata. La componente autoregressiva di terzo ordine deve essere eliminata. A questo punto determiniamo un nuovo modello autoregressivo di ordine 2, ottenendo i seguenti risultati: Ŷi 2.900 1.256Yi1 0.516Yi2 dove l’origine è rappresentata dal 1977 e l’unità è sempre l’anno. Dobbiamo ora verificare che il parametro autoregressivo di secondo ordine sia significativo. Si vuole quindi verificare l’ipotesi nulla H0: A2 0 contro l’alternativa H1: A2 0 Applicando ancora una volta l’equazione (11.12) otteniamo il valore osservato della statistica test: t 0.516 a2 2.51 Sa2 0.206 RIQUADRO A Output Excel del modello autoregressivo del terzo ordine implementato sulle entrate lorde della Eastman Kodak. 90 CAPITOLO 11 ANALISI DELLE SERIE STORICHE levine11_57-116 3-04-2002 8:28 Pagina 91 RIQUADRO B Output Excel del modello autoregressivo del secondo ordine implementato sulle entrate lorde della Eastman Kodak. Con 0.05, il valore critico della distribuzione t di Student con n – 2p – 1 19 gradi di libertà è pari a t19 2.093. Poiché |t| 2.51 > t19 2.093 (e anche: p-value 0.021 < 0.05) l’ipotesi nulla, secondo cui il parametro A2 sarebbe uguale a zero, deve essere rifiutata. La componente autoregressiva di secondo ordine deve essere considerata significativa e non può essere eliminata dal modello. Siamo quindi giunti alla conclusione che il modello autoregressivo di secondo ordine è il più appropriato per rappresentare le osservazioni. Avendo scelto il modello autoregressivo del secondo ordine, qualsiasi previsione per il futuro si baserà esclusivamente sui tre parametri stimati a0 2.90, a1 1.256 e a2 – 0.516 e sugli ultimi due valori osservati della serie (Y23 9,034 e Y24 8.22). In particolare le previsioni per gli anni 1999 e 2000 si ottengono nel modo seguente: Ŷnj 2.900 1.256Ŷnj1 0.516Ŷnj2 1999: 1 anno prima Ŷ25 2.900 1.256(8.22) 0.516(9.034) 8.56 milioni di dollari 2000: 2 anni prima Ŷ26 2.900 1.256(8.56) 0.516(8.22) 9.41 milioni di dollari Nella Figura 11.13 sono riportati i valori della serie delle entrate lorde della Eastman Kodak insieme con i valori previsti sulla base del modello autoregressivo del secondo ordine. Esercizi del Paragrafo 11.5 • 11.20 Considerate una serie storica di 40 osservazioni e supponete di voler stimare un modello autoregressivo del quinto ordine sui valori della serie. (a) Quanti valori vengono persi nello sviluppo del modello? (b) Quanti parametri devono essere stimati? (c) Quali dei valori originari entrano in gioco nelle previsioni? (d) Esprimete analiticamente il modello. (e) Rappresentate in un’equazione la previsione a j periodi futuri. 11.21 Considerate una serie storica di 17 osservazioni. Supponete di aver stimato un modello autoregressivo del terzo ordine, ottenendo le seguenti stime dei parametri, con i corrispondenti errori standard: a0 4.50 a1 1.80 a2 0.80 a3 0.24 Sa 0.50 Sa 0.30 Sa 0.10 1 2 3 (a) Adottando un livello di significatività = 0.05, valutate la bontà del modello. MODELLI AUTOREGRESSIVI PER LA DETERMINAZIONE DEL TREND E PER LA PREVISIONE 91 levine11_57-116 3-04-2002 8:28 Pagina 92 FIGURA 11.13 Modello autoregressivo del secondo ordine sulla serie delle entrate lorde della Eastman Kodak. (b) Supponendo che le tre osservazioni più recenti siano: Y15 23 Y16 28 Y17 34 Prevedete il valore della serie per i periodi 18 e 19. (b) Supponendo che le tre osservazioni più recenti siano: Sa1 0.45 Sa2 0.35 Sa3 0.15 Come cambierebbero le vostre considerazioni sul modello? 11.22 Fate riferimento ai dati dell’Esercizio 11.14 (depositi totali della J.P. Morgan nei 19 anni compresi fra il 1979 e il 1997). (a) Stimate un modello autoregressivo del terzo ordine, verificando al livello 0.05 la significatività del parametro di ordine maggiore. (b) Stimate un modello autoregressivo del secondo ordine, verificando al livello 0.05 la significatività del parametro di ordine maggiore. (c) Stimate un modello autoregressivo del primo ordine, verificando al livello 0.05 la significatività del parametro di ordine maggiore. (d) Scelto il modello che considerate più appropriato, prevedete il valore della serie per gli anni compresi tra il 1998 e il 2001. 11.23 Fate riferimento ai dati dell’Esercizio 11.15 (entrate a prezzi correnti della società CocaCola nei 24 anni compresi fra il 1975 e il 1998). (a) Stimate un modello autoregressivo del terzo ordine, verificando al livello 0.05 la significatività del parametro di ordine maggiore. (b) Se necessario, stimate un modello autoregressivo del secondo ordine, verificando al livello 0.05 la significatività del parametro di ordine maggiore. (c) Se necessario, stimate un modello autoregressivo del primo ordine, verificando al livello 0.05 la significatività del parametro di ordine maggiore. (d) Scelto il modello che considerate più appropriato, prevedete il valore della serie per gli anni 1999 e 2000. 11.24 Fate riferimento ai dati dell’Esercizio 11.16 (valori di chiusura dell’indice Dow Jones Industrial Average (DJIA) nei 20 anni compresi fra il 1979 e il 1998). (a) Stimate un modello autoregressivo del terzo ordine, verificando al livello 0.05 la significatività del parametro di ordine maggiore. (b) Se necessario, stimate un modello autoregressivo del secondo ordine, verificando al livello 0.05 la significatività del parametro di ordine maggiore. (c) Se necessario, stimate un modello autoregressivo del primo ordine, verificando al livello 0.05 la significatività del parametro di ordine maggiore. 92 CAPITOLO 11 ANALISI DELLE SERIE STORICHE levine11_57-116 3-04-2002 8:28 Pagina 93 (d) Scelto il modello che considerate più appropriato, prevedete il valore della serie per gli anni compresi tra il 1999 e 2001. ◆ 11.6 SCELTA DEL MODELLO DI PREVISIONE Nei paragrafi 11.4 e 11.5 sono stati presentati sei metodi alternativi per effettuare previsioni su una serie storica: il modello basato sul trend lineare, il modello quadratico, il modello esponenziale (paragrafo 11.4) e i modelli autoregressivi del primo, secondo e terzo ordine (paragrafo 11.5). A questo punto viene spontaneo domandarsi se esista effettivamente un modello ottimo fra quelli di cui disponiamo per effettuare previsioni su una serie storica. Vediamo ora alcuni strumenti estremamente utili per la scelta del modello. Riquadro 11.3 Linee guida per la scelta di un modello per l’analisi di una serie storica e la previsione del suo comportamento futuro ✓ ✓ 1. Analisi dei residui. ✓ 3. Misura della grandezza dell’errore residuo attraverso il metodo delle differenze in valore assoluto. ✓ 4. Applicazione del principio di parsimonia. 2. Misura della grandezza dell’errore residuo attraverso il metodo delle differenze al quadrato. Vediamo ora nei dettagli questi strumenti di valutazione del modello e di scelta fra modelli alternativi. Analisi dei residui Analogamente a quanto visto per l’analisi della regressione (paragrafi 9.5 e 10.2), i residui del modello si ottengono come differenza fra i valori osservati e i valori ottenuti con il modello stesso (“interpolati”): (Yi Ŷi) ei . Dal grafico dei residui (Figura 11.14) è possibile valutare la capacità del modello di cogliere le diverse componenti della serie storica. Quando il modello interpola adeguatamente le osservazioni, i residui assumono il tipico andamento casuale esemplificato nel riquadro A della figura; nei riquadri da B a D sono invece riportati residui che seguono andamenti sistematici, segnalando l’inadeguatezza dei rispettivi modelli a cogliere le componenti di trend (riquadro B), ciclica (riquadro C) o stagionale (riquadro D) della serie. Misura della grandezza dell’errore residuo attraverso il metodo delle differenze al quadrato e delle differenze in valore assoluto Supponiamo di dover scegliere fra due modelli che, dal punto di vista dell’andamento dei residui, sembrano spiegare altrettanto bene la nostra serie storica. In questo caso abbiamo bisogno di un altro metodo che ci aiuti nella scelta del modello. Gli analisti hanno proposto diverse misure di sintesi per la valutazione dell’errore residuo del modello (op. cit. 1, 2, 10, 11) alcune delle quali sono state già presentate con riferimento all’analisi della regressione. Ci riferiamo in particolare al metodo, basato sul principio dei minimi quadrati, dell’errore standard della stima SYX (paragrafo 9.3, equazione 9.8), il quale può essere calcolato SCELTA DEL MODELLO DI PREVISIONE 93 8:28 Pagina 94 ei Yi Yi 3-04-2002 ei Yi Yi levine11_57-116 0 0 1 2 3 4 5 6 7 8 9 10 Residui con andamento sistematico (B) Modello incapace di cogliere il trend ei Yi Yi ei Yi Yi 0 1 2 3 4 5 6 7 8 9 10 Residui con andamento casuale (A) Modello adeguato 0 0 1 2 3 4 5 6 7 8 9 10 Residui con andamento sistematico (C) Modello incapace di cogliere la componente ciclica FIGURA 11.14 0 0 0 1 2 3 4 5 6 7 8 9 10 Residui con andamento sistematico (D) Modello incapace di cogliere la componente stagionale (dati mensili) Analisi dei residui per valutare i modelli. come somma delle differenze al quadrato fra i valori osservati e quelli interpolati utilizzando il modello. Naturalmente se il modello interpola perfettamente le osservazioni, il valore di questo indicatore sarà zero; il valore dell’indice tende ad aumentare considerando modelli sempre meno adatti alla rappresentazione della serie. Alcuni autori reputano questo indice inadeguato in quanto, basandosi sugli scostamenti quadratici, porta a una eccessiva penalizzazione di modelli in cui si abbiano singoli errori di previsione particolarmente elevati. Viene quindi reputato più affidabile un indice che coinvolge le differenze in valore assoluto fra valori osservati e valori previsti, il MAD (deviazione media assoluta): Deviazione media assoluta Y Ŷ n i MAD i i1 n (11.15) Il MAD rappresenta quindi una misura della bontà del modello. A valori più bassi dell’indice corrispondono modelli che interpolano meglio le osservazioni. Abbiamo così a disposizione un altro criterio che ci consente di vagliare modelli alternativi per la stessa serie storica: sceglieremo il modello con MAD minimo. Il principio di parsimonia Quando diversi modelli sembrano essere equivalenti sulla base dei criteri descritti in precedenza, nella scelta dobbiamo tenere presente un’ultima considerazione intuitiva: a parità di performance, deve essere preferito il modello più semplice (principio di parsimonia). Fra i modelli descritti, i più parsimoniosi sono naturalmente quelli basati sul trend lineare e quadratico, seguiti dal modello autoregressivo di ordine 1. Fra i modelli più complessi invece vanno menzionati i modelli autoregressivi di ordine superiore al primo e il modello esponenziale. Confronto fra quattro metodi di previsione Riprendiamo l’esempio relativo alle entrate della società Eastman Kodak nel periodo di 24 anni compreso fra il 1975 e il 1998. Con riferimento a questa serie siamo interessati a con94 CAPITOLO 11 ANALISI DELLE SERIE STORICHE levine11_57-116 3-04-2002 8:28 Pagina 95 frontare i modelli lineare, quadratico, esponenziale e autoregressivo del secondo ordine (il modello autoregressivo del terzo ordine è già stato scartato con l’analisi della significatività del parametro di ordine 3 – Esempio 11.7). Nella Figura 11.15 sono stati riportati i residui dei quattro modelli concorrenti. Osserviamo innanzitutto che i tre modelli basati sul metodo dei minimi quadrati hanno residui che seguono un andamento strutturato ciclicamente (riquadri A, B e C): i tre modelli non sono in grado di cogliere la componente ciclica della serie. Di questi tre modelli il migliore sembra comunque essere quello quadratico che, almeno nei primi anni dell’analisi, sembra fluttuare in modo più casuale intorno all’origine. Nessuno dei tre modelli si rivela in ogni caso adeguato a rappresentare le grosse fluttuazioni cicliche che la serie ha fatto registrare in anni più recenti (la ciclicità nei residui diventa più marcata negli ultimi anni in tutti e tre i casi). I residui del modello autoregressivo del secondo ordine hanno un andamento completamente diverso rispetto a quelli dei modelli precedenti (riquadro D) manifestando il minor ammontare di componente strutturata. Questo primo criterio ci porta quindi ad individuare nel modello autoregressivo il modello più adatto a rappresentare la serie, mentre i due modelli peggiori sembrano essere quelli basati sul trend lineare ed esponenziale. Per avere una conferma di questa intuizione iniziale, è utile in ogni caso riferirsi agli indicatori sintetici presentati in precedenza: l’errore standard della stima (SXY) e la deviazione media assoluta (MAD), in grado di misurare la grandezza complessiva dell’errore residuo. I conti sono stati realizzati con Excel (Tabella 11.9) e ci portano alle stesse conclusioni cui eravamo giunti con la semplice analisi qualitativa dei residui: secondo entrambi gli indici il modello migliore è quello autoregressivo, seguito dal modello quadratico, lineare ed esponenziale. Una volta scelto il modello (riferimento bibliografico 4 per una modellistica più completa sulle serie storiche) è molto importante valutare la sua capacità previsiva ex post. Via RIQUADRO A Modello lineare. RIQUADRO B RIQUADRO C Modello esponenziale. RIQUADRO D Modello autoregressivo del secondo ordine. FIGURA 11.15 Modello quadratico. Grafici dei residui di quattro modelli per la rappresentazione di una serie storica. SCELTA DEL MODELLO DI PREVISIONE 95 levine11_57-116 3-04-2002 8:28 Pagina 96 Tabella 11.9 Confronto fra quattro metodi di previsione utilizzando gli indici SXY e MAD via che nuovi valori si rendono disponibili questi vanno confrontati con quelli che erano stati previsti dal modello. Se le differenze sono eccessive, il modello deve essere adeguato opportunamente, ricorrendo a delle procedure di controllo adattivo (riferimento bibliografico 2). Esercizi del paragrafo 11.6 • 11.25 Supponete di avere stimato il trend con un modello lineare su una serie di 12 osservazioni e di aver ottenuto i seguenti residui: 2.0 0.5 1.5 1.0 0.0 1.0 3.0 1.5 4.5 2.0 0.0 1.0 DATASET FEDSPEND (a) Calcolate l’indice SXY e interpretate i risultati. (b) Calcolate l’indice MAD e interpretate i risultati. • 11.26 Con riferimento ai dati dell’Esercizio 11.25, supponete che il primo e l’ultimo residuo siano in realtà 12.0 (anziché 2.0) e –11.0 (anziché –1.0). (a) Calcolate l’indice SXY e interpretate i risultati. (b) Calcolate l’indice MAD e interpretate i risultati. 11.27 I seguenti dati rappresentano le spese federali pro capite effettuate in tre stati americani (Alabama, Arizona, Louisiana) nei 15 anni compresi fra il 1981 e il 1995. Real federal spending per capita (in constant 1995 dollars), 1981-1995 FISCAL YEAR 1981 1982 1983 1984 96 CAPITOLO 11 ANALISI REAL FEDERAL SPENDING PER CAPITA (IN CONSTANT 1995 DOLLARS) ALABAMA ARIZONA LOUISIANA 4091 4046 4212 4284 DELLE SERIE STORICHE 3996 4036 4084 4242 4142 3599 3582 3552 levine11_57-116 3-04-2002 8:28 Pagina 97 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 4497 4620 4719 4629 4664 5139 5277 5559 5599 5631 5534 4289 4654 4784 4367 4439 4590 4526 4520 4765 4633 4686 3864 3895 3636 3783 4136 4268 4537 4975 5261 5442 5353 Fonte: D.P. Moynihan, M.E. Friar, H.B. Leonard, and J.H. Walder, The Federal Budget and the States: Fiscal Year 1995, jointly published by the John F. Kennedy School of Government, Harvard University, and the Office of Senator Daniel Patrick Moynihan, September 30, 1996, 43, 45, 60. Per (a) (b) (c) (d) (e) (f) (g) ◆ 11.7 ciascuna delle tre serie: Rappresentate i dati in un grafico. Determinate l’equazione del trend lineare. Prevedete il valore del trend per gli anni 1996 –1999. Effettuate un’analisi dei residui. Calcolate l’errore standard della stima (SYX). Calcolate il MAD. Sulla base dei risultati ottenuti ai punti (d), (e) e (f), siete soddisfatti della previsione fatta al punto (c)? Commentate. 11.28 Sulla base dei risultati ottenuti negli Esercizi 11.14 e 11.22 riguardo ai depositi della J.P. Morgan: (a) Effettuate un’analisi dei residui per ciascun modello considerato. (b) Calcolate l’errore standard della stima (SXY) per ciascun modello considerato. (c) Calcolate il MAD per ciascun modello considerato. (d) Sulla base dei risultati ottenuti ai punti (a), (b) e (c) e ricordando anche il criterio della parsimonia, quale fra i modelli analizzati vi sembra il più idoneo a prevedere i valori futuri della serie? Commentate. 11.29 Sulla base dei risultati ottenuti negli Esercizi 11.15 e 11.23 riguardo alle entrate annuali della società Coca Cola: (a) Effettuate un’analisi dei residui per ciascun modello considerato. (b) Calcolate l’errore standard della stima (SXY) per ciascun modello considerato. (c) Calcolate il MAD per ciascun modello considerato. (d) Sulla base dei risultati ottenuti ai punti (a), (b) e (c) e ricordando anche il criterio della parsimonia, quale fra i modelli analizzati vi sembra il più idoneo a prevedere i valori futuri della serie? Commentate. 11.30 Sulla base dei risultati ottenuti negli Esercizi 11.16 e 11.24 riguardo ai valori di chiusura dell’indice Dow Jones Industrial Average: (a) Effettuate un’analisi dei residui per ciascun modello considerato. (b) Calcolate l’errore standard della stima (SXY) per ciascun modello considerato. (c) Calcolate il MAD per ciascun modello considerato. (d) Sulla base dei risultati ottenuti ai punti (a), (b) e (c) e ricordando anche il criterio della parsimonia, quale fra i modelli analizzati vi sembra il più idoneo a prevedere i valori futuri della serie? Commentate. ANALISI DI SERIE STORICHE A CADENZA MENSILE O TRIMESTRALE Finora ci siamo concentrati sull’analisi di serie storiche a cadenza annuale. Tuttavia, numerose serie storiche di carattere economico sono registrate con una cadenza trimestrale o ANALISI DI SERIE STORICHE A CADENZA MENSILE O TRIMESTRALE 97 levine11_57-116 3-04-2002 8:28 Pagina 98 mensile, ma anche settimanale, giornaliera o oraria. Si è già accennato (Tabella 11.1) al fatto che, quando i dati sono disponibili ad intervalli infra-annuali, è necessario considerare un’ulteriore componente della serie: la componente stagionale. In questo paragrafo presenteremo un approccio all’analisi di serie storiche mensili o trimestrali, basato sui metodi di regressione discussi nel Capitolo 10. Nella Tabella 11.10 e nella Figura 11.16 sono rappresentate le spese private mensili per abitazioni (a prezzi costanti 1995) in una piccola città americana dal gennaio 1992 fino a dicembre 1997. DATASET PRIRECON Tabella 11.10 Spese private mensili per abitazioni (a prezzi costanti 1995) in una piccola città americana (gennaio 1992-dicembre 1997) MESE 1992 1993 1994 ANNO 1995 1996 1997 Gennaio Febbraio Marzo Aprile Maggio Giugno Luglio Agosto Settembre Ottobre Novembre Dicembre 10.2 9.7 11.3 12.4 13.6 14.5 14.8 15.3 15.0 15.0 14.2 12.4 11.2 11.0 12.7 14.3 16.2 17.7 18.4 18.6 18.1 18.0 16.7 14.2 12.5 12.0 13.9 15.4 17.0 18.2 18.6 18.8 18.4 18.2 17.1 14.5 12.6 12.0 14.2 15.6 17.1 18.3 18.9 19.3 18.7 18.7 17.7 15.0 13.2 12.5 14.4 15.8 17.1 18.1 18.7 18.9 18.1 17.8 16.7 14.0 13.0 12.7 14.8 15.9 17.1 17.7 17.9 18.0 16.8 16.3 14.7 12.2 FIGURA 11.16 Spese private mensili per abitazioni (a prezzi costanti 1995) in una piccola città americana (gennaio 1992-dicembre 1997). Fonte: dati della Tabella 11.10. Per l’analisi di serie storiche mensili come quella descritta, riprendiamo il classico modello moltiplicativo, aggiungendo alle componenti di trend, ciclica e irregolare (equazione 11.4) un nuovo fattore rappresentato dalla componente stagionale. Yi Ti Si Ci Ii 98 CAPITOLO 11 ANALISI DELLE SERIE STORICHE levine11_57-116 3-04-2002 8:28 Pagina 99 Previsione per serie storiche mensili o trimestrali con il metodo dei minimi quadrati Cercheremo ora di introdurre nel modello di regressione la componente stagionale, combinando le tecniche basate sui minimi quadrati presentate nel paragrafo 11.4 con la modellistica per regressori di tipo categorico di cui si è discusso nel paragrafo 10.7. Il trend esponenziale ad esempio può essere adattato ad osservazioni a cadenza mensile nel seguente modo: Il modello esponenziale con dati mensili 1 M2 M3 M4 M5 M6 M7 M8 M9 M10 M11 Ŷi b0bX1 ibM 2 b3 b4 b5 b6 b7 b8 b9 b10 b11 b12 (11.16a) dove b0 (b1 1) 100% Xi b2 b3 b4 b12 M1 M2 M3 M11 intercetta stimata di Y stima del tasso di crescita mensile composto valore assegnato al mese moltiplicatore di gennaio (rif. dicembre) moltiplicatore di febbraio (rif. dicembre) moltiplicatore di marzo (rif. dicembre) ... . moltiplicatore dicembre-novembre 1 se gennaio, 0 altrimenti 1 se febbraio, 0 altrimenti 1 se marzo, 0 altrimenti .. . 1 se novembre, 0 altrimenti Il modello esponenziale con dati trimestrali 1 Q2 Q3 Ŷi b0bX1 ibQ 2 b3 b4 (11.17a) dove b0 (b1 1) 100% Xi b2 b3 b4 Q1 Q2 Q3 ANALISI intercetta stimata di Y stima del tasso di crescita trimestrale composto valore assegnato al trimestre moltiplicatore del primo trimestre (rif. quarto trimestre) moltiplicatore del secondo trimestre (rif. quarto trimestre) moltiplicatore del terzo trimestre (rif. quarto trimestre) 1 se primo trimestre, 0 altrimenti 1 se secondo trimestre, 0 altrimenti 1 se terzo trimestre, 0 altrimenti DI SERIE STORICHE A CADENZA MENSILE O TRIMESTRALE 99 levine11_57-116 3-04-2002 8:28 Pagina 100 Osserviamo che le variabili Mi (i 1, …, 11) e Qi (i = 1, 2, 3) sono delle variabili dummy necessarie per introdurre le componenti mensile e trimestrale. Passando al logaritmo naturale (logaritmo in base e) in entrambi i membri delle equazioni (11.16a) e (11.17a) otteniamo le equazioni (11.16b) e (11.17b). Il modello esponenziale con dati mensili ln Ŷi ln b0 Xi ln b1 M1 ln b2 M2 ln b3 M3 ln b4 M11 ln b12 (11.16b) Il modello esponenziale con dati trimestrali ln Ŷi ln b0 Xi ln b1 Q1 ln b2 Q2 ln b3 Q3 ln b4 (11.17b) Osserviamo che le equazioni (11.16b) e (11.17b) sono in forma lineare. Di conseguenza è possibile applicare il metodo dei minimi quadrati alla variabile log Yi e quindi ottenere le stime delle inclinazioni (log bi i = 1, ..., 12) e dell’intercetta (log b0). I coefficienti b0, b1, …, b12 stimati si ricaveranno poi con una semplice trasformazione antilogaritmica. Il modello presentato può sembrare molto complesso, tuttavia occorre osservare che, in ciascun periodo, mese o trimestre che sia, solo una delle variabili dummy del modello è diversa da zero. Questo porta ad una drastica semplificazione dell’equazione. Per dati mensili ad esempio, le equazioni (11.6b) e (11.6a) si riducono nel modo seguente: In gennaio: Ŷi ln b0 Xi ln b1 M1 ln b2 quindi passando agli antilogaritmi 1 Ŷi b0bX1 ibM 2 In febbraio: Ŷi ln b0 Xi ln b1 M2 ln b3 quindi passando agli antilogaritmi 2 Ŷi b0bX1 ibM 3 In marzo: Ŷi ln b0 Xi ln b1 M3 ln b4 quindi passando agli antilogaritmi 3 Ŷi b0bX1 ibM 4 .. . In novembre: Ŷi ln b0 Xi ln b1 M11 ln b12 quindi passando agli antilogaritmi 11 Ŷi b0bX1 ibM 12 In dicembre: Ŷi ln b0 Xi ln b1 quindi passando agli antilogaritmi Ŷi b0bX1 i Notiamo che il modello per il mese di dicembre, mese che rappresenta il periodo base del modello, si ottiene ponendo pari a zero tutte le variabili dummy. Per dati trimestrali invece, le equazioni (11.7b) e (11.7a) si riducono nel modo seguente: Nel primo trimestre: Ŷi ln b0 Xi ln b1 Q1 ln b2 quindi passando agli antilogaritmi 1 Ŷi b0bX1 ibQ 2 Nel secondo trimestre: Ŷi ln b0 Xi ln b1 Q2 ln b3 quindi passando agli antilogaritmi 2 Ŷi b0bX1 ibQ 3 100 CAPITOLO 11 Nel terzo trimestre: Ŷi ln b0 Xi ln b1 Q3 ln b4 quindi passando agli antilogaritmi 3 Ŷi b0bX1 ibQ 4 Nel quarto trimestre: Ŷi ln b0 Xi ln b1 quindi passando agli antilogaritmi Ŷi b0bX1 i ANALISI DELLE SERIE STORICHE levine11_57-116 3-04-2002 8:28 Pagina 101 FIGURA 11.17 Output Excel del modello su dati mensili. In questo caso, il periodo di base del modello è quello relativo al quarto trimestre, che si ottiene assumendo nulle tutte le variabili dummy del modello stesso. Per mostrare un’applicazione del modello descritto, riprendiamo l’esempio relativo alle spese private mensili per abitazioni (a prezzi costanti 1995) in una città americana nel periodo compreso fra il gennaio 1992 e il dicembre 1997 (Tabella 11.10). Nella Figura 11.17 è riportato l’output Excel del modello nei logaritmi. Notiamo che il modello sembra interpretare correttamente le osservazioni: i valori dei coefficienti di determinazione R2 aggiustato e non aggiustato sono molto elevati (84.5% e 81.3% rispettivamente); il test statistico F segnala un’ottima significatività congiunta dei coefficienti del modello (p-value = 0.000); quasi tutti i coefficienti sono singolarmente significativi, eccetto quello relativo al mese di marzo che segnala una variazione solo casuale della componente stagionale in quel mese rispetto al mese di riferimento (dicembre). Passando agli antilogaritmi otteniamo le seguenti stime dei coefficienti: COEFFICIENTI DELLA REGRESSIONE ln bi b0: Y intercetta 2.51683 0.00241 b1: Inclinazione del codice di mese 0.09862 b2: Gennaio 0.14032 b3: Febbraio 0.00831 b4: Marzo 0.10132 b5: Aprile 0.19218 b6: Maggio 0.25310 b7: Giugno 0.27688 b8: Luglio 0.28978 b9: Agosto 0.25198 b10: Settembre 0.23900 b11: Ottobre b12: Novembre 0.16756 ANALISI bi elnbi 12.3893 1.0024 0.9061 0.8691 1.0083 1.1066 1.2119 1.2880 1.3190 1.3361 1.2866 1.2700 1.1824 DI SERIE STORICHE A CADENZA MENSILE O TRIMESTRALE 101 levine11_57-116 3-04-2002 8:28 Pagina 102 Interpretazione delle stime: • • • • • L’intercetta b0 12.3893 rappresenta il valore del trend all’inizio del periodo (gennaio 1992). Il valore (b1 – 1) 100% 0.24% è la stima del tasso di crescita mensile composto della serie analizzata. b2 0.9061 è il moltiplicatore stagionale per il mese di gennaio con riferimento al mese base di dicembre. Rispetto al mese di dicembre, in gennaio si spende il 9.4% in meno in abitazioni. b3 0.8691 è il moltiplicatore stagionale per il mese di febbraio con riferimento al mese base di dicembre. Rispetto al mese di dicembre, in febbraio si spende il 13.1% in meno in abitazioni. b4 1.0083 è il moltiplicatore stagionale per il mese di marzo con riferimento al mese base di dicembre. Rispetto al mese di dicembre, in marzo si spende lo 0.8% in meno in abitazioni. .. . • b12 1.1824 è il moltiplicatore stagionale per il mese di novembre con riferimento al mese base di dicembre. Rispetto al mese di dicembre, in novembre si spende il 18.2% in più in abitazioni. Vediamo ora in che modo il modello proposto può essere utilizzato per interpolare la serie ed effettuare delle previsioni. A titolo di esempio, supponiamo di voler stimare la spesa per abitazioni relativa ai mesi di novembre e dicembre 1997. Ci affideremo alle seguenti equazioni: Per novembre 1997: Ŷ71 2.51683 70(0.00241) 0.16756 2.85309 quindi passando agli antilogaritmi Ŷ71 17.341 Per dicembre 1997: Ŷ72 2.51683 71(0.00241) 2.68794 quindi passando agli antilogaritmi Ŷ72 14.701 In modo del tutto analogo a quanto descritto nei paragrafi precedenti, anche in questo caso la bontà del modello può essere valutata attraverso il calcolo degli indici SYX e MAD. Volendo poi utilizzare il modello per effettuare previsioni a ciascun mese dell’anno 2000, si hanno le seguenti relazioni: Gennaio 2000: Febbraio 2000: Marzo 2000: 102 CAPITOLO 11 ANALISI Ŷ97 2.51683 2.64957 Ŷ97 14.148 Ŷ98 2.51683 2.61028 Ŷ98 13.603 Ŷ99 2.51683 2.76132 Ŷ99 15.821 DELLE SERIE STORICHE 96(0.00241) 0.09862 quindi passando agli antilogaritmi 97(0.00241) 0.14032 quindi passando agli antilogaritmi 98(0.00241) 0.00831 quindi passando agli antilogaritmi levine11_57-116 3-04-2002 8:28 Pagina 103 Novembre 2000: Ŷ107 Dicembre 2000: Ŷ107 Ŷ108 Ŷ108 .. . 2.51683 106(0.00241) 0.16756 2.93985 quindi passando agli antilogaritmi 18.913 2.51683 107(0.00241) 2.77470 quindi passando agli antilogaritmi 16.034 Esercizi del Paragrafo 11.7 • 11.31 Supponete di aver stimato (col metodo dei minimi quadrati) il seguente modello esponenziale su una serie storica mensile, con riferimento in particolare al mese di gennaio: Ŷi 2.0 0.01 Xi 0.10 Gennaio Calcolate l’antilogaritmo dei coefficienti e interpretate: (a) il valore dell’intercetta b0 ; (b) il tasso di crescita mensile; (c) il moltiplicatore del mese di gennaio. 11.32 Se vogliamo costruire un modello per l’interpolazione e la previsione di una serie storica settimanale, di quante variabili dummy abbiamo bisogno per tenere conto della componente stagionale? 11.33 Supponete di aver stimato (col metodo dei minimi quadrati) il seguente modello esponen• ziale su una serie storica trimestrale (I trimestre 1995 – IV trimestre 1998): Ŷi 3.0 0.10Xi 0.25Q1 0.20Q2 0.15Q3 DATASET S&PSTKIN Calcolate l’antilogaritmo dei coefficienti e interpretate: (a) il valore dell’intercetta b0 ; (b) il tasso di crescita trimestrale; (c) il moltiplicatore relativo al secondo trimestre. 11.34 Fate riferimento al modello esponenziale presentato nell’Esercizio 11.33. • (a) Calcolate il valore interpolato per il quarto trimestre 1996. (b) Calcolate il valore interpolato per il primo trimestre 1997. (c) Prevedete il valore della serie per il quarto trimestre 1999. (d) Prevedete il valore della serie per il primo trimestre 2000. • 11.35 Nella seguente tabella sono riportati i valori di un indice dei prezzi (Standard & Poor) dal primo trimestre 1994 fino al quarto trimestre 1998. Valori trimestrali dell’indice dei prezzi Standard & Poor TRIMESTRE 1 2 3 4 1994 1995 ANNO 1996 1997 1998 445.77 444.27 462.69 459.27 500.71 544.75 584.41 615.93 645.50 670.63 687.31 740.74 757.12 885.14 947.28 970.43 1101.75 1133.84 1017.01 1229.23 Fonte: Standard & Poor’s Current Statistics, January 1998, 29. Reprinted by permission of Financial Information Services, a division of Financial Communications Company, Inc., and Yahoo.com, June 24, 1999. (a) Fornite un’opportuna rappresentazione grafica delle osservazioni. (b) Adattate alla serie un modello esponenziale con componente stagionale trimestrale. ANALISI DI SERIE STORICHE A CADENZA MENSILE O TRIMESTRALE 103 levine11_57-116 3-04-2002 8:28 Pagina 104 (1) Qual è il valore interpolato per il terzo trimestre del 1998? (2) Qual è il valore interpolato per il quarto trimestre del 1998? (3) Prevedete, in base al modello, i valori della serie relativi a tutti i trimestri degli anni 1999 e 2000. (4) Interpretate il tasso di crescita trimestrale. (5) Interpretate il valore del moltiplicatore relativo al secondo trimestre. 11.36 Nella seguente tabella sono riportati i valori dell’indicatore economico GNP (Gross National Product) registrati a partire dal primo trimestre 1990 fino al quarto trimestre 1997. DATASET REALGNP Valori trimestrali del GNP (a prezzi costanti 1992) TRIMESTRE 1 2 3 4 1990 1991 1992 6152.6 6171.6 6142.1 6079.0 6047.5 6074.7 6090.1 6105.3 6175.7 6214.2 6260.7 6327.1 ANNO 1993 1994 6327.9 6359.9 6393.5 6436.9 6524.5 6600.3 6629.5 6688.6 1995 1996 1997 6703.7 6708.8 6759.2 6796.5 6826.4 6926.0 6943.8 7017.4 7101.6 7159.6 7217.6 7250.0a a Stima. Fonte: Survey of Current Business, December 1997. DATASET UNLDREG (a) Fornite un’opportuna rappresentazione grafica delle osservazioni. (b) Adattate alla serie un modello esponenziale con componente stagionale trimestrale. (1) Qual è il valore “interpolato” per il terzo trimestre del 1997? (2) Qual è il valore “interpolato” per il quarto trimestre del 1997? (3) Prevedete, in base al modello, i valori della serie relativi a tutti i trimestri degli anni 1998 e 1999. (4) Interpretate il tasso di crescita trimestrale. (5) Interpretate il valore del moltiplicatore relativo al primo trimestre. 11.37 Nella seguente tabella sono riportati i prezzi medi della benzina (per gallone) registrati in diverse città americane nel periodo compreso tra gennaio 1990 e dicembre 1997. Prezzi medi della benzina per gallone (prezzi correnti) ANNO MESE 1990 1991 1992 1993 1994 1995 1996 1997 Gennaio Febbraio Marzo Aprile Maggio Giugno Luglio Agosto Settembre Ottobre Novembre Dicembre 1.042 1.037 1.023 1.044 1.061 1.088 1.084 1.190 1.294 1.378 1.377 1.354 1.247 1.143 1.082 1.104 1.156 1.160 1.127 1.140 1.143 1.122 1.134 1.123 1.073 1.054 1.058 1.079 1.136 1.179 1.174 1.158 1.158 1.154 1.159 1.136 1.117 1.108 1.098 1.112 1.129 1.130 1.109 1.097 1.085 1.127 1.113 1.070 1.043 1.051 1.045 1.064 1.080 1.106 1.136 1.182 1.177 1.152 1.163 1.143 1.129 1.120 1.115 1.140 1.200 1.226 1.195 1.164 1.148 1.127 1.101 1.101 1.129 1.124 1.162 1.251 1.323 1.299 1.272 1.240 1.234 1.227 1.250 1.260 1.261 1.255 1.235 1.231 1.226 1.229 1.205 1.253 1.277 1.242 1.213 1.177 Fonte: Bureau of Labor Statistics, U.S. Department of Labor, ser. ID: APU000074714, extracted February 2, 1998. (a) Con l’applicazione dell’indice dei prezzi al consumo presentato nell’Esercizio 11.11, costruite la serie dei valori a prezzi costanti 1982-84 (dividete per CPI e moltiplicate il risultato per 100). (b) Fornite un’opportuna rappresentazione grafica delle osservazioni. (c) Adattate alla serie un modello esponenziale con componente stagionale mensile. 104 CAPITOLO 11 ANALISI DELLE SERIE STORICHE levine11_57-116 3-04-2002 DATASET CREDIT 8:28 Pagina 105 (1) Qual è il valore “interpolato” per il mese di novembre 1997? (2) Qual è il valore “interpolato” per il mese di dicembre 1997? (3) Prevedete, in base al modello, i valori della serie per tutti i 12 mesi del 1998. (4) Interpretate il tasso di crescita mensile. (5) Interpretate il valore del moltiplicatore relativo al mese di luglio. 11.38 Nella seguente tabella sono riportate le spese mensili associate ad una nota carta di credito. Spese associate a una carta di credito MESE 1997 ANNO 1998 Gennaio Febbraio Marzo Aprile Maggio Giugno Luglio Agosto Settembre Ottobre Novembre Dicembre 31.9 27.0 31.3 31.0 39.4 40.7 42.3 49.5 45.0 50.0 50.9 58.5 39.4 36.2 40.5 44.6 46.8 44.7 52.2 54.0 48.8 55.8 58.7 63.4 1999 45.0 39.6 Fonte: Dati reali raccolti da uno degli autori. DATASET TOYS-REV (a) Rappresentate graficamente le osservazioni. (b) Fornite una prima descrizione intuitiva dell’andamento mensile della serie. (c) In generale l’ammontare di spese associate alla carta di credito vi sembra in aumento o in diminuzione? (d) Adattate alla serie un modello esponenziale con componente stagionale mensile. (e) Interpretate il tasso di crescita mensile. (f) Interpretate il valore del moltiplicatore relativo al mese di gennaio. (g) Quale valore prevedete, in base al modello, per il mese di marzo 1999? (h) Quale valore prevedete, in base al modello, per il mese di aprile 1999? 11.39 Nella seguente tabella sono riportate le entrate trimestrali della società Toys, fatte registrare a partire dal primo trimestre 1992 fino al terzo trimestre 1998. Entrate trimestrali della società Toys (1992-98) TRIMESTRE 1992 1993 1994 ANNO 1995 1996 1997 1998 1 2 3 4 1026 1056 1182 2861 1172 1249 1346 3402 1286 1317 1449 3893 1462 1452 1631 4200 1493 1614 1715 4605 1646 1736 1883 4668 1924 1989 2142 Fonte: Standard & Poor’s Stock Reports, November 1995, November 1998. New York: McGrawHill, Inc. (a) Pensate che le entrate della società siano soggette a variazioni stagionali? (b) Fornite un’opportuna rappresentazione grafica delle osservazioni. Il vostro grafico supporta l’ipotesi che avete fatto al punto (a)? (c) Adattate alla serie un modello esponenziale con componente stagionale trimestrale. (1) Interpretate il valore del tasso di crescita trimestrale. (2) Commentate i quattro moltiplicatori trimestrali. ANALISI DI SERIE STORICHE A CADENZA MENSILE O TRIMESTRALE 105 levine11_57-116 3-04-2002 8:28 DATASET FORD-REV Pagina 106 (3) Qual è la vostra previsione per il quarto trimestre del 1998? (4) Quali valori prevedete per i quattro trimestri del 1999? 11.40 Nella seguente tabella sono riportate le entrate trimestrali della società Ford Motor Company, fatte registrare a partire dal primo trimestre 1992 fino al terzo trimestre 1998. Entrate trimestrali della società Ford Motor Company (1992-98) TRIMESTRE 1 2 3 4 1992 1993 1994 ANNO 1995 1996 1997 1998 24 560 26 840 23 330 25 410 26 760 29 420 24 500 27 840 30 400 33 770 30 660 33 643 34 783 36 389 31 418 34 547 36 261 37 937 33 960 38 833 36 202 40 265 36 096 39 952 36 584 37 289 32 640 Fonte: Standard & Poor’s Stock Reports, November 1995, November 1998. New York: McGraw-Hill, Inc. DATASET VUL-REV (a) Pensate che le entrate della società siano soggette a variazioni stagionali? (b) Fornite un’opportuna rappresentazione grafica delle osservazioni. Il vostro grafico supporta l’ipotesi che avete fatto al punto (a)? (c) Adattate alla serie un modello esponenziale con componente stagionale trimestrale. (1) Interpretate il valore del tasso di crescita trimestrale. (2) Commentate i quattro moltiplicatori trimestrali. (3) Qual è la vostra previsione per il quarto trimestre 1998? (4) Quali valori prevedete per i quattro trimestri del 1999? 11.41 Nella seguente tabella sono riportate le entrate trimestrali della società Vulcan Materials, fatte registrare a partire dal primo trimestre 1992 fino al terzo trimestre 1998. Entrate trimestrali della società Vulcan Materials (1992-98) TRIMESTRE 1992 1993 1994 ANNO 1995 1996 1997 1998 1 2 3 4 211 284 312 271 214 306 336 282 217 327 360 350 294 383 422 362 309 419 444 398 341 445 478 414 359 466 510 Fonte: Standard & Poor’s Stock Reports, November 1995, November 1998. New York: McGraw-Hill, Inc. (a) Pensate che le entrate della società siano soggette a variazioni stagionali? (b) Fornite un’opportuna rappresentazione grafica delle osservazioni. Il vostro grafico supporta l’ipotesi che avete fatto al punto (a)? (c) Adattate alla serie un modello esponenziale con componente stagionale trimestrale. (1) Interpretate il valore del tasso di crescita trimestrale. (2) Commentate i quattro moltiplicatori trimestrali. (3) Qual è la vostra previsione per il quarto trimestre 1998? (4) Quali valori prevedete per i quattro trimestri del 1999? ◆ 11.8 106 VALIDITÀ CAPITOLO 11 E LIMITI DEI METODI DI ANALISI DELLE SERIE STORICHE La validità dei metodi, come quelli descritti in questo capitolo, che si basano sulla conoscenza del passato e del presente per prevedere l’evolversi futuro di un fenomeno è accettata da sempre. Se effettivamente non si verificasse nessun cambiamento nei fattori che, nel passato, hanno influenzato l’attività economica, i metodi descritti rappresenterebbero uno strumento validissimo per la previsione degli andamenti futuri dell’economia e quindi per la valuta- ANALISI DELLE SERIE STORICHE levine11_57-116 3-04-2002 8:28 Pagina 107 zione delle migliori strategie aziendali. Naturalmente una simile stabilità non è realistica e di fronte al cambiamento le tecniche presentate non possono non sembrarci ingenue e meccaniche. Proprio per superare alcuni dei limiti dell’analisi classica delle serie storiche sono stati elaborati in anni recenti modelli più complessi (modelli econometrici) in grado di considerare l’incidenza di fattori quali il giudizio personale dell’analista, l’esperienza manageriale, il progresso tecnologico, l’evoluzione dei gusti e dei bisogni. Tale modellistica (riferimenti bibliografici 2, 3, 6 e 10) va oltre gli scopi di questo libro, in cui si è voluto dare un quadro delle tecniche classiche di analisi delle serie storiche e di previsione degli andamenti futuri, le quali rappresentano pur sempre un valido punto di partenza per l’analista e per il manager e un utile strumento di supporto decisionale aziendale. ◆R IEPILOGO DEL CAPITOLO In questo capitolo, come potete osservare nel diagramma di riepilogo, sono stati presentati diversi metodi per l’analisi di serie storiche annuali: le medie mobili, il livellamento esponenziale, i modelli lineari, quadratici ed esponenziali, i modelli autoregressivi. Si è inoltre discusso un metodo di regressione con l’aggiunta di variabili dummy, utile per cogliere la componente stagionale e tentare un approccio previsivo su serie rilevate con cadenza mensile o trimestrale. ◆P AROLE CHIAVE componente casuale 60 componente ciclica 59 componente irregolare 60 componente stagionale 60 deviazione media assoluta (MAD) 94 livello esponenziale 75 media mobile 62 metodi di previsione aleatori 59 metodi di previsione basati sulle serie storiche 59 modello moltiplicativo classico 60 modello quadratico 74 previsione 84 principio di parsimonia 94 serie storica 59 tecniche di previsione quantitative 59 trend lineare 71 trend 59 metodo di previsione qualitativo 59 modelli autoregressivi 84 modello autoregressivo del p-esimo ordine 84 modello autoregressivo del primo ordine 84 modello autoregressivo del secondo ordine 84 modello moltiplicativo classico per serie storiche 60 Previsione di una serie storica Rappresentazione grafica dei valori Sì Trend lineare Trend quadratico Trend esponenziale Trend ? Modelli autoregressivi No Smoothing esponenziale Medie mobili Tabella riassuntiva del capitolo 11. RIEPILOGO DEL CAPITOLO 107 levine11_57-116 3-04-2002 8:28 Pagina 108 Verifica della comprensione 11.42 11.43 11.44 11.45 11.46 11.47 11.48 11.49 11.50 11.51 Perché sono importanti le tecniche di previsione? Cosa si intende esattamente per serie storica? Descrivete le componenti del modello moltiplicativo classico per l’analisi di una serie storica. Qual è la differenza fra le medie mobili e il livellamento esponenziale? Sotto quali circostanze il modello basato su un trend esponenziale deve essere ritenuto il più appropriato? In cosa consiste la particolarità dei modelli di regressione discussi in questo capitolo? In cosa differiscono i modelli autoregressivi rispetto agli altri approcci per la previsione di una serie storica? Quali sono i criteri per la scelta del modello appropriato in un caso concreto? Commentate il significato degli indici SYX e MAD nella scelta del modello. In che modo le tecniche di previsione su dati mensili o trimestrali differiscono da quelle discusse in relazione a serie con cadenza annuale? Esercizi di riepilogo del Capitolo DATASET 11.52 I seguenti dati rappresentano l’incidenza della poliomielite (numero di casi su 100.000 per- POLIO sone) registrata a cadenza quinquennale nel periodo compreso fra il 1915 e il 1955. Tassi di incidenza della poliomielite ANNO 1915 1920 1925 1930 1935 1940 1945 1950 1955 Tasso 3.1 2.2 5.3 7.5 8.5 7.4 10.3 22.1 17.6 Fonte: Data are taken from B. Wattenberg, ed., The Statistical History of the United States: From Colonial Times to the Present, ser. B303 (New York: Basic Books, 1976). DATASET GAPAC (a) Rappresentate i dati in un opportuno grafico. (b) Adattate alla serie un trend lineare e disegnatelo sul precedente grafico. (c) Prevedete l’incidenza della malattia per gli anni 1960, 1965 e 1970. 11.53 Nella seguente tabella sono riportate le entrate lorde (a prezzi correnti) della società Geor• gia-Pacific Corporation nei 24 anni compresi fra il 1975 e il 1998. Entrate lorde (a prezzi correnti) della società Georgia-Pacific Corporation ANNO ENTRATE ANNO ENTRATE ANNO ENTRATE 1975 1976 1977 1978 1979 1980 1981 1982 2.4 3.0 3.7 4.4 5.2 5.0 5.4 5.4 1983 1984 1985 1986 1987 1988 1989 1990 6.5 6.7 6.7 7.2 8.6 9.5 10.1 12.7 1991 1992 1993 1994 1995 1996 1997 1998 11.5 11.8 12.3 12.7 14.3 13.0 13.1 13.3 Fonte: Moody’s Handbook of Common Stocks, 1980, 1989, 1993, 1997. Reprinted by permission of Financial Information Services, a division of Financial Communications Company, Inc., and Standard and Poor’s Corp., New York: McGraw-Hill, Inc., April 1999. (a) Calcolate le entrate la prezzi costanti 1982-84, dividendo ciascun valore della tabella per l’indice dei prezzi al consumo (Esercizio 11.11) e moltiplicando il risultato per 100. (b) Rappresentate la nuova serie di dati in un grafico. (c) Individuate il trend lineare. (d) Individuate il trend quadratico. (e) Individuate il trend esponenziale. 108 CAPITOLO 11 ANALISI DELLE SERIE STORICHE levine11_57-116 3-04-2002 DATASET PMORRIS 8:28 Pagina 109 (f) Stimate un modello autoregressivo del terzo ordine e verificate la significatività del parametro autoregressivo di ordine tre ( = 0.05). (g) Se necessario, stimate un modello autoregressivo del secondo ordine e verificate la significatività del parametro autoregressivo di ordine due ( = 0.05). (h) Se necessario, stimate un modello autoregressivo del primo ordine e verificate la significatività del parametro autoregressivo di ordine uno ( = 0.05). (i) Analizzate i residui dei tre modelli considerati ai punti (c) – (e) e del modello autoregressivo più appropriato fra quelli stimati ai punti (f) – (h). (j) Calcolate l’indice SYX per tutti i modelli considerati al punto (i). (k) Calcolate l’indice MAD per tutti i modelli considerati al punto (i). (l) Sulla base dei risultati ottenuti ai punti (i) – (k), e tenendo conto anche del principio di parsimonia, quale fra i modelli confrontati vi sembra il più idoneo a prevedere l’andamento futuro della serie? (m) Utilizzate il modello scelto al punto (l) per effettuare una previsione per gli anni 19992000. 11.54 Nella seguente tabella sono riportate le entrate lorde (a prezzi correnti) della società Philip Morris nei 24 anni compresi fra il 1975 e il 1998. Entrate lorde (a prezzi correnti) della società Philip Morris ANNO ENTRATE ANNO ENTRATE ANNO ENTRATE 1975 1976 1977 1978 1979 1980 1981 1982 3.6 4.3 5.2 6.6 8.1 9.6 10.7 11.6 1983 1984 1985 1986 1987 1988 1989 1990 13.0 13.8 16.0 25.9 28.2 31.7 44.8 51.3 1991 1992 1993 1994 1995 1996 1997 1998 56.5 59.1 60.9 65.1 66.1 69.2 72.0 74.4 Fonte: Moody’s Handbook of Common Stocks, 1980, 1989, 1993, 1997. Reprinted by permission of Financial Information Services, a division of Financial Communications Company, Inc., and Standard and Poor’s Corp., New York: McGraw-Hill, April 1999. (a) Calcolate le entrate la prezzi costanti 1982-84, dividendo ciascun valore della tabella per l’indice dei prezzi al consumo (Esercizio 11.11) e moltiplicando il risultato per 100. (b) Rappresentate la nuova serie di dati in un grafico. (c) Individuate il trend lineare. (d) Individuate il trend quadratico. (e) Individuate il trend esponenziale. (f ) Adattate alla serie un modello autoregressivo del terzo ordine e verificate la significatività del parametro autoregressivo di ordine tre ( = 0.05). (g) Se necessario, adattate alla serie un modello autoregressivo del secondo ordine e verificate la significatività del parametro autoregressivo di ordine due ( = 0.05). (h) Se necessario, adattate alla serie un modello autoregressivo del primo ordine e verificate la significatività del parametro autoregressivo di ordine uno ( = 0.05). (i) Analizzate i residui dei tre modelli considerati ai punti (c) – (e) e del modello autoregressivo più appropriato fra quelli stimati ai punti (f) – (h). (j) Calcolate l’indice SXY per tutti i modelli considerati al punto (i). (k) Calcolate l’indice MAD per tutti i modelli considerati al punto (i). (l) Sulla base dei risultati ottenuti ai punti (i) – (k), e tenendo conto anche del principio di parsimonia, quale fra i modelli confrontati vi sembra il più idoneo a prevedere l’andamento futuro della serie? (m) Utilizzate il modello scelto al punto (l) per effettuare una previsione per gli anni 19992000. ESERCIZI DI RIEPILOGO DEL CAPITOLO 109 levine11_57-116 3-04-2002 8:28 DATASET MCDONALD Pagina 110 11.55 Nella seguente tabella sono riportate le entrate lorde (a prezzi correnti) della società Mc Donald’s Corporation nei 24 anni compresi fra il 1975 e il 1998. Entrate lorde (a prezzi correnti) della società McDonald’s Corporation ANNO ENTRATE ANNO ENTRATE ANNO ENTRATE 1975 1976 1977 1978 1979 1980 1981 1982 1.0 1.2 1.4 1.7 1.9 2.2 2.5 2.8 1983 1984 1985 1986 1987 1988 1989 1990 3.1 3.4 3.8 4.2 4.9 5.6 6.1 6.8 1991 1992 1993 1994 1995 1996 1997 1998 6.7 7.1 7.4 8.3 9.8 10.7 11.4 12.4 Fonte: Moody’s Handbook of Common Stocks, 1980, 1989, 1993, 1997. Reprinted by permission of Financial Information Services, a division of Financial Communications Company, Inc., and Standard and Poor’s Corp., New York: McGraw-Hill, April 1999. DATASET SEARS (a) Calcolate le entrate la prezzi costanti 1982-84, dividendo ciascun valore della tabella per l’indice dei prezzi al consumo (Esercizio 11.11) e moltiplicando il risultato per 100. (b) Rappresentate la nuova serie di dati in un grafico. (c) Individuate il trend lineare. (d) Individuate il trend quadratico. (e) Individuate il trend esponenziale. (f ) Adattate alla serie un modello autoregressivo del terzo ordine e verificate la significatività del parametro autoregressivo di ordine tre ( = 0.05). (g) Se necessario, adattate alla serie un modello autoregressivo del secondo ordine e verificate la significatività del parametro autoregressivo di ordine due ( = 0.05). (h) Se necessario, adattate alla serie un modello autoregressivo del primo ordine e verificate la significatività del parametro autoregressivo di ordine uno ( = 0.05). (i) Analizzate i residui dei tre modelli considerati ai punti (c) – (e) e del modello autoregressivo più appropriato fra quelli stimati ai punti (f) – (h). (j) Calcolate l’indice SXY per tutti i modelli considerati al punto (i). (k) Calcolate l’indice MAD per tutti i modelli considerati al punto (i). (l) Sulla base dei risultati ottenuti ai punti (i) – (k), e tenendo conto anche del principio di parsimonia, quale fra i modelli confrontati vi sembra il più idoneo a prevedere l’andamento futuro della serie? (m) Utilizzate il modello scelto al punto (l) per effettuare una previsione per gli anni 19992000. 11.56 Nella seguente tabella sono riportate le entrate lorde (a prezzi correnti) della società Sears, Roebuck & Company nei 24 anni compresi fra il 1975 e il 1998. Entrate lorde (a prezzi correnti) della società Sears, Roebuck & Company 110 CAPITOLO 11 ANALISI ANNO ENTRATE ANNO ENTRATE ANNO ENTRATE 1975 1976 1977 1978 1979 13.1 17.7 19.6 22.9 24.5 1983 1984 1985 1986 1987 35.9 38.8 40.7 42.3 48.4 1991 1992 1993 1994 1995 57.2 52.3 50.8 54.6 34.9 DELLE SERIE STORICHE levine11_57-116 3-04-2002 8:28 Pagina 111 1980 1981 1982 25.2 27.4 30.0 1988 1989 1990 50.3 53.8 56.0 1996 1997 1998 38.2 41.3 41.3 Fonte: Moody’s Handbook of Common Stocks, 1980, 1989, 1993, 1997. Reprinted by permission of Financial Information Services, a division of Financial Communications Company, Inc., and Standard and Poor’s Corp., New York: McGraw-Hill, April 1999. DATASET WALMART (a) Calcolate le entrate prezzi a costanti 1982-84, dividendo ciascun valore della tabella per l’indice dei prezzi al consumo (Esercizio 11.11) e moltiplicando il risultato per 100. (b) Rappresentate la nuova serie di dati in un grafico. (c) Individuate il trend lineare. (d) Individuate il trend quadratico. (e) Individuate il trend esponenziale. (f ) Adattate alla serie un modello autoregressivo del terzo ordine e verificate la significatività del parametro autoregressivo di ordine tre ( = 0.05). (g) Se necessario, adattate alla serie un modello autoregressivo del secondo ordine e verificate la significatività del parametro autoregressivo di ordine due ( = 0.05). (h) Se necessario, adattate ala serie un modello autoregressivo del primo ordine e verificate la significatività del parametro autoregressivo di ordine uno ( = 0.05). (i) Analizzate i residui dei tre modelli considerati ai punti (c) – (e) e del modello autoregressivo più appropriato fra quelli stimati ai punti (f) – (h). (j) Calcolate l’indice SXY per tutti i modelli considerati al punto (i) (k) Calcolate l’indice MAD per tutti i modelli considerati al punto (i) (l) Sulla base dei risultati ottenuti ai punti (i) – (k), e tenendo conto anche del principio di parsimonia, quale fra i modelli confrontati vi sembra il più idoneo a prevedere l’andamento futuro della serie? (m) Utilizzate il modello scelto al punto (l) per effettuare una previsione per gli anni 19992000. 11.57 Nella seguente tabella sono riportate le entrate trimestrali fatte registrare dalla società WalMart Stores nel periodo di 7 anni compreso fra il 1992 e il 1998. Entrate trimestrali della società Wal-Mart Stores (1992-1998) TRIMESTRE 1 2 3 4 1992 1993 1994 ANNO 1995 1996 1997 1998 9280 10 340 10 630 13 640 11 650 13 030 13 680 17 122 13 920 16 237 16 827 20 361 17 690 19 942 20 418 24 448 20 440 22 723 22 913 27 550 22 772 25 587 25 644 30 856 25 409 28 366 28 777 35 386 Fonte: Standard & Poor’s Stock Reports, November 1995, November 1998. New York: McGraw-Hill, Inc. DATASET WORKWEEK (a) Quali fra le componenti che in generale compongono una serie storica riuscite ad individuare nei dati riportati nella tabella? (b) Rappresentate i valori in un grafico. (c) Adattate alla serie un modello esponenziale con componente trimestrale. (d) Interpretate i valori dei “moltiplicatori” trimestrali. (e) Effettuate una previsione a tutti i trimestri degli anni 1999 e 2000. 11.58 Nella seguente tabella è riportato il numero medio di ore di lavoro settimanali per addetti alla produzione nel ramo manifatturiero, calcolato mensilmente a partire dal gennaio 1992 fino a dicembre 1997. ESERCIZI DI RIEPILOGO DEL CAPITOLO 111 levine11_57-116 3-04-2002 8:28 Pagina 112 Numero medio di ore di lavoro settimanali nel ramo manifatturiero MESE 1992 1993 1994 ANNO 1995 1996 1997 Gennaio Febbraio Marzo Aprile Maggio Giugno Luglio Agosto Settembre Ottobre Novembre Dicembre 40.8 41.0 41.0 41.0 41.1 41.1 41.1 41.1 41.0 41.1 41.2 41.2 41.3 41.5 41.1 41.6 41.3 41.2 41.4 41.4 41.6 41.5 41.6 41.7 41.7 41.2 42.0 41.9 42.0 42.0 42.0 42.0 41.9 42.1 42.1 42.1 42.2 41.9 41.8 41.5 41.4 41.4 41.3 41.5 41.5 41.5 41.5 41.2 40.1 41.4 41.3 41.5 41.6 41.7 41.6 41.7 41.7 41.7 41.7 42.0 41.8 41.9 42.1 42.1 42.0 41.8 41.8 41.8 41.9 42.0 42.1 42.1a a Stima. Fonte: Standard & Poor’s Current Statistics, January 1998, 7. Reprinted by permission of Financial Information Services, a division of Financial Communications Company, Inc. (a) Rappresentate i valori in un grafico. (b) Adattate alla serie un modello esponenziale con componente mensile e utilizzatelo per effettuare una previsione della serie a tutti i mesi del 1998. ◆I L CASO ANALISI DI UNA SERIE STORICA DI TASSI DI CAMBIO Supponete di essere membro di una società finanziaria che investe a livello internazionale. I vostri soci, per stabilire la politica degli investimenti, hanno bisogno di una previsione dei valori futuri dei tassi di cambio rispetto al dollaro americano di diverse valute quali il dollaro canadese, il franco francese, il marco tedesco, lo yen giapponese e la DATASET sterlina inglese. Nella tabella sono riportati i cambi (rispetto al dollaro americano) registrati negli anni dal 1967 al 1997. Analizzate opportunamente le cinque serie storiche proposte, utilizzando gli strumenti appresi in questo capitolo, e prevedete i tassi di cambio delle cinque valute rispetto al dollaro americano per gli anni 1998-1999 e 2000. Tassi di cambio di cinque valute rispetto al dollaro americano CURRENCY 112 CAPITOLO 11 DOLLARO FRANCO MARCO YEN STERLINA ANNO CANADESE FRANCESE TEDESCO GIAPPONESE INGLESE 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1.0789 1.0776 1.0769 1.0444 1.0099 0.9907 1.0002 0.9780 1.0175 0.9863 1.0633 4.921 4.953 5.200 5.529 5.510 5.044 4.454 4.811 4.288 4.783 4.916 3.9865 3.9920 3.9251 3.6465 3.4830 3.1886 2.6715 2.5868 2.4614 2.5185 2.3236 362.13 360.55 358.36 358.16 347.79 303.13 271.31 291.84 296.78 296.45 268.62 ANALISI DELLE SERIE STORICHE a 275.04 239.35 239.01 239.15 244.42 250.34 245.25 234.03 222.17 180.48 174.49 levine11_57-116 3-04-2002 8:28 Pagina 113 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1.1405 1.1713 1.1693 1.1990 1.2344 1.2325 1.2952 1.3659 1.3896 1.3259 1.2306 1.1842 1.1668 1.1460 1.2085 1.2901 1.3656 1.3027 1.3704 1.4296 4.509 4.257 4.225 5.440 6.579 7.620 8.736 8.980 6.926 6.012 5.960 6.380 5.447 5.647 5.294 5.663 5.552 4.853 5.184 6.024 2.0097 1.8343 1.8175 2.2632 2.4281 2.5539 2.8455 2.9420 2.1705 1.7981 1.7570 1.8808 1.6166 1.6610 1.5618 1.6533 1.6228 1.5014 1.5415 1.7986 210.39 219.02 226.63 220.63 249.06 237.55 237.46 238.47 168.35 144.60 128.17 138.07 145.00 134.59 126.78 111.20 102.21 103.35 115.87 130.38 191.84 212.24 232.46 202.43 174.80 151.59 133.68 129.74 146.77 163.98 178.13 163.82 178.41 176.74 176.63 150.20 153.16 152.84 171.26 165.18 a In cents per pound. Fonte: Board of Governors of the Federal Reserve System, Table B-107. ◆I L CASO IL CASO SPRINGVILLE HERALD Si è discusso dell’importanza che riveste per il giornale il ramo delle consegne a domicilio, per incrementare le quali i responsabili di marketing del quotidiano hanno messo a punto una serie di strategie di cui si è parlato nei precedenti capitoli. Ora il DATASET SH11 giornale vuole verificare se effettivamente l’impegno ha prodotto i risultati sperati. A tal fine i responsabili hanno raccolto informazioni dettagliate sul numero di abbonamenti per consegna a domicilio in un periodo di due anni (Tabella SH11.1). Tabella SH11.1 Numero di abbonamenti per consegna a domicilio in un periodo di 24 mesi MESE 1 2 3 4 5 6 7 8 9 10 11 12 ABBONAMENTI MESE ABBONAMENTI 75 327 77 116 79 341 80 983 82 326 82 879 84 006 85 119 86 182 87 418 88 063 89 444 13 14 15 16 17 18 19 20 21 22 23 24 90 507 91 927 93 878 94 784 96 109 97 189 97 899 99 208 100 537 102 028 103 977 106 375 IL CASO SPRINGVILLE HERALD 113 levine11_57-116 3-04-2002 8:28 Pagina 114 (a) Analizzate opportunamente i valori della serie e individuate un modello che vi consenta di effettuare previsioni. (b) Prevedete il numero di abbonamenti per i 4 mesi successivi. (c) Siete in grado di utilizzare il vostro modello per previsioni a oltre un anno nel futuro? ◆B IBLIOGRAFIA 1. Bails, D.G., e L.C. Peppers, Business Fluctuations: Forecasting Techniques and Applications (Englewood Cliffs, NJ: Prentice Hall, 1982). 2. Bowerman, B.L., e R.T. O’Connell, Forecasting and Time Series, 3d ed. (North Scituate, MA: Duxbury Press, 1993). 3. Box, G.E.P., G.M. Jenkins, e G.C. Reinsel, Time Series Analysis: Forecasting and Control, 3d ed. (Englewood Cliffs, NJ: Prentice Hall, 1994). 4. Brown, R.G., Smoothing, Forecasting, and Prediction (Englewood Cliffs, NJ: Prentice Hall, 1963). 5. Chambers, J.C., S.K. Mullick, e D.D. Smith, “How to Choose the Right Forecasting Technique,” Harvard Business Review 49, no. 4 (July–August 1971): 45–74. 6. Frees, E.W., Data Analysis Using Regression Models: The ◆ A11.1 DI MICROSOFT DELLE SERIE STORICHE L’USO 7. 8. 9. 10. 11. Business Perspective (Upper Saddle River, NJ: Prentice Hall, 1996). Hanke, J.E., e A.G. Reitsch, Business Forecasting, 6th ed. (Upper Saddle River, NJ: Prentice Hall, 1998). Mahmoud, E., “Accuracy in Forecasting: A Survey,” Journal of Forecasting 3 (1984): 139–159. Microsoft Excel 2000 (Redmond, WA: Microsoft Corp., 1999). Newbold, P., Statistics for Business and Economics, 4th ed. (Englewood Cliffs, NJ: Prentice Hall, 1994). Wilson, J.H., e B. Keating, Business Forecasting (Homewood, IL: Irwin, 1990). EXCEL PER L’ANALISI L’uso di Excel per il calcolo delle medie mobili Per mostrare l’applicazione del calcolo di una media mobile con l’uso di Excel, aprite il file GM.XLS e considerate il foglio di lavoro Data. Selezionate Strumenti | Analisi dei dati e scegliete l’opzione media mobile. Inserite C1 : C25 nel campo Intervallo di input, selezionate l’opzione Etichette nella prima riga, inserite l’ordine della media mobile (in questo caso 3) nel campo Intervallo e scegliete un opportuno Intervallo di output (ad esempio D2:D25). Fate clic sul tasto OK e otterrete nella colonna D la media mobile di ordine 3 calcolata sulle osservazioni. Ripetete il procedimento richiedendo di calcolare la media mobile di ordine 7. Si osserva che in entrambi i casi Excel non posiziona correttamente l’output in corrispondenza della parte centrale della serie, ma lo sposta di qualche cella verso il basso. Potete correggere l’errore con un semplice tagliaincolla che sposti la serie delle medie mobili di ordine tre a partire dalla terza cella e quella delle medie di ordine 7 a partire dalla quinta cella, in modo da centrare correttamente le medie. L’uso di Excel per il livellamento (o smorzamento) esponenziale Scegliete ora, all’interno del percorso Strumenti|Analisi dei dati l’opzione Smorzamento esponenziale. Inserite C1:C25 nel campo Intervallo di input, selezionate l’opzione Etichette nella prima riga. Se volete ottenere valori smussati con un W = 0.25, inserite il valore 1 – W = 0.75 nel campo Fattore di smorzamento e scegliete un opportuno Intervallo di output (ad esempio F2:F25). Ripetete il procedimento scegliendo un fattore di smorzamento pari a 0.5. Anche in questo caso dovete incollare le formule una riga più in alto rispetto a quella automaticamente scelta da Excel. A questo punto potete utilizzare Autocomposizione grafico per rappresentare i valori, le medie mobili e i valori smorzati, seguendo le indicazioni fornite nell’Appendice 2.1. 114 CAPITOLO 11 ANALISI DELLE SERIE STORICHE levine11_57-116 3-04-2002 8:28 Pagina 115 L’uso di Excel per la determinazione del trend col metodo dei minimi quadrati La determinazione di un trend col metodo dei minimi quadrati con riferimento a una serie storica si traduce nell’applicazione di un modello di regressione. Si rimanda pertanto a quanto detto nelle Appendici 9.1 (per la stima di un trend lineare), 10.1 (per la stima di un trend non lineare). In particolare se vogliamo adattate alla serie un modello esponenziale dobbiamo semplicemente effettuare la trasformazione logaritmica delle osservazioni e considerare la nuova variabile come variabile dipendente in un modello di regressione lineare. L’uso di Excel per la determinazione di modelli autoregressivi Anche i modelli autoregressivi si riducono a modelli di regressione multipla: in questo caso i regressori (variabili indipendenti) sono le variabili ritardate. A titolo di esempio aprite il file EASTMANK.XLS e posizionatevi sul foglio di lavoro Data. Copiate per comodità le colonne relative al valore assegnato all’anno e alla variabile dipendente (entrate lorde) in un nuovo foglio di lavoro (colonne A e B). Per creare la variabile ritardata di un periodo inserite la formula =B2 nella cella C3 e copiatela nella stessa colonna fino alla riga 25. Ricordate di inserire il simbolo #N/A nella cella rimasta vuota (C2) in modo tale che il contenuto della cella sia considerato come un valore mancante ai fini della regressione. In modo del tutto analogo create nelle colonne D e D le variabili ritardate di 2 e 3 periodi. A questo punto potete utilizzare l’opzione Strumenti | Analisi dei dati | Regressione per stimare i parametri del modello (vedi anche Appendice 9.1). L’uso di Excel per calcolare l’indice MAD (deviazione media assoluta) Excel non prevede il calcolo automatico dell’indice MAD per i modelli descritti. Tuttavia il MAD può essere agevolmente calcolato applicando ai residui del modello le formule di Excel. Si è visto che tutti i modelli presentati possono essere visti come casi particolari di modelli di regressione. Uno degli output Excel del modello di regressione è dato dai residui. Il MAD si ottiene applicando ai valori assoluti dei residui (=ASS()) la funzione MEDIA. Il calcolo del MAD diventa un po’ più complesso nel caso di trend esponenziale. In questo caso infatti il modello restituisce il logaritmo (in base 10) dei valori previsti e quindi, prima di calcolare i residui del modello, occorre passare all’antilogaritmo e quindi calcolare i residui basandosi su quest’ultimo valore. Si tratta cioè di applicare la funzione: POTENZA(numero; potenza) Per esempio POTENZA (10; 2) = 100 = 102. APPENDICE 115