STATISTICA ECONOMICA ED ANALISI DI MERCATO
“Previsioni Economiche ed Analisi di Serie Storiche”
A.A. 2003 / 04
ESERCITAZIONE 1
“Analisi Classica”
di Daniele Toninelli
NB: HO EVIDENZIATO IN GIALLO LE PROCEDURE CHE SAREBBE OPPORTUNO
APPLICARE ALLA PROPRIA SERIE (VERRANNO INSERITE NEL VOSTRO LAVORO
FINALE).
P.S.: PER LA PROSSIMA ESERCITAZIONE VI PREGO DI PRESENTARVI TUTTI
CON UNA SERIE STORICA (PERSONALE) CHE REGISTRERO’ SU UN APPOSITO
FILE.
LA SERIE DEVE ESSERE MENSILE E COMPRENDERE 12 ANNI DI DATI;
QUINDI DEVE ESSERE COMPOSTA DA 144 DATI ORGANIZZATI IN EXCEL PER
COLONNA (PRIMA COLONNA: DATE; SECONDA: DATI DELLA SERIE).
GRAZIE.
1. INTRODUZIONE
Una serie storica Yt (t = 1, 2, …) (in genere a cadenza infra-annuale) è formata dall’insieme di
un certo numero di componenti:
• Trend Tt (tendenza della serie)
• Ciclo Ct (fluttuazioni periodiche)
• Stagionalità St (oscillazioni di periodo inferiori all’anno)
• Componente Accidentale o Casuale At (fattori casuali / erratici)
Possibilità di combinazioni delle componenti:
• Modello additivo:
Yt = Tt + Ct + St + At
• Modello moltiplicativo:
Yt = Tt * Ct * St * At
• Passaggio dal modello moltiplicativo a quello additivo tramite log
1
Yt = Tt * Ct * St * At
=>
Log (Yt) = Log (Tt) + Log (Ct) + Log (St) + Log(At)
Spesso le componenti Ciclo-Trend sono lasciate unite (TCt).
1.1. Rappresentazione grafica di una serie
Per rappresentare la serie data tramite grafico:
¾ Selezionare i dati della serie
¾ Inserisci – Grafico
¾ Selezionare Linee
¾ Avanti: Cartella Intervallo dati e Serie (possibile aggiungere altre serie e relativi nomi)
¾ Avanti: Cartella opzioni del grafico (Titoli, assi, griglia, legenda, etichette dati, tabelle
dati)
¾ Avanti: Fine (due opzioni)
E’ possibile modificare ogni impostazione ciccando sul grafico con il tasto destro e scegliendo
dati di origine o opzioni grafico.
RAPPRESENTARE LA SERIE
2. DESTAGIONALIZZAZIONE
Scopo: eliminazione della componente stagionale.
Trattamento preliminare dei dati grezzi per correggere l'influenza:
•
del diverso numero di giorni lavorativi contenuti nei periodi considerati (mesi o
trimestri)
•
delle festività (Pasqua, Natale, …)
•
dei valori anomali (outliers), legati a fenomeni accidentali o straordinari (scioperi,
calamità naturali, ecc.)
2.1. Aggiustamenti per il calendario
Per eliminare il problema del diverso numero di giorni che compongono un determinato mese
è necessario agire nel modo seguente:
•
calcolare un fattore di aggiustamento (per ogni mese)
2
•
il fattore di aggiustamento per il mese i (i = 1, 2, …, 12) è individuabile nel seguente
modo:
¾
•
numero medio mensile di giorni
numero di giorni del mese i − esimo
per i = 1, 2, …, 12
moltiplicare i dati della serie originaria per il corrispondente fattore di aggiustamento
ricavando una nuova serie
Analoga procedura viene utilizzata per mesi che hanno un differente numero di giorni
lavorativi (o per serie di altra periodicità). I fattori di aggiustamento dovranno essere calcolati in
base al tipo di serie presa in analisi.
La presenza della stagionalità rende difficile il confronto corretto tra mesi contigui (si deve
ricorrere alle variazioni percentuali “tendenziali”, calcolate cioè rispetto allo stesso periodo
dell’anno precedente).
AGGIUSTARE LA SERIE PER IL CALENDARIO (SE OPPORTUNO)
2.2. Calcolo della componente stagionale di una serie
Si vedrà in seguito per la previsione tramite Exponential Smoothing.
2.3. Destagionalizzazione di una serie
Modalità di intervento:
•
Sottrazione della componente stagionale dalla serie originaria (modello additivo)
•
Divisione della serie originaria per la componente stagionale (modello moltiplicativo)
Si ottiene la serie “destagionalizzata” (andamento meno oscillante della serie “grezza”, pur
mantenendo al suo interno la componente ciclica ed irregolare).
Eliminando poi la componente accidentale si ottiene la stima del ciclo-trend (tendenza di
medio-lungo termine).
La destagionalizzazione consente di interpretare correttamente anche le variazioni percentuali
“congiunturali”, calcolate rispetto al periodo immediatamente precedente (mese su mese). Si
3
dispone così di una misura dell’andamento di breve periodo del fenomeno analizzato, non
influenzata dagli elementi di natura stagionale.
3. TREND
Proiezione del trend di una serie tramite curve matematiche individuate tramite l’analisi di
regressione (dati interpolati da una curva che ne interpreta l’andamento, basandosi sul criterio dei
minimi quadrati).
•
Variabile dipendente: fenomeno da prevedere della funzione di regressione
•
Variabile indipendente: serie temporale a cui si riferiscono le osservazioni
La funzione stimata lega i valori storici del fenomeno a quelli temporali, quindi, specificando
altri periodi temporali (ad esempio futuri, variabile indipendente), è possibile calcolare in loro
corrispondenza i valori della variabile dipendente, ovvero ottenere la proiezione del fenomeno da
prevedere.
I nuovi periodi temporali da specificare devono essere omogenei con quelli della serie storica
(mensili se mensile,…).
In risultati delle proiezione rappresentano la tendenza futura (previsione) del fenomeno,
ammesso che gli stessi scenari continuino a caratterizzare il prossimo futuro; e per questo motivo
non sono completamente affidabili (eventi imprevedibili che impattano sull’evoluzione del
fenomeno ne inficiano l’attendibilità)
3.1. Riempimento
Funzione “Riempimento”:
•
permette di completare o creare automaticamente una serie numerica secondo varie
modalità;
•
mezzo rapido per eseguire una analisi di regressione (lineare o esponenziale).
Creazione di una progressione numerica:
¾ Inserire in una qualsiasi cella il valore iniziale della progressione
¾ Modifica – Riempimento - Serie (apertura di un box)
¾ Specificare:
ƒ
se si vuole una progressione strutturata in verticale o in orizzontale
4
ƒ
l’incremento della progressione (di quanto devono essere aumentati i
suoi termini rispetto al precedente)
ƒ
il valore limite che la conclude
¾ Ok
3.2. Regressione tramite Riempimento
Regressione lineare di dati mensili.
¾ Replicare i dati sulla colonna di fianco (in corrispondenza dei dati originari)
¾ Evidenziare i dati
¾ Lanciare Riempimento
ƒ
Spuntare il bottone Lineare o Esponenziale a seconda del tipo di
regressione che si vuole fare
ƒ
Spuntare Tendenza.
¾ Ok
Si richiede così che i dati originali sino trasformati in una progressione lineare o esponenziale
(nuovi dati) che ne approssima in modo ottimale l’andamento.
La pendenza della linea di regressione è utile a descrivere l’evoluzione del fenomeno, molto di
più di quanto si evincerebbe dalla analisi dei dati grezzi (se questi non hanno un andamento
uniforme è infatti difficile interpretarne l’andamento, mentre le linea di tendenza lo rappresenta
inequivocabilmente).
Evidenziando le due colonne è possibile creare con i dati in esse contenuti un grafico lineare
(si ottiene la curva dei dati storici e la corrispondente linea di tendenza che ne interpreta
l’andamento); è possibile anche confrontare i risultati della regressione con i dati originari.
Inoltre è possibile scegliere quale tipo di regressione sia più appropriato per stimare
l’andamento dei dati: basta affiancare i dati elaborati con la regressione (lineare e esponenziale) e
impostare in altre due colonne gli scarti al quadrato tra questi e i dati originari. La regressione che
avrà somma degli scarti minore sarà quella che meglio si adatta alla interpretazione dei dati.
3.3. Regressione e proiezione tramite Riempimento
Pero ottenere la proiezione:
5
¾ digitare nella zona opportuna i riferimenti ai periodi da proiettare (per rendere
immediata la lettura dei risultati);
¾ replicare i dati storici nella zona di fianco a quelli originali
¾ evidenziare le celle contenenti questi dati e le celle successive (bianche) relative ai
periodi per cui si vuole effettuare la proiezione
¾ Modifica – Riempimento – Serie
ƒ
Spuntare la casella Linea di tendenza
ƒ
Selezionare Lineare o Esponenziale a seconda del tipo di regressione
che si vuole fare
ƒ
Ok
D’ORA IN POI LAVORARE SUI PRIMI 10 ANNI DI DATI E FARE EVENTUALI
PREVISIONI PER GLI ULTIMI DUE ANNI.
PROVARE LA PROCEDURA DI PROIEZIONE (TRAMITE RIEMPIMENTO) SUI DATI;
PROVARE CON LA PROCEDURA LINEARE E ESPONENZIALE E SCEGLIERE LA
MIGLIORE
Viene così eseguita l’analisi di regressione e la proiezione desiderata. Se si vogliono
interpretare graficamente i risultati, è possibile creare un grafico lineare contenente le due serie (dati
originari e serie risultato della regressione). Come si noterà, la linea di tendenza sarà stata
prolungata oltre l’ultimo dato storico disponibile, consentendo così di leggere sull’asse delle Y le
previsioni per i periodi presi in considerazione.
4. GRAFICO E LINEA DI TENDENZA
Partendo da un grafico (meglio se lineare) si richiede che vi venga inserita una linea di
tendenza specificandone le modalità di calcolo, e indicando in corrispondenza di quanti periodi
temporali deve essere prolungata al fine di ottenere la previsione desiderata. Si ha la possibilità di
calcolare la linea di tendenza utilizzando cinque tipi di funzioni (lineari, logaritmiche, esponenziali,
di potenza e polinomiali). Per le polinomiali si possono utilizzare equazioni di vario grado (da 2 a
6).
6
Inoltre può essere eseguita anche l’analisi della media mobile, che ben si presta ad interpretare
l’andamento di situazioni che tendono a subire delle fluttuazioni cicliche influenzate dalla
stagionalità.
Tutte le analisi previste possono essere eseguite impostando di volta in volta numerosi
parametri operativi che consentono di ottenere risultati particolarmente mirati, o complementati da
utili informazioni. Ci riferiamo alla possibilità di specificare il numero di periodi da proiettare, di
visualizzare l’equazione rappresentativa della linea di tendenza, e al calcolo del cosiddetto R2, un
indice numerico dal quale si può estrapolare l’attendibilità dell’analisi condotta.
4.1. Aggiungere ad un grafico una linea di tendenza
Si parte da un grafico lineare dei valori storici da elaborare
¾ fare clic destro su un qualsiasi punto della curva che lo rappresenta
¾ selezionare Aggiungi linea di tendenza; viene visualizzata una maschera a due schede:
o La scheda Tipo gestisce il tipo di analisi da realizzare (due sezioni)
ƒ
Sezione superiore: icone delle sei analisi realizzabili
ƒ
Sezione inferiore: si può specificare (se il grafico presenta più serie di
valori) quale utilizzare per l’analisi
¾ Selezionare l’icona corrispondente all’analisi desiderata (scegliendo la regressione
polinomiale o la media mobile, è possibile indicare rispettivamente il grado della curva
e la periodicità della media)
o Nella scheda Opzioni si impostano alcuni parametri operativi dell’analisi
ƒ
Nome linea di tendenza: assegnare un nome personalizzato
ƒ
si può specificare il numero di periodi da proiettare (tale possibilità non
è prevista se si esegue un’analisi della media mobile, in quanto tale
elaborazione mette in evidenza il solo trend di evoluzione dei dati
analizzati)
¾ Per eseguire l’analisi: Ok
INDIVIDUARE LA LINEA DI TENDENZA COL METODO GRAFICO; PROVARE CON
TRE TIPI DIVERSI DI PROCEDURE (TRA LE 6 POSSIBILI) E SCEGLIERE LA MIGLIORE.
A questo punto, nota la dinamica operativa della procedura, è possibile realizzare analisi
grafiche specifiche.
7
4.2. Regressione Lineare
L’equazione che rappresa la linea di tendenza è del tipo:
y=a*x+b
(a e b rappresentano rispettivamente il coefficiente e la costante di regressione: a identifica la
pendenza della retta, b l’intercetta, cioè il punto in cui la retta incontra l’asse Y).
¾ Nella maschera per l’aggiunta della linea di tendenza, selezionare la prima icona
¾ Nella scheda Opzioni inserire nella casella il nome da assegnare alla linea di tendenza
¾ Nella sezione Previsioni inserire nella casella Futura il numero di periodi da
proiettare. I periodi proiettati sono omogenei con quelli che si riferiscono ai dati storici
analizzati (stessa unità temporale)
PREVISIONI TRAMITE LA LINEA DI TENDENZA; PROVARE CON TRE TIPI
DIVERSI DI PROCEDURE (TRA LE 6 POSSIBILI) E SCEGLIERE LA MIGLIORE.
FARE EVENTUALI CONFRONTI COI RISULTATI INDIVIDUATI CON IL METODO
RIEMPIMENTO
¾ Se si lavora con grafico XY è possibile digitare (opzionalmente) un numero nella
casella Verifica per specificare per quanti valori si desidera tracciare all’indietro una
linea di tendenza. I grafici XY appartengono alla categoria dei diagrammi lineari, ma il
valore della variabile dipendente viene calcolato in funzione di quello rappresentato
dal corrispondente punto dell’asse X. Per questa ragione si prestano particolarmente
bene a interpretare o analizzare graficamente funzioni matematiche
¾ Spuntare (opzionalmente) la casella Imposta intercetta = e indicare nella finestrella a
fianco il punto dell’asse Y in cui la linea di tendenza deve intersecarlo. Questa opzione
si applica a linee di tendenza lineari, polinomiali ed esponenziali, ma non è disponibile
per quelle logaritmiche, di potenza e a media mobile
¾ Spuntare il checkbox Visualizza l’equazione sul grafico se si vuole far apparire
l’equazione della curva di tendenza nel diagramma
8
¾ Selezionare la casella Visualizza il valore di R al quadrato sul grafico se si desidera
che venga specificato l’indice di confidenza dell’analisi (il valore che consente di
giudicare l’attendibilità dell’analisi che è stata eseguita)
VISUALIZZARE EQUAZIONE DEL TREND E R2. SCEGLIERE IL METODO
PREVISIVO RITENUTO MIGLIORE.
Nota – R2
Le informazioni fornite da tale indice si rivelano preziose per la scelta del tipo di analisi da
condurre. R2 che è un valore numerico compreso fra 0 e 1. Tanto più si avvicina ad 1 tanto più
l’analisi condotta è affidabile, mentre tanto più si avvicina a 0 tanto meno lo è. Ciò significa che la
linea di tendenza approssima nel migliore o nel peggiore dei modi l’andamento dei dati storici. Per
eseguire una analisi attendibile basta utilizzare vari tipi di procedure (usando sempre, come base, i
dati storici) e optare poi per quella che presenta il migliore indice di confidenza. Non è possibile
dire che la migliore analisi è quella caratterizzata dall’indice più elevato, ma bisogna valutarne
anche il valore assoluto per verificare che non si tratti di un valore piuttosto basso: in questo caso si
tratterebbe di risultati non affidabili.
4.3. Regressione Logaritmica
L’equazione che rappresa la linea di tendenza è del tipo:
y = a * Ln(x) + b
(la costante b rappresenta l’intercetta della curva, Ln(x) il logaritmo in base naturale della
variabile indipendente).
La procedura per creare la curva è analoga a quella già vista per la regressione lineare.
4.4. Regressione Esponenziale
L’analisi si conduce con le procedure già descritte. La linea di tendenza è rappresentata da una
equazione del tipo:
y = a * e b*x
(e è la base dei logaritmi naturali)
4.5. Regressione di Potenza
9
La curva di tendenza è interpretata dalla relazione:
y=a*xb
si esegue con le solite procedure.
4.6. Regressione Polinomiale
L’equazione caratteristica della curva di tendenza è rappresentata da un polinomio di grado da
2 a 6. Aumentando il grado dell’equazione, aumenta la complessità della curva.
La procedura di base per inserire la linea di tendenza è sempre la stessa, ma questa volta è
prevista la selezione del grado dell’equazione da utilizzare.
Per un grado pari a 4, l’espressione è del tipo:
y = a x4 + b*x3 + c*x2 + d*x + e
5. MEDIE MOBILI
La media mobile viene utilizzata per la stima del trend di un fenomeno soggetto a stagionalità.
Si ottiene facendo la media dei valori corrispondenti a determinati intervalli temporali (la cui
ampiezza si definisce periodicità o ampiezza della media mobile).
Il risultato viene riferito ad un ben preciso punto dell’intervallo, che si assume pari al valore
che si trova al centro della periodicità.
L’analisi prosegue calcolando una nuova media riferita ad un intervallo della medesima
ampiezza, ma spostato in avanti di un periodo, e via dicendo sino a che vi sono dati a disposizione.
Si ottiene così una linea di tendenza che presenta i picchi smorzati, proprio perché l’influenza
di questi ultimi viene attutita dal fatto che questi vengono mediati con altri valori prossimi nel
tempo.
Per realizzare una media mobile, si utilizza la solita procedura, ma nella finestra dedicata nella
prima scheda della maschera si dichiara la periodicità della media (periodo). La scelta della
periodicità da impostare dipende dall’andamento della curva dei dati storici.
L’analisi della media mobile non prevede la specifica dei periodi da proiettare, né il calcolo di
R2.
INDIVIDUARE MEDIA MOBILE TRAMITE METODO GRAFICO
10
6. FORMATO LINEA DI TENDENZA
Il tratto, lo spessore, e il colore della linea di tendenza possono essere opportunamente
personalizzati.
¾ Fare clic destro su un qualsiasi punto della linea di tendenza
¾ Nel sottomenu selezionare Formato linee di tendenza (la voce Cancella serve per
eliminare la linea)
¾ Si accede ad una maschera a tre schede:
o Opzioni e Tipo: identiche a quelle di cui ci si è avvalsi per aggiungere le
linee di tendenza. E’ possibile utilizzarle per modificare le caratteristiche di
quella su cui stiamo lavorando o per aggiungere al grafico elementi che non
erano stati presi in considerazione in prima battuta (visualizzazione
dell’indice di confidenza, equazione della linea di tendenza, …).
o Motivo (quella che interessa):
ƒ
spuntare il bottone Personalizza
ƒ
negli elenchi a discesa associati alle caselle Stile e Spessore definire
queste caratteristiche selezionando quelle desiderate
ƒ
per il colore della linea, aprire la paletta cromatica associata alla
voce omonima e impostare quello desiderato
¾ Per formattare i caratteri dell’equazione della linea di tendenza e dell’indice R2
(nonché il riquadro che li ospita), farvi sopra doppio clic per accedere alla
maschera che gestisce l’applicazione dei formati. Oppure fare clic destro e
selezionare la voce Formato etichette dati nel menu.
¾ Nella scheda Motivo, si possono impostare i bordi del riquadro che ospita le scritte.
¾ Nella sezione Bordi, spuntando Personalizzato, si possono specificare le
caratteristiche di questi ultimi e associare loro una ombreggiatura facendo clic
sull’omonimo checkbox (per eliminare i bordi spuntare il bottone Assente).
¾ In Area è possibile definire il colore di fondo del riquadro che ospita i dati. La
paletta cromatica che gestisce l’assegnazione può essere estesa facendo
semplicemente clic sul pulsante in calce ad essa. Si accede così ad uno speciale
box in cui si possono impostare le sfumature dello sfondo.
11
¾ Colore e formato dei caratteri delle scritte si impostano nella scheda Carattere.
¾ Nella scheda Allineamento si può impostare quest’ultimo parametro (anche
l’orientamento verticale dei testi con varie angolazioni).
12