STATISTICA ECONOMICA ED ANALISI DI MERCATO

STATISTICA ECONOMICA ED ANALISI DI MERCATO
“Previsioni Economiche ed Analisi di Serie Storiche”
A.A. 2003 / 04
ESERCITAZIONE 2
“Introduzione all’uso di
EViews”
di Daniele Toninelli
1. INTRODUZIONE ad EViews
Software statistico utilizzato per analisi statistiche di vario genere, analisi econometriche,
previsioni, … .
E’ caratterizzato da alta flessibilità e dà la possibilità di creare programmi.
Nel seguito si vedrà una sintesi delle principali funzioni di EViews per l’analisi delle Serie
Storiche.
1.1
Creazione workfile
E’ possibile inserire direttamente i dati in EViews, ma di solito è molto più facile farlo prima
in Excel e, in seguito, importarli in EViews.
EViews permette di importare file da Excel, Lotus, file ASCII (file di Testo), … Non possono
essere importati direttamente dati da SAS o SPSS. Prima di importare questo tipo di dati bisogna
salvarli come file di testo.
Prima di importare la serie storica è necessario creare il workfile (ovvero il “contenitore” in
cui verranno salvati tutti gli oggetti (la serie originale e tutti i risultati della elaborazione).
Per fare ciò è indispensabile innanzitutto verificare l’esatta grandezza (in termini di
estensione) e il tipo dei dati (serie giornaliera, mensile, annuale, …) su cui si vuole lavorare.
Per creare un nuovo workfile:
• File → New → Workfile
1
Compare una finestra di dialogo.
Come detto, se si sta lavorando con una serie temporale di dati, bisogna conoscere
• la periodicità della serie stessa (quotidiana, mensile, quadrimestrale,…)
• le date esatte di inizio e fine della serie dei dati.
Se si sta lavorando con dati cross-sectional, bisogna conoscere il numero delle osservazioni.
Nei rimanenti casi bisogna scegliere Undated or irregular e inserire la collocazione temporale
dell’inizio e della fine delle osservazioni negli appositi riquadri.
1.2
Importare una serie di dati da Excel
Prima di iniziare la procedura di importazione dati è opportuno fare alcune considerazioni di
ordine formale per i nomi delle variabili:
ƒ Si possono usare sia caratteri minuscoli che maiuscoli
ƒ La lunghezza non deve superare le 15 lettere
ƒ La prima lettera deve essere una lettera dell’alfabeto
ƒ Non può essere usata la sola lettera “c”
ƒ Non sono ammessi simboli e caratteri speciali (tranne “_”)
Per importare i dati della serie storica da Excel si devono seguire i seguenti passi:
a. Esaminare il contenuto del file Excel e annotarsi:
• La data di inizio e di fine delle osservazioni
• La cella da cui partono i dati
• Il nome delle variabili e l’ordine in cui appaiono (se ce ne dovessero essere
differenti)
• Il nome del foglio di lavoro in cui i dati sono contenuti (se il file Excel è
formato da più fogli di lavoro; altrimenti, per default, la serie viene
importata dal primo foglio)
b. Nella procedura di creazione di un nuovo workfile (v. 1.1):
•
Scegliere il tipo di serie (Annuale, trimestrale, settimanale, giornaliera, …).
ƒ Per inserire i dati giornalieri bisogna usare il formato americano
(MM/DD/YYYY);
ƒ Per dati trimestrali anno e quarter di partenza (YYYY:Q);
ƒ Per dati mensili anno e mese (YYYY:MM)
•
OK
In questo modo appare la finestra del workfile con indicati il Range e il Sample.
Importati i dati, vengono sempre create ed indicate per default due serie (C e Resid):
• C è la colonna che conterrà i coefficienti dall’ultima equazione di
regressione (o del modello) che è stata stimata
• RESID è la colonna che conterrà i residui dall’ultimo modello stimato.
A questo punto è possibile iniziare la procedura di importazione dei dati della serie storica:
2
c.
d.
Per importare i dati da Excel:
• Procs → Import → Read Text-Lotus-Excel.
• Nella finestra di dialogo per Open scegliere il formato Excel e il percorso
per il file.
• Selezionare il file e ciccare Open.
•
NB: Ricordarsi di chiudere il file in Excel prima di importarlo in EViews.
•
Ci potrebbero essere problemi dovuti al formato Excel originale
nell’importare i dati. In questo caso è opportuno salvare prima il file
contenente la serie storica in formato Excel 4.0 (se il file originario è
salvato diversamente):
ƒ File / Salva con Nome
ƒ scegliere Excel 4.0 nell’elenco a discesa
ƒ Salva
•
Altro problema potrebbe essere dovuto al fatto che in Excel i dati della
serie non sono in formato numerico. In questi casi selezionare le celle di
Excel contenenti i dati e, cliccando col tasto destro del mouse, modificare il
formato dati in “numero” prima di importare la serie.
Seguito il procedimento del punto c., si aprirà una finestra di dialogo in cui è molto
importante inserire le informazioni corrette. Ogni errore potrebbe causare la
costruzione di un dataset incompleto o errato.
•
•
•
•
L’ordine dei dati può essere (come capita in molti casi) By Observation –
series in column. In questo caso è necessario segnalare la prima cella in alto
a sinistra contenente i dati ed eventualmente il nome del foglio Excel da cui
si desidera importare i dati. Se il file Excel comprende un solo foglio di
lavoro, non è necessario inserirne il nome.
Bisogna inserire (tenendo ben presenti le regole di cui si è parlato sopra) il
nome della serie (non devono essere lasciati spazi nel nome). In caso si
volessero importare i nomi presenti in Excel, bisogna solamente inserire il
numero delle serie che vengono considerate. Questi nomi possono essere
cambiati in EViews con la funzione Rename. Questo metodo però in alcuni
casi potrebbe causare problemi (se, per esempio, i nomi cominciano con un
numero oppure sono molto simili tra di loro).
Cliccare su Ok
Nel workfile è ora visualizzata la lista delle serie importate in ordine
alfabetico insieme alle due righe dei coefficienti stimati C e dei residui
Resid. Buona norma è controllare che il primo e l’ultimo dato delle variabili
sia stato importato correttamente (potrebbero verificarsi degli errori nel
caso dell’utilizzo di cifre decimali, nel caso di righe “NA”, cioè in
mancanza di dati nel file originale o nel caso ci siano dei valori troppo alti o
troppo bassi). Per fare ciò basta ciccare due volte sulla serie di interesse e
aprirne il foglio dati relativo.
Molto utile è la possibilità di poter aprire due variabili come un unico gruppo:
a. Cliccare sulla variabile scelta
b. Tenendo premuto CTRL, cliccare sull’altra variabile
3
c. Seguire il percorso: View → Open as one window → Open
Group (oppure si può semplicemente cliccare col tasto destro
sulle due serie selezionate e scegliere Open Group)
Se si è certi di avere importato correttamente i dati, è possibile salvare il workfile:
• File → Save As
• Daremo al workfile nome “nomewf”
Il workfile sarà salvato in EViews con l’estensione “.wf1” e potrà essere riaperto in qualsiasi
altro momento senza che il lavoro fatto sia andato perso.
Per riaprire un workfile in un secondo momento è necessario selezionare:
• File → Open File → Workfile
dal menu principale.
E’ possibile lavorare su un workfile formato anche da due o più serie (x e y); in questo caso si
segue la procedura indicata nel seguito:
• Objects / New Object
• nel riquadro Type of Object della finestra New Object selezionare Group
• elencare, nella finestra Series List, le serie che faranno parte del gruppo separate da
uno spazio (ovviamente le serie devono già essere state entrambe importate nel
workfile)
Fatto ciò, si possono utilizzare alcuni utili comandi:
• View / Graph consente di ottenere vari tipi di grafici per le due serie:
ƒ Scatter fornisce stime non parametriche della regressione di y su x;
ƒ Scatter Simple dà un diagramma a dispersione per le serie y e x.
• View / Multiple affianca i due grafici delle singole serie
• View / Correlations fornisce la correlazione tra le serie che formano il gruppo
• View / Cross correlations consente di tracciare la funzione di autocorrelazione
incrociata tra le variabili di una serie e le variabili ritardate dell’altra (ad esempio, tra yt
e xt-j oppure tra yt e xt+j).
1.3
Analisi preliminare di una Serie Storica
Importata la serie storica y, cliccare sulla serie (d’ora in poi si fisserà come presupposto il fatto
di lavorare su una serie mensile di dati riguardanti 10 anni di osservazioni). Cliccando sulla serie si
apre una finestra indicante:
Serie: y Workfile: nomewf
Che mostra la serie considerata in colonna in una tabella (si possono osservare i valori
numerici originari della serie importata).
Per effettuare alcune analisi preliminari sulla serie y importata si può agire sul menu della
finestra principale. Le funzioni principali sono:
• View / Line graph mostra il grafico della serie storica
• Seasonal (EViews crea automaticamente un grafico contenente l’andamento dei dati
relativamente al medesimo mese; in questo modo si può avere una idea precisa della
stagionalità mensile della serie, infatti l’andamento della serie relativo ai differenti
mesi può essere visto in grafici separati oppure può essere visualizzato all’interno di
4
•
•
•
•
•
1.4
un unico grafico, e questo permette agevolmente di constatare il livello della serie
relativamente ai differenti mesi).
View / Descriptive Statistics / Histogram and Stats mostra l’istogramma della serie: si
può così constatare come i dati della serie si distribuiscono. Inoltre sono presenti anche
le statistiche descrittive più comunemente utilizzate (media, mediana, massimo,
minimo, deviazione standard, indici di asimmetria e curtosi, test di normalità, …)
View / Distribution Graph per CDF-Survivor-Quantile, Quantile-Quantile, Kernel
Density.
View / Correlogram è utilizzato per calcolare il correlogramma della serie; nella
finestra Correlogram specification:
• In Correlogram of selezionare
ƒ Level per effettuare le analisi sui dati originari
ƒ 1st difference per effettuare le analisi sulla serie delle differenze
prime (dyt = yt – yt-1)
ƒ 2nd difference per effettuare l’analisi sulla serie delle differenze
seconde (2dyt = dyt – dyt-1)
• Lag Specification: inserire il numero di ritardi per i quali si vuole
calcolare il correlogramma.
View / Unit Root Test per il test di radice unitaria
Quick / Graph (selezionabile dal menu nella parte alta della finestra) permette di
ottenere un diagramma a dispersione (scatterplot) per valori della serie e valori
ritardati di j periodi.
ƒ Nel riquadro List of Series, Groups and/or Series Estimations indicare
le serie da rappresentare graficamente, ad es. y e y(-j).
ƒ Nella successiva finestra Graph , all’opzione Graph Type, selezionare
Scatter Diagram
ƒ OK
Trasformazione dei dati
EViews permette anche di utilizzare differenti procedure per trasformare le variabili originarie
in nuove variabili (che in genere vanno a costituire nuove serie).
Per utilizzare questa procedura si utilizza il tasto Genr (che si trova in alto a destra nella
finestra del workfile).
Per trasformare l’intera serie lasciare Sample così com’è e selezionare OK, altrimenti è
necessario modificare l’estensione del Sample (cioè l’intervallo di dati su cui si vuole operare)
ATTENZIONE! Se nella parte sinistra della equazione non si imposta un nuovo nome per la
variabile, EViews va a sovrapporre la nuova serie alla vecchia. I dati originali verranno di
conseguenza persi e si dovrà procedere alla ri-importazione di essi dal file Excel.
•
Procs / Generate by equation consente di ottenere serie trasformate da quella
originale.
o Ad esempio, per trovare la serie dei quadrati si inserisce in Enter equation la
formula:
y2 = y^2
Tornati alla finestra workfile si avrà la nuova serie y2.
5
E’ possibile anche effettuare altri tipi di trasformazione:
o Per la trasformazione esponenziale della serie bisogna usare la formula:
ey = exp(y)
o Per la trasformazione logaritmica:
ly = log(y)
In molte occasioni è di grande utilità differenziare la serie storica; per trovare una serie
differenziata, dalla serie iniziale, bisogna impostare la formula come per il seguente esempio:
• dyt = yt – yt-1,
in formula
dy = d(y).
Per differenziare n volte la serie:
d(y,n)
Per trovare la differenza logaritmica della serie data, è possibile usare la funzione dlog
(combinazione tra la differenziazione e la trasformazione logaritmica della serie) da applicare alla
serie storica in esame.
• Il comando log_a = dlog(serie_a) ad esempio crea una nuova serie (log_a) data dalla
differenza tra il logaritmo della serie_a all’istante t e il logaritmo della stessa serie
all’istante t-1.
In qualsiasi caso, tra quelli elencati, si ricorda che per visualizzare la nuova variabile basta
cliccarci sopra due volte.
Rilevante anche la funzione lag che permette di ottenere da una serie originaria una serie (che
chiameremo z) ritardata (spostata in avanti) di un determinato numero di lag (ad esempio ponendo
come lag un valore k si ottiene una serie ritardata di k periodi; questo ritardo, nella formula, si
indica con -k).
• z = y(-k)
Da notare che la serie in questo modo perde le prime k osservazioni (indicate nel foglio
Spreadsheet con NA).
•
Ad esempio, col comando dif_serie_b = serie_b – serie _b(-1) si ottiene la nuova serie
differenziata dif_serie_b.
Se invece si vuole traslare (ritardare) la serie b di un certo numero di lag (periodi), basta
semplicemente inserire nell’equazione il comando serie_b(-1).
•
In EViews è possibile anche generare una serie di numeri pseudo-casuali da una v.c. N(0,1);
bisogna procedere nel seguente modo:
• Procs / Generate by equation
• nel riquadro enter equation indicare: z=nrnd (viene generata una serie delle lunghezza
del sample)
Per cancellare una qualsiasi serie creata nel workfile basta evidenziarla e selezionare Delete
1.5
Creare una variabile dummy stagionale
Creare variabili dummy (che assumono solo i valori 0 o 1).
•
Se abbiamo un workfile contenente dati trimestrali potremmo volere isolare solo il
quarto quarter di ogni anno (Q4) in una nuova variabile.
6
•
•
o Tasto Genr ;
o inserire la seguente equazione: Q4=@SEAS(4)
Se si fa invece riferimento ad ogni mese di Marzo di ciascun anno della nostra serie
(rilevazione a cadenza mensile) per valutare l’effetto di quel determinato mese
all’interno della serie da noi considerata:
o Tasto Genr ;
o MAR=@SEAS(3)
o Viene attribuito valore 1 a tutti i dati relativi al mese di Marzo, valore 0 ai dati
relativi a tutti gli altri mesi.
Col comando DUM1987 = 0 inserito dopo aver cliccato sul tasto Genr, possiamo
isolare l’anno 1987 all’interno del nostro dataset. Ricliccando Genr dopo aver
cambiato il sample range dall’originale a [1987:10 1987:10], inserendo l’equazione
DUM1987 = 1 otteniamo una nuova variabile DUM1987 che assume valore 1 per
l’Ottobre 1987 e valore 0 per tutti gli altri mesi.
7