Analisi delle serie storiche parte V Modelli autoregressivi a.a. 2016/2017 Statistica Economica ‐ Laurea in Relazioni Economiche Internazionali 1 Definizioni introduttive Autoregressione: modello di regressione che spiega una serie temporale con i suoi valori passati Autocorrelazione o correlazione seriale: correlazione di una serie storica con i propri valori ritardati Si definisce p‐esima autocovarianza di una serie Yt la covarianza tra il valore assunto dalla serie al tempo t e il valore assunto p periodi precedenti: autocovarianzap = cov(Yt,Yt‐p) mentre la p‐esima autocorrelazione (o p‐esimo coefficiente di autocorrelazione) è data da: autocorrelazionep=corr(Yt,Yt‐p)=p= cov( Y , Y t p ) t var( Y t ) var( Y t Statistica Economica ‐ Laurea in Relazioni Economiche Internazionali p ) 2 Modelli autoregressivi Modello autoregressivo del primo ordine AR(1) Yt = 0+1Yt‐1+ut dove ut ≈ NID(0, σu2) previsione al tempo T del valore al tempo T+1: prevYT+1lT = b0+b1YT dove b0 e b1 sono gli stimatori OLS del modello di regressione delle osservazioni Yt sulla osservazione immediatamente precedente Statistica Economica ‐ Laurea in Relazioni Economiche Internazionali 3 Modelli autoregressivi Modello autoregressivo del p‐esimo ordine AR(p) Yt = 0+1Yt‐1+ … + pYt‐p + ut dove ut ≈ NID(0, σu2) previsione al tempo T del valore al tempo T+1: prevYT+1lT = b0 + b1YT + … + bpYT‐p+1 dove b0, b1, … bp sono gli stimatori OLS del modello di regressione delle osservazioni Yt sulle p osservazioni precedenti Statistica Economica ‐ Laurea in Relazioni Economiche Internazionali 4 Scelta dell’ordine del modello AR • Trade‐off fra la semplicità dei modelli di ordine più basso e la (eventuale) maggiore capacità esplicativa di quelli di ordine superiore. Se l’ordine dell’autoregressione è troppo basso si tralasceranno le informazioni contenute nei valori ritardati più lontani, se troppo alto si stimeranno più coefficienti del necessario, introducendo errori di stima aggiuntivi nelle previsioni Statistica Economica ‐ Laurea in Relazioni Economiche Internazionali 5 Scelta dell’ordine del modello AR Test di significatività del parametro autoregressivo di ordine più elevato Si inizia con un modello con molti ritardi e si verifica man mano la significatività del coefficiente relativo al ritardo finale. n 2p 1 t NB per p=1 si ha tn 3 bp p Sbp b1 1 s(b1) (Yt 1Y ) 2 Statistica Economica ‐ Laurea in Relazioni Economiche Internazionali 6 Scelta dell’ordine del modello AR Se l’ipotesi nulla H0: p=0 viene accettata, si passa da un modello AR(p) a un modello AR(p‐1) C’è però il rischio (pari all’errore di I specie, , probabilità di rifiutare H0 quando è vera) di stimare comunque modelli con ritardi troppo lunghi. Criteri alternativi: BIC Criterio d’informazione bayesiano (detto anche SIC, Criterio d’informazione di Schwarz) AIC Criterio d’informazione di Akaike Statistica Economica ‐ Laurea in Relazioni Economiche Internazionali 7 Scelta dell’ordine del modello AR • BIC indicando con SSR(p) la somma dei quadrati dei residui del modello AR(p) scegliamo il valore di p che rende minima la quantità ln T SSR ( p ) BIC ( p ) ln ( p 1) T T si osservi che il primo termine diminuisce (o comunque non cresce) al crescere del numero dei p regressori Yt‐p mentre il secondo aumenta con l’aumentare di p Statistica Economica ‐ Laurea in Relazioni Economiche Internazionali 8 Scelta dell’ordine del modello AR • AIC 2 SSR ( p ) AIC ( p ) ln ( p 1 ) T T per un numero di osservazioni T superiore a 8 (ln8=2,08) il secondo termine è più piccolo rispetto al precedente: quindi basta una riduzione più piccola in SSR(p) per passare da un modello con p‐1 ritardi ad uno con p ritardi. Teoricamente, dunque, l’uso del criterio AIC potrebbe portare ad una sovrastima dell’ordine del modello. Statistica Economica ‐ Laurea in Relazioni Economiche Internazionali 9 Costruzione del modello AR(p) per una serie annuale • Scelta dell’ordine p del modello • Stima del modello di regressione multipla AR(p) • Si testa l’ipotesi H0: p=0. Se H viene rifiutata il modello stimato viene usato per rappresentare la serie e fare previsioni. Se H0 viene accettata si stima un modello AR(p‐1) e si testa l’ipotesi H0: p‐1=0. Il processo continua fino ad individuare un modello AR(k) per cui l’ipotesi H0: k=0 viene rifiutata Statistica Economica ‐ Laurea in Relazioni Economiche Internazionali 10 Scelta del tipo di modello per interpolare la serie storica Analisi dei residui • errore standard della stima, su • deviazione media assoluta n MAD Y t Yˆt t 1 n Principio di parsimonia Statistica Economica ‐ Laurea in Relazioni Economiche Internazionali 11 Analisi delle serie storiche infra‐annuali • Se la cadenza della serie storica è inferiore all’anno, occorre tener conto della stagionalità • Per inserire nel modello di regressione la componente stagionale si introducono delle variabili dummy stagionali. • Ad es. per dati Yt mensili si introducono 11 variabili indicatrici M1t=1 se il mese t è gennaio, 0 altrimenti … M11t=1 se il mese t è novembre, 0 altrimenti Statistica Economica ‐ Laurea in Relazioni Economiche Internazionali 12 Analisi delle serie storiche infra‐annuali • Per dati Yt trimestrali si introducono 3 variabili indicatrici Q1t=1 se il trimestre t è il primo, 0 altrimenti Q2t=1 se il trimestre t è il secondo, 0 altrimenti Q3t=1 se il trimestre t è il terzo, 0 altrimenti Statistica Economica ‐ Laurea in Relazioni Economiche Internazionali 13 Cenni sui modelli ARIMA I modelli autoregressivi e le medie mobili a livellamento esponenziale sono casi particolari di una classe molto generale di modelli per l’analisi delle serie storiche, i cosiddetti modelli Autoregressivi a media mobile, ARMA(p,q). Nei modelli ARMA(p,q) si ipotizza che la serie storica sia costituita da una componente prevedibile, che dipende dai valori assunti dalla serie in p periodi precedenti e da una componente casuale, funzione degli shock casuali verificatisi nei q periodi precedenti: Yt=b0+b1Yt‐1+b2Yt‐2+..+bpYt‐p+ut+c1ut‐1+c2ut‐2+…+cqut‐q Statistica Economica ‐ Laurea in Relazioni Economiche Internazionali 14 Cenni sui modelli ARIMA Una ulteriore generalizzazione dei modelli ARMA è costituita dai cosiddetti modelli ARIMA(p,d,q) – modelli autoregressivi integrati a media mobile – in cui il modello ARMA viene applicato non ai valori delle osservazioni Yt ma alle differenze di ordine d delle osservazioni, dove dYt=(Yt‐Yt‐1)‐(Yt‐1‐Yt‐2)‐…‐(Yt‐d+1‐Yt‐d) Un modello autoregressivo di ordine p, AR(p), costituisce pertanto un modello ARIMA di ordine p,0,0 ARIMA(p,0,0). Statistica Economica ‐ Laurea in Relazioni Economiche Internazionali 15