Approccio stocastico all’analisi delle serie storiche Statistica Applicata all’edilizia Lezione: approccio stocastico all’analisi delle serie storiche Orietta Nicolis E-mail: [email protected] 13 aprile 2011 Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Programma 1 Approccio stocastico all’analisi delle serie storiche Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Programma 1 Approccio stocastico all’analisi delle serie storiche Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Le serie storiche (o temporali) Una serie storica y1 , y2 , . . . , yn viene definita come la realizzazione finita di un processo stocastico Y1 , Y2 , . . . , Yn . Un processo stocastico è definito tramite la distribuzione congiunta di Y1 , ..., Yn per ogni n. In generale le Yt non sono fra di loro indipendenti e interessa la distribuzione congiunta per esempio di Yt ed Yt+1 . Modelli per serie storiche yt = f (yt−1 , yt−2 , . . .) + εt dove εt processo stocastico stazionario non direttamente osservabile Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Proprietà di un processo stocastico 1 Stazionarietà Stazionarietà in senso stretto: se la distribuzione congiunta associata ad n osservazioni rilevate ai tempi 1, 2, . . . , n è la stessa di quella associata a n osservazioni rilevate ai tempi 1 + h, 2 + h, . . . , n + h, ossia f (y1 , y2 , . . . , yn ) = f (y1+h , y2+h , . . . , yn+h ) Stazionarietà in senso debole: se valgono le seguenti proprietà: E(Yt ) = µ; σt2 = Var (Yt ) = σ 2 (costante); γ(t, t + h) = Cov (Yt , Yt+h ) = γ(h), funzione di autocovarianza. 2 Invertibilità: Un processo stocastico è invertibile se esiste una funzione lineare H(·) ed un processo ε ∼ w.n. tale che per ogni t sia Yt = H(Yt−1 , Yt−2 , . . .) + εt . Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Autocorrelazione e correlogramma Autocorrelazione ρt (h) = Cor (Yt , Yt+h ) = Cov (Yt , Yt+h ) σYt σYt+h Correlogramma L’autocorrelazione campionaria, posto ȳ ≡ 0, è definita da P P yt yt+h ∼ yt yt+h r (h) = P 2 = qP P yt 2 yt2 yt+h Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Funzione di autocorrelazione parziale La funzione di autocorrelazione parziale è data da πk = Cor (Yt , Yt+h |Yt+1 , Yt+2 , . . . , Yt+h−1 ) ed legame tra due generiche Yt e Yt+h al netto delle variabili intermedie. Può essere vista come il coefficiente φkk delle regressioni Yt = c + φ1h Yt−1 + φ2h Yt−2 + . . . + φhh Yt−h Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Calcolo della autocorrelazione parziale 1 ρ(1) .. . P(h) = ρ(1) 1 .. . ρ(2) ρ(1) .. . ... ... .. . ρ(h − 2) ρ(h − 3) .. . ρ(1) ρ(2) .. . ρ(h − 1) ρ(h − 2) ρ(h − 3) . . . ρ(1) ρ(h) 1 ρ(1) ρ(2) . . . ρ(h − 2) ρ(h − 1) ρ(1) 1 ρ(1) . . . ρ(h − 3) ρ(h − 2) .. .. .. .. .. .. . . . . . . ρ(h − 1) ρ(h − 2) ρ(h − 3) . . . ρ(1) 1 N.B. Il denominatore è il determinante della matrice di Toeplitz. Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Alcuni processi stocastici: Rumore Bianco (White Noise) Autoregressivi (AR) Media Mobile (MA) Autoregressivi a Media Mobile (ARMA) Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Processo Rumore Bianco Un processo stocastico {εt } è un rumore bianco (w.n.) se E(εt ) = 0, ∀t Var (εt ) = σε2 , ∀t Cov (εt , εt−h ) = 0, ∀t, ∀h Si indica con εt ∼ wn(0, σε2 ) ed è un processo stazionario in senso debole. Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Simulazione di un Rumore Bianco Rumore bianco (w.n.) Sample autocorrelation coefficients 0.08 3 0.06 2 0.04 1 0.02 sacf values 4 0 0 −1 −0.02 −2 −0.04 −3 −0.06 −4 0 200 400 600 800 1000 Orietta Nicolis −0.08 0 10 20 30 40 k−values Statistica Applicata all’edilizia 50 60 Approccio stocastico all’analisi delle serie storiche Processo Autoregressivo (AR) Un processo Autoregressivo di ordine 1, AR(1) è definito come Yt = c + φYt−1 + εt dove εt ∼ wn(0, σε2 ). Il processo AR è sempre invertibile. Ponendo c = 0 e indicando con BYt = Yt−1 , Yt = φYt−1 + εt = φBYt + εt (1 − φB)Yt = εt Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Il processo AR(1) è stazionario? Un processo AR(1) può essere scritto come Φ(B)Yt = εt dove Φ(B) = (1 − φB). Se le radici del polinomio caratteristico Φ(B) = 0 giacciono al di fuori del raggio di cerchio unitario, cioè |B| > 1, allora AR(1) è stazionario. Ciò accade se −1 < φ < 1. Esempio: Il processo Yt = 0.2Yt−1 + εt può essere scritto come Yt = 0.2BYt + εt , (1 − 0.2B)Yt = εt . Ponendo (1 − 0.2B) = 0, si 1 ricava B = 0.2 = 5 > 1. Quindi il processo Yt è stazionario. Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Momenti di un processo AR(1) Per un processo AR(1) si può dimostrare che: E(Yt ) = µ=0 Var (Yt ) = σε2 1 − φ2 ρh = πh = Orietta Nicolis φh ( φ 0 h=1 h>1 Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Simulazione di un AR(1) con φ = 0.5 Yt = 0.5Yt−1 + εt Simulazione AR(1) con φ=0.5 2 1.8 1.6 1.4 1.2 1 0.8 0.6 0.4 0.2 0 0 100 200 300 400 500 Orietta Nicolis 600 700 800 Statistica Applicata all’edilizia 900 1000 Approccio stocastico all’analisi delle serie storiche funzioni di autocorrelazione di un AR(1) con φ = 0.5 Sample partial autocorrelation coefficients 0.6 0.4 0.5 0.3 0.4 spacf values sacf values Sample autocorrelation coefficients 0.5 0.2 0.1 0.3 0.2 0 0.1 −0.1 0 −0.2 0 10 20 30 k−values 40 50 60 Orietta Nicolis −0.1 0 10 20 30 k−values Statistica Applicata all’edilizia 40 50 60 Approccio stocastico all’analisi delle serie storiche Simulazione di un AR(1) con φ = −0.5 Yt = −0.5Yt−1 + εt Simulazione AR(1) con φ=−0.5 1.2 1 0.8 0.6 0.4 0.2 0 −0.2 −0.4 −0.6 0 100 200 300 400 500 Orietta Nicolis 600 700 800 Statistica Applicata all’edilizia 900 1000 Approccio stocastico all’analisi delle serie storiche funzioni di autocorrelazione di un AR(1) con φ = −0.5 Sample autocorrelation coefficients Sample partial autocorrelation coefficients 0.3 0.2 0.2 0.1 0.1 0 spacf values sacf values 0 −0.1 −0.1 −0.2 −0.2 −0.3 −0.3 −0.4 −0.4 −0.5 0 10 20 30 k−values 40 50 60 Orietta Nicolis −0.5 0 10 20 30 k−values Statistica Applicata all’edilizia 40 50 60 Approccio stocastico all’analisi delle serie storiche Processo Autoregressivo di ordine p, AR(p) Un processo Autoregressivo di ordine p, AR(p) è definito come Yt = c + φ1 Yt−1 + φ2 Yt−2 + . . . + φp Yt−p + εt dove εt ∼ wn(0, σε2 ). Il processo AR(p) è sempre invertibile. Ponendo c = 0 e indicando con BYt = Yt−1 , B 2 Yt = Yt−2 , . . ., B p Yt = Yt−p , Yt = φ1 Yt−1 + φ2 Yt−2 + . . . + φp Yt−p + εt = φ1 BYt + φ2 B 2 Yt + . . . + φp B p Yt + εt (1 − φ1 B − φ2 B 2 − . . . − φp B p )Yt = εt Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Il processo AR(p) è stazionario? Un processo AR(p) può essere scritto come Φ(B)Yt = εt dove Φ(B) = (1 − φ1 B − φ2 B 2 − . . . − φp B p ). Se le radici del polinomio caratteristico Φ(B) = 0 giacciono al di fuori del raggio di cerchio unitario, cioè |B| > 1, allora AR(p) è stazionario. Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Funzione di autocorrelazione di un processo AR(p) La funzione di AUTOCORRELAZIONE di un processo AR(p) decade a 0 velocemente. La funzione di AUTOCORRELAZIONE PARZIALE di un processo AR(p) ha il seguente comportamento: ( 6= 0 h ≤ p πh = 0 h>p Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Simulazione di un AR(2) con φ1 = −0.5 e φ2 = 0.38 Yt = −0.5Yt−1 + 0.38Yt−2 + εt Sample autocorrelation coefficients Sample partial autocorrelation coefficients 0.8 0.4 0.6 0.2 0.4 0 spacf values sacf values 0.2 0 −0.2 −0.2 −0.4 −0.4 −0.6 −0.6 −0.8 −0.8 −1 0 10 20 30 40 k−values 50 60 Orietta Nicolis −1 0 10 20 30 40 k−values Statistica Applicata all’edilizia 50 60 Approccio stocastico all’analisi delle serie storiche Simulazione di un AR(3) con φ1 = 0.5, φ2 = 0.3 e φ3 = 0.15 Yt = 0.5Yt−1 + 0.3Yt−2 + 0.15Yt−3 + εt Sample partial autocorrelation coefficients 1.2 1 1 0.8 0.8 spacf values sacf values Sample autocorrelation coefficients 1.2 0.6 0.4 0.6 0.4 0.2 0.2 0 0 −0.2 0 10 20 30 40 k−values 50 60 Orietta Nicolis −0.2 0 10 20 30 40 k−values Statistica Applicata all’edilizia 50 60 Approccio stocastico all’analisi delle serie storiche Processo a Media Mobile di ordine 1, MA(1) Un processo MA(1) è definito come Yt = c + εt + θεt−1 dove εt ∼ wn(0, σε2 ). Il processo MA è sempre stazionario. Ponendo c = 0 e indicando con Bεt = εt−1 , Yt = θεt−1 + εt = θBεt + εt Yt = (1 + θB)εt Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Il processo MA(1) è invertibile? Un processo MA(1) può essere scritto come Yt = Θ(B)εt dove Θ(B) = (1 + θB). Se le radici del polinomio caratteristico Θ(B) = 0 giacciono al di fuori del raggio di cerchio unitario, cioè |B| > 1, allora MA(1) è invertibile. Ciò accade se −1 < θ < 1. Esempio: Il processo Yt = 0.2εt−1 + εt può essere scritto come Yt = 0.2Bεt + εt , Yt = (1 + 0.2B)εt . Ponendo (1 + 0.2B) = 0, si 1 ricava |B| = 0.2 = 5 > 1. Quindi il processo Yt è invertibile. Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Funzione ACF di un processo MA(1) Per un processo MA(1) si può dimostrare che: ( θ − 1+θ h=1 2 ρh = 0 h>1 La funzione di autocorrelazione parziale πh decade a 0 all’aumentare di h. Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Simulazione di un MA(1) con θ = 0.8 Yt = 0.8εt−1 + εt Sample autocorrelation coefficients Sample partial autocorrelation coefficients 0.6 0.6 0.5 0.5 0.4 0.4 spacf values sacf values 0.3 0.3 0.2 0.2 0.1 0 0.1 −0.1 0 −0.1 0 −0.2 20 40 60 k−values −0.3 0 20 40 k−values Orietta Nicolis Statistica Applicata all’edilizia 60 Approccio stocastico all’analisi delle serie storiche Simulazione di un MA(1) con φ = −0.8 Yt = −0.8εt−1 + εt Sample partial autocorrelation coefficients 0.2 0.1 0.1 0 0 spacf values sacf values Sample autocorrelation coefficients 0.2 −0.1 −0.2 −0.1 −0.2 −0.3 −0.3 −0.4 −0.4 −0.5 0 20 40 60 k−values −0.5 0 20 40 k−values Orietta Nicolis Statistica Applicata all’edilizia 60 Approccio stocastico all’analisi delle serie storiche Processo Media Mobile di ordine q, MA(q) Un processo MA(q) è definito come Yt = c + θ1 εt−1 + θ2 εt−2 + . . . + θq εt−q + εt dove εt ∼ wn(0, σε2 ). Il processo MA(q) è sempre stazionario. Ponendo c = 0 e indicando con Bεt = εt−1 , B 2 εt = εt−2 , . . ., B q εt = εt−q , Yt = θ1 εt−1 + θ2 εt−2 + . . . + θq εt−q + εt = θ1 Bεt + θ2 B 2 εt + . . . + θq B q εt + εt Yt = (1 + θ1 B + θ2 B 2 + . . . − θq B q )εt Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Il processo MA(q) è invertibile? Un processo MA(q) può essere scritto come Yt = Θ(B)εt dove Θ(B) = (1 + θ1 B + θ2 B 2 + . . . + θp B p ). Se le radici del polinomio caratteristico Θ(B) = 0 giacciono al di fuori del raggio di cerchio unitario, cioè |B| > 1, allora MA(q) è stazionario. Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Funzione di autocorrelazione di un processo MA(q) La funzione di AUTOCORRELAZIONE PARZIALE di un processo MA(q) decade a 0 velocemente. La funzione di AUTOCORRELAZIONE di un processo MA(Q) ha il seguente comportamento: ( 6= 0 h ≤ q ρh = 0 h>q Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Simulazione di un MA(2) con θ1 = 0.6 e θ2 = 0.3 Yt = 0.6εt−1 + 0.3εt−2 + εt Simulazione MA(2) con θ1=0.6 e θ2=0.3 4 3 2 1 0 −1 −2 −3 −4 0 100 200 300 400 500 Orietta Nicolis 600 700 800 Statistica Applicata all’edilizia 900 1000 Approccio stocastico all’analisi delle serie storiche Funzioni di autocorrelazione di un processo MA(2) con θ1 = 0.6 e θ2 = 0.3 Sample autocorrelation coefficients Sample partial autocorrelation coefficients 0.6 0.6 0.5 0.5 0.4 spacf values sacf values 0.4 0.3 0.2 0.3 0.2 0.1 0.1 0 0 −0.1 0 −0.1 10 20 30 40 k−values 50 60 Orietta Nicolis −0.2 0 10 20 30 40 k−values Statistica Applicata all’edilizia 50 60 Approccio stocastico all’analisi delle serie storiche Simulazione di un MA(3) con θ1 = 0.5, θ2 = 0.3 e θ3 = 0.15 Yt = 0.4εt−1 − 0.3εt−2 + 0.25εt−3 + εt Simulazione MA(3) con θ1=0.4, θ2=−0.3 e θ3=0.25 4 3 2 1 0 −1 −2 −3 −4 0 100 200 300 400 500 Orietta Nicolis 600 700 800 Statistica Applicata all’edilizia 900 1000 Approccio stocastico all’analisi delle serie storiche Funzioni di autocorrelazione di un processo MA(3)con θ1 = 0.5, θ2 = 0.3 e θ3 = 0.15 Sample autocorrelation coefficients Sample partial autocorrelation coefficients 0.2 0.25 0.15 0.2 0.15 0.1 0.1 spacf values sacf values 0.05 0 0.05 0 −0.05 −0.05 −0.1 −0.1 −0.15 −0.2 0 −0.15 10 20 30 40 k−values 50 60 Orietta Nicolis −0.2 0 10 20 30 40 k−values Statistica Applicata all’edilizia 50 60 Approccio stocastico all’analisi delle serie storiche Processo AutoRegressivo a Media Mobile di ordine 1,1, ARMA(1,1) Un processo ARMA(1, 1) è definito come Yt = c + φYt−1 + θεt−1 + εt dove εt ∼ wn(0, σε2 ). Ponendo c = 0, Yt − φYt−1 = θεt−1 + εt (1 − φB)Yt = Orietta Nicolis (1 + θB)εt Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Il processo ARMA(1,1) è invertibile e/o stazionario? Un processo ARMA(1, 1) può essere scritto come Φ(B)Yt = Θ(B)εt dove Φ(B) = (1 − φB) e Θ(B) = (1 + θB). Il processo ARMA(1,1) è STAZIONARIO se le radici del polinomio caratteristico 1 − φB = 0 giacciono al di fuori del raggio di cerchio unitario, cioè |B| > 1. Il processo ARMA(1,1) è INVERTIBILE se le radici del polinomio caratteristico 1 + θ(B) = 0 giacciono al di fuori del raggio di cerchio unitario, cioè |B| > 1. ARMA(1,1) è stazionario ed invertibile se −1 < φ < 1 e −1 < θ < 1. Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Funzione di autocorrelazione di un processo ARMA(1,1) La funzione di AUTOCORRELAZIONE, ρh di un processo ARMA(1,1) tende a zero all’aumentare di h. La funzione di AUTOCORRELAZIONE PARZIALE φh di un processo ARMA(1,1) tende a 0 all’aumentare di h. Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Simulazione di un ARMA(1,1) con φ1 = 0.7 e θ = −0.2 Yt = 0.7Yt−1 − 0.2εt−1 + εt Simulazione ARMA(1,1) con φ=0.7 e θ1=−0.2 4 3 2 1 0 −1 −2 −3 −4 −5 0 100 200 300 400 500 Orietta Nicolis 600 700 800 Statistica Applicata all’edilizia 900 1000 Approccio stocastico all’analisi delle serie storiche Funzioni di autocorrelazione di un processo un ARMA(1,1) con φ1 = 0.7 e θ = −0.2 Sample partial autocorrelation coefficients 0.6 0.5 0.5 0.4 0.4 spacf values sacf values Sample autocorrelation coefficients 0.6 0.3 0.2 0.3 0.2 0.1 0.1 0 0 −0.1 0 10 20 30 k−values 40 50 60 Orietta Nicolis −0.1 0 10 20 30 k−values Statistica Applicata all’edilizia 40 50 60 Approccio stocastico all’analisi delle serie storiche Processo AutoRegressivo a Media Mobile di ordine p,q, ARMA(p,q) Un processo ARMA(p, q) è definito come Yt = c+φ1 Yt−1 +φ2 Yt−2 +. . .+φp Yt−p +εt +θ1 εt−1 +θ2 εt−2 +. . .+θq εt−q dove εt ∼ wn(0, σε2 ). Ponendo c = 0, Yt − φ1 Yt−1 − φ2 Yt−2 − . . . − φp Yt−p = θ1 εt−1 + θ2 εt−2 + . . . + θq εt−q (1 − φ1 B − φ2 B − . . . − φp B )Yt = (1 + θ1 B + θ2 B 2 . . . + θq B q )εt Φ(B) = Θεt 2 p Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Il processo ARMA(p,q) è invertibile e/o stazionario? Un processo ARMA(p, q) può essere scritto come Φ(B)Yt = Θ(B)εt dove Φ(B) = ((1 − φ1 B − φ2 B 2 − . . . − φp B p ) e Θ(B) = (1 + θ1 B + θ2 B 2 . . . + θq B q ). Il processo ARMA(p,q) è STAZIONARIO se le radici del polinomio caratteristico Φ(B) = 0 giacciono al di fuori del raggio di cerchio unitario, cioè |B| > 1. Il processo ARMA(p,q) è INVERTIBILE se le radici del polinomio caratteristico Θ(B) = 0 giacciono al di fuori del raggio di cerchio unitario, cioè |B| > 1. Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Funzione di autocorrelazione di un processo ARMA(p,q) La funzione di AUTOCORRELAZIONE, ρh di un processo ARMA(1,1) tende a zero all’aumentare di h. La funzione di AUTOCORRELAZIONE PARZIALE φh di un processo ARMA(1,1) tende a 0 all’aumentare di h. Orietta Nicolis Statistica Applicata all’edilizia Approccio stocastico all’analisi delle serie storiche Simulazione di un ARMA(3,2) con φ1 = 0.4, φ2 = −0.3, φ3 = 0.2, θ1 = −0.3, e θ2 = 0.6 Yt = 0.4Yt−1 − 0.3Yt−2 + 0.2Yt−3 − 0.3εt−1 + 0.6εt−2 + εt Simulazione ARMA(p,q) φ1=0.4, φ2=−0.3, φ3=0.2, θ1=−0.3, e θ2=0.6 4 3 2 1 0 −1 −2 −3 −4 0 100 200 300 400 500 Orietta Nicolis 600 700 800 Statistica Applicata all’edilizia 900 1000 Approccio stocastico all’analisi delle serie storiche Funzioni di autocorrelazione di un processo un ARMA(p,q) con φ1 = 0.4, φ2 = −0.3, φ3 = 0.2, θ1 = −0.3, e θ2 = 0.6 Sample autocorrelation coefficients Sample partial autocorrelation coefficients 0.35 0.3 0.3 0.25 0.25 0.2 spacf values sacf values 0.2 0.15 0.1 0.15 0.1 0.05 0.05 0 0 −0.05 −0.05 −0.1 0 10 20 30 k−values 40 50 60 Orietta Nicolis −0.1 0 10 20 30 k−values Statistica Applicata all’edilizia 40 50 60