Regressione Non

4-Econometria, a.a. 2014-15
Capitolo 4
4-1
Modelli di regressione non lineare
4-2
Metodi di stima: Il metodo dei momenti e quello dei minimi quadrati (NLS)
4-3
Proprietà asintotiche delle stime NLS: Consistenza e asintotica normalita`
4-4
Il modello di regressione di Gauss-Newton (GNR)
4-5
Test sulle ipotesi: Il test di Wald, il test F e il test LM
4-6
Esercizio: Stima di un modello lineare con errori autocorrelati
4-7
Il test di Breusch-Godfrey (sull’assenza di autocorrelazione negli errori)
4-8
Appendice (il metodo di Newton)
4-9
La statistica di Box-Pierce e di Ljung-Box
4-10 La statistica di Durbin-Watson
4-1 Modelli di regressione non lineare
Innanzitutto va segnalato che in econometria i termini “lineare e non lineare” attribuiti ad un
modello si riferiscono ai parametri del modello (ai quali e` rivolta l’attenzione). La classe dei
modelli (econometrici) non lineari e` molto vasta, ma soltanto con l’avvento di veloci strumenti di
calcolo essi hanno ricevuto particolare attenzione.
In questo capitolo si considerano i modelli econometrici non lineari del tipo
yt = f (t , xt , β) + ut con E(ut | Ωt ) = 0 e xt ∈ Ωt ,
dove Ω t denota il complesso di informazioni disponibili all’istante t (risp. “nell’unita` sezionale
t ” se i dati sono cross-section) che influenzano yt (non solo dal punto di vista funzionale). In
definitiva si sta assumendo che la variabile economica yt abbia una dipendenza causale dalla
variabile esogena (vettoriale) x t , una dipendenza non lineare dal parametro non noto β ∈ R k e che
l’errore sia additivo; naturalmente, come in tutti i problemi econometrici, e` richiesta la
disponibilita` del processo delle osservazioni
{ yt , xt }t =1,…,n .
Per alleggerire le notazioni, nella
trattazione teorica si preferisce non evidenziare esplicitamente nel modello la dipendenza da x t , e
allora esso si scrive nella forma
yt = xt (β) + ut , con E(ut | Ωt ) = 0 e xt ∈ Ωt .( 1 )
Forme piu’ generali di modelli nonlineari si presentano nella forma m( yt , x t , β) = ut . Per una semplice introduzione al
metodo di stima GMM (Metodo generalizzato dei momenti) utilizzabile per questi (e altri) modelli, vedi il par. 6 del
cap. 5 del volume “A Guide to Modern Econometrics” di Verbeek, dove è presente anche un’interessante applicazione.
Un breve cenno a questo metodo e` presente anche in 7-5 di queste lezioni.
1
1
4-Econometria, a.a. 2014-15
E` importante sottolineare che per i modelli non lineari non sussiste in generale l’uguaglianza tra la
dimensione del vettore x t e la dimensione k del parametro β , come invece accade per i modelli
lineari, dove si ha f (t , xt , β) = x′t β .
Alcuni esempi: I primi due esempi mostrano che la non linearità (per il primo) e la linearità (per il
secondo) dei modelli economici non si trasferisce nella non linearità (per il primo) e la linearità (per
il secondo) dei modelli econometrici sui quali fare inferenza.
Modello economico non lineare: Si considera il modello economico
z = α x β yγ
(denominato modello di Cobb-Douglas, utilizzato per mettere in relazione la produzione con i
fattori produttivi capitale e lavoro). Osservato che le variabili assumono valori positivi, non è
restrittivo assumere che anche α e` positivo e allora il modello si può scrivere nella forma
log( z ) = log(α ) + β log( x) + γ log( y ) ,
che è evidentemente lineare nei parametri log(α ) , β , γ . Se sono disponibili le osservazioni sulle
variabili z, x, y , l’introduzione nell’ultimo modello di un errore additivo u , dà origine ad un
modello econometrico lineare. Si noti che la presenza dell’errore additivo u , equivale alla presenza
di un errore moltiplicativo v = eu nel modello originario. Semplici considerazioni di natura
economica rendono ragionevole la presenza di un tale tipo di errore.
Modello lineare con errori autocorrelati: Si considera un modello lineare
yt = x′t β + ut ,
e si suppone che il processo degli errori abbia la seguente semplice struttura
ut = ρ ut −1 + ε t con {ε t } ∼ i.i.d .(0, σ 2 ) e ρ < 1 .( 2 )
Ricavando ut dalla prima equazione e sostituendo nella seconda si ha:
yt = ρ yt −1 + x′t β − ρ x′t −1β + ε t , con {ε t } ∼ i.i.d .(0, σ 2 ) e ρ < 1 ,
Osservazione:
i) Se le variabili x t sono strettamente esogene (nel senso che il loro valore all’istante t è determinato all’esterno del
modello) allora il metodo dei minimi quadrati ordinari fornisce una buona stima (cioè consistente e asintoticamente
normale) di β sebbene non efficiente; se invece tra le x t c’è qualche ritardo della variabile dipendente, allora
evidentemente la stima OLS di β non è piu` consistente.
ii) L’ipotesi qui fatta sugli errori è abbastanza realistica. Per esempio nel caso in cui l’errore ut all’istante t ha due
2
componenti: l’innovazione ε t e ρ ut −1 (l’effetto residuale dell’errore all’istante t − 1 ) con 0 < ρ < 1 o equivalentemente
quando gli effetti delle innovazioni si spengono geometricamente e quindi per l’errore si ha
ut = ε t + ρε t −1 + ρ 2ε t − 2 + ,
rappresentazione che si dimostra essere equivalente a ut = ρ ut −1 + ε t
2
4-Econometria, a.a. 2014-15
che è un modello econometrico non lineare. Si noti che quest’ultimo è un modello dinamico (per la
presenza di yt −1 tra le variabili indipendenti) con gli errori che sono innovazioni (cioe`
i.i.d .(0, σ 2 ) ).
•
Modello per dati di conteggio (count-data): Se la variabile dipendente yt e` una
variabile di conteggio (e dunque assume valori in N ) e x t e` il vettore delle variabili indipendenti,
essendo evidentemente E( yt xt ) > 0 , e` poco ragionevole assumere E( yt xt ) = x′t β (quest’ultima
assume valori in tutto R ), mentre appare piu` verosimile, e non e` neppure molto restrittiva,
l’ipotesi
E( yt xt ) = exp(x′t β) ,
da cui, posto ut = yt − exp(x′t β) , si ottiene il modello non lineare
yt = exp(x′t β) + ut e E(ut xt ) = 0
(*)
(qualche ulteriore considerazione mostra che gli errori non possono essere omoschedastici).
Si segnala che c’e` una vasta letteratura sui modelli per dati di conteggio; il piu` semplice (e
anche il piu` utilizzato) e` quello in cui si assume:
yt xt ha distribuzione di Poisson con parametro λt = exp(x′t β) .
Si noti che in questo caso si ha
i)
E( yt xt ) = exp(x′t β) ;
ii)
var( yt xt ) = exp(x′t β) ;
iii) Il modello e` completamente specificato;( 3 )
e in presenza di dati cross-section il miglior metodo di stima e` quello della massima
verosimiglianza (vedi cap. 8). Tale stima e` valida anche per il modello in (*), con la usuale
avvertenza di correggere la varianza asintotica.( 4 )
top
4-2 Metodi di stima: Il metodo dei momenti e quello dei minimi quadrati (NLS)
Intanto il modello deve essere correttamente specificato quindi deve esistere un valore β ∗ di β ,
la cui corrispondente struttura del modello (o DGP) ha generato i dati a disposizione.
3
Infatti fissato il valore del parametro β , in corrispondenza di x t per simulare yt (costruire al computer una sua
osservazione) e` sufficiente simulare una distribuzione di Poisson con parametro x′t β .
4
La necessita` di costruire modelli, sempre completamente specificati, ma piu` generali di quello di Poisson, il cui
approfondimento e` rinviato ai testi specializzati, e` sorta quando si e` osservato che, nei processi in cui la variabile
dipendente e` di conteggio, e` ragionevole la presenza della sovradispersione, cioe` var( yt xt ) > E( yt xt ) . Una
evidenza empirica di tale fenomeno e` data dalla presenza di molte osservazioni uguali a 0 per yt .
3
4-Econometria, a.a. 2014-15
Il metodo dei momenti (si descrive brevemente come costruire le stime, tralasciando alcuni
dettagli). Per avviare la procedura di stima, come nel caso lineare, sono necessarie (almeno) k
variabili non correlate con ut , e dunque che appartengono a Ω t per le quali sono disponibili le
osservazioni. La scelta naturale non puo` ricadere sulle variabili x t (come per i modelli lineari, nel
qual caso la scelta e` anche ottima se gli errrori sono omoschedastici) in quanto il loro numero (in
generale) non coincide con la dimensione del parametro, ma sembra dover ricadere sulle variabili
X t (β) =
(1×k )
∂xt (β)
, in quanto il loro numero e` esattamente k , sono non correlate con ut (in quanto
∂β
funzione di x t con E(ut | xt ) = 0 ) ed infine sono la scelta naturale nei modelli lineari (infatti si ha
X t (β) =
∂ [ x′t β ]
∂β
= x′t )( 5 ). Pero` nel caso non lineare, queste variabili presentano l’inconveniente di
dipendere da β , in tal caso non sono disponibili le osservazioni. Questo ostacolo puo` essere
superato fissando aritrariamente un valore per β , ma si intuisce che tale valore sarebbe preferibile
sceglierlo il piu` vicino a β ∗ . Si fa vedere che cio` si ottiene con la seguente procedura iterativa: Si
fissa β̂0 (come al solito, per tali procedure, con qualche accorgimento) e con il metodo dei
momenti, utilizzando le variabili X t (β 0 ) (per le quali sono ora disponibili le osservazioni) si trova
la stima β̂1 , che prendera` il posto di β̂0 , e poi si prosegue allo stesso modo; nelle procedure
numeriche fino a raggiungere la soglia prefissata di errore..
Il metodo (di stima) dei minimi quadrati non lineari (NLS). Si considera la funzione
Qn (β) =
1 n
∑ ( yt − xt (β))2
n t =1
denominata come al solito “funzione obiettivo”.
Definizione: L’unico punto di minimo assoluto della funzione Qn (β) (se esiste) dicesi stimatore dei
minimi quadrati non lineare (NLS) di β e si denota con il simbolo βˆ NLS (o β̂ come si fara` nel
seguito, se non c’è possibilità di equivoco).
Osservazione:
•
Lo stimatore β̂ esiste se per ogni n − pla di osservazioni
{ yt , xt }t =1,…,n
la funzione Qn (β)
(questa volta) a valori reali ha un unico punto di minimo assoluto.
5
E` evidente che ci sono inummerevoli altre scelte per avviare la procedura di stima; ma si mostra che la scelta qui
chiamata naturale e` (in un certo senso) la migliore almeno asintoticamente, salvo che non siano disponibili altre
informazioni.
4
4-Econometria, a.a. 2014-15
•
Lo stimatore β̂ (se esiste) è soluzione dell’equazione non lineare
⎛
⎞ n
⎜ ∂Qn (β) = 0 ⇔ ⎟ X ′(β)( y − x (β)) = 0 ;
t
t
t
⎜ ∂β
⎟∑
⎜ (1×k )
⎟ t =1 ( k ×1)
⎝
⎠
•
Per (lo stimatore) β̂ generalmente non e` disponibile una rappresentazione analitica esplicita,
ma per le applicazioni servono soltanto le sue proprietà e il suo valore nel campione a disposizione
(e dunque la stima);
•
La stima β̂ (se esiste) deve essere individuata con metodi numerici; per esempio la procedura
descritta precedentemente (quindi i due metodi forniscono la stessa stima), ma piu` avanti saranno
presentate altre procedure piu` efficienti dal punto di vista numerico e piu` interessanti per le
conseguenze teoriche.
•
Le condizioni che assicurano l’esistenza di β̂ per ogni fissato n si dicono condizioni di
identificabilità per campioni finiti (che in questo caso non sono conseguenza delle condizioni per
la asintotica identificabilita come invece accade nei modelli lineari).
top
4-3 Proprietà asintotiche degli stimatori NLS: Consistenza e asintotica normalita`
Soltanto per rendere piu` scorrevole l’esposizione si fa riferimento al caso in cui i dati siano del
tipo time-series, ma i risultati ottenuti sono validi anche nel caso di dati cross-section.
Proposizione 1 (consistenza): Si denota ancora con β* il valore vero (naturalmente non noto) del
parametro β e si assume
i)
β̂ esiste per n sufficientemente grande (e dunque il modello e` identificabile al finito);
ii)
Il processo { yt , xt } è stazionario ed ergodico;
iii) Il modello e` asintoticamente identificabile, cioe` posto
1 n
X t′(β)( yt − xt (β)) [ = E( X t′(β)( yt − xt (β))) ]
∑
n →∞ n
t =1
α (β) = p lim
(l’esistenza del limite segue da ii)) β* è l’unica soluzione dell’equazione α (β) = 0 . ( 6 )
p
Allora lo stimatore β̂ e` consistente (cioe` βˆ → β* ).
Un cenno della dimostrazione: Si prova dapprima che
p
βˆ → β
Nel caso di modelli lineari l’asintotica identificabilità implica l’identificabilità (finita), implicazione non vera nel
caso di modelli non lineari.
6
5
4-Econometria, a.a. 2014-15
(la prova qui non è riportata e non è proprio banale). Passando al limite, nella uguaglianza
1 n
∑ X t′(βˆ )( yt − xt (βˆ )) = 0 , si ha α (β ) = 0 , donde per l’asintotica identificabilita` del modello segue
n t =1
che β = β* e quindi l`asserto.
Proposizione 2 (asintotica normalità e stima della varianza asintotica): In aggiunta alle
precedenti ipotesi i), ii), iii) di proposizione 1, si assume
iv)
E(ut | xt , xt −1 ,… , ut −1 ,…) = 0 (assicura insieme alla condizione (ii) la validità` del teorema del
limite centrale quando se ne presentera` l’occasione);
v)
la matrice Σ x = E ⎡⎣ X t′(β* ) X t (β* ) ⎤⎦ è invertibile.
Allora si ha:
ˆ ;
n (βˆ − β* ) → N (0, Avar(β))
d
per una rappresentazione di Avar(βˆ ) e di una sua stima consistente (quest’ultima essenziale per le
applicazioni) si rimanda alla 1) e 2) che seguono.
Dimostrazione: Dalla formula di Taylor del prim’ordine, di punto iniziale β* per la funzione
∂Qn (β)
, si ha (per un β appartenente al segmento congiungente β* e β̂ , e dunque anch’esso, al pari
∂β′
di β̂ , convergente in probabilita` a β* , per n → ∞ )
∂Qn (βˆ ) ∂Qn (β* ) ∂ 2Qn (β) ˆ *
(β − β ) ;
=
+
(0 =)
∂β′
∂β′
∂β′∂β
( k ×1)
ora
•
d
⎛
∂Qn (β* ) ⎞ 1 n
=⎟
X t′(β* )ut →N (0, Σux ) con Σux = E ⎡⎣ut2 X t′(β* ) X t (β* ) ⎤⎦ ;
∑
⎜ (−1/ 2) n
∂β′
⎝
⎠ n t =1
•
∂ 2Qn (β)
1 n ∂
(1/ 2)
= − ∑ [ X t′(β)( yt − xt (β)) ] =
∂β′∂β
n t =1 ∂β
β =β
=−
p
1 n ∂X t′(β)
1 n
( yt − xt (β)) + ∑ X t′(β) X t (β) → 0 + Σ x
∑
n t =1 ∂β
n t =1
⎡ ∂X ′(β) ⎤
ut ⎥ = 0 ) e
(il primo addendo converge a zero per la legge dei grandi numeri, essendo E ⎢ t
∂
β
⎣
⎦
quindi si ha:
1)
⎛ ⎡ ∂ 2Q (β) ⎤ −1 ⎡
∂Qn (β* ) ⎤ ⎞ d
n
ˆ
ˆ
⎜
n (β − β 0 ) = ⎢ −
n
⎥ ⎟ → N (0, Avar(β)) ;
⎜ ⎣ ∂β′∂β ⎥⎦ ⎢⎣
∂β′ ⎦ ⎟
⎝
⎠
6
4-Econometria, a.a. 2014-15
con
⎧
Avar(βˆ ) = Σ −x1Σux Σ −x1 ;
⎪
−1
−1
2) ⎨
⎡1 n
⎤ ⎡1 n 2
⎤ ⎡1 n
⎤ .
ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
′
′
′
ˆ
=
X
X
u
X
X
X
X
β
β
β
β
β
β
Avar(
)
(
)
(
)
(
)
(
)
(
)
(
)
β̂
⎪
t
t
t
⎢ ∑ t
⎥ ⎢ ∑ t t
⎥ ⎢n ∑ t
⎥
⎣ n t =1
⎦ ⎣ n t =1
⎦ ⎣ t =1
⎦
⎩
Osservazione:
i)
Avar(βˆ ) (che converge in probabilità a Avar(βˆ ) ) dicesi stimatore di White (o consistente per
l’eteroschedasticita` (HC)) della varianza. La prova della convergenza e` del tutto analoga alla
prova della consistenza dello stimatore di White per la varianza degli stimatori OLS nei modelli
lineari.
ii) Stima di Avar(βˆ ) quando gli errori sono omoschedastici (cioe` E(ut2 | Ωt ) = σ 2 ): In questo
caso si ha Σux = σ 2 Σ x , e allora
⎡1 n
⎤
Avar(βˆ ) = σ 2 Σ −x1 e Avar(βˆ ) = s 2 ⎢ ∑ X t′(βˆ ) X t (βˆ ) ⎥
⎣ n t =1
⎦
con s 2 =
−1
1 n 2
1 n 2
uˆt (o anche s 2 =
∑
∑ uˆt che spesso è preferito).
n t =1
n − k t =1
iii) Talvolta, anche in presenza di autocorrelazione negli errori, si puo` utilizzare il teorema del
limite centrale; in tal caso, come per i modelli lineari, si utilizza come stimatore della varianza
asintotica di β̂ lo stimatore di Newey e West, indicato con la sigla HAC (Heteroskedasticity and
Autocorrelation Consistent). E` importante notare che, come nei modelli lineari, la presenza di
autocorrelazione negli errori esclude la possibilita` che tra le variabili indipendenti ci possa essere
qualche ritardo di yt (non sarebbe piu` valida l’ipotesi E(ut | xt ) = 0 , essenziale per la consistenza
dello stimatore).
top
4-4 Il modello di regressione di Gauss-Newton (GNR)
Data la struttura della funzione obiettivo, una utile procedura numerica per la minimizzazione e`
il metodo di Newton o quasi-Newton che e` richiamato in 4-8. Qui si descrive la procedura per
alcune interessanti conseguenze di natura statistica.
Si pone
⎛ ∂Q(β) ⎞
2 n
=
−
g(β) ⎜ =
∑ X t′(β)( yt − xt (β)) ,
⎟
∂β′ ⎠
n t =1
( k ×1) ⎝
7
4-Econometria, a.a. 2014-15
⎛ ∂ 2Q(β) ⎞
⎞
2 n ⎛ ∂X ′(β)
= − ∑⎜ t
H (β) ⎜ =
( yt − xt (β)) − X t′ (β) X t (β) ⎟ .
⎟
∂β∂β′ ⎠
n t =1 ⎝ ∂β
( k ×k ) ⎝
⎠
Importanti considerazioni (da i a vii):
Al fine di costruire una sequenza minimizzante di β̂ (e dunque una successione ( β j ) che
i)
j
converge a β̂ ), si osserva che è possibile utilizzare il metodo Quasi-Newton con la matrice
D(β) =
2 n
∑ X t′ (β) X t (β) (che è certamente definita positiva se è non singolare), in quanto l’altro
n t =1
addendo di H (β) per β = βˆ converge in probabilità a 0 per n → ∞ .
In tal modo non e` necessario il calcolo delle derivate seconde della funzione nonlineare xt (β) .
Per evitare l’eventuale sigolarita` di D(β) , si sceglie c > 0 opportunamente e si considera
D(β) + 2cI ; la procedura minimizzante dicesi di Marquardt.
ii)
Costruzione della sequenza minimizzante: Fissato β 0 (se possibile non molto distante da
β̂ , che però non è noto) si ha (per ogni j ≥ 0 ):
β j +1
(
)
−1
⎡2 n
⎤ ⎡ 2 n
⎤
= β j − ⎡⎣ D(β j ) ⎤⎦ g(β j ) = β j − ⎢ ∑ X t′(β j ) X t (β j ) ⎥ ⎢ − ∑ X t′(β j )( yt − xt (β j )) ⎥
⎣ n t =1
⎦ ⎣ n t =1
⎦
−1
−1
⎡1 n
⎤ ⎡1 n
⎤
= β j + ⎢ ∑ X t′(β j ) X t (β j ) ⎥ ⎢ ∑ X t′(β j )( yt − xt (β j )) ⎥
⎣ n t =1
⎦ ⎣ n t =1
⎦
= β + bˆ
j
j
con
−1
⎡1 n
⎤ ⎡1 n
⎤
bˆ j = ⎢ ∑ X t′(β j ) X t (β j ) ⎥ ⎢ ∑ X t′(β j )( y − xt (β j )) ⎥ ,
⎣ n t =1
⎦ ⎣ n t =1
⎦
iii) Importante: Dall’esame della rappresentazione di bˆ j (l’addendo che aggiorna la
procedura per ricorrenza) si vede immediatamente che esso è la stima OLS del parametro b del
modello di regressione lineare
(*)
( yt − xt (β j )) = X t (β j )b + resid , per t = 1,… , n
e dunque bˆ j = bˆ OLS del precedente modello.
iv) Definizione: Il modello di regressione (*) dicesi Modello (ausiliario) di regressione di
Gauss-Newton. (In esso yt − xt (β j ) è la variabile dipendente e X t (β j ) è il vettore riga delle k
variabili indipendenti; per tali variabili sono disponibili n osservazioni quando e` noto il valore di
8
4-Econometria, a.a. 2014-15
β j ).
v)
La stima del modello di regressione lineare di Gauss-Newton per β = βˆ (= βˆ NLS ) :
Essendo per definizione
1 n
∑ X t′(βˆ )( yt − xt (βˆ )) = 0 ,
n t =1
considerato il modello di Gauss-Newton in β̂ , cioe` ( yt − xt (βˆ )) = X t (βˆ )b + resid , il metodo OLS
fornisce le stime
bˆ = ...... = 0 e Avar(bˆ ) = …… = Avar(βˆ ) .
Osservazione (puo` essere omessa): Se si stima il modello di Gauss-Newton utilizzando un altro
1 n
X t′(β)( yt − xt (β)) = 0 , segue il precedente
∑
n →∞ n
t =1
stimatore consistente β di β , allora, essendo p lim
risultato con la seguente poco significativa modifica:
p
bˆ → 0 e Avar(bˆ ) = …… = Avar(β) .
(
)
vi) Quando si interrompe la procedura iterativa (al passo j ), si ha βˆ NLS ≈ β j +1 = β j + bˆ j ,
allora se si effettua un ulteriore passo, dal precedente punto v) segue immediatamente che la stima
della varianza asintotica di bˆ j +1 è la stima della varianza asintotica di βˆ NLS .
vii) Se gli errori sono omoschedastici (si prova che) lo stimatore NLS è asintoticamnete
efficiente (nel senso che ha la minore varianza asintotica) nella classe degli stimatori costruiti con il
metodo dei momenti. Si prova inoltre che se si avvia la procedura iterativa con uno stimatore
n − consistente (non efficiente), al primo passo si ottiene uno stimatore asintoticamente efficiente
di β (come lo stimatore NLS ), genralmente diverso da βˆ NLS , denominato stimatore efficiente ad
un passo. Quest’ultimo risultato ha soltanto un interesse teorico; per individuare i valori numerici
delle stime si utilizzano sempre piu` iterazioni.
Osservazione: Anche nei modelli non lineari eventuali informazioni sulla eteroschedasticita`
possono essere utilizzate per costruire stimatori piu` efficienti. L’argomento e` discusso nel capitolo
5 per i modelli lineari, ma l’adattamento ai modelli non lineari non presenta alcuna difficolta`
aggiuntiva.
top
4-5 Test sulle ipotesi: Il test di Wald, il test F e il test LM
Sia yt = xt (β) + ut un modello econometrico non lineare correttamente specificato, con le usuali
9
4-Econometria, a.a. 2014-15
ipotesi sui processi
{ yt , xt }
e
{ut } ,
che assicurino l`esistenza dello stimatore NLS
e la sua
asintotica normalita`. Dal punto di vista teorico la costruzione di test (con validità asintotica)
sull’ipotesi del tipo H 0 : a(β) = 0 non presenta particolari difficoltà; gli argomenti utilizzati in 3-10
continuano ad essere validi.
Qui si assume che gli errori siano omoschedastici e si considera l’ipotesi lineare del tipo
H 0 : β 2 = 0 , essendo β = (β1 , β 2 ) ; si mostra come il test LM ha una realizzazione relativamente
semplice, che si semplifica ulteriormente quando il modello e` lineare se l’ipotesi H 0 e` vera.
Soltanto per ragioni di completezza si descrivono anche i test di Wald (ma qui non è necessaria
l’ipotesi di omoschedasticità) e il test asintotico (F) di Fisher.
Se si denota con R il modello ristretto e con U il modello non ristretto, l’ipotesi statistica
assegnata puo` essere scritta nella seguente forma:
⎧ H 0 : yt = xt (β1 , 0) + ut (Modello R )
.
⎨
⎩ H1 : yt = xt (β1 , β 2 ) + ut (Modello U)
1) Il Test di Wald (come e` noto si costruisce utilizzando soltanto il modello non-ristretto U): Sia
β̂2 la stima di β 2 del modello U e var(βˆ 2 ) la stima della sua varianza. La statistica di Wald per
l’ipotesi H 0 è la distanza pesata da 0 di β̂2 , con peso l’inversa della stima della sua varianza e
dunque
(
W = βˆ ′2 var(βˆ 2 )
)
−1
(
⎛
βˆ 2 ⎜ = nβˆ ′2 Avar(βˆ 2 )
⎝
)
−1
⎞
βˆ 2 ⎟ .
⎠
Con gli usuali argomenti si prova che (sempre nell’ipotesi H 0 ) si ha
W → χ k22 ,
d
e quest`ultima proprietà consente di costruire un test con validità asintotica sull’ipotesi assegnata.
2) Il test asintotico (F) di Fisher (è necessario stimare entrambi i modelli): Siano USSR e RSSR
le somme dei quadrati dei residui dei modelli U e R rispettivamente, allora non è difficile provare
che per la usuale variabile
F=
( RSSR − USSR ) / k2 ,
USSR /(n − k )
in presenza di errori omoschedastici, si ha k2 F → χ k22 , donde con la usuale procedura si costruisce
d
il test con livello di significatività assegnato.
10
4-Econometria, a.a. 2014-15
3) Test LM (utilizza il modello di regressione di Gauss-Newton e il modello ridotto): Qui ci si
limita a descrivere la costruzione del test. Si prova che la statistica utilizzata, detta statistica LM, e`
la distanza pesata da 0 del moltiplicatore di Lagrange (o equivalentemente la distanza pesata da 0
del gradiente della funzione obiettivo calcolato nella stima del modello ridotto).
Si osserva innanzitutto che il modello di regressione di Gauss Newton per il modello U ha la
seguente rappresentazione
yt − xt (β1 , β 2 ) = X 1t (β1 , β 2 )b1 + X 2t (β1 , β 2 )b 2 + resid
essendo X it (β) =
∂xt (β)
per i = 1, 2 .
∂βi
Per costruire la stima efficiente ad un passo di β è richiesta una sua stima
n − consistente,
che puo` essere costruita con il modello R, in quanto nell’ipotesi H 0 si ha β = (β1 , 0) ); tale stima
sia β = (β1 , 0) . Il modello di Gauss- Newton diventa allora
yt − xt (β1 , 0) = X1t (β1 , 0)b1 + X 2t (β1 , 0)b 2 + resid
(*)
e osservato che evidentemente sussiste la seguente equivalenza
H 0 : β 2 = 0 ⇔ H 0′ : b 2 = 0 ,
il test sull’ipotesi H 0 : β 2 = 0 diventa un test su un ipotesi lineare sul parametro di un modello
lineare che si costruisce senza particolari difficoltà. E` evidente che la procedura si semplifica
ulteriormente se il modello R dovesse essere lineare.( 7 )
top
4-6 Esercizio: Stima di un modello lineare con errori autocorrelati
E’ assegnato il modello
⎧ yt = x′t β + ut
Modello 1: ⎨
2
⎩ut = ρ ut −1 + ε t , con ε t ∼ i.i.d .(0, σ ), 0 < ρ < 1 e t = 1, 2,…
e si suppone che il processo { yt , xt } sia stazionario ed ergodico e che sia valida qualche versione
del teorema del limite centrale quando se ne presenta la necessita` (si noti che non si sta facendo
nessuna ipotesi sulla presenza o meno di correlazione tra x t e ut ).
7
Nel modello (*) le osservazioni sulla variabile dipendente sono i residui costruiti utilizzando il modello ridotto; e`
possibile provare che la statistca F per testare l’ipotesi H 0′ : b 2 = 0 e` asintoticamente equivalente alla statistica nR 2
(piu` avanti l’affermazione e` provata nel caso in cui il modello ridotto e` lineare) ed inoltre che quest’ultima e`
esattamente la statistica LM.
11
4-Econometria, a.a. 2014-15
Osservazione:
•
L’ipotesi
ρ < 1 e` di fondamentale importanza; se cosi` non fosse, il processo
{ut } ( = { yt − x′t β}) , e di conseguenza { yt , xt } , non sarebbe stazionario ed ergodico.
•
Il processo {ut } e` definito a meno della condizione iniziale u0 , ma questa come si vedra` e`
ininfluente sulle conclusioni.
•
Se tra le variabili indipendenti del modello lineare yt = x′t β + ut non ci sono ritardi di yt , il
metodo OLS fornisce (generalmente) stime consistenti e asintoticamente normali (con la stima
HAC della varianza asintotica), ma non (asintoticamente) efficienti. Se invece tra le variabili
indipendenti c’e` yt −1 allora nel modello ci sono variabili endogene (in questo caso si ha
evidentemente E(ut yt −1 ) ≠ 0 ) e allora le stime OLS non sono piu` consistenti (alcuni metodi di
stima utilizzabili quando alcune variabili indipendenti sono endogene sono descritti nel capitolo 7).
Il modello 1 ha le seguenti rappresentazioni equivalenti:
Modello 2:
yt = ρ yt −1 + x′t β − ρ x′t −1β + ε t con ε t ∼ i.i.d .(0, σ 2 ) , 0 < ρ < 1 e t = 1, 2,… , ;
1) ⇒ 2) Si utilizza la prima equazione del modello 1 per rappresentare ut (e quindi ut −1 ) e si
sostituisce nella seconda equazione.
2) ⇒ 1) Si pone ut = yt − x′t β e allora ……………. .
⎧ y = ρ yt −1 + x′t β + x′t −1γ + ε t
con ε t ∼ i.i.d .(0, σ 2 ) , 0 < ρ < 1 e t = 1, 2,… .
Modello 3 (ristretto): ⎨ t
⎩ γ = − ρβ
La sua equivalenza con il modello 2 è evidente.
Osservazione: Il modello 3 non ristretto consente di costruire stimatori
n − consistenti per i
parametri ρ e β , ma essi sono (prevedibilmente) non efficienti in quanto non utilizzano tutte le
informazioni disponibili.
Costruzione di una stima asintoticamente efficiente dei parametri ρ e β : Il modello 2 è non
lineare e per comodita` e` scritto nella forma
⎧ yt = xt ( ρ , β) + ε t
.
⎨
⎩ xt ( ρ , β) = ρ yt −1 + x′t β − ρ x′t −1β
Si osserva che
∂xt ( ρ , β)
∂xt ( ρ , β)
= yt −1 − x′t −1β e
= x′t − ρ x′t −1 , allora il modello (ausiliario) di
∂ρ
∂β
12
4-Econometria, a.a. 2014-15
Gauss-Newton, yt − xt ( ρ , β) =
∂xt ( ρ , β)
∂x ( ρ , β)
r+ t
b + resid , ha la seguente rappresentazione
∂ρ
∂β
yt − x′t β − ρ yt −1 + ρ x′t −1β = ( yt −1 − x′t β)r + (x′t − ρ x′t −1 )b + resid .
(*)
•
La procedura ricorsiva per la costruzione di ρˆ NLS e βˆ NLS : Si fissa arbitrariamente β ≡ β 0
e ρ ≡ ρ 0 (meglio se vicini ai valori veri; generalmente si considerano le loro stime
n − consistenti
se disponibili) e si considera la procedura iterativa
ρ j +1 = ρ j + rˆj e β j +1 = β j + bˆ j ,
dove rˆj e bˆ j sono le stime OLS del modello (*) nel quale si e` posto β = β j e ρ = ρ j .
Osservazione:
•
Se nella precedente procedura si considera ρ 0 = ρˆ OLS e β 0 = βˆ OLS , ottenute dal modello 3 non
(
)
ristretto, allora ( ρ1 = ) ρ1 = ρ0 + r̂0 e β1 = β1 = β 0 + bˆ 0 sono le stime efficienti ad un passo. Come
precedentemente segnalato queste stime hanno principalmente un interesse teorico.
•
La stima della varianza asintotica dello stimatore ( ρ1 , β1 ) si ottiene effettuando un ulteriore
passo con il modello di regressione di Gauss-Newton (*) (vedi il punto (v) in 4-4).
top
4-7 Il test di Breusch-Godfrey (sull’assenza di autocorrelazione negli errori)
La presenza di autocorrelazione negli errori di un modello lineare spesso (non sempre) e` un
segnale di non corretta specificazione del modello; si intuisce allora l’importanza dei test che
possano essere in grado di rivelarne la presenza.
Alla fine degli anni 70 del secolo scorso, quando Breusch e Godfrey separatamente
presentarono il test, a cui e` stato dato il loro nome, erano disponibili test per rilevare la presenza di
autocorrelazione nei processi stocastici (vedi 4-9 e 4-10). La procedura fino a quel momento (e
ancora oggi) adottata, per affrontare il problema inizialmente posto, era quella di utilizzare i residui
come osservazioni del processo degli errori, procedura che trovava anche una sua giustificazione
teorica per modelli in cui le variabili indipendenti erano strettamente esogene. Il test che si passa a
costruire ha una validita` piu generale, consente per esempio la presenza dei ritardi della variabile
dipendente tra le variabili indipendenti.
Costruzione del test: Sia
{ yt , xt }
un processo stazionario ed ergodico, yt = x′t β + ut un modello
⎧ H 0 : {ut } ∼ i.i.d .(0, σ 2 )
lineare e per un fissato p ≥ 1 si considera l’ipotesi ⎨
, dove
⎩ H1 : ρi ≠ 0 per almeno un 1 ≤ i ≤ p
13
4-Econometria, a.a. 2014-15
ρi = corr(ut , ut −i ) .
Osservazione:
•
Come si puo` notare per fissare l’ipotesi e` richiesta la scelta di un valore di p . L’esame
del grafico di ACF dei residui puo` suggerire la scelta di tale valore che comunque non va preso
grande (in prima istanza l’esame dell’ACF potrebbe far apparire evidente la presenza di
autocorrelazione negli errori, nel qual caso l’esito del test e` certamente scontato);
•
si puo` provare che per la costruzione del test, che non va dimenticato ha soltanto validita`
asintotica, non e` restrittivo assumere che ut = α1ut −1 +
+ α p ut − p + ε t e {ε t } ∼ i.i.d .(0, σ 2 ) (con le
restrizioni sui coefficienti che rendano stazionario il processo {ut } ) e allora l’ipotesi considerata
⎧ H 0 : (α1 ,…, α p )= 0
diventa ⎨
;
⎩ H1 : (α1 , …, α p ) ≠ 0
•
Per semplicita` si considera il caso in cui e` p = 1 , ma non c’e` alcuna difficoltà` aggiuntiva
nel considerare il caso generale.
⎧ y = x′t β + ut
Sia dunque ut = ρ ut −1 + ε t con ρ < 1 , e allora il modello diventa ⎨ t
, che e`
⎩ut = ρ ut −1 + ε t
esattamente il Modello 1 di 4.6 , (che ha come rappresentazione equivalente il Modello 2), mentre
l’ipotesi e` H 0 : ρ = 0 .
Il test LM per quest’ultima ipotesi e` quello che prende il nome di test di Breusch-Godfrey e
che ora si passa a descrivere brevemente, per maggiori dettagli vedi 2 in 4-5.
Si osserva innanzitutto che, se l’ipotesi H 0 e` vera, una stima consistente di (β, ρ ) è (βˆ , 0) ,
essendo β̂ la stima OLS del modello lineare yt = x′t β + ut e allora il modello GNR in (βˆ , 0) e`
( yt − x′t βˆ ) = x′t b + ( yt −1 − x′t −1βˆ )r + resid (⇔ uˆt = x′t b + uˆt −1r + resid )
e l’ipotesi in esame e` equivalente a H 0 : r = 0 per quest`ultimo modello lineare, per la cui verifica
sono utilizzabili le procedure standard (per esempio il test di Wald).
Osservazione:
a) Una osservazione sulla costruzione del test sull’ipotesi H 0 : Si considera la statistica di Wald
che ha la seguente rappresentazione W (= 1F ) =
[ RSSR − USSR ]
USSR / n − k − 1
(cfr. 2-5 anche per il significato dei
simboli) e si osserva che, essendo il vettore û ortogonale alla matrice delle osservazioni, nella
14
4-Econometria, a.a. 2014-15
regressione del modello ridotto uˆt = x′t b + resid , si ha RESS = 0 e quindi non solo e` TSS = RSSR
ma
TSS
e` una stima consistente della varianza.
n
In definitiva si ha W =
[TSS − USSR ]
USSR /(n − k − 1)
, che ha distribuzione asintotica χ12 . Il ruolo del
denominatore nella precedente rappresentazione e` quello di essere stimatore consistente della
varianza (costruito con il modello non ridotto) che puo` essere sostituito con
TSS
(stimatore
n
consistente della varianza costruito con il modello ridotto). Si ottiene in tal modo la statistica
[TSS − USSR ]
TSS / n
( = nR )
2
che produce un test asintoticamente equivalente a quello di Wald.
Se nel modello originario e` presente l’intercetta, essendo la somma dei residui uˆt nulla, si ha
nR 2 = nRc2 e Rc2 e` presente nell’output della stima del modello uˆt = x′t b + uˆt −1r + resid .
b) Descrizione della costruzione del test di Breusch-Godfrey:
Primo Step: Si stima con il metodo OLS il modello yt = x′t β + ut e sia {uˆ}t =1,…,n la serie dei
residui
Secondo Step: Si sceglie un intero p > 1 (suggerito eventualmente dalla funzione di
autocorrelazione empirica della serie dei residui);
Terzo Step: Si considera il modello ausiliario uˆt = x′t b + α1uˆt −1 +
+ α p uˆt − p + resid , il valore
R 2 della stima OLS (fornito da qualunque software) e si rifiuta l’ipotesi H 0 a livello di
significativita` α se e` nR 2 > χ p2 ,1−α .
top
4-8 Appendice (il metodo di Newton)
Sia Q(β) una funzione a valori reali definita in un sottinsieme di R k e β 0 un punto (del tutto
arbitrario) nel suo dominio di definizione e si consideri il polinomio di Taylor del second’ordine di
Q(β) di punto iniziale β 0
1
Q* (β) = Q(β 0 ) + g 0 (β − β 0 ) + (β − β 0 )′H 0 (β − β 0 )
2
dove si è posto
g0 =
∂Q (β 0 )
( = ∇Q(β0 )′ ) (vettore colonna delle derivate parziali);
∂β′
15
4-Econometria, a.a. 2014-15
H0 =
∂ 2Q(β 0 )
(matrice hessiana di Q(β) in β 0 e` una matrice quadrata di ordine k ).
∂β∂β′
Osservazione:
1) Se la matrice H 0 è definita positiva, la funzione Q* (β) ha un unico punto di minimo che
soddisfa la condizione del prim’ordine 0 = g 0 + H 0 (β − β 0 ) , la cui (unica) soluzione è evidentemente
β1 = β 0 − H 0−1g 0 .
2) Costruzione di una successione “estremante” (costituita da punti di minimo di funzioni
ausiliarie e candidata a convergere verso l’eventuale punto di minimo) della funzione Q(β) :
⎧β0
∂ 2Q(βi )
∂Q (βi )
=
H
,
,
,
=
g
⎨
i
i
−1
′
′
β
β
H
g
=
−
∂
∂
β
∂
β
β
−
−
1
n
n
n
n
−
1
1
⎩
che esiste se la matrice H i e` invertibile per ogni i .
Proposizione 1:
i)
Se la funzione Q(β) è quadratica (ha un solo punto di minimo) allora al primo passo si ottiene
il punto di minimo;
ii) Se la funzione Q(β) è approssimativamente quadratica (per esempio somma di funzioni
quadratiche) allora la convergenza della procedura ricorsiva verso il punto di minimo (esistente) è
rapida.
iii) Se la funzione Q(β) è (globalmente) convessa esiste un unico punto di minimo e la successione
estremante converge verso esso (e quindi è una successione minimizzante).
iv) Se la funzione Q(β) non è globalmente convessa, pur avviando la procedura con β 0 vicino al
punto di minimo (supposto esistente), può accadere che qualcuna delle matrici Hessiane H j sia non
definita positiva e allora la procedura per ricorrenza si può bloccare oppure la successione può
allontanarsi dal punto di minimo. Per porre rimedio a tale inconveniente, si sostituisce, nella
costruzione della sequenza β j , la matrice H j con una sua buona approssimazione D j che però sia
definita positiva. Tale procedura è prende il nome di metodo quasi-Newton.
top
4-9 La statistica di Box-Pierce e di Ljung-Box
Un problema di un qualche interesse in econometria (e non solo) è quello di testare l’ipotesi di
indipendenza (o più in generale l’assenza di autocorrelazione) in un processo stazionario o anche
quello di rilevare la presenza di autocorrelazione negli errori di un modello di regressione che
16
4-Econometria, a.a. 2014-15
spesso e` un segnale di non corretta specificazione( 8 ) (una risposta a questo secondo problema e`
stata data nel paragrafo 4-7 con la costruzione del test di Breusch-Godfrey proposto separatamente
dai due autori nel 1978, il quale è valido in contesti sufficientemente generali).
Alcuni esempi di serie economiche che generalmente si assumono non autoccorrelate:
1) Per molto tempo (e ancora oggi in varie questioni teoriche) si è assunto che i rendimenti (di un
titolo, di un mercato, …) sono indipendenti (ipotesi che per la verità si è rivelata per nulla
ragionevole).
2) Hall formulò l’ipotesi che il processo dei consumi aggregati {ct } è una martingala (cioè che la
migliore previsione sui consumi all’istante t siano i consumi all’istante t − 1 ) e dunque che il
processo {ct − ct −1} sia una differenza martingala.
Qui si costruisce un test sull’ipotesi (nulla) che un processo stazionario (con qualche proprietà
che sara` precisata in seguito) sia non autocorrelato. A tal fine si premette la seguente:
Proposizione 1 – Sia {ε t }t ≥1 una differenza martingala strettamente stazionaria, ergodica e tale che
E(ε t2 | ε t −1 , ε t − 2 ,… , ε1 ) = σ 2 (ipotesi di omoschedasticità condizionata)( 9 ). Allora fissato p ≥ 1 e
posto γˆ = (γˆ1 ,… , γˆ p )′ e ρˆ = ( ρˆ1 ,… , ρˆ p )′ , (con γˆs =
γˆ
1 n
ε t ε t − s e ρˆ s = s per s ≥ 0 ) si ha:
∑
n t =s
γˆ0
n γˆ → N (0; σ 4 I p ) e
d
nρˆ → N (0; I p ) .
d
Dimostrazione: Per semplicità si esamina soltanto il caso p = 1 ; non ci sono difficoltà aggiuntive
se e` p > 1 . Posto gt = ε t ε t −1 , si ha:
•
{ gt } è un processo stazionario ed ergodico (è evidente);
•
{ gt } è una differenza martingala. Infatti
E( gt | ε t −1 , ε t − 2 ,…) = E(ε t ε t −1 | ε t −1 , ε t − 2 ,…) = E(ε t | ε t −1 , ε t − 2 ,…)ε t −1 = 0
•
E( gt2 ) = σ 4 . Infatti si ha
E( gt2 | ε t −1 , ε t − 2 ,…) = E(ε t2ε t2−1 | ε t −1 , ε t − 2 ,…) = E(ε t2 | ε t −1 , ε t − 2 ,…)ε t2−1 = σ 2ε t2−1
e quindi l’asserto non appena si considera l’aspettazione del primo e dell’ultimo termine.
8
Per esempio e` stata omessa dal modello qualche variabile indipendente oppure gli errori hanno una effettiva
autocorrelazione che andrebbe modellata. Nel primo caso le stime OLS non sono consistenti nel secondo caso, nei
modelli dinamici si perde la consistenza, mentre in quelli statici le stime OLS rimangono consistenti ma non sono
efficienti.
9
L’ipotesi di omoschedasticita puo` essere rimossa, naturalmente cio` porta alla modifica della varianza asintotica degli
stimatori.
17
4-Econometria, a.a. 2014-15
•
1 n
⎡
⎤ d
nγˆ1 ⎢ = n ( ∑ ε t ε t −1 ) ⎥ → N (0;σ 4 ) . E’ conseguenza del teorema del limite centrale per
n t =2
⎣
⎦
una differenza martingala stazionaria ed ergodica.
•
n ρˆ1 → N (0;1) . Segue dalla precedente e dalla rappresentazione
d
n ρˆ1 = n
γˆ1
, dopo aver
γˆ0
osservato che il denominatore converge in probabilità a σ 2 .
Corollario: Nelle ipotesi della precedente proposizione, si ha
p
p
⎛
⎞ d
Q1 ⎜ = n∑ ρˆ 2j = ∑ ( n ρˆ j ) 2 ⎟ → χ p2
j =1
j =1
⎝
⎠
ed anche
p
p
⎛
⎞ d
ρˆ 2
n+2
( n ρˆ j ) 2 ⎟ → χ p2 .
Q2 ⎜ = n(n + 2)∑ j = ∑
⎜
⎟
j =1 n − j
j =1 n − j
⎝
⎠
Le statistiche Q1 e Q2 sono denominate rispettivamente statistica di Box-Pierce e statistica di
Ljung-Box.
Osservazione:
• La statistica Q di Ljung-Box (per differenti valori di p ) e il corrispondente p -value nel
campione e` fornita dai software econometrici quando si richiede il correlogramma di una timeseries. Essa solitamente e` utilizzata per rilevare la presenza di autocorrelazione nel processo che si
ritiene stazionario o anche negli errori di un modello di regressione, utilizzando in tal caso come
osservazioni i residui. Per costruire test sull`ipotesi di assenza di autocorrelazione in un processo o
sugli errori in un modello di regressione si preferiscono altri strumenti.
E’ stato mostrato con tecniche di simulazione che, per campioni finiti, è preferibile utilizzzare la
statistica di Ljung-Box piuttosto che la statistica di Box-Pierce.
top
4-10 La statistica di Durbin-Watson
Uno dei primi test sulla presenza di autocorrelazione negli errori di un modello di regressione
lineare, che ora si passa a descrivere, fu proposto intorno al 1950 da Durbin e Watson; in realtà
esso è soltanto un test sulla presenza di autocorrelazione del prim’ordine, è valido in ipotesi molto
restrittive ed infine le sue risposte non sono come solitamente accade per un test “si accetta” o “si
rifiuta” l’ipotesi nulla, ma contempla anche l’ulteriore risposta “non si è in grado di fornire
suggerimenti”. Attualmente esso (test) non e’ mai utilizzato, ma il valore della statistica di DurbinWatson è riportato nell’output dei software econometrici, data la sua semplicità di calcolo, e
fornisce un primo segnale di presenza di autocorrelazione negli errori quando (come si vedrà) il suo
18
4-Econometria, a.a. 2014-15
valore è vicino a 0 oppure a 4.
Si considera il modello yt = x′t β + ut con { yt , xt } processo stazionario ed ergodico e si suppone
che le variabili x t siano strettamente esogene.
Osservazione: Qui l’ipotesi di stretta esogeneita` e` sostanzialmente necessaria, data la possibile
autocorrelazione negli errori.
n
Definizione: La statistica D =
∑ (uˆ
t
t =2
− uˆt −1 ) 2
n
∑ uˆ
t =1
, dove {uˆt } e` il processo dei residui nella stima OLS,
2
t
dicesi statistica di Durbin-Watson (il suo valore è presente nell’output di qualunque procedura di
stima in cui son coinvolte le time-series).
Osseravazione: La consistenza dello stimatore β̂ , assicura la consitenza del processo dei residui e
dunque la validita della seguente
1)
n
n
n
t =2
t =2
n
t =2
∑ uˆt2 − 2∑ uˆt uˆt −1 + ∑ uˆt2−1
D=
∑ uˆ
2
t
t =1
n
n
t =1
t =2
2∑ uˆt2 − 2∑ uˆt uˆt −1
=
n
∑ uˆ
t =1
(si noti che
uˆ12 + uˆn2
n
∑ uˆ
t =1
2
t
=
(al numeratore si somma e si sottrae uˆ12 + uˆn2 )
2
t
−
uˆ12 + uˆn2
n
∑ uˆ
t =1
p
→
2(1 − ρ1 ) (∈ [ 0, 4])
2
t
(uˆ12 + uˆn2 ) / n p
→ 0 ).
1 n 2
∑ uˆt
n t =1
2) L’assenza di autocorrelazione del prim’ordine negli errori ( ρ1 = 0 ) dovrebbe produrre un
valore della statistica D non molto distante da 2, mentre un valore di D vicino a 4 suggerirebbe la
presenza di autocorrelazione negativa e un valore vicino a 0 la presenza di autocorrelazione
positiva.
3) Al fine di utilizzare la statistica D per costruire un test sulla presenza di autocorrelazione
del prim’ordine negli errori, è essenziale individuare la sua distribuzione (finita o asintotica). In
alternativa si potrebbe usare il metodo del bootstrap, che alla luce di quanto provato da Durbin e
Watson (vedi il teorema che segue) sembra poter dare migliori risultati.
Teorema (di Durbin e Watson) – Considerato il modello yt = x′t β + ut con
19
{ yt , xt }
processo
4-Econometria, a.a. 2014-15
stazionario, tale che
i)
ii)
Le variabili x t sono strettamente esogene,
ut = ρ1ut −1 + ε t con è ε t ∼ n.i.d .(0, σ 2 ) ,
gli autori individuarono (al variare del numero di variabili indipendenti, per gli standard livelli di
significatività e per differenti lunghezze del campione) una coppia di quantili (dl* , du* ) (spesso
non presenti nei software econometrici, ma disponibili su internet) con 0 < dl* < du* < 2 ,
indipendenti dalla matrice X delle osservazioni delle variabili indipendenti, tali che un test per
l’ipotesi
⎧ H 0 : ρ1 = 0
⎨
⎩ H1 : ρ1 > 0
è:
“Si accetta H 0 se D > du* , si rifiuta H 0 se D < dl* , mentre se dl* < D < du* non si può dire nulla”.
⎧H : ρ = 0
Un test per l’ipotesi ⎨ 0 1
è uguale al precedente con 4 − D al posto di D .
⎩ H1 : ρ1 < 0
Il precedente test ha validità asintotica se ε t ∼ i.i.d .(0, σ 2 ) .
top
20