4-Econometria, a.a. 2014-15 Capitolo 4 4-1 Modelli di regressione non lineare 4-2 Metodi di stima: Il metodo dei momenti e quello dei minimi quadrati (NLS) 4-3 Proprietà asintotiche delle stime NLS: Consistenza e asintotica normalita` 4-4 Il modello di regressione di Gauss-Newton (GNR) 4-5 Test sulle ipotesi: Il test di Wald, il test F e il test LM 4-6 Esercizio: Stima di un modello lineare con errori autocorrelati 4-7 Il test di Breusch-Godfrey (sull’assenza di autocorrelazione negli errori) 4-8 Appendice (il metodo di Newton) 4-9 La statistica di Box-Pierce e di Ljung-Box 4-10 La statistica di Durbin-Watson 4-1 Modelli di regressione non lineare Innanzitutto va segnalato che in econometria i termini “lineare e non lineare” attribuiti ad un modello si riferiscono ai parametri del modello (ai quali e` rivolta l’attenzione). La classe dei modelli (econometrici) non lineari e` molto vasta, ma soltanto con l’avvento di veloci strumenti di calcolo essi hanno ricevuto particolare attenzione. In questo capitolo si considerano i modelli econometrici non lineari del tipo yt = f (t , xt , β) + ut con E(ut | Ωt ) = 0 e xt ∈ Ωt , dove Ω t denota il complesso di informazioni disponibili all’istante t (risp. “nell’unita` sezionale t ” se i dati sono cross-section) che influenzano yt (non solo dal punto di vista funzionale). In definitiva si sta assumendo che la variabile economica yt abbia una dipendenza causale dalla variabile esogena (vettoriale) x t , una dipendenza non lineare dal parametro non noto β ∈ R k e che l’errore sia additivo; naturalmente, come in tutti i problemi econometrici, e` richiesta la disponibilita` del processo delle osservazioni { yt , xt }t =1,…,n . Per alleggerire le notazioni, nella trattazione teorica si preferisce non evidenziare esplicitamente nel modello la dipendenza da x t , e allora esso si scrive nella forma yt = xt (β) + ut , con E(ut | Ωt ) = 0 e xt ∈ Ωt .( 1 ) Forme piu’ generali di modelli nonlineari si presentano nella forma m( yt , x t , β) = ut . Per una semplice introduzione al metodo di stima GMM (Metodo generalizzato dei momenti) utilizzabile per questi (e altri) modelli, vedi il par. 6 del cap. 5 del volume “A Guide to Modern Econometrics” di Verbeek, dove è presente anche un’interessante applicazione. Un breve cenno a questo metodo e` presente anche in 7-5 di queste lezioni. 1 1 4-Econometria, a.a. 2014-15 E` importante sottolineare che per i modelli non lineari non sussiste in generale l’uguaglianza tra la dimensione del vettore x t e la dimensione k del parametro β , come invece accade per i modelli lineari, dove si ha f (t , xt , β) = x′t β . Alcuni esempi: I primi due esempi mostrano che la non linearità (per il primo) e la linearità (per il secondo) dei modelli economici non si trasferisce nella non linearità (per il primo) e la linearità (per il secondo) dei modelli econometrici sui quali fare inferenza. Modello economico non lineare: Si considera il modello economico z = α x β yγ (denominato modello di Cobb-Douglas, utilizzato per mettere in relazione la produzione con i fattori produttivi capitale e lavoro). Osservato che le variabili assumono valori positivi, non è restrittivo assumere che anche α e` positivo e allora il modello si può scrivere nella forma log( z ) = log(α ) + β log( x) + γ log( y ) , che è evidentemente lineare nei parametri log(α ) , β , γ . Se sono disponibili le osservazioni sulle variabili z, x, y , l’introduzione nell’ultimo modello di un errore additivo u , dà origine ad un modello econometrico lineare. Si noti che la presenza dell’errore additivo u , equivale alla presenza di un errore moltiplicativo v = eu nel modello originario. Semplici considerazioni di natura economica rendono ragionevole la presenza di un tale tipo di errore. Modello lineare con errori autocorrelati: Si considera un modello lineare yt = x′t β + ut , e si suppone che il processo degli errori abbia la seguente semplice struttura ut = ρ ut −1 + ε t con {ε t } ∼ i.i.d .(0, σ 2 ) e ρ < 1 .( 2 ) Ricavando ut dalla prima equazione e sostituendo nella seconda si ha: yt = ρ yt −1 + x′t β − ρ x′t −1β + ε t , con {ε t } ∼ i.i.d .(0, σ 2 ) e ρ < 1 , Osservazione: i) Se le variabili x t sono strettamente esogene (nel senso che il loro valore all’istante t è determinato all’esterno del modello) allora il metodo dei minimi quadrati ordinari fornisce una buona stima (cioè consistente e asintoticamente normale) di β sebbene non efficiente; se invece tra le x t c’è qualche ritardo della variabile dipendente, allora evidentemente la stima OLS di β non è piu` consistente. ii) L’ipotesi qui fatta sugli errori è abbastanza realistica. Per esempio nel caso in cui l’errore ut all’istante t ha due 2 componenti: l’innovazione ε t e ρ ut −1 (l’effetto residuale dell’errore all’istante t − 1 ) con 0 < ρ < 1 o equivalentemente quando gli effetti delle innovazioni si spengono geometricamente e quindi per l’errore si ha ut = ε t + ρε t −1 + ρ 2ε t − 2 + , rappresentazione che si dimostra essere equivalente a ut = ρ ut −1 + ε t 2 4-Econometria, a.a. 2014-15 che è un modello econometrico non lineare. Si noti che quest’ultimo è un modello dinamico (per la presenza di yt −1 tra le variabili indipendenti) con gli errori che sono innovazioni (cioe` i.i.d .(0, σ 2 ) ). • Modello per dati di conteggio (count-data): Se la variabile dipendente yt e` una variabile di conteggio (e dunque assume valori in N ) e x t e` il vettore delle variabili indipendenti, essendo evidentemente E( yt xt ) > 0 , e` poco ragionevole assumere E( yt xt ) = x′t β (quest’ultima assume valori in tutto R ), mentre appare piu` verosimile, e non e` neppure molto restrittiva, l’ipotesi E( yt xt ) = exp(x′t β) , da cui, posto ut = yt − exp(x′t β) , si ottiene il modello non lineare yt = exp(x′t β) + ut e E(ut xt ) = 0 (*) (qualche ulteriore considerazione mostra che gli errori non possono essere omoschedastici). Si segnala che c’e` una vasta letteratura sui modelli per dati di conteggio; il piu` semplice (e anche il piu` utilizzato) e` quello in cui si assume: yt xt ha distribuzione di Poisson con parametro λt = exp(x′t β) . Si noti che in questo caso si ha i) E( yt xt ) = exp(x′t β) ; ii) var( yt xt ) = exp(x′t β) ; iii) Il modello e` completamente specificato;( 3 ) e in presenza di dati cross-section il miglior metodo di stima e` quello della massima verosimiglianza (vedi cap. 8). Tale stima e` valida anche per il modello in (*), con la usuale avvertenza di correggere la varianza asintotica.( 4 ) top 4-2 Metodi di stima: Il metodo dei momenti e quello dei minimi quadrati (NLS) Intanto il modello deve essere correttamente specificato quindi deve esistere un valore β ∗ di β , la cui corrispondente struttura del modello (o DGP) ha generato i dati a disposizione. 3 Infatti fissato il valore del parametro β , in corrispondenza di x t per simulare yt (costruire al computer una sua osservazione) e` sufficiente simulare una distribuzione di Poisson con parametro x′t β . 4 La necessita` di costruire modelli, sempre completamente specificati, ma piu` generali di quello di Poisson, il cui approfondimento e` rinviato ai testi specializzati, e` sorta quando si e` osservato che, nei processi in cui la variabile dipendente e` di conteggio, e` ragionevole la presenza della sovradispersione, cioe` var( yt xt ) > E( yt xt ) . Una evidenza empirica di tale fenomeno e` data dalla presenza di molte osservazioni uguali a 0 per yt . 3 4-Econometria, a.a. 2014-15 Il metodo dei momenti (si descrive brevemente come costruire le stime, tralasciando alcuni dettagli). Per avviare la procedura di stima, come nel caso lineare, sono necessarie (almeno) k variabili non correlate con ut , e dunque che appartengono a Ω t per le quali sono disponibili le osservazioni. La scelta naturale non puo` ricadere sulle variabili x t (come per i modelli lineari, nel qual caso la scelta e` anche ottima se gli errrori sono omoschedastici) in quanto il loro numero (in generale) non coincide con la dimensione del parametro, ma sembra dover ricadere sulle variabili X t (β) = (1×k ) ∂xt (β) , in quanto il loro numero e` esattamente k , sono non correlate con ut (in quanto ∂β funzione di x t con E(ut | xt ) = 0 ) ed infine sono la scelta naturale nei modelli lineari (infatti si ha X t (β) = ∂ [ x′t β ] ∂β = x′t )( 5 ). Pero` nel caso non lineare, queste variabili presentano l’inconveniente di dipendere da β , in tal caso non sono disponibili le osservazioni. Questo ostacolo puo` essere superato fissando aritrariamente un valore per β , ma si intuisce che tale valore sarebbe preferibile sceglierlo il piu` vicino a β ∗ . Si fa vedere che cio` si ottiene con la seguente procedura iterativa: Si fissa β̂0 (come al solito, per tali procedure, con qualche accorgimento) e con il metodo dei momenti, utilizzando le variabili X t (β 0 ) (per le quali sono ora disponibili le osservazioni) si trova la stima β̂1 , che prendera` il posto di β̂0 , e poi si prosegue allo stesso modo; nelle procedure numeriche fino a raggiungere la soglia prefissata di errore.. Il metodo (di stima) dei minimi quadrati non lineari (NLS). Si considera la funzione Qn (β) = 1 n ∑ ( yt − xt (β))2 n t =1 denominata come al solito “funzione obiettivo”. Definizione: L’unico punto di minimo assoluto della funzione Qn (β) (se esiste) dicesi stimatore dei minimi quadrati non lineare (NLS) di β e si denota con il simbolo βˆ NLS (o β̂ come si fara` nel seguito, se non c’è possibilità di equivoco). Osservazione: • Lo stimatore β̂ esiste se per ogni n − pla di osservazioni { yt , xt }t =1,…,n la funzione Qn (β) (questa volta) a valori reali ha un unico punto di minimo assoluto. 5 E` evidente che ci sono inummerevoli altre scelte per avviare la procedura di stima; ma si mostra che la scelta qui chiamata naturale e` (in un certo senso) la migliore almeno asintoticamente, salvo che non siano disponibili altre informazioni. 4 4-Econometria, a.a. 2014-15 • Lo stimatore β̂ (se esiste) è soluzione dell’equazione non lineare ⎛ ⎞ n ⎜ ∂Qn (β) = 0 ⇔ ⎟ X ′(β)( y − x (β)) = 0 ; t t t ⎜ ∂β ⎟∑ ⎜ (1×k ) ⎟ t =1 ( k ×1) ⎝ ⎠ • Per (lo stimatore) β̂ generalmente non e` disponibile una rappresentazione analitica esplicita, ma per le applicazioni servono soltanto le sue proprietà e il suo valore nel campione a disposizione (e dunque la stima); • La stima β̂ (se esiste) deve essere individuata con metodi numerici; per esempio la procedura descritta precedentemente (quindi i due metodi forniscono la stessa stima), ma piu` avanti saranno presentate altre procedure piu` efficienti dal punto di vista numerico e piu` interessanti per le conseguenze teoriche. • Le condizioni che assicurano l’esistenza di β̂ per ogni fissato n si dicono condizioni di identificabilità per campioni finiti (che in questo caso non sono conseguenza delle condizioni per la asintotica identificabilita come invece accade nei modelli lineari). top 4-3 Proprietà asintotiche degli stimatori NLS: Consistenza e asintotica normalita` Soltanto per rendere piu` scorrevole l’esposizione si fa riferimento al caso in cui i dati siano del tipo time-series, ma i risultati ottenuti sono validi anche nel caso di dati cross-section. Proposizione 1 (consistenza): Si denota ancora con β* il valore vero (naturalmente non noto) del parametro β e si assume i) β̂ esiste per n sufficientemente grande (e dunque il modello e` identificabile al finito); ii) Il processo { yt , xt } è stazionario ed ergodico; iii) Il modello e` asintoticamente identificabile, cioe` posto 1 n X t′(β)( yt − xt (β)) [ = E( X t′(β)( yt − xt (β))) ] ∑ n →∞ n t =1 α (β) = p lim (l’esistenza del limite segue da ii)) β* è l’unica soluzione dell’equazione α (β) = 0 . ( 6 ) p Allora lo stimatore β̂ e` consistente (cioe` βˆ → β* ). Un cenno della dimostrazione: Si prova dapprima che p βˆ → β Nel caso di modelli lineari l’asintotica identificabilità implica l’identificabilità (finita), implicazione non vera nel caso di modelli non lineari. 6 5 4-Econometria, a.a. 2014-15 (la prova qui non è riportata e non è proprio banale). Passando al limite, nella uguaglianza 1 n ∑ X t′(βˆ )( yt − xt (βˆ )) = 0 , si ha α (β ) = 0 , donde per l’asintotica identificabilita` del modello segue n t =1 che β = β* e quindi l`asserto. Proposizione 2 (asintotica normalità e stima della varianza asintotica): In aggiunta alle precedenti ipotesi i), ii), iii) di proposizione 1, si assume iv) E(ut | xt , xt −1 ,… , ut −1 ,…) = 0 (assicura insieme alla condizione (ii) la validità` del teorema del limite centrale quando se ne presentera` l’occasione); v) la matrice Σ x = E ⎡⎣ X t′(β* ) X t (β* ) ⎤⎦ è invertibile. Allora si ha: ˆ ; n (βˆ − β* ) → N (0, Avar(β)) d per una rappresentazione di Avar(βˆ ) e di una sua stima consistente (quest’ultima essenziale per le applicazioni) si rimanda alla 1) e 2) che seguono. Dimostrazione: Dalla formula di Taylor del prim’ordine, di punto iniziale β* per la funzione ∂Qn (β) , si ha (per un β appartenente al segmento congiungente β* e β̂ , e dunque anch’esso, al pari ∂β′ di β̂ , convergente in probabilita` a β* , per n → ∞ ) ∂Qn (βˆ ) ∂Qn (β* ) ∂ 2Qn (β) ˆ * (β − β ) ; = + (0 =) ∂β′ ∂β′ ∂β′∂β ( k ×1) ora • d ⎛ ∂Qn (β* ) ⎞ 1 n =⎟ X t′(β* )ut →N (0, Σux ) con Σux = E ⎡⎣ut2 X t′(β* ) X t (β* ) ⎤⎦ ; ∑ ⎜ (−1/ 2) n ∂β′ ⎝ ⎠ n t =1 • ∂ 2Qn (β) 1 n ∂ (1/ 2) = − ∑ [ X t′(β)( yt − xt (β)) ] = ∂β′∂β n t =1 ∂β β =β =− p 1 n ∂X t′(β) 1 n ( yt − xt (β)) + ∑ X t′(β) X t (β) → 0 + Σ x ∑ n t =1 ∂β n t =1 ⎡ ∂X ′(β) ⎤ ut ⎥ = 0 ) e (il primo addendo converge a zero per la legge dei grandi numeri, essendo E ⎢ t ∂ β ⎣ ⎦ quindi si ha: 1) ⎛ ⎡ ∂ 2Q (β) ⎤ −1 ⎡ ∂Qn (β* ) ⎤ ⎞ d n ˆ ˆ ⎜ n (β − β 0 ) = ⎢ − n ⎥ ⎟ → N (0, Avar(β)) ; ⎜ ⎣ ∂β′∂β ⎥⎦ ⎢⎣ ∂β′ ⎦ ⎟ ⎝ ⎠ 6 4-Econometria, a.a. 2014-15 con ⎧ Avar(βˆ ) = Σ −x1Σux Σ −x1 ; ⎪ −1 −1 2) ⎨ ⎡1 n ⎤ ⎡1 n 2 ⎤ ⎡1 n ⎤ . ˆ ˆ ˆ ˆ ˆ ˆ ′ ′ ′ ˆ = X X u X X X X β β β β β β Avar( ) ( ) ( ) ( ) ( ) ( ) ( ) β̂ ⎪ t t t ⎢ ∑ t ⎥ ⎢ ∑ t t ⎥ ⎢n ∑ t ⎥ ⎣ n t =1 ⎦ ⎣ n t =1 ⎦ ⎣ t =1 ⎦ ⎩ Osservazione: i) Avar(βˆ ) (che converge in probabilità a Avar(βˆ ) ) dicesi stimatore di White (o consistente per l’eteroschedasticita` (HC)) della varianza. La prova della convergenza e` del tutto analoga alla prova della consistenza dello stimatore di White per la varianza degli stimatori OLS nei modelli lineari. ii) Stima di Avar(βˆ ) quando gli errori sono omoschedastici (cioe` E(ut2 | Ωt ) = σ 2 ): In questo caso si ha Σux = σ 2 Σ x , e allora ⎡1 n ⎤ Avar(βˆ ) = σ 2 Σ −x1 e Avar(βˆ ) = s 2 ⎢ ∑ X t′(βˆ ) X t (βˆ ) ⎥ ⎣ n t =1 ⎦ con s 2 = −1 1 n 2 1 n 2 uˆt (o anche s 2 = ∑ ∑ uˆt che spesso è preferito). n t =1 n − k t =1 iii) Talvolta, anche in presenza di autocorrelazione negli errori, si puo` utilizzare il teorema del limite centrale; in tal caso, come per i modelli lineari, si utilizza come stimatore della varianza asintotica di β̂ lo stimatore di Newey e West, indicato con la sigla HAC (Heteroskedasticity and Autocorrelation Consistent). E` importante notare che, come nei modelli lineari, la presenza di autocorrelazione negli errori esclude la possibilita` che tra le variabili indipendenti ci possa essere qualche ritardo di yt (non sarebbe piu` valida l’ipotesi E(ut | xt ) = 0 , essenziale per la consistenza dello stimatore). top 4-4 Il modello di regressione di Gauss-Newton (GNR) Data la struttura della funzione obiettivo, una utile procedura numerica per la minimizzazione e` il metodo di Newton o quasi-Newton che e` richiamato in 4-8. Qui si descrive la procedura per alcune interessanti conseguenze di natura statistica. Si pone ⎛ ∂Q(β) ⎞ 2 n = − g(β) ⎜ = ∑ X t′(β)( yt − xt (β)) , ⎟ ∂β′ ⎠ n t =1 ( k ×1) ⎝ 7 4-Econometria, a.a. 2014-15 ⎛ ∂ 2Q(β) ⎞ ⎞ 2 n ⎛ ∂X ′(β) = − ∑⎜ t H (β) ⎜ = ( yt − xt (β)) − X t′ (β) X t (β) ⎟ . ⎟ ∂β∂β′ ⎠ n t =1 ⎝ ∂β ( k ×k ) ⎝ ⎠ Importanti considerazioni (da i a vii): Al fine di costruire una sequenza minimizzante di β̂ (e dunque una successione ( β j ) che i) j converge a β̂ ), si osserva che è possibile utilizzare il metodo Quasi-Newton con la matrice D(β) = 2 n ∑ X t′ (β) X t (β) (che è certamente definita positiva se è non singolare), in quanto l’altro n t =1 addendo di H (β) per β = βˆ converge in probabilità a 0 per n → ∞ . In tal modo non e` necessario il calcolo delle derivate seconde della funzione nonlineare xt (β) . Per evitare l’eventuale sigolarita` di D(β) , si sceglie c > 0 opportunamente e si considera D(β) + 2cI ; la procedura minimizzante dicesi di Marquardt. ii) Costruzione della sequenza minimizzante: Fissato β 0 (se possibile non molto distante da β̂ , che però non è noto) si ha (per ogni j ≥ 0 ): β j +1 ( ) −1 ⎡2 n ⎤ ⎡ 2 n ⎤ = β j − ⎡⎣ D(β j ) ⎤⎦ g(β j ) = β j − ⎢ ∑ X t′(β j ) X t (β j ) ⎥ ⎢ − ∑ X t′(β j )( yt − xt (β j )) ⎥ ⎣ n t =1 ⎦ ⎣ n t =1 ⎦ −1 −1 ⎡1 n ⎤ ⎡1 n ⎤ = β j + ⎢ ∑ X t′(β j ) X t (β j ) ⎥ ⎢ ∑ X t′(β j )( yt − xt (β j )) ⎥ ⎣ n t =1 ⎦ ⎣ n t =1 ⎦ = β + bˆ j j con −1 ⎡1 n ⎤ ⎡1 n ⎤ bˆ j = ⎢ ∑ X t′(β j ) X t (β j ) ⎥ ⎢ ∑ X t′(β j )( y − xt (β j )) ⎥ , ⎣ n t =1 ⎦ ⎣ n t =1 ⎦ iii) Importante: Dall’esame della rappresentazione di bˆ j (l’addendo che aggiorna la procedura per ricorrenza) si vede immediatamente che esso è la stima OLS del parametro b del modello di regressione lineare (*) ( yt − xt (β j )) = X t (β j )b + resid , per t = 1,… , n e dunque bˆ j = bˆ OLS del precedente modello. iv) Definizione: Il modello di regressione (*) dicesi Modello (ausiliario) di regressione di Gauss-Newton. (In esso yt − xt (β j ) è la variabile dipendente e X t (β j ) è il vettore riga delle k variabili indipendenti; per tali variabili sono disponibili n osservazioni quando e` noto il valore di 8 4-Econometria, a.a. 2014-15 β j ). v) La stima del modello di regressione lineare di Gauss-Newton per β = βˆ (= βˆ NLS ) : Essendo per definizione 1 n ∑ X t′(βˆ )( yt − xt (βˆ )) = 0 , n t =1 considerato il modello di Gauss-Newton in β̂ , cioe` ( yt − xt (βˆ )) = X t (βˆ )b + resid , il metodo OLS fornisce le stime bˆ = ...... = 0 e Avar(bˆ ) = …… = Avar(βˆ ) . Osservazione (puo` essere omessa): Se si stima il modello di Gauss-Newton utilizzando un altro 1 n X t′(β)( yt − xt (β)) = 0 , segue il precedente ∑ n →∞ n t =1 stimatore consistente β di β , allora, essendo p lim risultato con la seguente poco significativa modifica: p bˆ → 0 e Avar(bˆ ) = …… = Avar(β) . ( ) vi) Quando si interrompe la procedura iterativa (al passo j ), si ha βˆ NLS ≈ β j +1 = β j + bˆ j , allora se si effettua un ulteriore passo, dal precedente punto v) segue immediatamente che la stima della varianza asintotica di bˆ j +1 è la stima della varianza asintotica di βˆ NLS . vii) Se gli errori sono omoschedastici (si prova che) lo stimatore NLS è asintoticamnete efficiente (nel senso che ha la minore varianza asintotica) nella classe degli stimatori costruiti con il metodo dei momenti. Si prova inoltre che se si avvia la procedura iterativa con uno stimatore n − consistente (non efficiente), al primo passo si ottiene uno stimatore asintoticamente efficiente di β (come lo stimatore NLS ), genralmente diverso da βˆ NLS , denominato stimatore efficiente ad un passo. Quest’ultimo risultato ha soltanto un interesse teorico; per individuare i valori numerici delle stime si utilizzano sempre piu` iterazioni. Osservazione: Anche nei modelli non lineari eventuali informazioni sulla eteroschedasticita` possono essere utilizzate per costruire stimatori piu` efficienti. L’argomento e` discusso nel capitolo 5 per i modelli lineari, ma l’adattamento ai modelli non lineari non presenta alcuna difficolta` aggiuntiva. top 4-5 Test sulle ipotesi: Il test di Wald, il test F e il test LM Sia yt = xt (β) + ut un modello econometrico non lineare correttamente specificato, con le usuali 9 4-Econometria, a.a. 2014-15 ipotesi sui processi { yt , xt } e {ut } , che assicurino l`esistenza dello stimatore NLS e la sua asintotica normalita`. Dal punto di vista teorico la costruzione di test (con validità asintotica) sull’ipotesi del tipo H 0 : a(β) = 0 non presenta particolari difficoltà; gli argomenti utilizzati in 3-10 continuano ad essere validi. Qui si assume che gli errori siano omoschedastici e si considera l’ipotesi lineare del tipo H 0 : β 2 = 0 , essendo β = (β1 , β 2 ) ; si mostra come il test LM ha una realizzazione relativamente semplice, che si semplifica ulteriormente quando il modello e` lineare se l’ipotesi H 0 e` vera. Soltanto per ragioni di completezza si descrivono anche i test di Wald (ma qui non è necessaria l’ipotesi di omoschedasticità) e il test asintotico (F) di Fisher. Se si denota con R il modello ristretto e con U il modello non ristretto, l’ipotesi statistica assegnata puo` essere scritta nella seguente forma: ⎧ H 0 : yt = xt (β1 , 0) + ut (Modello R ) . ⎨ ⎩ H1 : yt = xt (β1 , β 2 ) + ut (Modello U) 1) Il Test di Wald (come e` noto si costruisce utilizzando soltanto il modello non-ristretto U): Sia β̂2 la stima di β 2 del modello U e var(βˆ 2 ) la stima della sua varianza. La statistica di Wald per l’ipotesi H 0 è la distanza pesata da 0 di β̂2 , con peso l’inversa della stima della sua varianza e dunque ( W = βˆ ′2 var(βˆ 2 ) ) −1 ( ⎛ βˆ 2 ⎜ = nβˆ ′2 Avar(βˆ 2 ) ⎝ ) −1 ⎞ βˆ 2 ⎟ . ⎠ Con gli usuali argomenti si prova che (sempre nell’ipotesi H 0 ) si ha W → χ k22 , d e quest`ultima proprietà consente di costruire un test con validità asintotica sull’ipotesi assegnata. 2) Il test asintotico (F) di Fisher (è necessario stimare entrambi i modelli): Siano USSR e RSSR le somme dei quadrati dei residui dei modelli U e R rispettivamente, allora non è difficile provare che per la usuale variabile F= ( RSSR − USSR ) / k2 , USSR /(n − k ) in presenza di errori omoschedastici, si ha k2 F → χ k22 , donde con la usuale procedura si costruisce d il test con livello di significatività assegnato. 10 4-Econometria, a.a. 2014-15 3) Test LM (utilizza il modello di regressione di Gauss-Newton e il modello ridotto): Qui ci si limita a descrivere la costruzione del test. Si prova che la statistica utilizzata, detta statistica LM, e` la distanza pesata da 0 del moltiplicatore di Lagrange (o equivalentemente la distanza pesata da 0 del gradiente della funzione obiettivo calcolato nella stima del modello ridotto). Si osserva innanzitutto che il modello di regressione di Gauss Newton per il modello U ha la seguente rappresentazione yt − xt (β1 , β 2 ) = X 1t (β1 , β 2 )b1 + X 2t (β1 , β 2 )b 2 + resid essendo X it (β) = ∂xt (β) per i = 1, 2 . ∂βi Per costruire la stima efficiente ad un passo di β è richiesta una sua stima n − consistente, che puo` essere costruita con il modello R, in quanto nell’ipotesi H 0 si ha β = (β1 , 0) ); tale stima sia β = (β1 , 0) . Il modello di Gauss- Newton diventa allora yt − xt (β1 , 0) = X1t (β1 , 0)b1 + X 2t (β1 , 0)b 2 + resid (*) e osservato che evidentemente sussiste la seguente equivalenza H 0 : β 2 = 0 ⇔ H 0′ : b 2 = 0 , il test sull’ipotesi H 0 : β 2 = 0 diventa un test su un ipotesi lineare sul parametro di un modello lineare che si costruisce senza particolari difficoltà. E` evidente che la procedura si semplifica ulteriormente se il modello R dovesse essere lineare.( 7 ) top 4-6 Esercizio: Stima di un modello lineare con errori autocorrelati E’ assegnato il modello ⎧ yt = x′t β + ut Modello 1: ⎨ 2 ⎩ut = ρ ut −1 + ε t , con ε t ∼ i.i.d .(0, σ ), 0 < ρ < 1 e t = 1, 2,… e si suppone che il processo { yt , xt } sia stazionario ed ergodico e che sia valida qualche versione del teorema del limite centrale quando se ne presenta la necessita` (si noti che non si sta facendo nessuna ipotesi sulla presenza o meno di correlazione tra x t e ut ). 7 Nel modello (*) le osservazioni sulla variabile dipendente sono i residui costruiti utilizzando il modello ridotto; e` possibile provare che la statistca F per testare l’ipotesi H 0′ : b 2 = 0 e` asintoticamente equivalente alla statistica nR 2 (piu` avanti l’affermazione e` provata nel caso in cui il modello ridotto e` lineare) ed inoltre che quest’ultima e` esattamente la statistica LM. 11 4-Econometria, a.a. 2014-15 Osservazione: • L’ipotesi ρ < 1 e` di fondamentale importanza; se cosi` non fosse, il processo {ut } ( = { yt − x′t β}) , e di conseguenza { yt , xt } , non sarebbe stazionario ed ergodico. • Il processo {ut } e` definito a meno della condizione iniziale u0 , ma questa come si vedra` e` ininfluente sulle conclusioni. • Se tra le variabili indipendenti del modello lineare yt = x′t β + ut non ci sono ritardi di yt , il metodo OLS fornisce (generalmente) stime consistenti e asintoticamente normali (con la stima HAC della varianza asintotica), ma non (asintoticamente) efficienti. Se invece tra le variabili indipendenti c’e` yt −1 allora nel modello ci sono variabili endogene (in questo caso si ha evidentemente E(ut yt −1 ) ≠ 0 ) e allora le stime OLS non sono piu` consistenti (alcuni metodi di stima utilizzabili quando alcune variabili indipendenti sono endogene sono descritti nel capitolo 7). Il modello 1 ha le seguenti rappresentazioni equivalenti: Modello 2: yt = ρ yt −1 + x′t β − ρ x′t −1β + ε t con ε t ∼ i.i.d .(0, σ 2 ) , 0 < ρ < 1 e t = 1, 2,… , ; 1) ⇒ 2) Si utilizza la prima equazione del modello 1 per rappresentare ut (e quindi ut −1 ) e si sostituisce nella seconda equazione. 2) ⇒ 1) Si pone ut = yt − x′t β e allora ……………. . ⎧ y = ρ yt −1 + x′t β + x′t −1γ + ε t con ε t ∼ i.i.d .(0, σ 2 ) , 0 < ρ < 1 e t = 1, 2,… . Modello 3 (ristretto): ⎨ t ⎩ γ = − ρβ La sua equivalenza con il modello 2 è evidente. Osservazione: Il modello 3 non ristretto consente di costruire stimatori n − consistenti per i parametri ρ e β , ma essi sono (prevedibilmente) non efficienti in quanto non utilizzano tutte le informazioni disponibili. Costruzione di una stima asintoticamente efficiente dei parametri ρ e β : Il modello 2 è non lineare e per comodita` e` scritto nella forma ⎧ yt = xt ( ρ , β) + ε t . ⎨ ⎩ xt ( ρ , β) = ρ yt −1 + x′t β − ρ x′t −1β Si osserva che ∂xt ( ρ , β) ∂xt ( ρ , β) = yt −1 − x′t −1β e = x′t − ρ x′t −1 , allora il modello (ausiliario) di ∂ρ ∂β 12 4-Econometria, a.a. 2014-15 Gauss-Newton, yt − xt ( ρ , β) = ∂xt ( ρ , β) ∂x ( ρ , β) r+ t b + resid , ha la seguente rappresentazione ∂ρ ∂β yt − x′t β − ρ yt −1 + ρ x′t −1β = ( yt −1 − x′t β)r + (x′t − ρ x′t −1 )b + resid . (*) • La procedura ricorsiva per la costruzione di ρˆ NLS e βˆ NLS : Si fissa arbitrariamente β ≡ β 0 e ρ ≡ ρ 0 (meglio se vicini ai valori veri; generalmente si considerano le loro stime n − consistenti se disponibili) e si considera la procedura iterativa ρ j +1 = ρ j + rˆj e β j +1 = β j + bˆ j , dove rˆj e bˆ j sono le stime OLS del modello (*) nel quale si e` posto β = β j e ρ = ρ j . Osservazione: • Se nella precedente procedura si considera ρ 0 = ρˆ OLS e β 0 = βˆ OLS , ottenute dal modello 3 non ( ) ristretto, allora ( ρ1 = ) ρ1 = ρ0 + r̂0 e β1 = β1 = β 0 + bˆ 0 sono le stime efficienti ad un passo. Come precedentemente segnalato queste stime hanno principalmente un interesse teorico. • La stima della varianza asintotica dello stimatore ( ρ1 , β1 ) si ottiene effettuando un ulteriore passo con il modello di regressione di Gauss-Newton (*) (vedi il punto (v) in 4-4). top 4-7 Il test di Breusch-Godfrey (sull’assenza di autocorrelazione negli errori) La presenza di autocorrelazione negli errori di un modello lineare spesso (non sempre) e` un segnale di non corretta specificazione del modello; si intuisce allora l’importanza dei test che possano essere in grado di rivelarne la presenza. Alla fine degli anni 70 del secolo scorso, quando Breusch e Godfrey separatamente presentarono il test, a cui e` stato dato il loro nome, erano disponibili test per rilevare la presenza di autocorrelazione nei processi stocastici (vedi 4-9 e 4-10). La procedura fino a quel momento (e ancora oggi) adottata, per affrontare il problema inizialmente posto, era quella di utilizzare i residui come osservazioni del processo degli errori, procedura che trovava anche una sua giustificazione teorica per modelli in cui le variabili indipendenti erano strettamente esogene. Il test che si passa a costruire ha una validita` piu generale, consente per esempio la presenza dei ritardi della variabile dipendente tra le variabili indipendenti. Costruzione del test: Sia { yt , xt } un processo stazionario ed ergodico, yt = x′t β + ut un modello ⎧ H 0 : {ut } ∼ i.i.d .(0, σ 2 ) lineare e per un fissato p ≥ 1 si considera l’ipotesi ⎨ , dove ⎩ H1 : ρi ≠ 0 per almeno un 1 ≤ i ≤ p 13 4-Econometria, a.a. 2014-15 ρi = corr(ut , ut −i ) . Osservazione: • Come si puo` notare per fissare l’ipotesi e` richiesta la scelta di un valore di p . L’esame del grafico di ACF dei residui puo` suggerire la scelta di tale valore che comunque non va preso grande (in prima istanza l’esame dell’ACF potrebbe far apparire evidente la presenza di autocorrelazione negli errori, nel qual caso l’esito del test e` certamente scontato); • si puo` provare che per la costruzione del test, che non va dimenticato ha soltanto validita` asintotica, non e` restrittivo assumere che ut = α1ut −1 + + α p ut − p + ε t e {ε t } ∼ i.i.d .(0, σ 2 ) (con le restrizioni sui coefficienti che rendano stazionario il processo {ut } ) e allora l’ipotesi considerata ⎧ H 0 : (α1 ,…, α p )= 0 diventa ⎨ ; ⎩ H1 : (α1 , …, α p ) ≠ 0 • Per semplicita` si considera il caso in cui e` p = 1 , ma non c’e` alcuna difficoltà` aggiuntiva nel considerare il caso generale. ⎧ y = x′t β + ut Sia dunque ut = ρ ut −1 + ε t con ρ < 1 , e allora il modello diventa ⎨ t , che e` ⎩ut = ρ ut −1 + ε t esattamente il Modello 1 di 4.6 , (che ha come rappresentazione equivalente il Modello 2), mentre l’ipotesi e` H 0 : ρ = 0 . Il test LM per quest’ultima ipotesi e` quello che prende il nome di test di Breusch-Godfrey e che ora si passa a descrivere brevemente, per maggiori dettagli vedi 2 in 4-5. Si osserva innanzitutto che, se l’ipotesi H 0 e` vera, una stima consistente di (β, ρ ) è (βˆ , 0) , essendo β̂ la stima OLS del modello lineare yt = x′t β + ut e allora il modello GNR in (βˆ , 0) e` ( yt − x′t βˆ ) = x′t b + ( yt −1 − x′t −1βˆ )r + resid (⇔ uˆt = x′t b + uˆt −1r + resid ) e l’ipotesi in esame e` equivalente a H 0 : r = 0 per quest`ultimo modello lineare, per la cui verifica sono utilizzabili le procedure standard (per esempio il test di Wald). Osservazione: a) Una osservazione sulla costruzione del test sull’ipotesi H 0 : Si considera la statistica di Wald che ha la seguente rappresentazione W (= 1F ) = [ RSSR − USSR ] USSR / n − k − 1 (cfr. 2-5 anche per il significato dei simboli) e si osserva che, essendo il vettore û ortogonale alla matrice delle osservazioni, nella 14 4-Econometria, a.a. 2014-15 regressione del modello ridotto uˆt = x′t b + resid , si ha RESS = 0 e quindi non solo e` TSS = RSSR ma TSS e` una stima consistente della varianza. n In definitiva si ha W = [TSS − USSR ] USSR /(n − k − 1) , che ha distribuzione asintotica χ12 . Il ruolo del denominatore nella precedente rappresentazione e` quello di essere stimatore consistente della varianza (costruito con il modello non ridotto) che puo` essere sostituito con TSS (stimatore n consistente della varianza costruito con il modello ridotto). Si ottiene in tal modo la statistica [TSS − USSR ] TSS / n ( = nR ) 2 che produce un test asintoticamente equivalente a quello di Wald. Se nel modello originario e` presente l’intercetta, essendo la somma dei residui uˆt nulla, si ha nR 2 = nRc2 e Rc2 e` presente nell’output della stima del modello uˆt = x′t b + uˆt −1r + resid . b) Descrizione della costruzione del test di Breusch-Godfrey: Primo Step: Si stima con il metodo OLS il modello yt = x′t β + ut e sia {uˆ}t =1,…,n la serie dei residui Secondo Step: Si sceglie un intero p > 1 (suggerito eventualmente dalla funzione di autocorrelazione empirica della serie dei residui); Terzo Step: Si considera il modello ausiliario uˆt = x′t b + α1uˆt −1 + + α p uˆt − p + resid , il valore R 2 della stima OLS (fornito da qualunque software) e si rifiuta l’ipotesi H 0 a livello di significativita` α se e` nR 2 > χ p2 ,1−α . top 4-8 Appendice (il metodo di Newton) Sia Q(β) una funzione a valori reali definita in un sottinsieme di R k e β 0 un punto (del tutto arbitrario) nel suo dominio di definizione e si consideri il polinomio di Taylor del second’ordine di Q(β) di punto iniziale β 0 1 Q* (β) = Q(β 0 ) + g 0 (β − β 0 ) + (β − β 0 )′H 0 (β − β 0 ) 2 dove si è posto g0 = ∂Q (β 0 ) ( = ∇Q(β0 )′ ) (vettore colonna delle derivate parziali); ∂β′ 15 4-Econometria, a.a. 2014-15 H0 = ∂ 2Q(β 0 ) (matrice hessiana di Q(β) in β 0 e` una matrice quadrata di ordine k ). ∂β∂β′ Osservazione: 1) Se la matrice H 0 è definita positiva, la funzione Q* (β) ha un unico punto di minimo che soddisfa la condizione del prim’ordine 0 = g 0 + H 0 (β − β 0 ) , la cui (unica) soluzione è evidentemente β1 = β 0 − H 0−1g 0 . 2) Costruzione di una successione “estremante” (costituita da punti di minimo di funzioni ausiliarie e candidata a convergere verso l’eventuale punto di minimo) della funzione Q(β) : ⎧β0 ∂ 2Q(βi ) ∂Q (βi ) = H , , , = g ⎨ i i −1 ′ ′ β β H g = − ∂ ∂ β ∂ β β − − 1 n n n n − 1 1 ⎩ che esiste se la matrice H i e` invertibile per ogni i . Proposizione 1: i) Se la funzione Q(β) è quadratica (ha un solo punto di minimo) allora al primo passo si ottiene il punto di minimo; ii) Se la funzione Q(β) è approssimativamente quadratica (per esempio somma di funzioni quadratiche) allora la convergenza della procedura ricorsiva verso il punto di minimo (esistente) è rapida. iii) Se la funzione Q(β) è (globalmente) convessa esiste un unico punto di minimo e la successione estremante converge verso esso (e quindi è una successione minimizzante). iv) Se la funzione Q(β) non è globalmente convessa, pur avviando la procedura con β 0 vicino al punto di minimo (supposto esistente), può accadere che qualcuna delle matrici Hessiane H j sia non definita positiva e allora la procedura per ricorrenza si può bloccare oppure la successione può allontanarsi dal punto di minimo. Per porre rimedio a tale inconveniente, si sostituisce, nella costruzione della sequenza β j , la matrice H j con una sua buona approssimazione D j che però sia definita positiva. Tale procedura è prende il nome di metodo quasi-Newton. top 4-9 La statistica di Box-Pierce e di Ljung-Box Un problema di un qualche interesse in econometria (e non solo) è quello di testare l’ipotesi di indipendenza (o più in generale l’assenza di autocorrelazione) in un processo stazionario o anche quello di rilevare la presenza di autocorrelazione negli errori di un modello di regressione che 16 4-Econometria, a.a. 2014-15 spesso e` un segnale di non corretta specificazione( 8 ) (una risposta a questo secondo problema e` stata data nel paragrafo 4-7 con la costruzione del test di Breusch-Godfrey proposto separatamente dai due autori nel 1978, il quale è valido in contesti sufficientemente generali). Alcuni esempi di serie economiche che generalmente si assumono non autoccorrelate: 1) Per molto tempo (e ancora oggi in varie questioni teoriche) si è assunto che i rendimenti (di un titolo, di un mercato, …) sono indipendenti (ipotesi che per la verità si è rivelata per nulla ragionevole). 2) Hall formulò l’ipotesi che il processo dei consumi aggregati {ct } è una martingala (cioè che la migliore previsione sui consumi all’istante t siano i consumi all’istante t − 1 ) e dunque che il processo {ct − ct −1} sia una differenza martingala. Qui si costruisce un test sull’ipotesi (nulla) che un processo stazionario (con qualche proprietà che sara` precisata in seguito) sia non autocorrelato. A tal fine si premette la seguente: Proposizione 1 – Sia {ε t }t ≥1 una differenza martingala strettamente stazionaria, ergodica e tale che E(ε t2 | ε t −1 , ε t − 2 ,… , ε1 ) = σ 2 (ipotesi di omoschedasticità condizionata)( 9 ). Allora fissato p ≥ 1 e posto γˆ = (γˆ1 ,… , γˆ p )′ e ρˆ = ( ρˆ1 ,… , ρˆ p )′ , (con γˆs = γˆ 1 n ε t ε t − s e ρˆ s = s per s ≥ 0 ) si ha: ∑ n t =s γˆ0 n γˆ → N (0; σ 4 I p ) e d nρˆ → N (0; I p ) . d Dimostrazione: Per semplicità si esamina soltanto il caso p = 1 ; non ci sono difficoltà aggiuntive se e` p > 1 . Posto gt = ε t ε t −1 , si ha: • { gt } è un processo stazionario ed ergodico (è evidente); • { gt } è una differenza martingala. Infatti E( gt | ε t −1 , ε t − 2 ,…) = E(ε t ε t −1 | ε t −1 , ε t − 2 ,…) = E(ε t | ε t −1 , ε t − 2 ,…)ε t −1 = 0 • E( gt2 ) = σ 4 . Infatti si ha E( gt2 | ε t −1 , ε t − 2 ,…) = E(ε t2ε t2−1 | ε t −1 , ε t − 2 ,…) = E(ε t2 | ε t −1 , ε t − 2 ,…)ε t2−1 = σ 2ε t2−1 e quindi l’asserto non appena si considera l’aspettazione del primo e dell’ultimo termine. 8 Per esempio e` stata omessa dal modello qualche variabile indipendente oppure gli errori hanno una effettiva autocorrelazione che andrebbe modellata. Nel primo caso le stime OLS non sono consistenti nel secondo caso, nei modelli dinamici si perde la consistenza, mentre in quelli statici le stime OLS rimangono consistenti ma non sono efficienti. 9 L’ipotesi di omoschedasticita puo` essere rimossa, naturalmente cio` porta alla modifica della varianza asintotica degli stimatori. 17 4-Econometria, a.a. 2014-15 • 1 n ⎡ ⎤ d nγˆ1 ⎢ = n ( ∑ ε t ε t −1 ) ⎥ → N (0;σ 4 ) . E’ conseguenza del teorema del limite centrale per n t =2 ⎣ ⎦ una differenza martingala stazionaria ed ergodica. • n ρˆ1 → N (0;1) . Segue dalla precedente e dalla rappresentazione d n ρˆ1 = n γˆ1 , dopo aver γˆ0 osservato che il denominatore converge in probabilità a σ 2 . Corollario: Nelle ipotesi della precedente proposizione, si ha p p ⎛ ⎞ d Q1 ⎜ = n∑ ρˆ 2j = ∑ ( n ρˆ j ) 2 ⎟ → χ p2 j =1 j =1 ⎝ ⎠ ed anche p p ⎛ ⎞ d ρˆ 2 n+2 ( n ρˆ j ) 2 ⎟ → χ p2 . Q2 ⎜ = n(n + 2)∑ j = ∑ ⎜ ⎟ j =1 n − j j =1 n − j ⎝ ⎠ Le statistiche Q1 e Q2 sono denominate rispettivamente statistica di Box-Pierce e statistica di Ljung-Box. Osservazione: • La statistica Q di Ljung-Box (per differenti valori di p ) e il corrispondente p -value nel campione e` fornita dai software econometrici quando si richiede il correlogramma di una timeseries. Essa solitamente e` utilizzata per rilevare la presenza di autocorrelazione nel processo che si ritiene stazionario o anche negli errori di un modello di regressione, utilizzando in tal caso come osservazioni i residui. Per costruire test sull`ipotesi di assenza di autocorrelazione in un processo o sugli errori in un modello di regressione si preferiscono altri strumenti. E’ stato mostrato con tecniche di simulazione che, per campioni finiti, è preferibile utilizzzare la statistica di Ljung-Box piuttosto che la statistica di Box-Pierce. top 4-10 La statistica di Durbin-Watson Uno dei primi test sulla presenza di autocorrelazione negli errori di un modello di regressione lineare, che ora si passa a descrivere, fu proposto intorno al 1950 da Durbin e Watson; in realtà esso è soltanto un test sulla presenza di autocorrelazione del prim’ordine, è valido in ipotesi molto restrittive ed infine le sue risposte non sono come solitamente accade per un test “si accetta” o “si rifiuta” l’ipotesi nulla, ma contempla anche l’ulteriore risposta “non si è in grado di fornire suggerimenti”. Attualmente esso (test) non e’ mai utilizzato, ma il valore della statistica di DurbinWatson è riportato nell’output dei software econometrici, data la sua semplicità di calcolo, e fornisce un primo segnale di presenza di autocorrelazione negli errori quando (come si vedrà) il suo 18 4-Econometria, a.a. 2014-15 valore è vicino a 0 oppure a 4. Si considera il modello yt = x′t β + ut con { yt , xt } processo stazionario ed ergodico e si suppone che le variabili x t siano strettamente esogene. Osservazione: Qui l’ipotesi di stretta esogeneita` e` sostanzialmente necessaria, data la possibile autocorrelazione negli errori. n Definizione: La statistica D = ∑ (uˆ t t =2 − uˆt −1 ) 2 n ∑ uˆ t =1 , dove {uˆt } e` il processo dei residui nella stima OLS, 2 t dicesi statistica di Durbin-Watson (il suo valore è presente nell’output di qualunque procedura di stima in cui son coinvolte le time-series). Osseravazione: La consistenza dello stimatore β̂ , assicura la consitenza del processo dei residui e dunque la validita della seguente 1) n n n t =2 t =2 n t =2 ∑ uˆt2 − 2∑ uˆt uˆt −1 + ∑ uˆt2−1 D= ∑ uˆ 2 t t =1 n n t =1 t =2 2∑ uˆt2 − 2∑ uˆt uˆt −1 = n ∑ uˆ t =1 (si noti che uˆ12 + uˆn2 n ∑ uˆ t =1 2 t = (al numeratore si somma e si sottrae uˆ12 + uˆn2 ) 2 t − uˆ12 + uˆn2 n ∑ uˆ t =1 p → 2(1 − ρ1 ) (∈ [ 0, 4]) 2 t (uˆ12 + uˆn2 ) / n p → 0 ). 1 n 2 ∑ uˆt n t =1 2) L’assenza di autocorrelazione del prim’ordine negli errori ( ρ1 = 0 ) dovrebbe produrre un valore della statistica D non molto distante da 2, mentre un valore di D vicino a 4 suggerirebbe la presenza di autocorrelazione negativa e un valore vicino a 0 la presenza di autocorrelazione positiva. 3) Al fine di utilizzare la statistica D per costruire un test sulla presenza di autocorrelazione del prim’ordine negli errori, è essenziale individuare la sua distribuzione (finita o asintotica). In alternativa si potrebbe usare il metodo del bootstrap, che alla luce di quanto provato da Durbin e Watson (vedi il teorema che segue) sembra poter dare migliori risultati. Teorema (di Durbin e Watson) – Considerato il modello yt = x′t β + ut con 19 { yt , xt } processo 4-Econometria, a.a. 2014-15 stazionario, tale che i) ii) Le variabili x t sono strettamente esogene, ut = ρ1ut −1 + ε t con è ε t ∼ n.i.d .(0, σ 2 ) , gli autori individuarono (al variare del numero di variabili indipendenti, per gli standard livelli di significatività e per differenti lunghezze del campione) una coppia di quantili (dl* , du* ) (spesso non presenti nei software econometrici, ma disponibili su internet) con 0 < dl* < du* < 2 , indipendenti dalla matrice X delle osservazioni delle variabili indipendenti, tali che un test per l’ipotesi ⎧ H 0 : ρ1 = 0 ⎨ ⎩ H1 : ρ1 > 0 è: “Si accetta H 0 se D > du* , si rifiuta H 0 se D < dl* , mentre se dl* < D < du* non si può dire nulla”. ⎧H : ρ = 0 Un test per l’ipotesi ⎨ 0 1 è uguale al precedente con 4 − D al posto di D . ⎩ H1 : ρ1 < 0 Il precedente test ha validità asintotica se ε t ∼ i.i.d .(0, σ 2 ) . top 20