Nella seguente tabella sono riportati il PIL Pro-capite (in migliaia di euro) e la quantità di investimenti privati pro-capite effettuati (in centinaia di euro) da 10 nazioni europee. Investimenti Privati PIL/Pro-capite 18 30 24 35 25 38 11 20 32 45 15 25 40 60 12 21 35 49 21 33 Stimare il modello di regressione lineare semplice attraverso l’algebra delle matrici. Determinare la matrice di varianza e covarianza del vettore β. Effettuare il test ANOVA sulla regressione. Costruire gli intervalli di confidenza per entrambi i parametri con un livello di fiducia del 99%. *** Definiamo la matrice X: 1 1 1 1 1 1 1 1 1 1 30 35 38 20 45 25 60 21 49 33 Verifichiamo che la matrice X’X abbia inversa: 1 30 1 1 1 1 1 35 38 20 45 25 1 1 1 1 1 1 1 1 1 60 21 49 33 1 1 1 1 1 30 35 38 20 45 10 356 ; 25 356 14150 60 21 49 33 || 10 14150 356 356 14764 Si può procedere al calcolo dell’inversa: 1 0,9584 0,0241 14150 356 ! 0,0241 0,0007 || 356 10 14764 (Si ricorda che con A si è indicata la matrice aggiunta, o matrice dei cofattori) Verifichiamo che questa sia proprio l’inversa: 0,9584 0,0241 10 1 0 356 ! ; 0,0241 0,0007 356 14150 0 1 0,9584 0,0241 1 0 356 10 ! . 0,0241 0,0007 0 1 356 14150 Possiamo calcolare il vettore dei coefficienti: "= # 0,9584 0,0241 1 ! 0,0241 0,0007 30 1 1 1 1 1 1 35 38 20 45 25 60 18 24 25 11 1 1 1 32 21 49 33 15 40 12 35 21 18 24 25 11 0,2350 0,1145 0,0421 0,4762 0,1267 0,3556 0,4884 0,4520 0,2231 0,1627 32 ! = 0,0038 0,0004 0,0016 0,0106 0,0064 0,0072 0,0165 0,0099 0,0091 0,0018 15 40 12 35 21 3,9522 ! 0,7655 L’intercetta è pari a -3,9522 ed il coefficiente angolare è pari a 0,7655. Il modello stimato è, pertanto $&% 3,9522 ' 0,7655() ' *) Calcoliamo gli indici di posizione e di variabilità uni variati: (+ 35,6; $. 23,3; /*0$ 876,1; Sappiamo che 1 2345,6 748954896 :; 74895 74896 /*0( 1476,4 ;=>?,= 0,7655 √ @>?,; 0,9937 √ Possiamo calcolare la somma dei quadrati dei residui: B B )C; )C; A *) A$) $D) E /*0$F1 1E G 876,1F1 0,9937E G 10,9198 La stima della varianza è, pertanto HE ∑B)C; *) 10,9198 1,3650 JK 8 La matrice di varianza e covarianza di β è L H E ; 1,3650 1,3082 0,0329 0,9584 0,0241 ! 0,0329 0,0009 0,0241 0,0007 La varianza di :MN è 1,3082, mentre quella di :M; è 0,0009. Costruiamo la tabella ANOVA. I dati in nostro possesso sono: Devianza di y = 876,1; Somma dei quadrati dei residui = 10,9198. La devianza della regressione è, pertanto, pari a 876,1 - 10,9198 = 865,1802. La tabella ANOVA è pertanto: Somma dei Quadrati 865,1802 10,9198 876,1 Regressione Errori Totale Gradi di Libertà 1 8 9 Medie 865,1802 1,3650 F 633,843 La F critica, ad un livello di significatività dell’1% con 1 grado di libertà al numeratore ed 8 gradi di libertà al denominatore, è pari a 11,2. Siccome la F calcolata è superiore alla F critica, si rifiuta l’ipotesi nulla. Calcoliamo gli intervalli di confidenza per i parametri della retta di regressione. Dalla Matrice di varianza e covarianza si sa che la varianza di :MN è 1,3082, da cui lo standard error è pari a √1,3082 1,1438 L’intervallo di confidenza (con livello di confidenza pari al 99%) per l’intercetta del modello è, quindi: :MN OPQR E;BES THP:MN S U :N U :MN ' OPQR E;BES THP:MN S F3,9522 3,355 1,1438; 3,9522 ' 3,355 1,1438G F7,7896; 0,1148G Dalla Matrice di varianza e covarianza si sa che la varianza di :M; è 0,0009, da cui lo standard error è pari a √0,0009 0,03 L’intervallo di confidenza (con livello di confidenza pari al 99%) per il coefficiente angolare del modello è, quindi: :M; OPQR E;BES THP:M; S U :; U :M; ' OPQR E;BES THP:M; S F0,7655 3,355 0,03; 0,7655 ' 3,355 0,03G F0,6649; 0,8662G Entrambi gli intervalli di confidenza non contengono il valore zero, per cui si può concludere che i coefficienti sono significativamente diversi da zero. Di seguito si riporta l’output della regressione fatta con gretl sugli stessi dati: A meno delle approssimazioni decimali, i coefficienti sono (ovviamente) identici a quelli calcolati. Gli asterischi dopo i p-value indicano la significatività statistica (*=coefficiente significativo al 10%; **=coefficiente significativo al 5%; ** *=coefficiente significativo all’ 1%) Gli intervalli di confidenza (volutamente costruiti con un livello di fiducia del 99% -ve ne accorgete guardando in alto a sinistra il valore della t che indica i gradi di libertà (8) ed il valore di VR2 (0,005) -) sono uguali a quelli calcolati a meno di approssimazioni decimali. La tabella ANOVA riporta il P-value della F calcolata (molto prossimo allo zero). PER ESERCIZIO STIMARE IL MODELLO SENZA L’UTILIZZO DELL’ALGEBRA DELLE MATRICI E VERIFICARE DI OTTENERE GLI STESSI IDENTICI RISULTATI