Nella seguente tabella sono riportati il PIL Pro

Nella seguente tabella sono riportati il PIL Pro-capite (in migliaia di euro) e la quantità di
investimenti privati pro-capite effettuati (in centinaia di euro) da 10 nazioni europee.
Investimenti
Privati
PIL/Pro-capite
18
30
24
35
25
38
11
20
32
45
15
25
40
60
12
21
35
49
21
33
Stimare il modello di regressione lineare semplice attraverso l’algebra delle matrici. Determinare la matrice
di varianza e covarianza del vettore β. Effettuare il test ANOVA sulla regressione. Costruire gli intervalli di
confidenza per entrambi i parametri con un livello di fiducia del 99%.
***
Definiamo la matrice X:
1
1
1
1
1
1
1
1
1
1
30
35
38
20
45
25
60
21
49
33
Verifichiamo che la matrice X’X abbia inversa:
1
30
1
1
1
1
1
35 38 20 45 25
1
1
1
1
1
1
1
1 1
60 21 49 33 1
1
1
1
1
30
35
38
20
45
10
356
;
25
356 14150
60
21
49
33
|| 10 14150 356 356 14764
Si può procedere al calcolo dell’inversa:
1
0,9584 0,0241
14150 356
!
0,0241
0,0007
||
356
10
14764
(Si ricorda che con A si è indicata la matrice aggiunta, o matrice dei cofattori)
Verifichiamo che questa sia proprio l’inversa:
0,9584 0,0241 10
1 0
356
!
;
0,0241 0,0007 356 14150
0 1
0,9584 0,0241
1 0
356
10
!
.
0,0241
0,0007
0 1
356 14150
Possiamo calcolare il vettore dei coefficienti:
"= # 0,9584 0,0241
1
!
0,0241 0,0007
30
1
1
1
1
1
1
35 38 20 45 25 60
18
24
25
11
1
1
1
32
21 49 33
15
40
12
35
21
18
24
25
11
0,2350
0,1145 0,0421 0,4762 0,1267 0,3556 0,4884 0,4520 0,2231 0,1627
32
! =
0,0038 0,0004 0,0016 0,0106 0,0064 0,0072 0,0165 0,0099 0,0091 0,0018
15
40
12
35
21
3,9522
!
0,7655
L’intercetta è pari a -3,9522 ed il coefficiente angolare è pari a 0,7655.
Il modello stimato è, pertanto
$&% 3,9522 ' 0,7655() ' *)
Calcoliamo gli indici di posizione e di variabilità uni variati:
(+ 35,6; $. 23,3; /*0$ 876,1;
Sappiamo che 1 2345,6
748954896
:;
74895
74896
/*0( 1476,4
;=>?,=
0,7655 √ @>?,; 0,9937
√
Possiamo calcolare la somma dei quadrati dei residui:
B
B
)C;
)C;
A *) A$) $D) E /*0$F1 1E G 876,1F1 0,9937E G 10,9198
La stima della varianza è, pertanto
HE ∑B)C; *) 10,9198
1,3650
JK
8
La matrice di varianza e covarianza di β è
L H E ; 1,3650 1,3082 0,0329
0,9584 0,0241
!
0,0329 0,0009
0,0241 0,0007
La varianza di :MN è 1,3082, mentre quella di :M; è 0,0009.
Costruiamo la tabella ANOVA. I dati in nostro possesso sono:
Devianza di y = 876,1; Somma dei quadrati dei residui = 10,9198. La devianza della regressione è, pertanto,
pari a 876,1 - 10,9198 = 865,1802.
La tabella ANOVA è pertanto:
Somma dei Quadrati
865,1802
10,9198
876,1
Regressione
Errori
Totale
Gradi di Libertà
1
8
9
Medie
865,1802
1,3650
F
633,843
La F critica, ad un livello di significatività dell’1% con 1 grado di libertà al numeratore ed 8 gradi di libertà al
denominatore, è pari a 11,2. Siccome la F calcolata è superiore alla F critica, si rifiuta l’ipotesi nulla.
Calcoliamo gli intervalli di confidenza per i parametri della retta di regressione. Dalla Matrice di varianza e
covarianza si sa che la varianza di :MN è 1,3082, da cui lo standard error è pari a √1,3082 1,1438
L’intervallo di confidenza (con livello di confidenza pari al 99%) per l’intercetta del modello è, quindi:
:MN OPQR
E;BES
THP:MN S U :N U :MN ' OPQR
E;BES
THP:MN S
F3,9522 3,355 1,1438; 3,9522 ' 3,355 1,1438G F7,7896; 0,1148G
Dalla Matrice di varianza e covarianza si sa che la varianza di :M; è 0,0009, da cui lo standard error è pari a
√0,0009 0,03
L’intervallo di confidenza (con livello di confidenza pari al 99%) per il coefficiente angolare del modello è,
quindi:
:M; OPQR
E;BES
THP:M; S U :; U :M; ' OPQR
E;BES
THP:M; S
F0,7655 3,355 0,03; 0,7655 ' 3,355 0,03G F0,6649; 0,8662G
Entrambi gli intervalli di confidenza non contengono il valore zero, per cui si può concludere che i
coefficienti sono significativamente diversi da zero.
Di seguito si riporta l’output della regressione fatta con gretl sugli stessi dati:
A meno delle approssimazioni decimali, i coefficienti sono (ovviamente) identici a quelli calcolati. Gli
asterischi dopo i p-value indicano la significatività statistica (*=coefficiente significativo al 10%;
**=coefficiente significativo al 5%; ** *=coefficiente significativo all’ 1%)
Gli intervalli di confidenza (volutamente costruiti con un livello di fiducia del 99% -ve ne accorgete
guardando in alto a sinistra il valore della t che indica i gradi di libertà (8) ed il valore di VR2 (0,005) -) sono
uguali a quelli calcolati a meno di approssimazioni decimali.
La tabella ANOVA riporta il P-value della F calcolata (molto prossimo allo zero).
PER ESERCIZIO STIMARE IL MODELLO SENZA L’UTILIZZO DELL’ALGEBRA DELLE MATRICI E VERIFICARE DI
OTTENERE GLI STESSI IDENTICI RISULTATI