Statistica economica
a.a. 2013/14
Dr. Luca Secondi
07 a – Test di indipendenza
Test di indipendenza
Siano X e Y rispettivamente due caratteri tali che H
siano le modalità di X e K le modalità di Y (tabella
a doppia entrata)
Si vuole verificare sulla base delle n osservazioni
campionarie l’ipotesi nulla di indipendenza
statistica tra X e Y nella popolazione
H0 : pij = pip j
H1 : pij ≠ pip j
o, equivalentemente
H0 : nij = ni.n.j n
H1 : nij ≠ ni.n.j n
dove pij e nij indicano, rispettivamente, la generica
frequenza congiunta relativa e assoluta
2
Test di indipendenza
La statistica test utilizzata è data da
χ
2
H
=
∑
i =1
c
∑
j =1 n
K
2
ij
'
ij
'
ij
cij = nij − n
nij
freq. osservate
nij'
freq. teoriche
che, per n grande, ha una distribuzione chiquadrato con (K-1)(H-1) gradi di libertà
Maggiore sarà il valore della statistica e maggiore
sarà l’evidenza contro l’ipotesi nulla, il test pertanto
è sempre ad una coda
3
Distribuzione chi-quadrato χ
X~ χ
x>0
Asimmetrica,
χ24
2
g
2
g
Asimmetrica
Dipende da g
(gradi di libertà)
2
χ10
2
χ15
Se si considerano g v.c. normali standardizzate e indipendenti allora la
somma dei loro quadrati si distribuisce come una χ 2g con g gradi di libertà:
Z12 + Z22 + .... + Zg2 ∼ χg2
4
Tavola del chi-quadrato
(Area sulla coda destra, da χ 2 all'infinito)
g\p
0,995
0,99
0,975
0,95
0,9
0,75
0,5
0,25
0,1
0,05
0,025
0,01
0,005
1
0,0000
0,0002
0,0010
0,0039
0,0158
0,1015
0,4549
1,3233
2,7055
3,8415
5,0239
6,6349
7,8794
2
0,0100
0,0201
0,0506
0,1026
0,2107
0,5754
1,3863
2,7726
4,6052
5,9915
7,3778
9,2103
10,5966
3
0,0717
0,1148
0,2158
0,3519
0,5844
1,2125
2,3660
4,1083
6,2514
7,8147
9,3484
11,3449
12,8382
4
0,2070
0,2971
0,4844
0,7107
1,0636
1,9226
3,3567
5,3853
7,7794
9,4877
11,1433
13,2767
14,8603
5
0,4117
0,5543
0,8312
1,1455
1,6103
2,6746
4,3515
6,6257
9,2364
11,0705
12,8325
15,0863
16,7496
6
0,6757
0,8721
1,2373
1,6354
2,2041
3,4546
5,3481
7,8408
10,6446
12,5916
14,4494
16,8119
18,5476
7
0,9893
1,2390
1,6899
2,1674
2,8331
4,2549
6,3458
9,0372
12,0170
14,0671
16,0128
18,4753
20,2777
8
1,3444
1,6465
2,1797
2,7326
3,4895
5,0706
7,3441
10,2189
13,3616
15,5073
17,5346
20,0902
21,9550
9
1,7349
2,0879
2,7004
3,3251
4,1682
5,8988
8,3428
11,3888
14,6837
16,9190
19,0228
21,6660
23,5894
10
2,1559
2,5582
3,2470
3,9403
4,8652
6,7372
9,3418
12,5489
15,9872
18,3070
20,4832
23,2093
25,1882
Sulla prima colonna il numero dei gradi di libertà (g)
Sulla prima riga l’area alla destra del valore chi quadrato cercato (area
rossa nel disegno)
All’incrocio si legge il valore chi-quadrato della corrispondente
distribuzione che lascia alla sua destra tale area
5
Con Excel
La funzione DISTRIB.CHI(x;g) calcola le
probabilità della distribuzione Chi-quadrato
come P(χ2g > x ) cioè come area della coda
destra
x è il valore della distribuzione
g è il numero dei gradi di libertà
La funzione INV.CHI(prob;g) calcola il
valore della distribuzione Chi-quadrato che
lascia alla sua destra un’area pari a prob
6
Test di indipendenza
α
χα2;(K −1)(H−1)
Se il valore del Chi-quadrato empirico è
inferiore al valore critico definito da α si
accetta l’ipotesi di indipendenza tra X e Y.
7
Tavola del chi-quadrato
(Area sulla coda destra, da χ 2 all'infinito)
g\p
0,995
0,99
0,975
0,95
0,9
0,75
0,5
0,25
0,1
0,05
0,025
0,01
0,005
1
0,0000
0,0002
0,0010
0,0039
0,0158
0,1015
0,4549
1,3233
2,7055
3,8415
5,0239
6,6349
7,8794
2
0,0100
0,0201
0,0506
0,1026
0,2107
0,5754
1,3863
2,7726
4,6052
5,9915
7,3778
9,2103
10,5966
3
0,0717
0,1148
0,2158
0,3519
0,5844
1,2125
2,3660
4,1083
6,2514
7,8147
9,3484
11,3449
12,8382
4
0,2070
0,2971
0,4844
0,7107
1,0636
1,9226
3,3567
5,3853
7,7794
9,4877
11,1433
13,2767
14,8603
5
0,4117
0,5543
0,8312
1,1455
1,6103
2,6746
4,3515
6,6257
9,2364
11,0705
12,8325
15,0863
16,7496
6
0,6757
0,8721
1,2373
1,6354
2,2041
3,4546
5,3481
7,8408
10,6446
12,5916
14,4494
16,8119
18,5476
7
0,9893
1,2390
1,6899
2,1674
2,8331
4,2549
6,3458
9,0372
12,0170
14,0671
16,0128
18,4753
20,2777
8
1,3444
1,6465
2,1797
2,7326
3,4895
5,0706
7,3441
10,2189
13,3616
15,5073
17,5346
20,0902
21,9550
9
1,7349
2,0879
2,7004
3,3251
4,1682
5,8988
8,3428
11,3888
14,6837
16,9190
19,0228
21,6660
23,5894
10
2,1559
2,5582
3,2470
3,9403
4,8652
6,7372
9,3418
12,5489
15,9872
18,3070
20,4832
23,2093
25,1882
8