Statistica economica a.a. 2013/14 Dr. Luca Secondi 07 a – Test di indipendenza Test di indipendenza Siano X e Y rispettivamente due caratteri tali che H siano le modalità di X e K le modalità di Y (tabella a doppia entrata) Si vuole verificare sulla base delle n osservazioni campionarie l’ipotesi nulla di indipendenza statistica tra X e Y nella popolazione H0 : pij = pip j H1 : pij ≠ pip j o, equivalentemente H0 : nij = ni.n.j n H1 : nij ≠ ni.n.j n dove pij e nij indicano, rispettivamente, la generica frequenza congiunta relativa e assoluta 2 Test di indipendenza La statistica test utilizzata è data da χ 2 H = ∑ i =1 c ∑ j =1 n K 2 ij ' ij ' ij cij = nij − n nij freq. osservate nij' freq. teoriche che, per n grande, ha una distribuzione chiquadrato con (K-1)(H-1) gradi di libertà Maggiore sarà il valore della statistica e maggiore sarà l’evidenza contro l’ipotesi nulla, il test pertanto è sempre ad una coda 3 Distribuzione chi-quadrato χ X~ χ x>0 Asimmetrica, χ24 2 g 2 g Asimmetrica Dipende da g (gradi di libertà) 2 χ10 2 χ15 Se si considerano g v.c. normali standardizzate e indipendenti allora la somma dei loro quadrati si distribuisce come una χ 2g con g gradi di libertà: Z12 + Z22 + .... + Zg2 ∼ χg2 4 Tavola del chi-quadrato (Area sulla coda destra, da χ 2 all'infinito) g\p 0,995 0,99 0,975 0,95 0,9 0,75 0,5 0,25 0,1 0,05 0,025 0,01 0,005 1 0,0000 0,0002 0,0010 0,0039 0,0158 0,1015 0,4549 1,3233 2,7055 3,8415 5,0239 6,6349 7,8794 2 0,0100 0,0201 0,0506 0,1026 0,2107 0,5754 1,3863 2,7726 4,6052 5,9915 7,3778 9,2103 10,5966 3 0,0717 0,1148 0,2158 0,3519 0,5844 1,2125 2,3660 4,1083 6,2514 7,8147 9,3484 11,3449 12,8382 4 0,2070 0,2971 0,4844 0,7107 1,0636 1,9226 3,3567 5,3853 7,7794 9,4877 11,1433 13,2767 14,8603 5 0,4117 0,5543 0,8312 1,1455 1,6103 2,6746 4,3515 6,6257 9,2364 11,0705 12,8325 15,0863 16,7496 6 0,6757 0,8721 1,2373 1,6354 2,2041 3,4546 5,3481 7,8408 10,6446 12,5916 14,4494 16,8119 18,5476 7 0,9893 1,2390 1,6899 2,1674 2,8331 4,2549 6,3458 9,0372 12,0170 14,0671 16,0128 18,4753 20,2777 8 1,3444 1,6465 2,1797 2,7326 3,4895 5,0706 7,3441 10,2189 13,3616 15,5073 17,5346 20,0902 21,9550 9 1,7349 2,0879 2,7004 3,3251 4,1682 5,8988 8,3428 11,3888 14,6837 16,9190 19,0228 21,6660 23,5894 10 2,1559 2,5582 3,2470 3,9403 4,8652 6,7372 9,3418 12,5489 15,9872 18,3070 20,4832 23,2093 25,1882 Sulla prima colonna il numero dei gradi di libertà (g) Sulla prima riga l’area alla destra del valore chi quadrato cercato (area rossa nel disegno) All’incrocio si legge il valore chi-quadrato della corrispondente distribuzione che lascia alla sua destra tale area 5 Con Excel La funzione DISTRIB.CHI(x;g) calcola le probabilità della distribuzione Chi-quadrato come P(χ2g > x ) cioè come area della coda destra x è il valore della distribuzione g è il numero dei gradi di libertà La funzione INV.CHI(prob;g) calcola il valore della distribuzione Chi-quadrato che lascia alla sua destra un’area pari a prob 6 Test di indipendenza α χα2;(K −1)(H−1) Se il valore del Chi-quadrato empirico è inferiore al valore critico definito da α si accetta l’ipotesi di indipendenza tra X e Y. 7 Tavola del chi-quadrato (Area sulla coda destra, da χ 2 all'infinito) g\p 0,995 0,99 0,975 0,95 0,9 0,75 0,5 0,25 0,1 0,05 0,025 0,01 0,005 1 0,0000 0,0002 0,0010 0,0039 0,0158 0,1015 0,4549 1,3233 2,7055 3,8415 5,0239 6,6349 7,8794 2 0,0100 0,0201 0,0506 0,1026 0,2107 0,5754 1,3863 2,7726 4,6052 5,9915 7,3778 9,2103 10,5966 3 0,0717 0,1148 0,2158 0,3519 0,5844 1,2125 2,3660 4,1083 6,2514 7,8147 9,3484 11,3449 12,8382 4 0,2070 0,2971 0,4844 0,7107 1,0636 1,9226 3,3567 5,3853 7,7794 9,4877 11,1433 13,2767 14,8603 5 0,4117 0,5543 0,8312 1,1455 1,6103 2,6746 4,3515 6,6257 9,2364 11,0705 12,8325 15,0863 16,7496 6 0,6757 0,8721 1,2373 1,6354 2,2041 3,4546 5,3481 7,8408 10,6446 12,5916 14,4494 16,8119 18,5476 7 0,9893 1,2390 1,6899 2,1674 2,8331 4,2549 6,3458 9,0372 12,0170 14,0671 16,0128 18,4753 20,2777 8 1,3444 1,6465 2,1797 2,7326 3,4895 5,0706 7,3441 10,2189 13,3616 15,5073 17,5346 20,0902 21,9550 9 1,7349 2,0879 2,7004 3,3251 4,1682 5,8988 8,3428 11,3888 14,6837 16,9190 19,0228 21,6660 23,5894 10 2,1559 2,5582 3,2470 3,9403 4,8652 6,7372 9,3418 12,5489 15,9872 18,3070 20,4832 23,2093 25,1882 8