11 aprile 2014 INDIPENDENZA STATISTICA – χ2 Dott.ssa Rita Allais Facoltà di Economia Dipartimento di Statistica e Matematica Applicata “Diego de Castro” Università degli Studi di Torino PER USO DIDATTICO INTERNO M.s. bivariata: indipendenza statistica e χ2 Da una indagine condotta su 120 dipendenti di una azienda, con riferimento ai due caratteri mutabili A={genere} e B={professione}, emerge la seguente distribuzione congiunta di frequenze assolute: Professione Genere Femmine Impiegato/a 34 Operaio/a ni. 48 Maschi n.j Sapendo che 120 nˆ 22 = 42 •Completare la tabella •La mutabile doppia (A,B) è a componenti indipendenti? •Nel caso in cui non lo fosse calcolare χ2 e V M.s. bivariata: indipendenza statistica χ2 nˆ22 = 42 n2. ⋅ n.2 nˆ22 = n n2. = 120 − 48 = 72 n ⋅ nˆ22 120 ⋅ 42 n.2 = = = 70 n2. 72 Professione Impiegato/a Operaio/a ni. Femmine 34 14 48 Maschi 16 56 72 n.j 50 70 120 Sesso M.s. bivariata: indipendenza statistica e χ2 Distribuzioni condizionate: Sono differenti quindi la composizione percentuale per sesso varia al variare della professione Genere | Impiegato ni1/n.1 Genere | Operaio ni2/n.2 Femmine 34/50 = 0.68 Femmine 14/70 = 0.2 Maschi 16/50 = 0.32 Maschi 56/70 = 0.8 La m.s. B è statisticamente indipendente dalla m.s. A se le distribuzioni di frequenze relative condizionate A | bj (B | ai ) risultano identiche M.s. bivariata: indipendenza statistica χ2 Se la m.s. A fosse indipendente dalla m.s. B si otterrebbe la tabella Profess. Impiegato/a Operaio/a ni. fi. Femmine 0.4 50 =20 0.4 70 = 28 48 48/120 = 0.4 Maschi 0.6 50 = 30 0.6 70 = 42 72 72/120 = 0.6 n.j 50 70 120 Sesso cij = nij − nˆij Tabella delle contingenze: Profess. Impiegato/a Operaio/a Femmine 34-20 = +14 14-28 = -14 0 Maschi 16-30 = -14 56-42 = +14 0 0 0 Sesso M.s. bivariata: indipendenza statistica χ2 r cij2 s χ2 = ∑ ∑ nˆij i =1 j =i = 142 142 142 142 = + + + = 28 20 30 28 42 r 2 χ = n∑ i =1 s ∑ j =i − 1 = ni. n. j nij2 oppure 342 142 162 562 = 120 + + + − 1 = 28 48 ⋅ 50 48 ⋅ 70 72 ⋅ 50 70 ⋅ 72 V = χ2 max χ 2 ( ) = 28 = 0.483 120 V.s. bivariata: indipendenza statistica e χ2 E’ data la v.s. doppia (X,Y) con la seguente distribuzione congiunta di frequenze assolute Y X 0 1 2 0 1 2 10 0 0 10 0 20 0 20 0 0 10 10 Determinare: χ 2 e V di Cramer; 10 20 10 40 V.s. bivariata: indipendenza statistica e χ2 Y X 0 1 2 χ 2 0 1 2 10 0 0 10 0 20 0 20 0 0 10 10 10 20 10 40 ] E [Y ] = 1 .5 − 1 = 0 .5 = χ m2 a x = 8 0 V =1 E [X V ] = E [Y ] = 1 [ X ] = V [Y ] = 0 .5 C ov [X ,Y ]= ρ = E [XY ]− E [X C ov [X ,Y V [X ] V ] [Y ] = 0 .5 =1 0 .5 0 .5 MEDIE CONDIZIONATE Nella seguente tabella sono riportati gli importi delle polizze vendute in un mese da due agenti assicurativi. Importo 0 -| 2 2 -| 3 3 -| 5 Ag 1 8 4 6 18 Ag 2 10 60 2 72 18 64 8 90 Agenti Valutare se gli importi delle polizze stipulate dipendono dall’agente. INDIPENDENZA STATISTICA INDIPENDENZA IN MEDIA DISTRIBUZIONI CONDIZIONATE Importo | Ag1 Importo | Ag 2 0 -| 2 0.444 0 -| 2 0.139 2 -| 3 0.222 2 -| 3 0.833 3 -| 5 0.333 3 -| 5 0.028 La v.s. mista ha dunque componenti statisticamente dipendenti poiché le distribuzioni condizionate relative non risultano identiche e pertanto gli importi delle polizze stipulate dipendono dall’agente. ( χ2 = 29.41 V = 0.33 )