11 aprile 2014
INDIPENDENZA STATISTICA – χ2
Dott.ssa Rita Allais
Facoltà di Economia Dipartimento di Statistica e Matematica
Applicata “Diego de Castro”
Università degli Studi di Torino
PER USO DIDATTICO INTERNO
M.s. bivariata: indipendenza statistica e χ2
Da una indagine condotta su 120 dipendenti di
una azienda, con riferimento ai due caratteri
mutabili A={genere} e B={professione}, emerge
la seguente distribuzione congiunta di frequenze
assolute:
Professione
Genere
Femmine
Impiegato/a
34
Operaio/a
ni.
48
Maschi
n.j
Sapendo che
120
nˆ 22 = 42
•Completare la tabella
•La mutabile doppia (A,B) è a componenti
indipendenti?
•Nel caso in cui non lo fosse calcolare χ2 e V
M.s. bivariata: indipendenza statistica χ2
nˆ22 = 42
n2. ⋅ n.2
nˆ22 =
n
n2. = 120 − 48 = 72
n ⋅ nˆ22
120 ⋅ 42
n.2 =
=
= 70
n2.
72
Professione
Impiegato/a
Operaio/a
ni.
Femmine
34
14
48
Maschi
16
56
72
n.j
50
70
120
Sesso
M.s. bivariata: indipendenza statistica e χ2
Distribuzioni condizionate:
Sono differenti quindi la composizione percentuale per
sesso varia al variare della professione
Genere |
Impiegato
ni1/n.1
Genere |
Operaio
ni2/n.2
Femmine
34/50 = 0.68
Femmine
14/70 = 0.2
Maschi
16/50 = 0.32
Maschi
56/70 = 0.8
La m.s. B è statisticamente indipendente
dalla m.s. A se le distribuzioni di frequenze
relative condizionate A | bj
(B | ai )
risultano identiche
M.s. bivariata: indipendenza statistica χ2
Se la m.s. A fosse indipendente dalla m.s. B si
otterrebbe la tabella
Profess.
Impiegato/a
Operaio/a
ni.
fi.
Femmine
0.4 50 =20
0.4 70 = 28
48
48/120 =
0.4
Maschi
0.6 50 = 30
0.6 70 = 42
72
72/120 =
0.6
n.j
50
70
120
Sesso
cij = nij − nˆij
Tabella delle contingenze:
Profess.
Impiegato/a
Operaio/a
Femmine
34-20 = +14
14-28 = -14
0
Maschi
16-30 = -14
56-42 = +14
0
0
0
Sesso
M.s. bivariata: indipendenza statistica χ2
r
cij2
s
χ2 = ∑ ∑
nˆij
i =1 j =i
=
142 142 142 142
=
+
+
+
= 28
20 30 28 42
 r
2
χ = n∑
 i =1

s
∑
j =i

− 1 =

ni. n. j

nij2
oppure
 342

142
162
562
= 120 
+
+
+
− 1 = 28
 48 ⋅ 50 48 ⋅ 70 72 ⋅ 50 70 ⋅ 72 
V =
χ2
max χ 2
( )
=
28
= 0.483
120
V.s. bivariata: indipendenza statistica e χ2
E’ data la v.s. doppia (X,Y) con la seguente
distribuzione congiunta di frequenze assolute
Y
X
0
1
2
0
1
2
10
0
0
10
0
20
0
20
0
0
10
10
Determinare:
χ 2 e V di Cramer;
10
20
10
40
V.s. bivariata: indipendenza statistica e χ2
Y
X
0
1
2
χ
2
0
1
2
10
0
0
10
0
20
0
20
0
0
10
10
10
20
10
40
] E [Y ] = 1 .5 − 1 =
0 .5
= χ m2 a x = 8 0
V =1
E [X
V
] = E [Y ] = 1
[ X ] = V [Y ] = 0 .5
C ov [X ,Y
]=
ρ =
E [XY
]−
E [X
C ov [X ,Y
V
[X ]
V
]
[Y ]
=
0 .5
=1
0 .5 0 .5
MEDIE CONDIZIONATE
Nella seguente tabella sono riportati gli importi
delle polizze vendute in un mese da due agenti
assicurativi.
Importo
0 -| 2
2 -| 3
3 -| 5
Ag 1
8
4
6
18
Ag 2
10
60
2
72
18
64
8
90
Agenti
Valutare se gli importi delle polizze stipulate
dipendono dall’agente.
INDIPENDENZA STATISTICA
INDIPENDENZA IN MEDIA
DISTRIBUZIONI CONDIZIONATE
Importo | Ag1
Importo | Ag 2
0 -| 2
0.444
0 -| 2
0.139
2 -| 3
0.222
2 -| 3
0.833
3 -| 5
0.333
3 -| 5
0.028
La v.s. mista ha dunque componenti
statisticamente dipendenti poiché le
distribuzioni condizionate relative non
risultano identiche e pertanto gli importi delle
polizze stipulate dipendono dall’agente.
( χ2 = 29.41
V = 0.33 )