3 aprile 2014
Lezione 12:
Dipendenza in media
Dott.ssa Rita Allais PhD
Dipartimento di scienze economico-sociali e matematico-statistiche
Università degli Studi di Torino
PER USO DIDATTICO INTERNO
Relazioni fra mutabile e variabile
Ω = {alberghi della provincia di Torino}, Y = numero camere
N = 1089
Media Y = 29,27
Dev. Std. Y = 33,003
V[Y] = 1089,198
3/04/2014
Dipendenza in media
2
Relazione fra mutabile e variabile
Ω = {alberghi della provincia di Torino}
Y = numero camere, A= categoria dell’albergo
Ricodifica:
1= 1 o 2 stelle
2 = 3 stelle
3 =4 stelle
3/04/2014
Dipendenza in media
3
Relazioni fra variabile e mutabile
3/04/2014
Dipendenza in media
4
Dipendenza in media
Esiste dipendenza in media fra la variabile Y = numero di
camere e la mutabile A = categoria dell’albergo
3/04/2014
Dipendenza in media
5
Indipendenza in media
Definizione valida per una variabile statistica mista o doppia
Y è indipendente in media da A se le r medie delle variabili
condizionate Y |ai sono tutte uguali tra loro, cioè se
E[Y |a1] = . . . = E[Y |ai] = . . . = E[Y |ar]= E[Y]
3/04/2014
Indipendenza statistica
Indipendenza in media
Indipendenza in media
Indipendenza statistica
Dipendenza in media
6
Indipendenza in media ma non globale
Y|a1
11
12
13
14
15
16
17
18
19
20 21
Y|a2
11
12
13
14
15
16
17
18
19
20 21
11
12
13
14
15
16
17
18
19
20 21
E[Y|a1] = 15.5
E[Y|a2 ]= 15.5
Y|a3
3/04/2014
Dipendenza in media
E[Y|a3]= 15.5
7
Misura della dipendenza in media
Come indice della dipendenza in media prendiamo una appropriata
misura di diversità delle medie condizionate.
Considerando che la media della distribuzione marginale di Y è la
media ponderata delle r medie condizionate E[Y|ai] i= 1, … , r, ovvero
r
1
E [Y ] =
n
∑ E [Y a ] n
i
i =1
i•
la varianza delle medie condizionate, misura della loro variabilità, è:
[ ]
V EY
A
1
=
n
∑ (E [Y a ] − E [Y ])
r
i =1
i
Dipendenza in media
ni •
[ ]= 0
Se Y è indipendente in media da A V E Y
3/04/2014
2
A
8
Scomposizione della varianza
Data la variabile statistica mista (A, Y), la varianza della sua
componente Y è data dalla somma del valor medio delle varianze
condizionate più la varianza delle medie condizionate, in simboli
vale cioè l’uguaglianza:
V [Y ] = E[VY|A] + V [EY|A]
Varianza interna
ai gruppi o
varianza residua
non spiegata
dove
3/04/2014
Varianza tra i
gruppi o
varianza
spiegata
[ ]
E VY
A
1
=
n
Dipendenza in media
∑ V [Y
r
i =1
a i ]n i •
9
Rapporto di correlazione Eta quadro
Per misurare l’intensità del legame di dipendenza in media è
possibile giungere ad un indice normalizzato, sfruttando la
proprietà della scissione della varianza.
η
2
Y A
=
[ ]= varianza tra i gruppi
V EY A
V [Y ]
varianza t otale
= 0 INDIPENDENZA IN MEDIA
0 ≤ηY2 A ≤ 1
= 1 MASSIMA DIPENDENZA IN MEDIA
3/04/2014
Dipendenza in media
10
Indipendenza in media:
η
2
Y A
=
⇔ EY
Y
[
V EY
A
]= 0
⇔
V [Y ]
costante
A
⇔
[
2
η
V EY
A
=0
]= 0
⇔
medie condizionate tutte uguali
Valori misurati sulle
singole unità statistiche
E[Y|a1]
E[Y]
E[Y|ar]
E[Y|a2]
a1
3/04/2014
a2
Dipendenza in media
ar
A
11
Massima dipendenza in media:
η Y2 A
=
[
V EY
V [Y
A
]
[ ]= 0
⇔ E VY
A
]= 1
⇔
⇔
VY
E[Y|ar]
E[Y|a2]
E[Y]
E[Y|a1]
3/04/2014
=1


V E

Y
A


=1 ⇔




V E
 + E V Y A 
Y
A




⇔ la variabilità è tutta spiegata
A = 0
Y
a1
2
η
a2
Dipendenza in media
ar
Non esiste
variabilità interna
ai gruppi: in ogni
gruppo i valori
misurati sulle
singole unità
statistiche sono
tutti uguali
A
12
Nell’esempio…
[]
V [Y ] = 1089,198
 
E Y = E E Y

 
 
V E Y


ηY2 A
=
 15,36 ⋅ 412 + 30,27 ⋅ 546 + 68,85⋅131

A =
= 29,27


1089
2
2
2
15
,
36
⋅
412
+
30
,
27
⋅
546
+
68
,
85
⋅131


A =
− 29,272 = 262,156


1089
262,156
= 0,241
1089,198
3/04/2014
Dipendenza in media
13
Bibliografia
Newbold P. , Carlson W., Thorne B. Statistica , Pearson-Prentice
Hall
Cicchitelli G.
Statistica – Principi e Metodi , Pearson –Education
R. Corradetti, A. Durio, E. D. Isaia Elementi di Statistica Descrittiva
3/04/2014
Dipendenza in media
14