27 marzo 2014
Variabili statistiche bivariate.
Distribuzioni doppie e condizionate.
Dott.ssa Rita Allais
Dipartimento di scienze economico-sociali e matematico-statistiche
Dipartimento di Management
Università degli Studi di Torino
PER USO DIDATTICO INTERNO
Mutabile e variabile statistica bivariata
L’applicazione che associa a ciascuna unità ωα del collettivo Ω uno
ed un solo elemento dell’insieme M1x M2 viene detta:
– mutabile statistica bivariata (doppia), e indicata con (A,B), se gli
elementi di M1 e M2 sono attributi;
– variabile statistica mista, e indicata con (A, Y ), se gli elementi di
M1 sono attributi e M2 è costituito da elementi di R;
– variabile statistica bivariata (doppia), e indicata con (X, Y ), se gli
insiemi M1 e M2 sono costituiti da elementi di R.
28/03/2014
Distribuzioni bivariate. Distribuzioni condizionate.
2
Mutabile e variabile statistica bivariata
Ω
Ω
R Altezza
in cm
R
185
180
170
170
155
Anno
imm.
2007
R2
2003
2000
M
F
Genere
Rilevazione di una variabile
statistica mista
28/03/2014
2000
4000
Rilevazione di una variabile
statistica bivariata
Distribuzioni bivariate. Distribuzioni condizionate.
9000
Prezzo
dell’usato
3
Distribuzione di frequenze congiunte:
tabella a doppia entrata
Y
y1
…
yj
…
yc
a1
n11
…
n1j
…
n1c
M
M
ai
ni1
M
M
ar
nr1
…
nrj
…
nrc
n r.
n.1
…
n.j
…
n.c
n
A
Frequenze
congiunte
assolute
M
…
nij
n1.
M
…
nic
M
Frequenze
marginali
di riga
n i.
c
ni • = ∑ nik
M
k =1
r
Frequenze marginali di colonna
28/03/2014
n
• j
= ∑ n
k =1
Distribuzioni bivariate. Distribuzioni condizionate.
k
j
4
Frequenze condizionate
Y
A
a1
y1
…
yj
…
yc
n11
…
n1j
…
n1c
n1.
ai
ni1
…
nij
…
nic
n i.
ar
nr1
…
nrj
…
nrc
n r.
n.1
…
n.j
…
n.c
n
Frequenze relative
condizionate di Y|ai
28/03/2014
 y1

Y a i ≡  n i1
n
 i•
L
L
yj
n ij
L
L
ni •
Distribuzioni bivariate. Distribuzioni condizionate.
Frequenze relative
condizionate di A|yj
 a1 L ai L ar 

nij
nrj 
A y j ≡  n1 j
L
L
n• j
n• j
n• j 

yc 

n ic 
n i • 
5
Variabile statistica condizionata.
Data una variabile statistica mista (A , Y) definita da Ω a M1 x M2 e
scelta una qualunque modalità
ai di A, si definisce variabile
statistica Y condizionata alla modalità ai di A, Y|ai , l’applicazione
che associa a ciascuna unità statistica ωα per cui A ( ωα ) = ai uno ed
un solo elemento dell’insieme delle modalità M2. La distribuzione di
frequenze relative condizionate sarà dunque
 y1

Y a i ≡  n i1
n
 i•
28/03/2014
L
L
yj
n ij
ni •
Distribuzioni bivariate. Distribuzioni
condizionate.
L
L
yc 

n ic 
n i • 
6
Media e varianza condizionate
Nel caso di una variabile mista (A,Y) è possibile calcolare per la componente Y tutti
gli indici visti per le v.s. univariate.
Si avranno, ad esempio, media e varianza di Y:
1 c
E [Y ] = µ Y =
y j n• j
∑
n j =1
V [Y
]=
σ
2
Y
∑ (y
c
1
=
n
j =1
j
)
− µY
2
n• j
Inoltre, ciascuna delle r variabili condizionate Y|ai è dotata di una propria media
(media condizionata) e varianza (varianza condizionata):
c
E Y a i  = µ


V Y a i  = σ


Y ai
1
n i•
=
2
Y ai
V Y a i  = E Y



28/03/2014
=
1
n i•
2
∑
y
ni
j
j
j=1
c
∑
j=1

 y

j
− µ


a i  −  E  Y a i  





Distribuzioni bivariate. Distribuzioni
condizionate.
Y ai



2
ni
j
2
7
Esempio
Rilevazione effettuata sulle abitazioni di un piccolo comune Piemontese
riguardante numero di occupanti e numero di stanze delle abitazioni
X
Y
Numero stanze
N°occupanti
1
2
3
4
ni.
1
30
139
268
314
751
2
11
87
255
410
763
3
5
43
163
330
541
4
3
25
110
257
395
n.j
49
294
796
1311
2450
[ ] = 1 ⋅ 751
E X
[ ]=
E Y
28/03/2014
+ 2 ⋅ 763 + 3 ⋅ 541 + 4 ⋅ 395
2450
1 ⋅ 49 + 2 ⋅ 294 + 3 ⋅ 796 + 4 ⋅ 1311
= 2 ,2
= 3,4
2450
Distribuzioni bivariate. Distribuzioni
condizionate.
8
Distribuzione del numero di stanze per gli
alloggi occupati da una sola persona
X
Y
Numero stanze
N°occupanti
1
2
3
4
ni.
1
30
139
268
314
751
2
11
87
255
410
763
3
5
43
163
330
541
4
3
25
110
257
395
n.j
49
294
796
1311
2450
1 ⋅ 30 + 2 ⋅ 139 + 3 ⋅ 268 + 4 ⋅ 314
E Y X = 1 =
= 3 ,15


751

V Y X = 1 = E Y



=
2

X = 1 − E 2 Y X = 1 =



1 2 ⋅ 30 + 2 2 ⋅ 139 + 3 2 ⋅ 268 + 4 2 ⋅ 314
− 3 ,15
2
=
751
= 0 , 7575
28/03/2014
Distribuzioni bivariate. Distribuzioni
condizionate.
9
Distribuzione delle persone occupanti
abitazioni composte da due camere
X
Y
Numero stanze
N°occupanti
1
2
3
4
ni.
1
30
139
268
314
751
2
11
87
255
410
763
3
5
43
163
330
541
4
3
25
110
257
395
n.j
49
294
796
1311
2450
E  X Y

1 ⋅ 139
= 2  =

V  X Y


= 2  = E  X


=
1
2
+ 2 ⋅ 87
+ 3 ⋅ 43
+ 4 ⋅ 25
= 1 ,8
294
2
⋅ 139
Y

= 2 − E

+ 2
2
⋅ 87
2
 X Y

+ 3
2
⋅ 43
= 2  =

+ 4
2
⋅ 25
− 1 ,8
2
=
294
= 1 , 09
28/03/2014
Distribuzioni bivariate. Distribuzioni
condizionate.
10