Distribuzioni campionarie (media e varianza)

Esercizio 1
Si supponga di aver assegnato ad una popolazione di N = 4 dattilografe un test e di aver ottenuto i
seguenti risultati:
Dattilografa
A
B
C
D
N. Errori
3
2
1
4
La variabile X, il numero di errori commessi da ciascuna dattilografa, ha μ X = 2,5 e σ X2 = 1, 25 .
Determinare l’universo campionario rispettivamente per n = 2, n = 3 e n = 4 immaginando di
procedere con un campionamento casuale semplice (con reintroduzione).
Inoltre, per i differenti valori di n determinare:
1) la distribuzione della variabile casuale media campionaria, calcolandone il valore atteso e la
varianza;
2) la distribuzione della variabile casuale varianza campionaria, calcolandone il valore atteso.
Svolgimento
Trattandosi di campionamento con reintroduzione, l’universo campionario è pari a Nn.
Per n = 2, quindi, i possibili campioni sono 42 = 16, e cioè:
Campione
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Dattilografe
A,A
A,B
A,C
A,D
B,A
B,B
B,C
B,D
C,A
C,B
C,C
C,D
D,A
D,B
D,C
D,D
Risultati del
campione
3,3
3,2
3,1
3,4
2,3
2,2
2,1
2,4
1,3
1,2
1,1
1,4
4,3
4,2
4,1
4,4
Media Campionaria
3,0
2,5
2,0
3,5
2,5
2,0
1,5
3,0
2,0
1,5
1,0
2,5
3,5
3,0
2,5
4,0
Supponendo che ogni dattilografa ha la medesima probabilità di essere estratta nel campione e ciò
che interessa è la media campionaria, cioè il numero medio di errori commessi da ogni campione, la
funzione di probabilità è la seguente:
P(xi)
Xi
0,0625
0,125
0,1875
0,25
0,1875
0,125
0,0625
1
1,5
2
2,5
3
3,5
4
Come si può facilmente calcolare, E ( X ) = 2,5 e
Var (X) = 0,625.
0,3
0,25
p
0,2
0,15
0,1
0,05
0
1
1,5
2
2,5
3
media campionaria ad ogni estrazione
3,5
4
Per determinare la distribuzione della variabile casuale varianza campionaria bisogna calcolare la
2
1 n
statistica varianza campionaria S 2 = ∑ ( xi − X ) ad ogni estrazione:
n i =1
Campione
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Risultati del
campione
3,3
3,2
3,1
3,4
2,3
2,2
2,1
2,4
1,3
1,2
1,1
1,4
4,3
4,2
4,1
4,4
Dattilografe
A,A
A,B
A,C
A,D
B,A
B,B
B,C
B,D
C,A
C,B
C,C
C,D
D,A
D,B
D,C
D,D
Media Campionaria
3,0
2,5
2,0
3,5
2,5
2,0
1,5
3,0
2,0
1,5
1,0
2,5
3,5
3,0
2,5
4,0
Varianza
Campionaria
0,00
0,25
1,00
0,25
0,25
0,00
0,25
1,00
1,00
0,25
0,00
2,25
0,25
1,00
2,25
0,00
la funzione di probabilità è la seguente:
P(xi)
0,25
0,375
0,25
0,125
0
0,25
1
2,25
Var(Xi)
Come si può facilmente calcolare, E(Var(Xi)) = 0,625
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
0
0,25
1
Varianza campionaria ad ogni estrazione
***
2,25
Si ripete l’esercizio per n = 3, dove l’universo campionario è pari a 43 = 64, e cioè:
Campione Dattilografe
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
A,A,A
A,A,B
A,A,C
A,A,D
A,B,A
A,B,B
A,B,C
A,B,D
A,C,A
A,C,B
A,C,C
A,C,D
A,D,A
A.D.B
A,D,C
A,D,D
B,A,A
B,A,B
B,A,C
B,A,D
B,B,A
B,B,B
B,B,C
B,B,D
B,C,A
B,C,B
B,C,C
B,C,D
B,D,A
B,D,B
B,D,C
B,D,D
Risultati
del
campione
3,3,3
3,3,2
3,3,1
3,3,4
3,2,3
3,2,2
3,2,1
3,2,4
3,1,3
3,1,2
3,1,1
3,1,4
3,4,3
3,4,2
3,4,1
3,4,4
2,3,3
2,3,2
2,3,1
2,3,4
2,2,3
2,2,2
2,2,1
2,2,4
2,1,3
2,1,2
2,1,1
2,1,4
2,4,3
2,4,2
2,4,1
2,4,4
Media
Campionaria
3,000
2,667
2,333
3,333
2,667
2,333
2,000
3,000
2,333
2,000
1,667
2,667
3,333
3,000
2,667
3,667
2,667
2,333
2,000
3,000
2,333
2,000
1,667
2,667
2,000
1,667
1,333
2,333
3,000
2,667
2,333
3,333
Campione Dattilografe
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
C,A,A
C,A,B
C,A,C
C,A,D
C,B,A
C,B,B
C,B,C
C,B,D
C,C,A
C,C,B
C,C,C
C,C,D
C.D.A
C.D.B
C,D,C
C,D,D
D,A,A
D,A,B
D,A,C
D,A,D
D,B,A
D,B,B
D,B,C
D,B,D
D,C,A
D,C,B
D,C,C
D,C,D
D,D,A
D,D,B
D,D,C
D,D,D
Risultati
del
campione
1,3,3
1,3,2
1,3,1
1,3,4
1,2,3
1,2,2
1,2,1
1,2,4
1,1,3
1,1,2
1,1,1
1,1,4
1,4,3
1,4,2
1,4,1
1,4,4
4,3,3
4,3,2
4,3,1
4,3,4
4,2,3
4,2,2
4,2,1
4,2,4
4,1,3
4,1,2
4,1,1
4,1,4
4,4,3
4,4,2
4,4,1
4,4,4
Media
Campionaria
2,333
2,000
1,667
2,667
2,000
1,667
1,333
2,333
1,667
1,333
1,000
2,000
2,667
2,333
2,000
3,000
3,333
3,000
2,667
3,667
3,000
2,667
2,333
3,333
2,667
2,333
2,000
3,000
3,667
3,333
3,000
4,000
Supponendo che ogni dattilografa ha la medesima probabilità di essere estratta nel campione e ciò
che interessa è la media campionaria, cioè il numero medio di errori commessi da ogni campione, la
funzione di probabilità è la seguente:
P(xi) 0,015625 0,046875
Xi
1
1,333
0,09375
0,15625
0,1875
0,1875
1,667
2
2,333
2,667
Come si può facilmente calcolare, E ( X ) = 2,5 e
0,15625 0,09375 0,046875 0,015625
3
Var (X) = 0,416667.
3,333
3,667
4
P
0,2
0,18
0,16
0,14
0,12
0,1
0,08
0,06
0,04
0,02
0
1
1,333
1,667
2
2,333
2,676
3
3,333
media campionaria per ogni campione
3,667
4
Per determinare la distribuzione della variabile casuale varianza campionaria bisogna calcolare la
2
1 n
statistica varianza campionaria S 2 = ∑ ( xi − X ) ad ogni estrazione:
n i =1
Camp.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
Datt.
A,A,A
A,A,B
A,A,C
A,A,D
A,B,A
A,B,B
A,B,C
A,B,D
A,C,A
A,C,B
A,C,C
A,C,D
A,D,A
A.D.B
A,D,C
A,D,D
B,A,A
B,A,B
B,A,C
B,A,D
B,B,A
B,B,B
B,B,C
B,B,D
B,C,A
B,C,B
B,C,C
B,C,D
B,D,A
B,D,B
B,D,C
B,D,D
Ris
3,3,3
3,3,2
3,3,1
3,3,4
3,2,3
3,2,2
3,2,1
3,2,4
3,1,3
3,1,2
3,1,1
3,1,4
3,4,3
3,4,2
3,4,1
3,4,4
2,3,3
2,3,2
2,3,1
2,3,4
2,2,3
2,2,2
2,2,1
2,2,4
2,1,3
2,1,2
2,1,1
2,1,4
2,4,3
2,4,2
2,4,1
2,4,4
Var(X)
X
3,000
2,667
2,333
3,333
2,667
2,333
2,000
3,000
2,333
2,000
1,667
2,667
3,333
3,000
2,667
3,667
2,667
2,333
2,000
3,000
2,333
2,000
1,667
2,667
2,000
1,667
1,333
2,333
3,000
2,667
2,333
3,333
0,000
0,222
0,889
0,222
0,222
0,222
0,667
0,667
0,889
0,667
0,889
1,556
0,222
0,667
1,556
0,222
0,222
0,222
0,667
0,667
0,222
0,000
0,222
0,889
0,667
0,222
0,222
1,556
0,667
0,889
1,556
0,889
Camp.
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
Datt.
C,A,A
C,A,B
C,A,C
C,A,D
C,B,A
C,B,B
C,B,C
C,B,D
C,C,A
C,C,B
C,C,C
C,C,D
C.D.A
C.D.B
C,D,C
C,D,D
D,A,A
D,A,B
D,A,C
D,A,D
D,B,A
D,B,B
D,B,C
D,B,D
D,C,A
D,C,B
D,C,C
D,C,D
D,D,A
D,D,B
D,D,C
D,D,D
Ris
1,3,3
1,3,2
1,3,1
1,3,4
1,2,3
1,2,2
1,2,1
1,2,4
1,1,3
1,1,2
1,1,1
1,1,4
1,4,3
1,4,2
1,4,1
1,4,4
4,3,3
4,3,2
4,3,1
4,3,4
4,2,3
4,2,2
4,2,1
4,2,4
4,1,3
4,1,2
4,1,1
4,1,4
4,4,3
4,4,2
4,4,1
4,4,4
Var(X)
X
2,333
2,000
1,667
2,667
2,000
1,667
1,333
2,333
1,667
1,333
1,000
2,000
2,667
2,333
2,000
3,000
3,333
3,000
2,667
3,667
3,000
2,667
2,333
3,333
2,667
2,333
2,000
3,000
3,667
3,333
3,000
4,000
la funzione di probabilità è la seguente:
P(xi)
Var(Xi)
0,0625
0,28125
0,1875
0,1875
0,09375
0 0,222222 0,666667 0,888889 1,555556
2
Come si può facilmente calcolare, E(Var(Xi)) = 0,8333
0,1875
0,889
0,667
0,889
1,556
0,667
0,222
0,222
1,556
0,889
0,222
0,000
2,000
1,556
1,556
2,000
2,000
0,222
0,667
1,556
0,222
0,667
0,889
1,556
0,889
1,556
1,556
2,000
2,000
0,222
0,889
2,000
0,000
0,3
0,25
0,2
0,15
0,1
0,05
0
0,0625
0,28125
0,1875
0,1875
0,1875
0,09375
Varianza campionaria ad ogni estrazione
***
Infine, per n = 4 l’universo campionario è pari a 44 = 256.
La tabella di tutti i possibili campioni sarebbe troppo grande da raffigurare, così come il calcolo
della media campionaria e della varianza campionaria.
Però, come è noto e come è stato possibile verificare empiricamente nei precedenti passaggi,
sappiamo che E ( X ) = μ X e che Var ( X ) =
σ X2
n
.
Infatti:
1
⎛1 n
⎞
⎛1 ⎞ 1
E ( X ) = E ⎜ ∑ X i ⎟ = E ⎜ S n ⎟ = E ( S n ) = nμ = μ
n
⎝n ⎠ n
⎝ n i =1 ⎠
1
σ2
⎛1 ⎞ 1
Var ( X ) = Var ⎜ S n ⎟ = 2 Var ( S n ) = 2 nσ 2 =
n
n
⎝n ⎠ n
Quindi, per n = 4, E ( X ) = 2,5 Var ( X ) =
1, 25
= 0,3125
4
ALL’AUMENTARE DELLA NUMEROSITA’ CAMPIONARIA LA DISPERSIONE INTORNO
AL VALORE ATTESO DIMINUISCE
Per quanto riguarda la V.C. varianza campionaria, si è potuto constatare che il suo valore atteso è
diverso dal parametro (in questo caso supposto) incognito della popolazione, in altri termini è uno
stimatore non corretto (o distorto).
Tuttavia il fattore di correzione è noto, ed è pari a
n
.
n −1
Infatti,
( )
2
1
E S 2 = ∑ E ( X i − X ) , aggiungendo e sottraendo la costante μ si ottiene:
n i
2
2⎤
1
1 ⎡
2
E S 2 = E ∑ ⎡⎣( X i − μ ) − ( X − μ ) ⎤⎦ = E ⎢ ∑ ( X i − μ ) − n ( X − μ ) ⎥ =
n i
n ⎣ i
⎦
( )
=
1⎛ 2
σ2 ⎞
σ2
⎛ n −1 ⎞
2
=σ2 ⎜
⎜ nσ − n
⎟ =σ −
⎟
n⎝
n ⎠
n
⎝ n ⎠
Quindi:
2
per n=2 si ha S 2 = 0, 625 da cui σ 2 = 0, 625 = 1, 25 ;
1
3
per n=3 si ha S 2 = 0,8333 da cui σ 2 = 0,8333 = 1, 25 ;
2
n −1
3
= 1, 25 = 0,9375
per n=4 si ha S 2 = σ 2
n
4