STATISTICA (2) – ESERCITAZIONE 4
18.02.2013
Dott.ssa Antonella Costanzo
Esercizio 1. Proprietà desiderabili degli stimatori (piccoli campioni)
Sia X una popolazione distribuita secondo la legge Bernoulliana di parametro π, con (0
< π < 1), e sia
= , 2 , =
+ 2 + 5
uno stimatore di π a partire dal campione.
a) Determinare se lo stimatore è corretto. Nel caso non lo sia calcolare la sua
distorsione
b) Calcolare l’errore quadratico medio EQM dello stimatore
Soluzione
a) Se la popolazione è distribuita secondo una v.c. bernoulliana
allora , 2 , ~ per cui
~
= = e = = 1 − Uno stimatore T si dice non distorto per θ se ET = θ ossia quando si escludono
deviazioni sistematiche nella stima di θ per cui la media dello stimatore coincide col
parametro.
+ 2 + + 2 + + 2 + 4
= =
=
=
≠
5
5
5
5
1
Distorsione (bias) dello stimatore:
#
= − =
4
1
− =− 5
5
b)
= =
+ 2 + + 4 + =
=
5
25
+ 4 + 1 − + 41 − + 1 − =
25
25
61 − =
25
%&
= + #
=
61 − 1 +
25
25
2
Esercizio 2. Stima puntuale: la media campionaria
Il tempo necessario per completare gli esercizi per casa di statistica segue una
distribuzione normale di media 100 minuti e deviazione standard di 20 minuti.
a) Calcolare la percentuale di studenti che completeranno tutti gli esercizi entro 2 ore.
b) Quanto tempo è necessario affinché il 95% degli studenti completino l’esercitazione?
Si estrae un campione casuale di 25 studenti iscritti al corso:
c) Calcolare il valore atteso e l’errore standard della v.c. tempo medio impiegato del
gruppo di studenti estratto. Indicare qual è la distribuzione della v.c. tempo medio per
completare gli esercizi. Motivare la risposta.
d) Calcolare la probabilità che il tempo medio impiegato dal gruppo di studenti per
completare gli esercizi differisca da 100 minuti per più dell’11%.
Soluzione
a) Indichiamo con X il tempo per completare gli esercizi
* ≤ 120 = * , ≤
~'100, ) = 20
120 − 100
= *, ≤ 1 = 84.13%
20
b) Il tempo necessario affinché il 95% degli studenti completino gli esercizi corrisponde
a:
12.34 =
1.64 + 1.65
= 1.645
2
*, ≤ 12.34 = 0.95
per cui:
6 = 100 + 1.645 ∙ 20 = 132.9
3
c) Il tempo medio impiegato dal gruppo di studenti per completare gli esercizi è
identificato dalla v.c. media campionaria:
1
8 = 9 Essendo nota la distribuzione della popolazione allora anche 8 sarà distribuita
normalmente, in particolare:
8 ~' :;,
)
<
8 = ; = 100
)
)
20
8
>
=. =
=
=
=4
√ √25
d) La probabilità che il tempo medio impiegato dal gruppo di studenti per completare
gli esercizi differisca da 100 minuti per più dell’11% corrisponde a:
89 − 100
111 − 100
*89 ≤ 8 ≤ 111 = * @
≤,≤
B=
20A
20A
√25
√25
= *−2.75 ≤ , ≤ 2.75 = 0.994
4
Esercizio 3. Stimatore media campionaria: applicazioni
Da un recente studio nazionale sulle condizioni lavorative dei dipendenti pubblici,
emerge che per un certo segmento ampio di popolazione e per un dato anno il numero
medio di giorni di assenza dal lavoro per malattia è di 5.4 con una deviazione standard
di 2.8 giorni. Si estrae un campione casuale di 49 persone
a) Proporre uno stimatore non distorto per il valore atteso dei giorni di assenza dal
lavoro per malattia e definirne le proprietà
Calcolare la probabilità che il campione di persone estratto da questa popolazione abbia
una media di assenze:
b) Maggiore di 6 giorni
c) Fra 4 e 6 giorni
d) Fra 4 giorni e mezzo e 5 giorni e mezzo
Soluzione
a) La media campionaria è uno stimatore non distorto della media dei giorni di assenza
dal lavoro per malattia.
1
8 = 9 La distribuzione della popolazione non è nota, tuttavia abbiamo un campione
sufficientemente grande (n>30) e per il TLC lo stimatore media campionaria si
distribuisce in modo approssimativamente normale:
8 → ';,
)2
b) Sapendo che
8 − ;
,=)
→ '0,1
A √
5
8 = ; = 5.4 )
√
=
2.8
√49
= 0.4
8 − ; 6 − 5.4
,=)
=
= 1.5
0.4
A √
La probabilità che un campione casuale di 49 persone abbia una media di assenze
maggiore di 6 giorni è pari a:
*8 > 6 = *, > 1.5 = 1 − *, ≤ 1.5 = 1 − 0.9332 = 0.0668
c) La probabilità che un campione casuale di 49 persone abbia una media di assenze tra
4 e 6 giorni è pari a:
4 − 5.4
6 − 5.4
*4 ≤ 8 ≤ 6 = * ≤,≤
= *, ≤ 1.5 − *, ≤ −3.5 = 0.933
0.4
0.4
d) La probabilità che un campione casuale di 49 persone abbia una media di assenze tra
4 giorni e mezzo e 5 giorni e mezzo è pari a:
H.4I4.H
4.4I4.H
*4.5 ≤ 8 ≤ 5.5 = * G 2.H ≤ , ≤ 2.H J = *−2.25 ≤ , ≤ 0.25 =
= *, ≤ 0.25 − K1 − *, ≤ 2.25L = 0.5987 − 1 − 0.9878 = 0.5865
6
Esercizio 4. Stima puntuale: la proporzione campionaria
Si vuole fare inferenza sulla propensione all’acquisto di un nuovo profumo di ragazze
in età 16-18 anni. Selezionato un campione di 225 ragazze e fornito loro un
campioncino del nuovo profumo, risulta che 90 delle 225 intervistate sono propense
all’acquisto.
Determinare:
a) Una stima puntuale per b) Definire le proprietà dello stimatore utilizzato
c) A partire dall’informazione campionaria ricavata indicare quale dovrebbe essere
il numero minimo di ragazze da intervistare affinché lo scarto quadratico medio
dello stimatore utilizzato sia inferiore a 0.04.
Soluzione
a) La v.c. che descrive la popolazione è una v.c. bernoulliana che assume valore 1 o 0 a
seconda che le ragazze acquistano o meno il profumo. La stima della propensione
all’acquisto è data dallo stimatore:
M =
N
dove N = ∑ è la somma di n v.c. i.i.d. bernoulliane di parametro N
1
= N =
= N
1
1 − 1 − P = = N =
=
M =
90
= 0.4
225
Per n sufficientemente grande, per il TLC, lo stimatore M è tale che:
M~' :,
1 − <
7
M è uno stimatore corretto per della popolazione. La varianza tende a zero al crescere
della numerosità campionaria.
c) Dobbiamo determinare
)M = QM < 0.04
Ossia:
1 − >
< 0.04
da cui risolvendo rispetto a n otteniamo:
1 − < 0.04
0.40 × 0.60
> 0.04
>
0.40 × 0.60
0.0016
> 150
8