STATISTICA (2) – ESERCITAZIONE 4 18.02.2013 Dott.ssa Antonella Costanzo Esercizio 1. Proprietà desiderabili degli stimatori (piccoli campioni) Sia X una popolazione distribuita secondo la legge Bernoulliana di parametro π, con (0 < π < 1), e sia = , 2 , = + 2 + 5 uno stimatore di π a partire dal campione. a) Determinare se lo stimatore è corretto. Nel caso non lo sia calcolare la sua distorsione b) Calcolare l’errore quadratico medio EQM dello stimatore Soluzione a) Se la popolazione è distribuita secondo una v.c. bernoulliana allora , 2 , ~ per cui ~ = = e = = 1 − Uno stimatore T si dice non distorto per θ se ET = θ ossia quando si escludono deviazioni sistematiche nella stima di θ per cui la media dello stimatore coincide col parametro. + 2 + + 2 + + 2 + 4 = = = = ≠ 5 5 5 5 1 Distorsione (bias) dello stimatore: # = − = 4 1 − =− 5 5 b) = = + 2 + + 4 + = = 5 25 + 4 + 1 − + 41 − + 1 − = 25 25 61 − = 25 %& = + # = 61 − 1 + 25 25 2 Esercizio 2. Stima puntuale: la media campionaria Il tempo necessario per completare gli esercizi per casa di statistica segue una distribuzione normale di media 100 minuti e deviazione standard di 20 minuti. a) Calcolare la percentuale di studenti che completeranno tutti gli esercizi entro 2 ore. b) Quanto tempo è necessario affinché il 95% degli studenti completino l’esercitazione? Si estrae un campione casuale di 25 studenti iscritti al corso: c) Calcolare il valore atteso e l’errore standard della v.c. tempo medio impiegato del gruppo di studenti estratto. Indicare qual è la distribuzione della v.c. tempo medio per completare gli esercizi. Motivare la risposta. d) Calcolare la probabilità che il tempo medio impiegato dal gruppo di studenti per completare gli esercizi differisca da 100 minuti per più dell’11%. Soluzione a) Indichiamo con X il tempo per completare gli esercizi * ≤ 120 = * , ≤ ~'100, ) = 20 120 − 100 = *, ≤ 1 = 84.13% 20 b) Il tempo necessario affinché il 95% degli studenti completino gli esercizi corrisponde a: 12.34 = 1.64 + 1.65 = 1.645 2 *, ≤ 12.34 = 0.95 per cui: 6 = 100 + 1.645 ∙ 20 = 132.9 3 c) Il tempo medio impiegato dal gruppo di studenti per completare gli esercizi è identificato dalla v.c. media campionaria: 1 8 = 9 Essendo nota la distribuzione della popolazione allora anche 8 sarà distribuita normalmente, in particolare: 8 ~' :;, ) < 8 = ; = 100 ) ) 20 8 > =. = = = =4 √ √25 d) La probabilità che il tempo medio impiegato dal gruppo di studenti per completare gli esercizi differisca da 100 minuti per più dell’11% corrisponde a: 89 − 100 111 − 100 *89 ≤ 8 ≤ 111 = * @ ≤,≤ B= 20A 20A √25 √25 = *−2.75 ≤ , ≤ 2.75 = 0.994 4 Esercizio 3. Stimatore media campionaria: applicazioni Da un recente studio nazionale sulle condizioni lavorative dei dipendenti pubblici, emerge che per un certo segmento ampio di popolazione e per un dato anno il numero medio di giorni di assenza dal lavoro per malattia è di 5.4 con una deviazione standard di 2.8 giorni. Si estrae un campione casuale di 49 persone a) Proporre uno stimatore non distorto per il valore atteso dei giorni di assenza dal lavoro per malattia e definirne le proprietà Calcolare la probabilità che il campione di persone estratto da questa popolazione abbia una media di assenze: b) Maggiore di 6 giorni c) Fra 4 e 6 giorni d) Fra 4 giorni e mezzo e 5 giorni e mezzo Soluzione a) La media campionaria è uno stimatore non distorto della media dei giorni di assenza dal lavoro per malattia. 1 8 = 9 La distribuzione della popolazione non è nota, tuttavia abbiamo un campione sufficientemente grande (n>30) e per il TLC lo stimatore media campionaria si distribuisce in modo approssimativamente normale: 8 → ';, )2 b) Sapendo che 8 − ; ,=) → '0,1 A √ 5 8 = ; = 5.4 ) √ = 2.8 √49 = 0.4 8 − ; 6 − 5.4 ,=) = = 1.5 0.4 A √ La probabilità che un campione casuale di 49 persone abbia una media di assenze maggiore di 6 giorni è pari a: *8 > 6 = *, > 1.5 = 1 − *, ≤ 1.5 = 1 − 0.9332 = 0.0668 c) La probabilità che un campione casuale di 49 persone abbia una media di assenze tra 4 e 6 giorni è pari a: 4 − 5.4 6 − 5.4 *4 ≤ 8 ≤ 6 = * ≤,≤ = *, ≤ 1.5 − *, ≤ −3.5 = 0.933 0.4 0.4 d) La probabilità che un campione casuale di 49 persone abbia una media di assenze tra 4 giorni e mezzo e 5 giorni e mezzo è pari a: H.4I4.H 4.4I4.H *4.5 ≤ 8 ≤ 5.5 = * G 2.H ≤ , ≤ 2.H J = *−2.25 ≤ , ≤ 0.25 = = *, ≤ 0.25 − K1 − *, ≤ 2.25L = 0.5987 − 1 − 0.9878 = 0.5865 6 Esercizio 4. Stima puntuale: la proporzione campionaria Si vuole fare inferenza sulla propensione all’acquisto di un nuovo profumo di ragazze in età 16-18 anni. Selezionato un campione di 225 ragazze e fornito loro un campioncino del nuovo profumo, risulta che 90 delle 225 intervistate sono propense all’acquisto. Determinare: a) Una stima puntuale per b) Definire le proprietà dello stimatore utilizzato c) A partire dall’informazione campionaria ricavata indicare quale dovrebbe essere il numero minimo di ragazze da intervistare affinché lo scarto quadratico medio dello stimatore utilizzato sia inferiore a 0.04. Soluzione a) La v.c. che descrive la popolazione è una v.c. bernoulliana che assume valore 1 o 0 a seconda che le ragazze acquistano o meno il profumo. La stima della propensione all’acquisto è data dallo stimatore: M = N dove N = ∑ è la somma di n v.c. i.i.d. bernoulliane di parametro N 1 = N = = N 1 1 − 1 − P = = N = = M = 90 = 0.4 225 Per n sufficientemente grande, per il TLC, lo stimatore M è tale che: M~' :, 1 − < 7 M è uno stimatore corretto per della popolazione. La varianza tende a zero al crescere della numerosità campionaria. c) Dobbiamo determinare )M = QM < 0.04 Ossia: 1 − > < 0.04 da cui risolvendo rispetto a n otteniamo: 1 − < 0.04 0.40 × 0.60 > 0.04 > 0.40 × 0.60 0.0016 > 150 8