Esame di Statistica I – 17 luglio 2001 docente: Prof.ssa J. Mortera I quesiti in corsivo hanno carattere teorico 1. [6] La seguente tabella riporta i furti commessi scoperti in un grande magazzino in un anno, a seconda del settore merceologico e dell’età del colpevole. Settore Età 10 - 18 18 – 20 20 - 60 Abbigliamento 312 913 3367 Bigiotteria 710 377 208 Profumi 248 211 341 a) Sia p la probabilità che se un furto viene compiuto nel settore abbigliamento, l’età del colpevole sia 18 – 20.Costruire un intervallo di confidenza per p al 95%. b) Siano p1 e p2 le probabilità che il furto sia commesso nel settore dell’abbigliamento nell’ipotesi che il colpevole abbia rispettivamente età compresa nella classe 10 – 18 oppure 18 – 20. Verificare l’ipotesi p1=p2 contro l’ipotesi alternativa p1< p2. Soluzione esercizio 1 a) Una stima della probabilità che l’età del colpevole per i furti nel settore abbigliamento sia nella classe 18-20 è data da: 913 pˆ 0,1988. 4592 Calcolando i limiti dell’intervallo di confidenza usando l’approssimazione normale: p(1 p) pˆ (1 pˆ ) pˆ N ( p; ) , con n=4592, e la varianza stimata da , l’intervallo al n n 95% è definito da: pˆ (1 pˆ ) pˆ z 0,025 0,1988 0,0115 n e quindi (0,1873;0,2103). b) Le stime delle probabilità richieste sono: 312 913 pˆ 1 pˆ 2 1270 1501 Osserviamo due campioni di ampiezze rispettivamente n1=1270 e n2=1501 dalle popolazioni degli autori dei furti rispettivamente di età 10-18 e 18-20. Sotto l’ipotesi nulla di uguaglianza delle probabilità, la quantità p=p1=p2 è stimata da: n pˆ n2 pˆ 2 pˆ 1 1 0,442 n1 n2 Il valore osservato del test è: pˆ 1 pˆ 2 0,3626 zoss 19,19. 0,0189 1 1 pˆ (1 pˆ ) n1 n2 Poiché z0,01=2,326 e |zoss|>z0,01 si rifiuta l’ipotesi nulla di uguaglianza delle probabilità per =0,02. 2. [4] Con riferimento alla tabella dell’esercizio precedente, dire se (giustificando le risposte) a) la classe modale della distribuzione dell’età condizionata al settore profumi è A 10 - 18 B 18 - 20 C 20 -60 D la distribuzione è bimodale b) la moda della distribuzione del settore merceologico condizionata alla classe di età 10-18 è A abbigliamento B bigiotteria C non si può calcolare D profumi c) la mediana della distribuzione del settore merceologico condizionata alla classe di età 1018 è A abbigliamento B bigiotteria C non si può calcolare D 0,5 Soluzione esercizio 2 a) La risposta esatta è B. Infatti è la classe alla quale corrisponde la densità maggiore. b) La risposta esatta è B. Infatti è la classe alla quale corrisponde la frequenza maggiore. c) La risposta esatta è C. Infatti per calcolare la mediana è necessario che il carattere sia almeno qualitativo ordinabile. 3. [4] Una ditta produttrice di fotocopiatrici sa che la durata di una macchina (in migliaia di copie) si distribuisce come una normale con =1600 e 2=3600. Essa risarcisce un milione di lire all’acquirente se la durata della macchina acquistata è inferiore a 1450. Calcolare la probabilità che a) su 5 macchine la ditta debba risarcire almeno un milione di lire b) su 120 macchine la ditta debba risarcire fino a due milioni soluzione esercizio 3 Sia X il tempo di durata di una macchina. Si ha: 1450 1600 p0 P( X 1450) P Z P( Z 2,5) 1 (2,5) 0,0062. 60 a) La distribuzione del numero N di macchine su 5 che durano meno di 1450 è una binomiale B(5; 0,0062). Quindi, la probabilità che il risarcimento sia non inferiore al milione equivale alla probabilità dell’evento (N 1 ), cioè: P( N 1) 1 P( N 0) 1 (1 0,0062) 5 0,0306. b) Si deve calcolare P(N≥2). Poiché n=100 è grande e p0 è piccolo, si può approssimare la distribuzione di N con la distribuzione di Poisson di parametro =np0=0,62. P( N 2) 1 P( N 0) P( N 1) 1 e (1 ) 1 1,62 0,5379 0,1285. 4. [8] Dato un campione casuale X1,...,Xn, a) definire uno stimatore e la proprietà di efficienza; 2 b) dimostrare (facendo tutti i passaggi) che S 2 1 n X i X è uno stimatore distorto di n i 1 2. c) Qual è la distribuzione di nS 2 2 ? Perchè? 5. [5] Due studentesse, Paola e Chiara, hanno frequentato entrambe le lezioni del corso di Statistica. Paola ha frequentato il 60% delle lezioni e Chiara ha frequentato l’80%. a) Sapendo che la presenza di Paola a lezione è indipendente dalla presenza di Chiara (e viceversa), qual è la probabilità che almeno una delle due studentesse abbia frequentato una lezione. b) Qual è la probabilità che Chiara abbia frequentato la quinta lezione di statistica dato che Paola ha frequentato la terza lezione? c) Dati due eventi, A e B, definire la proprietà di incompatibilità e di indipendenza. Soluzione esercizio 5 Sia A l’evento “Paola assiste alla lezione” e B l’evento “Chiara assiste alla lezione”. Dai dati si ha: P(A)=0,6 P(B)=0,8 a) P( A B) P( A) P( B) P( A C ) 0,6 0,8 P( A) P( B) 1,4 0,48 0,92 b) La probabilità che Chiara abbia assistito alla quinta lezione è esattamente 0,8, poiché i due eventi sono indipendenti: P( B | A) P( B) 0,8. 6. [6] Sia (X1, X2,X3) un campione casuale estratto da una popolazione X con distribuzione Binomiale di parametro p. Dati due stimatori di p T1 2 X1 X 2 2 X 3 5 e T2 X1 X 3 2 a) stabilire se sono non distorti. b) Ricavare l’errore quadratico medio di T1 e T2. c) Quale tra i due stimatori è preferibile? Perchè? soluzione esercizio 6 Dato che X si distribuisce come una binomiale di parametro p, ha media pari a 3p e varianza pari a 3pq, con q=1-p. 1 2p p 2p p. a) E (T1 ) E (2 X 1 X 2 2 X 3 ) 5 5 1 2 E (T2 ) E ( X 1 X 2 ) p p 2 2 quindi ambedue gli stimatori sono corretti. b) Essendo corretti, quindi senza distorsione, l’errore quadratico medio è dato dalla sola varianza. 12 3 12 27 MSE (T1 ) Var (T1 ) pq pq pq pq 25 25 25 25 3 3 3 MSE (T2 ) Var (T2 ) pq pq pq 4 4 2 c) Tra i due stimatori è preferibile quello con errore quadratico medio inferiore, cioè T1.