Esame di Statistica I – 17 luglio 2001 docente: Prof.ssa J. Mortera I quesiti in corsivo hanno carattere teorico 1. [5] Due tifosi, Paolo e Carlo, vanno spesso allo stadio. Paolo ha assistito al 70% delle partite e Carlo ha assistito al 90% delle partite. a) Sapendo che la presenza di Paolo allo stadio è indipendente dalla presenza di Carlo (e viceversa), qual è la probabilità che almeno uno dei due tifosi abbia assistito ad una partita? b) Qual è la probabilità che Paolo abbia assistito alla quarta partita di campionato sapendo che Carlo ha assistito alla seconda partita di campionato? c) Dati due eventi, A e B, definire la proprietà di incompatibilità e di indipendenza. Soluzione esercizio 1 Sia A l’evento “Paolo assiste alla partita” e B l’evento “Carlo assiste alla partita”. Dai dati si ha: P(A)=0,7 P(B)=0,9 a) P( A B) P( A) P( B) P( A C ) 0,7 0,9 P( A) P( B) 1,6 0,63 0,97 b) La probabilità che Paolo abbia assistito alla quarta partita è esattamente 0,7, poiché i due eventi sono indipendenti: P( A | B) P( A) 0,7. 2. [4] Una ditta produttrice di fotocopiatrici sa che la durata di una macchina (in migliaia di copie) si distribuisce come una normale con =1600 e 2=3600. Essa risarcisce un milione di lire all’acquirente se la durata della macchina acquistata è inferiore a 1450. Calcolare la probabilità che a) su 5 macchine la ditta debba risarcire al massimo un milione di lire b) su 100 macchine la ditta debba risarcire più di un milione soluzione esercizio 2 Sia X il tempo di durata di una macchina. Si ha: 1450 1600 p0 P( X 1450) P Z P( Z 2,5) 1 (2,5) 0,0062. 60 a) L’evento: “risarcimento al più uguale a 1 milione” corrisponde all’evento “0 o 1 macchina ha durata inferiore a 1450”. La distribuzione del numero N di macchine su 5 che durano meno di 1450 è una binomiale Bin(5; 0,0062). Quindi: P( N 0) P( N 1) (1 0,0062) 5 5 0,0062 (1 0,0062) 4 0,99962. b) Si deve calcolare P(N2). Poiché n=100 è grande e p0 è piccolo, si può approssimare la distribuzione di N con la distribuzione di Poisson di parametro =np0=0,62. P( N 2) 1 P( N 0) P( N 1) 1 e (1 ) 1 1,62 0,5379 0,1285. 3. [8] Dato un campione casuale X1,...,Xn, a) definire uno stimatore e la proprietà di non distorsione; 1 b) dimostrare (facendo tutti i passaggi) che S n 2 2 X i X n è uno stimatore distorto di i 1 2. c) Qual è la distribuzione di 4. nS 2 2 ? Perchè? [6] Sia (X1, X2,X3) un campione casuale estratto da una popolazione X con distribuzione di Poisson di parametro . Dati due stimatori di T1 2 X1 X 2 2 X 3 5 e T2 X1 X 3 2 a) stabilire se sono non distorti. b) Ricavare l’errore quadratico medio di T1 e T2. c) Quale tra i due stimatori è preferibile? Perchè? soluzione esercizio 4 Dato che X si distribuisce come una Poisson di parametro , ha media e varianza pari a . 1 2 2 . a) E (T1 ) E (2 X 1 X 2 2 X 3 ) 5 5 1 2 E (T2 ) E ( X 1 X 2 ) 2 2 quindi ambedue gli stimatori sono corretti. b) Essendo corretti, quindi senza distorsione, l’errore quadratico medio è dato dalla sola varianza. 4 1 4 9 MSE (T1 ) Var (T1 ) 25 25 25 25 1 1 1 MSE (T2 ) Var (T2 ) 4 4 2 c) Tra i due stimatori è preferibile quello con errore quadratico medio inferiore, cioé T1. 5. [6] La seguente tabella riporta i furti commessi scoperti in un grande magazzino in un anno, a seconda del settore merceologico e dell’età del colpevole. Settore Età 10 - 18 18 – 20 20 - 60 Abbigliamento 312 913 3367 Bigiotteria 710 377 208 Profumi 248 211 341 a) Sia p la probabilità che se un furto viene compiuto nel settore abbigliamento, l’età del colpevole sia 10 – 18.Costruire un intervallo di confidenza per p al 95%. b) Siano p1 e p2 le probabilità che il furto sia commesso nel settore dell’abbigliamento nell’ipotesi che il colpevole abbia rispettivamente età compresa nella classe 18 – 20 oppure 20 – 60. Verificare l’ipotesi p1=p2 contro l’ipotesi alternativa p1 p2. Soluzione esercizio 5 a) Una stima della probabilità che l’età del colpevole per i furti nel settore abbigliamento sia nella classe 10-18 è data da: 312 pˆ 0,0679. 4592 Calcolando i limiti dell’intervallo di confidenza usando l’approssimazione normale: p (1 p ) pˆ (1 pˆ ) pˆ N ( p; ) , con n=4592, e la varianza stimata da , l’intervallo al n n 95% è definito da: pˆ (1 pˆ ) pˆ z0,025 0,0679 0,0073 n e quindi (0,0606;0,0752). b) Le stime delle probabilità richieste sono: 913 3367 pˆ 1 pˆ 2 1501 3916 Osserviamo due campioni di ampiezze rispettivamente n1=1501 e n2=3916 dalle popolazioni degli autori dei furti rispettivamente di età 18-20 e 20-60. Sotto l’ipotesi nulla di uguaglianza delle probabilità, la quantità p=p1=p2 è stimata da: n pˆ n2 pˆ 2 pˆ 1 1 0,7901 n1 n2 Il valore osservato del test è: pˆ 1 pˆ 2 0,2515 z oss 20,34. 0,0124 1 1 pˆ (1 pˆ ) n1 n2 Poiché z0,01=2,326 e |zoss|>z0,01 si rifiuta l’ipotesi nulla di uguaglianza delle probabilità per =0,02 6. [4] Con riferimento alla tabella dell’esercizio precedente, dire se (giustificando le risposte) a) la classe modale della distribuzione marginale dell’età è A 10 - 18 B 18 - 20 C 20 -60 D la distribuzione è bimodale b) la moda della distribuzione marginale del settore merceologico è A abbigliamento B bigiotteria C non si può calcolare D profumi c) la mediana della distribuzione marginale del settore merceologico è A abbigliamento B bigiotteria C non si può calcolare D 0,5 Soluzione esercizio 6 a) La risposta esatta è B. Infatti è la classe alla quale corrisponde la densità maggiore. b) La risposta esatta è A. Infatti è la classe alla quale corrisponde la frequenza maggiore. c) La risposta esatta è C. Infatti per calcolare la mediana è necessario che il carattere sia almeno qualitativo ordinabile.