Prova di recupero di Probabilità e Statistica - A* 21/04/2006 (NB: saranno prese in considerazione solo le risposte adeguatamente motivate) tempo di lavoro: Due ore 1. Per conseguire la patente di guida, un ragazzo sostiene la prova teorica. Questa consiste in un test a risposta multipla. Il ragazzo ha studiato il 60% del programma. Quando si trova di fronte ad un quesito del test di cui non conosce la risposta decide di sceglierla in base al seguente esperimento casuale: lancia due volte una moneta, se l'esito testa si verifica due volte allora sceglie la prima risposta, se si verifica testa al primo lancio e croce al secondo sceglie la seconda risposta, se si verifica croce al primo lancio e testa al secondo lancio sceglie la terza risposta, se l'esito croce si verifica due volte sceglie la quarta ed ultima risposta. Qual è la probabilità che con questo procedimento risponda correttamente ad un quesito? Se ha risposto correttamente ad un quesito, qual è la probabilità che conosca effettivamente la risposta? Soluzione: Indicato con A l’evento “il ragazzo conosce la risposta esatta” e con R l’evento “risposta data esatta” si tratta di calcolare P( R) = P( R | A) P( A) + P( R | A C ) P ( A C ) con P( R | A) = 1, P( A) = 0.60, P( R | AC ) = 0.25, P( A C ) = 0.40. Per rispondere al secondo quesito è necessario calcolare P( A | R) = P( R | A) P ( A) applicando il teorema di Bayes. P( R) 2. Sia X il tempo (in minuti) che occorre al sig. Rossi per arrivare in ufficio la mattina con la sua macchina. Supponendo che X abbia una distribuzione uniforme nell’intervallo (25,40) e che il sig. Rossi esce di casa ogni giorno alle 7.25, qual è la probabilità che arrivi in ritardo se deve timbrare il cartellino entro le 8.00? Soluzione: Il signore Rossi impiega dai 25 ai 40 minuti per arrivare in ufficio. Perché arrivi in ritardo, è necessario che impieghi dai 35 ai 40 minuti. Indicata con T la v.a. tempo impiegato dal signor Rossi per arrivare in ufficio si tratta di calcolare: 40 P(T > 35) = 1 1 ∫ 40 − 25dx = 3 35 3. Un fondo azionario comune ha subito le seguenti variazioni nell'arco di due settimane: 0.19 -0.01 -0.5 0.02 0.001 0.10 -0.21 * Correzione dei compiti: giovedì 27 Aprile ore 11.30. -0.43 0.1 0.3 Supponendo che la variazione del fondo sia descritta da una variabile aleatoria normale, costruire un intervallo di fiducia al 90% della variazione media del fondo. Verificare con un test di ipotesi se la popolazione può ritenersi normale. Soluzione: Il campione casuale assegnato ha media campionaria pari a -0.0439 e varianza campionaria 0.067. La semiampiezza dell’intervallo di confidenza centrato sulla media corrispondente al 90% è 0.15. Per verificare che il campione casuale ha distribuzione gaussiana, utilizziamo un test di Kolmogorov-Smirnov Dati -0,5 -0,43 -0,21 -0,01 0,001 0,02 0,1 0,19 0,3 Funz. Rip. Empirica 0,1 0,2 0,3 0,4 0,5 0,6 0,8 0,9 1 Funz. Rip. Teorica 0,038825704 0,067560567 0,259532405 0,550693287 0,567449385 0,596091515 0,709568147 0,815837121 0,907302322 Diff. 0,061174 0,132439 0,040468 0,150693 0,067449 0,003908 0,090432 0,084163 0,092698 Il massimo delle differenze risulta 0.15 che confrontato con il quantile relativo ad un campione di taglia 10 ed errore di I tipo pari al 5% implica che l’ipotesi di distribuzione gaussiana per il campione non è rigettabile. Prova di recupero di Probabilità e Statistica - B* 21/04/2006 (NB: saranno prese in considerazione solo le risposte adeguatamente motivate) tempo di lavoro: Due ore 1. Un contadino usa una macchina automatica per riempire dei sacchi di grano. Il peso nominale di un sacco di grano è 112lb. A causa di fluttuazioni casuali nel meccanismo di peso dei sacchi, il peso dei sacchi risulta una variabile aleatoria normale di media 115.375 lb e deviazione standard 0.226 lb. Se il contadino fornisce un cliente assicurandogli che non più del 5% dei sacchi è sottopeso (rispetto al peso nominale), quanto dovrebbe essere il peso minimo dei sacchi? Soluzione: Si tratta di determinare il valore x<112 tale che l’area sotto la curva gaussiana di media 115.375 lb e deviazione standard 0.226 lb compresa tra x e 112 sia non più del 5%. Indichiamo con X ≈ N (115,375;0,226) . In realtà poiché P( X > 112) = 1 , allora P( x < X < 112) = 0 per ogni x<112 e quindi il contadino fornisce sacchi il cui peso è ben al di sopra del valore nominale. 2. Sono state scelte 6 automobili a caso in una concessionaria di auto usate e per ognuna di esse è stata registrata la potenza e la velocità massima: Potenza(kW) Velocità (km/h) 70 155 63 150 72 180 66 135 70 156 74 168 (1) disegnare uno scatter diagram (diagramma di dispersione dei dati); (2) costruire la retta di regressione dei dati e riportarla sul diagramma di cui al punto (1); (3) stimare la velocità massima di una automobile la cui potenza è 75 kW; (4) effettuare l’analisi dei residui (con un test di ipotesi). Soluzione: La retta di regressione è y = 2,82 x − 38,32 e il diagramma di dispersione risulta Velocità Tracciato delle approssimazioni 200 Velocità 100 0 Previsto Velocità 60 65 70 Potenza * Correzione dei compiti: giovedì 27 Aprile ore 11.30. 75 La velocità corrispondente ad una potenza di 75KW è 2,82 75 − 38,32 , mentre i residui sono: Osservazione 1 2 3 4 5 6 Residui -4,69072 10,11134 14,65155 -13,3753 -3,69072 -3,00619 ai quali si applica un test di Kolmogorov-Smirnov per determinare se hanno distribuzione gaussiana di media 0. La deviazione campionaria dei residui è 10.39 Residui -13,3753 -4,69072 -3,69072 -3,00619 10,11134 14,65155 F.teorica 0,09899063 0,325827269 0,361212961 0,386162539 0,834768071 0,920753602 F. empirica 0,166666667 0,333333333 0,5 0,666666667 0,833333333 1 Diff. 0,067676037 0,007506064 0,138787039 0,280504127 0,001434737 0,079246398 Poiché la massima differenza in valore assoluto è 0,28 inferiore al quantile corrispondente ad una taglia pari a 6 e al livello di confidenza pari a 0.05, l’ipotesi di normalità per i residui non è rigettabile. 3. Assegnata la funzione kx 2 , x ∈ [0,1] f X (x ) = determinare il valore di k per cui tale 0 altrove funzione risulta una funzione densità di probabilità e tracciarne il grafico. Determinare la funzione distribuzione cumulativa. Soluzione: Per determinare il valore di k è necessario imporre la condizione 1 1 k 3 ∫0 kx dx = 3 x 0 ⇒ k = 3 2 0 La funzione di ripartizione risulta: F ( x) = x 3 1 x<0 x ∈ [0,1] x >1 Prova di recupero di Probabilità e Statistica - C* 21/04/2006 (NB: saranno prese in considerazione solo le risposte adeguatamente motivate) tempo di lavoro: Due ore 1. Si ha un'urna contenente un certo numero di palle delle quali non si sa se siano tutte bianche o metà bianche e metà nere; si estrae una palla dall'urna: avendo osservato che è bianca, calcolare la probabilità che lo siano anche tutte le altre. Soluzione: Si assuma pari a p la probabilità che l’urna sia formata per metà da palline bianche e per metà da palline nere. Indicato con B l’evento “urna composta da sole palline bianche”, risulta B C l’evento “urna composta per metà da palline nere e per metà da palline bianche” e quindi P( B) = p, P( B C ) = 1 − p. Indicato con A l’evento “pallina estratta bianca” risulta P( A | B ) = 0.5 e P( A | B C ) = 1. L’esercizio chiede di ossia applicando il teorema di Bayes calcolare P( B | A), P( B | A) = P ( A | B) P( B) . P( A | B) P( B) + P( A | B C ) P( B C ) 2. Una popolazione normale ha media 100 e varianza 25. Quanto deve essere largo il campione casuale se si vuole che l'errore standard della media campionaria sia 1.5? Quanto deve essere largo il campione casuale se si vuole che la media campionaria differisca dalla media della popolazione meno di 0.1 con probabilità 90%? σ da cui risulta n = (5 / 1.5)2 . n 0.1 n Se si desidera che P(| X − µ |< 0.1) = 0.90 bisogna risolvere l’equazione = z 0.05 σ nell’incognita n dove σ = 5 e z 0.05 = 1.64 . Soluzione: L’errore standard della media campionaria è 3. Il risultato della prova scritta ed il punteggio finale dell’esame di statistica di 7 studenti scelti a caso, sono stati i seguenti Punteggio prova scritta (x) Punteggio complessivo (y) 18 22 17 21 18 25 24 20 25 20 24 19 28 27 (1) disegnare uno scatter diagram (diagramma di dispersione dei dati); (2) costruire la retta di regressione dei dati e riportarla sul diagramma di cui al punto (1); * Correzione dei compiti: giovedì 27 Aprile ore 11.30. (3) stimare il punteggio complessivo se la prova scritta ha riportato un punteggio pari a 22; (4) effettuare l’analisi dei residui (con un test di ipotesi). Y X Tracciato delle approssimazioni 40 20 0 Y 0 10 20 30 Previsto Y X Soluzione: la retta di regressione è y = 1.13x − 0.26 pertanto il punteggio complessivo corrispondente a 22 è y = 1.13 * 22 − 0.26 . Per effettuare l’analisi dei residui, eseguiamo un test di Kolmogorvo-Smirnov, tenendo conto che la deviazione standard associata è 0.658. Residui -1,19952 -0,19952 -0,15865 -0,02163 0,252404 0,389423 0,9375 F. emprica 0,142857143 0,285714286 0,428571429 0,571428571 0,714285714 0,857142857 1 F. teorica 0,034153 0,380861 0,404733 0,486885 0,64936 0,723017 0,922888 Diff. 0,108704 0,095147 0,023839 0,084543 0,064926 0,134126 0,077112 Poiché il massimo è 0,134 ed è inferiore corrispondente al quantile del test per n=7 e livello di significatività pari a 0.05, l’ipotesi che i residui abbiano distribuzione gaussiana non è rigettabile. Prova di recupero di Probabilità e Statistica - D* 21/04/2006 (NB: saranno prese in considerazione solo le risposte adeguatamente motivate) tempo di lavoro: Due ore 1. Una macchina che produce strumenti di precisione è dotata di 5 motori in linea, ciascuno indipendente dagli altri. La macchina funziona regolarmente fin tanto che almeno due motori sono in funzione. Sapendo che la probabilità che un motore si guasti è uguale a 0.20, calcolare la probabilità che la macchina funzioni regolarmente. Soluzione: Indicata con X la v.a. che conta il numero di motori funzionanti, si tratta di calcolare P( X ≥ 2) dove X è una v.a. binomiale di parametri n=5 e p=0.2. 2. Il tempo T richiesto per completare un'operazione è descritto da una funzione densità di probabilità pari a f(x)=1/20 per 20<x<40 secondi. Calcolare la percentuale di assemblaggi che vengono completati in più di 27 secondi. Qual è il tempo massimo per il completamento dell'85% degli assemblaggi? Soluzione: Per determinare la percentuale di assemblaggi che vengono completati in più di 27 secondi è necessario calcolare 40 1 13 ∫ 20dx = 20 27 Per determinare il tempo massimo per il completamento dell'85% degli assemblaggi è necessario risolvere l’equazione: x 1 ∫ 20dt = 0.85 ⇒ 20 x − 20 = 0.85 ⇒ x = 20 + 20 * 0.85 20 3. In un campione casuale di 500 lampadine si è registrata la seguente distribuzione dei tempi di durata tra 800 ore e 2000 ore: Tempi di durata n. lampadine 800-1000 15 1000-1200 91 1200-1400 65 1400-1600 191 1600-1800 26 1800-2000 8 Sottoporre a test l’ipotesi che il tempo di durata delle lampadine segua una distribuzione Normale, facendo uso del test chi quadrato. (Per calcolare media e varianza campionaria si sostituisca ogni dato con il centro dell'intervallo: ad esempio per la prima classe 800-1000 si assume che 900 si sia verificato 15 volte). Soluzione: Si osservi che dei 500 campioni esaminati, 396 sono riportati in tabella. La media campionaria risulta x= * 900 * 15 + 1100 * 91 + 1300 * 65 + 1500 * 191 + 1700 * 26 + 1900 * 8 = 1373.73 396 Correzione dei compiti: giovedì 27 Aprile ore 11.30. mentre la varianza campionaria risulta s2 = (900 − 1373.73) 2 * 15 + (1100 − 1373.73) 2 * 91 + 395 + (1900 − 1373.73) 2 *8 = 47004.73 Effettuiamo un test chi quadrato: Intervalli 1000 1200 1400 1600 1800 Freq. Oss. 15 91 65 191 26 8 F. ripart. 0,042368 0,211468 0,548222 0,851683 0,975362 0,024638 Probab. 0,042368 0,1691 0,336754 0,303461 0,123678 0,024638 Freq. Attese 16,77762741 66,96374155 133,3547155 120,1705636 48,97657263 9,756779257 Poiché la statistica test risulta maggiore del quantile di riferimento, si rigetta l’ipotesi nulla.