Aprile 06 - Università degli Studi della Basilicata

Prova di recupero di Probabilità e Statistica - A*
21/04/2006
(NB: saranno prese in considerazione solo le risposte adeguatamente motivate)
tempo di lavoro: Due ore
1. Per conseguire la patente di guida, un ragazzo sostiene la prova teorica. Questa
consiste in un test a risposta multipla. Il ragazzo ha studiato il 60% del programma.
Quando si trova di fronte ad un quesito del test di cui non conosce la risposta
decide di sceglierla in base al seguente esperimento casuale: lancia due volte una
moneta, se l'esito testa si verifica due volte allora sceglie la prima risposta, se si
verifica testa al primo lancio e croce al secondo sceglie la seconda risposta, se si
verifica croce al primo lancio e testa al secondo lancio sceglie la terza risposta, se
l'esito croce si verifica due volte sceglie la quarta ed ultima risposta. Qual è la
probabilità che con questo procedimento risponda correttamente ad un quesito? Se
ha risposto correttamente ad un quesito, qual è la probabilità che conosca
effettivamente la risposta?
Soluzione: Indicato con A l’evento “il ragazzo conosce la risposta esatta” e con R
l’evento “risposta data esatta” si tratta di calcolare P( R) = P( R | A) P( A) + P( R | A C ) P ( A C )
con P( R | A) = 1, P( A) = 0.60, P( R | AC ) = 0.25, P( A C ) = 0.40. Per rispondere al secondo
quesito è necessario calcolare P( A | R) =
P( R | A) P ( A)
applicando il teorema di Bayes.
P( R)
2. Sia X il tempo (in minuti) che occorre al sig. Rossi per arrivare in ufficio la mattina
con la sua macchina. Supponendo che X abbia una distribuzione uniforme
nell’intervallo (25,40) e che il sig. Rossi esce di casa ogni giorno alle 7.25, qual è la
probabilità che arrivi in ritardo se deve timbrare il cartellino entro le 8.00?
Soluzione: Il signore Rossi impiega dai 25 ai 40 minuti per arrivare in ufficio. Perché
arrivi in ritardo, è necessario che impieghi dai 35 ai 40 minuti. Indicata con T la v.a.
tempo impiegato dal signor Rossi per arrivare in ufficio si tratta di calcolare:
40
P(T > 35) =
1
1
∫ 40 − 25dx = 3
35
3. Un fondo azionario comune ha subito le seguenti variazioni nell'arco di due
settimane:
0.19 -0.01 -0.5 0.02 0.001 0.10 -0.21
*
Correzione dei compiti: giovedì 27 Aprile ore 11.30.
-0.43 0.1 0.3
Supponendo che la variazione del fondo sia descritta da una variabile aleatoria
normale, costruire un intervallo di fiducia al 90% della variazione media del fondo.
Verificare con un test di ipotesi se la popolazione può ritenersi normale.
Soluzione: Il campione casuale assegnato ha media campionaria pari a -0.0439 e
varianza campionaria 0.067. La semiampiezza dell’intervallo di confidenza centrato
sulla media corrispondente al 90% è 0.15. Per verificare che il campione casuale ha
distribuzione gaussiana, utilizziamo un test di Kolmogorov-Smirnov
Dati
-0,5
-0,43
-0,21
-0,01
0,001
0,02
0,1
0,19
0,3
Funz. Rip. Empirica
0,1
0,2
0,3
0,4
0,5
0,6
0,8
0,9
1
Funz. Rip. Teorica
0,038825704
0,067560567
0,259532405
0,550693287
0,567449385
0,596091515
0,709568147
0,815837121
0,907302322
Diff.
0,061174
0,132439
0,040468
0,150693
0,067449
0,003908
0,090432
0,084163
0,092698
Il massimo delle differenze risulta 0.15 che confrontato con il quantile relativo ad un
campione di taglia 10 ed errore di I tipo pari al 5% implica che l’ipotesi di
distribuzione gaussiana per il campione non è rigettabile.
Prova di recupero di Probabilità e Statistica - B*
21/04/2006
(NB: saranno prese in considerazione solo le risposte adeguatamente motivate)
tempo di lavoro: Due ore
1. Un contadino usa una macchina automatica per riempire dei sacchi di grano. Il peso
nominale di un sacco di grano è 112lb. A causa di fluttuazioni casuali nel
meccanismo di peso dei sacchi, il peso dei sacchi risulta una variabile aleatoria
normale di media 115.375 lb e deviazione standard 0.226 lb. Se il contadino
fornisce un cliente assicurandogli che non più del 5% dei sacchi è sottopeso
(rispetto al peso nominale), quanto dovrebbe essere il peso minimo dei sacchi?
Soluzione: Si tratta di determinare il valore x<112 tale che l’area sotto la curva
gaussiana di media 115.375 lb e deviazione standard 0.226 lb compresa tra x e 112 sia
non più del 5%. Indichiamo con X ≈ N (115,375;0,226) . In realtà poiché P( X > 112) = 1 ,
allora P( x < X < 112) = 0 per ogni x<112 e quindi il contadino fornisce sacchi il cui
peso è ben al di sopra del valore nominale.
2. Sono state scelte 6 automobili a caso in una concessionaria di auto usate e per
ognuna di esse è stata registrata la potenza e la velocità massima:
Potenza(kW)
Velocità (km/h)
70
155
63
150
72
180
66
135
70
156
74
168
(1) disegnare uno scatter diagram (diagramma di dispersione dei dati);
(2) costruire la retta di regressione dei dati e riportarla sul diagramma di cui al
punto (1);
(3) stimare la velocità massima di una automobile la cui potenza è 75 kW;
(4) effettuare l’analisi dei residui (con un test di ipotesi).
Soluzione: La retta di regressione è y = 2,82 x − 38,32 e il diagramma di dispersione
risulta
Velocità
Tracciato delle approssimazioni
200
Velocità
100
0
Previsto Velocità
60
65
70
Potenza
*
Correzione dei compiti: giovedì 27 Aprile ore 11.30.
75
La velocità corrispondente ad una potenza di 75KW è 2,82 75 − 38,32 , mentre i residui
sono:
Osservazione
1
2
3
4
5
6
Residui
-4,69072
10,11134
14,65155
-13,3753
-3,69072
-3,00619
ai quali si applica un test di Kolmogorov-Smirnov per determinare se hanno
distribuzione gaussiana di media 0. La deviazione campionaria dei residui è 10.39
Residui
-13,3753
-4,69072
-3,69072
-3,00619
10,11134
14,65155
F.teorica
0,09899063
0,325827269
0,361212961
0,386162539
0,834768071
0,920753602
F. empirica
0,166666667
0,333333333
0,5
0,666666667
0,833333333
1
Diff.
0,067676037
0,007506064
0,138787039
0,280504127
0,001434737
0,079246398
Poiché la massima differenza in valore assoluto è 0,28 inferiore al quantile
corrispondente ad una taglia pari a 6 e al livello di confidenza pari a 0.05, l’ipotesi di
normalità per i residui non è rigettabile.
3. Assegnata la funzione
kx 2 , x ∈ [0,1]
f X (x ) = 
determinare il valore di k per cui tale
 0 altrove
funzione risulta una funzione densità di probabilità e tracciarne il grafico.
Determinare la funzione distribuzione cumulativa.
Soluzione: Per determinare il valore di k è necessario imporre la condizione
1
1
k 3
∫0 kx dx = 3 x  0 ⇒ k = 3
2
0
La funzione di ripartizione risulta: F ( x) =  x 3
1

x<0
x ∈ [0,1]
x >1
Prova di recupero di Probabilità e Statistica - C*
21/04/2006
(NB: saranno prese in considerazione solo le risposte adeguatamente motivate)
tempo di lavoro: Due ore
1. Si ha un'urna contenente un certo numero di palle delle quali non si sa se siano tutte
bianche o metà bianche e metà nere; si estrae una palla dall'urna: avendo osservato
che è bianca, calcolare la probabilità che lo siano anche tutte le altre.
Soluzione: Si assuma pari a p la probabilità che l’urna sia formata per metà da palline
bianche e per metà da palline nere. Indicato con B l’evento “urna composta da sole
palline bianche”, risulta B C l’evento “urna composta per metà da palline nere e per
metà da palline bianche” e quindi P( B) = p, P( B C ) = 1 − p. Indicato con A l’evento
“pallina estratta bianca” risulta P( A | B ) = 0.5 e P( A | B C ) = 1. L’esercizio chiede di
ossia
applicando
il
teorema
di
Bayes
calcolare
P( B | A),
P( B | A) =
P ( A | B) P( B)
.
P( A | B) P( B) + P( A | B C ) P( B C )
2. Una popolazione normale ha media 100 e varianza 25. Quanto deve essere largo il
campione casuale se si vuole che l'errore standard della media campionaria sia 1.5?
Quanto deve essere largo il campione casuale se si vuole che la media campionaria
differisca dalla media della popolazione meno di 0.1 con probabilità 90%?
σ
da cui risulta n = (5 / 1.5)2 .
n
0.1 n
Se si desidera che P(| X − µ |< 0.1) = 0.90 bisogna risolvere l’equazione
= z 0.05
σ
nell’incognita n dove σ = 5 e z 0.05 = 1.64 .
Soluzione: L’errore standard della media campionaria è
3. Il risultato della prova scritta ed il punteggio finale dell’esame di statistica di 7
studenti scelti a caso, sono stati i seguenti
Punteggio prova
scritta (x)
Punteggio
complessivo (y)
18
22
17
21
18
25
24
20
25
20
24
19
28
27
(1) disegnare uno scatter diagram (diagramma di dispersione dei dati);
(2) costruire la retta di regressione dei dati e riportarla sul diagramma di cui al
punto (1);
*
Correzione dei compiti: giovedì 27 Aprile ore 11.30.
(3) stimare il punteggio complessivo se la prova scritta ha riportato un punteggio
pari a 22;
(4) effettuare l’analisi dei residui (con un test di ipotesi).
Y
X Tracciato delle approssimazioni
40
20
0
Y
0
10
20
30
Previsto Y
X
Soluzione: la retta di regressione è y = 1.13x − 0.26 pertanto il punteggio complessivo
corrispondente a 22 è y = 1.13 * 22 − 0.26 . Per effettuare l’analisi dei residui,
eseguiamo un test di Kolmogorvo-Smirnov, tenendo conto che la deviazione
standard associata è 0.658.
Residui
-1,19952
-0,19952
-0,15865
-0,02163
0,252404
0,389423
0,9375
F. emprica
0,142857143
0,285714286
0,428571429
0,571428571
0,714285714
0,857142857
1
F. teorica
0,034153
0,380861
0,404733
0,486885
0,64936
0,723017
0,922888
Diff.
0,108704
0,095147
0,023839
0,084543
0,064926
0,134126
0,077112
Poiché il massimo è 0,134 ed è inferiore corrispondente al quantile del test per n=7
e livello di significatività pari a 0.05, l’ipotesi che i residui abbiano distribuzione
gaussiana non è rigettabile.
Prova di recupero di Probabilità e Statistica - D*
21/04/2006
(NB: saranno prese in considerazione solo le risposte adeguatamente motivate)
tempo di lavoro: Due ore
1. Una macchina che produce strumenti di precisione è dotata di 5 motori in linea,
ciascuno indipendente dagli altri. La macchina funziona regolarmente fin tanto che
almeno due motori sono in funzione. Sapendo che la probabilità che un motore si
guasti è uguale a 0.20, calcolare la probabilità che la macchina funzioni
regolarmente.
Soluzione: Indicata con X la v.a. che conta il numero di motori funzionanti, si tratta
di calcolare P( X ≥ 2) dove X è una v.a. binomiale di parametri n=5 e p=0.2.
2. Il tempo T richiesto per completare un'operazione è descritto da una funzione
densità di probabilità pari a f(x)=1/20 per 20<x<40 secondi. Calcolare la
percentuale di assemblaggi che vengono completati in più di 27 secondi. Qual è il
tempo massimo per il completamento dell'85% degli assemblaggi?
Soluzione: Per determinare la percentuale di assemblaggi che vengono completati
in più di 27 secondi è necessario calcolare
40
1
13
∫ 20dx = 20
27
Per determinare il tempo massimo per il completamento dell'85% degli assemblaggi
è necessario risolvere l’equazione:
x
1
∫ 20dt = 0.85 ⇒
20
x − 20
= 0.85 ⇒ x = 20 + 20 * 0.85
20
3. In un campione casuale di 500 lampadine si è registrata la seguente distribuzione dei
tempi di durata tra 800 ore e 2000 ore:
Tempi di durata
n. lampadine
800-1000
15
1000-1200
91
1200-1400
65
1400-1600
191
1600-1800
26
1800-2000
8
Sottoporre a test l’ipotesi che il tempo di durata delle lampadine segua una
distribuzione Normale, facendo uso del test chi quadrato. (Per calcolare media e
varianza campionaria si sostituisca ogni dato con il centro dell'intervallo: ad
esempio per la prima classe 800-1000 si assume che 900 si sia verificato 15 volte).
Soluzione: Si osservi che dei 500 campioni esaminati, 396 sono riportati in tabella.
La media campionaria risulta
x=
*
900 * 15 + 1100 * 91 + 1300 * 65 + 1500 * 191 + 1700 * 26 + 1900 * 8
= 1373.73
396
Correzione dei compiti: giovedì 27 Aprile ore 11.30.
mentre la varianza campionaria risulta
s2 =
(900 − 1373.73) 2 * 15 + (1100 − 1373.73) 2 * 91 +
395
+ (1900 − 1373.73)
2
*8
= 47004.73
Effettuiamo un test chi quadrato:
Intervalli
1000
1200
1400
1600
1800
Freq. Oss.
15
91
65
191
26
8
F. ripart.
0,042368
0,211468
0,548222
0,851683
0,975362
0,024638
Probab.
0,042368
0,1691
0,336754
0,303461
0,123678
0,024638
Freq. Attese
16,77762741
66,96374155
133,3547155
120,1705636
48,97657263
9,756779257
Poiché la statistica test risulta maggiore del quantile di riferimento, si rigetta l’ipotesi nulla.