prova del 17-7-2001

annuncio pubblicitario
Esame di Statistica I – 17 luglio 2001
docente: Prof.ssa J. Mortera
I quesiti in corsivo hanno carattere teorico
1. [5] Due tifosi, Paolo e Carlo, vanno spesso allo stadio. Paolo ha assistito al 70% delle
partite e Carlo ha assistito al 90% delle partite.
a) Sapendo che la presenza di Paolo allo stadio è indipendente dalla presenza di Carlo (e
viceversa), qual è la probabilità che almeno uno dei due tifosi abbia assistito ad una
partita?
b) Qual è la probabilità che Paolo abbia assistito alla quarta partita di campionato sapendo
che Carlo ha assistito alla seconda partita di campionato?
c) Dati due eventi, A e B, definire la proprietà di incompatibilità e di indipendenza.
Soluzione esercizio 1
Sia A l’evento “Paolo assiste alla partita” e B l’evento “Carlo assiste alla partita”. Dai
dati si ha:
P(A)=0,7 P(B)=0,9
a) P( A  B)  P( A)  P( B)  P( A  C )  0,7  0,9  P( A) P( B)  1,6  0,63  0,97
b) La probabilità che Paolo abbia assistito alla quarta partita è esattamente 0,7,
poiché i due eventi sono indipendenti:
P( A | B)  P( A)  0,7.
2. [4] Una ditta produttrice di fotocopiatrici sa che la durata di una macchina (in migliaia di
copie) si distribuisce come una normale con =1600 e 2=3600. Essa risarcisce un
milione di lire all’acquirente se la durata della macchina acquistata è inferiore a 1450.
Calcolare la probabilità che
a) su 5 macchine la ditta debba risarcire al massimo un milione di lire
b) su 100 macchine la ditta debba risarcire più di un milione
soluzione esercizio 2
Sia X il tempo di durata di una macchina. Si ha:
1450  1600 

p0  P( X  1450)  P Z 
  P( Z  2,5)  1  (2,5)  0,0062.
60


a) L’evento: “risarcimento al più uguale a 1 milione” corrisponde all’evento “0 o 1
macchina ha durata inferiore a 1450”. La distribuzione del numero N di macchine
su 5 che durano meno di 1450 è una binomiale Bin(5; 0,0062). Quindi:
P( N  0)  P( N  1)  (1  0,0062) 5  5  0,0062  (1  0,0062) 4  0,99962.
b) Si deve calcolare P(N2). Poiché n=100 è grande e p0 è piccolo, si può
approssimare la distribuzione di N con la distribuzione di Poisson di parametro
=np0=0,62.
P( N  2)  1  P( N  0)  P( N  1)  1  e  (1   )  1  1,62  0,5379  0,1285.
3. [8] Dato un campione casuale X1,...,Xn,
a) definire uno stimatore e la proprietà di non distorsione;
1
b) dimostrare (facendo tutti i passaggi) che S 
n
2
2
 X i  X 
n
è uno stimatore distorto di
i 1
2.
c) Qual è la distribuzione di
4.
nS 2
2
? Perchè?
[6] Sia (X1, X2,X3) un campione casuale estratto da una popolazione X con distribuzione
di Poisson di parametro .
Dati due stimatori di 
T1 
2 X1  X 2  2 X 3
5
e
T2 
X1  X 3
2
a) stabilire se sono non distorti.
b) Ricavare l’errore quadratico medio di T1 e T2.
c) Quale tra i due stimatori è preferibile? Perchè?
soluzione esercizio 4
Dato che X si distribuisce come una Poisson di parametro , ha media e varianza pari
a .
1
2    2
 .
a) E (T1 )  E (2 X 1  X 2  2 X 3 ) 
5
5
1
2
E (T2 )  E ( X 1  X 2 )  
2
2
quindi ambedue gli stimatori sono corretti.
b) Essendo corretti, quindi senza distorsione, l’errore quadratico medio è dato dalla
sola varianza.
4
1
4
9
MSE (T1 )  Var (T1 )        
25
25
25
25
1
1
1
MSE (T2 )  Var (T2 )      
4
4
2
c) Tra i due stimatori è preferibile quello con errore quadratico medio inferiore, cioé
T1.
5.
[6] La seguente tabella riporta i furti commessi scoperti in un grande magazzino in un
anno, a seconda del settore merceologico e dell’età del colpevole.
Settore
Età
10 - 18
18 – 20
20 - 60
Abbigliamento
312
913
3367
Bigiotteria
710
377
208
Profumi
248
211
341
a) Sia p la probabilità che se un furto viene compiuto nel settore abbigliamento, l’età del
colpevole sia 10 – 18.Costruire un intervallo di confidenza per p al 95%.
b) Siano p1 e p2 le probabilità che il furto sia commesso nel settore dell’abbigliamento
nell’ipotesi che il colpevole abbia rispettivamente età compresa nella classe 18 – 20
oppure 20 – 60. Verificare l’ipotesi p1=p2 contro l’ipotesi alternativa p1  p2.
Soluzione esercizio 5
a) Una stima della probabilità che l’età del colpevole per i furti nel settore
abbigliamento sia nella classe 10-18 è data da:
312
pˆ 
 0,0679.
4592
Calcolando i limiti dell’intervallo di confidenza usando l’approssimazione normale:
p (1  p )
pˆ (1  pˆ )
pˆ  N ( p;
) , con n=4592, e la varianza stimata da
, l’intervallo al
n
n
95% è definito da:
pˆ (1  pˆ )
pˆ  z0,025
 0,0679  0,0073
n
e quindi (0,0606;0,0752).
b) Le stime delle probabilità richieste sono:
913
3367
pˆ 1 
pˆ 2 
1501
3916
Osserviamo due campioni di ampiezze rispettivamente n1=1501 e n2=3916 dalle
popolazioni degli autori dei furti rispettivamente di età 18-20 e 20-60. Sotto l’ipotesi
nulla di uguaglianza delle probabilità, la quantità p=p1=p2 è stimata da:
n pˆ  n2 pˆ 2
pˆ  1 1
 0,7901
n1  n2
Il valore osservato del test è:
pˆ 1  pˆ 2
 0,2515
z oss 

 20,34.
0,0124
1 1
pˆ (1  pˆ )  
 n1 n2 
Poiché z0,01=2,326 e |zoss|>z0,01 si rifiuta l’ipotesi nulla di uguaglianza delle probabilità
per =0,02
6. [4] Con riferimento alla tabella dell’esercizio precedente, dire se (giustificando le
risposte)
a) la classe modale della distribuzione marginale dell’età è
 A 10 - 18
 B 18 - 20
 C 20 -60
 D la distribuzione è bimodale
b) la moda della distribuzione marginale del settore merceologico è
 A abbigliamento
 B bigiotteria
 C non si può calcolare
 D profumi
c) la mediana della distribuzione marginale del settore merceologico è
 A abbigliamento
 B bigiotteria
 C non si può calcolare
 D 0,5
Soluzione esercizio 6
a) La risposta esatta è B. Infatti è la classe alla quale corrisponde la densità
maggiore.
b) La risposta esatta è A. Infatti è la classe alla quale corrisponde la frequenza
maggiore.
c) La risposta esatta è C. Infatti per calcolare la mediana è necessario che il carattere
sia almeno qualitativo ordinabile.
Scarica