Esame di Statistica I – 17 luglio 2001
docente: Prof.ssa J. Mortera
I quesiti in corsivo hanno carattere teorico
1. [6] La seguente tabella riporta i furti commessi scoperti in un grande magazzino in un
anno, a seconda del settore merceologico e dell’età del colpevole.
Settore
Età
10 - 18
18 – 20
20 - 60
Abbigliamento
312
913
3367
Bigiotteria
710
377
208
Profumi
248
211
341
a) Sia p la probabilità che se un furto viene compiuto nel settore abbigliamento, l’età del
colpevole sia 18 – 20.Costruire un intervallo di confidenza per p al 95%.
b) Siano p1 e p2 le probabilità che il furto sia commesso nel settore dell’abbigliamento
nell’ipotesi che il colpevole abbia rispettivamente età compresa nella classe 10 – 18
oppure 18 – 20. Verificare l’ipotesi p1=p2 contro l’ipotesi alternativa p1< p2.
Soluzione esercizio 1
a) Una stima della probabilità che l’età del colpevole per i furti nel settore
abbigliamento sia nella classe 18-20 è data da:
913
pˆ 
 0,1988.
4592
Calcolando i limiti dell’intervallo di confidenza usando l’approssimazione normale:
p(1  p)
pˆ (1  pˆ )
pˆ  N ( p;
) , con n=4592, e la varianza stimata da
, l’intervallo al
n
n
95% è definito da:
pˆ (1  pˆ )
pˆ  z 0,025
 0,1988  0,0115
n
e quindi (0,1873;0,2103).
b) Le stime delle probabilità richieste sono:
312
913
pˆ 1 
pˆ 2 
1270
1501
Osserviamo due campioni di ampiezze rispettivamente n1=1270 e n2=1501 dalle
popolazioni degli autori dei furti rispettivamente di età 10-18 e 18-20. Sotto l’ipotesi
nulla di uguaglianza delle probabilità, la quantità p=p1=p2 è stimata da:
n pˆ  n2 pˆ 2
pˆ  1 1
 0,442
n1  n2
Il valore osservato del test è:
pˆ 1  pˆ 2
 0,3626
zoss 

 19,19.
0,0189
1 1
pˆ (1  pˆ )  
 n1 n2 
Poiché z0,01=2,326 e |zoss|>z0,01 si rifiuta l’ipotesi nulla di uguaglianza delle probabilità
per =0,02.
2. [4] Con riferimento alla tabella dell’esercizio precedente, dire se (giustificando le
risposte)
a) la classe modale della distribuzione dell’età condizionata al settore profumi è
 A 10 - 18
 B 18 - 20
 C 20 -60
 D la distribuzione è bimodale
b) la moda della distribuzione del settore merceologico condizionata alla classe di età 10-18
è
 A abbigliamento
 B bigiotteria
 C non si può calcolare
 D profumi
c) la mediana della distribuzione del settore merceologico condizionata alla classe di età 1018 è
 A abbigliamento
 B bigiotteria
 C non si può calcolare
D
0,5
Soluzione esercizio 2
a) La risposta esatta è B. Infatti è la classe alla quale corrisponde la densità
maggiore.
b) La risposta esatta è B. Infatti è la classe alla quale corrisponde la frequenza
maggiore.
c) La risposta esatta è C. Infatti per calcolare la mediana è necessario che il carattere
sia almeno qualitativo ordinabile.
3. [4] Una ditta produttrice di fotocopiatrici sa che la durata di una macchina (in migliaia di
copie) si distribuisce come una normale con =1600 e 2=3600. Essa risarcisce un
milione di lire all’acquirente se la durata della macchina acquistata è inferiore a 1450.
Calcolare la probabilità che
a) su 5 macchine la ditta debba risarcire almeno un milione di lire
b) su 120 macchine la ditta debba risarcire fino a due milioni
soluzione esercizio 3
Sia X il tempo di durata di una macchina. Si ha:
1450  1600 

p0  P( X  1450)  P Z 
  P( Z  2,5)  1  (2,5)  0,0062.
60


a) La distribuzione del numero N di macchine su 5 che durano meno di 1450 è una
binomiale B(5; 0,0062). Quindi, la probabilità che il risarcimento sia non inferiore
al milione equivale alla probabilità dell’evento (N 1 ), cioè:
P( N  1)  1  P( N  0)  1  (1  0,0062) 5  0,0306.
b) Si deve calcolare P(N≥2). Poiché n=100 è grande e p0 è piccolo, si può
approssimare la distribuzione di N con la distribuzione di Poisson di parametro
=np0=0,62.
P( N  2)  1  P( N  0)  P( N  1)  1  e  (1   )  1  1,62  0,5379  0,1285.
4. [8] Dato un campione casuale X1,...,Xn,
a) definire uno stimatore e la proprietà di efficienza;
2
b) dimostrare (facendo tutti i passaggi) che S 2 
1 n
 X i  X  è uno stimatore distorto di
n i 1
2.
c) Qual è la distribuzione di
nS 2
2
? Perchè?
5. [5] Due studentesse, Paola e Chiara, hanno frequentato entrambe le lezioni del corso di
Statistica. Paola ha frequentato il 60% delle lezioni e Chiara ha frequentato l’80%.
a) Sapendo che la presenza di Paola a lezione è indipendente dalla presenza di Chiara (e
viceversa), qual è la probabilità che almeno una delle due studentesse abbia frequentato
una lezione.
b) Qual è la probabilità che Chiara abbia frequentato la quinta lezione di statistica dato che
Paola ha frequentato la terza lezione?
c) Dati due eventi, A e B, definire la proprietà di incompatibilità e di indipendenza.
Soluzione esercizio 5
Sia A l’evento “Paola assiste alla lezione” e B l’evento “Chiara assiste alla lezione”.
Dai dati si ha:
P(A)=0,6 P(B)=0,8
a) P( A  B)  P( A)  P( B)  P( A  C )  0,6  0,8  P( A) P( B)  1,4  0,48  0,92
b) La probabilità che Chiara abbia assistito alla quinta lezione è esattamente 0,8,
poiché i due eventi sono indipendenti:
P( B | A)  P( B)  0,8.
6.
[6] Sia (X1, X2,X3) un campione casuale estratto da una popolazione X con distribuzione
Binomiale di parametro p.
Dati due stimatori di p
T1 
2 X1  X 2  2 X 3
5
e
T2 
X1  X 3
2
a) stabilire se sono non distorti.
b) Ricavare l’errore quadratico medio di T1 e T2.
c) Quale tra i due stimatori è preferibile? Perchè?
soluzione esercizio 6
Dato che X si distribuisce come una binomiale di parametro p, ha media pari a 3p e
varianza pari a 3pq, con q=1-p.
1
2p  p  2p
 p.
a) E (T1 )  E (2 X 1  X 2  2 X 3 ) 
5
5
1
2
E (T2 )  E ( X 1  X 2 )  p  p
2
2
quindi ambedue gli stimatori sono corretti.
b) Essendo corretti, quindi senza distorsione, l’errore quadratico medio è dato dalla
sola varianza.
12
3
12
27
MSE (T1 )  Var (T1 ) 
pq 
pq 
pq 
pq
25
25
25
25
3
3
3
MSE (T2 )  Var (T2 )  pq  pq  pq
4
4
2
c) Tra i due stimatori è preferibile quello con errore quadratico medio inferiore, cioè
T1.