Università Carlo Cattaneo
STATISTICA II
Prova generale
24 giugno 2003
SOLUZIONI
Esercizio 1 ( 7 punti)
Si suppone che il tempo di consegna (in ore) di un pacco X abbia la seguente funzione di densità:
 x2
0 x3

f X x    k
0 altrove

a) Si enuncino le proprietà di cui gode una funzione di densità.
Una funzione di densità fX(x) deve soddisfare le seguenti proprietà:
1. f X ( x)  0 , per ogni x.

2.
f
X
( x)dx  1 .

b) Si determini la costante k.
Ponendo l’integrale della funzione uguale a uno e svolgendo l’equazione, si ottiene:
3
x2
0 k dx  1
3
1 2
x dx  1
k 0
3
 x3 
27
k   x dx   x dx    
9
3
3


0
0
0
3
3
2
2
x2
La funzione così ottenuta f X ( x) 
soddisfa entrambe le proprietà enunciate al punto precedente, quindi
9
il valore richiesto è k = 9.
 Qualora non sia risolto il punto precedente b si supponga che X abbia la seguente funzione di densità

3 2

0 x2
 x

f X x    8

0 altrove

c) Si determini la probabilità che un pacco venga consegnato in meno di un’ora.
1
1
x2
1 2
1  x3 
1 1 1
Pr( X  1)   dx   x dx      
9
90
9  3  0 9 3 27
0
3
Utilizzando invece la funzione suggerita f X ( x )  x 2 , la probabilità richiesta è pari a:
8
1
1
1
3 2
3 2
3  x3 
3 1 1
Pr( X  1)   x dx   x dx      
8
80
8  3 0 8 3 8
0
1
:





d) Si determini la probabilità che su 5 pacchi scelti a caso almeno uno sia consegnato in meno di un’ora.
La probabilità con cui un pacco viene consegnato entro un’ora è stata calcolata al punto precedente ed è pari
a 1/27. Sia Y = numero di pacchi consegnati in meno di un’ora su 5 scelti a caso. Y può assumere valori da 0
a 5 e si distribuisce come una BINOMIALE di parametri n=5 e =1/27, quindi:
5
1 

Pr(Y  1)  1  Pr(Y  0)  1  1    1  0.828  0.172
 27 
Qualora si utilizzasse la funzione suggerita f X ( x ) 
3 2
x , si avrebbe:
8
5
 1
Pr(Y  1)  1  Pr(Y  0)  1  1    1  0.513  0.487
 8
Esercizio 2 (4 punti)
Il numero di pezzi prodotti quotidianamente da un artigiano X è una variabile aleatoria discreta con la
seguente distribuzione:
2 3
1
0.5 0.4 0.1
X: 
a) Si determini il valore atteso e la varianza di X.
Il valore atteso di X è pari a:
n
E ( X )   xi p ( xi )  1  0.5  2  0.4  3  0.1  1.6
i 1
Calcolando il momento secondo:
n
E ( X 2 )   xi2 p ( xi )  1  0.5  4  0.4  9  0.1  3
i 1
e applicando la formula di calcolo della varianza, si ottiene:
VAR( X )  E ( X 2 )  [ E ( X )] 2  3  1.6 2  0.44
b) Si determini la probabilità che il numero medio di pezzi prodotti in 50 giorni lavorativi sia minore di 1.5.
(Si supponga che i numeri dei pezzi prodotti in giorni diversi possano essere considerati come delle
variabili aleatori indipendenti).
Sia X il numero medio di pezzi prodotti in 50 giorni e siano   E ( X ) e  2  VAR( X ) . Grazie al
teorema del limite centrale:
 2 
0.44 

  N 1.6,
X  N   ,
  N 1.6,0.0088
n 
50 


La probabilità richiesta è quindi approssimativamente pari a:

1.5  1.6 
Pr( X  1.5)  Pr Z 
  Pr( Z  1.07)  1  Pr( Z  1.07)  1  0.8577  0.1423
0.0088 

dove Z indica una v. c. normale standardizzata.
Esercizio 3 (5 punti)
Sia (X1, X2, X3) un campione di variabili indipendenti e identicamente distribuite estratte da una popolazione
X con valore atteso  e varianza 2. Al fine di stimare 2 si propongono i seguenti due stimatori:
T1  X 1 , X 2 , X 3  
X 1  2 X 2  3X 3
3
T2  X 1 , X 2 , X 3  
X1  2X 2  X 3
4
a) Si dia la definizione dell’errore quadratico medio di un generico stimatore T per un parametro .
Dato uno stimatore T per il parametro    , si definisce errore quadratico medio la quantità:
EQM T ( )  E[(T   )2 ],   
Alternativamente, l’EQM può essere espresso come:
EQM T ( )  VAR(T )  DT2 ( )  VAR(T )  [ E (T )   ]2
dove DT ( ) indica la distorsione dello stimatore.
b) Si dica giustificando la risposta quale tra i due stimatori proposti per 2 è opportuno scegliere.
Occorre calcolare gli EQM per i due stimatori:
1 2
14
(  4 2  9 2 )  (2  2 ) 2   2
9
9
1
11
EQM T2 (2 )  VAR(T2 )  DT22 (2 )  ( 2  4 2   2 )  (  2 ) 2   2
16
8
EQM T1 (2 )  VAR(T1 )  DT22 (2 ) 
Siccome
11 14

, T2 presenta un EQM inferiore e quindi è preferibile a T1.
8
9
Esercizio 4 ( 5 punti)
Il direttore del settore commerciale di un quotidiano intende valutare la possibilità di offrire agli abbonati un
servizio di consegna del quotidiano nel luogo di vacanza. Egli ritiene conveniente offrire questo servizio
qualora ne facesse richiesta più del 30% degli abbonati.
La decisione verrà presa sulla base di un campione bernoulliano di 200 abbonati.
a) Si imposti il problema di verifica di ipotesi su cui è possibile basare tale decisione, specificando
opportunamente l’ipotesi nulla e l’ipotesi alternativa. Si giustifichi la risposta.
Sia  la percentuale di abbonati richiedenti il servizio di consegna. Il test deve verificare se  sia maggiore o
minore di 0.3.
Occorre scegliere come ipotesi nulla quella che porta a conseguenze più gravi se rifiutata quando vera. Ad
esempio, se il direttore ritiene più grave predisporre il servizio di consegna qualora le richieste non fossero
sufficienti (un servizio di consegna comporta dei costi), allora le ipotesi del test sono:
H0:   0.3
H1:   0.3
b) Si fornisca l’espressione analitica della regione di rifiuto corrispondente al problema specificato al punto
a) per un livello di significatività  pari a 0.01.

 (1   0 ) 
R  ( x1 , , x n ) : x   0  z 0.99 0

n


c) Se su 200 abbonati 70 dichiarano di essere disposti ad avvalersi del servizio, che decisione prenderà il
direttore dell’area commerciale?

0.3(1  0.3) 
R  ( x1 , , x n ) : x  0.3  z 0.99
  ( x1 ,, x n ) : x  0.3  2.326  0.0324 
200


 ( x1 ,, x n ) : x  0.375
La media campionaria è pari a 70/200=0.35 e non appartiene alla regione di rifiuto, quindi si accetta H0.
Esercizio 5 ( 6 punti)
Si supponga che la spesa annua X (in migliaia di Euro) delle imprese del paese EE a sostegno di progetti
umanitari abbia una distribuzione Normale con valore atteso  e varianza 2 non noti. Si estrae da X un
campione bernoulliano di ampiezza 10 e si osservano i seguenti risultati:
10
x
i 1
i
 10 0
10
 x
i 1
 x  225.
2
i
a) Si dia la definizione di intervallo di confidenza di livello 1- per un generico parametro .
Sia X una popolazione indicizzata dal parametro  e sia (X1,…,Xn) un campione bernoulliano estratto da X;
siano inoltre T1 e T2 due statistiche tali che T1< T2 e che Pr(T1<q< T2)=1-,    , con  costante nota
tra 0 e 1. Allora l’intervallo (t1, t2) è detto intervallo di confidenza per  a livello 1-, dove t1 e t2 sono le
corrispondenti realizzazioni di T1 e T2.
b) Si costruisca un intervallo di confidenza di livello 1-=0.95 per il valore atteso .
Calcolando media campionaria e varianza campionaria corretta:
x
1 n
1
xi  100  10

n i 1
10
sC2 
1 n
1
( xi  x ) 2  225  25

n  1 i 1
9
è possibile costruire l’intervallo richiesto:

s2  
25 
)
  10  2.262  1.581  (6.424,13.576)
IC 0.95 (  )   x  t ( n1) C   10  t 0(.9975


1

n
10
2


 
10
 x
c) Se si fosse osservato un valore maggiore per
i 1
i
 x
2
come sarebbe variato l’intervallo di
confidenza?
In questo caso, la varianza campionaria corretta sarebbe stata più elevata e la lunghezza L dell’intervallo di
confidenza sarebbe stata maggiore, in quanto L  2t ( n1)
1
2
sC2
.
n
Esercizio 6 (3 punti)
Perché è rilevante la verifica dell’ipotesi 1=0 nell’ambito dell’inferenza sui coefficienti del modello
lineare?
Tale verifica è rilevante perché il parametro 1 incorpora la direzione e la forza della relazione lineare tra la
variabile dipendente Y e la variabile esplicativa X. Infatti, qualora un test di ipotesi portasse alla conclusione
che 1=0, potremmo ritenere il modello lineare inutile nel descrivere la relazione tra X e Y.