statistica ii - 01.02.2005

LIUC – CASTELLANZA
Corso di laurea in Economia Aziendale
STATISTICA I I - 01.02.2005
(Nello svolgimento del compito, si utilizzino quattro cifre decimali dopo la virgola)
SOLUZIONI
ESERCIZIO 1 (12 punti = 3 + 3 + 3 + 3)
Supponete che p rappresenti la proporzione di italiani che posseggono un computer. Su 80
persone intervistate, 36 di esse dichiarano di possedere un computer.
a) Proponete uno stimatore corretto per p e fornite la stima puntuale per p.
Uno stimatore corretto per la proporzione p è la media campionaria; la corrispondente stima
puntuale è:
1 80
36
x   xi 
 0.45
80 i 1
80
b) Fornite l’intervallo di confidenza per p, con un livello di confidenza al 95%.

x (1  x )  
0.45(1  0.45) 
   0.45  z 0.975
  0.45  1.96  0.0556 
ic1 ( p)   x  z 
 

1
n
80
2

 

 (0.341,0.559)
c) Recentemente, un quotidiano nazionale ha affermato che il 53% degli italiani possiede un
computer. Sulla base del vostro campione, ritenete accettabile la notizia? Rispondete
utilizzando un test di livello = 0.1 (H0: p = 53%, H1:p  53%).
La regione di rifiuto è:

p0 (1  p0 )  
0.53(1  0.53) 
R  ( x1 ,, xn ) : x  p0  z 
 ( x1 ,, x n ) : x  0.53  z 0.95


1
n
80

 
2

 ( x1 ,, xn ) : x  0.53  1.645  0.0558  ( x1 ,, x n ) : x  0.53  0.0918
Siccome la media campionaria è pari a 0.45, x  0.53 = 0.08 < 0.0918; quindi si ACCETTA
l’ipotesi nulla.
d) Quale dovrebbe essere l’ampiezza campionaria minima affinché la lunghezza
dell’intervallo di confidenza (punto b) non superi il valore di 0.2?
x (1  x )
La lunghezza L dell’intervallo è L = 2 z 
. Imponendo quindi L<0.2, si ottiene:
1
n
2
2
 2 z  x (1  x ) 
2
2
 1



2
z
0
.
45
(
1

0
.
45
)
 2  1.96  0.4975 
0
,
975
2


 
n

  95.082 .


0.2
0
.
2
0
.
2








Dunque l’ampiezza campionaria minima è pari a 96.
ESERCIZIO 2 (4 punti = 2 + 2)
Sia Xi la distanza (in km) tra l’abitazione dell’i-esimo cliente e un certo punto vendita. Si
suppone che Xi abbia una distribuzione normale con valore atteso  = 2 e varianza 2=9.
a) Si determini la probabilità che l’i-esimo cliente abiti a una distanza dal punto vendita
inferiore 1.7 km.
 X  2 1.7  2 
Pr  X i  1.7   Pr i

  Pr Z  0.1  1  Pr Z  0.1  1  0.5398  0.4602
9
9 

b) Nell’ipotesi che le distanze di tutti i clienti del punto vendita siano indipendenti e
identicamente distribuite come N(2,9), si determini la probabilità che la distanza
media per 20 clienti sia inferiore a 3 km.
 X 2
32 
  Pr Z  1.4907   0.9319
Pr X 20  3  Pr 20

9 / 20 
 9 / 20
ESERCIZIO 3 (4 punti = 2 + 2)
Sia X una variabile aleatoria discreta avente E(X) = 2 e E(X2) = 9. Considerate inoltre
un’altra variabile Y definita come Y = a + bX, con a e b costanti positive.
a) Calcolate VAR(X).
Applicando la formula di calcolo della varianza:
VAR( X )  E ( X 2 )  [ E ( X )] 2  9  2 2  5
b) Sapendo che E(Y) = 12 e VAR(Y) = 5, determinate i valori di a e b. (Se non avete
risposto al punto precedente, utilizzate VAR(X)=20).
Per le proprietà degli operatori valore atteso e varianza, sappiamo che:
 E (Y )  a  bE ( X )

2
VAR(Y )  b VAR( X )
con VAR(X)=5, il sistema diventa:
12  a  b  2

2
 5  b 5
Dalla seconda equazione si deduce che b=1; sostituendo nella prima, otteniamo a=10.
Utilizzando invece VAR(X)=20:
12  a  b  2

2
 5  b  20
Dalla seconda equazione si deduce che b=1/2; sostituendo nella prima, otteniamo a=11.
ESERCIZIO 4 (5 punti = 3 + 2)
Si consideri il seguente stimatore:
nX n  X 1
n
a) Definite in generale cosa si intende per stimatore consistente in media quadratica.
Uno stimatore Tn è consistente (in media quadratica) per un parametro    se:
lim E[(Tn   ) 2 ]  0,   
Tn 
n
Equivalentemente, condizione necessaria e sufficiente affinché Tn sia uno stimatore consistente
(in media quadratica) per  è che:
lim n E (Tn )   ,
  
lim n VAR(Tn )  0,
  
b) Sapendo che E(X) = VAR(X) =  , stabilite se lo stimatore Tn sia o meno consistente in
media quadratica per  .
Il valore atteso e la varianza dello stimatore sono rispettivamente:
 nX  X 1  nE ( X n )  E ( X 1 ) n   n  1
E (Tn )  E  n




n
n
n
n


2
 nX  X 1  n VAR( X n )  VAR( X 1 ) n 2   n 2  1
VAR(Tn )  VAR n




n
n2
n2
n2


La condizione necessaria e sufficiente per la consistenza non è interamente verificata, infatti:
lim n VAR(Tn )    0
Quindi lo stimatore NON è consistente in media quadratica.
ESERCIZIO 5 (5 punti = 3 + 2)
Considerate il modello di regressione lineare Yi   0   1 xi   i , per i  1,..., n .
a) Elencate le ipotesi deboli del modello.
Le ipotesi deboli sono:
per ogni i  1,..., n
1) E  i   0
2) Var  i    2
3) Cov i ,  j   0
per ogni i  1,..., n
per ogni i  1,..., n, j  i
b) Nell’ambito dell’inferenza sui coefficienti del modello, perché è rilevante la verifica
dell’ipotesi 1=0?
Tale verifica è rilevante perché il parametro 1 incorpora la direzione e la forza della
relazione lineare tra la variabile dipendente Y e la variabile esplicativa X. Infatti, qualora
un test di ipotesi portasse alla conclusione che 1=0, potremmo ritenere il modello lineare
inutile nel descrivere la relazione tra X e Y.