LIUC – CASTELLANZA Corso di laurea in Economia Aziendale STATISTICA I I - 01.02.2005 (Nello svolgimento del compito, si utilizzino quattro cifre decimali dopo la virgola) SOLUZIONI ESERCIZIO 1 (12 punti = 3 + 3 + 3 + 3) Supponete che p rappresenti la proporzione di italiani che posseggono un computer. Su 80 persone intervistate, 36 di esse dichiarano di possedere un computer. a) Proponete uno stimatore corretto per p e fornite la stima puntuale per p. Uno stimatore corretto per la proporzione p è la media campionaria; la corrispondente stima puntuale è: 1 80 36 x xi 0.45 80 i 1 80 b) Fornite l’intervallo di confidenza per p, con un livello di confidenza al 95%. x (1 x ) 0.45(1 0.45) 0.45 z 0.975 0.45 1.96 0.0556 ic1 ( p) x z 1 n 80 2 (0.341,0.559) c) Recentemente, un quotidiano nazionale ha affermato che il 53% degli italiani possiede un computer. Sulla base del vostro campione, ritenete accettabile la notizia? Rispondete utilizzando un test di livello = 0.1 (H0: p = 53%, H1:p 53%). La regione di rifiuto è: p0 (1 p0 ) 0.53(1 0.53) R ( x1 ,, xn ) : x p0 z ( x1 ,, x n ) : x 0.53 z 0.95 1 n 80 2 ( x1 ,, xn ) : x 0.53 1.645 0.0558 ( x1 ,, x n ) : x 0.53 0.0918 Siccome la media campionaria è pari a 0.45, x 0.53 = 0.08 < 0.0918; quindi si ACCETTA l’ipotesi nulla. d) Quale dovrebbe essere l’ampiezza campionaria minima affinché la lunghezza dell’intervallo di confidenza (punto b) non superi il valore di 0.2? x (1 x ) La lunghezza L dell’intervallo è L = 2 z . Imponendo quindi L<0.2, si ottiene: 1 n 2 2 2 z x (1 x ) 2 2 1 2 z 0 . 45 ( 1 0 . 45 ) 2 1.96 0.4975 0 , 975 2 n 95.082 . 0.2 0 . 2 0 . 2 Dunque l’ampiezza campionaria minima è pari a 96. ESERCIZIO 2 (4 punti = 2 + 2) Sia Xi la distanza (in km) tra l’abitazione dell’i-esimo cliente e un certo punto vendita. Si suppone che Xi abbia una distribuzione normale con valore atteso = 2 e varianza 2=9. a) Si determini la probabilità che l’i-esimo cliente abiti a una distanza dal punto vendita inferiore 1.7 km. X 2 1.7 2 Pr X i 1.7 Pr i Pr Z 0.1 1 Pr Z 0.1 1 0.5398 0.4602 9 9 b) Nell’ipotesi che le distanze di tutti i clienti del punto vendita siano indipendenti e identicamente distribuite come N(2,9), si determini la probabilità che la distanza media per 20 clienti sia inferiore a 3 km. X 2 32 Pr Z 1.4907 0.9319 Pr X 20 3 Pr 20 9 / 20 9 / 20 ESERCIZIO 3 (4 punti = 2 + 2) Sia X una variabile aleatoria discreta avente E(X) = 2 e E(X2) = 9. Considerate inoltre un’altra variabile Y definita come Y = a + bX, con a e b costanti positive. a) Calcolate VAR(X). Applicando la formula di calcolo della varianza: VAR( X ) E ( X 2 ) [ E ( X )] 2 9 2 2 5 b) Sapendo che E(Y) = 12 e VAR(Y) = 5, determinate i valori di a e b. (Se non avete risposto al punto precedente, utilizzate VAR(X)=20). Per le proprietà degli operatori valore atteso e varianza, sappiamo che: E (Y ) a bE ( X ) 2 VAR(Y ) b VAR( X ) con VAR(X)=5, il sistema diventa: 12 a b 2 2 5 b 5 Dalla seconda equazione si deduce che b=1; sostituendo nella prima, otteniamo a=10. Utilizzando invece VAR(X)=20: 12 a b 2 2 5 b 20 Dalla seconda equazione si deduce che b=1/2; sostituendo nella prima, otteniamo a=11. ESERCIZIO 4 (5 punti = 3 + 2) Si consideri il seguente stimatore: nX n X 1 n a) Definite in generale cosa si intende per stimatore consistente in media quadratica. Uno stimatore Tn è consistente (in media quadratica) per un parametro se: lim E[(Tn ) 2 ] 0, Tn n Equivalentemente, condizione necessaria e sufficiente affinché Tn sia uno stimatore consistente (in media quadratica) per è che: lim n E (Tn ) , lim n VAR(Tn ) 0, b) Sapendo che E(X) = VAR(X) = , stabilite se lo stimatore Tn sia o meno consistente in media quadratica per . Il valore atteso e la varianza dello stimatore sono rispettivamente: nX X 1 nE ( X n ) E ( X 1 ) n n 1 E (Tn ) E n n n n n 2 nX X 1 n VAR( X n ) VAR( X 1 ) n 2 n 2 1 VAR(Tn ) VAR n n n2 n2 n2 La condizione necessaria e sufficiente per la consistenza non è interamente verificata, infatti: lim n VAR(Tn ) 0 Quindi lo stimatore NON è consistente in media quadratica. ESERCIZIO 5 (5 punti = 3 + 2) Considerate il modello di regressione lineare Yi 0 1 xi i , per i 1,..., n . a) Elencate le ipotesi deboli del modello. Le ipotesi deboli sono: per ogni i 1,..., n 1) E i 0 2) Var i 2 3) Cov i , j 0 per ogni i 1,..., n per ogni i 1,..., n, j i b) Nell’ambito dell’inferenza sui coefficienti del modello, perché è rilevante la verifica dell’ipotesi 1=0? Tale verifica è rilevante perché il parametro 1 incorpora la direzione e la forza della relazione lineare tra la variabile dipendente Y e la variabile esplicativa X. Infatti, qualora un test di ipotesi portasse alla conclusione che 1=0, potremmo ritenere il modello lineare inutile nel descrivere la relazione tra X e Y.