STATISTICA INFERENZIALE Prova scritta del 28 aprile 2003 TEORIA ESERCIZIO 1 Sia X una variabile aleatoria con distribuzione normale di media sconosciuta e varianza 1. Si vuole effettuare un test per le iptesi H 0 : 0 contro H 0 : 0 a livello di significatività 0.05. Si effettuano 10 campioni da 1 unità sperimentale ciascuno ottenendo i seguenti valori 0.65 -0.75 0.43 -2.44 0.44 0.71 0.86 -1.22 -1.92 0.25 Dire quante volte si rifiuta l’ipotesi principale. ESERCIZIO 2 Nella tabella a fianco sono riportati i risultati campionari di un’intervista effettuata su 54 persone, suddivisi fra maschi e femmine. Senza effettuare i calcoli dire quale è la conclusione di un test 2 di indipendenza fra le variabili Opinione e Sesso. SI FORSE NO M 10 12 5 F 10 12 5 ESERCIZIO 3 Si considerino i tre seguenti stimatori della media per campioni di dimensione n di una variabile aleatoria X con distribuzione normale di varianza 2. X Xn (1) X n(1) 1 (2) X n(2) (3) (3) X n n X1 X 2 2 X Xn 1 2n 3.1 Dire quali sono non distorti. 3.2 Dire quali, fra i non distorti, sono consistenti. ESERCIZIO 4 Una variabile casuale in una popolazione ha distribuzione normale con media sconosciuta e deviazione standard nota, 15 . Si vuole verificare se la media della variabile casuale è 20 contro l’alternativa che sia diversa da 20. Ad un campione si applica il test sulla media al livello del 5%. a) Qual è la probabilità di rifiutare l’ipotesi principale quando nella popolazione si ha 20 ? b) Che cosa si può dire circa la probabilità di rifiutare l’ipotesi principale quando nella popolazione si ha 20 ? ESERCIZI ESERCIZIO 1 Un gruppo di 22 volontari viene esposto a vari tipi di virus influenzali e tenuto sotto controllo medico. A un campione casuale di 10 volontari viene somministrato un farmaco e agli altri un placebo. Nella tabella a fianco è riporta la durata in giorni dell’influenza. Si indichi con X la variabile casuale che indica la durata dell’influenza nella popolazione. Dal campione si ottengono le seguenti statistiche: 12 i 1 10 i 1 1.1 12 x i (P ) = 70 x i (F ) = 75.5 i 1 10 i 1 x i2(P ) = 442 x i2(F ) = 584.75 Placebo (P) Farmaco (F) 5.5 7.5 4.5 7.0 3.0 6.0 4.5 8.5 8.5 4.5 4.5 6.0 6.5 9.0 10.0 8.0 8.5 7.0 7.0 6.0 7.0 6.5 Si effettui un test per verificare l’uguaglianza delle varianze nelle due popolazioni (P e F) di cui si hanno i dati campionari. Si effettui un test per verificare se il farmaco diminuisce la durata media dell’influenza. Giustificare la scelta dell’ipotesi pricipale e dell’alternativa. ESERCIZIO 2 1.2 Una variabile casuale X ha densità: f X (x ) a x a 1 per x [0,1] , dipendente da un parametro a reale positivo. 3.1 Disegnare il grafico della densità per valori di a uguale a 2 e uguale a 3. 3.2 Calcolare il valore medio e la varianza di X in funzione del parametro a . var( X ) IE ( X 2 ) IE ( X ) 2 x 2 f X (x ) dx A A dove A è l’insieme su cui è definita la variabile casuale. Ricordare: IE ( X ) x f X (x ) dx e IE ( X ) 2 3.3 Si vuole stimare il parametro a . A tale fine si effettua un campionamento di 36 unità sperimentali e si ottiene un valore medio campionario pari a 3.3. Fornire una stima puntuale della media di X , del parametro a e della varianza di X . 3.4 Calcolare un intervallo di confidenza a livello al 95% per la media di X e un intervallo di confidenza allo stesso livello per il parametro a . ESERCIZIO 3 Si vuole studiare se una variabile, indicata con Y, possa avere una dipendenza lineare da 3 variabili esplicative, indicate con X1, X2 e X3. Si effettua una regressione lineare su 100 osservazioni campionarie considerando un modello: Y 0 1 X 1 2 X 2 3 X 3 . I risultati sono i seguenti: The regression equation is Y = 1366 + 0.27 X1 + 23.0 X3 + 22.3 X4 Predictor Constant X1 X3 X4 Coef 1365.54 0.268 23.0040 22.3390 S = 27.97 SE Coef 22.04 5.148 0.3829 0.1593 R-Sq = 99.6% T 61.95 0.05 60.09 140.19 P 0.000 0.959 0.000 0.000 R-Sq(adj) = 99.6% Analysis of Variance Source Regression Residual Error Total DF 3 96 99 SS 20495331 75123 20570453 4.1 Commentare dettagliatamente. 4.2 La matrice X t X 1 MS 6831777 783 F 8730.39 P 0.000 ha i seguenti valori: 0.620858 -0.109551 -0.007038 -0.000913 -0.109551 0.033865 0.000180 0.000080 -0.007038 0.000180 0.000187 -0.000010 -0.000913 0.000080 -0.000010 0.000032 Ricavare da questa e dai dati precedenti la covarianza e la correlazione fra gli stimatori dei parametri 0 e 1