STATISTICA ESERCITAZIONE 13 Dott. Giuseppe Pandolfo 9 Marzo 2015 Errore di I tipo: si commette se l'ipotesi nulla H0 viene rifiutata quando essa è vera Errore di II tipo: si commette se l'ipotesi nulla H0 viene accettata quando essa è falsa Esercizio 1 Supponiamo che la spesa mensile per l'affitto di un locale commerciale ( ) si distribuisce come una Normale con con . Selezionando n = 40 locali si osserva che euro. Verifichiamo che euro. Accettiamo H0 con ? Soluzione Il sistema di ipotesi é: Calcoliamo Siccome rifiutiamo l'ipotesi nulla In maniera equivalente: 1 Visto che rifiutiamo H0. Utilizziamo anche l'approccio basato sul p-value. Ora l'ipotesi nulla Ho viene rifiutata se Vediamo che e dunque rifiutiamo Ho. Esercizio 2 (Cicchitelli) Per la generica voce di un inventario di un’impresa mercantile sia X la variabile casuale valore inventariato - valore certificato. Un certificatore contabile estrae a sorte un campione di 120 voci ottenendo = 25,3 e = 13240. Sia µ la media di X nella popolazione. a) Si sottoponga a verifica l’ipotesi che µ = 0 contro l’alternativa µ > 0, cioè che l’inventario è gonfiato, con α = 0.01; b) Si calcoli la probabilità dell’errore di I tipo; c) Si calcoli la probabilità di errore di II tipo nel caso di ipotesi alternativa H1: µ = 27 d) Si calcoli la potenza del test; e) Senza fare i calcoli, e considerando i risultati del punto d) spiegare come cambierebbe la potenza del test se l’ipotesi alternativa è H1: µ = 27. 2 Soluzione a) 1. Definizione del sistema di ipotesi: 2. Livello di significatività α = 0,01 3. Costruzione della statistica test Trattandosi di un campione di dimensione elevata, per il Teorema del Limite Centrale si può ricorrere all’approssimazione normale e considerare S2 una buona stima della varianza della popolazione. 4. Definizione della regola di decisione (regione di rifiuto) Il livello di significatività è α = 0.01, il test è a una coda, quindi Se rifiutiamo l’ipotesi nulla o equivalentemente (1) 5. A partire dal campione calcolo il valore della statistica sotto l’ipotesi nulla 6. Decisione Siccome rifiuto l’ipotesi nulla. b) la probabilità dell’errore di I tipo è α = 0.01 c) Si definisce errore di II tipo la probabilità di non rifiutare l’ipotesi nulla quando è vera l’ipotesi alternativa, ossia nel nostro caso: 3 A partire dall’ipotese alternativa proposta µ1 = 27 (che da quindi luogo ad una distribuzione alternativa), la probabilità dell’errore di II tipo è data da: d) La potenza del test è la probabilità di rifiutare correttamente , in pratica la probabilità di prendere la “decisione giusta” e può essere espressa, in termini standardizzati, come: dove β è la probabilità di non rifiutare anche se è vera . Potenza del test Nota: un test ha potenza maggiore se la dimensione campionaria è grande, se la discrepanza vera dall’ipotesi nulla è grande e se la variabilità nella popolazione è bassa. e) Specificando = 28 la probabilità dell’errore di II tipo si riduce e aumenta la potenza del test. Esercizio 3 (ANOVA confronto tra medie) Applicare l'analisi della varianza ai dati in tabella e effettuare il test per il confronto tra medie. X Y A 17,4 10,4 20,0 B 57,1 25,7 19,9 C 20,5 12,8 22,3 4 Soluzione Medie parziali Scarti quadratici medi parziali Media generale Devianza tra gruppi Devianza entro gruppi Devianza totale 5 Definizione del sistema di ipotesi: Fonte di variazione Dev(SQ) gdl Tra i gruppi (DevEST) 588,15 2 Entro i gruppi (DevINT) 30,01 6 Totale 618,16 8 VAR(MQ) F Siccome rifiutiamo H0. Esercizio 4 (ANOVA per regressione) Y X 2,3 7 4 11 3,3 10,4 5 9 1) Stimare i coefficienti di regressione; 2) Calcolare l'indice di bontà di adattamento del modello di regressione; 6 3) Costruire la tabella ANOVA della regressione; 4) Verificare la significatività del modello usando il test sul coefficiente di regressione e il test F a partire dalla tabella ANOVA. Soluzione Fonte Variabilità Dev(ss) gdl Var(MS) Regressione Dev(R) 1 Dev(R) Errore Dev(E) n-2 Totale Dev(Y) n-1 Statistica F 1) 2) 7 3) Ora sapendo che Per cui: Quindi da cui: A questo punto calcoliamo Tn: La statistica F si ottiene: Fonte Variabilità Dev(ss) gdl Var(MS) Statistica F Regressione 0,89 1 0,89 3,83 Errore 2,99 2 1,49 Totale 3,88 3 8 4) Sistema di ipotesi: con Sappiamo che Siccome allora accettiamo H0. Esercizio 5 Il valore dell'indice di connessione del chi-quadrato per i dati in tabella è 8,95. Condizione Vaccino Sani Malati Totale Si 43 7 50 No 86 14 100 Totale 129 21 150 Effettuare un test del chi-quadrato per l'indipendenza con un livello di significatività del 10%. Soluzione Sappiamo che 9 Il sistema di ipotesi è: Il valore dell'indice di connessione va confrontato con , considerando anche il livello di significatività, nel nostro caso Utilizzando le tavole Rifiutiamo H0 se Siccome Rifiutiamo H0, e possiamo affermare che vi è relazione significativa con probabilità del 90%. 10