Esercitazioni di Statistica Dott.ssa Cristina Mollica [email protected] Verifica di ipotesi Esercizio 1. Il preside di una scuola elementare sospetta che i suoi studenti abbiano un IQ, quoziente di intelligenza, superiore alla media italiana. Dopo aver selezionato casualmente 64 bambini tra i suoi studenti e misurato il loro quoziente di intelligenza, il preside riscontra un valore medio di 106. Supponiamo che l'IQ di uno studente della scuola elementare sia una variabile aleatoria normale con valore atteso non noto μ, e varianza 256. Supponiamo inoltre che il valore medio nazionale sia 100. a) Avendo fissato un valore di significatività α = 0.025, può il preside concludere che i suoi studenti siano più intelligenti della media? b) Ripetere il test assumendo una varianza pari a 900. SOLUZIONE a) Il preside è interessato alla verifica del seguente sistema di ipotesi: H 0 : μ =100 H 1 : μ >100 La statistica test è ̄ – μ0 X Z= , σ /√n che ha distribuzione normale standard. Per α = 0.025, il valore critico è z0.025 = 1.96. Il valore della statistica test è pari a 106 – 100 z= =3>1.96, √ 256 /64 e pertanto ricade nella zona di rifiuto (si rifiuta l’ipotesi nulla). Il preside può concludere che i suoi studenti sono più intelligenti della media. { b) Se σ2 = 900, il valore la statistica test diventa 106 – 100 z= =1.6<1.96, √ 900/ 100 pertanto non si può rifiutare l’ipotesi nulla. Esercizio 2. Un produttore di batterie ha immesso sul mercato un nuovo modello sostenendo che la durata media è superiore a quella del vecchio modello, che era pari a 14 ore. Su un campione di 10 batterie sono state osservate le seguenti durate: x = {18,17,14,16,15,12,13,15,17,13}. Supponendo che il tempo di durata abbia distribuzione normale, sottoporre a verifica l’affermazione del produttore, al livello α = 0.05. SOLUZIONE Il sistema di ipotesi d' interesse è il seguente: H 0 : μ =14 H 1 : μ >14 La varianza non è nota, pertanto la statistica test ̄ – μ0 X T= ∼T n−1 . σ̂ / √ n Il valore critico è t0.05,9 =1.833. { A partire dalla seguente tabella i 2 xi xi 1 18 324 2 17 289 3 14 196 4 16 256 5 15 225 6 12 144 7 13 169 8 15 225 9 17 289 10 13 169 150 2286 possiamo calcolare i valori campionari di media e varianza (corretta) n 1 n 1 2 2 2 2 x −n ̄x =( 2286−10⋅15 ) /9=4. ̄x = ∑i=1 x i=150 /10=15, s = ∑ i=1 i n n−1 ( ) Il valore della statistica test è quindi pari a t = (15-14) / (2 / √10) = 1.58. Dato che t = 1.58 < 1.833 = t0.05, 9, il test cade nella zona di accettazione. L’affermazione del produttore non è supportata dai dati osservati. Esercizio 3. Il direttore di un ospedale, situato in un quartiere molto povero nei sobborghi di New York, sospetta che i neonati che nascono lì abbiano un peso inferiore rispetto alla media nazionale (pari a 3.2 Kg), tale da dover richiedere un intervento di prevenzione sulla malnutrizione delle donne del quartiere. Rileva quindi il peso di 160 bambini scelti casualmente tra i neonati nell'ultimo anno e riscontra che il peso medio è pari a 2.9 e la varianza corretta è pari a 4. a) Verificare se il direttore riterrà necessario un intervento di sanità pubblica contro la malnutrizione, avendo fissato il livello di significatività del test uguale a 0.05. b) Ripetere il test supponendo che il campione sia di 80 bambini. SOLUZIONE a) Il direttore decide di sottoporre a verifica il sistema di ipotesi H 0 : μ =3.2 H 1 : μ <3.2 Nella situazione descritta, visto anche il valore elevato di n, possiamo usare il TLC per scrivere X̄ – μ 0 ∼T n−1 . σ̂ / √ n { Il valore della statistica test è t = (2.9 – 3.2) / (2/√160) = -1.90. La numerosità campionaria elevata ci permette di approssimare il valore critico del test t utilizzando il quantile della normale standard: zα = z0.05 = -1.645. Dal momento che t = -1.90 < -1.645 si rifiuta l’ipotesi nulla: il direttore riterrà necessario un intervento contro la malnutrizione. b) Anche con n = 80 possiamo ritenere valida l'approssimazione normale della distribuzione della statistica test. Il valore di t diventa t = (2.9 – 3.2) / (2/√80) = -1.34 Dato che t > -1.645 non si può rifiutare l'ipotesi nulla. Esercizio 4. La distribuzione della spesa per cliente di un certo supermercato può essere ben approssimata da una normale con media pari a 150 euro. Nelle vicinanze viene costruito un nuovo supermercato avente le stesse caratteristiche. Per un campione casuale di 49 clienti del nuovo supermercato, si rileva una spesa media pari a 150.50 euro e una varianza corretta pari a 4 euro. Sulla base di questi dati possiamo concludere, ad un livello di significatività α = 0.05, che nel nuovo supermercato la spesa media è diversa del vecchio? SOLUZIONE Il sistema di ipotesi di interesse è il seguente: H 0 : μ =150 H 1 : μ ≠150 La statistica test X̄ – μ 0 ∼T n−1 , σ̂ / √ n quindi il valore critico è pari a t48;0.025 ≈ z0.975 = 1.96. { Il valore della statistica è pari a t = (150.5 – 150) / (2 / √49) = 1.75 Dato che |t| = 1.75 < 1.96, non si può rifiutare l'ipotesi nulla. Esercizio 5. In uno studio di marketing viene misurato il grado di soddisfazione dei clienti di un determinato prodotto. Supponiamo che il gradimento si distribuisca nella popolazione come una v.c. Normale con varianza nota pari a σ2 = 9. Sulla base di un campione di 20 clienti, si vuole verificare l’ipotesi nulla che il grado di soddisfazione medio sia uguale a μ = 8 contro l’ipotesi alternativa che sia inferiore. Calcolare la probabilità di commettere un errore del II tipo considerando che μ1 = 7 e α = 0.05. SOLUZIONE Il sistema di ipotesi di interesse è il seguente: H 0 : μ =8 H 1 : μ <8 La statistica test ̄ – μ0 X Z= ∼N (0,1), σ /√n ̄ ⩽6.90 . La quindi il valore critico è pari a z0.05 = -1.645 e il rifiuto dell'ipotesi nulla avviene se X ̄ >6.90 . regione di accettazione è quindi data da tutti i valori della media campionaria tali che X Dalla definizione di errore di secondo tipo, β =Pr ( Accettare H 0 ∣H 1 )=Pr ( X̄ >6.90 ∣μ 1=7). ̄ >6.90 ∣ μ 1=7)=Pr Z> 6.90−7 =P (Z >−0.15)= P( Z <0.15)=0.5596. Pr ( X 3 / √ 20 { ( )