Esercitazione del 17.05.2013 Esercizi sulla verifica di ipotesi per la media di una popolazione. Esercizio 12.12 del libro di testo. Commento sul punto b. Va precisato “a parità di varianza”. Infatti, se si avesse: n = 85, x̄ = 132, s = 18.71 si avrebbe un intervallo di confidenza di lunghezza 2× √ 1.96 ×18.71/ 85 = 7.95 < 8. Con la specificazione suddetta, si ha n ≥ 100. Esercizio 14.6 del libro di testo. Soluzione. X=diametro del bullone. X ∼ N(µ, 1). Diametro medio corretto (con la macchina correttamente tarata): 8 cm. Per verificare che la macchina sia tarata correttamente si consideri la varifica di ipotesi: H0 : µ = 8 contro H1 : µ 6= 8 o, alternativamente, si calcoli l’intervallo di confidenza per µ di ugual livello. Esercizio. Consideriamo i lettori di DVD dell’Esercizio 9.10 (si veda l’esercitazione dell’8 maggio) la cui durata, in ore, è descritta da una variabile aleatoria X esponenziale. Il rivenditore sospetta che la loro durata media sia inferiore alle 2000 ore dichiarate dal costruttore. Sulla base di un campione della durata di 200 lettori, con media x̄ = 1750 ore e deviazione standard s = 1942.9, potete dire che c’è abbastanza evidenza per suggerire al venditore di cambiare marca? Soluzione. Verifica di ipotesi per la durata media µ, basata su un campione grande (approssimazione col Teorema Centrale del Limite): H0 : µ = 2000 (µ ≥ 2000) contro H1 : µ < 2000 . I dati forniscono evidenza per rifiutare, al livello del 5%, l’ipotesi nulla che la durata media sia (almeno) quella dichiarata dal costruttore (valore della statistica test: -1.82). Esercizio 14.7 del libro di testo. Soluzione. Ci chiediamo se ci sia abbastanza evidenza nei dati per rifiutare l’ipotesi (nulla) che la proporzione π di operai affetti da forti disturbi respiratori sia uguale (o minore) dell’incidenza di tali disturbi sull’intera popolazione (π0 = 10%). Test 1 asintotico per la proporzione: H0 : π = 0.10 (π ≤ 0.10) contro H1 : π > 0.10 . Sulla base del campione, non possiamo rifiutare l’ipotesi nulla (statistica test: 1.217) al livello del 5%. Esercizi sul confronto delle medie di due popolazioni indipendenti. Esercizio. Un’associazione di consumatori ha confrontato il tempo necessario a sciogliersi di una pastiglia di analgesico generico con una di marca. Vengono messe alla prova 8 pastiglie di generico (G) e 9 pastiglie di marca (M), ottenendo i seguenti dati: G M 14.2 14.7 13.9 15.3 14.8 13.6 14.3 14.9 14.4 13.8 15.0 15.1 14.6 14.9 14.4 14.7 14.9 I dati stabiliscono al livello del 5% che le pastiglie di marca si sciolgono più velocemente? Soluzione. La posizione ufficiale del Servizio Sanitario Nazionale è che il generico sia equivalente al corrispondente farmaco di marca. Ci chiediamo se ci sia abbastanza evidenza nei dati per rifiutare tale convinzione. Nell’ipotesi che il tempo di scioglimento sia una variabile aleatoria gaussiana con media µG e varianza incognita σ 2 nella popolazione G, e sia una variabile aleatoria gaussiana con media µM e medesima varianza σ 2 nella popolazione M, possiamo svolgere un test di confronto delle medie: H0 : µG = µM (µG ≤ µM ) contro H1 : µG > µM . Si ha: x̄G = 14.50, x̄M = 14.61 e le stime non distorte delle varianze1 nelle due popolazioni sono s2G = 0.314, s2M = 0.176. Stimiamo σ 2 con la varianza campionaria congiunta (pooled): s2p = 1 2 1 n−1 (nG − 1)s2G + (nM − 1)s2M 7 × 0.314 + 8 × 0.176 = = 0.2402 nG + nM − 2 15 − x̄)2 In classe potrei aver scambiato qualche termine. Qui è corretto. P i (xi 2 consideriamo la statistica test: r X̄G − X̄M s2p n1G + n1M che sotto l’ipotesi nulla ha distribuzione gaussiana standard, e rifiutiamo l’ipotesi nulla se in corrispondenza al campione la statistica test assume valori grandi, positivi. Nel nostro caso la statistica test vale −0.467, e quindi non possiamo rifiu- tare l’ipotesi nulla di uguale tempo di scioglimento (la statistica test prende valore negativo, come si poteva osservare fin dall’inizio perchè le medie campionarie “si comportano come” indicato dall’ipotesi nulla). Esercizio Un recente studio sugli incidenti al ginocchio dei giocatori di football americano ha confrontato due tipi di scarpe. Su un gruppo scelto a caso di 1440 giocatori, 240 utilizzano scarpe coi tacchetti mentre gli altri 1200 utilizzano scarpe più convenzionali. Tutti i soggetti giocano abitualmente sull’erba naturale. Hanno avuto problemi al ginocchio 13 dei giocatori coi tacchetti e 78 dei giocatori con le scarpe convenzionali. C’è abbastanza evidenza per suggerire alla Lega di football di sostituire le scarpe convenzionali con quelle coi tacchetti? Soluzione. Verifica di ipotesi per il confronto di proporzioni sulla base del test asintotico. Indichiamo con πT la proporzione di incidenti al ginocchio nella popolazione coi tacchetti, con πC la proporzione di incidenti al ginocchio nella popolazione con scarpe convenzionali. Suggeriamo alla Lega di cambiare scarpe se c’è abbastanza evidenza nei dati per rifiutare l’ipotesi nulla H0 : πT = πC (πT ≥ πC ) contro H1 : πT < πC .3 La statistica test, gaussiana standard sotto l’ipotesi nulla, è r πT − πC πp (1 − πp ) n1T + 3 1 nC A lezione abbiamo fatto i calcoli per il test bilatero e discusso il caso del caso unilatero, che qui è risolto per esteso. 3 ove πp è la proporzione totale di infortunati al ginocchio. Rifiuto l’ipotesi nulla se in corrispondenza al campione la statistica test è negativa, piccola. Nel nostro caso si hanno i valori campionari: π̂T = 13 78 91 = 0.054, π̂C = = 0.065, π̂p = = 0.063 240 1200 1440 La statistica test vale (si osservi che π̂T < π̂C ): q 0.054 − 0.065 0.063(1 − 0.063) 1 240 + 1 1200 = −0.64 > −1.65 (= zα ) e non è possibile rifiutare l’ipotesi nulla di uguale proporzione di incidenti nelle due popolazioni al livello del 5%. Esercizi sul test di indipendenza. Esercizio 14.16 del libro. Esercizio dal tema d’esame del 27.06.2011. Riprendiamo la tabella esaminata nell’esercitazione del 13 marzo: Età: Opinione PRO Contro Non so 21-40 25 20 5 41-59 20 35 20 60-79 55 15 5 100 70 30 50 75 75 200 che si riferisce ad un sondaggio d’opinione in cui 200 rispondenti sono classificati per opinione rispetto ad un certo provvedimento e per classe d’età. Verificare l’ipotesi di indipendenza tra la fascia d’età e l’opinione espressa sul provvedimento. P P (nij −n′ij )2 Soluzione La statistica test χ2 = i j ha, sotto l’ipotesi di indipendenza, n′ ij distribuzione χ2 a (3-1)×(3-1)=4 gradi di libertà. Si rifiuta l’ipotesi di indipendenza se il valore della statistica è molto grande. Nel nostro caso, avevamo calcolato nella esercitazione del 13.03, il valore di 35.54. Guardando alla tavola del χ2 a 4 gradi di libertà che c’è sul libro, vediamo che 35.54 > del più grande valore riportato, 19.9977, corrispondente al livello 0.0005. Quindi, il p-valore è < di 0.0005 e possiamo rifiutare l’ipotesi di indipendenza ai principali valori di significatività (5%, 1%, 0.1%). 4