Esercitazione del 17.05.2013 Esercizi sulla verifica di - imati-cnr

Esercitazione del 17.05.2013
Esercizi sulla verifica di ipotesi per la media di una popolazione.
Esercizio 12.12 del libro di testo.
Commento sul punto b. Va precisato “a parità di varianza”. Infatti, se si avesse:
n = 85, x̄ = 132, s = 18.71 si avrebbe un intervallo di confidenza di lunghezza 2×
√
1.96 ×18.71/ 85 = 7.95 < 8. Con la specificazione suddetta, si ha n ≥ 100.
Esercizio 14.6 del libro di testo.
Soluzione. X=diametro del bullone. X ∼ N(µ, 1). Diametro medio corretto (con
la macchina correttamente tarata): 8 cm. Per verificare che la macchina sia tarata
correttamente si consideri la varifica di ipotesi:
H0 : µ = 8 contro H1 : µ 6= 8
o, alternativamente, si calcoli l’intervallo di confidenza per µ di ugual livello.
Esercizio.
Consideriamo i lettori di DVD dell’Esercizio 9.10 (si veda l’esercitazione dell’8 maggio) la cui durata, in ore, è descritta da una variabile aleatoria X esponenziale. Il
rivenditore sospetta che la loro durata media sia inferiore alle 2000 ore dichiarate
dal costruttore. Sulla base di un campione della durata di 200 lettori, con media
x̄ = 1750 ore e deviazione standard s = 1942.9, potete dire che c’è abbastanza evidenza per suggerire al venditore di cambiare marca?
Soluzione. Verifica di ipotesi per la durata media µ, basata su un campione grande
(approssimazione col Teorema Centrale del Limite):
H0 : µ = 2000 (µ ≥ 2000) contro H1 : µ < 2000
.
I dati forniscono evidenza per rifiutare, al livello del 5%, l’ipotesi nulla che la durata media sia (almeno) quella dichiarata dal costruttore (valore della statistica test:
-1.82).
Esercizio 14.7 del libro di testo.
Soluzione. Ci chiediamo se ci sia abbastanza evidenza nei dati per rifiutare l’ipotesi
(nulla) che la proporzione π di operai affetti da forti disturbi respiratori sia uguale
(o minore) dell’incidenza di tali disturbi sull’intera popolazione (π0 = 10%). Test
1
asintotico per la proporzione:
H0 : π = 0.10 (π ≤ 0.10) contro H1 : π > 0.10
.
Sulla base del campione, non possiamo rifiutare l’ipotesi nulla (statistica test: 1.217)
al livello del 5%.
Esercizi sul confronto delle medie di due popolazioni indipendenti.
Esercizio.
Un’associazione di consumatori ha confrontato il tempo necessario a sciogliersi di
una pastiglia di analgesico generico con una di marca. Vengono messe alla prova 8
pastiglie di generico (G) e 9 pastiglie di marca (M), ottenendo i seguenti dati:
G
M
14.2 14.7 13.9 15.3 14.8 13.6
14.3 14.9 14.4 13.8 15.0 15.1
14.6 14.9
14.4 14.7 14.9
I dati stabiliscono al livello del 5% che le pastiglie di marca si sciolgono più velocemente?
Soluzione. La posizione ufficiale del Servizio Sanitario Nazionale è che il generico
sia equivalente al corrispondente farmaco di marca. Ci chiediamo se ci sia abbastanza evidenza nei dati per rifiutare tale convinzione. Nell’ipotesi che il tempo di
scioglimento sia una variabile aleatoria gaussiana con media µG e varianza
incognita σ 2 nella popolazione G, e sia una variabile aleatoria gaussiana
con media µM e medesima varianza σ 2 nella popolazione M, possiamo svolgere un test di confronto delle medie:
H0 : µG = µM (µG ≤ µM ) contro H1 : µG > µM .
Si ha: x̄G = 14.50, x̄M = 14.61 e le stime non distorte delle varianze1 nelle due popolazioni sono s2G = 0.314, s2M = 0.176. Stimiamo σ 2 con la varianza campionaria
congiunta (pooled):
s2p =
1
2
1
n−1
(nG − 1)s2G + (nM − 1)s2M
7 × 0.314 + 8 × 0.176
=
= 0.2402
nG + nM − 2
15
− x̄)2
In classe potrei aver scambiato qualche termine. Qui è corretto.
P
i (xi
2
consideriamo la statistica test:
r
X̄G − X̄M
s2p n1G + n1M
che sotto l’ipotesi nulla ha distribuzione gaussiana standard, e rifiutiamo l’ipotesi nulla se in corrispondenza al campione la statistica test assume valori grandi,
positivi. Nel nostro caso la statistica test vale −0.467, e quindi non possiamo rifiu-
tare l’ipotesi nulla di uguale tempo di scioglimento (la statistica test prende valore
negativo, come si poteva osservare fin dall’inizio perchè le medie campionarie “si
comportano come” indicato dall’ipotesi nulla).
Esercizio
Un recente studio sugli incidenti al ginocchio dei giocatori di football americano ha
confrontato due tipi di scarpe. Su un gruppo scelto a caso di 1440 giocatori, 240 utilizzano scarpe coi tacchetti mentre gli altri 1200 utilizzano scarpe più convenzionali.
Tutti i soggetti giocano abitualmente sull’erba naturale. Hanno avuto problemi al
ginocchio 13 dei giocatori coi tacchetti e 78 dei giocatori con le scarpe convenzionali.
C’è abbastanza evidenza per suggerire alla Lega di football di sostituire le scarpe
convenzionali con quelle coi tacchetti?
Soluzione. Verifica di ipotesi per il confronto di proporzioni sulla base del test asintotico. Indichiamo con πT la proporzione di incidenti al ginocchio nella popolazione
coi tacchetti, con πC la proporzione di incidenti al ginocchio nella popolazione con
scarpe convenzionali. Suggeriamo alla Lega di cambiare scarpe se c’è abbastanza
evidenza nei dati per rifiutare l’ipotesi nulla
H0 : πT = πC (πT ≥ πC ) contro H1 : πT < πC .3
La statistica test, gaussiana standard sotto l’ipotesi nulla, è
r
πT − πC
πp (1 − πp ) n1T +
3
1
nC
A lezione abbiamo fatto i calcoli per il test bilatero e discusso il caso del caso unilatero, che
qui è risolto per esteso.
3
ove πp è la proporzione totale di infortunati al ginocchio. Rifiuto l’ipotesi nulla se
in corrispondenza al campione la statistica test è negativa, piccola. Nel nostro caso
si hanno i valori campionari:
π̂T =
13
78
91
= 0.054, π̂C =
= 0.065, π̂p =
= 0.063
240
1200
1440
La statistica test vale (si osservi che π̂T < π̂C ):
q
0.054 − 0.065
0.063(1 − 0.063)
1
240
+
1
1200
= −0.64 > −1.65 (= zα )
e non è possibile rifiutare l’ipotesi nulla di uguale proporzione di incidenti nelle due
popolazioni al livello del 5%.
Esercizi sul test di indipendenza.
Esercizio 14.16 del libro.
Esercizio dal tema d’esame del 27.06.2011.
Riprendiamo la tabella esaminata nell’esercitazione del 13 marzo:
Età:
Opinione
PRO Contro Non so
21-40
25
20
5
41-59
20
35
20
60-79
55
15
5
100
70
30
50
75
75
200
che si riferisce ad un sondaggio d’opinione in cui 200 rispondenti sono classificati per
opinione rispetto ad un certo provvedimento e per classe d’età. Verificare l’ipotesi
di indipendenza tra la fascia d’età e l’opinione espressa sul provvedimento.
P P (nij −n′ij )2
Soluzione La statistica test χ2 = i j
ha, sotto l’ipotesi di indipendenza,
n′
ij
distribuzione χ2 a (3-1)×(3-1)=4 gradi di libertà. Si rifiuta l’ipotesi di indipendenza
se il valore della statistica è molto grande. Nel nostro caso, avevamo calcolato nella
esercitazione del 13.03, il valore di 35.54. Guardando alla tavola del χ2 a 4 gradi di
libertà che c’è sul libro, vediamo che 35.54 > del più grande valore riportato, 19.9977,
corrispondente al livello 0.0005. Quindi, il p-valore è < di 0.0005 e possiamo rifiutare
l’ipotesi di indipendenza ai principali valori di significatività (5%, 1%, 0.1%).
4