Test di Ipotesi

Test di Ipotesi
Test di ipotesi - Prob. e Stat. a.a. 04/05
1
Metodologia statistica che consente di prendere una decisione
circa:
- una ipotesi formulata sul modello di una popolazione
- un parametro incognito del modello di una popolazione.
Definizione
Una ipotesi statistica è una proposizione circa uno o più parametri
di una popolazione o circa la distribuzione di probabilità della variabile aleatoria X che descrive la popolazione.
Esempio: Si vuole stabilire se una certa moneta è equa, ossia se p=P(T)=P(C)=0.5.
Si formula l’ipotesi di base (quella da sottoporre a test) che la moneta è onesta
e si verifica l’attendibilità di tale ipotesi contro l’ipotesi alternativa (che la moneta
sia disonesta).
H 0 : p = 0.5 (ipotesi nulla)
H 1: p ≠ 0.5 (ipotesi alternativa)
Test di ipotesi - Prob. e Stat. a.a. 04/05
2
H 0 : p = 0.5 (ipotesi nulla)
H 1: p ≠ 0 .5 (ipotesi alternativ a)
Ipotesi alternativa
a due code
H 0 : p = 0.5 (ipotesi nulla)
H 1: p < 0 .5 (ipotesi alternativ a)
Ipotesi alternativa
a una coda
H 0 : p = 0.5 (ipotesi nulla)
H 1: p > 0 .5 (ipotesi alternativ a)
Determinare se il valore
del parametro è cambiato
Obbiettivo
Risultato da esperienza passata
o conoscenza del processo
Verificare la teoria
sul modello
Risultato di una ipotesi formulata
sul modello
Test di conformità
Risultato di specifiche di progetto
o obblighi contrattuali
Test di ipotesi - Prob. e Stat. a.a. 04/05
3
Si chiama test di ipotesi una procedura che consente di
prendere una decisione circa una particolare ipotesi (nulla) a
partire dalle informazioni contenute in un campione casuale
estratto dalla popolazione in esame.
Se questa informazione
è consistente con l’ipotesi
Se questa informazione non
è consistente con l’ipotesi
H 0 non è rigettabile
H 0 è falsa
Una ipotesi non potrà mai essera accettata con certezza, ma il risultato
del test sarà sempre accompagnato da una valutazione della possibilità di commettere un errore accettando o rigettando l’ipotesi.
Procedura
• selezionare un campione casuale
• calcolare una statistica test
• usando il valore calcolato prendere una decisione
circa l’ipotesi nulla
Test di ipotesi - Prob. e Stat. a.a. 04/05
4
Esempio: Si vuole stabilire se il coefficiente di combustione medio di un propellente solido
usato per potenziare un sistema di fuga in un equipaggio aereo è 50 cm al secondo.
H 0 : µ = 50cm/s (ipotesi nulla)
H 1: µ ≠ 50cm/s (ipotesi alternativa)
Si assuma che sia stato osservato un campione casuale di taglia n = 10.
Si supponga di poter valutare la media campionaria x.
E'legittimo assumere di non rigettare l'
ipotesi H 0 se fosse 48.5 ≤ x ≤ 51.5
e di rigettare l'
ipotesi H 0 se fosse x > 51.5 oppure x < 48.5.
Definizione
La regione critica di un test di ipotesi è quel sottoinsieme di numeri reali
tale che si rigetta H 0 se il valore calcolato s della statistica test appartiene
a tale sottoinsieme e si accetta H 0 se il valore calcolato s della statistca test
non appartiene a tale sottoinsieme.
Il complemento della regione critica viene chiamato
regione di accettazione.
Test di ipotesi - Prob. e Stat. a.a. 04/05
5
Questo tipo di procedura decisionale può condurre a due tipi di errori
Si commette un errore del I tipo quando si rigetta l’ipotesi nulla pur
essendo vera. Si commette un errore del II tipo quando non si rigetta l’ipotesi nulla pur essendo falsa.
I tipo
Regione critica
Reg.accettazione
48.5
50
Regione critica
51.5
µ vero
x
II tipo
µ vero
48.5
50
x
51.5
Test di ipotesi - Prob. e Stat. a.a. 04/05
6
Non si rigetta l’ipotesi nulla
Si rigetta l’ipotesi nulla
Ipotesi nulla vera Ipotesi nulla falsa
no errore
errore II tipo
errore I tipo
no errore
Definizione
Si definisce livello di significatività del test o taglia del test la probabilità
di commettere un errore di I tipo :
α = P(errore di I tipo) = P(rigettare H 0 quando è vera)
β = P(errore di II tipo) = P(accettare H 0 quando è falsa)
Ipotesi nulla vera Ipotesi nulla falsa
β
1-α
Non si rigetta l’ipotesi nulla
α
1- β
Si rigetta l’ipotesi nulla
Test di ipotesi - Prob. e Stat. a.a. 04/05
7
Torniamo all’esempio del fattore di combustione. Si assuma che la deviazione
standard di tale variabile aleatoria sia 2.5 cm al sec. Determinare il livello di
significatività del test per un campione di taglia 10.
P(rigettare H 0 | H 0 vera ) = P(rigettare H 0 | µ = 50) = P (X ∈ regione critica | µ = 50)
(
Υ X > 51,5 | µ = 50) = P(X − 50 < 48,5 − 50)+ P(X − 50 > 51,5 − 50) =
= P X < 48,5
 X − 50
 X − 50

48,5 − 50 
51,5 − 50 
48,5 − 50 
 + P
 = 2 P Z <
= P
<
>
 = 0.0588
2
.
5
/
10
2
.
5
/
10
2
.
5
/
10
2
.
5
/
10
2.5 / 10 





α
Regione di accettazione taglia
48.5 ≤ x ≤ 51.5
10 0.0576
48 ≤ x ≤ 52
10 0.0114
48.5 ≤ x ≤ 51.5
16 0.0164
48 ≤ x ≤ 52
16 0.0014
Test di ipotesi - Prob. e Stat. a.a. 04/05
8
Come si calcola la probabilit à di commettere un errore di II tipo?
β = P(errore di II tipo) = P(non rigettare H 0 quando è falsa)
= P ( non rigettare H 0 | H 1 è vera)
Per calcolare l’errore di secondo tipo dobbiamo avere una ipotesi
alternativa specifica. Quale?
H 1 : µ ≠ 50
Si assuma che è “necessario” rigettare l’ipotesi nulla H 0 : µ = 50
se il coefficiente di combustione medio dovesse raggiungere valori
intorno a 52.
Ad esempio, si commette un errore di II tipo, se il campione casuale fornisce una
stima puntuale della media campionari a compresa tra 48.5 e 51.5 quando µ = 52 .
β = P (48 .5 ≤ X ≤ 51 .5 quando µ = 52 ) = 0.2643
Test di ipotesi - Prob. e Stat. a.a. 04/05
9
Lo statistico controlla l’errore di I tipo e in funzione
di questo seleziona la regione critica.
Rigettare l’ipotesi nulla
L’errore di II tipo dipende dal vero valore del
parametro in esame, che è normalmente incognito,
sicché si procede per tentativi.
Accettare l’ipotesi nulla
= non si rigetta l’ipotesi nulla
Test di ipotesi - Prob. e Stat. a.a. 04/05
10
α
Regione di accettazione taglia
48.5 ≤ x ≤ 51.5
10 0.0576
48 ≤ x ≤ 52
10 0.0114
48.5 ≤ x ≤ 51.5
16 0.0164
48 ≤ x ≤ 52
16 0.0014
β con µ = 52 β con µ = 50.5
0.2643
0.8923
0.5000
0.9705
0.2119
0.9445
0.5000
0.9918
•L’errore di I tipo è legato all’errore di II tipo. Se aumenta uno decresce
l’altro e viceversa.
•Al crescere della taglia del campione, vengono ridotti gli errori di I
e II tipo.
• L’errore di II tipo diminuisce se il valore assegnato al parametro si
allontana da quello impiegato nell’ipotesi nulla.
Test di ipotesi - Prob. e Stat. a.a. 04/05
11
Definizione
Si definisce potenza del test, la probabilità di rigettare l’ipotesi nulla
quando è vera l’ipotesi alternativa.
1 − β è la probabilità di rigettare correttamente un’ipotesi nulla falsa
Nell'
esempio del fattore di combustione dove si effettua il test sull'
ipotesi H 0 : µ = 50
contro l'
ipotesi alternativa H 1 : µ ≠ 50, se il valore vero del parametro µ è 52, allora
β = 0.2643 ⇒ 1 - β = 0.7357, ossia con in 73 casi su 100 il test riconosce che l'
ipotesi nulla è falsa. Se si ritiene questo valore basso, si può aumentare α oppure aumen tare la taglia del campione.
1− β
Test di ipotesi - Prob. e Stat. a.a. 04/05
12
Procedura generale per la costruzion e di un test di ipotesi.
(a) Dal contesto del problema, identifica re il parametro di interesse.
(b) Formulare l'
ipotesi nulla H 0 .
(c) Specificar e una opportuna ipotesi alternativa H 1 (test a 1 o 2 code).
(d) Scegliere un opportuno errore di I tipo α .
(e) Scegliere una opportuna statistica test (dipende dal parametro).
(f) Costruire una opportuna regione criticaα ..
(g) Determinare un campione casuale e valutare una stima puntuale
della statistica test.
(h) Decidere se rigettare o meno l'
ipotesi nulla, verifican do se tale
stima puntale appartiene o meno alla regione critica.
Esercizio: La specifica assegnata sul coefficiente di combustione di un certo propollente è di 50cm/s. La deviazione standard di tale caratteristica è di 2cm/s. Selezionando un campione casuale di taglia 25, si è trovato che la media campionaria è di 51.3
cm/s. Quale conclusione si può dedurre sulla specifica al livello di significatività del
Test di ipotesi - Prob. e Stat. a.a. 04/05
13
5%?
Procedura per il test di ipotesi
(a) Identificare il parametro di interesse : la media µ .
(b) Formulare l'
ipotesi nulla H 0 ⇒ H 0 : µ = 50
(c) Specificar e l'ipotesi alternativa H 1 ⇒ H 1 : µ ≠ 50.
(d) Scegliere un opportuno errore di I tipo α . ⇒ α = 0.05
(e) Scegliere una opportuna statistica test ⇒ X (media camp.).
(f) Costruire una opportuna regione critica :
P( X < ?
ΥX > ?| H
0
è vera) = α ⇒ P (? < X < ? | µ = 50) = 1 - α
X −µ
< zα / 2 ) = 1 - α allora la regione
σ/ n
di accettazione del test è l'
intervallo :
Poichè si sa che : P ( − zα / 2 <

σ
σ  
2
2
 50 − zα / 2
 =  50 − 1.96 ,50 + 1.96  = ( 49.21,50.78)
,50 + zα / 2
5
5
n
n 

Test di ipotesi - Prob. e Stat. a.a. 04/05
14
(g) Determinare un campione casuale e valutare una stima puntuale
della statistica test. ⇒ x = 51.3.
(h) Decidere se rigettare o meno l'
ipotesi nulla, verifican do se tale
stima puntale appartiene o meno alla regione critica :
poichè 51.3 ∉ ( 49.21,50.78), l'
ipotesi nulla viene rigettata.
Test di ipotesi - Prob. e Stat. a.a. 04/05
15
Esercizio: Si ipotizza che l’età media dei frequentatori di una biblioteca sia 39 anni con una
varianza di 10.2 anni. Per verificare tale ipotesi vengono campionati 100 frequentatori e la
loro età media risulta essere 38 anni. Si verifichi l’ipotesi iniziale (si assuma la popolazione
normale).
(a) Identifica re il parametro di interesse : la media µ .
(b) Formulare l'ipotesi nulla H 0 ⇒ H 0 : µ = 39.0
(c) Specificar e l'ipotesi alternativa H 1 ⇒ H 1 : µ ≠ 39.0.
(d) Scegliere un opportuno errore di I tipo α . ⇒ α = 0.05
(e) Scegliere una opportuna statistica test ⇒ X (media camp.).
(f) Costruire una opportuna regione critica :
P( X < ?
ΥX > ?| H
0
è vera) = α ⇒ P (? < X < ? | µ = 39.0) = 1 - α
X −µ
< zα / 2 ) = 1 - α allora la regione
σ/ n
di accettazione del test è l'
intervallo :
Poichè si sa che : P ( − zα / 2 <

σ
σ  
3.19
3.19 
 39 − zα / 2
 =  39 − 1.96
,39 + zα / 2
,39 + 1.96
 = (38.48,39.51)
10
10 
n
n


Testdi ipotesi - Prob. e Stat. a.a. 04/05
16
(g) Determinare un campione casuale e valutare una stima puntuale
della statistica test. ⇒ x = 38.
(h) Decidere se rigettare o meno l'
ipotesi nulla, verifican do se tale
stima puntale appartiene o meno alla regione critica :
poichè 38 ∉ (38.42,39.51), l'
ipotesi nulla viene rigettata.
Test di ipotesi - Prob. e Stat. a.a. 04/05
17
T es t di Ipotes i s ulla Media: var ianz a nota
H : µ = µ 0
Ipotesi (test a due code)  0
 H1 : µ ≠ µ 0
X −µ
Z=
Statistica test
σ/ n
Regione Accettazione P (− zα / 2 ≤ Z ≤ zα / 2 quando µ = µ 0 ) = 1 − α
 H : µ = µ0
Ipotesi (test a una coda)  0
 H 1 : µ > (< ) µ 0
X −µ
Z=
Statistica test
σ/ n
R. Accettazione P(Z ≤ (≥ −) zα | µ = µ 0 ) = 1 − α
Test di ipotesi - Prob. e Stat. a.a. 04/05
18
Per calcolare l' errore di II tipo :
(a) Ricavare la regione di accettazio ne nella forma X ∈ (x1 , x2 ).
(
)
(b) Calcolare β = P X ∈ (x1 , x2 ) | µ1 = ... mediante operazione di
standardiz zazione.
T es t di Ipotes i s ulla Media: var ianz a incognita
H : µ = µ 0
Ipotesi (test a due code)  0
 H1 : µ ≠ µ0
X −µ
T=
Statistica test
( popolazione normale)
S/ n
Regione Accettazione P (− tα / 2,n −1 ≤ T ≤ tα / 2 ,n −1 quando µ = µ 0 ) = 1 − α
Test di ipotesi - Prob. e Stat. a.a. 04/05
19
Esercizio : Un articolo nel giornale Materials Engineerin g (1989) descrive i risultati
di un test di adesione su 22 campioni di una certa lega. I coefficien ti di fallimento dei 22
campioni sono :
19,8
18,5
17,6
16,7
15,8
15,4
14,1
13,6
11,9
11,4
11,4
8,8
7,5
15,4
15,4
19,5
14,9
12,7
11,9
11,4
10,1
7,9
Si assuma che i campioni provengano da una popolazion e normale. I dati suggerisco no
che si ha un fallimento quando la media è diversa da 10?
8
13,71364
6
0,757625
4
13,85
2
11,4
0
3,553576
7,5
12,6279
-0,75137
-0,01513
12,3
7,5
19,8
301,7
22
19,8
7,5
Test di ipotesi - Prob. e Stat. a.a. 04/05
1,575567
Frequenza
M edia
E rrore s tandard
M ediana
M oda
Deviaz ione s tandard
V arianz a c am pionaria
Curtos i
A s im m etria
Intervallo
M inim o
M as s im o
S om m a
Conteggio
P iù grande(1)
P iù pic c olo(1)
Livello di c onfidenz a(95,0% )
10,575
Dati relativi
all’istogramma
13,65
16,725
Altro
Classe Frequenza
7,5
1
10,575
3
13,65
7
16,725
7
Altro
4
20
Come ver ificar e l’as s unzione che la popolazione è nor male?
19.8
11,4
Costruendo un box plot, si osserva che
la popolazione è simmetrica.
13,8
15,7
7.9
Normal probability plot
I dati x1 , x 2 , Κ , x n vengono
ordinati in x (1) , x ( 2 ) , Κ , x ( n ) .
Tali valori ordinati vengono
plottati in coppia con
 i - 0.5 

 * 100 (le frequenze
 n 
Test di ipotesi - Prob. e Stat. a.a. 04/05
cumulative )
21
T es t di Ipotes i s ulla Var ianz a: Popolaz ione nor male
 H : σ 2 = σ 02
Ipotesi (test a due code)  0 2
2
 H1 : σ ≠ σ 0
(n − 1) S 2
Statistica test
χ2 =
( popolazione normale)
σ 02
Regione Accettazione P(χ 12−α / 2 ,n −1 ≤ χ 2 ≤ χ α2 / 2, n −1quando σ 2 = σ 02 ) = 1 − α
Esercizio: Una macchina per l’imbottigliamento automatico di liquido detergente
viene sottoposta a verifica, selezionando un campione di 20 bottiglie. Per queste
20 bottiglie, viene misurata la quantità di liquido contenuta in ciascuna di esse e
calcolata la varianza campionaria che risulta pari a 0.0153. Se la varianza associata
al processo di imbottigliamento del liquido supera lo 0.01, si corre il rischio di avere
bottiglie troppo piene rispetto alla specifica assegnata o viceversa. C’è una evidenza
dai dati raccolti per concludere che il processo di imbottigliamento non funziona bene?
Si assuma che il volume di liquido in ciascuna bottiglia sia distribuito come una normale.
Test di ipotesi - Prob. e Stat. a.a. 04/05
22
T es t di Ipotes i s ulle Per centuali
H : p = p0
Ipotesi (test a due code)  0
 H 1 : p ≠ p0
X − np
Statistica test
Z=
np (1 − p )
Regione Accettazione P (− zα / 2 ≤ Z ≤ zα / 2 quando p = p 0 ) = 1 − α
T es t di Ipotes i s ulle Differ enz e tr a medie - Var ianz a nota
H : µ − µ 2 = ∆ 0
Ipotesi (test a due code)  0 1
 H 1 : µ1 − µ 2 ≠ ∆ 0
X − X 2 − ( µ1 − µ 2 )
Statistica test
Z= 1
σ 12 σ 22
+
n1 n 2
Regione Accettazione P (− zα / 2 ≤ Z ≤ zα / 2 quando µ1 − µ 2 = ∆ 0 ) = 1 − α
Test di ipotesi - Prob. e Stat. a.a. 04/05
23
T es t di Ipotes i s ulle Differ enz e tr a medie - Var ianz a incognita
H : µ − µ 2 = ∆ 0
Ipotesi (test a due code)  0 1
 H 1 : µ1 − µ 2 ≠ ∆ 0
X − X 2 − ( µ1 − µ 2 )
Statistica test
T= 1
1
1
Sp
+
n1 n 2
Regione Accettazione P (− tα / 2, n1 + n2 − 2 ≤ T ≤ tα / 2 ,n1 + n2 − 2 , µ1 − µ 2 = ∆ 0 ) = 1 − α
T es t di Ipotes i s ui r appor ti tra var ianz e - Var ianz a incognita
 H : σ 2 = σ 22
Ipotesi (test a due code)  0 12
2
 H1 : σ 1 ≠ σ 2
S2
Statistica test
F = 12
S2
Regione Accettazione P( f 1−α / 2,n1 −1,n2 −1 ≤ F ≤ f α / 2 ,n1 −1,n2 −1 , 0 ) = 1 − α
Test di ipotesi - Prob. e Stat. a.a. 04/05
24