Test delle ipotesi

Test delle ipotesi
Il test consiste nel formulare una ipotesi (ipotesi
nulla) e nel verificare se con i dati a disposizione è
possibile rifiutarla o no.
L’ipotesi che viene formulata è l’ipotesi nulla (Ho) e
rappresenta di solito lo stato di fatto
Se il campione fornisce risultati fortemente in
contrasto con Ho, questa viene rifiutata a favore
dell’ipotesi alternativa (H1).
Test della media di una popolazione
Eseguiamo il test H0:=0
Ipotesi nulla (H0): la media  della popolazione da cui abbiamo
estratto il campione è = 0
Ipotesi alternativa (H1): la media  della popolazione è  0
Verifichiamo quindi se la deviazione della media campionaria
da 0 è compatibile con l’ipotesi nulla.
Confrontando la media del campione con 0
Test delle ipotesi
Usando una distribuzione campionaria
identifichiamo un range di valori che hanno bassa
probabilità di accadere se l’ipotesi nulla è vera.
Questo range di valori costituisce la cosiddetta
regione critica o regione di rifiuto dell’ipotesi
nulla.
Dalla distribuzione campionaria della statistica
posso conoscere le probabilità di ottenere
determinati valori, e sulla base di queste definire la
regione di rifiuto.
ESEMPIO test media di una popolazione
Ho:  = o
Popolazione:
H1:   o
Medie campionarie: N (  0 ;
Distribuzione delle
medie campionarie
N (0 ; x ) Con:
x 
N ( 0 ; )

n
x
Verifico l’ipotesi che o= 10 in una popolazione con  = 6
estraendo a caso un campione di n = 9.

n
)
ESEMPIO test media di una popolazione
Ho:  =10
Popolazione:
H1:  10
Medie campionarie: N (10;  x )
N (10;  )
Se  = 0,05
N (10;  x )
Rifiuto H0 se la media
campionaria è al di
fuori dei limiti
0  1.96 (/n)
10
x
La regione di rifiuto ha probabilità  (livello di significatività)
È la probabilità di rifiutare H0 quando H0 è vera
ESEMPIO test media di una popolazione
Ho:  = 10
Popolazione:
N (10;6)
H1:   10
Medie campionarie:
N (10;2)
(sono noti =6 e n=9)
Distribuzione delle
medie campionarie
N (10;2)
10
x
ESEMPIO test media di una popolazione
Ho:  =10
Se  = 0,05
H1:  10
Rifiuto H0 se la media
campionaria è al di
fuori dei limiti
0  1.96 (/n)
Quindi:
6,08
10 1.96·2
13,92
N (10;2)
6,08
10
13,92
x
Esempio di fasi da seguire per un test delle ipotesi
1. Specificare Ho, H1 ed un livello 
2. Definire una statistica per il test (statistica di cui sia
definibile la distribuzione campionaria) e la zona di
rifiuto per Ho (valori della statistica di probabilità< 
quando Ho è vera).
3. Eseguire il campionamento (o l’esperimento) e
calcolare la statistica.
4. Se la statistica calcolata cade nella zona di rifiuto
decido di rifiutare Ho, altrimenti decido di non
rifiutare Ho.
Test della media di una popolazione
1. Esempio. Ho:  = 10 ; H1:   10; livello = 0,05
2. La statistica è z. Poiché P(z >1.96)=0,05, la zona di rifiuto è
z< -1,96 o z>1,96 ovvero z >1.96 (test a 2 code)
3. Calcolo la media campionaria e la converto nella variabile
standardizzata:
z
x
x
4. Rifiuto l’ipotesi nulla se z >1.96.
In questo modo si ha una probabilità di rifiuto di 0.05
quando H0 è vera (e quindi una probabilità di errore di
0,05).
Test della media di una popolazione con p value
In alternativa si può riportare direttamente il valore della
probabilità p di commettere l’errore di I specie (livello di
significatività osservato).
Il p value è una misura di quanto i dati sono in disaccordo con Ho.
Posso procedere come segue:
1. Definisco Ho:  = 10 ; H1:   10
2.Calcolo la media campionaria e la converto nella variabile
standardizzata:
z
x
x
3. Calcolo la probabilità p di ottenere il valore di z calcolato:
P(Z< -z) + P(Z>z) ovvero P(Z > z ) (test a 2 code)
Significatività e potenza del test
verità
conclusione
H0 vera
H0 falsa
GIUSTO
ERRORE II specie
H0 vera
P = 1-
P=
livello di protezione
ERRORE di I
specie
GIUSTO P= 1-
H0 falsa
P =
potenza
livello di
significatività
SIGNIFICATIVITÀ E POTENZA DEL TEST
Ho:  =10
H1:  10
N (0 ;

n
A parità di n (numerosità
campionaria) se diminuisco
la probabilità dell’errore di I
specie () aumento la
probabilità dell’errore di II
specie (). Diminuisce la
potenza del test (1-).
)
1- 
1- 

10
/2
/2
Test a una o due code
Se siamo interessati a rifiutare Ho solo se la
differenza è in un senso o nell’altro, eseguiamo il test
ad una coda, o test unilaterale.
L’ipotesi alternativa sarà H1:  >  o ovvero H1:  <  o
Il vantaggio è che la potenza del test aumenta
andando verso H1 ma è praticamente 0 dall’altra parte.
1- 
1- 


Test della media di una popolazione ( ignoto)
Se  non è noto si utilizza la sua stima s e la relativa stima
dell’errore standard:
s
sx 
n
La statistica da usare per il test è t con (n-1) gradi di libertà
(GL).
x
t 
sx
- Rifiuto l’ipotesi nulla se t > t, (n-1)
- Ovvero calcolo la probabilità p di trovare t
Test della media di una popolazione ( ignoto)
In pratica per il test al livello di significatività del 5%:
L’ipotesi è sempre Ho:  = o contro H1:   o
Calcolo t:
t 
x
sx
- Rifiuto l’ipotesi nulla se t > t, (n-1)
- Ovvero calcolo la probabilità p di trovare il t
calcolato sotto ipotesi nulla
Esempio test della media di una popolazione
( ignoto)
Si afferma che con l’applicazione di una certa dieta
dimagrante si perdono 3 kg in un mese.
Vengono sottoposte a dieta 64 persone e dopo un mese
si verificano i risultati:
perdita di peso media = 2,6 kg
deviazione standard del campione: 1,2 kg
Al livello  = 0.05, il campione è significativamente
diverso dall’atteso?
Soluzione
Le ipotesi sono:
H0 :  = 3
H1 :   3
x  2,6
(test a due code)
s
sx 
 0,15
n
x
2,6  3
t 

 2,667
sx
0,15
- Rifiuto Ho se t >
t0,05;63  1,998
- P(t >2,667) = 0,0097
Rifiuto l’ipotesi nulla. Il metodo non funziona come
promesso
Esempio test della media di una popolazione
( ignoto)
Un acquirente è interessato all’acquisto di grosse partite di
formaggio provenienti dagli alpeggi, ma richiede che le
forme siano di peso mediamente superiore ai 2.5 kg
Viene scelto casualmente un campione di 12 forme che
vengono pesate
Media campionaria: m=2.758
Stima deviazione standard s=0.3942
Al livello di  = 0.1, il campione è significativamente
superiore (test a una coda) a 2.5 Kg?
Soluzione
Le ipotesi sono:
H0:  = 2,5
H1:  > 2,5
(test a una coda)
x  2,758
sx 
s
 0.1138
n
x
2,758  2,5
t 

 2,267
sx
0.1138
- Rifiuto Ho se t >
t0, 2;11  1,363
P(t >2,267)=0,022
L’ipotesi nulla è rifiutata.
Test di una proporzione
Una distribuzione binomiale, se ci si riferisce alle
proporzioni di successi, è caratterizzata da:
Media (valore atteso): =p
Varianza: 2= p(1-p)
La proporzione di successi del campione, se n è
sufficiente, è una variabile casuale con distribuzione
approssimativamente normale e:
Media = p
Varianza = p(1-p)/n
Test di una proporzione
Posso definire le ipotesi: Ho:p=po e H1:ppo
La statistica per il test sarà:
z
pˆ  po
p0 (1  p0 ) n
Dove p̂ è la proporzione campionaria di successi,
trovata con un campione di numerosità n.
Se n è sufficientemente grande la distribuzione è
proprio quella della normale standardizzata.
Posso quindi calcolare i valori critici di z (per
significatività prefissate) da confrontare con lo z
trovato oppure il p value.
Esempio test di una proporzione
Ho:p=0,8 e H1:p0,8
In un campione di 100 osservazioni i successi
risultano 75. Posso rifiutare l’ipotesi nulla a livello
=0,05?
z
pˆ  po
0,75  0,8

 1,25
p0 (1  p0 ) n
0,8(1  0,8) 100
- Rifiuto l’ipotesi nulla se z >1.96.
- P(Z > z )=P(Z>1,25) = 0,0528
L’ipotesi nulla non è rifiutata