Verifica d`ipotesi

STATISTICA A – K
(63 ore)
Marco Riani
[email protected]
http://www.riani.it
Verifica d’ipotesi
Esempio di logica di un test
statistico
• Prova d’esame con 10 quesiti a quiz
• 4 possibili risposte per ogni quesito
• Ipotesi da confutare: studente risponde a
caso (oppure è preparato)
• Se (non) è preparato ci attendiamo tante
(poche) risposte giuste
• Problema: quante risposte giuste: 7, 8?
• X = numero di risposte esatte ⇒ v.a.
• Come si distribuisce X se lo studente non
è preparato?
Distribuzione X se studente non ha
studiato e risponde a caso
X ~ B(10, 0,25),
n=10, π =1/4=0,25
10 
10 − s
s
P ( X = s ) =  0,25 (1 − 0,25)
 s
E(X) = 2,5
VAR(X) = 1,875
π =0,25=ipotesi sulla popolazione
s=0,…,10= numero di risposte esatte
nell’esperimento campionario osservato
• Obiettivo:
quali valori di X (numero di risposte
esatte), sotto l’ipotesi che lo studente
non abbia studiato (π =0,25),
conducono a ritenere che lo studente
sia effettivamente preparato?
⇓
• Strumento: distribuzione campionaria
della variabile aleatoria X, sotto la
stessa ipotesi.
Distribuzione campionaria X
(quando π=0,25)
P(X=s) =
10 
 
s
0,25s· (1-0,25)10-s
P(X=0) = 0,7510 = 0,0563
P(X=1) = 10 ·0,25 ·0,759 = 0,1877
10 
P(X=2) =  2 ·0,252·0,758 = 0,281568
≈0,98
10 
P(X=3) =  3  ·0,253 ·0,757 =0,250282
10 
P(X=4) =  4  ·0,254 ·0,756 =0,145998
10 
P(X=5) =  5  ·0,255 ·0,755 =0,058399
10 

P(X=6) =  6  ·0,256 ·0,754 =0,016222
10 
P(X=7) =  7  ·0,257 ·0,753 =0,003090 ecc
P(X ≥ 6)=P(X=6)+P(X=7)+P(X=8) +P(X=9)
+P(X=10) = 0,016222+ 0,003090+
0,000386+ 0,000029+ 0,000001=0.019728
<2%
Se X ≥ 6 ⇒ o lo studente è preparato o si
è verificato un evento raro (con
probabilità < 2% lo studente, pur
impreparato, è molto fortunato).
Se X ≥ 6 posso quindi rifiutare l’ipotesi
che lo studente non ha studiato.
Sono però consapevole che potrei
commettere un errore (errore di tipo 1) nel
caso il risultato X≥6 sia ottenuto da uno
studente fortunato e impreparato.
Però sono tutelato dal fatto che tale errore ha
prob (P-value) molto bassa di accadere.
Ecco perché ho scelto proprio X ≥ 6.
Se avessi infatti scelto X ≥ 5 :
P(X ≥ 5)= P(X≥6)+P(X=5)=0,0197+ 0,058=0,078
Strategia
Nelle indagini statistiche (approccio
diretto) un tetto massimo (alpha) per
questa probabilità (errore di tipo 1) e’
fissato dal committente.
In genere 1% o 5%.
Formalizzazione di un test
θ = parametro ignoto dell’universo (ad es.: µ, π)
(π=probabilità di rispondere correttamente ai quiz)
T = indice campionario (ad es: P) ⇒ statistica test
(è variabile aleatoria)
(X=numero risposte corrette nel test)
⇒ ipotesi da sottoporre a
verifica
H0: θ = θ0
(π =0.25)
θ0 = valore fissato a priori in base al problema
(non dipende dai dati)
H0 = ipotesi nulla
H0
e
H1
• H1 = ipotesi alternativa ⇒ ipotesi che
contraddice H0
H1: θ ≠ θ0 ⇒ alternativa bilaterale
H1: θ > θ0 ⇒ alternativa unilaterale
destra
H1: θ < θ0 ⇒ alternativa unilaterale
sinistra
La scelta di H1 è di tipo logico e non
dipende dai dati
Esempio
• Ipotesi alternativa = lo studente è
preparato:
H1: π > 0,25
(lo studio aumenta la probabilità di
rispondere correttamente)
• Distribuzione campionaria di T ⇒
suddivisa in 2 zone:
• zona di rifiuto di H0 (“regione critica”) =
insieme di valori di T a cui è associata
una piccola probabilità di verificarsi se
H0 è vera;
• zona di accettazione di H0 = comprende
i restanti valori di T.
Esempio: T = X = n. di risposte
esatte
0.30
0.25
P(X = s)
0.20
0.15
0.10
0.05
0.00
0
accetto
1
2
3
4
5
6
7
8
9
X = numero di risposte esatte rifiuto
Zona di rifiuto: X ≥ 6
10
• In pratica si osserva lo specifico valore
T=t
Se:
• t cade nella zona di rifiuto ⇒ si ritiene
H0 falsa (e H1 vera)
• t cade nella zona di accettazione ⇒ non
si può ritenere H0 falsa (“accetto” H0)
Se accetto H0…
• Il valore osservato di T può cadere (con
probabilità elevata) nella zona di
accettazione anche se H0 è in realtà falsa.
• Esempio:
se π = 0,70 n=10
P(X<6) = 0,150
“Accetto” H0 ⇒ non posso rifiutarla
(accettazione per “insufficienza di prove”)
⇓
Non è una prova che H0 sia vera
Conclusioni (p. 89)
Realtà
H0 è vera
Accetto H0
Decisione
corretta
Rifiuto H0
Errore di
prima
specie
H0 è falsa
Errore di
seconda
specie
Decisione
corretta
Livello di significatività (α) = probabilità di
commettere un errore di prima specie
Interpretazione:
principio del campionamento ripetuto
Approccio “diretto”
• si fissa α sufficientemente piccolo
(ad es: α = 0,05; α = 0,01)
• si definiscono le corrispondenti zone di
rifiuto e di accettazione tramite la
distribuzione campionaria della v.a. T
• si prende una decisione in base al
valore osservato nel campione T = t
Esempio: T = X = n. di risposte
esatte
0.30
0.25
P(X = s)
0.20
0.15
0.10
0.05
0.00
0
accetto
1
2
3
4
5
6
7
8
9
X = numero di risposte esatte rifiuto
Zona di rifiuto: X ≥ 6
10
Approccio “inverso”
• Livello di significatività osservato
(P-value) = probabilità che la v.a. T
assuma valori più estremi di quello
osservato nel campione (tobs) quando
H0 è vera.
Esempio:
Osservo nel campione 8 risposte esatte.
P - value di 8 = P(X ≥ 8 π = 0.25) =
= P(X = 8) + P(X = 9) + P(X = 10) =
10 
10 
10 
8
2
9
10
=  0,25 ·0,75 +  0,25 ·0,75 +  0,25 =
8
9
10 
= 0.000416
fortissima evidenza contro H0
P - value
• H1 unilaterale destra H1: θ > θ0
P-value = P{T ≥ tobs, dato che θ = θ0}.
f(t)
P-value Pr(T>tobs)
tobs
P - value
• H1 unilaterale sinistra H1: θ < θ0
P-value = P{T ≤ tobs, dato che θ = θ0}.
f(t)
Pr(T<tobs)
tobs
P - value
• H1 bilaterale: H1: θ ≠ θ0
• P-value = P{T ≥ |tobs|, dato che θ = θ0}
+ P{T ≤ −|tobs|, dato che θ = θ0}
Pr(T<-|tobs|)
Pr(T>|tobs|)
-|tobs|
+|tobs|
Significato P-value:
evidenza campionaria contro H0 ⇒ se il P-value
è piccolo rifiuto H0
v. Tabella Pag. 92 del libro di
inferenza
TEST SULLA MEDIA
(grandi campioni)
H0: µ = µ0
(µ0 = valore prefissato, in es.
confezioni µ0 =200 g)
Consideriamo come statistica-test la media campionaria
che, sotto H0, gode delle seguenti proprietà:
E( X ) = µ0
VAR( X ) =
σ2
n
Z(X ) =
X − µ0
σ
n
~ N (0,1)
Quindi la media campionaria standardizata secondo H0 è
distribuita secondo N(0,1).
Rifiutiamo H0 quando osserviamo medie campionarie
lontane da µ0 → medie campionarie standardizzate
lontane da 0→ sulle code della distribuzione → legate
a probabilità basse.
Ad esempio: H1: µ ≠ µ0
α/2
1-α
-z(α/2)
0
Rifuto
accettazione
α/2
+z(α/2)
Rifiuto
• Calcolo sui dati di:
Scostamento
standardizzato:
x
z( x ) =
s
2
cor
s( X ) =
s cor
n
x − µ0
s cor
n
Se
α/2
1-α
α/2
Accetto H0
Se
-z(α/2)
Rifuto
0
accettazione
+z(α/2)
Rifiuto
Rifiuto H0
2 approcci
H 1: µ ≠ µ 0
• APPROCCIO DIRETTO: si fissa α (livello
di significatività)
• APPROCCIO INVERSO: si fornisce il p
value
Esempio 1: macchina riempitrice
tarata su 200 g
H0: µ = 200
H1: µ ≠ 200
Campione=100 confezioni
scor = 8 g
x = 199 g
z( x ) =
x − µ0
s cor
n
s( X ) = 0,8 g
199 − 200
z( x ) =
= −1,25
0,8
Approccio diretto
si fissa α = 0,05
1,96
0,025
-1,96 -1,25 0
⇒
0,025
z(0,025) =
z( x ) =
199 − 200
= −1,25
0,8
+1,96
-1,25 non è un valore estremo ⇒ cade
infatti nella zona di accettazione ⇒ il
campione non dà evidenza per rifiutare
H0 e non possiamo dire che il processo
è fuori controllo
Approccio inverso: P-value
-1,25
0
+1,25
Pvalue alto (molto
maggiore di 5% o 1%)
⇒differenza tra media
campionaria =199g e µ0
= 200g non è
significativa
⇒il processo di
produzione è sotto
controllo
Esempio 2: valutazione orario flessibile
H0: µ = 6,3 giorni
H1: µ < 6,3 ⇒ si riduce l’assenteismo
α = 0,05
Campione =100 dipendenti:
x = 5,5 giorni, scor = 2,5
z( x ) =
x − µ0
s cor
n
s( X ) = 0,25
5,5 − 6,3
z( x ) =
= −3,2
0,25
Approccio diretto
H1: µ < 6,3
si fissa α = 0,05
5,5 − 6,3
z( x ) =
= −3,2
0,25
⇒
-z(0,05) = -1,64
0,05
-3,2 -1,64
-1,64
00
-3,2 è un valore estremo ⇒ cade infatti
nella zona di rifiuto ⇒ rifiutiamo H0 e
concludiamo che con l’orario flessibile
l’assenteismo si riduce
Approccio inverso
Calcolo del P-value
H1: µ < 6,3
• P-value = P{Z( X ) ≤ -3,2} = F(-3,2) = 0,00069
⇒valore molto basso (molto minore dell’
1%) ⇒ differenza tra X =5,5 giorni e µ0 = 6,3
giorni è significativa ⇒l’orario flessibile
porta a una riduzione dell’assenteismo
-3,2 -1,64
0
TEST SULLA MEDIA
piccoli campioni
TEST SULLA MEDIA (piccoli campioni)
Assunzione: distribuzione Normale dell’universo
H0: µ = µ0
(µ0 = valore prefissato, in es confezioni
µ0 = 200g)
Consideriamo come statistica-test la media campionaria
che, sotto H0, gode delle seguenti proprieta’:
E( X ) = µ0
, VAR( X ) =
σ2
n
X − µ0
Z(X ) =
scor / n
,
~ t(n − 1)
oppure
X − µ0
Z(X ) =
σ/ n
~ N(0,1)
TEST SULLA MEDIA (piccoli campioni)
• Valutare assunzione che il fenomeno considerato
presenti nell’ universo distribuzione Normale.
• Se σ2 è noto la media campionaria standardizzata
secondo H0 è Normale.
• Se invece σ non è noto e lo si stima con scor , la media
campionaria standardizzata si distribuisce secondo t(n1). Le zone di rifiuto e di “accettazione” devono quindi
essere definite con riferimento alla v.a. t(n − 1) (NON z)⇒
calcolo t(α):
F[-t(α/2)] = α/2
Rifiutiamo H0 quando osserviamo medie campionarie
lontane da µ0 → medie campionarie standardizzate
lontane da 0→ sulle code della distribuzione → legate a
probabilità basse.
Esempio 1: macchina riempitrice
tarata su 200 g
H0: µ = 200 (valore standard)
H1: µ ≠ 200 (valore fuori controllo)
Campione=12 confezioni
x =207,75g, scor = 11,14g,
Z(X ) =
X − µ0
scor / n
s ( X ) =3,22
207.75 − 200
= 2,41
z( x ) =
3.22
Distribuzione normale dei pesi ⇒
assunzione ragionevole
Approccio diretto
α = 0,05
⇒
t0,025 (11)= 2,201
oppure
α = 0,01 ⇒
t0,005(11) = 3,106
Nel campione:
z( x ) =
-3,106 -2,201
0
207,75 − 200
= 2,41
3,22
2,201 +3,106
• Se si vuole test con α = 0,05
z ( x ) = 2,41 è un valore estremo ⇒ cade
infatti nella zona di rifiuto⇒ rifiutiamo
H0 e concludiamo che il processo è
fuori controllo;
• Se si vuole test con α = 0,01
z ( x ) = 2,41 NON è un valore estremo ⇒
cade infatti nella zona di accettazione⇒
non possiamo rifiutare H0 e NON
possiamo concludere che il processo è
fuori controllo.
Approccio inverso: P-value
P-value = P{ Z (X ) ≥ +2,41} + P{ Z (X ) ≤ −2,41}
= 2⋅P{ Z (X ) ≥ +2,41}
Dalle tavole della t con 11 gradi di liberta’:
0,02 < P-value < 0,05
⇓
Discreta (ma non fortissima) evidenza contro
H0 ⇒ decisione incerta
Esercizio
• Il contenuto di nicotina di una certa marca di
sigarette è 0,25 milligrammi con una
deviazione standard di 0,015. Un’associazione
di consumatori sostiene che il contenuto di
nicotina dichiarato è al di sotto di quello
effettivo. Si effettui il test opportuno sapendo
che in un campione casuale di 20 sigarette si
è osservata una media campionaria pari a
0,264 milligrammi.
• Si ponga α=0,01
• Si calcoli il relativo p-value
Soluzione
H0: µ = 0,25 milligrammi
H1: µ > 0,25 ⇒ contenuto superiore a
quello dichiarato
x = 0,264
σ=0,015 noto a priori
n=20
Ip. di distribuzione normale
X − µ0
Z(X ) =
~ N (0,1)
σ/ n
0,264 − 0,25
Z(x) =
= 4,17
0,015 / 20
H1: µ > 0,25 α=0,01 F(2,33)=0,99
Densità della
v.c. normale
standardizzata
0,01
Zona di accettazione
0,264 − 0,25
Z(x) =
= 4,17
0,015 / 20
2,33
Zona di rifiuto
tobs=
= 4,17 cade nella
zona di rifiuto
Calcolo del p-value
P-value = P{
>4,17}
= 1-F(4,17) = 0,00002 ⇒valore
molto basso (molto minore dell’
1%)
P-value = P{
>4,17}
Esercizio
• Da una sperimentazione geologica vengono
estratte 10 piccole porzioni di roccia che
vengono successivamente sottoposte ad
analisi per verificare il contenuto percentuale
di cadmio. Si osserva una percentuale media
di 17,4 di cadmio con scor=4,2. L’estrazione
del minerale è economicamente conveniente
se il contenuto medio percentuale di cadmio è
maggiore di 15.
Esercizio (continua)
• Si definiscano l’ipotesi nulla e l’ipotesi
alternativa
• Si stabilisca se le osservazioni
campionarie supportano la convenienza
economica dello sfruttamento del
giacimento (si utilizzi α=0,01)
• Si calcoli e si commenti il p-value del test
Soluzione
H0: µ0 = 15 (percentuale di cadmio)
H1: µ0 > 15 ⇒ casi in cui è
conveniente estrarre il minerale
n=10
α=0,01
x = 17,4 scor=4,2
Ip. di distribuzione normale
X − µ0
Z(X ) =
~ t(9) scor / n
17,4 − 15 17,4 − 15
Z(x) =
=
= 1,807
1,3282
4,2 / 10
H1: µ > 15 α=0,01
Ft(9)(2,821)=0,99
0,01
Zona di accettazione
17,4 − 15
Z(x) =
= 1,807
4,2 / 10
2,821
Densità
della v.c. T
di Student
con 9 gradi
di libertà
Zona di rifiuto
tobs=
= 1,807 cade
nella zona di accettazione
Approccio inverso: P-value
P-value = P{ Z (X ) ≥ +1,807}
Dalle tavole della t con 9 gradi di libertà:
Ft(9)(1,833)=0,95
⇓
P-value leggermente superiore a 0,05
Il valore esatto del p-value è 0,052 ottenuto
tramite Excel e la funzione distrib.t
=distrib.t(1,807;9;1)
Esercizio
• Con riferimento all’esercizio precedente si
determini la probabilità dell’errore di
seconda specie assumendo α=0,01 e
µ=16
Soluzione
• Con riferimento all’esercizio precedente si
determini la probabilità dell’errore di
seconda specie assumendo α=0,01 e
µ=16
• Errore di seconda specie = accettare
un’ipotesi nulla falsa
• Obiettivo: calcolare la probabilità di
accettare l’ipotesi nulla quando µ=16
Errore di prima specie (α)
errore seconda specie (β) e
potenza del test (1-β)
xα = valore soglia che separa la zona di
accettazione dalla zona di rifiuto
Qual è il valore soglia xα che separa la zona di accettazione da
quella di rifiuto in termini di valori originari? α=0,01
0,01
Accetto
xα − 15
= 2,821
4,2 / 10
2,821
Densità
della v.c. T
di Student
con 9 gradi
di libertà
Rifiuto
Il valore soglia xα è 18,7467
Prob. di accettare l’ipotesi nulla quando µ=16 
prob. di trovare un valore più piccolo di 18,7467
quando µ=16
Prob. di accettare l’ipotesi nulla quando µ=16 =
prob. di commettere un errore di seconda specie
=β prob. di trovare un valore più piccolo di
18,7467 quando µ=16
Che probabilità è associata all’area in verde?
Devo calcolare
Ft(9) ((18,75-16)/1,3282)
=Ft(9) (2,07)=0,966
In Excel
=1-DISTRIB.T(2,07;9;1)
Esercizi da svolgere per
LUN 17 marzo
Esercizio
• Un fornitore di pneumatici sostiene che la
durata media di un certo tipo di pneumatici per
camion è di 45000 Km. Un’impresa sottopone a
test l’affermazione del produttore osservando
un campione di 56 pneumatici utilizzati dai
propri veicoli.
• Qual è la conclusione a cui giunge l’impresa se
trova una durata media di 43740 con un
scor=2749 km (si ponga α=0,01)
• Si calcoli il p-value
Esercizio
• Di seguito sono riportati i dati di durata (in
migliaia di Km) di un convertitore catalitico
in un campione di 15 osservazioni.
• 115,4 85,2 89,1 118,3 88,4 109,3 104,3
69,3 105,5 106,8 103,1 101,6 102,9 89,6
109,3
• Si verifichi l’ipotesi che la durata media sia
pari a 100 contro l’alternativa che essa sia
minore. Si assuma un livello di significatività
α=0,05. Si calcoli il p-value del test.
Esercizio
L’Istituto Superiore di Sanità ha stimato che le spese a carico del
Sistema Sanitario Nazionale per la riabilitazione di un paziente
che ha avuto un ictus è di 42372 euro. L’amministrazione di una
ASL, per verificare se i costi nella ASL sono in linea con la media
nazionale, ha raccolto le informazioni sul costo della riabilitazione
di 64 pazienti. Il costo medio è risultato pari a 44143 euro con
uno scarto quadratico medio (campionario) corretto di 9156 euro.
• (a) Calcolare l'intervallo di confidenza al livello del 99% per la
vera media dei costi nell’ASL considerata.
• (b) Dopo aver impostato l'ipotesi nulla e l'ipotesi alternativa, si
testi se la differenza tra il costo medio nazionale e il costo
medio stimato nell’ASL è significativa al livello di significatività
dell'1%. Commentare i risultati ottenuti.
• Come sarebbero cambiate le conclusioni se il livello di
significatività fosse stato del 10%?
Esercizio
Si assuma che la pressione sistolica media di un adulto sano
sia 120 (mm Hg) e lo scarto quadratico medio 5,6.
Assumendo che la pressione abbia una distribuzione normale
calcolare la probabilità che:
• selezionando un individuo sano scelto a caso questi abbia
una pressione sistolica superiore a 125;
• scegliendo a caso 4 individui, la media della loro pressione
sistolica sia superiore a 125;
• scegliendo a caso 25 individui, la media della loro
pressione sistolica sia superiore a 125;
• selezionando 6 individui sani quattro di essi abbiano una
pressione inferiore a 125.
Esercizio
• Si consideri la verifica di ipotesi sulla
media di una popolazione normale. Si
definisce la potenza di un test la
probabilità di rifiutare un’ipotesi nulla falsa
(ossia la probabilità di non commettere un
errore di seconda specie)
• Si considerino le seguenti ipotesi nulla e
alternativa
• H0: µ=µ0
• H1: µ=µ 1 (con µ 1 > µ 0)
Errore di prima specie (α)
errore seconda specie (β) e
potenza del test (1-β)
xα = valore soglia che separa la zona di
Quesiti
• Si dimostri che la potenza del test (1-β) è
– Funzione crescente della dimensione
campionaria (n)
– Funzione crescente della differenza
tra µ 1 e µ0
– Funzione decrescente di σ (standard
deviation dell’universo)
– Funzione crescente di α (probabilità di
commettere errore di prima specie)
Esercizio
• Per una generica voce di inventario di una
determinata impresa, sia X la differenza tra il
valore inventariato ed il valore certificato. Da un
campione di 120 voci un certificatore contabile
ha ottenuto x=25,3 s2cor=13240
• Si sottoponga a test l’ipotesi che l’inventario
non sia gonfiato specificando opportunamente
l’ipotesi alternativa (si ponga α=0,01)
• Si calcoli il p-value
• Si calcoli la prob. di rifiutare l’ipotesi nulla nel
caso in cui la vera media di X fosse pari a 30
Esercizio
• Un ricercatore desidera stimare la media
di una popolazione che presenta una
deviazione standard σ con un campione di
numerosità h in modo tale che sia uguale
a 0,90 la probabilità che la media del
campione non differisca dalla media della
popolazione per più dell'8% della
deviazione standard. Si determini h.
Esercizio
• Siano X1 e X2 due v.c. indipendenti con
distribuzione N(4,1) e N(5,4)
rispettivamente.
• Si rappresenti graficamente la densità
delle due distribuzioni
• Si calcoli P(X1<X2)
Esercizio
• Si consideri un dado a 20 facce tutte
uguali
• Qual è il valore atteso?
• Quante volte è necessario lanciarlo
affinché la probabilità di ottenere almeno
un 20 sia maggiore o uguale a 0.5?
• Lanciandolo 20 volte, qual è il numero
medio di 20 ottenuti?
• Pr di ottenere almeno una volta la faccia
20 in 20 lanci?
Esercizio
• Nel gioco del lotto un numero ha una
probabilità p di uscire ad ogni estrazione.
• Si scriva la densità della v.c. che descrive il
tempo di attesa dell’uscita del numero
all’estrazione k-esima (v. casuale geometrica),
k=1, 2, 3, ….
• Si dimostri che la somma delle probabilità è 1
• Si calcoli il valore atteso
• Si calcoli l’espressione che definisce P(X>k)