CORSO DI LAUREA IN STATISTICA
Statistica per le decisioni (Note didattiche)
Bruno Chiandotto
CAP. 5 – TEST DELLE IPOTESI STATISTICHE
5.1 Introduzione
In questo capitolo si affronta il problema della verifica d’ipotesi statistiche
limitando sostanzialmente la trattazione alla cosiddetta teoria classica del test delle
ipotesi parametriche e facendo, soprattutto, riferimento a campioni estratti da
popolazioni normali; comunque, la portata generale dei principi enunciati e la logica
delle argomentazioni svolte rimangono immutate anche se si fa riferimento a campioni
estratti da popolazioni non normali.
Argomentazioni diverse devono essere svolte sia nei riguardi della impostazione
bayesiana della teoria del test delle ipotesi sia nei riguardi della teoria dei test non
parametrici; aspetti questi che non vengono qui trattati.
E' stato sottolineato in precedenza che la teoria dell'inferenza statistica riguarda
principalmente due specifici argomenti: la stima ed il test delle ipotesi. In entrambi i
casi si tratta di valutare aspetti incogniti, concernenti una determinata popolazione, sulla
scorta delle risultanze campionarie.
Il problema della stima e quello del test delle ipotesi, anche se simili, vanno
comunque tenuti distinti in quanto coinvolgono problematiche diverse. Infatti, come già
detto, nel primo caso l'evidenza campionaria, eventualmente integrata da conoscenze a
priori, viene utilizzata per stimare un'entità incognita relativa ad una certa popolazione;
nel secondo caso, l'evidenza campionaria, eventualmente integrata da conoscenze a
priori, viene utilizzata per verificare statisticamente la validità di una certa assunzione
(ipotesi) concernente una specifica entità incognita.
La rilevanza del problema della verifica di ipotesi
statistiche è facilmente
intuibile se si pensa che dall'operazione di verifica scaturisce, nella generalità dei casi,
l'accettazione o il rifiuto dell'ipotesi formulata. A conferma di un tale fatto, vanno
considerati soprattutto i problemi di decisione nei quali all'accettazione o al rifiuto di
1
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
una certa ipotesi è collegata la scelta di una particolare linea di comportamento.
Definizione 1 (Ipotesi statistica). Un'ipotesi statistica è un'affermazione che specifica
parzialmente o completamente la legge di distribuzione della
probabilità di una variabile casuale. L'affermazione può riferirsi sia alla
forma funzionale della legge di distribuzione che ai parametri caratteristici o ai soli parametri caratteristici quando si assuma nota la forma
analitica della distribuzione stessa.
Se l'ipotesi, usualmente indicata con il simbolo H0 e detta ipotesi nulla o ipotesi
zero (ipotesi di lavoro), specifica completamente la legge di distribuzione della
variabile casuale, si dice semplice, nel caso opposto l’ipotesi viene detta composita o
composta. Inoltre, se l'ipotesi riguarda i parametri caratteristici di una particolare
distribuzione di cui si conosce la forma analitica si parla di ipotesi parametrica; si dice
invece non parametrica (o più correttamente distribution free), l'ipotesi statistica che
non presuppone nota tale forma. Ovviamente l'ipotesi non parametrica, come
generalmente accade, può riguardare sia la forma analitica della distribuzione sia i
parametri che la caratterizzano.
Ad esempio se si ipotizza che l'altezza degli italiani adulti di sesso maschile si
distribuisce in modo (approssimativamente) normale con media pari a 1,70 metri e
scostamento quadratico medio pari a 0,28 metri. Si sta trattando di una ipotesi statistica
semplice (specifica completamente la legge di distribuzione del fenomeno) non
parametrica (l'ipotesi riguarda anche la forma della distribuzione). Se invece si dà per
acquisito il fatto che l'altezza degli italiani adulti di sesso maschile si distribuisce in
modo (approssimativamente) normale, l'ipotesi statistica potrà riguardare i soli
parametri caratteristici media µ e varianza σ2 (o lo scostamento quadratico medio
σ ). L'ipotesi sarà semplice, se specifica un preciso valore numerico per i due
parametri, ad esempio: l'altezza media è pari a 1,70 metri; sarà invece composita se
specifica un insieme di valori, ad esempio: l'altezza media degli italiani adulti di sesso
maschile è compresa nell'intervallo 1,68 – 1,72 metri.
Definizione 2 (Test di ipotesi). Un test di ipotesi (statistica) è una regola attraverso la
2
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
quale si decide se accettare o meno l'ipotesi formulata sulla base delle
risultanze campionarie. Tali dati si riferiscono naturalmente alla
variabile casuale sulla cui legge di distribuzione è stata formulata l'ipotesi.
Se si indica con
l'universo dei campioni o spazio dei campioni, cioè
C
l'insieme di tutti i possibili risultati campionari, un test delle ipotesi consiste nel
bipartire l'insieme C in due sottoinsiemi disgiunti C0 e C1 = C – C1 in modo tale che
si decide di rifiutare l'ipotesi H0 se il punto campionario cade in C1, di accettare l'ipotesi
se il punto campionario cade in C0.
Lo spazio C1 di rifiuto di un'ipotesi viene usualmente detto regione critica,
mentre si dice regione di accettazione lo spazio C0.
C = Spazio o universo dei campioni
C1 = Regione o spazio di rifiuto di H0
(
Regione critica )
C0 = Regione o spazio di
.
accettazione dell’ipotesi H0
Fig. 1 - Bipartizione dell'universo dei campioni
Si è parlato di un test statistico e non del test statistico, in quanto si intuisce
facilmente come la bipartizione dell'universo dei campioni, e cioè la definizione della
regione critica, possa essere effettuata secondo criteri o regole differenti che non
conducono necessariamente agli stessi risultati. Due differenti test, e cioè due modi
diversi di bipartizione dell'universo dei campioni, possono essere posti a confronto
3
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
attraverso un'analisi del processo logico seguito nella loro formulazione, o più
semplicemente, sempre che sia possibile, confrontando le probabilità che si hanno di
commettere degli errori adottando l'una o l'altra procedura per sottoporre a test una
stessa ipotesi.
Nell'accettare o rifiutare, sulla scorta dell'evidenza campionaria, una determinata
ipotesi nulla, si può agire correttamente, e cioè accettare un'ipotesi vera o rifiutare
un'ipotesi falsa, oppure si possono commettere errori aventi diversa natura:
a)
rifiutare un'ipotesi quando essa è vera. Si parla in questo caso di errore di I
specie o di I tipo;
b)
accettare un'ipotesi quando essa è falsa. Si parla in questo caso di errore di II
specie o di II tipo.
Il processo decisionale sopra illustrato può essere schematicamente riassunto nella
tavola che segue.
Stato di
natura
H0 è vera
H0 è falsa
Azioni
Si commette un
Si accetta H0
Decisione corretta
errore di II tipo
Si commette un
Si rifiuta H0
errore di I tipo
Decisione corretta
Tab. 1 - Tavola di decisione
La probabilità di commettere un errore di primo tipo, e cioè la probabilità di
rifiutare una ipotesi quando essa è vera, è indicata usualmente con α.
α = P ( X ∈ C1 /H 0 )
dove α viene detto livello di significatività del test e X = ( X 1 , X 2 ,...., X n ) rappresenta
il punto campionario.
La probabilità di commettere un errore di II tipo, e cioè la probabilità di
accettare un'ipotesi quando essa è falsa, è indicata con β ( Η1 )
β (H 1 ) = P ( X ∈ C0 /H 1 )
4
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
Dove H1 = H 0 , che rappresenta la negazione dell’ipotesi Ho , viene detta ipotesi
alternativa e, nell’ambito della teoria classica o frequentista del test delle ipotesi,
completa il contesto decisionale nel senso che, nella specifica situazione sotto esame, o
è vera l’ipotesi nulla H0 o è vera l’ipotesi alternativa H1; β ( Η1 ) indica, pertanto, la
probabilità dell’errore di II tipo che dipende, ovviamente, dalla specificazione
dell’ipotesi alternativa H1.
La quantità γ ( H1 ) = 1 – ß ( H1 ) e cioè la probabilità di rifiutare un'ipotesi
quando essa è falsa viene detta forza o potenza del test relativamente all'ipotesi
alternativa H1. Al variare di H1 la γ ( H1 ) assumerà il carattere di funzione, e viene
detta funzione forza del test. Da rilevare che i termini forza e potenza vengono usati
come sinonimi e traducono il termine inglese power.
Quanto sopra affermato si riferiva al caso d'ipotesi H0 semplice. Nel caso di
ipotesi nulla composita, si può definire il livello di significatività come
α = Sup P ( X ∈ C1 /H 0 )
H ⊂ H0
Così posto il problema, si vede chiaramente come la migliore soluzione sia
rappresentata da un test capace di minimizzare simultaneamente le probabilità di
commettere gli errori di I e di II tipo. Purtroppo, non è generalmente possibile
perseguire un tale obbiettivo, e cioè, non è sempre possibile individuare un test capace
di minimizzare contemporaneamente le probabilità di commettere i due tipi di errore
quando la dimensione del campione sia stata fissata. Si dovrà quindi operare in modo
diverso; infatti, la procedura che si segue generalmente è quella di fissare la misura
della probabilità di commettere un errore di primo tipo (si stabilisce cioè il livello di
significatività α) e nell'individuare poi il test che minimizza la probabilità di
commettere un errore di II tipo.
Si potrebbe, più semplicemente, dire che fissato il livello di significatività α , si
cerca il test più potente (test MP dall’inglese Most Powerful), cioè, quello che ha il
valore di γ ( H1 ) più elevato.
5
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
5.2 Ipotesi semplici
Si è distinto in precedenza le ipotesi sulla forma funzionale della legge di
distribuzione della variabile casuale oggetto d'analisi dalle ipotesi sui parametri
caratteristici di tale legge (supposta nota). Le ipotesi statistiche sono state ulteriormente
distinte in semplici e composite a seconda che le ipotesi stesse specifichino
completamente o parzialmente la legge di distribuzione del fenomeno.
Nel caso in cui l'ipotesi nulla H0 e l'ipotesi alternativa H1 siano entrambe semplici,
lo spazio parametrico Θ, a una o più dimensioni, di definizione dei parametri risulta
formato da due soli punti
Θ = (θ : θ0 , θ1)
Le ipotesi sono
H0 : θ = θ0
H1 : θ = θ1
Si è già detto come la costruzione di un test si riduce in effetti alla bipartizione
dello spazio dei campioni C in due sottospazi C0 e C1 . Si vede quindi chiaramente
come il miglior test per sottoporre a verifica un'ipotesi H0 sia quello che individua la
migliore regione critica C1; l'altra, la regione di accettazione, risulterà determinata di
conseguenza. Dove, per miglior regione critica s’intende, appunto, quella che, a parità
di livello di significatività, presenta la probabilità di commettere un errore di II tipo più
bassa. In termini formali si può dire che la migliore regione critica C1 (il miglior test)
di grandezza α ( a livello α di significatività) per sottoporre al test l'ipotesi semplice
H0 : θ = θ0 contro l'ipotesi alternativa H1 : θ = θ1 è quella che soddisfa le due
relazioni
P ( X ∈ C1 /H0 ) = α
P ( X ∈ C1 /H1 ) ≥ P ( X ∈ Ci /H1 )
dove: X rappresenta il punto campionario, e Ci (i = 2, 3,...) rappresenta ogni possibile
regione critica alternativa a C1 tale che P ( X ∈ Ci /H0 ) = α.
Un famoso teorema attesta che esiste, ed è sempre possibile individuare, la
migliore regione critica nel caso in cui si voglia sottoporre a test un'ipotesi statistica
semplice contro un'ipotesi alternativa anch'essa semplice.
6
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
Teorema 1 (Neyman-Pearson): Sia X una variabile casuale con funzione di massa o
di densità di probabilità f ( x;θ ) e sia x1, x2,...,xn un campione casuale di
osservazioni su X. Allora la funzione di verosimiglianza del campione sarà
espressa da
n
L ( θ ;x ) = L ( θ ;x1 , x 2 ,… , x n ) = ∏ f ( xi ; θ )
i =1
dove f(xi; θ) rappresenta la funzione di densità (di massa) di probabilità
dell'i-esimo elemento campionario.
Siano θ0 e θ1 due valori distinti di θ, K una costante reale positiva e si
voglia sottoporre a test l'ipotesi H0 : θ = θ0 contro l'ipotesi alternativa H1
: θ = θ1. Se C1 (regione critica) è un sottospazio dello spazio dei campioni
C tale che
L ( θ1; x )
≥ K → x ∈ C1
L ( θ0 ; x )
e di conseguenza
C0 = C – C1 (regione di accettazione) consisterà
nell'insieme di punti campionari tali che
L ( θ1; x )
L ( θ0 ; x )
< K → x ∈ C0
dove K viene scelto in modo che la probabilità di commettere un errore di I
specie sia pari a α [P( X ∈ C1 / H 0 ) = α ], allora la regione critica
C1
presenta la più bassa probabilità d'errore di II specie, tra le regioni critiche
che hanno livello di significatività pari ad α.
Dimostrazione
Siano C1 e C1* due regioni di rifiuto dell’ipotesi nulla H0 per le quali valgono le
relazioni
(
)
P( X ∈ C1 / H 0 ) = P X ∈ C1* / H 0 = α
si vuol dimostrare che se C1 risulta definito dalle disuguaglianze sopra riportate allora:
(
P( X ∈ C1 / H 1 ) ≥ P X ∈ C1* / H 1
7
)
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
si vuole dimostrare, cioè, che il test definito dalla regione C1 è più potente di quello
definito da una qualunque altre regione critica C1* che abbia lo stesso livello di
significatività α..
Si consideri la differenza tra le probabilità di non commettere un errore di II tipo
(potenza) relative alle due regioni critiche:
(
∩ (C
)
L(θ , x )
∪ C ) = (C ∩ C ) ∪ (C ∩ C )
∩ (C ∪ C ) = (C ∩ C ) ∪ (C ∩ C )
P( X ∈ C1 / H 0 ) = P X ∈ C1* / H 0 = ∫ L(θ 1 , x ) − ∫
C1 = C1 ∩ C = C1
C1* = C1* ∩ C = C1*
quindi
(
P (C ) = P (C
*
0
*
1
0
*
1
1
) (
∩ C ) + P (C
*
0
1
1
C1+
C1
*
1
1
*
1
0
1
)
∩C )
P(C1 ) = P C1 ∩ C 0* + P C1 ∩ C1*
*
1
*
1
*
1
0
1
per cui
∫
C1 ∩C0*
L(θ 1 , x ) + ∫
L(θ 1 , x ) − ∫
C1 ∩C1*
=∫
C1 ∩C0*
C1* ∩C01
L(θ1 , x ) − ∫
C1* ∩C0
L(θ 1 , x ) − ∫
C1* ∩C1
L(θ 1 , x ) =
L(θ 1 , x )
ma per le due disuguaglianze riportate nell' enunciato del teorema si ha :
in C1 → L(θ1 , x ) ≥ K ⋅ L(θ 0 , x )
in C o → L(θ1 , x ) < K ⋅ L(θ 0 , x )
pertanto
∫
C1 ∩C0*
=∫
L(θ1 , x ) − ∫
C1 ∩C0*
L(θ1 , x ) ≥ ∫
C1* ∩C0
C1 ∩C0*
K ⋅ L(θ 0 , x ) + ∫
C1 ∩C1*
K ⋅ L(θ 0 , x ) − ∫
C1* ∩C0
K ⋅ L(θ 0 , x ) − ∫
C1* ∩C0
K ⋅ L(θ 0 , x ) =
K ⋅ L(θ 0 , x ) − ∫
C1* ∩C0
K ⋅ L(θ 0 , x ) =
= ∫ K ⋅ L(θ 0 , x ) − ∫ * K ⋅ L(θ 0 , x ) = K (α − α ) = 0
C1
C1
Bisogna tener presente che, dal punto di vista operativo, quando si procede nella
formulazione di un test, lo spazio dei campioni C di riferimento non è lo spazio di
variabilità della n-upla X = ( X 1 , X 2 ,… , X n ) che costituisce il campione casuale, ma lo
spazio di variabilità di una funzione T ( ⋅ ) di tali valori che assume, pertanto, la natura
di variabile casuale test; ad esempio, se θ = µ , la funzione di compattazione è data dà
X = T ( X 1 , X 2 ,…, X n ) =
si considera, cioè, la media campionaria X
8
1 n
∑ Xi
n i =1
e lo spazio dei campioni relativo a tale
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
variabile sarà l'intero asse reale e la sua suddivisione potrà essere del tipo riportato nella
figura che segue:
Fig. 2 - Regione critica e regione di accettazione dell'ipotesi H0
Tre considerazioni vanno fatte in merito al teorema di Neyman-Pearson:
•
il teorema resta valido qualunque sia il numero dei parametri (purché finito)
caratteristici della legge di distribuzione delle probabilità della variabile casuale
X;
•
il teorema non richiede esplicitamente l'indipendenza stocastica delle n
osservazioni costituenti il campione;
•
nel teorema sono fissate le condizioni necessarie affinché un test sia il più
potente ma vengono anche indicate le regole per la derivazione della regione
critica.
Esempio 1
Sia
f
1
( x, θ ) =
2π
e
−
1
( x −θ )2
2
la funzione di densità di probabilità di una variabile casuale X definita sull'intero asse
reale esteso (X: -∞ ≤ x ≤ +∞). Si può osservare che si sta trattando una variabile
casuale normale di media µ = θ e varianza σ2 = 1.
Relativamente alle seguenti ipotesi (entrambe semplici)
H 0 :θ = θ 0
9
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
H 1 :θ = θ 1 < θ 0
si assuma la disponibilità di un campione casuale x = (x1, x2, ...., xn). In queste
condizioni si può pervenire alla individuazione della migliore regione critica C1, cioè
alla individuazione del test più potente, facendo ricorso al teorema di
Neyman-Pearson.
Le funzioni di verosimiglianza sotto le ipotesi H0 e H1 sono
n
L ( θ 1 ; x ) = ∏ f ( xi ; θ 1 ) = (2 π)
−
n
2
−
n
2
e
−
1 n
( xi −θ 1 )2
2 i =1
−
1 n
( xi −θ 0 )2
2 i =1
∑
i =1
L (θ 0 ; x
n
) = ∏ f ( xi ; θ 0 )
= (2 π)
e
∑
i =1
La migliore regione critica, cioè quella che minimizza la probabilità β (H 1 )
dell'errore di II tipo una volta fissata la probabilità α dell'errore di I tipo, resta
individuata dalla disuguaglianza
n
f(x ;θ
L ( θ ; x) ∏
=
i
1
L ( θ 01 ; x )
)
1
i =1
n
∏ f(x ;θ
i
=e
n
⎤
1⎡ n
2
2
⎢ (xi −θ 0 ) − (xi −θ 1 ) ⎥
2 ⎢⎣ i = 1
⎥⎦
i =1
∑
∑
≥K
)
0
i =1
dove K è una costante da determinare in funzione di α.
Prendendo il logaritmo degli ultimi due termini della disuguaglianza si ottiene
n
1⎡ n
⎤
2
(x
−
θ
)
−
(xi − θ 1 )2 ⎥ ≥ log K
∑
∑
i
0
⎢
2 ⎣ i =1
i =1
⎦
moltiplicando per 2 i due termini della disuguaglianza si ha
n
n
i =1
i =1
∑ (xi − θ 0 )2 − ∑ (xi − θ 1 )2 ≥ 2 log K
essendo
n
n
n
i =1
i =1
i =1
n
n
n
n
i =1
i =1
i =1
i =1
n
∑ (x − θ
i =1
i
0
)2 = ∑ xi2 − 2θ 0 ∑ xi + nθ 02 =∑ xi2 − 2 nθ 0 x + nθ 02
∑ (xi − θ 1 )2 = ∑ xi2 − 2θ 1 ∑ xi + nθ 12 =∑ xi2 − 2 nθ 1 x + nθ 12
dove
10
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
n⋅ x = n⋅
n
1 n
x
=
xi
∑i ∑
n i =1
i =1
la relazione di disuguaglianza può essere scritta
(
)
2 ⋅ n⋅ x ( θ 1 − θ 0 ) + n⋅ θ 02 − θ 12 1 ≥ 2 ⋅ log K
(
ed anche, dividendo per la quantità negativa n⋅ θ 02 − θ 12
)
che inverte il segno di
disuguaglianza (si ricordi l'ipotesi θ1 < θ0):
x ≤
Poiché
X
(
)
2 ⋅ log K- n⋅ θ 02 − θ 12
= K*
2 ⋅ n( θ 1 − θ 0 )
H 0 :θ = θ 0 , distribuzione normale con
ha, sotto l'ipotesi nulla
µ = θ0 e varianza σ2 = 1/n , sarà facile determinare il valore di K che
media
soddisfa la relazione
P( X ≤
(
)
2 ⋅ log K- n⋅ θ 02 − θ 12
/H 0
2 ⋅ n( θ 1 − θ 0 )
) =α
In pratica l'operazione si semplifica tenendo presente che il membro di destra
della disuguaglianza è una funzione costante di K , basterà allora individuare il valore
K* che soddisfa la relazione
(
)
P X ≤ K * /H 0 = α
od anche
⎞
⎛ X −θ 0
K* −θ 0
P ⎜⎜
/H 0 ⎟⎟ = α
≤
1/ n
⎠
⎝ 1/ n
il che equivale alla relazione
P ( Z ≤ c) = α
dove
Z è una variabile casuale normale standardizzata e
c=
K* −θ 0
è il punto
1/ n
critico che ha alla sua sinistra (regione critica) l'α% dei valori della distribuzione.
5.3 Ipotesi composite
Il teorema di Neyman-Pearson consente di derivare la migliore regione critica
11
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
soltanto nei casi in cui sia l'ipotesi nulla che quella alternativa sono semplici. Quando
H0 o H1, o entrambe le ipotesi sono composite non esiste un analogo teorema. E' stata
comunque suggerita, sempre dagli stessi autori, una procedura generale per la
individuazione della regione critica che dà usualmente buoni risultati: il test del
rapporto di verosimiglianza. Si dimostra infatti che nei casi in cui esiste la migliore
regione critica essa viene individuata dal test del rapporto di verosimiglianza.
Si dimostra inoltre che se esiste un test uniformemente più potente (test UMP
dall’inglese Uniformly Most Powerful), cioè un test che relativamente ad una data
ipotesi nulla semplice H0 e per un prefissato livello di probabilità dell'errore di I tipo
minimizza la probabilità dell'errore di II tipo, qualunque sia la specificazione della
ipotesi alternativa composita H1 , esso è un test del rapporto di verosimiglianza.
Il test del rapporto di verosimiglianza può essere definito nei seguenti termini:
Definizione 3 (Test del rapporto di verosimiglianza). Si supponga che x1,x2,….,xn
costituisca un campione casuale di una variabile X la cui distribuzione
di probabilità sia caratterizzata dal parametro incognito θ, e si voglia
sottoporre a test una ipotesi nulla contro un'ipotesi alternativa (una o
entrambe composite). Si indichi con L ( Θ̂0 ) il valore massimo della
funzione di verosimiglianza del campione rispetto al parametro il cui
campo di variabilità è circoscritto dall'ipotesi H0 , e si indichi con
L ( Θ̂) il valore massimo della funzione di verosimiglianza rispetto a θ,
il cui campo di variabilità riguarda ogni valore specificato dall'ipotesi
H0 o H1. Allora la regione critica del test (generalizzato) del rapporto
di verosimiglianza è formata da tutti i punti campionari che soddisfano
la relazione
R =
L ( Θ̂0 ) max L ( θ / θ ∈ Θ0 )
=
< K
L ( Θ̂)
max L ( θ / θ ∈ Θ)
dove K è scelto in modo che la probabilità di commettere un errore di
I specie sia uguale ad α.
Da rilevare che il rapporto sopra indicato non potrà mai superare l'unità; la
costante K sarà quindi sempre inferiore a 1 e potrà essere determinata sulla base della
distribuzione probabilistica del rapporto stesso in corrispondenza del livello α di
12
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
significatività prefissato. La distribuzione di R non è sempre facilmente derivabile, in
ogni caso si dimostra che, per n abbastanza grande, e se sono soddisfatte certe
condizioni generali di regolarità, la variabile casuale W = - 2 log R, ha una legge di
2
distribuzione approssimata del tipo χ con ν gradi di libertà, dove ν rappresenta il
numero di vincoli di uguaglianza puntuali sui parametri specificati dall’ipotesi nulla.
Nelle pagine successive verranno discusse alcune procedure per sottoporre a test
ipotesi sui parametri della distribuzione normale. Tutti i test considerati sono test del
rapporto di verosimiglianza. Si noti che l'applicazione di tale test al problema della
verifica di ipotesi semplici contro alternative semplici dà luogo a risultati identici a
quelli che si otterrebbero utilizzando il teorema di Neyman-Pearson.
5.3.1 Test sulla media
Per poter verificare delle ipotesi statistiche si deve avere a disposizione un campione di
osservazioni che consenta di poter concludere sulla ragionevolezza dell'ipotesi (nulla)
formulata; se ciò accade si accetta l'ipotesi stessa (ritenendola ragionevole), altrimenti si
procede al suo rifiuto in favore dell'ipotesi alternativa.
Si ammetta di poter disporre di un campione di osservazioni x1,x2,….,xn su una
2
popolazione normale di media µ e varianza σ incognite, e di voler risolvere seguenti
problemi di test d'ipotesi:
a)
H0 : µ = µ0
H1 : µ = µ1 > µ0
b)
H0 : µ = µ0
H1 : µ > µ1
c)
H0 : µ = µ0
H1 : µ < µ0
d)
H0 : µ = µ0
H1 : µ ≠ µ0
Si fissi ora un certo livello di significatività α, cioè la misura della probabilità
d'errore di I specie che si è disposti a sopportare. L'ipotesi riguarda la media di una
distribuzione normale, si sceglie quindi come funzione degli elementi del campione
(variabile casuale test) la media campionaria:
13
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
X = T ( X 1 , X 2 ,...., X n ) =
1 n
∑ Xi
n i =1
Lo spazio di variabilità della variabile casuale campionaria
X
è l'intero asse
reale. La procedura di test consisterà quindi nella suddivisione dell'asse reale in due
regioni in modo tale che la probabilità d'errore di I specie sia pari a α, cioè in modo che
P ( X ⊂ C1 / H 0 ) = α
dove C1 rappresenta naturalmente la regione critica.
Si è visto in precedenza che la variabile campionaria casuale
T =
X- µ
S/
n
ha una legge di distribuzione del tipo t di Student con n-1 gradi di libertà. Avrà quindi
la distribuzione t, con n-1 gradi di libertà anche la variabile casuale
T =
Caso a)
X- µ 0
S/
n
H0 : µ = µ0
H1 : µ = µ1 > µ0
L'asse reale viene diviso in due intervalli. Il primo degli intervalli specifica la
zona di accettazione, il secondo la zona critica. Il valore numerico di c , detto valore
critico del test, si ottiene dalla relazione
P ( T > c / µ = µ0 ) = α
caso b)
H0 : µ = µ0
H1 : µ > µ0
In questo caso l'ipotesi alternativa è composita, la procedura di test
uniformemente più potente (cioè quella che minimizza la probabilità d'errore di II
specie contro ogni specificazione delle ipotesi alternative H1) è esattamente identica a
quella indicata nel caso precedente.
caso c)
H0 : µ = µ0
H1 : µ < µ0
L'ipotesi alternativa anche in questo caso è composita ma con segno di
disuguaglianza, relativamente all'ipotesi alternativa, invertito rispetto al caso
precedente. Si dovrà sempre suddividere l'asse reale nei due intervalli -∞ — |c , c |—+∞
ma in questo caso la regione critica è data dall'intervallo -∞ —| c.
14
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
Il valore critico si ottiene dalla relazione
P ( T < c / µ = µ0 ) = α
Da sottolineare che nelle due situazioni sopra descritte si applica il test del
rapporto di verosimiglianza che individua la migliore regione critica, individua cioè, il
test uniformemente più potente; a sostegno di una tale affermazione è sufficiente
ipotizzare una applicazione reiterata del teorema di Neyman-Pearson in
corrispondenza a ciascuna specifica dell’ipotesi alternativa: la regione critica
individuata è sempre la stessa, ed è quella che minimizza la probabilità dell’errore di II
tipo, ovviamente, tale probabilità varierà al variare della specifica dell’ipotesi
alternativa.
caso d)
H0 : µ = µ0
H1 : µ ≠ µ0
Mentre nei due casi precedenti si parla di ipotesi alternative composite
unidirezionali, quì si parla di ipotesi alternativa bidirezionale. In questo contesto
l'asse reale viene suddiviso in tre parti
-∞—| c1 , c1|— |c2 , c2 |— +∞ , l'intervallo
c1|—| c2 costituirà la zona di accettazione, mentre i due intervalli -∞—| c1 e
c2 |—+∞
costituiscono insieme la zona di rifiuto. Poiché la distribuzione t è simmetrica, si
scelgono i valori di c1, c2 equidistanti dallo 0, cioè c2 = - c1 = c . Il valore critico c si
otterrà allora dalla relazione
P ( T < -c / µ = µ0 ) = P ( T > c / µ = µ0 ) α/2
Evidentemente la procedura indicata non fornisce un test uniformemente più
potente; infatti, se il vero valore di µ fosse superiore a µ0, il test più potente sarebbe
quello indicato nel caso a); se invece il vero valore di µ fosse inferiore a µ0 il test più
potente sarebbe quello indicato nel caso c). Non avendo maggiori informazioni sulle
alternative, relativamente all'ipotesi H1: µ ≠ µ0, si preferisce attribuire alle due
possibilità µ > µ0 e µ < µ0 uguale peso. Da rilevare che il test così ottenuto risulta
quello uniformemente più potente nella classe ristretta dei cosiddetti test corretti o
non distorti (test UMPU dall’inglese Uniformly Most Powerful Unbiased).
Definizione 4 (Correttezza di un test). Un test si dice corretto o non distorto se
soddisfa il vincolo γ (Η1) ≥ α , cioè, se la probabilità di non commettere
un errore di II tipo è sempre maggiore od uguale alla probabilità di
15
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
commettere un errore di I tipo).
Nei quattro casi sopra esaminati si rifiuta l'ipotesi
H0
se la specifica
determinazione della variabile casuale T cade nella zona critica (zona di rifiuto), si
accetta altrimenti.
Esempio 2
Si supponga di voler risolvere il seguente problema di test d'ipotesi
H0 : µ = 30
H1 : µ < 30
al livello di significatività α = 0,01, disponendo delle informazioni media campionaria
x = 26 e della varianza campionaria corretta s2 = 36 relative ad un campione di 25
elementi estratti da una popolazione normale.
Non essendo nota la varianza della popolazione, la regione critica o regione di
rifiuto dell'ipotesi nulla H0 : µ = 30 si individua facendo riferimento alla variabile
casuale t di Student
t=
dove
Sx = S /
X −µ
Sx
n . Tenendo presente l'ipotesi alternativa H1 : µ < 30 la regione
critica resta quindi individuata dal punto critico
c = - tα = - t0,01 = - 2,492 che
rappresenta la specifica determinazione della variabile casuale t di Student che ha
alla sua sinistra l'1% dei casi. Poiché il valore campionario è
t=
26 − 30
= −3,33 < −2,492
σ/ 25
rifiutiamo l'ipotesi nulla H0 : µ = 30, al livello di significatività dell'1%.
Esempio 3
Dati i seguenti otto valori campionari 31, 29, 26, 33, 40, 28, 30 e 25 estratti da una
popolazione normale si vuole sottoporre a test l'ipotesi che la media sia pari a 35
contro l'ipotesi alternativa che non lo sia, al livello di significatività α = 0,01.
Il problema di test d'ipotesi da risolvere è
16
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
H 0 :µ = 35
H 0 :µ ≠ 35
Essendo la varianza della popolazione una incognita del problema si dovrà
procedere ad una sua stima utilizzando i dati campionari
S2 =
1 n
(xi − x )2
∑
n− 1 i =1
essendo
x=
1 8
1 n
=
xi = 30,25
x
∑ i 8∑
n i =1
i =1
s2 =
1 8
(xi − 30,25)2 = 22,21
∑
7 i =1
s = s 2 = 4,71
La determinazione della variabile casuale test che in questo caso, essendo
incognita la varianza, è la t di Student, è pari a
t=
30,25 - 35
x- µ
x−µ
=
=
= - 2,85
sx
s / n 4,71 / 8
Essendo α = 0,01 i valori critici della variabile t, con (8-1) =7 gradi di
libertà; che definiscono la regione critica sono
c1 = - tα/ 2 = - 3,499
e
c2 = tα/ 2 = 3,499 . Il valore campionario -2,85 è contenuto nell'intervallo
-3,499 |—| 3,499, pertanto si accetta l'ipotesi nulla µ = 35 attribuendo la differenza
riscontrata rispetto al valore campionario x = 30,25 a fattori di carattere accidentale.
Esempio 4
Per giustificare la loro richiesta di aumento di stipendio, gli impiegati di una ditta di
vendita per corrispondenza affermano di riuscire ad evadere, mediamente un ordine di
acquisto ogni 13 minuti. Il direttore generale della ditta ha effettuato una verifica
casuale sui tempi di evasione di 400 ordini registrando un tempo medio di evasione di
14 minuti e una variabilità, misurata in termini di varianza corretta, di 100 minuti.
Cosa si può concludere
riguardo alle richieste degli impiegati se si fissa una
probabilità di errore di I tipo (livello di significatività) del 5%?
Si deve sostanzialmente verificare se la media rilevata nel campione differisce, al
17
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
livello di significatività del 5%, da quella dichiarata dagli impiegati.
Il problema di verifica d'ipotesi è formalizzato nei termini seguenti
H 0 : µ = 13
H 1 : µ > 13
La variabile casuale test di riferimento
t=
X- µ
X −µ
=
Sx
S/ n
ha, nell'universo dei campioni, distribuzione del tipo t di Student con
n-1 gradi di
libertà.
Conviene sottolineare che, in questo specifico esempio, essendo la dimensione
campionaria elevata (n = 400) si può fare riferimento alla distribuzione normale quale
approssimazione della distribuzione t di student che fornisce un valore critico (test
unidirezionale ), per α = 0,05, pari a 1,65. La regola di decisione è quella di rifiutare
l'ipotesi
H0
se il valore assunto (valore empirico) dalla v.c. test nello specifico
campione è ≥ 1,65, di accettare se il valore empirico è < 1,65.
Poiché x = 14 e s x = s /
n = 10 / 400 si ha
x−µ
14 - 13
=
= 2 > 1,65
sx
10 / 400
si rifiuta l'ipotesi H0 concludendo che tempo medio richiesto per evadere un ordine è
superiore ai 13 minuti dichiarati dagli impiegati.
Esempio 5
Si supponga di disporre di un campione di 10 elementi rispetto al quale siano stati
ottenuti i valori x = 50,
10
∑ (x − x)
i =1
2
i
= 99 e di dover risolvere il seguente problema di
test d'ipotesi
H0 : µ = 47
H1 : µ ≠47
ipotizzando la normalità della distribuzione della variabile di interesse.
Non essendo nota la varianza della popolazione e relativamente ridotta la
dimensione del campione non si può fare ricorso all'approssimazione normale, la
18
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
variabile casuale test da utilizzare è, pertanto, la variabile casuale t di Student.
X- µ
S/ n
T =
dove
n
∑ (x − x )
S=
2
i
1= 1
n− 1
quindi
10
S x2 =
2
S
=
n
∑ (x − x )
i =1
2
i
9 ⋅ 10
=
99
= 1,1
90
La determinazione assunta dalla variabile casuale t di student sotto l'ipotesi nulla
Ho : µ = 47 risulta essere
t=
x − µ 50 − 47
= 2,8604
=
Sx
1,0488
Per (n – 1) = 9 gradi di libertà ed α = 0,01 i valori critici che delimitano la
regione di accettazione sono − tα/ 2 = - 3,25 e. tα / 2 = 3,25 . Essendo 2,8604 < 3,25 si
accetta l'ipotesi nulla Ho : µ = 47.
Se si sceglie il livello di significatività α = 0,05, i valori critici sono -tα/2 e tα/2;
essendo 2,8604 > 2,262 l 'ipotesi nulla Ho : µ = 47 dovrà essere rifiutata.
Esempio 6
Si supponga di aver somministrato ad un gruppo di 12 cavie una particolare dieta dalla
nascita fino all'età di 3 mesi e di aver riscontrato i seguenti incrementi di peso: 55, 62,
54, 57, 65, 64, 60, 63, 58, 67, 63 e 61 grammi. Sapendo che le cavie del tipo
considerato, quando non sono sottoposte a diete speciali, mostrano un incremento
medio di peso (nei primi tre mesi di vita) pari a 65 grammi, ci si domanda se le
risultanze campionarie siano tali da poter attribuire alla dieta la differenza riscontrata
nell'incremento medio di peso; si vuole sapere cioè se la differenza d = 60,75 - 65
debba essere attribuita alla dieta o se non debba invece essere attribuita a fattori aventi
carattere puramente accidentale. Una possibile risposta al quesito si può ottenere
applicando la procedura di test sopra illustrata; la procedura può essere riassunta
19
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
come segue:
1.
si fissa il livello di significatività, ad esempio α = 0,05;
2.
si specificano le due ipotesi
H0 : µ = 65
H1 : µ ≠ 65
L'ipotesi alternativa è di tipo bidirezionale in quanto si può ritenere, almeno per
il momento, che un qualsiasi incremento medio di peso maggiore o minore di 65
grammi possa essere attribuito all'effetto della dieta;
3.
si individua la variabile casuale al test
X- 65
T =
S / 12
che, per quanto detto, è del tipo t di Student con 12 - 1 = 11 gradi di libertà. Tale
variabile descrive l'andamento dei risultati campionari (sintetizzati nella formula sopra
scritta) sotto l'ipotesi nulla H0; cioè a condizione che la dieta non abbia effetto e che
quindi le differenze tra
X
e 65 siano da attribuire esclusivamente a fattori
accidentali;
4.
si determina il valore critico c che soddisfa la relazione
P ( -c ≤ T ≤ c) = 0,95
Dalle tavole della distribuzione t di Student, in corrispondenza di 11 gradi di
libertà, risulta c = 2,20;
5.
si pone a confronto il valore t (la specifica determinazione della variabile casuale
T) calcolato sui dati campionari
t =
60,75 - 65
16,38 / 12
con il valore critico determinato al punto precedente.
Essendo
t = -3,63 < -2,20 = -c
si rifiuta l'ipotesi nulla H0 : µ = 65, al livello di significatività α = 0,05, si rifiuta cioè
l'ipotesi che la differenza d = 60,75 - 65 sia da attribuire al caso.
Qualora si ritenga, a priori, che la dieta debba provocare un incremento medio di
peso inferiore a 65 grammi, la procedura di test da adottare sarà quella di tipo
unidirezionale. In tal caso si dovrà porre
20
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
H0 : µ = 65
H1 : µ < 65
si determina poi, in funzione della variabile test
T =
X- 65
S / 12
il valore critico c che soddisfa la relazione
P (T ≤ -c) = 0,05
Dalle tavole della distribuzione t di Student risulta c = 1,80. Essendo
t = -3,63 < -1,80 = -c
si rifiuta l'ipotesi H0 : µ = 65.
Le due procedure di test adottate, bidirezionale e unidirezionale, portano
entrambe alla stessa conclusione: rifiuto dell'ipotesi nulla. A tale proposito va però
sottolineato che se la t campionaria avesse assunto un valore compreso nell'intervallo
-2,20 |—| -1,80 l'applicazione della procedura di test bidirezionale, a livello α = 0,05
di significatività, avrebbe comportato un'accettazione dell'ipotesi nulla mentre, allo
stesso livello di significatività, l'applicazione della procedura di test unidirezionale
avrebbe comportato un suo rifiuto.
I test sopra illustrati sono, per l’ipotesi alternativa unidirezionale e per l’ipotesi
bidirezionale, rispettivamente, il test uniformemente più potente ed il test
uniformemente più potente nella classe dei test corretti.
5.3.2 Livello di significatività e p-value
Dalle considerazioni svolte, risulta evidente il ruolo fondamentale giocato dal livello di
significatività del test. Stante l'arbitrarietà nella fissazione del livello α, cioè della
probabilità massima di errore di I specie che si è disposti a sopportare, spesso il
ricercatore preferisce discutere di livello di significatività soltanto a posteriori. Nel caso
specifico dell'esempio considerato, si sarebbe detto che il risultato campionario t = 3,63 è significativo, nel caso di test bidirezionale, al livello dello 0,8%; volendo
esprimere con tale affermazione il fatto che l'area sottesa alla curva descritta dalla
funzione di densità di probabilità della distribuzione t di Student corrispondente alla
regione critica, definita dagli intervalli -∞ |—| -3,63, 3,63 |—| + ∞ è pari a 0,008. Tale
21
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
valore viene usualmente detto P-value.
Definizione 5 (P-value). In corrispondenza di una particolare determinazione
t0
assunta da una qualunque variabile casuale test T ( ⋅ ) si dice P-value la
probabilità dei valori che superano, in valore assoluto e nella direzione
estrema, il valore osservato.
Questa definizione viene usualmente accettata quando T ( ⋅ ) è una stima di θ
usata per sottoporre a test l’ipotesi nulla H 0 : θ = θ 0 contro un’ipotesi alternativa
unidirezionale: H 1 : θ > θ 0 ed i valori estremi da considerare si collocano nella coda
di destra della distribuzione; H 1 : θ <
θ0
ed i valori estremi da considerare si
collocano nella coda sinistra della distribuzione. Molto più problematica è la situazione
nel caso di ipotesi bidirezionale
H 1 : θ ≠ θ 0 , in questo caso i valori estremi da
considerare sono sia quelli della coda di destra sia quelli della coda di sinistra, a ragione
di ciò, alcuni autori sostengono che in tali circostanze il valore del P-value debba
essere raddoppiato; nell’esempio sopra considerato, se l’ipotesi alternativa fosse stata
H1 : µ ≠ 65 , il P-value sarebbe stato pari a 0,16 = 0,08 + 0,08.
Nel caso in cui la variabile casuale test abbia distribuzione discreta si pone il
problema di includere o meno nel P-value la probabilità corrispondente al valore
osservato. Usualmente tale probabilità viene inclusa per intero, così da ottenere un test
conservativo, cioè con un livello di significatività effettivo non superiore a quello
nominale.
Si richiama l’attenzione sul fatto che il ricorso al P-value è criticato da molti
autori a ragione, sia dell’aspetto sopra considerato dell’attribuzione di un valore
numerico a P-value , essendo il valore stesso interpretabile come evidenza empirica
contro l’ipotesi nulla ( P = 0,08 è sicuramente un’evidenza empirica contro l’ipotesi
nulla H0 : µ = 65 più forte di quanto non lo sia P = 0,16 ), sia perché può accadere
che ad uno stesso valore di P possono corrispondere realtà molto diverse.
Se si presuppone, ad esempio, di voler risolvere il problema di test H0 : µ = 65
contro l’ipotesi alternativa
H0 : µ > 65
avendo a disposizione un campione di
dimensione n estratto da una popolazione normale con varianza nota σ 2 = 1 , sotto
22
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
l’ipotesi nulla la variabile casuale test Z x =
X − 65
1/ n
si distribuisce come una normale
stardardizzata. In tale situazione, per n = 4 , x = 66 la determinazione della variabile
casuale test è z = 2, cui corrisponde un P-value pari a 0,0228, allo stesso valore di P
si perviene per n = 400 e x = 65,1. Ovviamente, le due situazioni sono decisamente
diverse anche se la misura dell’evidenza empirica contro H0 : µ = 65 è la stessa; ma
questo è un problema che che riguarda tutta l’impostazione classica della teoria del test
dell’ipotesi e che trova una sua soddisfacente soluzione solo nell’ambito
dell’impostazione bayesiana dell’inferenza statistica.
I problemi di test delle ipotesi fino ad ora considerati facevano riferimento ad una
variabile casuale normale con varianza incognita. Qualora la varianza fosse nota, per
risolvere i quattro problemi di test indicati, si dovrebbe operare in modo analogo
facendo però riferimento alla distribuzione normale anziché alla distribuzione t di
Student.
Esempio 7
Una fabbrica di lampadine afferma che i propri prodotti hanno una durata media di
1.000 ore, come acquirente si vuole verificare l'affermazione. Sottoponendo a prova un
campione casuale di 100 lampadine si riscontra una durata media di 970 ore.
Poiché è nota la variabilità (misurata dalla varianza) nella durata che risulta
essere σ2 = 1.600, cosa si può concludere riguardo all'affermazione ad un livello di
significatività del 5%?
Il problema di verifica l'ipotesi da risolvere è
H0 : µ = 1.000
H1 : µ ≠ 1.000
Essendo nota la varianza ed ipotizzando la normalità della distribuzione
d’origine, la variabile casuale test di riferimento è
Zx =
X- µ
σ / n
che, nell'universo dei campioni ha distribuzione normale standardizzata. I valori critici
per una probabilità di errore di I tipo, prefissata al livello α = 0,05, sono
− zα/ 2 = - 1,96 e zα / 2 = 1,96
23
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
che individuano le zone di accettazione di H0 nell'intervallo -1,96 |–| 1,96 mentre la
regione di rifiuto è rappresentata dai semintervalli -∞ |–| -1,96 e 1,96 |–| +∞.
Poiché la determinazione della variabile casuale test (valore empirico), pari a
970 − 1.000
80 / 100
= - 3,75 , ricade nell'intervallo -∞ |–| -1,96 (regione critica) si rifiuta
l'ipotesi H0 concludendo che la durata media delle lampadine è inferiore a 1.000 ore.
Esempio 8
Un'impresa afferma che le batterie prodotte hanno una durata media di 22 ore e che la
loro variabilità, misurata attraverso lo scostamento quadratico medio, è pari a 3 ore.
Nove batterie vengono sottoposte a prova e si accerta una durata media di 20 ore.
Ipotizzando per la popolazione una variabilità pari a quella dichiarata dalla casa
produttrice e la normalità della distribuzione, si vuol verificare la validità
dell'affermazione fatta dall'impresa.
Poiché la durata delle batterie si distribuisce in modo (approssimativamente)
2
normale e la varianza è nota (σ = 9), la media campionaria X si distribuirà,
nell'universo dei campioni normalmente con varianza
σ x2 =
9
σ2
=
= 1
n
9
La formulazione delle due ipotesi (nulla e alternativa) è
H0: µ = µ0 = 22
H1 : µ ≠ µ0
pertanto, fissato il livello di significatività
α = 0,05, la regione di accettazione
dell'ipotesi nulla risulta individuata dall'intervallo -zα/2 |—| zα/2, cioè dall'intervallo
-1,96 |—|1,96. Essendo
z =
x- µ 0
20 - 22
=
= -2
1
σ / n
pari ad un valore inferiore al valore –1,96 che delimita la regione di accettazione,
l'ipotesi nulla H0 : µ = 22 viene rifiutata, concludendo che la durata media delle
batterie in questione è inferiore alle 22 ore.
Se la varianza della popolazione non fosse nota ed il valore 9 corrispondesse alla
stima campionaria corretta di tale entità incognita, la variabile casuale test di
24
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
riferimento sarebbe la t di student con 8 (= 9-1) gradi di libertà. In questo caso, al
livello α = 0,05 di significatività i punti critici risulterebbero pari a -2,306 e 2,306,
ed essendo il valore campionario assunto dalla variabile casuale t (= -2) contenuto
nell'intervallo -2,306 |—| 2,306 si dovrebbe accettare l'ipotesi nulla attribuendo alla
differenza riscontrata (tra valore ipotizzato e valore registrato per il campione) natura
accidentale. Da sottolineare che nella situazione prospettata la mancanza di
informazioni (varianza della popolazione incognita) la stessa evidenza campionaria
porta a concludere in maniera opposta: rifiuto di H0 nel caso di varianza nota,
accettazione di H0 nel caso di varianza incognita; la maggiore variabilità dei risultati
campionari fa “perdere” di “significatività statistica” all’evidenza empirica.
5.3.3 Potenza di un test
Si esaminerà ora in modo dettagliato il problema di test di ipotesi relative alla media di
una popolazione normale di varianza nota. Questo caso, pure se meno interessante del
precedente da un punto di vista operativo in quanto la varianza è generalmente una
quantità incognita, consente, da un lato di meglio precisare i concetti già esposti in
merito alla procedura di test da utilizzare, dall'altro un maggiore approfondimento degli
aspetti connessi alla determinazione della probabilità di commettere un errore di II
tipo o anche alla probabilità di non commettere un errore di II tipo (potenza di un
test).
Si ammetta dunque di poter disporre di un campione di osservazioni
X 1 , X 2 ,...., X n relative ad una popolazione normale di media incognita µ e varianza
nota σ 2 , e di voler sottoporre a test le seguenti ipotesi:
a)
H0 : µ = µ0
H1 : µ = µ1 > µ0
b)
H0 : µ = µ0
H1 : µ > µ0
c)
H0 : µ = µ0
H1 : µ < µ0
d)
H0 : µ = µ0
H1 : µ ≠ µ0
25
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
Se l'ipotesi nulla H0 è vera, la media campionaria
X =
1 n
∑ Xi
n i =1
2
si distribuisce, nell'universo dei campioni, normalmente con media µ0 e varianza σ /n.
Per l'individuazione della migliore regione critica (quando esiste) si può procedere alla
standardizzazione della variabile casuale X
Zx =
X- µ 0
σ / n
e riferirsi alle tavole della distribuzione normale standardizzata utilizzando una
procedura del tutto analoga a quella illustrata a proposito della distribuzione t di
Student. Ad esempio per α = 0,05, i valori critici di riferimento per le quattro possibili
ipotesi alternative considerate sono:
a) c = 1,64, si rifiuta l'ipotesi nulla H0 se Z x > 1,64;
b) c = 1,64, si rifiuta l'ipotesi nulla H0 se Z x > 1,64;
c) c = -1,64, si rifiuta l'ipotesi nulla H0 se Z x < -1,64;
d) c1 = -1,96 e c2 = 1,96, si rifiuta l'ipotesi H0 se Z x < -1,96 oppure Z x > 1,96.
Nei quattro casi sopra considerati, sono stati individuati i valori critici facendo
riferimento alla distribuzione normale standardizzata. Risulta subito evidente come sia
possibile riferirsi direttamente alla variabile casuale
X
anziché alla sua
standardizzata. Infatti dall'uguaglianza
(
⎛ X- µ 0
⎞
P Z x ≥ 1,64 = P ⎜⎜
≥ 1,64 ⎟⎟ = P X ≥ µ 0 + 1,64 ⋅ σ/
⎝σ / n
⎠
(
)
n
) = 0,05
risulta immediatamente il valore critico del test per il primo (e secondo) caso
considerato, in riferimento alla variabile casuale test X anziché Z x . Nella Fig. 3 si
evidenziano graficamente, per tutti e quattro i casi di ipotesi alternativa considerati, la
regione critica e quella di accettazione in riferimento alla variabile casuale test X ed al
livello di significatività α = 0,05:
26
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
Fig. 3 - Distribuzione campionaria e regione critica relative a quattro diverse
specificazioni dell'ipotesi alternativa H1 rispetto all'ipotesi nulla H0 : µ = µ0
27
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
Nel primo grafico della Fig. 3 (quello relativo al caso a) dove entrambe le
ipotesi formulate sono semplici) è stata evidenziata graficamente oltre alla
regione di rifiuto dell'ipotesi H0 anche l'area corrispondente alla probabilità
α = 0,05 dell'errore di I tipo e l'area corrispondente alla probabilità β ( H 1 ) di
commettere un errore di II tipo. La potenza o forza del test γ ( Η1 ) = 1 – ß ( H1 ) ,
cioè la probabilità di non commettere un errore di II tipo, risulta graficamente
espressa dall'area sottesa alla curva di destra relativa all'intervallo c|—+∞
Dalla Fig. 3 e da quanto detto a proposito degli intervalli di confidenza si desume
che la potenza di un test resta influenzata:
i. - dal livello di significatività α prescelto;
ii. - dalla specificazione dell'ipotesi alternativa;
iii. - dalla numerosità del campione.
L'immediata considerazione da fare in merito alla relazione che lega la forza di un
test al livello di significatività è che un test è tanto più potente quanto più è elevata la
probabilità dell'errore di I tipo. Infatti, se si osserva la Fig. 4 si vede chiaramente come
l'incremento del livello
α (probabilità dell'errore di I tipo), comportando un
allargamento dell'intervallo di rifiuto (regione critica), determini una riduzione della
probabilità dell'errore di II tipo e di conseguenza un aumento della potenza del test.
28
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
Fig. 4 - Relazione tra potenza di un test e livello di significatività
Si consideri ora il caso in cui si voglia sottoporre a test l'ipotesi nulla H0 : µ = µ0,
contro l'ipotesi alternativa:
a)
H 1 : µ = µ 0* > µ 0
b)
H 1 : µ = µ 0** > µ 0*
c)
H 1 : µ = µ 0*** > µ 0**
al livello α di significatività.
I tre problemi di test sono illustrati graficamente nella Fig. 5. Osservando le curve
tracciate si vede chiaramente come la potenza del test cresca all'aumentare dello scarto
tra il valore di µ specificato dall'ipotesi nulla ed il valore di µ specificato nell'ipotesi
alternativa. Nella Fig. 6 si riporta il grafico della funzione forza del test in relazione a
tutte le possibili specificazioni delle ipotesi alternative composite unidirezionali
H1 : µ < µ0 e H1 : µ > µ0 e l'ipotesi alternativa composita bidirezionale H1 : µ ≠ µ0
29
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
Fig. 5 - Relazione tra potenza del test e specificazione dell'ipotesi alternativa
30
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
Fig. 6 - Grafico della funzione forza del test relativo all'ipotesi nulla H0 : µ = µ0 contro
tre diverse specificazioni dell'ipotesi alternativa composita H1
L'espressione analitica che consente di determinare il valore numerico assunto
dal punto critico relativo alla variabile casuale test X , quando si vuole sottoporre a test
un'ipotesi nulla del tipo H0 : µ = µ0 contro un'ipotesi alternativa del tipo H1 : µ > µ0 è
data dall'uguaglianza
c = µ0 + zα σ/√n
dove zα è la determinazione numerica della variabile casuale normale standardizzata
che soddisfa la relazione P ( Z > zα ) = α. Evidentemente la relazione sopra scritta si
riferisce ad un campione di osservazioni di dimensione n estratto da una popolazione
normale di varianza nota σ2.
Osservando la relazione si rileva come l'entità c (valore critico) sia una funzione
decrescente di n. Ciò sta a significare che ad un aumento della dimensione campionaria
corrisponde una diminuzione nel valore numerico di c, il che comporta un ampliamento
dell'intervallo che delimita la regione critica con un conseguente aumento della forza
del test.
A titolo esemplificativo si riporta il grafico della funzione forza del test in
31
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
riferimento a due diverse dimensioni campionarie n ed m (n > m)
Fig. 7 - Grafico della funzione forza del test relativo a due diverse dimensioni
campionarie
Un'ultima considerazione da fare in merito alla potenza o forza di un test statistico
riguarda la varianza campionaria della variabile casuale test σ c2 . Dalla formula sopra
scritta risulta che il valore critico c è legato funzionalmente ed in senso positivo a σ c2 ,
ciò sta a significare che a più bassi valori di σ c2 , corrispondono più bassi valori di c e
quindi più ampie regioni critiche. Sarà pertanto possibile, operando su σ c2 ottenere un
incremento nella potenza di un test senza dover necessariamente procedere ad un
aumento della dimensione campionaria o della probabilità dell'errore di I tipo.
Questa affermazione ha naturalmente significato soltanto nei casi in cui sia
σ c2 , ad esempio, attraverso un’opportuna
effettivamente possibile operare su
pianificazione della rilevazione campionaria o del disegno degli esperimenti. Il caso più
semplice e più significativo è quello relativo alle modalità di estrazione delle unità
campionarie e si considera la media campionaria
X
quale variabile casuale test;
infatti, come già sottolineato, se si procede all’estrazione da una popolazione finita
rimettendo ogni volta l’unità estratta nella popolazione (campionamento con
ripetizione) si ha
σ x2 =
σ2
, se invece si effettua l’estrazione in modo esaustivo
n
(estrazione senza ripetizione) si ha σ
2
x
σ 2 N− n
, dove N è la dimensione della
=
n N−1
popolazione e n è la dimensione del campione.
32
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
Relativamente alla varianza σ c2 della variabile casuale test, si deve sottolineare
che nella generalità dei casi tale varianza dipende dalla variabilità del fenomeno oggetto
di studio, cioè, dalla varianza σ 2 della popolazione che è un’entità usualmente
incognita (parametro di disturbo). Si dovrà, pertanto, procedere ad una stima
2
2
di tale entità il che porta alla determinazione di una stima σ̂ c di σ c ; la radice
positiva di tale quantità σ̂ c viene usualmente detto errore standard.
Esempio 9
Si consideri la variabile casuale continua X definita nel semiasse reale positivo esteso
(X : 0 ≤ x ≤ + ∞) con funzione di densità di probabilità
f
( x;θ ) =
x
1 −θ
e
θ
e si supponga di voler risolvere il seguente problema di test d'ipotesi
H0 : θ = 2
H1 : θ > 2
Supponendo, inoltre, la disponibilità di un campione di due elementi (n = 2) e
definendo la regione critica attraverso la disuguaglianza X1 + X2 ≥ 9,5 si può derivare
l'espressione analitica della funzione forza del test γ (H1) determinandone il valore per
H1: θ = 4.
Come più volte sottolineato, la funzione forza del test rappresenta la probabilità
di non commettere un errore di II tipo, cioè la probabilità di rifiutare l'ipotesi H0
quando l'ipotesi stessa è falsa.
γ
( H 1 ) = P ( X ∈ C1 / H 1 )
= 1 - P( X ∈ C0 / H 1 )
Se si esplicita l'ipotesi alternativa nel modo seguente
H 1 :θ = θ 1 > 4
e si tiene conto della regola di decisione prescelta (accettare l'ipotesi H0 quando
X1 + X2 < 9,5), e del fatto che le due variabili casuali campionarie X1 e X 2 sono
indipendenti, si avrà:
33
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
P ( X 1 + X 2 < 9 ,5 /H 1 ) = ∫
f ( x 2 ;θ1 )dx1 dx 2 = 1 − ∫
9 ,5
0
∫
9 ,5
0
∫
9 ,5⋅− x2
0
f ( x1;θ1 ) dx1 dx 2
1
e
θ12
9 ,5⋅− x2
0
x1 + x2
θ1
dx1 dx 2
e quindi
γ(θ1 ) = 1 − β(θ1 ) = 1 − ∫
9 ,5
0
∫
9 ,5⋅ x2
0
⎛ x1 + x2
θ1
1 −⎜⎜⎝
e
θ12
⎞
⎟⎟
⎠
9 ,5
dx1 dx 2 =
θ1 + 9 ,5 − θ1
e
θ1
Per θ1 = 4 si ha
4 + 9,5 −
γ(4) =
e
4
9,5
4
= 0,31
Si è più volte affermato che la variabile casuale
T =
ha una legge di distribuzione
t
X- µ
S/ n
di Student quando la popolazione che genera il
campione è di tipo normale.
Non sempre però, nella ricerca applicata, risulta soddisfatta la condizione di
normalità; ci si deve allora chiedere che cosa succede alla legge di distribuzione della
variabile T, definita dalla formula quando una tale condizione non sussiste.
L'osservazione da fare è che la variabile T si dimostra particolarmente sensibile alle
variazioni nella legge di distribuzione della popolazione che genera il campione.
Le considerazioni sopra svolte impongono una certa cautela nell’utilizzazione
della distribuzione
t
di Student, nel senso che si può fare ricorso ad una tale
distribuzione solo quando si è sufficientemente convinti della normalità, o
approssimativa normalità, della popolazione che genera il campione. Tale affermazione
vale naturalmente nei casi in cui la dimensione del campione non supera le 30 unità,
oltre tale dimensione, come già sottolineato, la distribuzione
t
di Student e la
distribuzione normale praticamente coincidono, basterà allora riferirsi alla distribuzione
normale purchè questa costituisca una buona approssimazione della distribuzione della
media campionaria.
Per quanto concerne i casi in cui si abbia a che fare con campioni di dimensione
superiore a 30, si rimanda a quanto sommariamente detto a proposito degli intervalli di
34
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
confidenza per campioni estratti da popolazioni di cui non è nota la legge di
distribuzione. Infatti, si rileva immediatamente come le procedure proposte per
sottoporre a test delle ipotesi statistiche, e quelle utilizzate per la determinazione degli
intervalli di confidenza, presentino punti di contatto tali da consentire un passaggio
immediato dall'intervallo di confidenza alla regione di accettazione.
A sostegno di quanto sopra affermato si può, ad esempio, considerare il problema
2
di test, sulla media µ di una popolazione normale con varianza nota pari a σ , definito
dalle ipotesi
H0 : µ =µ 0
H0 : µ ≠ µ 0
La regione di accettazione dell'ipotesi H 0 : µ = µ 0 al livello
α = 0,05 di
significatività, risulta essere
− 1,96 ≤
X - µ0
≤ 1,96
σ/ n
che può anche essere scritta
X − 1,96 ⋅ σ / n
≤ µ 0 ≤ X + 1,96 ⋅ σ / n
e tale espressione rappresenta l'analogo dell'intervallo di confidenza (al livello del 95%)
per la media di una popolazione normale
X − 1,96 ⋅ σ/
n ≤ µ ≤ X + 1,96 ⋅σ/
n
come già visto in precedenza. L'implicazione è dunque che un intervallo per la media, al
livello di confidenza del 95%, costituisce l'intervallo che include tutte quelle ipotesi,
sulla media stessa, che verrebbero accettate in una procedura di test bidirezionale,
qualora fosse stato fissato un livello di significatività pari a 0,05.
La somiglianza tra le procedure di test e quelle di determinazione degli
intervalli di confidenza, non deve naturalmente indurre a confondere i problemi di
test con quelli di stima; essi sono logicamente e sostanzialmente diversi.
5.3.4 Test sulla varianza
Nel caso in cui si voglia sottoporre a test un'ipotesi sulla varianza di una popolazione
normale, disponendo di un campione di n elementi e per un certo α, si deve operare in
modo analogo a quanto fatto relativamente alla media. La variabile casuale campionaria
35
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
di riferimento (variabile casuale test) diventa
W =
(n- 1) ⋅ S 2
σ2
che ha una legge di distribuzione del tipo χ2 con n-1 gradi di libertà ed è definita
nell'intervallo 0 ___ + ∞.
H 0 : σ 2 = σ 02
Caso a) b)
H 1 : σ 2 = σ *2 > σ 02 (od anche H 1 : σ 2 > σ 02 )
Il valore critico c si ottiene dalla relazione
P ( W > c / σ 2 = σ 02 ) = α
Caso c)
H 0 : σ 2 = σ 02
H 0 : σ 2 < σ 02
Il valore critico c si ottiene dalla relazione
P ( W < c / σ 2 = σ 02 ) = α
Caso d)
H 0 : σ 2 = σ 02
H 0 : σ 2 ≠ σ 02
I valori critici c1 e c2 (si noti che la distribuzione χ
2
non è simmetrica) si
ottengono dalle relazioni
P ( W > c 2 / σ 2 = σ 02 ) = α/2
P ( W < c1 / σ 2 = σ 02 )= 1-α/2
Esempio 10
Sulla scorta di una lunga esperienza è stato calcolato lo scostamento quadratico medio
σ sulla variabile descritta dal tempo di anestesia relativamente a soggetti di sesso
maschile sottoposti ad uno specifico trattamento; tale scostamento è risultato pari a
0,25 ore. Lo stesso trattamento viene applicato ad un campione di 20 soggetti di sesso
femminile, riscontrando uno scostamento quadratico medio, nel tempo di anestesia,
pari a 0,32 ore.
Sapendo che i venti soggetti femminili sottoposti a trattamento presentano, nei
confronti dell'anestetico, le stesse condizioni dei soggetti maschili, si vuole spiegare
36
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
l'incremento riscontrato nella variabilità. In altri termini, ci si chiede se l'incremento
riscontrato sia da attribuire al sesso oppure a fattori aventi natura accidentale.
Il problema può essere formalizzato specificando l'ipotesi nulla e l'ipotesi
alternativa nei termini che seguono
H 0 : σ 2f = σ m2 = 0,25
H 0 : σ 2f > σ m2 = 0,25
dove σf sta ad indicare lo scostamento quadratico medio relativo alla popolazione di
sesso femminile, σm lo scostamento quadratico medio relativo alla popolazione di
sesso maschile.
Sotto l'ipotesi nulla, e cioè a condizione che l'ipotesi nulla sia vera, la variabile
casuale test
19 ⋅ S 2
w=
σ m2
dove
S2 =
1 20
(X i − X)2
∑
19 i =1
rappresenta la varianza calcolata sul campione di venti soggetti femminili, avrà una
distribuzione del tipo χ2 con 19 gradi di libertà. Relativamente allo specifico
campione si ha
w=
20 ⋅ 0,32 2
0,25 2
Se si fissa un livello di significatività nell'ordine del 5%, si può determinare,
sulla scorta delle tavole della distribuzione χ2, il valore critico c per il quale risulta
soddisfatta la relazione
P (W ≤ c) = 0,95
Poiché risulta essere c = 30,1, la zona di accettazione sarà data dall'intervallo
0 ___ 30,1, mentre la regione critica risulterà espressa dall'intervallo 30,1 ___ + ∞.
Stante tale situazione si rifiuta l'ipotesi nulla; si rifiuta, cioè, l'ipotesi che la differenza
riscontrata nella variabilità sia da attribuire al caso.
Se il livello di significatività viene fissato nell'ordine dell'1%, si deduce un valore
critico c = 36,2. In tal caso, e cioè al livello di significatività dell'1%, il valore
37
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
campionario ricadrebbe nella zona di accettazione della ipotesi nulla; verrebbe
pertanto attribuita al caso la differenza riscontrata.
Esempio 11
Una fabbrica di batterie di automobili dichiara che il proprio prodotto presenta una
2
variabilità nella durata (misurata dalla varianza) pari a 0,8 (σ = 0,8). Un campione
casuale di 16 batterie viene sottoposto a prova evidenziando una varianza corretta pari
a 1. Si vuole verificare, al livello di significatività del 5% (α = 0,05) se la varianza
nella durata del prodotto è superiore a 0,8.
La formulazione delle ipotesi per il problema in esame è
H 0 : σ 2 = 0,8
H 0 : σ 2 > 0,8
mentre la v.c. test di riferimento è
W =
(n − 1) ⋅ S 2
σ
2
~ χ n2−1
che, nell'universo dei campioni, ha una distribuzione del tipo χ2 con n - 1 gradi di
libertà.
Per α = 0,05 e (n – 1) = 15 gradi di libertà il valore critico risulta essere
χ 02,05 = 24,996 , pertanto la regola di decisione sarà (test unidirezionale): si accetta
H0 se il χ2 empirico è ≤ 24,996, si rifiuta H0 se il χ2 empirico è > 24,996.
Essendo χ 2 =
(n− 1) S 2
σ2
=
15 − 12
= 18,7 ≤ 24,996 si accetta l'ipotesi H0.
0,8
5.3.5 Test sulle frequenze
Volendo utilizzare la teoria del test delle ipotesi per risolvere un problema di verifica
d'ipotesi sulle frequenze relative (probabilità) di un particolare evento, si può procedere
come illustrato nelle pagine precedenti; si fissa cioè un livello α di significatività
(probabilità dell'errore di I tipo) e si individua poi la regione critica (di rifiuto
dell'ipotesi nulla formulata) che massimizza la potenza del test (probabilità di non
commettere un errore di II tipo).
Se la dimensione del campione è sufficientemente elevata per sottoporre a test
38
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
un'ipotesi su una probabilità si può fare ricorso alla distribuzione normale essendo
questa una approssimazione abbastanza buona della distribuzione binomiale per n
sufficientemente elevato e n p > 5, n q > 5, dove n rappresenta la dimensione
campionaria, p la probabilità dell'evento che interessa e q = 1-p la probabilità
contraria.
In particolare se X rappresenta il numero di successi in n prove bernoulliane
(prove indipendenti), la proporzione campionaria
p̂ =
X
n
ha una distribuzione approssimativamente normale con media p e varianza
p⋅ q
n .
Se si vuole quindi sottoporre a test una specifica ipotesi, al livello di
significatività α, del tipo H 0 : p = p 0 contro l'ipotesi alternativa H 0 : p > p 0 si può
fare ricorso alla variabile casuale normale standardizzata
Z =
dove
pˆ -p0
p0 ⋅ q0 / n
~ N (0,1)
q0 = 1-p0 . Si rifiuterà l'ipotesi se
p̂ > p0 + Zα
p0 ⋅ q0
n
pˆ -p0
p0 ⋅ q0 / n
> Zα
cioè se
dove Zα è il valore (punto critico) della distribuzione normale
standardizzata che ha alla sua destra l'α % dei casi.
Si noti che l'ipotesi nulla H 0 = p = p0 non specifica solo la media p0 della
distribuzione bernoulliana ma anche la varianza p0 ⋅ q0 .
Esempio 12
Si supponga di voler sottoporre a test l'ipotesi H 0 ≤
H0 >
2
3
contro l'ipotesi alternativa
2
disponendo di un campione di 200 osservazioni indipendenti che evidenzia
3
una frequenza relativa
p̂ =
150
= 0,75 .
200
Poiché sotto l'ipotesi nulla
H0, la
proporzione campionaria p̂ ha una distribuzione approssimativamente normale con
39
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
media p = 2/3 e varianza p ⋅ q / n = 1/900 , se si sceglie il livello di significatività
α = 0,05, il punto critico che delimita la regione critica sarà zα = 1,645 . Pertanto
l'ipotesi nulla H 0 : p = 2/3 dovrà essere rifiutata quando
p - 2/3
≥ 1,645
1 / 30
Cioè quando
p̂ ≥
Essendo
2
1
+ 1,645 ⋅
= 0,722
3
30
P̂ = 0,75 > 0,722, l'ipotesi nulla
H0 : p = 2 3
viene rifiutata al
livello di significatività del 5%.
Come illustrato nelle pagine precedenti essendo l'ipotesi alternativa composita
non sarà possibile determinare la potenza del test e il valore α = 0,05 il valore
massimo della probabilità dell'errore di I tipo. Se si specificasse l'ipotesi alternativa in
termini di un preciso valore numerico risulterebbe possibile, come chiarito in
precedenza, calcolare la potenza del test.
Nella tabella che segue, per α= 0,01 e α = 0,05, sono riportati i valori assunti
dalla funzione forza del test in corrispondenza di alcune particolari specifiche
dell'ipotesi alternativa.
40
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
α = 5%
P
p⋅q /
200
0,722 − p
p⋅ q / 200
α = 1%
potenza
0,744 − p
p⋅ q / 200
potenza
0,60
0,0346
3,517
0,000
4,170
0,000
0,65
0,0337
2,128
0,017
2,798
0,003
0,67
0,0332
1,557
0,059
2,238
0,012
0,69
0,0327
0,969
0,166
1,661
0,048
0,71
0,0321
0,364
0,358
1,069
0,142
0,73
0,0314
-0,264
0,604
0,455
0,325
0,75
0,0306
-0,625
0,822
-0,186
0,574
0,77
0,0297
-1,626
0,948
-0,865
0,806
0,79
0,0288
-2,372
0,991
-1,587
0,944
0,81
0,0277
-3,188
0,999
-2,373
0,991
0,83
0,0266
-4,071
1,000
-3,222
1,000
Tab. 3 - Potenza del test relativo all'ipotesi dell'esempio 12.
Ovviamente anche in riferimento alle proporzioni (probabilità) si possono
presentare casi di test d'ipotesi del tipo H 0 : p = p0 contro l'alternativa bidirezionale
H 1 : p ≠ p0 od anche H 0 : p0 ≤ p ≤ p1 contro l'alternativa H1: ( p < p0 ) ∪ ( p > p1 ).
Esempio 13
Si supponga di avere a che fare con una distribuzione bernoulliana e di voler
sottoporre a test l'ipotesi nulla H 0 : p = 0,5 al livello di significatività α = 0,05
Si ammetta, inoltre, di poter disporre di un campione di n = 100 osservazioni
indipendenti e di volere calcolare la potenza del test in riferimento a ciascuna delle
seguenti specifiche dell'ipotesi alternativa
a) H 1 : p = 0,55
b) H 1 : p = 0,60
41
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
c ) H 1 : p = 0,65
d ) H 1 : p = 0,70
e) H 1 : p = 0,75
Essendo sufficientemente elevata la dimensione campionaria e risultando,
inoltre, n p e n q superiori a 5, si può approssimare la distribuzione binomiale con la
distribuzione normale che, quando l’ipotesi nulla
H 0 : p = 0,5 è vera, ha media
µ = n⋅ p = 100 ⋅ 0,50 = 50 e varianza σ 2 = n⋅ p⋅ q = 100 ⋅ 0,5 ⋅ 0,5 = 25 .
Poiché
α = 0,05
si rifiuta l'ipotesi nulla
H 0 : p = 0,5
quando la
determinazione campionaria della variabile casuale normale standardizzata
Z=
X- n⋅ p
n⋅ p⋅ q
assume un valore superiore al punto critico c = 1,65 che è il valore che soddisfa la
relazione (quando l'ipotesi nulla è vera)
⎛ X- 50
⎞
≥ 1,65 ⎟ = 0,05
P⎜
⎝ 5
⎠
e in modo equivalente
P ( X ≥ 50 + 5 ⋅ 1,65 ) = 0,05
cioè
P ( X ≥ 58
)=
0,05
La potenza di un test è misurata dalla probabilità di rifiutare un'ipotesi H0
quando questa è falsa, si dovrà allora calcolare la probabilità X > 58 per ciascuna
specifica dell'ipotesi alternativa cioè
P ( X ≥ 58 / H 1 ) = 0,05
I valori della potenza del test per i vari casi richiesti sono riportati nella tabella
che segue
42
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
H1
m=np
σ =
n⋅ p ⋅ q
X −µ
σ
= Z
Potenza
p = 0,55
55
4,97
0,50
0,308
p = 0,60
60
4,90
-0,51
0,695
p = 0,65
65
4,77
-1,57
0,942
p = 0,70
70
4,58
-2,73
0,997
p = 0,75
75
4,33
-4,04
1,000
Tab. 4 - Valori della potenza del test
Esempio 14
Relativamente ad una distribuzione bernoulliana si vuole risolvere il problema di test
d'ipotesi
H 0 : p = 0,5
H1 : p = 2 / 3
al livello di significatività α= 0,01 e presupponendo la disponibilità di 36 osservazioni
campionarie indipendenti. Si vuole evidenziare, inoltre, la crescita della potenza del
test al crescere della dimensione campionaria considerando in particolare i valori n =
36, 64, 100, 144 e 196.
La distribuzione binomiale può essere approssimata dalla distribuzione normale
essendo, in tutti i casi considerati, la dimensione campionaria sufficientemente elevata
e np, nq maggiore di 5.
Per ciascuna specifica del valore n si calcola la media µ = n p e lo scostamento
quadratico medio σ = n⋅ p⋅ q in corrispondenza del valore p = 0,5
43
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
n
µ=np
36
18
3
64
32
4
100
50
5
144
72
6
196
98
7
σ = n⋅ p⋅q
Poiché il valore p specificato dall'ipotesi alternativa H1, è più elevato di quello
specificato dall'ipotesi nulla, al livello di significatività α = 0,01, rifiutiamo l'ipotesi
H0 quando la determinazione campionaria della variabile casuale normale
standardizzata assume un valore superiore al valore critico c = zα = 2,3 essendo
questo il valore che soddisfa la relazione
⎞
⎛ X- 18
P⎜
≥ 2,33 ⎟ = 0,01
⎝ 3
⎠
ed anche
P ( X ≥ 3 ⋅ 2,33 + 18
)=
0,01
da cui
P ( X ≥ 24,99
)=
0,01
I valori critici in corrispondenza degli altri valori di n sono
n = 64 ⇒ 4 ⋅ 2,33 + 32 = 41,32
n = 100 ⇒ 5 ⋅ 2,33 + 50 = 61,65
n = 144 ⇒ 6 ⋅ 2,33 + 72 = 85,98
n = 196 ⇒ 7 ⋅ 2,33 + 982 = 114,31
Per n = 36 la potenza del test deriva dalla relazione
24,99 - 24 ⎞
⎛ X- 24
P ( X ≥ 24,99 / H 1 ) = P ⎜
≥
⎟ = P ( Z ≥ 0,3498 ) = 0,36
2,83 ⎠
⎝ 2,83
Analogamente per gli altri valori di n.
41,32 - 42,67 ⎞
⎛
n = 64 ⇒ P ⎜ Z ≥
⎟ = P ( Z ≥ - 0,3581 ) = 0,64
3,77
⎝
⎠
44
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
61,65 - 66,67 ⎞
⎛
n = 100 ⇒ P ⎜ Z ≥
⎟ = P ( Z ≥ - 1,0658
4,71
⎝
⎠
)=
0,86
85,98 - 96 ⎞
⎛
n = 144 ⇒ P ⎜ Z ≥
⎟ = P ( Z ≥ - 1,7703 ) = 0,95
5,66 ⎠
⎝
114,31 - 130' ,67 ⎞
⎛
n = 196 ⇒ P ⎜ Z ≥
⎟ = P ( Z ≥ - 2,4788
6,60
⎝
⎠
)=
0,99
5.3.6 Test non parametrici
Nella esemplificazione di situazioni verifica di ipotesi statistiche sin qui trattate, in
presenza di campioni di modeste dimensioni, è stata ipotizzata la conoscenza della
forma analitica del modello facendo riferimento, nella generalità dei casi, alla
distribuzione normale. Ma capita spesso di dover procedere alla verifica d’ipotesi
statistiche non disponendo di informazioni sulla forma analitica del modello di
riferimento; in tale contesto, come si già avuto modo di anticipare, i test statistici
vengono detti non parametrici o distribution free.
Tra i test ricompresi in questa classe una posizione non marginale è occupata dal
test dei segni. Si fa ricorso ad un tale test quando si è interessato a sottoporre a test
l’ipotesi che la mediana, di una distribuzione i cui valori sono espressi almeno in scala
ordinale ma di forma non specificata analiticamente, assuma un particolare valore.
Se l’ipotesi che si vuol verificare è H 0 : µ e = µ e* contro l’ipotesi alternativa
a)
H 1 : µ e > µ e* ;
b)
H 1 : µ e < µ e* ;
c)
H 1 : µ e ≠ µ e* .
potendo disporre di un campione di osservazioni X = ( X 1 , X 2 ,....., X n ) si procede al
[
]
calcolo delle differenze X − µ e* = (X 1 − µ e* ), (X 2 − µ e* ),....., (X n − µ e* ) e si determina il
numero delle differenze positive Y + che, sotto l’ipotesi H 0 : µ e = µ e* , nell’universo dei
campioni ha distribuzione binomiale di parametro p =
1
. Pertanto la v.c. test da
2
prendere in considerazione è la binomiale relativa Y + / n e la procedura di test è quella
illustrata in precedenza.
Se la distribuzione dalla quale viene estratto il campione è una distribuzione
45
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
continua e simmetrica si può far ricorso ad un diverso test non parametrico (forse il
termine più appropriato in questa circostanza è quello di test semiparametrico), basato
sempre sui segni e sulla mediana, utilizzando le ulteriori informazioni disponibili di
simmetria e continuità. Il test, usualmente indicato come test dei ranghi con segno di
Wilcoxon, supera la critica rivolta al test dei segni che è quella di non tener conto del
valore numerico degli scarti tra il valore osservato ed il valore della mediana specificato
dall’ipotesi nulla.
Il problema di test che si vuol risolvere è lo stesso sopra considerato cosi come il
primo
passo
[
della
procedura
che
si
]
risolve
nel
calcolo
degli
scarti
X − µ e* = (X 1 − µ e* ), (X 2 − µ e* ),....., (X n − µ e* ) , al riguardo si deve comunque tener
presente che la condizione di simmetria della distribuzione comporta l’uguaglianza
della media aritmetica e della mediana, cioè µ = µ e . Il passo successivo consiste
nell’ordinare gli scarti in valore assoluto secondo una graduatoria crescente ed
attribuendo ad ogni scarto il relativo rango, si si distinguono poi tali ranghi tenendo
conto del loro segno Ri e -Ri ,si procede quindi alla somma dei ranghi positivi
W+ = ∑ Ri e negativi W− = ∑ Ri . La v.c. test da considerare di pende dalla specifica
dell’ipotesi alternativa:
•
W+ per H 1 : µ e < µ e*
•
W− per H 1 : µ e > µ e*
•
il più piccolo tra W+ e W− per H 1 : µ e ≠ µ e* .
Di seguito si riporta la tavola del test W.
46
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
Tavola del test dei ranghi con segno di WILCOXON (valori critici per α = 0,05 e α
= 0,01)
Dimensione campionaria n
H1 bidirezionale
H1 unidirezionale
α = 0,01
α = 0,05
α = 0,01
α = 0,05
6
--
0
--
2
7
--
2
0
3
8
0
3
1
5
9
1
5
3
8
10
3
8
5
10
11
5
10
7
13
12
7
13
9
17
13
9
17
12
21
14
12
21
15
25
15
15
25
19
30
16
19
29
23
35
17
23
34
27
41
18
27
40
32
47
19
32
46
37
53
20
37
52
43
60
21
42
58
49
67
22
48
65
55
75
23
54
73
62
83
24
61
81
69
91
25
68
89
76
100
Da rilevare che per n > 8, la distribuzione di W+ è approssimativamente normale
con media e varianza:
n( n + 1)
4
(
n
n + 1)(2n + 1)
σ2 =
24
µ=
47
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
inoltre, la potenza del test di Wilcoxon è maggiore di quella del test dei segni sopra
illustrato e, ovviamente, è minore di quella del test t di Student considerato in
precedenza.
5.3.7 Determinazione della dimensione del campione
Nella trattazione fino ad ora svolta è stata considerata fissa la dimensione
campionaria, si presentano però spesso situazioni in cui non ci si limita alla fissazione
del solo livello di significatività avendo anche interesse a che la potenza del test non sia
inferiore ad una certa soglia. Per poter conseguire un tale obiettivo si potrà intervenire
convenientemente sulla dimensione campionaria.
Esempio 15
Si consideri, il caso in cui, in riferimento a una distribuzione normale, si voglia
sottoporre a test l'ipotesi nulla
H 0 :µ = µ 0
contro l'ipotesi alternativa H 1 : µ = µ 1 > µ0 al livello di significatività α= 0,05 e in
modo tale che la potenza del test γ
γ
( H1 ) =
( H1 )
non sia inferiore a 0,90. Si ricorda che,
1 - β ( H 1 ) , cioè, che la potenza di un test rappresenta la probabilità di non
commettere un errore di II tipo.
Si rifiuta l'ipotesi nulla quando per la media campionaria vale la disuguaglianza
x ≥ µ 0 + 1,645 ⋅
σ
n
Poiché il vincolo sulla potenza impone il rispetto della relazione
(
P X ≥ µ 0 + 1,645 ⋅ σ /
)
n ≥ 0,90
od anche
⎛ X −µ 1
µ −µ
P ⎜⎜
≥ 0 1 + 1,645
σ / n
⎝σ / n
⎞
⎟⎟ ≥ 0,90
⎠
e tenendo presente che il valore Z della variabile casuale normale standardizzata che
ha alla sua destra il
90%
dei casi è pari a - 1,282, dovrà essere soddisfatta
l'uguaglianza
µ 0 −µ 1
+ 1,645 = - 1,282
σ / n
48
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
da cui
n =
( 1,645 + 1,282 ) 2
[ ( µ 1 −µ 0 ) / n ] 2
=
[(µ
8,567
1
−µ 0 ) /
n
]
2
se n non è intero si opera una approssimazione per eccesso.
Per µ 0 = 100 ,µ 1 = 110 e σ 2 = 400 si avrà n = 34, 268, si fissa pertanto la
dimensione campionaria n = 35.
5.4 Confronto tra campioni
Nelle pagine precedenti è stato analizzato il problema della verifica di ipotesi statistiche
sulla scorta di dati concernenti singoli campioni. Più specificamente, si è discusso della
possibilità di utilizzazione dei dati campionari per la determinazione della struttura
generale di una particolare popolazione rappresentata mediante un modello
probabilistico, di forma nota ma caratterizzato da parametri incogniti.
Verrà analizzato ora il problema del confronto tra due campioni, avendo come
fine l'accertamento delle possibilità di una loro attribuzione alla stessa popolazione o a
popolazioni aventi un parametro caratteristico di uguale valore.
Relativamente a due gruppi di osservazioni campionarie, anche se generati da una
stessa popolazione, si riscontra generalmente una qualche differenza, il problema da
risolvere sarà quindi quello di accertare l'eventuale significatività statistica di una tale
differenza. Evidentemente, ogni conclusione favorevole alla significatività di una
differenza, comporterà l'attribuzione dei due campioni, cui la differenza si riferisce, a
popolazioni distinte.
Nei punti seguenti le considerazioni saranno limitate in modo quasi esclusivo al
problema del confronto di medie relative a campioni estratti da popolazioni normali.
5.4.1 Confronto tra medie
Si supponga di avere a disposizione un gruppo di m osservazioni campionarie casuali
X = ( X 1 , X 2 ,....., X m ) relative ad una popolazione normale X di media incognita µx e
varianza nota σ x2
ed un secondo gruppo di n osservazioni campionarie casuali
49
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
Y = (Y1 , Y2 ,....., Yn ) relative ad una popolazione normale Y di media incognita µy e
varianza nota σ y2 . Si supponga, inoltre, che le due v.c. siano indipendenti e di volere
stabilire se la differenza eventualmente riscontrata tra le due medie campionarie x e y
sia da attribuire al caso o al fatto che le due medie µx e µy, delle popolazioni che
hanno generato i due campioni, sono diverse; si vuole in altri termini decidere per
l'eventuale significatività statistica della differenza.
Il problema di cui sopra può essere formalizzato attraverso una specificazione
dell'ipotesi nulla e dell'ipotesi alternativa seguendo la linea di ragionamento descritta
nelle pagine precedenti. Le possibili formulazioni, strettamente legate alla problematica
dell'analisi che si sta conducendo, portano alla considerazione dei tre casi seguenti:
Caso a)
H0 : µx = µy
H1 : µx > µy
Caso b)
H0 : µx = µy
H1 : µx < µy
Caso c)
H0 : µx = µy
H1 : µx ≠ µy
La variabile casuale
Z x−y =
X- Y
σ x2 / m + σ y2 / n
ha, quando l'ipotesi nulla è vera, legge di distribuzione normale standardizzata. Avendo
individuato la legge di distribuzione di una funzione (quella che interessa) degli
elementi campionari, sarà facile definire la regione critica e quella di accettazione per la
risoluzione dei problemi indicati. Infatti, poiché nell'espressione sopra riportata
compare la differenza tra le due medie campionarie, sarà facile l'estensione di quanto
detto a proposito di una singola media al caso presente.
I valori critici nei tre casi proposti si derivano facilmente dalle relazioni:
Caso a)
P ( Z > c / µx = µy ) = α
si accetta l'ipotesi H0 se z < c, si rifiuta altrimenti:
Caso b)
P ( Z <- c / µx = µy ) = α
50
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
si accetta l'ipotesi H0 se z > - c, si rifiuta altrimenti;
Caso c)
P ( Z < - c / µx = µy ) = α/2
si accetta l'ipotesi H0 se - c < z < c, si rifiuta altrimenti.
Nei tre casi considerati z rappresenta la specifica determinazione della variabile
casuale normale standardizzata Z.
Nelle indagini sperimentali ove i test statistici vengono applicati regolarmente per
lunghi periodi di tempo, non risulta difficile una misura precisa della variabilità dei
risultati; in tali casi potrà essere applicata la teoria sopra esposta, ogni qual volta si
voglia procedere ad un confronto fra medie, attraverso un semplice ricorso alle tavole
della distribuzione normale standardizzata. Va rilevato però che sono molto più
frequenti i casi in cui la variabilità risulta essere anch'essa, oltre i valori medi, una
incognita del problema.
Esempio 16
Per un campione casuale di 120 studenti dell'università di Firenze si rileva un'età
media di 20,2 anni ed una varianza (campionaria corretta) pari a 1,44. Per un
campione casuale di studenti dell'università di Roma i valori riscontrati sono invece 21
anni e 2,25. Prefissando una probabilità di errore di I tipo a livello α = 0,05, si vuole
verificare statisticamente l'uguaglianza nell'età media tra gli studenti dei due Atenei.
Se con µx si indica l'età media degli studenti dell'Università di Firenze e con µy
l'età media degli studenti dell'Università di Roma il problema di test da risolvere è:
H0 : µx = µy
H1 : µx ≠ µy
Essendo le dimensioni campionarie sufficientemente elevate si può ritenere
accettabile la congettura che la variabile casuale campionaria
( X- Y ) - ( µ
x
-µ y )
S x- y
dove X e Y sono le due medie campionarie e
Sx− y =
S x2 / m + S y2 / n
( S x2 e S y2 le due varianze campionarie corrette) ha, nell'universo dei campioni, una
51
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
distribuzione approssimativamente normale e può pertanto essere utilizzata quale v.c.
test.
La regione di accettazione di H0 resta definita dall'intervallo -1,96 |–| 1,96
mentre la regione di rifiuto è data dai due intervalli -∞ |–| -1,96 e 1,96 |–| +∞.
Essendo la determinazione della variabile casuale test sotto l'ipotesi H0 pari a
x− y
=
sx − y
20,2 - 21
1,2 2 / 120 + 1,5 2 / 100
= - 4,30
e quindi non compresa nell'intervallo -1,96 |–| 1,96 si rifiuta l'ipotesi formulata di
uguaglianza nell'età media degli studenti dei due Atenei al livello di significatività del
5%.
Esempio 17
Un recente rapporto dell'Istituto Italiano di Ricerche sulla Popolazione afferma che
l'età media al matrimonio delle persone che non conseguono il titolo di studio di scuola
media superiore è inferiore a quello di coloro che conseguono tale titolo. Si vuole
verificare, al livello di significatività del 5% (α = 0,05), tale affermazione avendo a
disposizione due campioni casuali di 100 individui delle due categorie ed avendo
riscontrato: per coloro che non posseggono un titolo di scuola media superiore un'età
media al matrimonio pari a 22,5 anni e una varianza (campionaria corretta) pari a
1,96, mentre quelli che posseggono il titolo hanno evidenziato un'età al matrimonio di
23 anni e una varianza (campionaria corretta) pari a 3,24.
Se con µx e µy si indica l'età media al matrimonio, rispettivamente, di coloro
che non posseggono il titolo di scuola media superiore e di coloro che lo posseggono, il
problema di test (unidirezionale) da risolvere è
H0 :µ x ≥ µ y
H1 :µ x < µ y
Essendo la dimensione campionaria sufficientemente elevata, la v.c. campionaria
( X- Y ) - ( µ
x
-µ y )
S x- y
dove X e Y sono le medie campionarie, S X −Y =
S x2 / m + S y2 / n , S x2 e S y2 sono
le due varianze campionarie corrette, ha, nell'universo dei campioni, distribuzione
52
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
approssimativamente normale. Pertanto il valore critico -Zα = -1,64 individua la
regione critica nell'intervallo –1,64 —| +∞, mentre la regione di accettazione è definita
da -∞ |— -1,64.
La determinazione empirica della variabile casuale test sotto l'ipotesi nulla H0 è
z =
x - y- 0
=
s x- y
22,5 - 23
1,4 / 100 + 1,8 / 100
2
2
=
- 0,5
= - 2,18
0,229
che risulta inferiore a -1,64. Si rifiuta pertanto l'ipotesi H0 : µx ≥ µy, concludendo che
l'età media al matrimonio di coloro che non hanno conseguito il diploma di scuola
media superiore è più bassa dell'età media al matrimonio di coloro che hanno
conseguito il titolo.
Si indichino con X e
due variabili casuali normali di medie incognite µx e
µy e di varianze pure incognite σx2 = σy2 = σ2. Supponendo di disporre di due
gruppi di osservazioni casuali indipendenti sulle variabili X e Y, si possono risolvere i
problemi a), b) e c) trattati al punto precedente facendo ricorso alla variabile casuale t
di Student anziché alla normale standardizzata. Infatti, essendo la varianza comune
alle due popolazioni incognita, si deve sostituire, nella formula precedente, a σ2 una
sua stima. Così operando si ottiene la variabile casuale
X −Y
T=
S 1/m + 1/n
~ t m+ n−2
dove S2 rappresenta la stima di σ2 ottenuta combinando opportunamente (media
aritmetica ponderata delle varianze campionarie) le informazioni disponibili. In
particolare si ha
S
2
=
(m - 1) S x2 + (n - 1) S y2
m+n-2
per m e n dimensioni dei due campioni e
S x2 =
1 m
1 n
(xi − x ) 2 ; S y2 =
(yi − y) 2
∑
∑
m − 1 i =1
n − 1 n −1
Si controlla facilmente come la variabile casuale T, definita nella relazione
sopra scritta, deriva dal rapporto fra una variabile casuale normale standardizzata e la
radice di una variabile casuale χ
2
divisa per i propri gradi di libertà. Tale variabile
avrà legge di distribuzione del tipo t di Student con m+n-2 gradi di libertà, poiché le
53
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
due variabili poste a rapporto sono indipendenti.
I valori critici c per i tre casi a), b) e c), considerati al punto precedente,
derivano dalle relazioni
P (T > c / µx = µy) = α
Caso a)
si accetta l'ipotesi H0 se t < c, si rifiuta altrimenti:
P (T < - c / µx = µy) = α
Caso b)
si accetta l'ipotesi H0 se t > - c, si rifiuta altrimenti:
P (T < - c / µx ≠ µy) = α/2
Caso c)
si accetta l'ipotesi H0 se - c < t < c, si rifiuta altrimenti.
Dopo aver individuato il valore critico
c, mediante l'uso delle tavole della
distribuzione t, relativamente al caso che interessa (uno dei tre sopra considerati), si
porrà a confronto tale valore critico con la determinazione campionaria specifica t
della variabile casuale T.
Esempio 18
Si consideri la seguente tabella dove vengono riportati i risultati relativi a campioni di
osservazioni su due diverse famiglie di mycelio fungino della stessa specie.
Famiglia A
Famiglia B
246,3
246,2
239,2
247,1
257,3
244,9
Tab. 5 - Peso secco in mg. di mycelio fungino relativo a due famiglie appartenenti alla
stessa specie
Relativamente al fenomeno che si sta analizzando si può ipotizzare
ragionevolmente la n0rmalità delle distribuzioni del peso e, trattandosi di funghi della
54
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
stessa specie, anche un'uguale variabilità dei risultati in corrispondenza delle due
famiglie; in tal caso ci si trova ad operare su due campioni estratti da popolazioni
normali di uguale varianza (incognita).
Si supponga di voler verificare statisticamente l'ipotesi (di uguaglianza fra il peso
medio, µx, dei funghi appartenenti alla famiglia A ed il peso medio µy, dei funghi
appartenenti alla famiglia B) Ho : µx = µy contro l'ipotesi alternativa H1 : µx ≠ µy al
livello di significatività α = 0,05. La procedura di test da applicare dovrà essere
quindi di tipo bidirezionale.
Per quanto detto sopra, il valore critico c (c > 0), suddividerà lo spazio
campionario (-∞ |—| +∞) relativo alla variabile casuale test T di riferimento, in una
zona di accettazione costituita dall'intervallo -c |—| c e in una zona di rifiuto costituita
dagli intervalli -∞ |—| -c , c |—| +∞.
Sulle tavole della distribuzione t di Student, in corrispondenza a 4 gradi di
libertà, si individua il valore c che soddisfa la relazione
P (T < - c/µx = µy) = 0,025
che risulta essere 2,78. Tale valore critico c = 2,78 dovrà essere posto a confronto con
la determinazione specifica della variabile casuale T.
Dalle informazioni campionarie derivano i seguenti valori
x = 247,6 , y = 246,1, s x2 = 83,17
, s y2 = 1,22
e quindi S2 = 42,195 . La derivazione specifica della variabile casuale T sarà pertanto
t=
247,6 − 246,1
42,195 ⋅ 2 / 3
=
1,5
= 0,2828
5,3038
poiché
t = 0,28 < c = 2,78
l'ipotesi nulla H0 : µx = µy non viene rifiutata al livello di significatività del 5%
ricadendo la determinazione t di T nell'intervallo -c |—| c. Tale fatto, comporta
sostanzialmente l'accettazione dell'ipotesi che i due campioni provengano da una stessa
popolazione, ed una attribuzione delle differenze campionarie riscontrate a fattori
aventi carattere puramente accidentale.
Nell'esempio specifico, potrebbe interessare una diversa ipotesi alternativa; ad
esempio l'ipotesi che il peso medio dei funghi appartenenti alla famiglia A sia più
55
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
elevato del peso medio dei funghi appartenenti alla famiglia B (H1 : µx > µy). In tale
eventualità, allo stesso livello α = 0,05 di significatività, risulta un valore critico
c = 2,13 che comporta come nel caso di ipotesi alternativa bidirezionale, una
accettazione dell'ipotesi nulla H0 : µx = µy.
Esempio 19
Si supponga di dover decidere sulla durata di due diverse marche di lampadine di
ugual prezzo avendo verificato la durata di 100 lampadine di ciascuna marca e
riscontrato i seguenti valori campionari: medie campionarie x = 1.180, y = 1.160,
varianze campionarie corrette s x2 = 14.400, s x2 = 1.600. La decisione deve essere
presa al livello di significatività α = 0,05.
Il problema decisionale può essere impostato nei seguenti termini
H0 : µ x = µ y
H1 : µ x ≠ µ y
o, in modo equivalente
H0 : µ x − µ y = 0
H1 : µ x − µ y ≠ 0
dove µ x e µ y rappresentano la durata media delle lampadine, rispettivamente, della
prima e della seconda marca.
Per risolvere il problema di test d'ipotesi si può fare riferimento alla
distribuzione normale essendo sufficientemente elevata la dimensione campionaria. La
X −Y
differenza tra le due medie campionarie
avrà, pertanto, nell'universo dei
campioni, una distribuzione approssimativamente normale con media
µ x −µ y
e
varianza
σ x2− y = σ x2 / m + σ y2 / n
Al livello di significatività α = 0,05 , i valori critici che individuano la regione
di accettazione sono c1 = - zα/
2
= - 1,96 e c 2 = zα/
2
= 1,96 . Inoltre, sotto l'ipotesi
nulla H0 il valore campionario assunto dalla variabile casuale test è pari a
56
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
z=
1180 − 1160
(14400 + 1600 ) / 100
= 1,58
Essendo il valore 1,58 incluso nell'intervallo - 1,96 |—| 1,96 si accetta l'ipotesi
di uguale durata delle due diverse marche di lampadine, attribuendo a fattori
accidentali la differenza di durata riscontrata nei due campioni.
5.4.2 Confronto per dati appaiati
Nelle pagine precedenti è stato considerato il problema del confronto fra due campioni
nell'ipotesi di indipendenza assoluta tra gli elementi che li compongono; nel lavoro di
ricerca può accadere però di dover analizzare situazioni nelle quali una tale condizione
non risulta completamente soddisfatta. Può accadere cioè che tra le osservazioni,
relative ai due campioni che devono essere sottoposti a confronto, esista una qualche
relazione in modo tale da rendere possibile un confronto diretto fra ogni osservazione di
un campione con la controparte dell'altro campione. Un esempio classico è
rappresentato dal caso in cui le coppie di osservazioni siano relative ad una stessa unità
statistica (la stessa unità sperimentale prima delle cura e dopo la cura, il fatturato di una
stessa azienda prima e dopo una specifica campagna pubblicitaria, anche se vanno
naturalmente riferite, almeno a priori, a due differenti popolazioni.
Si indichi con ( Xi , Yi ) l'i-esimo elemento di un insieme costituito da n coppie
di osservazioni, e si assuma che la differenza Vi = Xi - Yi (i = 1, 2,...,n) rappresenti
un'unità campionaria casuale relativa ad una popolazione normale di media µv e
varianza σ v2 . Allora la variabile casuale
T=
dove : V =
V − µv
Sv / n
1 n
∑Vi = X − Y
n i =1
~ t n −1
n
e Sv2 = ∑ (Vi − V ) 2 /( n − 1)
i =1
ha, nell'universo dei campioni, una distribuzione del tipo t di Student con n-1 gradi di
libertà.
Utilizzando la variabile casuale test T espressa nella formula sopra scritta sarà
possibile sottoporre a test l'ipotesi H 0 : µ v = 0 , contro un'ipotesi alternativa
bidirezionale o unidirezionale, seguendo di pari passo la procedura esposta al punto
57
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
precedente.
Esempio 20
Si supponga di voler confrontare due diversi metodi di misura della percentuale di
amido presente in un particolare tipo di patate. Si fissa a tal fine un livello di
significatività α = 0,05 e si effettuano le due misurazioni su sedici patate. I risultati
dell’operazione di misura, e le differenze riscontrate in ciascuna patata, sono riportati
nella tabella che segue
n.progressivo
Percentuale di amido
delle patate
metodo di mis A. metodo di mis. B.
(x)
Differenze
(y)
1
21,7
21,5
0,2
2
18,7
18,7
0,0
3
18,3
18,3
0,0
4
17,5
17,4
0,1
5
18,5
18,3
0,2
6
15,6
15,4
0,2
7
17,0
16,7
0,3
8
16,6
16,9
-0,3
9
14,0
13,9
0,1
10
17,2
17,0
0,2
11
21,7
21,4
0,3
12
18,6
18,6
0,0
13
17,9
18,0
-0,1
14
17,7
17,0
0,1
15
18,3
18,5
-0,2
16
15,6
15,5
0,1
Tab. 6 - Percentuale di amido presente in 16 patate
Dai dati della tabella si ottiene
58
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
v = 0,075 ; s v = 0,17
ne risulterà pertanto una determinazione campionaria della variabile casuale T pari a
t =
0,075 ⋅ 4
= 17
0,17
Se interessa sottoporre a test l'ipotesi nulla H 0 : µ v = 0 contro l'ipotesi alternativa
H 1 : µ v ≠ 0 (che sono equivalenti a H0 : µx = µy e H1 : µx ≠ µy), dobbiamo
ricercare il valore critico c che soddisfa la relazione
P ( -c ≤ T ≤ c) = 0,95
Dalle tavole della distribuzione t di Student, in corrispondenza a 15 gradi di
libertà, risulta
c = 2,131
Essendo t = 1,7 < c = 2,131, si deve accettare la ipotesi di uguaglianza tra i due
metodi di misura della percentuale di amido nelle patate.
Esempio 21
I corsi per la lettura veloce dei testi sono ormai abbastanza popolari e diffusi. Si
supponga che una particolare azienda di fornitura di servizi abbia fatto partecipare
dieci suoi dipendenti, scelti casualmente, ai suddetti corsi e che abbia registrato i
seguenti risultati
59
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
Impiegato
Valutazione capacità
Valutazione capacità di
di lettura dopo il corso
lettura prima del corso
1
221
211
2
231
216
3
203
191
4
216
224
5
207
201
6
203
178
7
201
188
8
179
159
9
179
177
10
211
197
La valutazione della capacità di lettura risulta da una combinazione della
velocità e della comprensione del testo letto.
Cosa si può concludere riguardo all'efficacia del corso?
La valutazione delle capacità di lettura è stata effettuata sugli stessi individui
prima e dopo la partecipazione al corso, si tratta perciò di dati appaiati del tipo (xi, yi),
dove yi rappresenta la valutazione dopo la partecipazione al corso mentre xi la
valutazione prima della partecipazione. Se si indicano con µy e µx le valutazioni
medie teoriche relative alle due situazioni (prima e dopo il corso) configurate, il
problema di verifica d'ipotesi ha la seguente formulazione
H0 : µ x = µ y
H1 : µ x > µ y
e può essere risolto facendo riferimento alla variabile casuale test
T=
V − µv
Sv / n
~ t n −1
dove
V =
1 n
∑ ( Yi − X i ); µv =µ x − µ y
n i =1
60
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
Sv =
1 n
∑ [(Yi − X i ) − V ] 2
n − 1 i =1
che, nell'universo dei campioni, ha distribuzione t di student con n-1 gradi di libertà.
Sotto l'ipotesi H0, per 10-1 = 9 gradi di libertà e al livello di significatività
α = 0,01, il punto critico (test unidirezionale) è t = 2,82. La regola di decisione è
quello di rifiutare l'ipotesi H0 se il t empirico è ≥ 2,82 accettare l'ipotesi se il t
empirico è inferiore a 2,82. Poiché v = 10,9; sv = 9,28 il t empirico
t=
v
sv / 10
=
10 ,9
9 ,28 / 10
= 3,715
è maggiore di 2,82 ,si rifiuta, pertanto, l'ipotesi d'uguaglianza con una probabilità
d'errore del 5%. Si rifiuta cioè l'ipotesi che la partecipazione al corso non abbia
influenza sulla capacità di lettura degli individui che ne fruiscono.
Va rilevato che per la risoluzione dei problemi di confronto considerati nei due
esempi precedenti si poteva fare riferimento, presupponendo l'indipendenza dai due
campioni, alla variabile casuale test T; in tal caso la stima della varianza incognita σ2
(σ
2
x
)
= σ y2 = σ 2 si poteva ottenere, come abbiamo visto, attraverso una combinazione
delle stime calcolate sui singoli campioni. Va però osservato che il test t applicato alle
coppie di osservazioni, presenta il vantaggio d'eliminare l'influenza di fattori estranei in
quanto essi, avendo lo stesso effetto su ciascuna unità campionaria, verrebbero a
compensarsi nelle differenze vi. Va inoltre detto che la procedura di test basata sulla
singola osservazione, almeno così come è stata esposta, parte dall'assunto che i dati
campionari derivino da popolazioni con identica varianza mentre la procedura di test
esposta in questo punto non richiede necessariamente il soddisfacimento della
condizione di uguaglianza delle varianze.
Nel caso in cui sia soddisfatta la condizione ( σ 2x = σ 2y = σ 2 ) e si abbia ragione di
ritenere che i risultati sperimentali non siano influenzati da fattori estranei (campioni
indipendenti), è da preferire la procedura di test esposta al punto precedente. Infatti, con
una tale procedura si opera disponendo di (2n-2) gradi di libertà, il che implica una
potenza del test, rispetto alla potenza del test svolto in questo punto che è basato su
(n-1) gradi di libertà, tanto più elevata quanto più piccola è la dimensione del campione.
61
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
Una logica estensione di quanto sopra detto risulta essere l'analisi del problema
relativo al confronto tra varianze di popolazioni normali.
Si ammetta di poter disporre di due campioni di osservazioni indipendenti, il
primo X 1 , X 2 ,...., X n , relativo alla variabile casuale normale X di media µ x
e
varianza σ x2 ; il secondo, Y1 ,Y2 ,....,Yn relativo alla variabile casuale normale Y di
media µ y e varianza σ 2y .
La variabile casuale espressa dal rapporto tra le due varianze campionarie
F =
S x2
S y2
avrà nell'universo dei campioni, quando σ x2 = σ 2y , legge di distribuzione del tipo F
con (m - 1) e (n - 1) gradi di libertà. Infatti se l'ipotesi H 0 :σ x2 = σ y2 è vera si ha
(m− 1) S x2 / (m- 1)
σ x2
S x2
=
(n− 1) S y2 / (n- 1) S y2
σ y2
ma nel primo membro dell'uguaglianza si è istituito un rapporto tra i due variabili
casuali indipendenti del tipo χ
2
divise per i rispettivi gradi di libertà; come già detto
tale rapporto dà luogo a una variabile casuale F.
Se si vuole quindi risolvere il problema espresso dalle ipotesi
H 0 : σ 2x = σ 2y
H 1 : σ x2 > σ y2
basterà fissare il livello di significatività α , e determinare poi il valore critico c che
bipartisce l'intervallo 0
+ ∞ (ricorda che la variabile casuale F è definita in
tale intervallo) in modo che sia
(
)
P F ≥ c / σ x2 = σ y2 = α
Si accetta l'ipotesi nulla H 0 :σ x2 = σ y2 se la determinazione f della variabile casuale F,
relativa al campione specifico, risulta inferiore al valore critico, si rifiuta altrimenti.
Esempio 22
62
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
Un campione di 20 ragazzi e di 15 ragazze è stato sottoposto a una prova d'esame. La
votazione media dei ragazzi è stata 78/100, mentre quella delle ragazze è stata 84/100;
la variabilità dei risultati, misurata dallo scostamento quadratico medio corretto, è
stata, rispettivamente, pari a 6/100 per i ragazzi e 8/100 per le ragazze. Si vuol
sottoporre a test l'ipotesi di uguaglianza delle varianze σ x2 e σ 2y nelle due popolazioni
contro l'ipotesi alternativa
σ x2 < σ 2y , al livello di significatività
α = 0,05,
presupponendo la normalità delle due distribuzioni.
Il problema di test d'ipotesi può essere formulato nei seguenti termini
H 0 : σ x2 = σ y2
H1 = σ x2 < σ y2
Poiché le variabili casuali
S x2 ( m − 1 )
σ x2
e
S y2 ( n − 1 )
σ y2
dove m ed n rappresentano le dimensioni campionarie, S x2 e S y2 le varianze
campionarie corrette, hanno nell'universo dei campioni distribuzione del tipo χ2 con,
rispettivamente, (m - 1) ed (n - 1) gradi di libertà ed essendo i due campioni
indipendenti, la variabile casuale
(m − 1) S x2 / (m-1)
σ x2
(n − 1) S y2 / (n-1)
=
2
S x2 σ y
⋅
~ Fm −1.n −1
S y2 σ x2
σ y2
è distribuita secondo una F di Fisher-Snedecor con (m-1) e (n-1) gradi di libertà.
Sotto l'ipotesi nulla
H 0 : σ x2 = σ y2 , cioè quando l'ipotesi nulla è vera, la variabile
casuale diventa
S x2
F = 2
Sy
Il valore critico che definisce la zona di accettazione al livello α = 0,05
di
significatività è c = Fα = 2,26 , che rappresenta la particolare determinazione della
variabile casuale F, con 15-1 = 14 e 20-1 = 19 gradi di libertà e che ha alla sua
destra il 5% dei casi.
63
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
Essendo il valore campionario
82
F = 2 = 1,78
6
inferiore al valore critico 2,26 si accetta l'ipotesi di uguale varianza attribuendo a
fattori accidentali la differenza riscontrata nel campione.
Esempio 23
Lo scostamento quadratico medio dello spessore di una particolare lamina metallica
già in commercio è sufficientemente ridotto il che consente un suo facile utilizzo nella
fase di assemblaggio della componente stessa. Un nuovo produttore di lamine
metalliche afferma che il suo prodotto, offerto ad un prezzo inferiore, presenta una
variabilità dimensionale non superiore a quello già presente nel mercato.
Due campioni casuali di 100 lamine dei due prodotti vengono sottoposti a
misurazione evidenziando i seguenti risultati
S
2
x
=
100
∑ ( x − x)
i =1
2
i
/ 99 = 0,041
per il prodotto X già presente sul mercato,
S y2 =
100
∑(y
i =1
− y ) / 99 = 0,058
2
i
per il nuovo prodotto Y.
Si chiede se risulta conveniente procedere all'acquisto del nuovo prodotto al
livello di significatività del 5%.
Le ipotesi per il problema sono
H 0 : σ 2x ≤ σ 2y
H 1 : σ x2 > σ y2
La variabile casuale test di di riferimento
(m− 1) S x2 / (m- 1)
2
σ x2
S x2 σ y
=
⋅
(n− 1) S y2 / (n- 1) S y2 σ x2
σ y2
ha, nell'universo dei campioni una distribuzione del tipo F di Fisher-Snedecor con
(m - 1) e (n - 1) gradi di libertà.
64
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
Nel caso specifico, e sotto l'ipotesi H0 (cioè quando l'ipotesi nulla all’estremo
dell’intervallo di definizione H 0 : σ 2x = σ 2y è vera), si ha il valore critico c = 1,39.
La regola di decisione è quella di rifiutare l'ipotesi H0 se l'F empirico è
superiore a 1,39 mentre di accettare l'ipotesi se l'F empirico è inferiore a 1,39.
Essendo F =
0,0041
= 0,7069 < 1,39 si accetta l'ipotesi H0 concludendo che,
0,0058
avendo una probabilità di sbagliare del 5%, la variabilità nello spessore delle nuove
lamine non è inferiore o uguale a quello delle vecchie lamine e non si procede al
cambiamento del fornitore.
5.4.3 Confronto tra proporzioni
Capita spesso di dover affrontare situazioni in cui interessa accertare se la
proporzione di individui o oggetti in due popolazioni distinte siano uguali o diverse. La
percentuale degli elettori che voterà per il PDS alla prossima consultazione elettorale
sarà la stessa in Toscana e in Emilia Romagna? la percentuale dei bambini vaccinati che
contrae la poliomielite è inferiore a quella dei bambini non vaccinati? ecc. Per poter
rispondere a tali quesiti si effettua una rilevazione campionaria in ciascuna delle
popolazioni di interesse (elettori emiliani ed elettori toscani, bambini vaccinati e
bambini non vaccinati, ecc) e le proporzioni riscontrate nei campioni vengono poste a
confronto.
Le osservazioni campionarie sono variabili di tipo bernoulliano potendo assumere
soltanto i valori 0 (non vota per il PDS) ed 1 (vota per il PDS). Nella prima popolazione
gli indici caratteristici sono µ x = p x e σ x2 = p x ⋅ q x , mentre nella seconda popolazione
si ha µ y = p y
e σ 2y = p y ⋅ q y , dove, naturalmente, px è la probabilità di successo
(voterà per il PDS, non contrarrà la poliomielite, ecc.) nella prima e nella seconda
popolazione.
L'ipotesi nulla può assumere la forma
H 0 : px = p y
contro l'ipotesi alternativa
H 1 : px ≠ p y
(ipotesi bidirezionale)
od anche
65
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
H 1 : px < p y
(ipotesi unidirezionali)
H 1 : px > p y
Se si suppone di disporre, rispettivamente, di m rilevazioni campionarie dalla
prima popolazione e n dalla seconda popolazione, la variabile casuale campionaria
p̂ x − p̂ y , cioè la differenza tra le proporzioni riscontrate nei due campioni indipendenti
avrà nell'universo dei campioni distribuzione di tipo binomiale con media p x − p y e
varianza σ x2 / m + σ y2 / n = p x ⋅ q x / m + p y ⋅ q y / n .
Sotto l'ipotesi nulla H 0 : p x = p y = p , cioè se l'ipotesi nulla è vera, la variabile
casuale differenza tra proporzioni campionarie avrà media nulla e varianza
σ p̂2x − p̂ y = p⋅ q ( 1 /m + 1 /n ) .
Se la dimensione di due campioni è sufficientemente elevata la distribuzione
binomiale può essere approssimata dalla distribuzione normale. Pertanto, sotto l'ipotesi
nulla H 0 : p x = p y = p , la variabile casuale campionaria
Z p̂ x − p̂ y =
p̂ x − p̂ y
p̂⋅ q̂ ( 1 /m + 1 /n
)
dove, p̂ = ( a + b ) / ( m+ n ) , q̂ = 1 - p̂ ed a e b rappresentano il numero di successi
riscontrati, rispettivamente, nel primo e nel secondo campione, ha una distribuzione
normale standardizzata.
La procedura di test da adottare è quella illustrata in precedenza, quando si è fatto
riferimento al problema del confronto tra medie per popolazioni normali con identica
varianza incognita. Da sottolineare che in questo caso non si utilizza la distribuzione t
di Student essendo, per assunzione, elevate le dimensioni campionarie.
Esempio 24
Effettuata un'indagine di mercato riguardo al gradimento di un nuovo prodotto, due
differenti gruppi sociali si sono espressi, rispettivamente, a favore nel 45% e nel 55%
dei casi.
Avendo inoltre accertato una variabilità nelle risposte (misurata attraverso lo
scostamento quadratico medio corretto) pari, rispettivamente 0,04 e 0,03 e sapendo che
66
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
i due gruppi costituenti il campione degli intervistati sono molto numerosi, si vuole
verificare statisticamente, al livello di significatività del
10%, l'ipotesi che la
percentuale di soggetti favorevole al nuovo prodotto è più elevata nel secondo gruppo
rispetto a quelle del primo gruppo.
Se con p x e p y si indicano le due percentuali di soggetti favorevoli al nuovo
prodotto nel primo e nel secondo gruppo, il problema di test d'ipotesi è
H 0 : px = p y
H 1 : px < p y
od anche
H 0 : p y − px = 0
H 1 : p y − px > 0
Indicando con p̂ x e p̂ y le percentuali che hanno espresso il loro gradimento
del nuovo prodotto, nel primo e nel secondo gruppo sociale, con σ̂ p̂2 y − p̂ x = S p̂2x + S p̂2 y
la varianza stimata della v.c. differenza, e con S p̂2x , S p̂2 y
le varianze campionarie
corrette riscontrate nei due campioni, tenendo inoltre presente le elevate dimensioni
campionarie, la variabile casuale
( p̂
y
− p̂ x ) - ( p y − p x )
σˆ p̂ − p̂
y
x
ha, nell'universo dei campioni, distribuzione approssimativamente normale
(standardizzata) e può essere, pertanto, assunta quale v.c. test di riferimento.
Al livello di significatività α = 0,1 il valore critico del test (unidirezionale) è
z = 1,28, pertanto la regione critica resta individuata dall'intervallo 1,28 |—| +∞
mentre la regione di accettazione è data dall'intervallo - ∞ |—| 1,28.
Poiché, sotto l'ipotesi nulla H0 , la determinazione campionaria delle v.c. test è
p̂ y − p̂ x
σ̂ p̂ y − p̂ x
=
0,55 - 0,45
0,04 2 + 0,03 2
= 2 > 1,28
si rifiuta l'ipotesi formulata concludendo che la percentuale di coloro che esprimono
gradimento del nuovo prodotto è superiore nel secondo gruppo sociale rispetto al
primo gruppo.
67
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
Esempio 25
Ad un campione di 325 studenti di sesso maschile e di 200 di sesso femminile è stato
chiesto di esprimersi riguardo all'efficacia di un nuovo ausilio didattico. Tra i maschi
221 si sono espressi favorevolmente mentre sono state 120 le femmine che hanno
espresso parere favorevole. I risultati campionari sono indice di una differenza
significativa tra maschi e femmine riguardo al loro atteggiamento nei confronti della
efficacia del nuovo ausilio didattico?
Si vuole risolvere il problema per α = 0,05.
Il problema di test delle ipotesi assume la forma
H 0 : px = p y
H 1 : px ≠ p y
o, in modo equivalente
H 0 : px − p y = 0
H 1 : p y − px ≠ 0
dove
px
e
py
rappresentano, rispettivamente, la proporzione di maschi e di
femmine favorevoli al nuovo ausilio didattico; ovviamente i valori si riferiscono
all'intera popolazione.
La variabile casuale campionaria
( p̂
x
− p̂ y ) - ( p x − p y )
σˆ p̂ − p̂
x
dove
p̂ x , e
p̂ y
y
sono le proporzioni di soggetti favorevoli, riscontrate nei due
campioni, ha, nell'universo dei campioni, una distribuzione approssimativamente
normale con media 0 e varianza 1 (normale standardizzata).
Al livello α di significatività del 5% i valori che definiscono la regione critica
sono; c1 = - zα/ 2 = - 1,96 e
c 2 = zα/ 2 = 1,96 . Poiché
p̂ y = 120 / 200 = 0,60 si ha σˆ p̂ x − p̂ y =
p̂ x = 221 / 325 = 0,68
e
0,68 ⋅ 0,32 / 325 + 0,60 ⋅ 0,40 / 200 = 0,043
e quindi sotto l'ipotesi nulla H 0 : p x = p y , z = [
( 0,68 - 0,60 ) −
0 ] / 0,043 = 1,86 .
Essendo il valore campionario 1,86 contenuto nell'intervallo -1,96 |—| 1,96 si
68
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
accetta l'ipotesi nulla di uguaglianza tra le due proporzioni nelle popolazioni
attribuendo alla differenza riscontrata nei campioni natura accidentale.
5.4.4 Test non parametrici per il confronto tra due campioni
Le argomentazioni fin qui svolte, relative a situazioni di ricerca in cui si vuol operare il
confronto tra due campioni di modeste dimensioni, si sono basate sulla conoscenza
della forma analitica dei modelli rappresentativi delle due popolazioni dalle quali i
campioni sono stati estratti, sono stati considerati, cioè, test parametrici; ma, tale
condizione non risulta sempre soddisfatta.
Per risolvere i problemi del confronto tra campioni in assenza di informazioni, o
in presenza di informazioni limitate sulle due popolazioni di origine dei campioni, sono
stati proposti test adeguati (test non parametrici e test semiparametrici); tra questi i più
noti ed interessanti sono: il test della mediana, il test U di Mann-Whitney, il test dei
segni, il test dei ranghi con segno di Wilcoxon e il test W di Kolmogorov-Smirnov.
Si sottolinea che il test dei segni ed il test di Wilcoxon si riferiscono a dati appaiati e
costituiscono un’estensione dei test già introdotti al punto 5.3.6, quando è stata
considerata una sola popolazione, mentre il test di Kolmogorov e Smirnov viene anche
impiegato come test di bontà di adattamento.
Il test della mediana, riguarda due popolazioni indipendenti X e Y con mediana
rispettivamente pari a µ ex e µ ey . Potendo disporre di due campioni di osservazioni
X = ( X 1 , X 2 ,....., X m )
e
Y = (Y1 , Y2 ,....., Yn ) ,si vuol sottoporre a test l’ipotesi
H 0 : µ ex = µ ey . Si procede all’aggregazione dei due campioni i cui valori vengono
ordinati, si calcola quindi il numero V dei valori che si collocano nella prima metà della
graduatoria, se l’ipotesi H 0 : µ ex = µ ey è vera la variabile V dovrebbe assumere un
valore prossimo ad n/2; se µ ex < µ ey , V dovrebbe essere maggiore di m/2, mentre il
valore dovrebbe essere inferiore ad m/2 se µ ex > µ ey .
Se con F (x ) e G ( y ) si indicano le funzioni di distribuzioni relative alle due v.c. X
e Y si avrà:
• F ( z ) = G ( z ) ⇒ µ ex = µ ey ;
• F ( z ) ≥ G ( z ) ⇒ µ ex ≤ µ ey ;
69
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
• F ( z ) ≥ G ( z ) ⇒ µ ex ≥ µ ey .
Pertanto, la regione critica per risolvere il problema di test
H 0 : µ ex = µ ey
H 1 : µ ex < µ ey
la regione critica assume la forma v > c , dove c viene determinato in funzione del
livello di significatività α prefissato. Ragionando allo stesso modo, per risolvere il
problema
H 0 : µ ex = µ ey
H 1 : µ ex > µ ey
la regione critica sarà v < c.
Se F ( z ) = G ( z ) la v.c. V è di tipo ipergeometrico e per determinare P(V = v )
basterà calcolare la probabilità che esattamente v valori di X = ( X 1 , X 2 ,....., X m )
cadano nella prima metà del campione combinato ordinato. Infatti, se si pone m+n = 2
⎛ 2k ⎞
k, se l’ipotesi nulla è vera i k valori più piccoli possono essre scelti in ⎜⎜ ⎟⎟ modi
⎝k ⎠
⎛ 2k ⎞
diversi, ciascuno con la stessa probabilità. Dei ⎜⎜ ⎟⎟ gruppi, quelli che contengono
⎝k ⎠
nella prima metà della graduatoria v valori di X e k-v valori di Y sono pari a
⎛ m⎞ ⎛ n ⎞
⎜⎜ ⎟⎟ ⋅ ⎜⎜
⎟⎟ quindi:
⎝v ⎠ ⎝k − v⎠
⎛m⎞ ⎛ n ⎞
⎜⎜ ⎟⎟ ⋅ ⎜⎜
⎟⎟
−
v
k
v
⎠ per v = 0, 1, 2,....., m
P(V = v ) = ⎝ ⎠ ⎝
⎛m + n⎞
⎜⎜
⎟⎟
⎝ v ⎠
Il
test
U di Mann-Whitney
è tra i più potenti nell’ambito dei test non
parametrici che hanno come obiettivo il confronto tra due popolazioni. Attraverso tale
test
si vuole risolvere il problema dell’uguaglianza tra due popolazioni di forma
analitica non nota contro l’ipotesi alternativa che le due popolazioni abbiano mediana
diversa. La procedura richiede che le variabili di interesse siano espresse almeno con
una scala ordinale e che le due popolazioni siano indipendenti.
Si
presuma
di
poter
disporre
70
di
due
campioni
di
osservazioni
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
X = ( X 1 , X 2 ,....., X m )
e
Y = (Y1 , Y2 ,....., Yn ) ,si vuol sottoporre a test l’ipotesi
H 0 : µ ex = µ ey . Si procede all’aggregazione dei due campioni i cui valori vengono
ordinati, si calcola quindi la somma dei ranghi R x dei valori dei valori relativi alla
variabile X e la somma dei ranghi R y dei valori dei valori relativi alla variabile Y si
determinano, quindi, le quantità:
1
m ⋅ (m + 1) − R x
2
1
U 2 = m ⋅ n + n ⋅ (n + 1) − R y
2
sia U = min (U 1 ,U 2 )
U1 = m ⋅ n +
Si rifiuta l’ipotesi H 0 : µ ex = µ ey se U ≤ c , dove il valore critico c dipende dal livello
di significatività prefissato. Da sottolineare che l’ipotesi alternativa può essere
unidirezionale o bidirezionale, che è disponibile la tavola dei valori critici relativi al test
U
e
µu =
m⋅n
m ⋅ n ⋅ (m + n + 1)
e σ u2 =
, quando m ⋅ n > 20.
2
12
che
si
può
fare
ricorso
all’approssimazione
normale,
con
Come già sottolineato il test dei segni ed il test di Wilcoxon costituiscono una
diretta estensione di quelli precedentemente introdotti. Valgono quindi tutte le
considerazioni svolte che non vanno, però, più riferite al singolo dato campionario ma
alla differenza Vi = X i − Yi tra i dati appaiati.
Se, ad esempio, si considera il test dei segni potendo disporre di due campioni di
osservazioni di dati appaiati
problema
di
verifica
( X , Y ) = [( X 1 , Y1 ), ( X 2 , Y2 ),....., ( X n , Yn )] ,
d’ipotesi
si
considerano
i
segni
per risolvere il
delle
differenze
xi − y i (i = 1,2,..., n ) ; se le due variabili sono continue ed equivalenti la probabilità delle
differenze positive o negative è pari a 0,5. La procedura di test cui fare riferimento è,
pertanto, quella usuale basata la v.c. test di tipo binomiale con parametro p = 0,5.
71
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
Il test W di Kolmogorov-Smirnov, riguarda due popolazioni indipendenti,
espresse almeno con scala ordinale X e Y. Potendo disporre di due campioni di
osservazioni X = ( X 1 , X 2 ,....., X m ) e Y = (Y1 , Y2 ,....., Yn ) , si vuol sottoporre a test
l’ipotesi che le distribuzioni Fx = P( X ≤ x ) e Fy = P (Y ≤ y ) relative alle due
popolazioni siano uguali.
Si procede all’ordinamento dei dati campionari separatamente per ciascuna
variabile e alla successiva costruzione delle due funzioni di distribuzione (ripartizione o
delle probabilità cumulate) empiriche Fˆx = P( X ≤ x ) e Fˆ y = P(Y ≤ y ) , si definisce la
v.c. test:
W = max
x
[Fˆ − Fˆ ]
x
y
Si rifiuta l’ipotesi H 0 : Fx = Fy contro l' ipotesi alternativa H 1 : Fx ≠ Fy se W
> c , dove il valore critico c dipende dal livello di significatività prefissato.
Da sottolineare che l’ipotesi alternativa può anche essere di tipo unidirezionale e
che il secondo oggetto del confronto potrebbe anche non essere una popolazione Y
diversa da X ma una popolazione teorica di riferimento, in questo caso il test assume la
natura di test di bontà di adattamento (cfr. punto 5.6); cioè, il modello ipotizzato è
adeguato per la rappresentazione analitica (approssimata) dei dati disponibili ?.
Tavola del test di Kolmogorov-Smirnov
n
n
Livello di significatività
unidirezionale
bidirezionale
0,05
0,01
0,05
0,01
5
0,565
0,669
0,509
0,627
6
0,521
0,618
0,468
7
0,486
0,577
8
0,457
9
Livello di significatività
unidirezionale
bidirezionale
0,05
0,01
0,05
0,01
24
0,269
0,323
0,242
0,301
0,577
25
0,264
0,317
0,238
0,295
0,436
0,538
26
0,259
0,311
0,233
0,290
0,543
0,410
0,507
27
0,254
0,305
0,229
0,284
0,432
0,514
0,388
0,480
28
0,250
0,300
0,225
0,279
10
0,410
0,490
0,369
0,457
29
0,246
0,295
0,221
0,275
11
0,391
0,468
0,352
0,437
30
0,242
0,290
0,18
0,270
12
0,375
0450
0,338
0,419
31
0,238
0,285
0,214
0,266
13
0,361
0,433
0,326
0,404
32
0,234
0,281
0,211
0,262
72
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
14
0,349
0,418
0,314
0,390
33
0,231
0,277
0,208
0,258
15
0,338
0,404
0,304
0,377
34
0,227
0,273
0,205
0,254
16
0,328
0,392
0,295
0,366
35
0,224
0,269
0,202
0,251
17
0,318
0,381
0,286
0,355
36
0,221
0,265
0,199
0,247
18
0,309
0,371
0,279
0,346
37
0,218
0,62
0,197
0,244
19
0,301
0,363
0,271
0,337
38
0,215
0,258
0,194
0,241
20
0,294
0,356
0,265
0,329
39
0,213
0,255
0,192
0,238
21
0,287
0,344
0,259
0,312
40
0,210
0,252
0,189
0,235
22
0,281
0,337
0,253
0,314
>40
1,36
1,63
1,22
1,52
23
0,275
0,330
0,248
0,307
5.4.4 Determinazione della dimensione del campione
Così come per il caso di campioni estratti da una sola popolazione, anche quando si
affronta il problema del confronto tra campioni estratti da due diverse popolazioni, si
può aver interesse nell'introdurre un vincolo sul livello γ della potenza del test per un
prefissato livello α di significatività.
Si supponga, ad esempio, che in riferimento a popolazioni normali una differenza
µ x − µ y = 10 sia rilevante e che si vuole, essere relativamente sicuri nell'individuare
una tale differenza. In termini tecnici tale obiettivo si traduce nell’individuazione di un
test con potenza sufficientemente elevata.
Se si fissano i livelli α = 0,05 e γ = 0,70, il problema sopra posto può essere
risolto formulando l'ipotesi nulla
H0 : µx − µ y = 0
contro l'ipotesi alternativa
H 1 : µ x − µ y > 10
La variabile casuale test
(
X −Y
) - (µ x −µ y )
σ x- y
=
73
(
X−Y
) - (µ x −µ y )
σ x2 / m + σ y2 / n
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
dove σ x2
e σ 2y
sono le varianze delle due popolazioni m e n le dimensioni
campionarie sotto l'ipotesi nulla H 0 : µ x − µ y = 0 ed al livello di significatività
α = 0,05 deve soddisfare la relazione
⎛ X -Y
⎞
P⎜
≥ 1,645 ⎟ = 0,05
⎜ σ
⎟
⎝ x- y
⎠
ed anche
P( [ X - Y
]
) = 0,05
≥ 1,645 ⋅ σ x - y
Il vincolo sulla potenza si traduce nella relazione
⎛ X - Y - 10
1,645 ⋅ σ x - y - 10 ⎞
⎟ = 0,70
P⎜
≥
⎜ σ
⎟
σ
x
y
x
y
⎝
⎠
Sapendo che il valore della variabile casuale normale standardizzata Z che ha
alla sua destra il 70% dei casi è pari a -0,524 si avrà
1,645 - 10 / σ x - y = - 0,524
ed anche
σ x2− y = σ x2 / m + σ y2 / n ≤ 10 2 / ( 1,645 + 0,524 )2
dal quale si possono ricavare i valori di m ed n necessari.
Se, ad esempio, si suppone che σ x2 = σ y2 = 12
e che la dimensione campionaria
relativa alla prima popolazione sia m = 7, la dimensione n del secondo campione, al
livello α = 0,05 di significatività e con potenza γ = 0,70 è data dalla relazione
144 / 7 + 144 / n ≤ 100 / ( 1,645 + 0,524
)2
che fornisce
n ≥ 210
Esempio 26
Per effettuare una verifica dell'effetto di un vaccino contro la poliomielite si deve
pianificare la rilevazione (dimensionare il campione) in modo da ottenere risultati
significativi sia in termini di probabilità dell'errore di I tipo sia, per le ovvie e rilevanti
conseguenze, in termini di probabilità dell'errore di II tipo.
Vista la scarsa diffusione della malattia, ci si deve aspettare una dimensione
campionaria molto elevata sia nei confronti dei soggetti vaccinati che di quelli non
74
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
vaccinati.
Supponendo che la proporzione di bambini colpiti da poliomielite sia di 30 su
100.000 (cioè 0,0003), e che il vaccino sia effettivo al 50%, il che implica una riduzione
del tasso al valore 0,00015, appare ragionevole imporre la condizione di aver
un'elevata probabilità, ad es. pari a 0,90 (=γ = 1-β), di evidenziare una tale differenza.
Imponendo l'uguaglianza delle due dimensioni campionarie m = n si ottiene la
seguente particolarizzazione della formula sopra introdotta
m = n ≥
(
px ⋅ qx + py ⋅ qy
(p
x
) ( zα +
+ py
)
zβ
)2
2
dove zα e z β sono le convenienti determinazioni della variabile casuale normale
standardizzata ottenuta in funzione dei prefissati livelli delle probabilità di errore α e
β.
Se si assume, quindi, p x = 0,00015, p y = 0,0003, α = 0,05 e β = 0,10, si avrà
n ≥
[ 0,00015 ⋅ (1 - 0,00015) + 0,003 ⋅ (1 − 0,0003)] ( 1,6450
( 0,00015 - 0,0003 ) 2
+ 1,282 ) 2
≅ 171.400
5.5 Test di bontà di adattamento
Nelle pagine precedenti si è discusso delle procedure per sottoporre a test ipotesi sul
valore dei parametri caratterizzanti le distribuzioni delle variabili casuali, assumendo
quasi sempre che la legge di distribuzione delle probabilità fosse nota. Come già
sottolineato, in molte situazioni di ricerca può capitare d'essere interessati alla verifica
di ipotesi che specificano la legge di probabilità delle variabili casuali, l'ipotesi
riguarderebbe in tal caso, non più i parametri che caratterizzano la distribuzione, ma
direttamente la forma della distribuzione stessa.
In queste situazioni il test del rapporto di verosimiglianza non è sempre
applicabile in quanto potrebbe risultare impossibile la derivazione della funzione di
verosimiglianza sotto l'ipotesi alternativa; e ciò accade tutte le volte in cui l'ipotesi
alternativa viene riferita ad una vasta classe di funzioni. Il fatto che la classe delle
alternative possibili sia generalmente molto ampia rende difficile anche ogni possibile
75
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
confronto tra procedure di test diverse, in termini di probabilità d'errore di seconda
specie. In tali casi si preferisce usualmente rinunciare ad ogni valutazione della
probabilità di tale errore.
Un metodo per sottoporre a test ipotesi sulla forma delle distribuzioni è il test χ2
di bontà d'adattamento ed è l'unico che verrà qui considerato. Di un altroper la misura
test di largo impiego in questo contesto si è avuto modo
L'ipotesi sulla forma funzionale della legge di probabilità di una certa variabile
casuale può essere suggerita dall'esperienza passata o da rappresentazioni grafiche di
campioni piuttosto ampi, può derivare da conoscenze pregresse di natura teorica e/o
empirica. Ma su tali questioni non ci soffermeremo, si limiterà pertanto la discussione
all'unica procedura cui si è detto sopra.
Si ipotizzi dunque che la funzione di distribuzione di una certa variabile casuale X
sia F(x). In base all'evidenza campionaria si otterrà una misura F̂ (x ) di F(x). Se F̂ (x )
approssima abbastanza bene F(x) l'ipotesi verrà accettata si rifiuterà altrimenti.
La procedura del χ2, per sottoporre al test l'ipotesi sulla forma funzionale della
variabile X disponendo di un campione casuale di osservazioni è molto semplice e può
essere schematizzata nelle seguenti cinque fasi successive:
1a fase
Si suddivide il campo di definizione della variabile casuale (discreta o
continua) X in k intervalli I1, I2, ..., Ik in modo tale che in ciascun intervallo
cadano almeno cinque valori campionari. Si determina poi il numero ai dei
valori campionari che cadono in ciascun intervallo Ii.
2a fase
Usando F(x), si calcola la probabilità pi che ha la variabile casuale X di
assumere un valore all'interno dell'intervallo Ii. Si calcolano poi i valori
bi = n pi che rappresentano i numeri teorici dei valori campionari che
dovrebbero cadere in Ii se l'ipotesi fosse vera.
3a fase
Si calcola la quantità
k
χ2 = ∑
i =1
(ai − bi ) 2
bi
variabile questa che, come già detto in precedenza, ha, nell'universo dei
campioni, una legge di distribuzione approssimata del tipo χ2.
4a fase
Si sceglie il livello di significatività α.
76
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
5a fase
Si determina il valore critico del test c dalla relazione
P (χ 2 > c ) = α
utilizzando le tavole della distribuzione χ2. Si noti che il numero dei gradi di
libertà della variabile χ2 è, in questo caso, pari a k-r-1 ; dove k è il numero
degli intervalli ed r è il numero dei parametri incogniti che occorre stimare
per ottenere i valori teorici bi. Nel caso in cui si ipotizza la normalità della
distribuzione (per µ e σ2 incogniti) si avrebbero k-3 gradi di libertà.
Esempio 27
Si supponga di avere a che fare con dati relativi al numero delle volte in cui uno
specifico evento si realizza in una particolare unità di tempo (o spazio) e che si voglia
verificare statisticamente l'ipotesi che la variabile rappresentativa del numero di eventi
che si realizza nell'unità di tempo (o spazio) segua una legge di distribuzione del tipo
Poisson. Due situazioni operative sono ipotizzabili: la prima è che il parametro
caratteristico λ della distribuzione sia già noto (specificato) a priori; la seconda, che
più frequentemente si riscontra nelle situazioni reali, è quella in cui il valore di λ non è
specificato e che deve, pertanto, essere stimato utilizzando le informazioni campionarie
disponibili.
Come illustrazione della seconda situazione si consideri il caso in cui si è
interessati a verificare se il passaggio di automobili su un ponte in una certa strada di
campagna possa essere adeguatamente rappresentato dalla legge di Poisson
supponendo come unità temporale di riferimento il minuto e fissando la probabilità
dell'errore di I tipo al livello (di significatività) α = 0,05.
Le uniche informazioni disponibili sono quelle derivanti dall'osservazione dei
passaggi riscontrati in 60 minuti consecutivi (l’unità temporale di osservazione è il
minuto, cioè, si dispone di 60 unità statistiche di osservazione) che risultano essere
stati:
Numero di automobili
Numero di minuti
0,
1,
2,
3,
4,
5,
25,
15,
10,
5,
3,
2,
Poiché il parametro caratteristico λ del modello di Poisson
77
più di 5
0
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
f ( x, λ ) =
e − λ ⋅ λx
x!
per x = 0, 1, 2,.....
non è noto, si deve procedere alla sua stima. Ricordando che il parametro stesso
rappresenta anche la media (valore atteso) della variabile si avrà che il numero medio
di automobili per minuto è pari a:
λˆ =
1
(0 ⋅ 25 + 1 ⋅ 15 + 2 ⋅ 10 + 3 ⋅ 5 + 4 ⋅ 3 + 5 ⋅ 2) = 1,2
60
Il numero dei passaggi teorici bi attesi per minuto si ottiene dalla formula
P( X = x ) = p(x ) =
e −1, 2 ⋅ 1,2 x
x!
attribuendo ad x i valori 0, 1, 2, 3, 4, 5 o più e moltiplicando il valore ottenuto
Numero di
p(x)
bi
ai
( ai − bi ) 2
bi
0
0,3012
18,07
25
2,63
1
0,3614
21,68
15
2,07
2
0,2169
13,01
10
0,69
3
0,0867
4
0,0260
7,23
10
1,06
5 o più
0,0078
Totale
1,0000
automobili
60,00
60
6,45=χ2
Tab. 7 – Test χ2 per sottoporre a test la bontà di adattamento del modello di Poisson
Per il calcolo dei valori riportati nella tabella sono stati adottati due
accorgimenti; il primo riguarda la determinazione della probabilità dell'evento 5 o più
passaggi nell'unità di tempo, che è stata ottenuta come complemento ad una delle
somme della probabilità degli eventi 0, 1, 2, 3 e 4, cioè
P(x≥5)=1-[P(x=0)+P(x=1)+P(x=2)+P(x=3)+P(x=4)]
il secondo accorgimento è relativo alla aggregazione delle ultime tre modalità (3, 4, 5
o più) in modo da soddisfare la condizione che le frequenze teoriche all'interno di
78
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
ciascuna classe siano ≥5.
Si può esplicitare meglio il problema di verifica d'ipotesi sopra illustrato
svolgendo le tre seguenti fasi:
1) Formulazione dell'ipotesi di lavoro
H0: Il modello di Poisson può rappresentare adeguatamente il fenomeno
oggetto d'esame
2) Formulazione dell'ipotesi alternativa
H1: Il modello di Poisson non è adeguato
3) Determinazione dei gradi di libertà che risultano pari a g=4-1-1=2
4) Individuazione del valore critico
χ20,05;2 = 5,99
Essendo il valore del χ2 osservato superiore al valore teorico (6,45>5,99) si
rifiuta l'ipotesi di lavoro H0 concludendo che il modello di Poisson non è adeguato al
livello di significatività del 5% per rappresentare la situazione in esame.
Esempio 28
E' stato rilevato il peso netto del prodotto in 70 vasetti di cioccolata confezionati
meccanicamente. I risultati della rilevazione sono quelli riportati nella tabella che
segue
Classe di peso in grammi
N. di vasetti
200 |— 201
13
201 |— 202
27
202 |— 203
18
203 |— 204
10
204 |— 205
1
205 |— 206
1
Tab. 8 - Distribuzione del peso della cioccolata per classi di frequenza
Si vuole verificare statisticamente se i dati rilevati sono conformi all'ipotesi di
79
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
normalità al livello di significatività del 10%.
Poiché i parametri caratteristici della distribuzione µ e σ2 non sono specificati, a
priori si deve procedere ad una loro stima utilizzando le informazioni campionarie. Le
stime non distorte dei due parametri si ottengono dalle espressioni
µˆ = x =
1 k
1 k
1 ⎛ k 2
⎞
2
2
2
ˆ
x
n
σ
S
x
x
xi ni − n x 2 ⎟
;
(
)
=
=
−
=
∑
∑
∑
i i
i
⎜
n i =1
n − 1 i =1
n − 1 ⎝ i =1
⎠
dove il simbolo xi indica il valore centrale di ciascuna classe di frequenza. Si ha
200,5 x 13 + ... + 205,5 x 1 14.137
=
= 202,2
70
70
2
2 x 855 x 149; 5 - 70 x 14.137
70
2
S =
= ; s = σ = 1,1
69
x=
Si può ora calcolare la probabilità teorica dei valori che cadono all'interno di
ciascuna classe facendo riferimento alla formula
f ( x; µ , σ 2 ) = f ( x;202, 2, 1, 21) =
⎛ ( x − 202, 2) 2 ⎞
1
exp ⎜ −
⎟
2 ⋅ 1, 21 ⎠
2π 1, 21
⎝
ed utilizzando le tavole della distribuzione normale standardizzata
Classi di peso
( ai − bi ) 2
bi
P(x)
bi
ai
meno di 201
0,1814
12,7
13
0,01
201 |— 202
0,3186
22,3
27
0,99
202 |— 203
0,3186
22,3
18
0,83
203 |— 204
0,1470
10,3
10
204 |— 205
0,0313
2,2
205 o più
0,0032
0,2
1
1,0000
70
70
12,7
1
12
0,04
1,87=χ2
Tab. 9 - Test χ2 per verificare la bontà di adattamento della distribuzione normale
Per il calcolo dei valori riportati nella tabella si deve osservare che:
le classi estreme sono state considerate aperte in modo d'avere una somma
di probabilità pari a 1;
sono state raggruppate le ultime tre classi per ottenere una frequenza
80
B. Chiandotto
Versione 2006
Statistica per le decisioni
Test delle ipotesi statistiche
teorica ≥ 5;
la probabilità dei valori di ciascuna classe derivano dall'applicazione della
relazione
F(xi ) - F(xi-1 )
es.
⎛ 202 − 2 ⎞
⎛ 201 − 201 ⎞
P(201 < X < 202) = F ⎜
−F⎜
⎟
⎟ = 0,5 − 0,1814 = 0,3186
⎝ 1,1 ⎠
⎝ 1,1 ⎠
Il problema di verifica d'ipotesi risulta esplicitato nel modo seguente
1. Formulazione dell'ipotesi di lavoro
H0: il modello normale risulta adeguato per rappresentare il fenomeno
2. Formulazione dell'ipotesi alternativa
H1 : il modello normale non è adeguato
3. Determinazione dei gradi di libertà 9 = 4 - 2 - 1 = 1
4. Individuazione del valore critico χ2 = 2,71
Essendo il valore del
χ2
osservato inferiore al valore teorico
(1,87 < 2,71) non si rifiuta l'ipotesi H0 di adeguatezza del modello normale al livello di
significatività α = 0,10.
81