Es sul test Chi

annuncio pubblicitario
Esercizi svolti sul test Chi-quadro di adattamento
Corso di Statistica, a cura del prof. R. D’Angio’, 10/01/14
Esercizi svolti sul test Chi-quadro di adattamento
Parte Standard Excel, cioè solo per chi non ha fatto SAS
INDICE
1. Ripasso sintetico ed operativo della spiegazione data in aula
2. Commento sul livello si significatività α del test ed altro
3. Esercizio 1
4. Esercizio 2
pagg. 1-2
pag.
2
pagg. 2-3
pagg. 3-4
RIPASSO SINTETICO ED OPERATIVO DELLA SPIEGAZIONE DATA IN AULA
Si proceda direttamente allo svolgimento degli Esercizi 1 e 2 nelle pagine successive sulla base di quanto appreso a
lezione. In caso di necessità si ricorra al seguente ripasso sintetico ed operativo della spiegazione data in aula a lezione.
Breve descrizione degli esercizi e della terminologia di base dei test non parametrici.
Nel testo di ogni esercizio (vedere gli esercizi) per ogni valore osservato di una certa v.a. X viene data
la frequenza assoluta di tale valore in N osservazioni. Sulla base di tali frequenze assolute osservate
(o empiriche o sperimentali) si vuole verificare l’ipotesi che la v.a. X sia di un certo tipo
(ipotesi che si chiama ipotesi nulla, simbolo H0), p.es. l’ipotesi che X sia Uniforme discreta con
supporto da 1 a 4, cioè con funzione di probabilità p(x) = ¼ (x=1,2,3,4) è un’ipotesi nulla.
Verificare un’ipotesi (non parametrica), o fare un test statistico (non parametrico), vuol dire
che mediante un opportuno procedimento (vedi sotto) sulla base alle frequenze assolute osservate
e all’ipotesi stessa, si decide
o di mantenere l’ipotesi fatta cioè di non rifiutarla (o “accettarla”)
o di rifiutarla .
Il procedimento pratico per eseguire il test è esposto in (A), (B) e (C) qui sotto.
(A) Calcolo del valore dell’indice Chi-quadro
N
indice Chi-quadro =
∑
( Oi − Ei )
2
Ei
i =1
dove nel nostro caso N = 4 che è il numero dei valori della variabile
Tale calcolo si può organizzare con le seguenti colonne:
(I) Calcolo delle frequenze attese (Ei) con la formula: Ei= 200 p(xi)
(II) Calcolo delle differenze Oi - Ei fra le frequenze assolute osservate Oi e le
frequenze attese Ei, e calcolo dei quadrati (Oi - Ei)2 di tali differenze
(III) Calcolo dei rapporti (Oi - Ei)2 / Ei e la somma di tali rapporti
(IV) La somma dei rapporti di cui sopra dà il valore dell’ indice Chi-quadro
(B) Determinazione del valore critico
Il valore
χ
2
3
è il valore della v.a.
2
3 che
Chi
χ 32
(dove 3=4-1 sono i g.d.l.)
lascia a destra un’area ( = probabilità) pari al livello
di significatività dato dal valore alfa specificato nel testo di ogni esercizio, cioè
(
P Chi32 ≥ χ 32
↑
)
= α
← ↓
ovvero
(
P Chi32 < χ 32
)
↑
χ 32
è dato da
= 1−α
←
↓
si segue la seconda formula perché la tavola numerica della v.a. Chi-quadro dà le aree a sinistra.
(C) Esecuzione del test
≥ valore critico χ 32
Se
valore dell’indice Chi-quadro
allora
si rifiuta l’ipotesi che la v.a. sia del tipo ipotizzato, cioè si rifiuta H0
Se invece
valore dell’indice Chi-quadro < valore critico χ 3
non si rifiuta, ovvero si accetta, l’ipotesi H0 che la v.a. sia del tipo ipotizzato.
allora
2
Di conseguenza il valore critico
_ l’intervallo da
χ32
divide la parte positiva dell’asse delle ascisse in due intervalli o “regioni”:
0 fino al valore critico χ 32 si chiama regione di accettazione, mentre
_ l’intervallo dal valore critico
χ32
fino a
+∞ si chiama regione di rifiuto.
1
Esercizi svolti sul test Chi-quadro di adattamento
Corso di Statistica, a cura del prof. R. D’Angio’, 10/01/14
COMMENTO SUL LIVELLO SI SIGNIFICATIVITÀ α ED ALTRO.
Se si eseguono N=200 osservazioni dei valori x di una variabile X, e poi altre
N=200, o 130, o 300, ecc., osservazioni, in generale si hanno ogni volta frequenze assolute diverse per uno stesso valore x (tale
fenomeno si chiama variabilità campionamento). Quindi l’esito del test può cambiare a seconda delle osservazioni ottenute e, per
quanto sia grande il numero N delle osservazioni, non si avrà mai la certezza che l’ipotesi sia vera (o falsa), anche se il test la accetta (o la rifiuta). Il livello di significatività α è la probabilità che il test ci faccia commettere l’errore di rifiutare l’ipotesi nel
caso che sia vera. Dunque il test si esegue fissando una tale probabilità α piccola a piacere. Così facendo, tanto più piccolo è α
fissato con cui si esegue il test, tanto più affidabile è il test stesso. Tale errore si chiama errore di 1° tipo, perché c’è un altro errore
possibile (detto errore di 2° tipo) che è: accettare l’ipotesi quando è falsa. In realtà non si possono minimizzare le probabilità di
entrambi tali errori, per cui la teoria matematica di tali test (che non fa parte del programma di Statistica del secondo anno di nessun Corso di laurea di Economia Aziendale) è costruita fissando (bassa) la probabilità di uno dei due errori e minimizzando la
probabilità dell’altro errore. Tale teoria matematica è detta di teoria di Neyman-Pearson, dai cognomi dei due statistico-matmeatici
che la hanno formulata.
Infine, la terminologia preferita di “non si rifiuta” invece di “si accetta” rispecchia la circostanza applicativa che l’ipotesi H0 è di
solito quella che già si fa correntemente (e quindi è già “accettata”) nel tipo di applicazioni considerate.
Per cui il test ha lo scopo di vedere se non sia intervenuto qualcosa (di nuovo) che comporti il rifiuto di tale ipotesi ormai già
accettata nelle applicazioni correnti.
Se poi il test si conclude con il non rifiuto dell’ipotesi H0 ─ o ipotesi nulla ─, nulla, appunto, si deve allora cambiare nelle
applicazioni correnti ─ donde il termine “ipotesi nulla”, appunto.
Esercizio 1.
Per una v.a. X i cui valori possibili sono x=1,2,3,4 si vuole testare
se sia una v.a. uniforme discreta con supporto da 1 a 4. A tale fine
si sono osservati 200 valori di tale variabile ottenendo per ciascun valore
le frequenze assolute sotto indicate
x
fr ass
1
40
2
60
3
45
4
55
200
Per un livello di significatività pari a alfa=0,05, si verifichi l'ipotesi che
la v.a. X sia uniforme discreta
Svolgimento Esercizio 1.
L’ipotesi
H 0 da testare è che X sia una v.a. uniforme discreta con S X = {1, 2,3, 4} ,
cioè che X abbia la seguente funzione di probabilità
1/ 4, x = 1, 2, 3, 4
H0 : p ( x)X = 
altrove
0
(A) Calcolo del valore dell’indice Chi-quadro
(I)
fr attese
(II)
(III)
xi
fr ass
Oi
p(xi)
Ei =
p(xi)*200
(Oi - Ei)^2
(Oi - Ei)^2/Ei
1
2
3
4
40
60
45
55
0,25
0,25
0,25
0,25
50
50
50
50
100
100
25
25
2
2
0,5
0,5
200
1
5
(IV) =
valore
= somma
colonna
(III)
indice Chiquadrato
2
Esercizi svolti sul test Chi-quadro di adattamento
Corso di Statistica, a cura del prof. R. D’Angio’, 10/01/14
χ32
(B) Determinazione del valore critico
(dove 3=4-1 sono i g.d.l.)
Chin2 con g.d.l. n=4-1=3
La lettura inversa della tavola numerica della v.a.
per 1-alfa=1-0,05 =0,95, ovvero
(
P Chi32 < χ 32
)
= 1 − α = 0,95
↑
dà (all’incrocio della colonna 0,95 e della riga n=3) il valore
←
↓
χ32
= 7,81.
(C) Esecuzione del test
Si ha: valore indice Chi-quadro =5 < valore critico
χ32
= 7,81.
H 0 che X sia una v.a. uniforme discreta con S X = {1, 2,3, 4} .
Dunque non si rifiuta (cioè si “accetta”) l’ipotesi
Esercizio 2.
Per una v.a. X si assume che abbia la seguente funzione di probabilità
1/ 6, x = 4,10

H 0 : p X ( x ) = 2 / 6, x = 7,8
0
altrove

Al fine di testare se la v.a. X in questione abbia effettivamente tale funzione di
probabilità si sono osservati 300 valori di tale variabile ottenendo per ciascun valore
x le frequenze assolute sotto indicate
x
fr ass
4
45
7
110
8
105
10
40
300
Per un livello di significatività pari a alfa=0,01, si verifichi l'ipotesi che
la v.a. X abbia la suddetta funzione di probabilità.
Svolgimento Esercizio 2.
(A) Calcolo del valore dell’indice Chi-quadro
(I) fr
attese
(II)
(III)
xi
fr ass
Oi
p(xi)
Ei =
p(xi)*200
(Oi - Ei)^2
(Oi - Ei)^2/Ei
4
7
8
10
45
110
105
40
0,167
0,333
0,333
0,167
50
100
100
50
25
100
25
100
0,5
1
0,25
2
300
1
3,75
(IV) =
valore
= somma
colonna
(III)
indice Chiqua
(B) Determinazione del valore critico
χ32
(dove 3=4-1 sono i g.d.l.)
La lettura inversa della tavola numerica della v.a.
Chin2 con g.d.l. n=4-1=3
3
Esercizi svolti sul test Chi-quadro di adattamento
Corso di Statistica, a cura del prof. R. D’Angio’, 10/01/14
per 1-alfa=1-0,01 =0,99, ovvero
(
P Chi32 < χ 32
)
= 1 − α = 0, 99
↑
dà (all’incrocio della colonna 0,99 e della riga n=3) il valore
←
χ32
↓
= 11,3.
(C) Esecuzione del test
χ32 = 11,3.
H 0 che la v.a. X abbia la funzione di probabilità sopra specificata.
Valore indice Chi-quadro =3,75 < valore critico
Dunque non si rifiuta (cioè si “accetta”) l’ipotesi
NOTA BENE.
Qualsiasi altro esercizio sul test Chi-quadro previsto dal programma si svolge con i tre step (A), (B), e
(C) visti sopra.
4
Scarica