Esercizi svolti sul test Chi-quadro di adattamento Corso di Statistica, a cura del prof. R. D’Angio’, 10/01/14 Esercizi svolti sul test Chi-quadro di adattamento Parte Standard Excel, cioè solo per chi non ha fatto SAS INDICE 1. Ripasso sintetico ed operativo della spiegazione data in aula 2. Commento sul livello si significatività α del test ed altro 3. Esercizio 1 4. Esercizio 2 pagg. 1-2 pag. 2 pagg. 2-3 pagg. 3-4 RIPASSO SINTETICO ED OPERATIVO DELLA SPIEGAZIONE DATA IN AULA Si proceda direttamente allo svolgimento degli Esercizi 1 e 2 nelle pagine successive sulla base di quanto appreso a lezione. In caso di necessità si ricorra al seguente ripasso sintetico ed operativo della spiegazione data in aula a lezione. Breve descrizione degli esercizi e della terminologia di base dei test non parametrici. Nel testo di ogni esercizio (vedere gli esercizi) per ogni valore osservato di una certa v.a. X viene data la frequenza assoluta di tale valore in N osservazioni. Sulla base di tali frequenze assolute osservate (o empiriche o sperimentali) si vuole verificare l’ipotesi che la v.a. X sia di un certo tipo (ipotesi che si chiama ipotesi nulla, simbolo H0), p.es. l’ipotesi che X sia Uniforme discreta con supporto da 1 a 4, cioè con funzione di probabilità p(x) = ¼ (x=1,2,3,4) è un’ipotesi nulla. Verificare un’ipotesi (non parametrica), o fare un test statistico (non parametrico), vuol dire che mediante un opportuno procedimento (vedi sotto) sulla base alle frequenze assolute osservate e all’ipotesi stessa, si decide o di mantenere l’ipotesi fatta cioè di non rifiutarla (o “accettarla”) o di rifiutarla . Il procedimento pratico per eseguire il test è esposto in (A), (B) e (C) qui sotto. (A) Calcolo del valore dell’indice Chi-quadro N indice Chi-quadro = ∑ ( Oi − Ei ) 2 Ei i =1 dove nel nostro caso N = 4 che è il numero dei valori della variabile Tale calcolo si può organizzare con le seguenti colonne: (I) Calcolo delle frequenze attese (Ei) con la formula: Ei= 200 p(xi) (II) Calcolo delle differenze Oi - Ei fra le frequenze assolute osservate Oi e le frequenze attese Ei, e calcolo dei quadrati (Oi - Ei)2 di tali differenze (III) Calcolo dei rapporti (Oi - Ei)2 / Ei e la somma di tali rapporti (IV) La somma dei rapporti di cui sopra dà il valore dell’ indice Chi-quadro (B) Determinazione del valore critico Il valore χ 2 3 è il valore della v.a. 2 3 che Chi χ 32 (dove 3=4-1 sono i g.d.l.) lascia a destra un’area ( = probabilità) pari al livello di significatività dato dal valore alfa specificato nel testo di ogni esercizio, cioè ( P Chi32 ≥ χ 32 ↑ ) = α ← ↓ ovvero ( P Chi32 < χ 32 ) ↑ χ 32 è dato da = 1−α ← ↓ si segue la seconda formula perché la tavola numerica della v.a. Chi-quadro dà le aree a sinistra. (C) Esecuzione del test ≥ valore critico χ 32 Se valore dell’indice Chi-quadro allora si rifiuta l’ipotesi che la v.a. sia del tipo ipotizzato, cioè si rifiuta H0 Se invece valore dell’indice Chi-quadro < valore critico χ 3 non si rifiuta, ovvero si accetta, l’ipotesi H0 che la v.a. sia del tipo ipotizzato. allora 2 Di conseguenza il valore critico _ l’intervallo da χ32 divide la parte positiva dell’asse delle ascisse in due intervalli o “regioni”: 0 fino al valore critico χ 32 si chiama regione di accettazione, mentre _ l’intervallo dal valore critico χ32 fino a +∞ si chiama regione di rifiuto. 1 Esercizi svolti sul test Chi-quadro di adattamento Corso di Statistica, a cura del prof. R. D’Angio’, 10/01/14 COMMENTO SUL LIVELLO SI SIGNIFICATIVITÀ α ED ALTRO. Se si eseguono N=200 osservazioni dei valori x di una variabile X, e poi altre N=200, o 130, o 300, ecc., osservazioni, in generale si hanno ogni volta frequenze assolute diverse per uno stesso valore x (tale fenomeno si chiama variabilità campionamento). Quindi l’esito del test può cambiare a seconda delle osservazioni ottenute e, per quanto sia grande il numero N delle osservazioni, non si avrà mai la certezza che l’ipotesi sia vera (o falsa), anche se il test la accetta (o la rifiuta). Il livello di significatività α è la probabilità che il test ci faccia commettere l’errore di rifiutare l’ipotesi nel caso che sia vera. Dunque il test si esegue fissando una tale probabilità α piccola a piacere. Così facendo, tanto più piccolo è α fissato con cui si esegue il test, tanto più affidabile è il test stesso. Tale errore si chiama errore di 1° tipo, perché c’è un altro errore possibile (detto errore di 2° tipo) che è: accettare l’ipotesi quando è falsa. In realtà non si possono minimizzare le probabilità di entrambi tali errori, per cui la teoria matematica di tali test (che non fa parte del programma di Statistica del secondo anno di nessun Corso di laurea di Economia Aziendale) è costruita fissando (bassa) la probabilità di uno dei due errori e minimizzando la probabilità dell’altro errore. Tale teoria matematica è detta di teoria di Neyman-Pearson, dai cognomi dei due statistico-matmeatici che la hanno formulata. Infine, la terminologia preferita di “non si rifiuta” invece di “si accetta” rispecchia la circostanza applicativa che l’ipotesi H0 è di solito quella che già si fa correntemente (e quindi è già “accettata”) nel tipo di applicazioni considerate. Per cui il test ha lo scopo di vedere se non sia intervenuto qualcosa (di nuovo) che comporti il rifiuto di tale ipotesi ormai già accettata nelle applicazioni correnti. Se poi il test si conclude con il non rifiuto dell’ipotesi H0 ─ o ipotesi nulla ─, nulla, appunto, si deve allora cambiare nelle applicazioni correnti ─ donde il termine “ipotesi nulla”, appunto. Esercizio 1. Per una v.a. X i cui valori possibili sono x=1,2,3,4 si vuole testare se sia una v.a. uniforme discreta con supporto da 1 a 4. A tale fine si sono osservati 200 valori di tale variabile ottenendo per ciascun valore le frequenze assolute sotto indicate x fr ass 1 40 2 60 3 45 4 55 200 Per un livello di significatività pari a alfa=0,05, si verifichi l'ipotesi che la v.a. X sia uniforme discreta Svolgimento Esercizio 1. L’ipotesi H 0 da testare è che X sia una v.a. uniforme discreta con S X = {1, 2,3, 4} , cioè che X abbia la seguente funzione di probabilità 1/ 4, x = 1, 2, 3, 4 H0 : p ( x)X = altrove 0 (A) Calcolo del valore dell’indice Chi-quadro (I) fr attese (II) (III) xi fr ass Oi p(xi) Ei = p(xi)*200 (Oi - Ei)^2 (Oi - Ei)^2/Ei 1 2 3 4 40 60 45 55 0,25 0,25 0,25 0,25 50 50 50 50 100 100 25 25 2 2 0,5 0,5 200 1 5 (IV) = valore = somma colonna (III) indice Chiquadrato 2 Esercizi svolti sul test Chi-quadro di adattamento Corso di Statistica, a cura del prof. R. D’Angio’, 10/01/14 χ32 (B) Determinazione del valore critico (dove 3=4-1 sono i g.d.l.) Chin2 con g.d.l. n=4-1=3 La lettura inversa della tavola numerica della v.a. per 1-alfa=1-0,05 =0,95, ovvero ( P Chi32 < χ 32 ) = 1 − α = 0,95 ↑ dà (all’incrocio della colonna 0,95 e della riga n=3) il valore ← ↓ χ32 = 7,81. (C) Esecuzione del test Si ha: valore indice Chi-quadro =5 < valore critico χ32 = 7,81. H 0 che X sia una v.a. uniforme discreta con S X = {1, 2,3, 4} . Dunque non si rifiuta (cioè si “accetta”) l’ipotesi Esercizio 2. Per una v.a. X si assume che abbia la seguente funzione di probabilità 1/ 6, x = 4,10 H 0 : p X ( x ) = 2 / 6, x = 7,8 0 altrove Al fine di testare se la v.a. X in questione abbia effettivamente tale funzione di probabilità si sono osservati 300 valori di tale variabile ottenendo per ciascun valore x le frequenze assolute sotto indicate x fr ass 4 45 7 110 8 105 10 40 300 Per un livello di significatività pari a alfa=0,01, si verifichi l'ipotesi che la v.a. X abbia la suddetta funzione di probabilità. Svolgimento Esercizio 2. (A) Calcolo del valore dell’indice Chi-quadro (I) fr attese (II) (III) xi fr ass Oi p(xi) Ei = p(xi)*200 (Oi - Ei)^2 (Oi - Ei)^2/Ei 4 7 8 10 45 110 105 40 0,167 0,333 0,333 0,167 50 100 100 50 25 100 25 100 0,5 1 0,25 2 300 1 3,75 (IV) = valore = somma colonna (III) indice Chiqua (B) Determinazione del valore critico χ32 (dove 3=4-1 sono i g.d.l.) La lettura inversa della tavola numerica della v.a. Chin2 con g.d.l. n=4-1=3 3 Esercizi svolti sul test Chi-quadro di adattamento Corso di Statistica, a cura del prof. R. D’Angio’, 10/01/14 per 1-alfa=1-0,01 =0,99, ovvero ( P Chi32 < χ 32 ) = 1 − α = 0, 99 ↑ dà (all’incrocio della colonna 0,99 e della riga n=3) il valore ← χ32 ↓ = 11,3. (C) Esecuzione del test χ32 = 11,3. H 0 che la v.a. X abbia la funzione di probabilità sopra specificata. Valore indice Chi-quadro =3,75 < valore critico Dunque non si rifiuta (cioè si “accetta”) l’ipotesi NOTA BENE. Qualsiasi altro esercizio sul test Chi-quadro previsto dal programma si svolge con i tre step (A), (B), e (C) visti sopra. 4