3.1 Introduzione all`inferenza statistica Prima Parte

La verifica di ipotesi: l’approccio NHST
Un primo esempio: Verifica d’ipotesi sulla media della popolazione
Corso di Psicometria Progredito
3.1 Introduzione all’inferenza statistica
Prima Parte
Gianmarco Altoè
Dipartimento di Pedagogia, Psicologia e Filosofia
Università di Cagliari, Anno Accademico 2013 - 2014
La verifica di ipotesi: l’approccio NHST
Un primo esempio: Verifica d’ipotesi sulla media della popolazione
Sommario
1
2
La verifica di ipotesi: l’approccio NHST
Un primo esempio: Verifica d’ipotesi sulla media della
popolazione
La verifica di ipotesi: l’approccio NHST
Un primo esempio: Verifica d’ipotesi sulla media della popolazione
Welcome :-)
Benvenuti nel Meraviglioso Mondo
dell’Inferenza Statistica!
La verifica di ipotesi: l’approccio NHST
Un primo esempio: Verifica d’ipotesi sulla media della popolazione
L’inferenza statistica
(G. Masarotto, 2006)
L’obiettivo dell’inferenza statistica è di utilizzare i dati
rilevati su un campione della popolazione, per fare delle
affermazioni sulla popolazione stessa da cui il campione
è stato estratto.
La verifica di ipotesi: l’approccio NHST
Un primo esempio: Verifica d’ipotesi sulla media della popolazione
Il Null Hypothesis Statistical Signicance Testing
Historically, researchers in psychology have relied heavily on
Null Hypothesis Statistical Signicance Testing (NHST)
(Publication Manual of the American Psychological
Association (APA) - Sixth Edition, 2010).
Attualmente l’approccio inferenziale maggiormente utilizzato
nella ricerca in psicologia è l’approccio NHST.
L’approccio NHST può essere considerato una “sorta di
fusione” tra due approcci inferenziali collegati ma distinti:
l’approccio dello studioso R. Fisher (1890 - 1962) e
l’approccio della coppia di studiosi J. Neyman (1894 - 1981)
e R. Pearson (1895 - 1980).
La verifica di ipotesi: l’approccio NHST
Un primo esempio: Verifica d’ipotesi sulla media della popolazione
L’approccio NHST in estrema sintesi
1
Definizione di due ipotesi complementari ed esaustive: l’ipotesi
nulla e l’ipotesi alternativa.
2
Calcolo di una opportuna funzione dei dati detta Statistica Test:
T (X) = TOSS .
3
Confronto del valore osservato della statistica test TOSS con un
valore critico fissato a priori TCRIT .
4
Sulla base del confronto si deciderà se rifiutare l’ipotesi nulla o se
non la si potrà rifiutare.
La verifica di ipotesi: l’approccio NHST
Un primo esempio: Verifica d’ipotesi sulla media della popolazione
L’approccio NHST: lo schema di procedimento
1
Definizione di due ipotesi complementari ed esaustive, dette H0
ipotesi nulla e H1 ipotesi alternativa.
2
Calcolo di una opportuna funzione dei dati detta Statistica Test:
T (X) = T0 . La statistica test viene scelta tra quelle di cui si
conosce la distribuzione di probabilità (“il comportamento”) se vale
l’ipotesi nulla.
3
Confronto del valore osservato della statistica test TOSS con un
valore critico fissato a priori TCRIT . In modo analogo si può
confrontare la probabilità, se vale H0 , di ottenere un risultato della
statistica test uguale o più estremo rispetto ad H0 (p-value
osservato) con un livello di probabilità fissato a priori (p-value
critico).
4
Sulla base del confronto si deciderà se rifiutare l’ipotesi nulla o se
non la si potrà rifiutare.
La verifica di ipotesi: l’approccio NHST
Un primo esempio: Verifica d’ipotesi sulla media della popolazione
1. La costruzione del sistema di Verifica di Ipotesi
Il primo passo è quello di definire due ipotesi contrapposte da
sottoporre a verifica.
Tradizionalmente si definisce l’ipotesi nulla H0 , che prevede
l’assenza di un effetto rispetto al fenomeno di studio;
e l’ipotesi alternativa o del ricercatore H1 , che prevede la
presenza di un effetto.
L’ipotesi alternativa può essere di tipo bidirezionale o di tipo
monodirezionale. Sulla base di questa suddivisione si parlerà
di test per la verifica di ipotesi bidirezionale o
monodirezionale.
... vediamo un esempio!
La verifica di ipotesi: l’approccio NHST
Un primo esempio: Verifica d’ipotesi sulla media della popolazione
1. La costruzione del sistema di Verifica di Ipotesi
Supponiamo di aver somministrato una prova sulle abilità matematiche
a un campione di bambini di 8 anni. E’ noto che la media della
popolazione dei bambini di 8 anni è pari a 24 risposte corrette.
Ipotesi bidirezionale
del ricercatore:
La media di risposte corrette della
popolazione da cui è estratto il
campione di bambini differisce dalla
media della popolazione di riferimento.
Ipotesi monodirezionale
del ricercatore:
La media di risposte corrette della
popolazione da cui è estratto il
campione di bambini è maggiore dalla
media della popolazione di riferimento.
Sistema di verifica di ipotesi
H0 : µ = 24
H1 : µ 6= 24
Sistema di verifica di ipotesi
H0 : µ = 24
H1 : µ > 24
La verifica di ipotesi: l’approccio NHST
Un primo esempio: Verifica d’ipotesi sulla media della popolazione
2. Calcolo del valore osservato della statistica test
A questo punto, sui dati campionari X verrà calcolata una
opportuna statistica test T (X) di cui si conosce la
distribuzione di probabilità se vale l’ipotesi nulla.
Nel nostro caso si tratterà rispettivamente della statistica Z
e della distribuzione di probabilità normale con media 0 e
varianza 1.
Dopo aver calcolato il valore osservato della statistica test, si
procede a individuare un valore critico stabilito sulla base di
criteri probabilistici fissati a priori.
La verifica di ipotesi: l’approccio NHST
Un primo esempio: Verifica d’ipotesi sulla media della popolazione
3-4. Confronto tra valore osservato e valore critico,
e decisione finale
Se il valore osservato della statistica test è più estremo,
rispetto all’ipotesi nulla, del valore critico, si rifiuterà l’ipotesi
nulla.
In caso contrario si concluderà affermando che l’ipotesi nulla
non può essere rifiutata.
... qualche dubbio sul procedimento da eseguire e sul suo
significato? Niente panico! Gli esempi che tratteremo in
seguito chiariranno tutto :-)
La verifica di ipotesi: l’approccio NHST
Un primo esempio: Verifica d’ipotesi sulla media della popolazione
La regione di accettazione e la regione di rifiuto
La determinazione del valore critico ha l’obiettivo di suddividere in
due regioni distinte lo spazio di valori che la statistica test può
assumere la regione di accettazione e la regione di rifiuto.
Se il valore osservato della statistica test appartiene alla
regione di rifiuto, si concluderà rifiutando l’ipotesi nulla.
Se il valore osservato della statistica test appartiene alla
regione di accettazione, si concluderà affermando che
l’ipotesi nulla non può essere rifiutata.
La verifica di ipotesi: l’approccio NHST
Un primo esempio: Verifica d’ipotesi sulla media della popolazione
Accettare o rifiutare, cosa comporta?
La suddivisione dei valori che la statistica test può assumere in
due regioni distinte, può portare, in termini decisionali, alle
seguenti 4 alternative.
Status dell’ipotesi
nella popolazione
Decisione
H0 vera H0 falsa
H0 vera corretto sbagliato
H0 falsa sbagliato corretto
La verifica di ipotesi: l’approccio NHST
Un primo esempio: Verifica d’ipotesi sulla media della popolazione
Errore di primo tipo, di secondo tipo e potenza
Status dell’ipotesi
nella popolazione
Decisione
H0 vera H0 falsa
H0 vera 1 − α
β
H0 falsa
α
1−β
dove:
α è l’errore di primo tipo del test, e cioè la probabilità di
rifiutare H0 quando essa è vera.
β è l’errore di secondo tipo del test, e cioè la probabilità di
non rifiutare H0 quando essa è falsa.
1 − β è la potenza del test, e cioè la probabilità di rifiutare
H0 quando essa è falsa
La verifica di ipotesi: l’approccio NHST
Un primo esempio: Verifica d’ipotesi sulla media della popolazione
Errore di primo tipo, di secondo tipo e potenza
L’errore di primo tipo α viene stabilito a priori e determina
direttamente il valore critico della statistica test.
Tradizionalmente all’errore di primo tipo viene attribuito un
valore pari a .05. A seconda del caso tuttavia, tale soglia può
essere alzata ad esempio a .10, ottenendo così un test meno
conservativo, o abbassata ad esempio a .01, ottenendo così
un test più conservativo.
L’errore di secondo tipo β non viene fissato a priori ma
dipende da: il livello fissato per l’errore di primo tipo, la
dimensione dell’effetto misurato e dalla numerosità
campionaria.
In particolare la potenza del test (1 − β) cresce all’aumentare
della dimensione dell’effetto, della numerosità campionaria e
dell’errore di primo tipo.
La verifica di ipotesi: l’approccio NHST
Un primo esempio: Verifica d’ipotesi sulla media della popolazione
Prima di prendere il largo ... [1]
I valori di α e β rappresentano delle probabilità e
sono quindi dei numeri sempre compresi tra 0 e 1.
La verifica di ipotesi: l’approccio NHST
Un primo esempio: Verifica d’ipotesi sulla media della popolazione
Prima di prendere il largo ... [2]
Anche se ad essere fissato a priori è l’errore di primo tipo, è
molto importante tenere sotto controllo la potenza del test
che si utilizza.
Nell’ambito delle scienze sociali, c’è un generale accordo sul
fatto che la potenza di un test non dovrebbe scendere al di
sotto di 0.8 (Cohen, 1977).
Purtroppo nelle applicazioni pratiche nella ricerca in
psicologia questo aspetto viene spesso sottovalutato :-(
La verifica di ipotesi: l’approccio NHST
Un primo esempio: Verifica d’ipotesi sulla media della popolazione
Il corso a pagamento
Un gruppo di 49 studenti universitari di età compresa tra i 20
e i 25 anni, ha seguito un corso a pagamento per migliorare
le proprie capacità di memoria.
Alla fine del corso è stato somministrato ai soggetti un test di
memoria. Tale test prevede di elencare ai soggetti 30 parole
e di rilevare, trascorsi 10 minuti, il numero di parole ricordate.
Nel gruppo in esame la media di parole ricordate è stata di
20.2.
Dalla letteratura è noto che in soggetti normali di età
compresa tra i 20 e 25 anni, la media di parole ricordate è
pari a 19.1 con varianza pari 64.
Verificare ad un livello di significatività del 5% (α = 0.05), se
il gruppo di studenti differisce, per capacità di memoria, dalla
popolazione generale.
La verifica di ipotesi: l’approccio NHST
Un primo esempio: Verifica d’ipotesi sulla media della popolazione
1. La costruzione del sistema di Verifica di Ipotesi
H0 : µ = 19.1
H1 : µ 6= 19.1
La verifica di ipotesi: l’approccio NHST
Un primo esempio: Verifica d’ipotesi sulla media della popolazione
2. Calcolo del valore osservato della statistica test
Nel caso di verifica di ipotesi sulla media della popolazione, con
varianza nota, la statistica test da utilizzare è la statistica Z:
X−µ
20.2 − 19.1
=
zOSS = = .96
σ
8
√
7
n
dove:
X è la media campionaria e µ la media della popolazione
σ è la deviazione standard della popolazione e n la
numerosità campionaria
Dalla teoria sappiamo che se vale H0 la statistica test si
distribuisce normalmente con media 0 e varianza 1.
La verifica di ipotesi: l’approccio NHST
Un primo esempio: Verifica d’ipotesi sulla media della popolazione
3. Confronto tra valore osservato e valore critico
Per prima cosa determiniamo il valore critico del test per un
livello di significatività critico pari a α = .05
Essendo il test bidirezionale dovremo cercare sulle tavole
statistiche i quantili della distribuzione normale standard
(normale con media 0 e varianza 1) che lasciano sulle code di
sinistra e destra della distribuzione un’area totale di .05.
Essendo la distribuzione normale simmetrica, ci basterà
trovare il quantile positivo che lascia a destra un’area di
probabilità pari a α/2 = .025. Il quantile negativo sarà pari al
quantile positivo moltiplicato per -1.
La verifica di ipotesi: l’approccio NHST
Un primo esempio: Verifica d’ipotesi sulla media della popolazione
3. Confronto tra valore osservato e valore critico
0.5
Distribuzione normale standard
Non Posso Rifiutare Ipotesi Nulla
Rifiuto Ipotesi Nulla
0.3
0.2
0.1
0.0
Densità
0.4
Rifiuto Ipotesi Nulla
α
2
α
= 0.025
− zCRIT = − 1.96
2
0
Z
zOSS = 0.96
= 0.025
zCRIT = 1.96
La verifica di ipotesi: l’approccio NHST
Un primo esempio: Verifica d’ipotesi sulla media della popolazione
3-4. Confronto tra valore osservato e valore critico e
decisione finale
Dall’analisi condotta emerge che il valore osservato della
statistica test è compreso tra i valori critici.
L’ipotesi nulla che afferma che la media della capacità di
memoria relativa agli studenti che hanno frequentato il corso
a pagamento non differisce dalla media della popolazione, non
può essere rifiutata per un livello di significatività pari al 5%.
... in sostanza, il corso non sembra aver prodotto effetti
rilevanti (statisticamente significativi ) sulle capacità di
memoria.