La verifica di ipotesi: l’approccio NHST Un primo esempio: Verifica d’ipotesi sulla media della popolazione Corso di Psicometria Progredito 3.1 Introduzione all’inferenza statistica Prima Parte Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013 - 2014 La verifica di ipotesi: l’approccio NHST Un primo esempio: Verifica d’ipotesi sulla media della popolazione Sommario 1 2 La verifica di ipotesi: l’approccio NHST Un primo esempio: Verifica d’ipotesi sulla media della popolazione La verifica di ipotesi: l’approccio NHST Un primo esempio: Verifica d’ipotesi sulla media della popolazione Welcome :-) Benvenuti nel Meraviglioso Mondo dell’Inferenza Statistica! La verifica di ipotesi: l’approccio NHST Un primo esempio: Verifica d’ipotesi sulla media della popolazione L’inferenza statistica (G. Masarotto, 2006) L’obiettivo dell’inferenza statistica è di utilizzare i dati rilevati su un campione della popolazione, per fare delle affermazioni sulla popolazione stessa da cui il campione è stato estratto. La verifica di ipotesi: l’approccio NHST Un primo esempio: Verifica d’ipotesi sulla media della popolazione Il Null Hypothesis Statistical Signicance Testing Historically, researchers in psychology have relied heavily on Null Hypothesis Statistical Signicance Testing (NHST) (Publication Manual of the American Psychological Association (APA) - Sixth Edition, 2010). Attualmente l’approccio inferenziale maggiormente utilizzato nella ricerca in psicologia è l’approccio NHST. L’approccio NHST può essere considerato una “sorta di fusione” tra due approcci inferenziali collegati ma distinti: l’approccio dello studioso R. Fisher (1890 - 1962) e l’approccio della coppia di studiosi J. Neyman (1894 - 1981) e R. Pearson (1895 - 1980). La verifica di ipotesi: l’approccio NHST Un primo esempio: Verifica d’ipotesi sulla media della popolazione L’approccio NHST in estrema sintesi 1 Definizione di due ipotesi complementari ed esaustive: l’ipotesi nulla e l’ipotesi alternativa. 2 Calcolo di una opportuna funzione dei dati detta Statistica Test: T (X) = TOSS . 3 Confronto del valore osservato della statistica test TOSS con un valore critico fissato a priori TCRIT . 4 Sulla base del confronto si deciderà se rifiutare l’ipotesi nulla o se non la si potrà rifiutare. La verifica di ipotesi: l’approccio NHST Un primo esempio: Verifica d’ipotesi sulla media della popolazione L’approccio NHST: lo schema di procedimento 1 Definizione di due ipotesi complementari ed esaustive, dette H0 ipotesi nulla e H1 ipotesi alternativa. 2 Calcolo di una opportuna funzione dei dati detta Statistica Test: T (X) = T0 . La statistica test viene scelta tra quelle di cui si conosce la distribuzione di probabilità (“il comportamento”) se vale l’ipotesi nulla. 3 Confronto del valore osservato della statistica test TOSS con un valore critico fissato a priori TCRIT . In modo analogo si può confrontare la probabilità, se vale H0 , di ottenere un risultato della statistica test uguale o più estremo rispetto ad H0 (p-value osservato) con un livello di probabilità fissato a priori (p-value critico). 4 Sulla base del confronto si deciderà se rifiutare l’ipotesi nulla o se non la si potrà rifiutare. La verifica di ipotesi: l’approccio NHST Un primo esempio: Verifica d’ipotesi sulla media della popolazione 1. La costruzione del sistema di Verifica di Ipotesi Il primo passo è quello di definire due ipotesi contrapposte da sottoporre a verifica. Tradizionalmente si definisce l’ipotesi nulla H0 , che prevede l’assenza di un effetto rispetto al fenomeno di studio; e l’ipotesi alternativa o del ricercatore H1 , che prevede la presenza di un effetto. L’ipotesi alternativa può essere di tipo bidirezionale o di tipo monodirezionale. Sulla base di questa suddivisione si parlerà di test per la verifica di ipotesi bidirezionale o monodirezionale. ... vediamo un esempio! La verifica di ipotesi: l’approccio NHST Un primo esempio: Verifica d’ipotesi sulla media della popolazione 1. La costruzione del sistema di Verifica di Ipotesi Supponiamo di aver somministrato una prova sulle abilità matematiche a un campione di bambini di 8 anni. E’ noto che la media della popolazione dei bambini di 8 anni è pari a 24 risposte corrette. Ipotesi bidirezionale del ricercatore: La media di risposte corrette della popolazione da cui è estratto il campione di bambini differisce dalla media della popolazione di riferimento. Ipotesi monodirezionale del ricercatore: La media di risposte corrette della popolazione da cui è estratto il campione di bambini è maggiore dalla media della popolazione di riferimento. Sistema di verifica di ipotesi H0 : µ = 24 H1 : µ 6= 24 Sistema di verifica di ipotesi H0 : µ = 24 H1 : µ > 24 La verifica di ipotesi: l’approccio NHST Un primo esempio: Verifica d’ipotesi sulla media della popolazione 2. Calcolo del valore osservato della statistica test A questo punto, sui dati campionari X verrà calcolata una opportuna statistica test T (X) di cui si conosce la distribuzione di probabilità se vale l’ipotesi nulla. Nel nostro caso si tratterà rispettivamente della statistica Z e della distribuzione di probabilità normale con media 0 e varianza 1. Dopo aver calcolato il valore osservato della statistica test, si procede a individuare un valore critico stabilito sulla base di criteri probabilistici fissati a priori. La verifica di ipotesi: l’approccio NHST Un primo esempio: Verifica d’ipotesi sulla media della popolazione 3-4. Confronto tra valore osservato e valore critico, e decisione finale Se il valore osservato della statistica test è più estremo, rispetto all’ipotesi nulla, del valore critico, si rifiuterà l’ipotesi nulla. In caso contrario si concluderà affermando che l’ipotesi nulla non può essere rifiutata. ... qualche dubbio sul procedimento da eseguire e sul suo significato? Niente panico! Gli esempi che tratteremo in seguito chiariranno tutto :-) La verifica di ipotesi: l’approccio NHST Un primo esempio: Verifica d’ipotesi sulla media della popolazione La regione di accettazione e la regione di rifiuto La determinazione del valore critico ha l’obiettivo di suddividere in due regioni distinte lo spazio di valori che la statistica test può assumere la regione di accettazione e la regione di rifiuto. Se il valore osservato della statistica test appartiene alla regione di rifiuto, si concluderà rifiutando l’ipotesi nulla. Se il valore osservato della statistica test appartiene alla regione di accettazione, si concluderà affermando che l’ipotesi nulla non può essere rifiutata. La verifica di ipotesi: l’approccio NHST Un primo esempio: Verifica d’ipotesi sulla media della popolazione Accettare o rifiutare, cosa comporta? La suddivisione dei valori che la statistica test può assumere in due regioni distinte, può portare, in termini decisionali, alle seguenti 4 alternative. Status dell’ipotesi nella popolazione Decisione H0 vera H0 falsa H0 vera corretto sbagliato H0 falsa sbagliato corretto La verifica di ipotesi: l’approccio NHST Un primo esempio: Verifica d’ipotesi sulla media della popolazione Errore di primo tipo, di secondo tipo e potenza Status dell’ipotesi nella popolazione Decisione H0 vera H0 falsa H0 vera 1 − α β H0 falsa α 1−β dove: α è l’errore di primo tipo del test, e cioè la probabilità di rifiutare H0 quando essa è vera. β è l’errore di secondo tipo del test, e cioè la probabilità di non rifiutare H0 quando essa è falsa. 1 − β è la potenza del test, e cioè la probabilità di rifiutare H0 quando essa è falsa La verifica di ipotesi: l’approccio NHST Un primo esempio: Verifica d’ipotesi sulla media della popolazione Errore di primo tipo, di secondo tipo e potenza L’errore di primo tipo α viene stabilito a priori e determina direttamente il valore critico della statistica test. Tradizionalmente all’errore di primo tipo viene attribuito un valore pari a .05. A seconda del caso tuttavia, tale soglia può essere alzata ad esempio a .10, ottenendo così un test meno conservativo, o abbassata ad esempio a .01, ottenendo così un test più conservativo. L’errore di secondo tipo β non viene fissato a priori ma dipende da: il livello fissato per l’errore di primo tipo, la dimensione dell’effetto misurato e dalla numerosità campionaria. In particolare la potenza del test (1 − β) cresce all’aumentare della dimensione dell’effetto, della numerosità campionaria e dell’errore di primo tipo. La verifica di ipotesi: l’approccio NHST Un primo esempio: Verifica d’ipotesi sulla media della popolazione Prima di prendere il largo ... [1] I valori di α e β rappresentano delle probabilità e sono quindi dei numeri sempre compresi tra 0 e 1. La verifica di ipotesi: l’approccio NHST Un primo esempio: Verifica d’ipotesi sulla media della popolazione Prima di prendere il largo ... [2] Anche se ad essere fissato a priori è l’errore di primo tipo, è molto importante tenere sotto controllo la potenza del test che si utilizza. Nell’ambito delle scienze sociali, c’è un generale accordo sul fatto che la potenza di un test non dovrebbe scendere al di sotto di 0.8 (Cohen, 1977). Purtroppo nelle applicazioni pratiche nella ricerca in psicologia questo aspetto viene spesso sottovalutato :-( La verifica di ipotesi: l’approccio NHST Un primo esempio: Verifica d’ipotesi sulla media della popolazione Il corso a pagamento Un gruppo di 49 studenti universitari di età compresa tra i 20 e i 25 anni, ha seguito un corso a pagamento per migliorare le proprie capacità di memoria. Alla fine del corso è stato somministrato ai soggetti un test di memoria. Tale test prevede di elencare ai soggetti 30 parole e di rilevare, trascorsi 10 minuti, il numero di parole ricordate. Nel gruppo in esame la media di parole ricordate è stata di 20.2. Dalla letteratura è noto che in soggetti normali di età compresa tra i 20 e 25 anni, la media di parole ricordate è pari a 19.1 con varianza pari 64. Verificare ad un livello di significatività del 5% (α = 0.05), se il gruppo di studenti differisce, per capacità di memoria, dalla popolazione generale. La verifica di ipotesi: l’approccio NHST Un primo esempio: Verifica d’ipotesi sulla media della popolazione 1. La costruzione del sistema di Verifica di Ipotesi H0 : µ = 19.1 H1 : µ 6= 19.1 La verifica di ipotesi: l’approccio NHST Un primo esempio: Verifica d’ipotesi sulla media della popolazione 2. Calcolo del valore osservato della statistica test Nel caso di verifica di ipotesi sulla media della popolazione, con varianza nota, la statistica test da utilizzare è la statistica Z: X−µ 20.2 − 19.1 = zOSS = = .96 σ 8 √ 7 n dove: X è la media campionaria e µ la media della popolazione σ è la deviazione standard della popolazione e n la numerosità campionaria Dalla teoria sappiamo che se vale H0 la statistica test si distribuisce normalmente con media 0 e varianza 1. La verifica di ipotesi: l’approccio NHST Un primo esempio: Verifica d’ipotesi sulla media della popolazione 3. Confronto tra valore osservato e valore critico Per prima cosa determiniamo il valore critico del test per un livello di significatività critico pari a α = .05 Essendo il test bidirezionale dovremo cercare sulle tavole statistiche i quantili della distribuzione normale standard (normale con media 0 e varianza 1) che lasciano sulle code di sinistra e destra della distribuzione un’area totale di .05. Essendo la distribuzione normale simmetrica, ci basterà trovare il quantile positivo che lascia a destra un’area di probabilità pari a α/2 = .025. Il quantile negativo sarà pari al quantile positivo moltiplicato per -1. La verifica di ipotesi: l’approccio NHST Un primo esempio: Verifica d’ipotesi sulla media della popolazione 3. Confronto tra valore osservato e valore critico 0.5 Distribuzione normale standard Non Posso Rifiutare Ipotesi Nulla Rifiuto Ipotesi Nulla 0.3 0.2 0.1 0.0 Densità 0.4 Rifiuto Ipotesi Nulla α 2 α = 0.025 − zCRIT = − 1.96 2 0 Z zOSS = 0.96 = 0.025 zCRIT = 1.96 La verifica di ipotesi: l’approccio NHST Un primo esempio: Verifica d’ipotesi sulla media della popolazione 3-4. Confronto tra valore osservato e valore critico e decisione finale Dall’analisi condotta emerge che il valore osservato della statistica test è compreso tra i valori critici. L’ipotesi nulla che afferma che la media della capacità di memoria relativa agli studenti che hanno frequentato il corso a pagamento non differisce dalla media della popolazione, non può essere rifiutata per un livello di significatività pari al 5%. ... in sostanza, il corso non sembra aver prodotto effetti rilevanti (statisticamente significativi ) sulle capacità di memoria.