14-Introduzione all`analisi della potenza statistica

Elementi di Psicometria con Laboratorio di SPSS 1
14-Introduzione all’analisi della potenza statistica
(vers. 1.2a, 11 dicembre 2015)
Germano Rossi1
[email protected]
1
Dipartimento di Psicologia, Università di Milano-Bicocca
2015-16
G. Rossi (Dip. Psicologia)
ElemPsico
2015-16
1 / 25
Analisi della potenza
È il capitolo 14 del libro di testo
Studiare fino a p.265
Leggere a p. 265 “La verifica d’ipotesi sulla media di una
popolazione”
Saltare “proporzione” a p. 270, “correlazione” a p.272
Leggere “differenza fra le medie” a p. 273, “medie appaiate” a
p.278, “come stimare” a p.279
Leggere “interpretazione” a p. 281
G. Rossi (Dip. Psicologia)
ElemPsico
2015-16
2 / 25
Introduzione
Ogni volta che si inizia a fare una ricerca ci si trova ad affrontare
diversi problemi: uno di questi è l’ampiezza del campione
Devo raccogliere almeno 100 soggetti? o ne bastano 30?
La ragione di questa domanda è duplice
Più piccolo è il campione, meno tempo (e fatica) è necessario per
raccogliere i dati
Più grande è il campione, più probabilità abbiamo di ottenere
risultati significativi
A questa domanda ci sono diverse risposte comuni (si ricordi che
la statistica ipotizza un campione casuale)
1
2
3
Almeno 30 per ogni gruppo formato dalle variabili indipendenti
Un campione il più grande possibile
Non si sa esattamente quanto dev’essere grande
G. Rossi (Dip. Psicologia)
ElemPsico
2015-16
3 / 25
Grandezza di un campione
La prima risposta fa riferimento alla teoria campionaria, per cui
con campioni di 30 o più osservazioni, la distribuzione
campionaria tende a distribuirsi normalmente anche se la
variabile non è normale
La seconda risposta dipende dall’idea che se il campione è molto
grande sia più facile trovare un risultato significativo
L’ultima risposta non è accettabile, salvo:
quando non si conosce assolutamente nulla sull’argomento di
ricerca
2 si hanno molte variabili indipendenti e molte dipendenti
3 si è interessati più ad una ricerca esplorativa che ad una ricerca
inferenziale vera e propria
1
G. Rossi (Dip. Psicologia)
ElemPsico
2015-16
4 / 25
Grandezza di un campione
La grandezza del campione dovrebbe quella che permette di
rispondere alle ipotesi di ricerca, considerando che:
il risultato dipende dalla dimensione dell’effetto che si studia (un
effetto “grande” verrà rilevato anche con poche osservazioni,
mentre uno “piccolo” necessita di più casi)
dal rischio di sbagliare la nostra decisione (cioè dall’errore di I e di
II tipo che utilizziamo); un α elevato produrrà più rifiuti di H0 e uno
più piccolo più rifiuti di H1
G. Rossi (Dip. Psicologia)
ElemPsico
2015-16
5 / 25
Relazioni fra errori e ipotesi
Risultato
ricerca
Accetto H0 ; rifiuto H1
Rifiuto H0 ; accetto H1
Realtà
H0 - Vera
H0 - Falsa
H1 - Falsa
H1 - Vera
Corretta
Errore II tipo
1−α
β
Errore I tipo
Corretta
α
1−β
Se α è la probabilità di rifiutare H0 quando è vera, 1 − α sarà la
probabilità di accettare H0 quando è vera
Analogamente se β è la probabilità di accettare H0 quando è falsa,
1 − β sarà la probabilità di rifiutare H0 quando è falsa
1 − β è chiamata potenza di un test e corrisponde alla probabilità di
rilevare una relazione veramente esistente nella realtà
G. Rossi (Dip. Psicologia)
ElemPsico
2015-16
6 / 25
Analisi della potenza
La potenza statistica di un test è la sua capacità di rifiutare un
ipotesi nulla falsa, perché noi, in genere, verifichiamo un’ipotesi
nulla rispetto ad una “gamma” di ipotesi alternative (ad es.
H1 : µ1 6= µ2 )
Come ricercatori, facciamo molti sforzi per organizzare e fare una
ricerca che ci dia conoscenze “sicure” e “affidabili”. Ma i nostri
sforzi sono vani se non riusciamo a trovare i risultati che ci
aspettiamo, o meglio, se non riusciamo a falsificare con maggior
sicurezza la nostra ipotesi.
Per molti anni, i ricercatori si sono focalizzati sul rischio di rifiutare
H0 quando è vera (atteggiamento conservatore)
Di recente ha acquisito importanza anche l’errore opposto.
Riassumiamo un momento le procedure di verifica d’ipotesi
G. Rossi (Dip. Psicologia)
ElemPsico
2015-16
7 / 25
Verifica d’ipotesi
All’inizio di una ricerca, partiamo generalmente da un’ipotesi che
è espressa a parole. Ad es. “A causa delle nuove tecnologie di
comunicazione veloce (e-mail, sms, chat, cellulari) gli studenti
passano meno tempo a stabilire relazioni personali dirette fra di
loro”.
Siccome qualcuno ha raccolto dati sul tempo trascorso in relazioni
personali negli anni precedenti (M=6 ore alla settimana; s=2),
posso raccogliere un nuovo campione da confrontare con il
precedente
Possiamo trasformare la nostra ipotesi verbale in ipotesi statistica:
H0 : µ = 6.0
H1 : µ < 6.0
G. Rossi (Dip. Psicologia)
ElemPsico
2015-16
8 / 25
Verifica d’ipotesi
Ricordiamo che noi verifichiamo l’ipotesi nulla confrontandola con
un’ipotesi alternativa.
L’ipotesi nulla è ciò che è noto o che si assume in base alla teoria
o alle ricerche precedenti.
Nel nostro esempio, la ricerca precedente, ci ha detto che gli
studenti universitari hanno speso circa 6 ore della settimana in
contatti faccia-a-faccia (più o meno 2 ore).
Così, la nostra ipotesi è che µ = 6.0.
L’errore α ci protegge dal prendere una decisione errata basata su
un campione “particolarmente anomalo” estratto dalla
popolazione corretta
La potenza di un test (1 − β) ci dice la probabilità di aver accettato
correttamente l’ipotesi alternativa
G. Rossi (Dip. Psicologia)
ElemPsico
2015-16
9 / 25
Concetti chiave della potenza
Ricordiamo che la potenza statistica di un test è la sua capacità di
rifiutare un ipotesi nulla falsa e che è legata al test statistico usato.
Ci sono 3 variabili legate alla potenza di un test:
1
Il livello di significatività cioè α:
più è severo (vicino a 0), più è difficile rifiutare l’ipotesi nulla (anche
quando è falsa).
all’aumentare di α aumenta la potenza del test. Tuttavia non
possiamo usare α molto grandi
un buon criterio (non troppo basso, né troppo alto) è α = 0.05 (per
ricerche esplorative possiamo usare valori leggermente maggiori)
G. Rossi (Dip. Psicologia)
ElemPsico
2015-16
10 / 25
Concetti chiave della potenza
2
L’ampiezza del campione cioè N
quando un campione è grande, è meno probabile fare errori di
campionamento
e trovare dati che portino a stime inaffidabili dei parametri della
popolazione.
L’errore standard è sempre basato su N e diminuisce all’aumentare
di N .
Quindi all’aumentare di N , aumenta la potenza
3
La dimensione dell’effetto nella popolazione cioè d o r;
la dimensione dell’effetto è misurabile in modo “grezzo” (la d o g
del t-test)
o in modo “standardizzato” (la φ del chi-quadro), cioè tramite una
correlazione
G. Rossi (Dip. Psicologia)
ElemPsico
2015-16
11 / 25
Concetti chiave della potenza
3
La dimensione dell’effetto nella popolazione cioè d o r;
ovvero quanto grande è il risultato che abbiamo ottenuto;
ricordiamo che d o r ha senso solo se H0 è falsa;
quindi possiamo considerare d o r come una misura di quanto è
falsa l’ipotesi nulla;
tanto più d o r è grande, tanto più H0 è falsa, tanto più aumenta la
potenza
4
Possiamo considerare la potenza statistica (cioè 1 − β) come un
quarto elemento
Essendo legati fra loro matematicamente; si può calcolare il
valore del quarto conoscendo il valore degli altri tre
G. Rossi (Dip. Psicologia)
ElemPsico
2015-16
12 / 25
Concetti chiave della potenza
Potenza (1 − β)
aumenta diminuisce
Riassumendo:
quando α
quando N
quando d o r
aumenta
aumenta
aumenta
diminuisce
diminuisce
diminuisce
La formula che lega i quattro indici è abbastanza complessa
per cui sono state predisposte delle tavole (Tavola D a p. 476) che
utilizzano α e una combinazione di d ed N chiamata δ:
δ = df (N )
dove f () indica “funzione di”
ed esistono dei software appositi (ad es. G*Power,
http://www.gpower.hhu.de/en.html che è free)
G. Rossi (Dip. Psicologia)
ElemPsico
2015-16
13 / 25
Uso dell’analisi di potenza
L’analisi di potenza viene usata, generalmente, per due obiettivi
1
a posteriori per determinare la potenza di un test: dal momento
che la ricerca viene effettuata su un certo campione (di ampiezza
N) e usando un certo livello α, e dai risultati ottenuti possiamo
calcolare d, ne consegue la possibilità di stimare la potenza di un
test, cioè la probabilità di aver fatto la scelta giusta;
2
a priori per determinare la numerosità del campione: se
vogliamo fare una ricerca che abbia una determinata potenza,
una volta stabilito un determinato α e ipotizzato un determinato d,
quale dev’essere l’ampiezza del campione?
G. Rossi (Dip. Psicologia)
ElemPsico
2015-16
14 / 25
Calcolare la potenza a priori
Ipotizziamo di voler fare una ricerca su un campione patologico
(ad es. pazienti di un servizio mentale)
Possiamo fare una ricerca veloce (in termini di tempo) su un
piccolo campione
oppure una ricerca che duri più tempo per poter raccogliere un
campione più grande
certamente non vogliamo fare una ricerca che non abbia
abbastanza “potenza” e che possa essere criticata
Decidiamo quindi una potenza minima che vogliamo raggiungere,
un effect size che ci aspettiamo e calcoliamo quanto dev’essere
ampio il campione da raccogliere.
G. Rossi (Dip. Psicologia)
ElemPsico
2015-16
15 / 25
Calcolare la potenza a posteriori
Abbiamo raccolto un certo campione su cui abbiamo misurato una certa
variabile
Abbiamo stabilito un livello α = .05
L’analisi dei dati, ci ha fornito i valori da utilizzare per il calcolo dell’effect
size
A questo punto abbiamo due strade (sia per l’approccio a priori sia per
quello a posteriori):
1
fare un calcolo a mano e usare le tavole (slide ??)
in questo caso ci serve solo di sapere qual è la funzione da applicare
ad N per trovare δ, e poi cercare il valore corrispondente alla potenza
sulla tavola D o E del libro
La funzione f (N ) cambia in base alla tecnica statistica utilizzata
2
usare il software G*Power (slide 21)
G. Rossi (Dip. Psicologia)
ElemPsico
2015-16
16 / 25
Potenza per la Media di una popolazione (a mano)
La funzione è f (N ) =
√
N
l’ipotesi alternativa coincide con il valore della media del campione
calcoliamo
troviamo δ = d ×
d = (µ1 − µ0 )/σ
√
N
Ipotizziamo di conoscere µ e σ della popolazione: µ = 84 e σ = 12; di aver
calcolato i seguenti valori su un campione di N = 60: M = 76.92; s = 15.05.
Le nostre ipotesi saranno: H0 : µ = 84
H1 : µ 6= 76, 92
√
d = (84 − 76, 92)/12 = 0.59
δ = 0.59 60 = 4.570
Se cerchiamo sulla tavola D un δ = 4.57 (4.5) troviamo una potenza statistica
di 0.99 Per α = .05 bidirezionale
G. Rossi (Dip. Psicologia)
ElemPsico
2015-16
17 / 25
Potenza per la Differenza delle medie (a mano)
r
n
2
Se N1 = N2 , allora n = N1
La funzione è f (N ) =
Se N1 6= N2 , allora
n=
2 × N1 × N2
N1 + N2
l’ipotesi alternativa coincide con il valore della media del campione
usiamo l’effect size di t (cioè g)
troviamo
r
δ=g
G. Rossi (Dip. Psicologia)
ElemPsico
n
2
2015-16
18 / 25
Differenza delle medie (a mano)
Facciamo riferimento alle slide 19-20 del cap. 11 per la variabile
Estr_pers
Avevamo: N=158 maschi e N=181 femmine, con t = −3.940
Calcoliamo l’effect size
r
r
N1 + N2
158 + 181
= 3.94
= 0.4289713
g=t
N1 × N2
158 × 181
quindi
n=
troviamo
2 × 158 × 181
= 168.7198
158 + 181
r
r
n
168.7198
δ=d
= 0.4289713
= 3.94
2
2
Dalla Tavola D, troviamo un potenza di 0.97
G. Rossi (Dip. Psicologia)
ElemPsico
2015-16
19 / 25
Stimare la numerosità (a mano)
per la differenza di due medie (campioni indipendenti) la funzione
da usare è:
2
δ
n=2
d
sulla Tavola E (p. 477), per un test a due code con α = 0.05 e una
potenza statistica di 0.90, δ = 3.24
Facciamo ancora riferimento alle slide 19-20 del cap. 11 per la
variabile Estr_pers
Vorremmo ottenere un d = .50 e perciò
n=2
3.24
.50
2
= 84
corrispondente ad un campione totale di 168
G. Rossi (Dip. Psicologia)
ElemPsico
2015-16
20 / 25
Calcolare la potenza di un test con G*Power
Facciamo riferimento alle slide 19-20 del cap. 11 per la variabile
Estr_pers
Avevamo: N=158 maschi e N=181 femmine, con t = −3.940
Abbiamo stabilito un livello α = .05, e calcoliamo l’effect size
r
r
N1 + N2
158 + 181
g=t
= 3.94
= 0.4289713
N1 × N2
158 × 181
In G*Power, scegliamo Test family = t-tests, Statistical test =
Means: Difference between two independent means (two
groups), Type of power analysis = post hoc: Compute
achieved power
Inseriamo in Effect size d = .43, in α err prob 0.05, in Sample
size group 1 158 e in Sample size group 2 181
Clicchiamo Calculate
G. Rossi (Dip. Psicologia)
ElemPsico
2015-16
21 / 25
Videata con G*Power
La potenza è 0.967
G. Rossi (Dip. Psicologia)
ElemPsico
2015-16
22 / 25
Numerosità del campione con G*Power
In G*Power, scegliamo Test family = t-tests, Statistical test = Means:
Difference between two independent means (two groups), Type
of power analysis = A priori: ...
Inseriamo Effect size d = .50, α err prob = 0.05, Power = .60, Allocation
ratio N2/N1 = 1
Clicchiamo Calculate: ci servono due campioni di 41 casi ciascuno
G. Rossi (Dip. Psicologia)
ElemPsico
2015-16
23 / 25
Numerosità del campione con G*Power
Cambiando ratio N2/N1, indichiamo di voler/poter usare campioni di diversa
numerosità
G. Rossi (Dip. Psicologia)
ElemPsico
2015-16
24 / 25
Interpretazione
Un risultato non significativo non è necessariamente vero: se
accettiamo per vera H0 , questo non significa che sia “realmente”
vera. Se la potenza di un esperimento è bassa (ad es. .50), beta
sarà alto (1 − .50 = .50); quindi avremo il 95% di probabilità
(1 − .05) che H0 sia vera, ma il 50% che sia falsa
Significatività con piccoli campioni: Nel caso del test t, t è
parte di g; se t è molto alto, anche g lo sarà, se g è alto anche la
potenza sarà alta (e beta sarà basso). Quindi un risultato t molto
alto è molto più importante se ottenuto su piccoli campioni che su
grandi campioni.
Grandi campioni e significatività: con grandi campioni è più
facile ottenere un t grande e quindi significativo; bisogna quindi
considerare d (o g) per sapere l’effettiva sicurezza da dare al
risultato raggiunto
G. Rossi (Dip. Psicologia)
ElemPsico
2015-16
25 / 25