Strumenti informatici 4.4 - Realizzare il test per un

Strumenti informatici 4.4 - Realizzare il test per un campione con Excel
e SPSS
Per realizzare il test z per un campione con Excel, possiamo utilizzare la funzione
=TEST.Z(matrice;x;sigma), dove matrice è l’insieme di celle che contiene i punteggi delle
osservazioni, x è la media della popolazione, sigma la deviazione standard della popolazione. Se σ
non è noto e/o non viene inserito, la funzione utilizza la deviazione standard del campione. Il
risultato è la probabilità che i dati osservati siano il risultato di un’ipotesi nulla vera con ipotesi
alternativa bidirezionale.
Una volta organizzati i dati in colonna come in Figura 4.4.1, selezioniamo una delle celle
vuote e clickiamo su , oppure seguiamo il percorso Inserisci → Funzione, e scegliamo la
funzione TEST.Z.
Figura 4.4.1 Organizzazione dei dati per il test z per un campione con Excel
La Figura 4.4.2 mostra la finestra degli argomenti della funzione. Nel campo Matrice inseriamo
l’intervallo di celle che contiene i dati, nel campo X la media nota della popolazione, nel campo
Sigma la deviazione standard nota della popolazione.
Figura 4.4.2 Inserimento degli argomenti della funzione di Excel TEST.Z
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Dopo aver premuto OK, nella cella comparirà la probabilità che i dati ottenuti siano il risultato di
un’ipotesi nulla vera (in questo caso, ,093), a cui corrisponde uno z di 1,32 [ottenibile mediante la
funzione =INV.NORM.ST(,093)], che è quello individuato nel testo. Se non avessimo inserito σ, il
risultato sarebbe stato ,028, che corrisponde alla probabilità che i dati osservati siano il risultato di
un’ipotesi nulla vera con test z a due code calcolato con una formula in cui s non è
(x − M ) 2
, ma
n
(x − M ) 2
, e nella formula per l’errore standard stimato si divide s per n , e non per
n −1
M −µ
n − 1 . La formula è quindi z =
= 1,91 . Il problema è che questo valore non è distribuito
sP
sP =
n
come z, ma come t, per cui per campioni inferiori a 30 la funzione di Excel =TEST.Z non dovrebbe
essere utilizzata per il test delle medie per un campione, in quanto la probabilità che restituisce è
ottenuta da una distribuzione teorica non adeguata. Attenzione inoltre a non farsi trarre inganno
dalla funzione =TEST.T, poiché questa consente solo il confronto fra due campioni (vedi Capitolo
5).
Con SPSS, dopo aver inserito i dati in una colonna, si segue il percorso Analyze → Compare
Means → One-sample T test (Figura 4.4.3)
Figura 4.4.3 Percorso di SPSS per realizzare un test z per un campione
Nella finestra che si apre occorre inserire la variabile che contiene i punteggi dei soggetti nel campo
Test Variable(s) e impostare la media della popolazione nel campo Test Value, come in Figura
4.4.4.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Figura 4.4.4 Impostazioni necessarie per realizzare un test z per un campione in SPSS
Le opzioni contenute in Options non sono particolarmente numerose. Consentono però di impostare
il livello di probabilità per l’intervallo di fiducia della differenza fra la media campionaria e la
media della popolazione, che viene riportato nell’output (Figura 4.4.5). Il valore di default è 95%.
One-Sample Statistics
N
Punteggio
10
Mean
27,3000
Std. Deviation
4,29599
Std. Error
Mean
1,35851
One-Sample Test
Test Value = 24.70
Punteggio
t
1,914
df
9
Sig. (2-tailed)
,088
Mean
Difference
2,60000
95% Confidence
Interval of the
Difference
Lower
Upper
-,4732
5,6732
Figura 4.4.5 Output di SPSS per il test z per un campione
Nella prima tabella di output (One-Sample Statistics) vengono riportate le statistiche descrittive del
campione. Come in Excel, la deviazione standard è calcolata con la formula s P =
l’errore standard con la formula
(x − M ) 2
,e
n −1
sP
. Nella seconda tabella (One-Sample Test) viene riportata la
n
media della popolazione (Test Value = 24,70), il valore di t, i gradi di libertà (df, dall’inglese
degrees of freedom), la probabilità a due code (Sig. (2-tailed), la differenza media (Mean
Difference) e l’intervallo di fiducia al 95% per la differenza (95% Confidence Interval of the
Difference). Per quanto SPSS non consenta l’inserimento della varianza della popolazione,
quand’anche fosse nota, riferisce però correttamente il valore standardizzato alla distribuzione t. Il
valore di t calcolato infatti è analogo a quello ottenuto nel testo e con Excel, ma la probabilità è
determinata in base ad una distribuzione t con 9 gradi di libertà.
In una tesi di laurea o in un articolo scientifico scriveremmo:
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
E’ stato eseguito un test t per un campione per verificare se il punteggio medio di Nevroticismo di
un campione di 10 studenti di psicologia (M = 27,30, DS = 4,30) era diverso da quello della
popolazione generale (M = 24,70). E’ emerso che la differenza non era statisticamente significativa1
(t(9) = 1,91, p > ,05, d = 0,42).
1
Si noti come il valore di t venga riportato nel seguente modo: t, aperta parentesi, gradi di libertà del test t, chiusa
parentesi, uguale, valore di t calcolato).
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia