Strumenti informatici 4.4 - Realizzare il test per un campione con Excel e SPSS Per realizzare il test z per un campione con Excel, possiamo utilizzare la funzione =TEST.Z(matrice;x;sigma), dove matrice è l’insieme di celle che contiene i punteggi delle osservazioni, x è la media della popolazione, sigma la deviazione standard della popolazione. Se σ non è noto e/o non viene inserito, la funzione utilizza la deviazione standard del campione. Il risultato è la probabilità che i dati osservati siano il risultato di un’ipotesi nulla vera con ipotesi alternativa bidirezionale. Una volta organizzati i dati in colonna come in Figura 4.4.1, selezioniamo una delle celle vuote e clickiamo su , oppure seguiamo il percorso Inserisci → Funzione, e scegliamo la funzione TEST.Z. Figura 4.4.1 Organizzazione dei dati per il test z per un campione con Excel La Figura 4.4.2 mostra la finestra degli argomenti della funzione. Nel campo Matrice inseriamo l’intervallo di celle che contiene i dati, nel campo X la media nota della popolazione, nel campo Sigma la deviazione standard nota della popolazione. Figura 4.4.2 Inserimento degli argomenti della funzione di Excel TEST.Z Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Dopo aver premuto OK, nella cella comparirà la probabilità che i dati ottenuti siano il risultato di un’ipotesi nulla vera (in questo caso, ,093), a cui corrisponde uno z di 1,32 [ottenibile mediante la funzione =INV.NORM.ST(,093)], che è quello individuato nel testo. Se non avessimo inserito σ, il risultato sarebbe stato ,028, che corrisponde alla probabilità che i dati osservati siano il risultato di un’ipotesi nulla vera con test z a due code calcolato con una formula in cui s non è (x − M ) 2 , ma n (x − M ) 2 , e nella formula per l’errore standard stimato si divide s per n , e non per n −1 M −µ n − 1 . La formula è quindi z = = 1,91 . Il problema è che questo valore non è distribuito sP sP = n come z, ma come t, per cui per campioni inferiori a 30 la funzione di Excel =TEST.Z non dovrebbe essere utilizzata per il test delle medie per un campione, in quanto la probabilità che restituisce è ottenuta da una distribuzione teorica non adeguata. Attenzione inoltre a non farsi trarre inganno dalla funzione =TEST.T, poiché questa consente solo il confronto fra due campioni (vedi Capitolo 5). Con SPSS, dopo aver inserito i dati in una colonna, si segue il percorso Analyze → Compare Means → One-sample T test (Figura 4.4.3) Figura 4.4.3 Percorso di SPSS per realizzare un test z per un campione Nella finestra che si apre occorre inserire la variabile che contiene i punteggi dei soggetti nel campo Test Variable(s) e impostare la media della popolazione nel campo Test Value, come in Figura 4.4.4. Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Figura 4.4.4 Impostazioni necessarie per realizzare un test z per un campione in SPSS Le opzioni contenute in Options non sono particolarmente numerose. Consentono però di impostare il livello di probabilità per l’intervallo di fiducia della differenza fra la media campionaria e la media della popolazione, che viene riportato nell’output (Figura 4.4.5). Il valore di default è 95%. One-Sample Statistics N Punteggio 10 Mean 27,3000 Std. Deviation 4,29599 Std. Error Mean 1,35851 One-Sample Test Test Value = 24.70 Punteggio t 1,914 df 9 Sig. (2-tailed) ,088 Mean Difference 2,60000 95% Confidence Interval of the Difference Lower Upper -,4732 5,6732 Figura 4.4.5 Output di SPSS per il test z per un campione Nella prima tabella di output (One-Sample Statistics) vengono riportate le statistiche descrittive del campione. Come in Excel, la deviazione standard è calcolata con la formula s P = l’errore standard con la formula (x − M ) 2 ,e n −1 sP . Nella seconda tabella (One-Sample Test) viene riportata la n media della popolazione (Test Value = 24,70), il valore di t, i gradi di libertà (df, dall’inglese degrees of freedom), la probabilità a due code (Sig. (2-tailed), la differenza media (Mean Difference) e l’intervallo di fiducia al 95% per la differenza (95% Confidence Interval of the Difference). Per quanto SPSS non consenta l’inserimento della varianza della popolazione, quand’anche fosse nota, riferisce però correttamente il valore standardizzato alla distribuzione t. Il valore di t calcolato infatti è analogo a quello ottenuto nel testo e con Excel, ma la probabilità è determinata in base ad una distribuzione t con 9 gradi di libertà. In una tesi di laurea o in un articolo scientifico scriveremmo: Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia E’ stato eseguito un test t per un campione per verificare se il punteggio medio di Nevroticismo di un campione di 10 studenti di psicologia (M = 27,30, DS = 4,30) era diverso da quello della popolazione generale (M = 24,70). E’ emerso che la differenza non era statisticamente significativa1 (t(9) = 1,91, p > ,05, d = 0,42). 1 Si noti come il valore di t venga riportato nel seguente modo: t, aperta parentesi, gradi di libertà del test t, chiusa parentesi, uguale, valore di t calcolato). Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia