Strumenti informatici 6.6 Modelli di analisi della

annuncio pubblicitario
Strumenti informatici 6.6
Modelli di analisi della varianza con più di una variabile indipendente
6.6.1 ANOVA fattoriale completamente between
Nella pratica comune è raro che le ipotesi di ricerca prendano in considerazione solo una variabile
indipendente. Nel caso dello studio di validazione di un test, ad esempio, di solito si indaga se il
punteggio è in relazione con le variabili socio-demografiche principali, come il genere, il titolo di
studio e l’età. Naturalmente è possibile verificare che il punteggio al test sia in relazione con
ognuna di queste variabili mediante tre diverse e separate analisi, ma per riuscire ad avere una
migliore comprensione dei fenomeni occorre utilizzare modelli statistici che tengano conto
dell’effetto di tutte le possibili cause contemporaneamente, salvo poi, con opportuni test post-hoc,
andare ad indagare come si comporta singolarmente ogni variabile indipendente. La logica di base
di questo tipo di modelli è la stessa dell’analisi della varianza con una sola variabile indipendente (e
dunque detta “ANOVA ad una via”, dall’inglese one-way, o “ANOVA ad un criterio di
classificazione”): la variabilità della variabile dipendente è spiegata dall’effetto delle variabili
indipendenti, singolo e congiunto, e da una quota di errore specifico. Questo, di fatto, è il vantaggio
dell’utilizzare modelli lineari: poiché gli effetti sono additivi (vedi la assunzioni per l'applicazione
di ANOVA nel paragrafo 6.3.1 del manuale), il considerare ulteriori variabili indipendenti fa sì che
la suddivisione della “torta” che rappresenta la variabilità della variabile dipendente produca più
“fette”, ognuna corrispondente all’effetto delle variabili indipendenti. In questo senso, ogni volta
che aggiungiamo al modello una nuova variabile indipendente andiamo a definire in modo
progressivamente più preciso il reale ruolo giocato da ognuna delle altre variabili indipendenti. Nel
caso della Figura 6.6 del manuale, la variabilità della variabile dipendente (punteggio al test) era
stata suddivisa in una quota spiegata dalla diversa condizione clinica dei soggetti (devianza
between) e in una quota che avevamo chiamato di errore (devianza within). Ora, il termine
“devianza di errore” non deve trarre in inganno, in quanto non è semplicemente la quota di
variabilità della variabile dipendente spiegata da un qualche tipo di errore, ma, più correttamente, è
la quota di variabilità della variabile dipendente che non è spiegata dalla variabile indipendente.
Questo significa che potrebbe contenere anche l’effetto di altre variabili indipendenti che in quel
momento non stiamo considerando e che invece giocano un ruolo centrale nella spiegazione del
fenomeno che stiamo studiando. Quando si cerca di descrivere un fenomeno mediante un modello
lineare, quindi, occorre prestare particolare attenzione a quella che è chiamata la specificazione del
modello, ossia la selezione delle variabili indipendenti da inserire, perché da questa operazione
dipende il successo dell’analisi. Sia chiaro che il “successo” dell’analisi non risiede, come
purtroppo molti pensano, nel trovare che tutti gli effetti delle variabili indipendenti siano
statisticamente significativi, ma nel riuscire a “vedere” l’impatto sulla variabile dipendente di ogni
possibile variabile indipendente in modo non distorto né dall’assenza di altre variabili indipendenti
importanti, né dalla presenza di variabili indipendenti irrilevanti. E’ in questo modo che si giunge
ad una spiegazione soddisfacente del fenomeno in esame.
Le variabili indipendenti che è possibile inserire nel modello possono essere variabili
categoriali (e in questo caso prendono il nome di fattori) e/o variabili continue (e in questo caso
prendono il nome di covariate). In base alla presenza e alle caratteristiche dei fattori e delle
covariate è possibile realizzare tutta una serie di diversi modelli, che prendono il nome di modelli di
ANOVA fattoriale (se presenti solo due o più fattori), di ANCOVA (analisi della covarianza, se
presenti un fattore e una o più covariate), o di ANCOVA fattoriale (se presenti sia due o più fattori,
sia covariate). I fattori, a loro volta, possono essere variabili per gruppi indipendenti (fattori
between) oppure per misure ripetute o campioni dipendenti (fattori within), per cui si parlerà di
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
modelli fattoriali completamente between se tutti i fattori sono per gruppi indipendenti (ad esempio,
l’effetto di genere e condizione clinica sul punteggio ad un test psicologico), di modelli fattoriali
completamente within se tutti i fattori sono per misure ripetute (ad esempio, in un esperimento di
psicologia dell’attenzione lo stesso gruppo di soggetti viene sottoposto a tutti i possibili incroci dei
livelli di due variabili indipendenti come tempo di esposizione dello stimolo [100 msec; 500 msec]
e dimensione dello stimolo [grande; media; piccola] e viene studiato l’effetto dei fattori sul tempo
di reazione), e di modelli fattoriali misti se sono presenti sia fattori between, sia within (ad esempio,
si considera l’effetto dell’appartenere al gruppo di controllo o al gruppo sperimentale [between] e
del trascorrere del tempo [inizio dell’intervento, dopo 3 mesi, dopo 6 mesi; within] sul punteggio ad
un test di funzionamento psicologico].
I modelli fattoriali vengono indicati con una notazione particolare, a moltiplicazione. Nel
caso dell’indagine dell’effetto del genere e della condizione clinica sul punteggio ad un test
psicologico, si parlerà quindi di ANOVA fattoriale completamente between 2 × 4: il numero dei
fattori (che non per caso è il “soprannome” delle variabili indipendenti) della moltiplicazione indica
il numero di variabili indipendenti, che in questo caso è due: la prima variabile indipendente ha 2
livelli (genere: Maschi; Femmine), la seconda 4 livelli (condizione clinica: Guariti; Migliorati;
Invariati; Peggiorati). Nel caso dell’effetto sul tempo di reazione del tempo di esposizione e della
dimensione dello stimolo si parlerà di ANOVA fattoriale completamente within 2 × 3 (due livelli del
tempo di esposizione dello stimolo e tre per la dimensione dello stimolo). Nel caso dell’effetto
dell’appartenere al gruppo di controllo o al gruppo sperimentale [between] e del trascorrere del
tempo [inizio, 3 mesi, 6 mesi; within] sul punteggio ad un test di funzionamento psicologico si
parlerà di ANOVA fattoriale mista 2 × 3, dove 2 sono i livelli della variabile between (gruppo
sperimentale o di controllo) e 3 quelli della variabile within (tempo della rilevazione: inizio
dell’intervento, dopo 3 mesi, dopo 6 mesi).
Quando la variabili dipendenti sono più di una, per cui viene studiato l’effetto delle variabili
indipendenti sull’insieme delle variabili dipendenti, con successivi test post-hoc per la valutazione
dell’effetto delle variabili indipendenti su ogni singola variabile dipendente, si parla di ANOVA
multivariata (MANOVA), con le stesse possibili varianti dell’ANOVA univariata (una sola variabile
dipendente) in base alla presenza di più fattori e/o covariate (MANOVA fattoriale completamente
between, MANOVA fattoriale completamente within, MANOVA mista, MANCOVA [analisi
multivariata della covarianza], etc.)
In teoria non c’è un limite al numero di variabili indipendenti che possiamo aggiungere ad
un modello lineare: quanto più complesso è il fenomeno, tanto maggiore sarà il numero di variabili
indipendenti che dovremo utilizzare per ottenerne una spiegazione adeguata. Il punto, però, è che
con l’aggiunta di ulteriori variabili indipendenti si moltiplicano gli effetti da considerare, in quanto
ogni variabile indipendente non contribuirà solo singolarmente, ma anche in interazione con le
altre. Un effetto di interazione si verifica quando l’effetto di una variabile indipendente sulla
variabile dipendente dipende o è condizionato dal valore di un’altra variabile indipendente, detta
moderatore. Supponiamo di stare studiando l’effetto del tipo di psicoterapia (individuale o di
gruppo) sul numero di sintomi ossessivi osservabili al termine della terapia, e al tempo stesso
considerare il possibile effetto moderatore dell’ostilità interpersonale. La Figura 6.6.1 mostra un
possibile esito dell’analisi dei dati.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Numero medio di sintomi
Individuale
Gruppo
Ostilità Bassa
Ostilità Alta
Punteggio Ostilità
Figura 6.6.1 Grafico delle medie per quattro gruppi di pazienti: con bassa ostilità in psicoterapia
individuale, con alta ostilità in psicoterapia individuale, con bassa ostilità in psicoterapia di gruppo,
con alta ostilità in psicoterapia di gruppo.
Dal grafico in Figura 6.6.1 osserviamo che il numero medio di sintomi è di fatto identico in tre
gruppi di soggetti: con bassa ostilità in psicoterapia individuale, con alta ostilità in psicoterapia
individuale, con bassa ostilità in psicoterapia di gruppo, mentre per il quarto gruppo (con alta
ostilità in psicoterapia di gruppo) il numero medio di sintomi è maggiore. Questo significa che
quando andiamo a porci la domanda “la psicoterapia individuale e quella di gruppo sono
ugualmente efficaci nel ridurre il numero di sintomi ossessivi?” non possiamo rispondere né di sì,
né di no, perché la risposta che verrebbe naturale dare in questo caso è “Dipende”. Dipende da
cosa? Dal livello di ostilità interpersonale: se il livello è basso, le due psicoterapie funzionano in
modo simile, mentre se il livello è alto, la psicoterapia individuale funziona meglio di quella di
gruppo. In questo senso, l’ostilità interpersonale modera l’effetto del tipo di psicoterapia. Possiamo
quindi definire un moderatore come una variabile qualitativa (e.g., genere, etnia, classe sociale) o
quantitativa (e.g., livello di ansia di tratto) che influenza la direzione e/o la forza della relazione fra
una variabile indipendente e una dipendente. L’effetto moderatore di una variabile indipendente su
un’altra variabile indipendente (detta focale) viene evidenziato statisticamente mediante l’effetto di
interazione. Quando andiamo a rappresentare quali sono le componenti additive che producono il
punteggio osservato y nella variabile dipendente dobbiamo quindi scrivere:
y = µ + α + β + αβ + ε
dove µ è il punteggio che ci aspettiamo di osservare nella popolazione in assenza di tutti gli altri
effetti (e che quindi è uguale per tutti i soggetti), α è l’effetto principale della prima variabile
indipendente, β è l’effetto principale della seconda variabile indipendente, αβ è l’effetto di
interazione delle due variabili considerare, ε è l’errore specifico, ossia l’effetto di tutte le altre cause
non inserite nel modello. Se le variabili indipendenti fossero tre (α, β, γ), dovremmo considerare,
oltre agli effetti principali, anche tutte le possibili interazioni, che a questo punto sono di secondo
ordine (αβ, αγ, βγ) e di terzo ordine (αβγ). Se le variabili indipendenti fossero quattro (α, β, γ, λ)
dovremmo considerare tutti gli effetti di secondo ordine (αβ, αγ, αλ, βγ, βλ, γλ), tutti quelli di terzo
(αβγ, αβλ, αγλ, βγλ), e quello di quarto (αβγλ), etc. La moltiplicazione degli effetti di interazione
che si verifica aggiungendo variabili indipendenti però, costituisce uno dei limiti dei modelli lineari,
almeno a livello di spiegazione dei risultati. Lo scopo della ricerca non è tanto quello di arrivare a
spiegare il 100% della variabilità della variabile dipendente, quanto quello di comprendere le cause
di un fenomeno. Nel caso dell’effetto del tipo di psicoterapia e del livello di ostilità, abbiamo
spiegato l’effetto di interazione come un intervento moderatore del livello di ostilità sull’effetto del
tipo di psicoterapia: questa spiegazione, però, è basata su argomenti puramente teorici, perché il
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
risultato statistico è perfettamente compatibile anche con una spiegazione in cui i ruoli di variabile
focale e moderatore siano invertiti, ossia che il tipo di psicoterapia modera l’effetto del livello di
ostilità interpersonale: non dimentichiamo che la statistica è cieca alla teoria, e in casi come questi
non ci dice quale variabile sia quella focale e quale moderatore: è la nostra conoscenza del
fenomeno che ci porta ad assegnare questi “ruoli”. Quando le variabili indipendenti sono più di due
e risulta significativo l’effetto di interazione di ordine più alto, la spiegazione diventa più
complessa. Supponiamo che oltre a tipo di psicoterapia e livello di ostilità sia stato considerato
come variabile indipendente il genere. Come possiamo interpretare un effetto di interazione di terzo
ordine significativo? L’interazione genere per tipo di psicoterapia modera l’effetto dell’ostilità? Il
genere modera l’effetto interattivo di tipo del psicoterapia con l’ostilità? Non è facile, a meno di una
approfondita conoscenza del fenomeno in esame, uscire dal labirinto di possibili spiegazioni, anche
perché non basta spiegare perché è valida quella che proponiamo noi: dobbiamo anche spiegare
perché le altre interpretazioni compatibili coi risultati sono meno valide. Immaginatevi quindi il
livello di complessità della spiegazione dell’effetto di interazione di ordine superiore se inserite nel
modello quattro, cinque o più variabili indipendenti.
La Figura 6.6.2 mostra le “fette” di variabilità della variabile dipendente che spettano ad
ogni effetto delle variabili indipendenti.
Figura 6.6.2 Suddivisione della devianza della variabile dipendente in base agli effetti delle variabili
indipendenti
Dal punto di vista della verifica delle ipotesi sul piano statistico, la logica rimane la stessa
dell’analisi della varianza ad una via: ogni devianza viene divisa per i rispettivi gradi di libertà, si
ottengono le varianze, e si eseguono i F di confronto fra la varianza attribuibile ad un particolare
effetto e la varianza di errore. In questo senso, quindi, andiamo a considerare più di una
significatività statistica, dato che le ipotesi da verificare sono più di una. Nel caso dell’effetto del
tipo di psicoterapia e del livello di ostilità sul numero di sintomi al termine della psicoterapia
dobbiamo realizzare un’ANOVA fattoriale completamente between, dato che abbiamo due variabili
indipendenti, entrambe per gruppi indipendenti.
Obiettivo: verificare l’effetto del tipo di psicoterapia e del livello di ostilità sul numero di sintomi al
termine della psicoterapia
Variabili
Variabile Indipendente 1: Tipo di psicoterapia (nominale, dicotomica: Individuale, Gruppo)
Variabile Indipendente 2: Livello di ostilità (nominale, dicotomica: Bassa, Alta)
Variabile Dipendente: Numero di sintomi (a rapporti)
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Ipotesi: potrebbe esservi un effetto del tipo di psicoterapia indipendentemente dal livello di ostilità,
del livello di ostilità indipendentemente dal tipo di psicoterapia, oppure un effetto di interazione tipo
di psicoterapia × livello di ostilità
Effetti principali
H0: µGruppo = µIndividuale → indipendentemente dal livello di ostilità, la popolazione da cui è stato
estratto il gruppo di pazienti in psicoterapia di gruppo al termine della psicoterapia presenta lo
stesso numero di sintomi della popolazione da cui è stato estratto il gruppo di pazienti in
psicoterapia individuale → non si riscontrano differenze nel numero di sintomi in base al solo
effetto del tipo di psicoterapia
H1: µGruppo ≠ µIndividuale → indipendentemente dal livello di ostilità, la popolazione da cui è stato
estratto il gruppo di pazienti in psicoterapia di gruppo al termine della psicoterapia non presenta
lo stesso numero di sintomi della popolazione da cui è stato estratto il gruppo di pazienti in
psicoterapia individuale → si riscontrano differenze nel numero di sintomi in base al solo effetto
del tipo di psicoterapia
H0: µBassa = µAlta → indipendentemente dal tipo di psicoterapia, la popolazione da cui è stato estratto
il gruppo di pazienti con bassa ostilità al termine della psicoterapia presenta lo stesso numero di
sintomi della popolazione da cui è stato estratto il gruppo di pazienti con alta ostilità → non si
riscontrano differenze nel numero di sintomi in base al solo effetto del livello di ostilità
H1: µBassa ≠ µAlta → indipendentemente dal tipo di psicoterapia, la popolazione da cui è stato estratto
il gruppo di pazienti con bassa ostilità al termine della psicoterapia non presenta lo stesso
numero di sintomi della popolazione da cui è stato estratto il gruppo di pazienti con alta ostilità
→ si riscontrano differenze nel numero di sintomi in base al solo effetto del livello di ostilità
Effetto di interazione
H0: (µGruppo − µIndividuale)Bassa = (µGruppo − µAlta)Individuale oppure (µBassa − µAlta)Gruppo = (µBassa −
µAlta)Individuale → nella popolazione di pazienti con bassa ostilità la differenza fra le medie delle
sottopopolazioni dei pazienti in psicoterapia individuale e di gruppo è uguale alla differenza fra
le medie delle sottopopolazioni dei pazienti in psicoterapia individuale e di gruppo nella
popolazione di pazienti con alta ostilità → l’ostilità non modera l’effetto del tipo di psicoterapia;
oppure nella popolazione di pazienti che seguono una psicoterapia individuale la differenza fra
le medie delle sottopopolazioni dei pazienti con alta e bassa ostilità è uguale alla differenza fra
le medie delle sottopopolazioni dei pazienti con alta e bassa ostilità nella popolazione di pazienti
in psicoterapia di gruppo → il tipo di psicoterapia non modera l’effetto del livello di ostilità
H1: Almeno una differenza è significativa → nella popolazione di pazienti con bassa ostilità la
differenza fra le medie delle sottopopolazioni dei pazienti in psicoterapia individuale e di
gruppo è diversa rispetto alla differenza fra le medie delle sottopopolazioni dei pazienti in
psicoterapia individuale e di gruppo nella popolazione di pazienti con alta ostilità, oppure nella
popolazione di pazienti che seguono una psicoterapia individuale la differenza fra le medie delle
sottopopolazioni dei pazienti con alta e bassa ostilità è diversa rispetto alla differenza fra le
medie delle sottopopolazioni dei pazienti con alta e bassa ostilità nella popolazione di pazienti
in psicoterapia di gruppo − vi è un effetto di interazione fra il tipo di psicoterapia e il livello di
ostilità: l’ostilità modera l’effetto del tipo di psicoterapia oppure il tipo di psicoterapia modera
l’effetto del livello di ostilità
Avendo i dati a disposizione, è possibile svolgere i calcoli necessari per verificare queste ipotesi
anche a mano, ma data la complessità dell’operazione, si preferisce presentare direttamente le
procedure per farlo in SPSS. I dati dell’esempio che viene proposto sono riportati in Tabella 6.6.1.
Nel file di dati di SPSS devono essere riportati nello stesso modo della tabella.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Tabella 6.6.1 Dati per la realizzazione di un’ANOVA fattoriale completamente between
Psicoterapia
(0 = Individuale; 1 = Gruppo)
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
Ostilità
(0 = Bassa; 1 = Alta)
0
0
0
0
0
1
1
1
1
1
0
0
0
0
0
1
1
1
1
1
Numero di sintomi
5
6
7
8
9
4
6
8
9
10
8
9
10
11
12
12
14
15
16
17
Per realizzare l’ANOVA fattoriale completamente between in SPSS, occorre seguire il percorso
Analyze → General Linear Model → Univariate (Figura 6.6.3).
Figura 6.6.3 Percorso di SPSS per la realizzazione di un’ANOVA fattoriale completamente between
Nella finestra che si apre dobbiamo inserire nel campo Dependent Variable la variabile dipendente
(in questo caso Numero di sintomi), e nel campo Fixed Factors i fattori (in questo caso Psicoterapia
e Livello di ostilità) (Figura 6.6.4)
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Figura 6.6.4 Impostazioni di SPSS per la realizzazione di un’ANOVA fattoriale completamente
between
Il software permette anche l’impiego di fattori random (vedi Rimando SPSS 6.4), di covariate
(come potrebbe essere l’età, vedi la sezione 6.6.4 per un esempio) e di un “peso differenziato” (WLS
weight) da attribuire ad ogni soggetto (utilizzato solo in particolari analisi dove sia possibile
determinare il peso differenziale di ogni caso). Clickando su Model si apre una finestra che permette
di impostare gli effetti da inserire nel modello: non siamo infatti obbligati a considerare tutti i
possibili effetti delle variabili indipendenti e della loro interazione, ma potremmo scegliere, in base
alla nostra conoscenza del fenomeno, di escludere alcuni effetti per non complicare inutilmente
l’interpretazione dei risultati. L’impostazione di default di SPSS è di inserire nel modello tutti i
possibili effetti (Full Factorial), ma spuntando l’opzione Custom è possibile, selezionando
opportunamente le variabili nel campo Factors & Covariates e scegliendo il tipo di effetto
(interazione [Interaction], effetti principali [Main Effects], tutte le interazioni di secondo ordine [All
2-way], tutte le interazioni di terzo ordine [All 3-way], etc.) scegliere di specificare solo alcuni di
tutti i possibili effetti (Figura 6.6.5)
Figura 6.6.5 Scelta degli effetti da introdurre nel modello lineare in SPSS per un’ANOVA fattoriale
completamente between
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Clickando su Contrasts si apre una finestra analoga a quella della Figura 6.5.4 del Box 6.5. Anche
in questo caso il tipo di contrasti possibile è limitato da quelli disponibili nel menu a tendina del
riquadro Change Constrast, anche se può essere impostato un contrasto diverso per ogni fattore.
Clickando su Plots è possibile impostare la realizzazione del grafico, che nel caso di un modello
fattoriale è di fondamentale importanza, in quanto dalla sola ispezione visiva del grafico delle
medie è possibile stimare quali effetti, fra quelli principali e quello di interazione, sono significativi.
Si può scegliere quale variabile avrà le categorie sull’asse orizzontale (Horizontal Axis) e quale avrà
le diverse categorie rappresentate da linee di colore diverso sul grafico (Separate Lines) (Figura
6.6.6). Ogni impostazione deve poi essere trasferita nel campo in basso mediante un click su Add.
Nel caso di un modello fattoriale a tre variabili, è possibile ottenere grafici separati in base ai livelli
di una terza variabile. Se nel nostro modello avessimo avuto anche il genere, avremmo potuto
richiedere al software di realizzare un grafico Psicoterapia × Ostilità per i maschi e uno per le
femmine inserendo la variabile Genere nel campo Separate Plots.
Figura 6.6.6 Impostazione dei grafici di ANOVA in SPSS
Mentre clickando su Save si accede ad una finestra che consente di impostare le statistiche avanzate
da salvare, clickando su Post-Hoc è possibile scegliere, per ogni effetto principale, il tipo di test
post-hoc da realizzare. Nel caso specifico che stiamo considerando è inutile, perché le variabili
hanno due sole categorie. Se l’effetto di interazione è significativo, però, significa che possiamo
accettare l’ipotesi nulla formulata in precedenza, per cui può essere di interesse confrontare i livelli
di una delle variabili su ciascun livello dell’altra variabile. Per far questo dobbiamo clickare su
Options (Figura 6.6.7).
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Figura 6.6.7 La finestra Options di SPSS per la realizzazione di un’ANOVA fattoriale completamente
between
Tutti i possibili effetti compaiono nel campo Factor(s) and Factor Interactions. Basta spostarli nel
campo Display Means for: e spuntare Compare Main Effects, scegliendo poi il tipo di
“aggiustamento” per controllare l’inflazione dell’errore di I tipo dovuta ai confronti multipli. Il
problema, però, è che anche inserendo l’effetto di interazione nel campo Display Means for: SPSS
di default realizza i confronti post-hoc solo per gli effetti principali1, e non per l’interazione (che
peraltro sono quelli che di solito interessano di più). Fortunatamente, intervenendo sulla sintassi di
SPSS è possibile ottenerli. Prima di procedere, nella finestra Options spuntiamo anche Descriptive
Statistics, Estimates of effect size e Homogeneity tests, come in Figura 6.6.7. Una volta clickato
Continue e tornati alla finestra principale, clickare su Paste. Si aprirà una nuova finestra che
contiene le righe di comando di SPSS (Figura 6.6.8).
Figura 6.6.8 Finestra di sintassi di SPSS
Originariamente, SPSS doveva essere programmato con righe di comando, e le versioni point-andclick sono venute solo dopo. Gli utenti avanzati di SPSS lavorano molto con la sintassi, in quanto
consente di impostare più analisi nello stesso programma. Le righe di comando possono essere
salvate in un file di sintassi che ha l’estensione .SPS. Al momento, però, quello che ci interessa è
1
Si noti che questi test post-hoc sugli effetti principali hanno un significato analogo a quelli della finestra Post-Hoc solo
quando i gruppi abbiano tutti la stessa numerosità e varianze omogenee
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
poter modificare le righe di comando per ottenere i confronti post-hoc per l’effetto di interazione.
L’operazione è molto semplice: basta cambiare il testo della Figura 6.20
/EMMEANS = TABLES(Psicoterapia*Ostilita)
con il testo in grassetto nella sintassi seguente:
UNIANOVA
Sintomi BY Psicoterapia Ostilita
/METHOD = SSTYPE(3)
/INTERCEPT = INCLUDE
/PLOT = PROFILE( Psicoterapia*Ostilita Ostilita*Psicoterapia )
/EMMEANS = TABLES(Psicoterapia) COMPARE ADJ(BONFERRONI)
/EMMEANS = TABLES(Ostilita) COMPARE ADJ(BONFERRONI)
/EMMEANS = TABLES(Psicoterapia*Ostilita) COMPARE(Psicoterapia) ADJ(BONFERRONI)
/EMMEANS = TABLES(Psicoterapia*Ostilita) COMPARE(Ostilita) ADJ(BONFERRONI)
/PRINT = DESCRIPTIVE ETASQ
/CRITERIA = ALPHA(.05)
/DESIGN = Psicoterapia Ostilita Psicoterapia*Ostilita .
A questo punto basta clickare sul tasto
nella finestra del file di sintassi (oppure seguire il
percorso Run → All) per ottenere l’output. L’output produce inizialmente tre tabelle (Between
Subjects Factors, Descriptive Statistics, e Levene's Test of Equality of Error Variances, Figura
6.6.9) che riassumono il disegno della ricerca e riportano media, deviazione standard e numerosità
dei gruppi in esame e, soprattutto, ci permettono di verificare se le varianze dei gruppi sono
omogenee, che, come sappiamo, è un'assunzione che deve essere rispettata per l'applicazione del
test statistico in oggetto.
Descriptive Statistics
Between-Subjects Factors
Psicoterapia
Livello di
ostilità
Value Label
Individuale
Gruppo
Bassa
Alta
,00
1,00
,00
1,00
Dependent Variable: Numero di sintomi
N
10
10
10
10
Psicoterapia
Individuale
Gruppo
Total
Livello di ostilità
Bassa
Alta
Total
Bassa
Alta
Total
Bassa
Alta
Total
Mean
7,0000
7,4000
7,2000
10,0000
14,8000
12,4000
8,5000
11,1000
9,8000
Std. Deviation
1,58114
2,40832
1,93218
1,58114
1,92354
3,02581
2,17307
4,40833
3,63608
N
5
5
10
5
5
10
10
10
20
a
Levene's Test of Equality of Error Variances
Dependent Variable: Numero di sintomi
F
,623
df1
df2
3
16
Sig.
,611
Tests the null hypothesis that the error variance of the
dependent variable is equal across groups.
a. Design: Intercept+Psicoterapia+Ostilita+Psicoterapia
* Ostilita
Figura 6.6.9 Output di SPSS per un’ANOVA fattoriale completamente between
La tabella Test of Between-Subjects Effects riporta invece le significatività di tutti gli effetti (Figura
6.6.10)
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Tests of Between-Subjects Effects
Dependent Variable: Numero di sintomi
Source
Corrected Model
Intercept
Psicoterapia
Ostilita
Psicoterapia * Ostilita
Error
Total
Corrected Total
Type III Sum
of Squares
193,200a
1920,800
135,200
33,800
24,200
58,000
2172,000
251,200
df
3
1
1
1
1
16
20
19
Mean Square
64,400
1920,800
135,200
33,800
24,200
3,625
F
17,766
529,876
37,297
9,324
6,676
Sig.
,000
,000
,000
,008
,020
Partial Eta
Squared
,769
,971
,700
,368
,294
a. R Squared = ,769 (Adjusted R Squared = ,726)
Figura 6.6.10 Tabella di SPSS con la significatività degli effetti di un’ANOVA fattoriale completamente
between
In questo caso occorre ignorare le informazioni di Corrected Model e Intercept, e concentrarsi solo
su Psicoterapia, Ostilita e Psicoterapia*Ostilita, che rappresentano gli effetti principali e
l’interazione, rispettivamente. I valori nella colonna Sig. rappresentano le probabilità associate al
fatto che i dati osservati siano il risultato di un’ipotesi nulla vera. La regola di decisione è:
Se Sig. < ,05 → Rifiutiamo H0 → L'effetto è significativo
Se Sig. > ,05 → Accettiamo H0 → L'effetto non è significativo
I risultati in Figura 6.6.10 mostrano che possiamo rifiutare l’ipotesi nulla per tutti e tre gli effetti e
dunque possiamo concludere che c’è un effetto principale del tipo di psicoterapia, un effetto
principale del livello di ostilità, e un effetto di interazione tipo di psicoterapia × livello di ostilità. I
tre effetti sono indipendenti fra loro, per cui è possibile che siano tutti significativi, solo alcuni
significativi, nessuno significativo. Per comprendere la direzione degli effetti, di solito si può far
riferimento al grafico di interazione, come mostrato in Figura 6.6.11.
Figura 6.6.11 Grafico di interazione prodotto da SPSS
La Figura 6.6.11 riporta i due tipi di grafico che è possibile realizzare quando i fattori in gioco sono
due: nel grafico di sinistra sull’asse orizzontale ci sono i livelli del fattore ‘Tipo di Psicoterapia’ e i
livelli del fattore ‘Livello di Ostilità’ sono rappresentati da linee di colore diverso, mentre nel
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
grafico di destra avviene il contrario. Il grafico di sinistra mostra come il numero medio di sintomi
(qui indicato come Estimated Marginal Means, che vuol dire “stima delle medie marginali”) sia
simile per i gruppi di ostilità in caso di psicoterapia individuale, ma molto diverso in caso di
psicoterapia di gruppo, con un numero medio di sintomi maggiore in caso di alto livello di ostilità.
Il grafico di destra, invece, mostra come in caso di psicoterapia individuale il numero di sintomi sia
comunque minore rispetto al caso della psicoterapia di gruppo, all’interno della quale, ad ogni
modo, vi è un numero medio di sintomi maggiore in caso di alto livello di ostilità.
La lettura di un grafico di interazione avviene come rappresentato in Figura 6.6.12.
Figura 6.6.12 Esempi tipici di grafici di ANOVA fattoriale con effetti principali ed effetto di interazione
La Figura 6.6.13 riporta tutti i possibili casi.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Figura 6.6.13 Possibili esiti di un’ANOVA fattoriale completamente between (Nota: NS = non
significativo)
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Occorre prestare particolare attenzione all’interpretazione del valore di dimensione dell’effetto η2
(nella Figura 6.6.10, colonna Partial Eta Squared). Questo valore non deve essere interpretato in
SS effetto
base alle linee guida Tabella 6.11 del manuale, perché è calcolato come
e non
SS effetto + SS errore
come
SS effetto
SS totale
. Nel caso dell’effetto principale del Tipo di Psicoterapia, η2 parziale = ,700, che è il
SS effetto
135,200
=,700 . Il valore di η2, invece, è dato dal rapporto fra
SS effetto + SS errore 135,200 + 58,00
SSeffetto e la somma delle devianze dei tre effetti e dell’errore, ossia 123,20 + 33,80 + 24,20 + 58,00
= 251,20. Tale valore corrisponde nella Figura 6.6.10 alla devianza relativa alla voce Corrected
SS effetto
135,20
Total. η 2 =
=
=,54 . Anche in questo caso, però, sarebbe preferibile calcolare il
SS Corrected Total 251,20
SS Effetto − ( gdl effetto ) MS errore 135,20 − (1)3,63
)
)
valore di ω 2 mediante la formula ω 2 =
=
=,52 . Con la
251,20 + 3,63
SS Corrected Total + MS errore
)
stessa operazione siamo in grado di calcolare i valori di η2 parziale, η2 e ω 2 anche per gli altri
effetti. I risultati sono riportati in Tabella 6.6.2
risultato di
=
Tabella 6.6.2 Confronto fra gli indici di dimensione dell’effetto η parziale, η e
Figura 6.6.10
2
Effetto
Psicoterapia
Ostilità
Psicoterapia × Ostilità
η2 parziale (riportato
da SPSS)
,70
,37
,29
2
)
ω2
per gli effetti in
)
η2
ω2
,54
,13
,10
,52
,12
,08
Occorre quindi porre estrema cautela nell’interpretare la dimensione dell’effetto offerta da SPSS.
Dopo la tavola di ANOVA fattoriale con gli effetti principali, se lo si è richiesto SPSS riporta i
confronti fra le medie per gli effetti principali e per l’interazione sotto la dicitura Estimated
Marginal Means. Nel caso che stiamo considerando gli effetti principali non hanno bisogno di posthoc in quanto i fattori sono variabili dicotomiche, per cui se l’effetto è significativo, la differenza
sarà a favore del livello del fattore con la media più alta. La Figura 6.6.14 riporta le tabelle per gli
effetti principali.
Tipo di Psicoterapia
Estimates
Dependent Variable: Numero di sintomi
Psicoterapia
Individuale
Gruppo
Mean
7,200
12,400
Std. Error
,602
,602
95% Confidence Interval
Lower Bound Upper Bound
5,924
8,476
11,124
13,676
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Pairwise Comparisons
Dependent Variable: Numero di sintomi
(I) Psicoterapia
Individuale
Gruppo
(J) Psicoterapia
Gruppo
Individuale
Mean
Difference
(I-J)
-5,200*
5,200*
a
Std. Error
,851
,851
Sig.
,000
,000
95% Confidence Interval for
a
Difference
Lower Bound Upper Bound
-7,005
-3,395
3,395
7,005
Based on estimated marginal means
*. The mean difference is significant at the ,05 level.
a. Adjustment for multiple comparisons: Bonferroni.
Livello di Ostilità
Estimates
Dependent Variable: Numero di sintomi
Livello di ostilità
Bassa
Alta
Mean
8,500
11,100
Std. Error
,602
,602
95% Confidence Interval
Lower Bound Upper Bound
7,224
9,776
9,824
12,376
Pairwise Comparisons
Dependent Variable: Numero di sintomi
(I) Livello di ostilità
Bassa
Alta
(J) Livello di ostilità
Alta
Bassa
Mean
Difference
(I-J)
-2,600*
2,600*
Std. Error
,851
,851
a
Sig.
,008
,008
95% Confidence Interval for
a
Difference
Lower Bound Upper Bound
-4,405
-,795
,795
4,405
Based on estimated marginal means
*. The mean difference is significant at the ,05 level.
a. Adjustment for multiple comparisons: Bonferroni.
Figura 6.6.14 Estimated Marginal Means per l’effetto principale del Tipo di Psicoterapia e del Livello
di Ostilità
La Figura 6.6.14 mostra come il numero di sintomi sia maggiore in chi segue una psicoterapia di
gruppo (indipendentemente dal livello di ostilità) e per chi ha un’alta ostilità (indipendentemente
dal tipo di psicoterapia).
La Figura 6.6.15 riporta invece le tabelle per i confronti sugli effetti di interazione. Si noti
che i valori di probabilità riportati nelle colonne Sig. sono già corretti per confronti multipli in base
alla procedura Bonferroni, per cui possono essere interpretati direttamente in base alla regola:
Se Sig. < ,05 → Rifiutiamo H0 → La differenza è significativa
Se Sig. > ,05 → Accettiamo H0 → La differenza non è significativa
Confronti dei livelli di Tipo di Psicoterapia sui singoli livelli di Livello di Ostilità
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Estimates
Dependent Variable: Numero di sintomi
Psicoterapia
Individuale
Gruppo
Livello di ostilità
Bassa
Alta
Bassa
Alta
Mean
7,000
7,400
10,000
14,800
Std. Error
,851
,851
,851
,851
95% Confidence Interval
Lower Bound Upper Bound
5,195
8,805
5,595
9,205
8,195
11,805
12,995
16,605
Pairwise Comparisons
Dependent Variable: Numero di sintomi
Livello di ostilità
Bassa
Alta
(I) Psicoterapia
Individuale
Gruppo
Individuale
Gruppo
Mean
Difference
(I-J)
-3,000*
3,000*
-7,400*
7,400*
(J) Psicoterapia
Gruppo
Individuale
Gruppo
Individuale
a
Std. Error
1,204
1,204
1,204
1,204
Sig.
,024
,024
,000
,000
95% Confidence Interval for
a
Difference
Lower Bound Upper Bound
-5,553
-,447
,447
5,553
-9,953
-4,847
4,847
9,953
Based on estimated marginal means
*. The mean difference is significant at the ,05 level.
a. Adjustment for multiple comparisons: Bonferroni.
Confronti dei livelli di Livello di Ostilità sui singoli livelli di Tipo di Psicoterapia
Estimates
Dependent Variable: Numero di sintomi
Psicoterapia
Individuale
Gruppo
Livello di ostilità
Bassa
Alta
Bassa
Alta
Mean
7,000
7,400
10,000
14,800
Std. Error
,851
,851
,851
,851
95% Confidence Interval
Lower Bound Upper Bound
5,195
8,805
5,595
9,205
8,195
11,805
12,995
16,605
Pairwise Comparisons
Dependent Variable: Numero di sintomi
Psicoterapia
Individuale
Gruppo
(I) Livello di ostilità
Bassa
Alta
Bassa
Alta
(J) Livello di ostilità
Alta
Bassa
Alta
Bassa
Mean
Difference
(I-J)
Std. Error
-,400
1,204
,400
1,204
-4,800*
1,204
4,800*
1,204
a
Sig.
,744
,744
,001
,001
95% Confidence Interval for
a
Difference
Lower Bound Upper Bound
-2,953
2,153
-2,153
2,953
-7,353
-2,247
2,247
7,353
Based on estimated marginal means
*. The mean difference is significant at the ,05 level.
a. Adjustment for multiple comparisons: Bonferroni.
Figura 6.6.15 Confronti post-hoc dei livelli di un fattore sui singoli livelli dell’altro fattore
Nella Figura 6.6.15 i confronti dei livelli di Tipo di Psicoterapia sui singoli livelli di Livello di
Ostilità mostrano come il numero medio di sintomi di chi segue una psicoterapia di gruppo sia
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
comunque maggiore di quello di chi segue una psicoterapia individuale, mentre i confronti dei
livelli di Livello di Ostilità sui singoli livelli di Tipo di Psicoterapia mostrano come non ci sia
differenza significativa fra le medie di Basso e Alto livello di Ostilità in caso di psicoterapia
individuale, mentre vi sia una differenza significativa fra le medie dei livelli di Ostilità in caso di
psicoterapia di gruppo, con alti livelli di ostilità associati ad un numero medio di sintomi maggiore2.
Per riportare il risultato in un articolo scientifico o in una tesi di laurea riporteremo la tabella con le
statistiche descrittive, uno dei due grafici in Figura 6.6.11 e scriveremo:
E’ stata eseguita un’analisi della varianza fattoriale 2 × 2 completamente between (Tipo
di Psicoterapia [Individuale, Gruppo] × Livello di Ostilità [Alto, Basso]). Sono risultati
significativi entrambi gli effetti principali (Psicoterapia: F(1, 16) = 37,30, p < ,001, η2
parziale = 0,70; Livello di Ostilità: F(1, 16) = 9,32, p = ,008, η2 parziale = 0,37;
Interazione: F(1, 16) = 6,77, p = ,020, η2 parziale = 0,29). Gli effetti principali erano
dovuti ad un numero medio di sintomi maggiore per chi seguiva una psicoterapia di
gruppo e per chi aveva un alto livello di ostilità. I confronti post-hoc sugli effetti di
interazione hanno mostrato che il numero medio di sintomi di chi segue una
psicoterapia di gruppo è maggiore di quello di chi segue una psicoterapia individuale
indipendentemente dal livello di ostilità, mentre i confronti dei livelli di Livello di
Ostilità sui singoli livelli di Tipo di Psicoterapia hanno rivelato come non ci sia
differenza significativa fra le medie di Basso e Alto livello di Ostilità in caso di
psicoterapia individuale, mentre vi sia una differenza significativa fra le medie dei
livelli di Ostilità in caso di psicoterapia di gruppo, con alti livelli di ostilità associati ad
un numero medio di sintomi maggiore.
6.6.2 ANOVA fattoriale completamente within
Quando tutte le variabili indipendenti, o fattori, sono entro i soggetti, ossia rappresentano misure
ripetute sugli stessi soggetti, si parla di ANOVA fattoriale completamente within. Consideriamo il
caso in cui lo stesso gruppo di 20 soggetti viene sottoposto ad un serie prove in cui vengono
mostrati degli oggetti di dimensioni variabili (grande, media, piccola) per un tempo di 100 o 500
msec. Il compito del soggetto è premere la barra spaziatrice quando ha riconosciuto l’oggetto e
nominarlo. In questo caso i fattori sono le Dimensioni dell’Oggetto e il Tempo di Esposizione dello
stimolo, mentre la variabile dipendente è il Tempo di Reazione, calcolato come media delle prove
per ogni incrocio dei livelli dei fattori (o condizione). In questi casi, per ogni incrocio dei livelli dei
fattori vengono somministrate molte prove (in gergo, trials), e per ognuna si ottiene un tempo di
reazione. Di solito, dopo aver “ripulito” i dati da eventuali valori outliers (comuni in questo tipo di
esperimenti), per ogni condizione si calcola il tempo di reazione medio (o mediano). I risultati sono
riportati in Tabella 6.6.3.
Tabella 6.6.3 Risultati dell’esperimento di riconoscimento di oggetti (tempo di reazione, millisecondi)
Soggetto
A
B
Esposizione 100 msec
Dimensione
Piccola
Media
Grande
2975
2725
1450
3000
3000
2700
Esposizione 500 msec
Dimensione
Piccola
Media
Grande
2350
1850
1800
3200
3925
2275
2
SPSS in questi casi riporta anche una tabella chiamata Univariate Tests che è legata all’opzione di default dei
Constrasts. In questo caso non è stata riportata per non appesantire il testo.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
C
D
E
F
G
H
I
L
M
N
O
P
Q
R
S
T
U
V
3425
4825
1950
2100
6050
4250
3425
3825
3400
7250
1950
3975
2275
1900
5350
1775
1550
2600
4400
3875
1200
1850
6075
2800
4275
3525
4000
6450
1950
2425
2300
1850
5000
2450
1950
2085
3750
3775
1900
725
2075
3400
3925
2150
4250
4925
1900
2300
1675
1700
5025
2875
1775
3650
3350
4700
1375
1950
6175
4150
4225
3250
4050
6500
2050
3375
3625
1650
5775
3000
1800
2500
3500
3775
1750
1250
3550
3175
3025
2150
3550
2980
2075
2250
2050
1750
2345
1750
2050
2675
3350
2150
1750
1250
3275
3400
2350
1975
2775
3100
2300
1800
1175
2100
4050
2150
1750
3350
Obiettivo: verificare l’effetto del Tempo di Esposizione e della Dimensione dello Stimolo sul
tempo di riconoscimento di un oggetto
Variabili
Variabile Indipendente 1: Tempo di Esposizione (nominale, dicotomica: 100 msec, 500 msec)
Variabile Indipendente 2: Dimensione dello Stimolo (nominale, politomica: Piccola, Media,
Grande)
Variabile Dipendente: Tempo di Reazione (msec, a rapporti)
Ipotesi: potrebbe esservi un effetto del Tempo di Esposizione indipendentemente dalla Dimensione
dello Stimolo, della Dimensione dello Stimolo indipendentemente dal Tempo di Esposizione,
oppure un effetto di interazione tipo di Tempo di Esposizione × Dimensione dello Stimolo
Effetti principali
H0: µ100msec = µ500msec → indipendentemente dalla dimensione dello stimolo, la popolazione a cui
fanno riferimento le osservazioni per un tempo di esposizione di 100 msec ha un tempo di
reazione medio uguale alla popolazione a cui fanno riferimento le osservazioni per un tempo di
esposizione di 500 msec → non si riscontrano differenze nel tempo di reazione in base al tempo
di esposizione dello stimolo
H1: µ100msec ≠ µ500msec → indipendentemente dalla dimensione dello stimolo, la popolazione a cui
fanno riferimento le osservazioni per un tempo di esposizione di 100 msec ha un tempo di
reazione medio diverso dalla popolazione a cui fanno riferimento le osservazioni per un tempo
di esposizione di 500 msec → si riscontrano differenze nel tempo di reazione in base al tempo
di esposizione dello stimolo
H0: µPiccola = µMedia = µGrande → indipendentemente dal tempo di esposizione dello stimolo, le
popolazioni a cui fanno riferimento le osservazioni per le varie dimensioni dello stimolo hanno
tempi di reazione medi uguali → non si riscontrano differenze nel tempo di reazione in base alla
dimensione dello stimolo
H1: Almeno due medie diverse → indipendentemente dal tempo di esposizione dello stimolo, le
popolazioni a cui fanno riferimento le osservazioni per le varie dimensioni dello stimolo non
hanno tutte tempi di reazione medi uguali → si riscontrano differenze nel tempo di reazione in
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
base alla dimensione dello stimolo, e i test post-hoc riveleranno quali condizioni sono
significativamente diverse fra loro
Effetto di interazione3
H0: (µ100msec − µI500msec)Piccola = (µ100msec − µI500msec)Media = (µ100msec − µI500msec)Grande → la differenza
fra i tempi di reazione medi delle popolazioni a cui fanno riferimento le osservazioni per un
tempo di esposizione di 100 msec e 500 msec è uguale su tutti i livelli di dimensione dello
stimolo → la dimensione dello stimolo non modera l’effetto del tempo di esposizione
H1: Almeno due differenze diverse → la differenza fra i tempi di reazione medi delle popolazioni a
cui fanno riferimento le osservazioni per un tempo di esposizione di 100 msec e 500 msec non è
uguale su tutti i livelli di dimensione dello stimolo → la dimensione dello stimolo modera
l’effetto del tempo di esposizione
Per realizzare l’ANOVA fattoriale completamente within in SPSS procediamo come nel caso
dell’ANOVA per misure ripetute (vedi Rimando SPSS 6.5), col percorso Analyze → General
Linear Model → Repeated Measures. I dati vanno organizzati come un Figura 6.6.16, che riproduce
la Tabella 6.6.3.
Figura 6.6.16 Organizzazione dei dati in SPSS per realizzare un’ANOVA fattoriale completamente
within.
Nella finestra dove vengono specificati i fattori within inseriremo Tempo (2 livelli) e Dimensio (tre
livelli; SPSS non consente l’inserimento di nomi di fattori within più lunghi di 8 caratteri) (Figura
6.6.17). Il nome della variabile va inserito nel campo Within-Subject Factor Name, e in Number of
Levels va specificato il numero di livelli di questo fattore. La procedura di inserimento del fattore
viene completata clickata su Add. Una volta completato l'inserimento dei fattori, si passa alla fase
successiva clickando su Define. Nel campo Measure Name possono essere inseriti i nomi di
variabili distinte che sono state misurate su ognuno dei livelli dei fattori (ad esempio, in tre
momenti diversi del tempo sono stati ottenuti i punteggi di tre diversi test psicologici; questo
consente di realizzare la cosiddetta ANOVA Multivariata per misure ripetute, vedi Sezione 6.6.5).
3
Per semplicità espositiva, si riporta qui una delle due possibili interpretazioni dell’effetto di interazione. Era possibile
formulare anche l’interpretazione alternativa, ovvero che fosse il tempo di esposizione a moderare l’effetto della
dimensione dello stimolo.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Figura 6.6.17 Impostazione dei fattori within in SPSS per la realizzazione di un’ANOVA fattoriale
completamente within.
Nella finestra successiva dobbiamo stare attenti ad assegnare ad ogni condizione la giusta variabile.
Le condizioni sono indicate con due numeri fra parentesi separate da una virgola: il primo numero
indica la condizione della prima variabile specificata nella finestra precedente, il secondo la
condizione della seconda variabile. Poiché abbiamo inserito come prima variabile il Tempo di
Esposizione e come seconda variabile la Dimensione dello Stimolo, il primo numero rappresenta i
livelli del Tempo di Esposizione, il secondo quelli della Dimensione dello Stimolo (Figura 6.6.18).
Figura 6.6.18 Assegnazione delle variabili alle condizioni per la realizzazione di di un’ANOVA
fattoriale completamente within in SPSS
SPSS offre tutta una serie di opzioni possibili per l’analisi. A noi però interessa soprattutto la
sezione Options, in quanto ci permette di impostare i test post-hoc per gli effetti principali e per
l’interazione (anche in questo caso è necessaria la modifica della sintassi di SPSS vista nella
sezione 6.6.1), richiedere le statistiche descrittive e le dimensioni dell’effetto (Figura 6.6.19)
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Figura 6.6.19 Impostazioni delle opzioni per la realizzazione di un’ANOVA fattoriale completamente
within.
Infine, impostiamo i grafici clickando su Plots. In questo caso chiediamo che vengano realizzati
entrambi i grafici possibili, ossia quello con le categorie della variabile Tempo di Esposizione
sull’asse orizzontale (Horizontal Axis) e le categorie della variabile Dimensione dello Stimolo
rappresentate da linee di colore diverso (Separate Lines), e viceversa.
L’output dell’analisi è riportato in Figura 6.6.204.
Within-Subjects Factors
Descriptive Statistics
Measure: MEASURE_1
tempo
1
2
dimensio
1
2
3
1
2
3
Dependent
Variable
rt_100_pic
rt_100_med
rt_100_gra
rt_500_pic
rt_500_med
rt_500_gra
rt_100_pic
rt_100_med
rt_100_gra
rt_500_pic
rt_500_med
rt_500_gra
Mean
3392,50
3209,25
2796,25
3452,50
2571,25
2406,25
Std. Deviation
1545,220
1455,936
1219,531
1488,352
801,943
785,890
N
20
20
20
20
20
20
Mauchly's Test of Sphericityb
Measure: MEASURE_1
Epsilon
Within Subjects Effect
tempo
dimensio
tempo * dimensio
Mauchly's W
1,000
,678
,969
Approx.
Chi-Square
,000
6,989
,564
df
Sig.
0
2
2
.
,030
,754
Greenhous
e-Geisser
1,000
,757
,970
a
Huynh-Feldt
1,000
,808
1,000
Lower-bound
1,000
,500
,500
Tests the null hypothesis that the error covariance matrix of the orthonormalized transformed dependent variables is
proportional to an identity matrix.
a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in
the Tests of Within-Subjects Effects table.
b.
Design: Intercept
Within Subjects Design: tempo+dimensio+tempo*dimensio
4
Per esigenze di spazio non vengono riportate in questo output le tabelle Multivariate Tests e Tests of Within-Subjects
Contrasts, che comunque SPSS produce, poiché in questo caso non ci interessano.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Tests of Within-Subjects Effects
Measure: MEASURE_1
Source
tempo
Error(tempo)
dimensio
Error(dimensio)
tempo * dimensio
Error(tempo*dimensio)
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Type III Sum
of Squares
3123413,333
3123413,333
3123413,333
3123413,333
8266403,333
8266403,333
8266403,333
8266403,333
13883501,7
13883501,7
13883501,7
13883501,7
28902173,3
28902173,3
28902173,3
28902173,3
2504026,667
2504026,667
2504026,667
2504026,667
13792981,7
13792981,7
13792981,7
13792981,7
df
1
1,000
1,000
1,000
19
19,000
19,000
19,000
2
1,513
1,616
1,000
38
28,750
30,708
19,000
2
1,940
2,000
1,000
38
36,863
38,000
19,000
Mean Square
3123413,333
3123413,333
3123413,333
3123413,333
435073,860
435073,860
435073,860
435073,860
6941750,833
9175333,424
8590094,109
13883501,67
760583,509
1005309,389
941186,752
1521167,018
1252013,333
1290632,468
1252013,333
2504026,667
362973,202
374169,337
362973,202
725946,404
F
7,179
7,179
7,179
7,179
Sig.
,015
,015
,015
,015
Partial Eta
Squared
,274
,274
,274
,274
9,127
9,127
9,127
9,127
,001
,002
,001
,007
,324
,324
,324
,324
3,449
3,449
3,449
3,449
,042
,044
,042
,079
,154
,154
,154
,154
Tests of Between-Subjects Effects
Measure: MEASURE_1
Transformed Variable: Average
Source
Intercept
Error
Type III Sum
of Squares
1059458613
128980537
df
1
19
Mean Square
1059458613
6788449,298
F
156,068
Sig.
,000
Partial Eta
Squared
,891
Figura 6.6.20 Output di SPSS per gli effetti principali e di interazione di un’ANOVA fattoriale
completamente within.
Le prime due tabelle dell’output (Within-Subjects Factors e Descriptive Statistics) riassumono il
disegno della ricerca e le statistiche descrittive delle varie condizioni. La tabella Mauchly’s Test of
Sphericity ci informa sulla sfericità (ossia, omogeneità) delle varianze per tutti gli effetti. Notiamo
che Sig. del fattore Dimensione è minore di ,05 (,030), per cui quando andremo a valutare la
significatività dell’effetto nella tabella Tests of Within-Subjects Effects non consulteremo la riga di
Sphericity Assumed, ma quella di Greenhouse-Geisser. Nessun problema, invece, per gli altri due
effetti. Nella tabella seguente (Tests of Within-Subjects Effects), osserviamo come tutti e tre gli
effetti siano statisticamente significativi (Sig. < ,05). Nel caso del Tempo di Esposizione e
dell’effetto di interazione consultiamo la riga Sphericity Assumed, mentre nel caso dell’effetto
principale di Dimensione dello Stimolo consultiamo Greenhouse-Geisser. Occorre prestare
particolare attenzione alla valutazione della dimensione dell’effetto mediante la colonna Partial Eta
Squared. Come già abbiamo visto anche nella sezione 6.6.1, una stima adeguata della dimensione
SS effetto
dell’effetto non si ottiene, come propone SPSS, con la formula
, ma con
SS effetto + SS errore
SS effetto
SS effetto + SS errore + SS between
, dove SSbetween è il termine Error nella tabella Tests of Between Subjects
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Effects. Quindi, se η2 parziale dell’effetto del tempo, così come riportato da SPSS, è 0,27, ossia
SS effetto
3123413,333
=
, la stima corretta di η2 è
SS effetto + SS errore 3123413,333 + 8266403,333
SS effetto
SS effetto + SS errore + SS between
=
3123413,333
= 0,02 . Con lo stesso
3123413,333 + 8266403,333 + 128980537
procedimento individuiamo la stima corretta di η2 per gli altri due effetti (0,08 per l’effetto
principale della Dimensione dello Stimolo, 0,02 per l’effetto di interazione).
Poiché tutti gli effetti sono significativi, occorre consultare i risultati dei test post-hoc per
individuare le condizioni “responsabili” di questa significatività. Nel caso del Tempo di
Esposizione dello stimolo il confronto è uno solo, poiché la variabile dicotomica. Le Estimated
Marginal Means ci mostrano che nella condizione 1 (100 msec) il tempo di reazione medio è
maggiore rispetto a quello della condizione 2 (500 msec) (Figura 6.6.21)5.
Estimates
Measure: MEASURE_1
tempo
1
2
Mean
3132,667
2810,000
Std. Error
285,297
197,478
95% Confidence Interval
Lower Bound Upper Bound
2535,533
3729,800
2396,673
3223,327
Pairwise Comparisons
Measure: MEASURE_1
(I) tempo
1
2
(J) tempo
2
1
Mean
Difference
(I-J)
322,667*
-322,667*
Std. Error
120,426
120,426
a
Sig.
,015
,015
95% Confidence Interval for
a
Difference
Lower Bound Upper Bound
70,612
574,722
-574,722
-70,612
Based on estimated marginal means
*. The mean difference is significant at the ,05 level.
a. Adjustment for multiple comparisons: Bonferroni.
Figura 6.6.21 Estimated marginal means e confronti post-hoc per l’effetto principale del Tempo di
Esposizione dello stimolo
L’interpretazione del risultato è abbastanza ovvia: minore è il tempo di esposizione dello stimolo,
indipendentemente dalla dimensiono dello stimolo, maggiore è il tempo che il soggetto impiega per
rispondere.
Per l’effetto principale della Dimensione dello Stimolo, invece, i confronti post-hoc ci
servono per sapere quali confronti fra le coppie di condizioni sono significative. La Figura 6.6.22
mostra come nella condizione 1 (figura piccola) il tempo di reazione sia significativamente
maggiore che nelle altre due (2 e 3, figura media e grande, rispettivamente), che però non sono
significativamente diverse fra di loro (Sig. = ,28 > ,05).
5
In questa e nelle due figure successive non viene riportata la tabella Multivariate Tests.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Estimates
Measure: MEASURE_1
dimensio
1
2
3
Mean
3422,500
2890,250
2601,250
Std. Error
332,640
229,125
211,170
95% Confidence Interval
Lower Bound Upper Bound
2726,277
4118,723
2410,686
3369,814
2159,266
3043,234
Pairwise Comparisons
Measure: MEASURE_1
(I) dimensio
1
(J) dimensio
2
3
1
3
1
2
2
3
Mean
Difference
(I-J)
Std. Error
532,250*
166,945
821,250*
244,108
-532,250*
166,945
289,000
163,181
-821,250*
244,108
-289,000
163,181
a
Sig.
,015
,010
,015
,278
,010
,278
95% Confidence Interval for
a
Difference
Lower Bound Upper Bound
94,003
970,497
180,440
1462,060
-970,497
-94,003
-139,368
717,368
-1462,060
-180,440
-717,368
139,368
Based on estimated marginal means
*. The mean difference is significant at the ,05 level.
a. Adjustment for multiple comparisons: Bonferroni.
Figura 6.6.22 Estimated marginal means e confronti post-hoc per l’effetto principale del Tempo di
Esposizione dello stimolo
L’interpretazione del risultato è che per figure piccole, indipendentemente dal tempo di esposizione
dello stimolo, il tempo di reazione è maggiore, mentre la dimensione medie e grande non sembra
produrre tempi di reazione significativamente diversi.
Vediamo infine le Estimated Marginal Means e i confronti post-hoc sull’effetto di
interazione (Figura 6.6.23).
Estimates
Measure: MEASURE_1
tempo
1
2
dimensio
1
2
3
1
2
3
Mean
3392,500
3209,250
2796,250
3452,500
2571,250
2406,250
Std. Error
345,522
325,557
272,695
332,806
179,320
175,730
95% Confidence Interval
Lower Bound Upper Bound
2669,315
4115,685
2527,851
3890,649
2225,492
3367,008
2755,930
4149,070
2195,929
2946,571
2038,442
2774,058
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Pairwise Comparisons
Measure: MEASURE_1
dimensio
1
2
3
(I) tempo
1
2
1
2
1
2
(J) tempo
2
1
2
1
2
1
Mean
Difference
(I-J)
Std. Error
-60,000
133,012
60,000
133,012
638,000*
257,475
-638,000*
257,475
390,000*
179,211
-390,000*
179,211
a
Sig.
,657
,657
,023
,023
,042
,042
95% Confidence Interval for
a
Difference
Lower Bound Upper Bound
-338,397
218,397
-218,397
338,397
99,098
1176,902
-1176,902
-99,098
14,908
765,092
-765,092
-14,908
Based on estimated marginal means
*. The mean difference is significant at the ,05 level.
a. Adjustment for multiple comparisons: Bonferroni.
Estimates
Measure: MEASURE_1
tempo
1
2
dimensio
1
2
3
1
2
3
Mean
3392,500
3209,250
2796,250
3452,500
2571,250
2406,250
Std. Error
345,522
325,557
272,695
332,806
179,320
175,730
95% Confidence Interval
Lower Bound Upper Bound
2669,315
4115,685
2527,851
3890,649
2225,492
3367,008
2755,930
4149,070
2195,929
2946,571
2038,442
2774,058
Pairwise Comparisons
Measure: MEASURE_1
tempo
1
(I) dimensio
1
2
3
2
1
2
3
(J) dimensio
2
3
1
3
1
2
2
3
1
3
1
2
Mean
Difference
(I-J)
Std. Error
183,250
155,543
596,250
279,992
-183,250
155,543
413,000
253,117
-596,250
279,992
-413,000
253,117
881,250*
266,860
1046,250*
265,910
-881,250*
266,860
165,000
168,781
-1046,250*
265,910
-165,000
168,781
a
Sig.
,760
,140
,760
,358
,140
,358
,011
,003
,011
1,000
,003
1,000
95% Confidence Interval for
a
Difference
Lower Bound Upper Bound
-225,068
591,568
-138,759
1331,259
-591,568
225,068
-251,460
1077,460
-1331,259
138,759
-1077,460
251,460
180,715
1581,785
348,208
1744,292
-1581,785
-180,715
-278,068
608,068
-1744,292
-348,208
-608,068
278,068
Based on estimated marginal means
*. The mean difference is significant at the ,05 level.
a. Adjustment for multiple comparisons: Bonferroni.
Figura 6.6.23 Estimated marginal means e confronti post-hoc per l’effetto di interazione
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Nelle prime due tabelle i confronti post-hoc sono stati eseguiti fra le condizioni del fattore Tempo di
Esposizione su ogni livello del fattore Dimensione dello Stimolo. Notiamo come per figure piccole
(condizione 1 del fattore Dimensione) la differenza nei tempi di reazione medie fra tempo di
esposizione 100 msec (1) e 500 msec (2) non sia statisticamente significativa (Sig. = ,66), mentre lo
sia sugli altri due livelli (figure medie [2] e grandi [3]: Sig. = ,02 e ,04, rispettivamente), sempre con
tempi di reazione maggiori per la condizione 100 msec. Nella terza e nella quarta tabella, invece, i
confronti post-hoc sono stati eseguiti fra le condizioni del fattore Dimensione dello Stimolo su ogni
livello del fattore Tempo di Esposizione. In questo caso si osserva come non vi siano differenze
significative nei tempi di reazione medi a stimoli di dimensioni diverse nella condizione 1 (100
msec) del fattore Tempo di Esposizione, mentre nella condizione 2 (500 msec) emerga lo stesso
pattern di risultati osservato nei confronti post-hoc sull’effetto principale del fattore Dimensione
dello Stimolo, ossia, tempi di reazione maggiori per figure piccole (1) rispetto a medie e grandi (2 e
3, rispettivamente), ma differenze non significative fra figure medie e grandi.
La rappresentazione grafica delle possibili interpretazioni dell’effetto di interazione è
riportata in Figura 6.6.24.
Figura 6.6.24 Grafici di interazione per un'ANOVA completamente within
Per riportare il risultato in un articolo scientifico o in una tesi di laurea riporteremo la tabella con le
statistiche descrittive, uno dei due grafici in Figura 6.6.24 e scriveremo:
E’ stata eseguita un’analisi della varianza fattoriale 2 × 3 completamente within
(Tempo di Esposizione [100msec, 500msec] × Dimensione dello Stimolo [Piccola,
Media, Grande]). Sono risultati significativi entrambi gli effetti principali (Tempo di
Esposizione: F(1, 19) = 7,18, p = ,015, η2 parziale = 0,27; Dimensione dello Stimolo:
F(1.51, 28.75) = 9,13, p = ,002, η2 parziale = 0,32; Interazione: F(2, 38) = 3,45, p =
,042, η2 parziale = 0,15). L’effetto principale del Tempo di Esposizione era dovuto ad
un tempo di reazione medio maggiore per la condizione 100msec. I confronti post-hoc,
eseguiti con correzione Bonferroni del livello di significatività fra le condizioni del
fattore Dimensione dello Stimolo, hanno mostrato che nella condizione Piccola il
tempo di reazione medio era maggiore rispetto alle condizioni Media e Grande, che
però non differivano fra di loro. I confronti post-hoc sugli effetti di interazione, eseguiti
con correzione Bonferroni del livello di significatività, hanno mostrato che per figure
piccole la differenza nei tempi di reazione medie fra tempo di esposizione non era
statisticamente significativa, mentre lo era sugli altri due livelli del fattore Dimensione
dello Stimolo. Inoltre, sono emerse differenze significative nei tempi di reazione medi a
stimoli di dimensioni diverse nella condizione 100 msec, mentre nella condizione 500
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
msec è stato osservato lo stesso pattern di risultati osservato nei confronti post-hoc
sull’effetto principale del fattore Dimensione dello Stimolo.
6.6.3 ANOVA fattoriale mista
Quando alcuni dei fattori sono per gruppi indipendenti (between) e alcuni per misure ripetute
(within), per studiare i loro effetti principali e di interazione si utilizza un’ANOVA fattoriale mista.
Ad esempio, potrebbe essere il caso dei dati riportati in Tabella 6.6.4. Questi dati si riferiscono ad
una ricerca in cui si intendeva valutare la prestazione di guida ad un simulatore (misurata come
numero di errori) di due gruppi di soggetti: nel primo gruppo il soggetto doveva eseguire il compito
mentre discuteva di un certo argomento al cellulare (con l'auricolare) con un amico (gruppo
Cellulare), mentre nel secondo gruppo il soggetto parlava dello stesso argomento con un amico che
però era seduto accanto a lui (gruppo Passeggero). I soggetti sono stati assegnati casualmente ai
gruppi, e dovevano eseguire il compito a tre livelli di difficoltà: Facile, Medio, Difficile. L'ordine
delle prove è stato controbilanciato per tutti i soggetti in tutti i gruppi in modo da evitare effetti di
ordine e di sequenza.
Tabella 6.6.4 Numero di errori
Gruppo
0
0
0
0
0
1
1
1
1
1
Facile
21
20
28
22
28
24
23
23
24
23
Medio
39
34
35
34
38
36
33
32
31
31
Difficile
68
65
66
62
62
63
56
60
51
51
In questo caso il fattore between è la Modalità di Conversazione (di persona vs al cellulare), mentre
quello within è il Livello di Difficoltà (facile, medio, difficile). Questo tipo di analisi può essere
molto utile anche per confrontare i “profili" dei due diversi gruppi6.
Obiettivo: verificare se vi è una differenza legata alla modalità di conversazione nel numero di
errori alla guida, se vi sono differenze legate alla difficoltà della prova e se le differenze nella
modalità di conversazione dipendono dalla difficoltà della prova (o se le differenze nella difficoltà
della prova dipendono dalla modalità di conversazione)
Variabili
Variabile Indipendente 1: Modalità di conversazione (nominale, dicotomica: Passeggero, Cellulare
→ between)
Variabile Indipendente 2: Difficoltà della prova (nominale, politomica: Facile, Medio, Difficile →
within)
Variabile Dipendente: Numero di errori alla prova di guida (a rapporti)
6
Per questo tipo di domanda di ricerca in realtà esiste un’analisi specifica, la profile analysis, che richiede un’analisi
leggermente diversa degli effetti in questione. L’esposizione di questo argomento va al di là degli scopi di questo
volume, per cui si rimanda il lettore, ad esempio, al sito:
http://faculty.chass.ncsu.edu/garson/PA765/manova.htm#profile
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Ipotesi: potrebbe esservi una effetto della modalità di conversazione indipendentemente dal livello
di difficoltà della prova, del livello di difficoltà della prova indipendentemente dalla modalità di
conversazione, oppure un effetto di interazione Modalità di Conversazione × Difficoltà.
Effetti principali
H0: µPasseggero = µCellulare → indipendentemente dalla difficoltà della prova, la popolazione da cui è
stato estratto il gruppo che parla al cellulare ottiene un punteggio medio uguale quello della
popolazione da cui è stato estratto il gruppo che parla dal vivo → non si riscontrano differenze
nel numero di errori di guida legate alla modalità di conversazione
H1: µPasseggero ≠ µCellulare → indipendentemente dalla difficoltà della prova, la popolazione da cui è
stato estratto il gruppo che parla al cellulare ottiene un punteggio medio diverso quello della
popolazione da cui è stato estratto il gruppo che parla dal vivo → si riscontrano differenze nel
numero di errori di guida legate alla modalità di conversazione
H0: µFacile = µMedio = µDifficile → indipendentemente dalla modalità di conversazione, le popolazioni a
cui fanno riferimento le osservazioni nelle prove di guida ai vari livelli di difficoltà hanno
punteggi medi uguali → non si riscontrano differenze nel numero di errori di guida in base alla
difficoltà della prova
H1: Almeno due medie diverse → indipendentemente dalla modalità di conversazione, le
popolazioni a cui fanno riferimento le osservazioni nelle prove di guida ai vari livelli di
difficoltà non hanno punteggi medi uguali → si riscontrano differenze nel numero di errori di
guida in base alla difficoltà della prova
Effetto di interazione7
H0: (µPasseggero − µCellulare)Facile = (µPasseggero − µCellulare)Medio = (µPasseggero − µCellulare)Difficile → la
differenza fra i punteggi medi delle popolazioni da cui sono stati estratti il gruppo che parla al
cellulare e quello che parla dal vivo è uguale per tutti i livelli di difficoltà della prova → la
differenza nel numero di errori di guida legata non dipende dalla difficoltà della prova
H1: Almeno una differenza è significativa → la differenza fra i punteggi medi delle popolazioni da
cui sono stati estratti il gruppo che parla al cellulare e quello che parla dal vivo non è uguale per
tutti i livelli di difficoltà della prova → la differenza nel numero di errori di guida legata
dipende dalla difficoltà della prova
Per realizzare l’analisi in SPSS, si procede come nel caso di un’ANOVA per misure ripetute o di
un’ANOVA fattoriale completamente within. I dati vanno organizzati come in Figura 6.6.25.
7
Per semplicità espositiva, si riporta qui una delle due possibili interpretazioni dell’effetto di interazione. Era possibile
formulare anche l’interpretazione alternativa, ovvero che le differenze fra i vari livelli difficoltà dipendono dalla
modalità di conversazione
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Figura 6.6.25 Organizzazione dei dati in SPSS per la realizzazione di un’ANOVA fattoriale mista
Il percorso da seguire è Analyze → General Linear Model → Repeated Measures. Nella prima
finestra indicheremo che il fattore within è uno solo, Livello di difficoltà, con 3 categorie ordinate
(Figura 6.6.26).
Figura 6.6.26 Definizione del fattore within nella realizzazione di un’ANOVA fattoriale mista
Nella finestra seguente inseriremo le variabili coi punteggi di funzionamento sociali e lavorativo sui
livelli della variabile within (campo Within-Subjects Variables), e il trattamento nel campo delle
variabili between (Between-Subjects Variables) (Figura 6.6.27).
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Figura 6.6.27 Impostazione dei fattori per la realizzazione di un’ANOVA fattoriale mista
A questo punto utilizzeremo le Options per ottenere nell’output i test post-hoc per i due effetti
principali e per l’interazione (anche in questo caso è necessaria la modifica della sintassi di SPSS
vista nella sezione 6.6.18), le statistiche descrittive, i test di omogeneità delle varianza per i gruppi
della variabile between e gli indici di dimensione dell’effetto. Inoltre, in Plots imposteremo la
realizzazione dei due grafici di interazione possibili. L’output è riportato in Figura 6.6.28 9.
Descriptive Statistics
Within-Subjects Factors
Measure: MEASURE_1
livello
1
2
3
Gruppo
8
Dependent
Variable
Facile
Medio
Difficile
Facile
Between-Subjects Factors
Difficile
0
1
Value Label
Cellulare
Passegger
o
Medio
N
6
Gruppo
Cellulare
Passeggero
Total
Cellulare
Passeggero
Total
Cellulare
Passeggero
Total
Mean
23,83
23,17
23,50
36,00
32,17
34,08
64,33
53,33
58,83
Std. Deviation
3,488
1,941
2,714
2,098
2,137
2,843
2,422
3,882
6,520
N
6
6
12
6
6
12
6
6
12
6
GLM
Facile Medio Difficile BY Gruppo
/WSFACTOR = livello 3 Polynomial
/METHOD = SSTYPE(3)
/PLOT = PROFILE( Gruppo*livello livello*Gruppo )
/EMMEANS = TABLES(Gruppo) COMPARE ADJ(BONFERRONI)
/EMMEANS = TABLES(livello) COMPARE ADJ(BONFERRONI)
/EMMEANS = TABLES(Gruppo*livello) COMPARE(gruppo) ADJ(BONFERRONI)
/EMMEANS = TABLES(Gruppo*livello) COMPARE(livello) ADJ(BONFERRONI)
/PRINT = DESCRIPTIVE ETASQ HOMOGENEITY
/CRITERIA = ALPHA(.05)
/WSDESIGN = livello
/DESIGN = Gruppo .
9
Per esigenze di spazio non vengono riportate in questo output le tabelle Multivariate Tests e Tests of Within-Subjects
Contrasts, che comunque SPSS produce, poiché in questo caso non ci interessano.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
a
Box's Test of Equality of Covariance Matrices
Box's M
F
df1
df2
Sig.
12,635
1,404
6
724,528
,210
Tests the null hypothesis that the observed covariance
matrices of the dependent variables are equal across groups.
a.
Design: Intercept+Gruppo
Within Subjects Design: livello
Mauchly's Test of Sphericityb
Measure: MEASURE_1
Epsilon
Within Subjects Effect Mauchly's W
livello
,846
Approx.
Chi-Square
1,508
df
Sig.
,471
2
Greenhous
e-Geisser
,866
a
Huynh-Feldt
1,000
Lower-bound
,500
Tests the null hypothesis that the error covariance matrix of the orthonormalized transformed dependent variables is
proportional to an identity matrix.
a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in
the Tests of Within-Subjects Effects table.
b.
Design: Intercept+Gruppo
Within Subjects Design: livello
Tests of Within-Subjects Effects
Measure: MEASURE_1
Source
livello
livello * Gruppo
Error(livello)
Type III Sum
of Squares
7892,056
7892,056
7892,056
7892,056
168,167
168,167
168,167
168,167
163,111
163,111
163,111
163,111
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
df
2
1,733
2,000
1,000
2
1,733
2,000
1,000
20
17,327
20,000
10,000
Mean Square
3946,028
4554,704
3946,028
7892,056
84,083
97,053
84,083
168,167
8,156
9,414
8,156
16,311
F
483,845
483,845
483,845
483,845
10,310
10,310
10,310
10,310
Sig.
,000
,000
,000
,000
,001
,002
,001
,009
Partial Eta
Squared
,980
,980
,980
,980
,508
,508
,508
,508
a
Levene's Test of Equality of Error Variances
Facile
Medio
Difficile
F
3,455
,027
1,639
df1
df2
1
1
1
10
10
10
Sig.
,093
,872
,229
Tests the null hypothesis that the error variance of the
dependent variable is equal across groups.
a.
Design: Intercept+Gruppo
Within Subjects Design: livello
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Tests of Between-Subjects Effects
Measure: MEASURE_1
Transformed Variable: Average
Source
Intercept
Gruppo
Error
Type III Sum
of Squares
54211,361
240,250
66,056
df
Mean Square
54211,361
240,250
6,606
1
1
10
F
8206,934
36,371
Sig.
,000
,000
Partial Eta
Squared
,999
,784
Figura 6.6.28 Output degli effetti dei fattori per un’ANOVA fattoriale mista
Le prime tre tabelle (Within-Subjects Factors, Between-Subjects Factors e Descriptive Statistics)
riportano l’impostazione del disegno di ricerca e le statistiche descrittive. La tabella Box's Test of
Equality of Covariance Matrices verifica l'ipotesi nulla che le relazioni fra il numero di errori nelle
tre condizioni della variabile between siano omogenee nel gruppo Passeggero e nel gruppo
Cellulare. Questa condizione è centrale soprattutto nell'analisi multivariata nella varianza (vedi più
avanti Sezione 6.6.5): nel caso non fosse soddisfatta questa condizione, ad essere rigorosi, non
potremmo procedere con l'analisi di confronto dei due gruppi, ma eseguire un'analisi separata per
ogni gruppo. In questo caso non ci sono problemi, in quanto Sig. = ,210 > ,05. La tabella Mauchly’s
Test of Sphericity ci informa che le varianze delle differenze nel numero di errori nelle tre
condizioni di difficoltà sono sferiche (Sig. = ,471 > ,05), per cui nella tabella Tests of WithinSubjects Effects potremo consultare, per l’effetto principale della Livello di Difficoltà, la riga
Sphericity Assumed (in caso contrario avremmo dovuto consultare la riga Greenhouse-Geisser).
Nella tabella Within-Subjects Effects notiamo che sono significativi sia l'effetto principale del
Livello di Difficoltà, sia la sua interazione con la modalità di conversazione (Gruppo). Nella tabella
Levene's Test of Equality of Error Variances sono riportati i risultati delle analisi circa l'omogeneità
delle varianze dei gruppi definiti dalla variabile between per ogni livello della variabile within. In
tutti e tre i casi l'assunzione è rispettata (Sig. > ,05). Nella tabella Tests of Between-Subjects Effects
troviamo infine l’effetto principale del fattore between, ossia della modalità di conversazione, che è
statisticamente significativo (Sig.< ,001). Possiamo quindi concludere che vi è un effetto della
difficoltà della prova indipendentemente dalla modalità di conversazione, un effetto della modalità
di conversazione indipendentemente dalla difficoltà della prova, e un effetto di interazione. I test
post-hoc, a questo punto ci aiuteranno ad andare più in profondità con le analisi. Non si farà
menzione di test post-hoc per l'effetto principale della modalità di conversazione, in quanto questa
ha due soli livelli. Dalla tabella delle statistiche descrittive si nota facilmente come sia sempre il
gruppo Cellulare quello a commettere il maggior numero di errori.
Nella Figura 6.6.29 sono riportati i test post-hoc per l'effetto principale della variabile
Livello di Difficoltà.
Estimates
Measure: MEASURE_1
livello
1
2
3
Mean
23,500
34,083
58,833
Std. Error
,815
,611
,934
95% Confidence Interval
Lower Bound
Upper Bound
21,685
25,315
32,721
35,445
56,752
60,914
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Pairwise Comparisons
Measure: MEASURE_1
(I) livello
1
2
3
(J) livello
2
3
1
3
1
2
Mean
Difference
(I-J)
-10,583*
-35,333*
10,583*
-24,750*
35,333*
24,750*
Std. Error
1,114
1,367
1,114
,984
1,367
,984
a
Sig.
,000
,000
,000
,000
,000
,000
95% Confidence Interval for
a
Difference
Lower Bound Upper Bound
-13,780
-7,387
-39,258
-31,409
7,387
13,780
-27,574
-21,926
31,409
39,258
21,926
27,574
Based on estimated marginal means
*. The mean difference is significant at the ,05 level.
a. Adjustment for multiple comparisons: Bonferroni.
Figura 6.6.29 Output dei test post-hoc per l'effetto principale della variabile Livello di Difficoltà
I risultati riportati in Figura 6.6.29 mostrano come al crescere del livello di difficoltà della prova
aumenti anche il numero degli errori alla prova di guida. Tutti i confronti a coppie fra i livelli di
difficoltà sono statisticamente significativi (Sig. < ,05).
Il risultato più interessante delle analisi, però, è la significatività dell'effetto di interazione
Modalità di Conversazione × Livello di Difficoltà. Possiamo supporre, infatti, che al variare del
livello di difficoltà della prova l'effetto della modalità di conversazione si modifichi. L'osservazione
dei grafici con le medie di Figura 6.6.30 sembra confermare questa ipotesi.
Figura 6.6.30. Grafici di interazione Modalità di Conversazione × Livello di Difficoltà
Per giustificare la conclusione a livello statistico, occorre valutare i risultati dei test post-hoc
(Figura 6.6.31).
Estimates
Measure: MEASURE_1
Gruppo
Cellulare
Passeggero
livello
1
2
3
1
2
3
Mean
23,833
36,000
64,333
23,167
32,167
53,333
Std. Error
1,152
,864
1,321
1,152
,864
1,321
95% Confidence Interval
Lower Bound Upper Bound
21,266
26,401
34,074
37,926
61,390
67,276
20,599
25,734
30,241
34,093
50,390
56,276
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Pairwise Comparisons
Measure: MEASURE_1
livello
1
2
3
(I) Gruppo
Cellulare
Passeggero
Cellulare
Passeggero
Cellulare
Passeggero
(J) Gruppo
Passeggero
Cellulare
Passeggero
Cellulare
Passeggero
Cellulare
Mean
Difference
(I-J)
,667
-,667
3,833*
-3,833*
11,000*
-11,000*
a
Std. Error
1,630
1,630
1,222
1,222
1,868
1,868
Sig.
,691
,691
,011
,011
,000
,000
95% Confidence Interval for
a
Difference
Lower Bound Upper Bound
-2,964
4,298
-4,298
2,964
1,109
6,557
-6,557
-1,109
6,838
15,162
-15,162
-6,838
Based on estimated marginal means
*. The mean difference is significant at the ,05 level.
a. Adjustment for multiple comparisons: Bonferroni.
Estimates
Measure: MEASURE_1
Gruppo
Cellulare
Passeggero
livello
1
2
3
1
2
3
Mean
23,833
36,000
64,333
23,167
32,167
53,333
Std. Error
1,152
,864
1,321
1,152
,864
1,321
95% Confidence Interval
Lower Bound
Upper Bound
21,266
26,401
34,074
37,926
61,390
67,276
20,599
25,734
30,241
34,093
50,390
56,276
Pairwise Comparisons
Measure: MEASURE_1
Gruppo
Cellulare
(I) livello
1
2
3
Passeggero
1
2
3
(J) livello
2
3
1
3
1
2
2
3
1
3
1
2
Mean
Difference
(I-J)
-12,167*
-40,500*
12,167*
-28,333*
40,500*
28,333*
-9,000*
-30,167*
9,000*
-21,167*
30,167*
21,167*
Std. Error
1,575
1,934
1,575
1,391
1,934
1,391
1,575
1,934
1,575
1,391
1,934
1,391
a
Sig.
,000
,000
,000
,000
,000
,000
,001
,000
,001
,000
,000
,000
95% Confidence Interval for
a
Difference
Lower Bound
Upper Bound
-16,687
-7,646
-46,050
-34,950
7,646
16,687
-32,327
-24,340
34,950
46,050
24,340
32,327
-13,520
-4,480
-35,716
-24,617
4,480
13,520
-25,160
-17,173
24,617
35,716
17,173
25,160
Based on estimated marginal means
*. The mean difference is significant at the ,05 level.
a. Adjustment for multiple comparisons: Bonferroni.
Figura 6.6.31. Test post-hoc per l'effetto di interazione Modalità di Conversazione × Livello di
Difficoltà
Nelle prime due tabelle vengono riportate le medie e i relativi confronti di ogni gruppo definito
dalla variabile between per ogni categoria del Livello di Difficoltà. I risultati mostrano che al livello
di difficoltà più basso non c'è una differenza significativa fra le prestazioni dei due gruppi, mentre
la differenza risulta significativa per i livelli di difficoltà successivi, sempre con medie maggiori
(ossia, maggior numero di errori) nel gruppo Cellulare.
Le ultime due tabelle della Figura 6.6.31, invece, mostrano le medie e i relativi confronti di
ogni livello di difficoltà per ogni categoria della variabile Modalità di Conversazione. Tutti i
possibili confronti sono significativi, per cui possiamo concludere che il Livello Difficile produce
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
un numero di errori sistematicamente maggiori del Livello Medio, che a sua volta produce un
numero di errori sistematicamente maggiore del Livello Facile.
La significatività dell'effetto di interazione Modalità di Conversazione × Livello di
Difficoltà sembra quindi dovuto al fatto che al livello più basso di difficoltà la simulazione della
telefonata non produce un numero di errori statisticamente maggiore rispetto a quello della
simulazione del dialogo in presenza dell'interlocutore, mentre questo avviene per tutti gli altri livelli
di difficoltà della prova.
Per riportare il risultato in un articolo scientifico o in una tesi di laurea riporteremo la tabella con le
statistiche descrittive, uno dei due grafici in Figura 6.6.31 e scriveremo:
E’ stata eseguita un’analisi della varianza fattoriale mista 2 × 3 (Modalità di
Conversazione: [Cellulare, Passeggero; between] × Livello di Difficoltà [Facile, Medio,
Difficile; within]. Gli effetti principali sono risultati statisticamente significativi
(Livello di Difficoltà: F(2, 20) = 483,85, p < ,001, η2 parziale = 0,98; Modalità di
Conversazione: F(1, 10) = 36,37, p < ,001, η2 parziale = 0,78, Cellulare > Passeggero),
così come l’interazione: F(2, 20) = 10,31, p = ,001, η2 parziale = 0,51). I confronti
post-hoc, eseguiti con correzione Bonferroni del livello di significatività, hanno
mostrato che l’effetto principale del Livello di Difficoltà era dovuto al fatto che ogni
livello di difficoltà produceva un numero medio di errori significativamente superiore a
quello precedente (Difficile > Medio > Facile). I confronti post-hoc eseguiti per
esaminare le ragioni dell'effetto di interazione hanno mostrato che questo pattern di
risultati si riproduceva indipendentemente dalla modalità di conversazione, e che al
livello più basso di difficoltà la simulazione della telefonata non produceva un numero
di errori statisticamente maggiore rispetto a quello della simulazione del dialogo in
presenza dell'interlocutore, mentre questo avveniva per tutti gli altri livelli di difficoltà
della prova.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
6.6.4 Analisi della covarianza (ANCOVA)
Quando una delle potenziali variabili indipendenti è metrica, ossia misurata su scala a intervalli o
rapporti, è possibile inserirla nel modello lineare come covariata. L’analisi dei dati prende quindi il
nome di analisi della covarianza (ANCOVA), e consente di esaminare la relazione fra le variabili
metriche controllando la variabile categoriale (fattore), o viceversa. Una delle due variabili
indipendenti, infatti, potrebbe sopprimere l’effetto dell’altra: a livello statistico, quindi, una delle
due variabili indipendenti andrebbe a gonfiare la varianza di errore, rendendo il test F per l’altra
variabile indipendente non significativo. Naturalmente è possibile anche il contrario, ossia che
l’effetto della seconda variabile indipendente gonfi l’effetto della prima, facendo emergere a livello
statistico un effetto che invece non c’è. In questo senso, un’ANCOVA consente di aumentare la
precisione nelle analisi dei dati fornendo un controllo statistico per le variabili estranee, soprattutto
quando il controllo diretto di queste variabili mediante il disegno sperimentale è impraticabile. Ad
esempio, l’ANCOVA permette di rimuovere statisticamente le differenze preesistenti fra gruppi che
sono utilizzati in test sperimentali ma ai quali i soggetti non sono stati assegnati in modo casuale.
Vediamo un paio di esempi.
Supponiamo di voler indagare l’effetto del metodo di studio per l’esame di Tecniche di
Ricerca e Analisi dei Dati, e di aver ottenuto informazioni su tre gruppi di studenti che si sono
preparati seguendo il tutorato didattico della facoltà (Tutorato), studiando assieme ad altri compagni
(Gruppo) o da soli (Individuale). Di primo acchito sembrerebbe molto semplice rispondere alla
domanda di ricerca, perché basterebbe realizzare un’ANOVA per gruppi indipendenti prendendo
come variabile dipendente il voto all’esame. Tuttavia, è verosimile pensare che una certa quota di
variabilità del voto all’esame possa essere spiegata, indipendentemente dal metodo di studio, anche
dal voto che gli stessi studenti avevano preso all’esame di Psicometria del primo anno. Questa
informazione va quindi a costituire una covariata del modello lineare per cui:
y = µ + α i + β ( X ij − M x ) + ε
dove µ è la media generale fissa della popolazione, α è l’effetto del fattore Metodo di Studio, β è la
variazione media che ci attendiamo in y per un cambiamento unitario del valore della covariata
(ossia, il voto a Psicometria), ε è il termine di errore. Si noti che in questo modello non è
contemplato l’effetto di interazione fattore × covariata, in quanto una delle assunzioni
dell’ANCOVA è che il valore di β è uguale per tutti i livelli del fattore. SPSS, infatti, di default non
inserisce questo termine nell’ANCOVA10. La suddivisione della “torta” della variabilità della
variabile dipendente avviene quindi come illustrato in Figura 6.6.32.
10
E’ però possibile richiederlo clickando su Model e spuntando Custom nel riquadro Specify Model. A questo punto
selezioniamo con un click del tasto sinistro del mouse entrambi i fattori (Gruppo e Psicometria_Cov) e nel menu a
e spostiamo i due effetti
tendina del riquadro Build Term(s) scegliamo Main Effects. A quel punto clickiamo su
principali nel campo Model. Per inserire nel modello lineare anche il termine di interazione, occorre selezionare di
nuovo le due variabili indipendenti, dal menu a tendina del riquadro Build Term(s) scegliere Interaction e premere su
. Nel campo Model quel punto comparirà anche la dicitura gruppo*psicometria_cov.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Figura 6.6.32 Suddivisione della devianza della variabile dipendente in base agli effetti delle variabili
indipendenti in un’ANCOVA (nel modello si assume che la devianza dovuta all’interazione covariate ×
fattore sia uguale a zero)
Supponiamo di aver ottenuto i dati riportati in Tabella 6.6.5
Tabella 6.6.5 Dati relativi all'esito dell'esame di Tecnica di Ricerca e Analisi dei Dati in tre gruppi di
soggetti definiti dal metodo di studio (0 = Tutorato, 1 = Gruppo; 2 = Individuale) e al voto conseguito
all'esame di Psicometria
Voto Tecniche di Ricerca
Metodo di Studio
Voto Psicometria
e Analisi dei Dati
(fattore)
(covariata)
(variabile dipendente)
0
25
28
0
22
25
0
22
27
0
23
27
1
20
21
1
25
29
1
19
22
1
20
24
2
25
23
2
25
27
2
24
24
2
21
20
Se eseguissimo delle analisi della varianza separatamente per il voto a Psicometria e quello a
Tecniche di Ricerca e Analisi dei Dati, osserveremmo che non ci sono differenze legate al metodo
di studio (Psicometria: F(2, 9) = 1,63, p = ,25; Tecniche di Ricerca: F(2, 9) = 1,88, p = ,21). Ma
cosa succede se consideriamo tutte le variabili in un unico modello?
Obiettivo: verificare se vi è una differenza legata al metodo di studio nel voto all’esame di
Tecniche di Ricerca e Analisi dei Dati, al netto del voto ottenuto a Psicometria
Variabili
Variabile Indipendente 1 (fattore): Metodo di Studio (nominale, politomica: Tutorato, Gruppo,
Individuale)
Variabile Indipendente 2 (covariata): Voto Psicometria (a intervalli)
Variabile Dipendente: Voto Tecniche di Ricerca e Analisi dei Dati (a intervalli)
Ipotesi: potrebbe esservi una effetto del metodo di studio indipendentemente dal voto a Psicometria,
un effetto del voto a Psicometria indipendentemente dal metodo di studio, oppure un effetto di
interazione del metodo di studio × voto psicometria
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Effetti principali
H0: µTutorato = µGruppo = µIndividuale → indipendentemente dal voto a Psicometria, le popolazioni da cui
sono stati estratti i tre gruppi ottengono all’esame di Tecniche di Ricerca e Analisi dei Dati lo
stesso voto medio → non si riscontrano differenze di voto legate al titolo di studio
H1: Almeno due medie diverse → indipendentemente dal voto a Psicometria, le popolazioni da cui
sono stati estratti i tre gruppi ottengono all’esame di Tecniche di Ricerca e Analisi dei Dati non
hanno lo stesso voto medio → si riscontrano differenze di voto legate al metodo di studio, da
indagare mediante test post-hoc
H0: β = 0 → indipendentemente dal metodo di studio, la covariata (voto a Psicometria) non ha alcun
effetto sul voto a Tecniche di Ricerca e Analisi dei Dati
H1: β ≠ 0 → indipendentemente dal metodo di studio, la covariata (voto a Psicometria) ha un
qualche effetto sul voto a Tecniche di Ricerca e Analisi dei Dati
Eventuale effetto di interazione (non inserito nei modelli ANCOVA standard)
H0: β uguali per ogni livello del titolo di studio → la covariata (voto a Psicometria) ha lo stesso
effetto per tutti i livelli del metodo di studio
H1: Almeno due β diversi → la covariata (voto a Psicometria) non ha lo stesso effetto per tutti i
livelli del metodo di studio
In SPSS i dati vanno inseriti come in Figura 6.6.33
Figura 6.6.33 Inserimento dati in SPSS per la realizzazione di un’ANCOVA
Le covariate possono essere inserite nell’apposito campo in qualunque tipo di analisi (Univariate,
Multivariate, Repeated Measures) del menu Analyze → General Linear Model. In questo caso,
poiché il fattore è una variabile between e la variabile dipendente una sola, utilizziamo il modulo
Univariate, ma sono possibili analisi della covarianza che includano più di un fattore, fattori sia
between che within, più di una variabile dipendente. L’impostazione dell’analisi è mostrata in
Figura 6.6.34.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Figura 6.6.34 Impostazione di un’ANCOVA in SPSS
Si noti in Figura 6.6.34 come sia grigiato il tasto Post-Hoc. Questo accade sempre quando si
inserisce una covariata nel modello, perché una volta rimossa dalla variabile dipendente la
variabilità dovuta alla covariata non è più possibile realizzare i post-hoc disponibili in questa
opzione. Rimane però possibile impostare i post-hoc con correzione Bonferroni per i livelli del
fattore in Options, che è quello che facciamo anche in questo caso, spuntando anche le casella per la
stima della dimensione dell’effetto (Estimates of effect size). L’effetto della covariata non prevede
post-hoc, perché è fondamentalmente una correlazione (si veda il Capitolo 7). Dopo aver clickato su
Continue e quindi su OK, si otterrà l’ouput di Figura 6.6.35. La prima tabella (Between-Subjects
Factors), che contiene il riassunto del disegno di ricerca, non è rappresentata per brevità.
Tests of Between-Subjects Effects
Dependent Variable: tecniche_vd
Source
Corrected Model
Intercept
psicometria_cov
metodo
Error
Total
Corrected Total
Type III Sum
of Squares
75,603a
,106
51,103
35,805
16,647
7443,000
92,250
df
3
1
1
2
8
12
11
Mean Square
25,201
,106
51,103
17,903
2,081
F
12,111
,051
24,559
8,604
Sig.
,002
,827
,001
,010
Partial Eta
Squared
,820
,006
,754
,683
a. R Squared = ,820 (Adjusted R Squared = ,752)
Estimates
Dependent Variable: tecniche_vd
metodo
Tutorato
Gruppo
Individuale
Mean
Std. Error
26,272a
,728
25,818a
,809
22,160a
,770
95% Confidence Interval
Lower Bound
Upper Bound
24,593
27,950
23,952
27,684
20,384
23,936
a. Covariates appearing in the model are evaluated at the
following values: psicometria_cov = 22,58.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Pairwise Comparisons
Dependent Variable: tecniche_vd
(I) metodo
Tutorato
Gruppo
Individuale
(J) metodo
Gruppo
Individuale
Tutorato
Individuale
Tutorato
Gruppo
Mean
Difference
(I-J)
,453
4,111*
-,453
3,658*
-4,111*
-3,658*
Std. Error
1,120
1,035
1,120
1,203
1,035
1,203
a
Sig.
1,000
,012
1,000
,048
,012
,048
95% Confidence Interval for
a
Difference
Lower Bound
Upper Bound
-2,926
3,832
,991
7,232
-3,832
2,926
,031
7,285
-7,232
-,991
-7,285
-,031
Based on estimated marginal means
*. The mean difference is significant at the ,05 level.
a. Adjustment for multiple comparisons: Bonferroni.
Figura 6.6.35 Output di SPSS per un’ANCOVA
Nella prima tabella (Test of Between-Subjects Effects) viene riportata la significatività di tutti gli
effetti. Si noti come sia significativo sia l’effetto del fattore (metodo) che quello della covariata
(psicometria_cov). Si ricorda che per una valutazione più precisa della dimensione dell’effetto
occorre dividere la devianza dell’effetto per quella corrispondente a Corrected Total. quando
andiamo a valutare i test post-hoc per i livelli del fattore, si noti che a pie’ delle tabella Estimates sia
indicato che quei valori sono corretti per l’effetto della covariata, ed è su questi che sono stati
eseguiti i test post-hoc della tabella Pairwise Comparisons. Si osservi come vi sia una differenza
significativa fra Tutorato e Individuale e fra Gruppo e Individuale, sempre con Individuale che
presenta i punteggi più bassi. Questo risultato significa che, al netto del voto di Psicometria,
all’esame di Tecniche di Ricerca e Analisi dei Dati chi ha seguito il tutorato didattico di facoltà o ha
studiato in gruppo in media ha ottenuto un voto superiore rispetto a chi ha studiato da solo.
Per riportare il risultato in un articolo scientifico o in una tesi di laurea riporteremo la tabella
con le statistiche descrittive, il grafico con le medie e scriveremo:
E’ stata eseguita un’analisi della covarianza con fattore Metodo di Studio (Tutorato,
Gruppo, Individuale) e covariata Voto all’esame di Psicometria. Gli effetti principali
sono risultati statisticamente significativi (Metodo di Studio: F(2, 8) = 8,60, p = ,010,
η2 parziale = 0,68; Voto Psicometria: F(1, 8) = 24,56, p = ,001, η2 parziale = 0,75). I
confronti post-hoc, eseguiti con correzione Bonferroni del livello di significatività,
hanno mostrato che chi ha seguito il tutorato didattico di facoltà o ha studiato in gruppo
ha ottenuto in media una votazione media superiore a chi ha studiato individualmente.
Un’altra importante applicazione dell’ANCOVA riguarda i casi in cui si ha un disegno misto in cui
vi è un gruppo sperimentale e un gruppo di controllo e una serie di misure ripetute. Se è possibile
assegnare i soggetti casualmente ai due livelli di trattamento, i due gruppi risultanti dovrebbero
essere omogenei per tutte le caratteristiche di interesse, compreso il punteggio nella variabile
dipendente in assenza di trattamento. Se però questa operazione di controllo non è possibile, può
darsi che i gruppi non siano omogenei fin dall’inizio, per cui gli effetti del trattamento potrebbero
essere distorti da questa disomogeneità iniziale. Consideriamo il caso in cui un ricercatore intenda
studiare i benefici dell’aggiunta di un training di assertività al normale protocollo terapeutico per la
cura dell’anoressia. Tutte le pazienti, quindi, seguiranno il protocollo standard, ma a metà di esse
sarà proposto di partecipare ad un corso per lo sviluppo dell’assertività. Se consideriamo come
variabile dipendente il punteggio alla scala Impulso alla Magrezza (IM, a punteggi maggiori
corrisponde un maggior grado di psicopatologia) del test Eating Disorder Inventory II (Garner,
1991), potremmo aspettarci che all’inizio del trattamento i due gruppi abbiamo lo stesso punteggio
alla scala IM solo se le pazienti venissero assegnate ai gruppi mediante una procedura
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
randomizzata. Se però questo non è possibile, perché possono partecipare al training solo le pazienti
residenti in città, mentre quelle fuori città no, allora occorre controllare che non vi sia una
disomogeneità iniziale nel punteggio alla scala IM. Supponiamo che la scala venga somministrata in
tre occasioni (Inizio del trattamento; dopo 3 mesi; dopo 6 mesi) e che i dati siano quelli riportati in
Tabella 6.6.611.
Tabella 6.6.6 Punteggi alla scala Impulso alla Magrezza del test EDI-2 per due gruppi (Training,
NoTraining di assertività) in tre diversi momenti della terapia
Condizione
Inizio
3 mesi
6 mesi
0
20
14
14
0
20
16
12
0
24
16
16
0
30
20
18
0
26
22
18
1
18
14
5
1
14
12
4
1
16
14
4
1
10
8
3
1
16
14
6
Nota: 0 = gruppo di controllo (no training); 1 = gruppo sperimentale (training)
Se realizzassimo una semplice ANOVA fattoriale mista 2 × 3 (variabile between Condizione: No
Training; variabile within: Tempo: Inizio, 3 mesi, 6 mesi) otterremmo che entrambi gli effetti
principali e l’effetto di interazione sono significativi (Tempo: F(2, 16) = 105,33, p < ,001;
Condizione: F(1, 8) = 24,55, p = ,001; Interazione: F(2, 16) = 11,11, p = ,001), il che ci porterebbe
a concludere che il training ha effetto indipendentemente dal miglioramento, che avviene comunque
in virtù del fatto che il protocollo di intervento viene applicato anche al gruppo di controllo.
L’interazione, come mostrato in Figura 6.6.36, suggerisce inoltre che il training sembra potenziare
l’effetto del protocollo, dato che la diminuzione del punteggio di IM è più ripida dal Tempo 2 al
Tempo 3 per il gruppo Training rispetto al gruppo di controllo. Nondimeno, dallo stesso si grafico
si nota che i due gruppi non partissero dallo stesso punteggio di IM al Tempo 1. Un semplice test t
per campioni indipendenti può provare che la differenza era significativa (t(8) = 3,94, p = ,004).
Questa differenza iniziale ha sicuramente avuto un’influenza sul livello dei punteggi ottenuti in
seguito, per cui, visto che non si è potuta controllare con l’assegnazione randomizzata questa
variabile, si procede al controllo statistico mediante l’ANCOVA. In pratica, realizziamo un’analisi
in cui la variabile within ha due livelli (Tempo 2 e Tempo 3), la between è immutata, e il punteggio
di IM all’Inizio del trattamento è la covariata.
11
I punteggi alla scala IM sono stati riscalati rispetto agli originali per facilitare l’esposizione
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Figura 6.6.36 Grafico di interazione Tempo × Condizione
Obiettivo: verificare se il training di assertività migliora la riuscita dell’intervento,
indipendentemente e in interazione col protocollo, al netto delle differenze iniziali fra il gruppo
sperimentale e il gruppo di controllo nei punteggi della variabile dipendente
Variabili
Variabile Indipendente 1 (fattore): Condizione (nominale, dicotomica: No Training, Training,
between)
Variabile Indipendente 2 (fattore): Tempo (nominale, dicotomica: 3 mesi, 6 mesi, within)
Variabile Indipendente 3 (covariata): Punteggio alla scala IM all’inizio del trattamento (ad
intervalli)
Variabile Dipendente: Punteggio alla scala IM (a intervalli)
Ipotesi: potrebbe esservi una effetto del tempo indipendentemente dalla condizione e dal punteggio
iniziale, un effetto della condizione indipendentemente dal punteggio iniziale e del tempo, un effetto
del punteggio iniziale indipendentemente dal tempo e dalla condizione, oppure un effetto di
interazione del tempo × condizione indipendente dal punteggio iniziale.
Effetti principali
H0: µTraining = µNo training → indipendentemente dal tempo e dal punteggio iniziale, le popolazioni da
cui sono stati estratti i due gruppi ottengono alla scala IM lo stesso punteggio medio → non si
riscontrano differenze di punteggio legate alla condizione
H1: µTraining ≠ µNo training → indipendentemente dal tempo e dal punteggio iniziale, le popolazioni da
cui sono stati estratti i due gruppi non ottengono alla scala IM lo stesso punteggio medio → si
riscontrano differenze di punteggio legate alla condizione
H0: µ3mesi = µ6mesi → indipendentemente dalla condizione e dal punteggio iniziale, la popolazione a
cui fanno riferimento le osservazioni a 3 mesi hanno un punteggio medio alla scala IM uguale
alla popolazione a cui fanno riferimento le osservazioni a 6 mesi → non si riscontrano
differenze di punteggio legate al tempo
H1: µ3mesi ≠ µ6mesi → indipendentemente dalla condizione e dal punteggio iniziale, la popolazione a
cui fanno riferimento le osservazioni a 3 mesi hanno un punteggio medio alla scala IM diverso
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
rispetto alla popolazione a cui fanno riferimento le osservazioni a 6 mesi → si riscontrano
differenze di punteggio legate al tempo
H0: β = 0 → indipendentemente dalla condizione e dal tempo, la covariata (punteggio all’Inizio del
trattamento) non ha alcun effetto sui punteggi successivi
H1: β ≠ 0 → indipendentemente dalla condizione e dal tempo, la covariata (punteggio all’Inizio del
trattamento) ha un qualche effetto sui punteggi successivi
Eventuale di interazione
H0: (µ3mesi − µ6mesi)Training = (µ3mesi − µ6mesi)NoTraining, oppure (µTraining − µNoTraining)3mesi = (µTraining −
µNoTraining)6mesi → la differenza fra i punteggi medi delle popolazioni a cui fanno riferimento le
osservazioni per un tempo di esposizione a 3 e 6 mesi è uguale per tutte le condizioni, oppure la
differenza fra i punteggi medi delle popolazioni a cui fanno riferimento il gruppo Training e il
gruppo NoTraining è uguale per tutte le rilevazioni → il tempo non modera l’effetto della
condizione, o viceversa
H1: Almeno una differenza è significativa → la differenza fra i punteggi medi delle popolazioni a
cui fanno riferimento le osservazioni per un tempo di esposizione a 3 e 6 mesi non è uguale per
tutte le condizioni, oppure la differenza fra i punteggi medi delle popolazioni a cui fanno
riferimento il gruppo Training e il gruppo NoTraining non è uguale per tutte le rilevazioni → il
tempo modera l’effetto della condizione, o viceversa
In SPSS seguiamo il percorso Analyze → General Linear Model → Repeated Measures,
impostiamo un fattore within a 2 livelli (Time), e inseriamo la variabile Inizio nel campo
Covariates, come in Figura 6.6.37.
Figura 6.6.37 Impostazione di un’ANCOVA in SPSS in cui il punteggio alla prima rilevazione è la
covariata
In questo caso non c’è bisogno dei post-hoc per gli effetti principali perché sia la variabile between
che quella within, adesso, sono a dicotomiche, ma lo impostiamo lo stesso in Options per ottenere le
medie stimate e, soprattutto, impostiamo i post-hoc per l’effetto di interazione, con l’opportuna
modifica nella sintassi di SPSS. Impostiamo in Options anche la produzione delle statistiche
descrittive e della dimensione dell’effetto. La Figura 6.6.38 riporta le sole tabelle necessarie ai fini
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
della valutazione degli effetti12. Per non appesantire l'esposizione non sono riportati i dati relativi ai
test di omogeneità delle varianze come abbiamo visto per l'ANOVA mista, ma nella pratica è
sempre consigliabile ispezionarli prima di procedere all'interpretazione dei risultati.
Tests of Within-Subjects Effects
Measure: MEASURE_1
Source
time
time * Inizio
time * gruppo
Error(time)
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Type III Sum
of Squares
,073
,073
,073
,073
2,647
2,647
2,647
2,647
27,366
27,366
27,366
27,366
12,353
12,353
12,353
12,353
df
Mean Square
,073
,073
,073
,073
2,647
2,647
2,647
2,647
27,366
27,366
27,366
27,366
1,765
1,765
1,765
1,765
1
1,000
1,000
1,000
1
1,000
1,000
1,000
1
1,000
1,000
1,000
7
7,000
7,000
7,000
F
,041
,041
,041
,041
1,500
1,500
1,500
1,500
15,507
15,507
15,507
15,507
Sig.
,845
,845
,845
,845
,260
,260
,260
,260
,006
,006
,006
,006
Partial Eta
Squared
,006
,006
,006
,006
,176
,176
,176
,176
,689
,689
,689
,689
Tests of Between-Subjects Effects
Measure: MEASURE_1
Transformed Variable: Average
Source
Intercept
Inizio
gruppo
Error
Type III Sum
of Squares
1,060
71,576
14,512
16,224
df
1
1
1
7
Mean Square
1,060
71,576
14,512
2,318
F
,457
30,883
6,261
Sig.
,521
,001
,041
Partial Eta
Squared
,061
,815
,472
Figura 6.6.38 Effetti principali e di interazione di un’ANCOVA fattoriale mista
Si noti come il Tempo (time) non abbia più un effetto principale significativo, mentre rimangano
significativi gli effetti principali del gruppo e dell’interazione. Inoltre, è significativo l’effetto della
covariata: a questo punto, però, che vi fosse una disomogeneità iniziale fra i gruppi non ci interessa
più, visto che il suo effetto è stato rimosso statisticamente. Ispezionando la tabella in Figura 6.6.39
possiamo concludere che chi segue in training, al netto di tutti gli altri effetti, ottiene punteggi di IM
inferiori.
Estimates
Measure: MEASURE_1
gruppo
Controllo
Training
Mean
Std. Error
13,962a
,676
11,038a
,676
95% Confidence Interval
Lower Bound Upper Bound
12,363
15,561
9,439
12,637
a. Covariates appearing in the model are evaluated at the
following values: Inizio = 19,40.
Figura 6.6.38 Medie stimate dei gruppi Training e Controllo
SPSS riporta anche l’effetto di interazione fattore within (time) × covariata (inizio), che non è eliminabile dal
modello.
12
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
I test post-hoc sull’effetto di interazione mostrano come le due condizioni non siano diverse dopo 3
mesi di trattamento (1), ma lo diventino dopo 6 mesi (2), e come nella condizione di controllo non
vi sia una differenza fra 3 mesi e 6 mesi, mentre nella condizione training sì (Figura 6.6.39).
Pairwise Comparisons
Measure: MEASURE_1
time
1
2
(I) gruppo
Controllo
Training
Controllo
Training
(J) gruppo
Training
Controllo
Training
Controllo
Mean
Difference
(I-J)
-1,091
1,091
6,938*
-6,938*
Std. Error
1,813
1,813
1,234
1,234
a
Sig.
,566
,566
,001
,001
95% Confidence Interval for
a
Difference
Lower Bound Upper Bound
-5,377
3,195
-3,195
5,377
4,020
9,857
-9,857
-4,020
Based on estimated marginal means
*. The mean difference is significant at the ,05 level.
a. Adjustment for multiple comparisons: Bonferroni.
Pairwise Comparisons
Measure: MEASURE_1
gruppo
Controllo
Training
(I) time
1
2
1
2
(J) time
2
1
2
1
Mean
Difference
(I-J)
,985
-,985
9,015*
-9,015*
Std. Error
1,180
1,180
1,180
1,180
a
Sig.
,431
,431
,000
,000
95% Confidence Interval for
a
Difference
Lower Bound Upper Bound
-1,805
3,775
-3,775
1,805
6,225
11,805
-11,805
-6,225
Based on estimated marginal means
*. The mean difference is significant at the ,05 level.
a. Adjustment for multiple comparisons: Bonferroni.
Figura 6.6.39 Confronti post-hoc per l’effetto di interazione
Per riportare il risultato in un articolo scientifico o in una tesi di laurea riporteremo la tabella con le
statistiche descrittive, il grafico in Figura 6.6.36 (per mostrare graficamente la disomogeneità
iniziale dei due gruppi) e scriveremo:
E’ stata eseguita un’analisi della covarianza fattoriale mista 2 × 2 (Tempo [3 mesi, 6
mesi, within] × Conizione [Training, NoTraining, between]) e covariata punteggio alla
scala IM all’inizio del trattamento. Un’analisi preliminare, infatti, aveva mostrato che il
gruppo Training e il gruppo NoTraining presentavano una disomogeneità rispetto al
punteggio di partenza (t(8) = 3,94, p = ,004). Non è risultato significativo l’effetto
principale del tempo (F(1, 7) = 0,04, p = ,845, η2 parziale = 0,006), mentre sono
risultati significativi gli effetti principali della Condizione (F(1, 7) = 6,26, p = ,041, η2
parziale = 0,472) e della covariata (F(1, 7) = 30,88, p = ,001, η2 parziale = 0,815. E’
risultata inoltre significativa l’interazione Condizione × Tempo (F(1, 7) = 15,51, p =
,006, η2 parziale = 0,689. L’ispezione delle medie ha rivelato che nella condizione
Training i punteggi di IM erano inferiori indipendentemente dal tempo e dalla
covariata. I confronti post-hoc sull’effetto di interazione, eseguiti con correzione
Bonferroni del livello di significatività, hanno mostrato come le due condizioni non
siano diverse dopo 3 mesi di trattamento ma lo diventino dopo 6 mesi, e come nella
condizione di controllo non vi sia una differenza fra 3 mesi e 6 mesi, mentre nella
condizione training la differenza era presente.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
6.6.4.1 Assunzioni per l’applicazione dell’analisi della covarianza
Per poter essere applicata correttamente, l’ANCOVA prevede alcune assunzioni:
1. I punteggi sulla variabile dipendente y possono essere considerati una combinazione lineare
di quattro componenti indipendenti: media generale µ, effetto del fattore α, effetto lineare
della covariata β, termine di errore ε: y = µ + α i + β ( X ij − M x ) + ε . In questa equazione β
rappresenta la variazione media che ci attendiamo in y per un cambiamento unitario del
valore della covariata
2. L’errore ε è distribuito normalmente con media 0 e gli errori di soggetti diversi sono
indipendenti fra loro
3. Il coefficiente β della covariata è lo stesso in ogni livello del fattore, altrimenti risulta
significativa l’interazione covariata × fattore: questo significa che il β del modello non è lo
stesso per tutti i livelli del fattore.
4. La covariata è una variabile matematica fissa misurata senza errore
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
6.6.5 Analisi multivariata della varianza (MANOVA) per campioni indipendenti
Quando le variabili dipendenti sono più di una, è possibile realizzare un test omnibus che in primo
luogo verifichi l’ipotesi che la/e variabile/i indipendente/i (siano esse fattori o covariate) abbiano un
effetto (effetto multivariato) sulle variabili dipendenti nel loro insieme. L’insieme delle variabili
dipendenti costituisce una variata, che è un criterio statistico risultante dalla combinazione lineare
delle variabili originariamente osservate. Se per le variabili si fanno ipotesi sulle medie, per le
variate si fanno ipotesi sui centroidi. Il test multivariato verifica infatti se i centroidi dei gruppi
della/e variabile/i indipendente/i sono uguali fra loro. Se questo test è significativo, si passa a
considerare gli effetti della/e variabile/i indipendente/i sulle singole variabili dipendenti, come se si
trattasse di un’ANOVA (effetti univariati). Se i test univariati sono significativi, si realizzano i
confronti post-hoc per indagare fra le medie di quali gruppi sussistono differenze significative.
Le assunzioni che devono essere rispettate per l’applicazione della MANOVA sono
identiche a quelle dell’ANOVA per quanto riguarda l’indipendenza delle osservazioni, l’assenza di
relazione fra i termini di errore, e l’additività degli effetti nel modello lineare. In più vi sono le
seguenti assunzioni:
1. Le correlazioni fra le variabili dipendenti devono essere diverse da zero: il vantaggio della
MANOVA rispetto al realizzare tante ANOVA quante sono le variabili dipendenti consiste
proprio nel considerare le relazioni fra le variabili dipendenti per valutare l’effetto delle
variabili indipendenti
2. Omogeneità delle matrici di varianza/covarianza all’interno di ogni gruppo: il pattern di
relazioni fra le variabili dipendenti deve essere lo stesso in ogni gruppo
3. In ogni gruppo vi deve essere un numero di soggetti superiore al numero di variabili
dipendenti
Se una di queste assunzioni non è soddisfatta, è consigliabile procedere con una serie di ANOVA
separate.
La MANOVA si rivela particolarmente utile quando le variabili dipendenti possono essere
considerate operazionalizzazioni di uno stesso costrutto psicologico. Il fatto di fare riferimento ad
un unico costrutto fa sì che le variabili siano adeguatamente correlate fra loro, e permette di
verificare sia ipotesi generali, a livello di centroidi, che specifiche, a livello di medie. Può essere il
caso delle scale ad un test psicologico, i cui punteggi siano correlati fra loro. Nel caso dell'esempio
dell'ANOVA mista la MANOVA non era applicabile perché la domanda di ricerca riguardava
anche la differenza fra le varie condizioni definite dalle misure ripetute, che invece non è un
obiettivo della MANOVA. Supponiamo però di voler indagare le differenze legate alla caratteristica
principale della scelta del cibo (Gusto, Contenuto Calorico, Genuinità) fra i punteggi alle tre scale
della Intuitive Eating Scale (IES, Tylka, 2006; adattamento italiano di Chiorri, 2009). La tre scale di
IES valutano il fatto che le persone si concedano di mangiare quello che desiderano, senza
restrizioni legate a vincoli esterni come la dieta (Permesso), che mangino in risposta a stimoli
fisiologici, e non emotivi (Motivo) e che si basino sui segnali interni del proprio corpo per decidere
quando iniziare e smettere di mangiare (Segnali). Se le tre scale posseggono validità di criterio, ci
aspettiamo che individui che riferiscono di scegliere il cibo in base al gusto, al contenuto calorico e
alla genuinità ottengano punteggi diversi sulle tre scale. Sia Tylka (2006) che Chiorri (2009) hanno
mostrato in campioni molto ampi come i punteggi delle tre scale siano correlati fra loro, per cui la
prima assunzione per l’applicabilità della MANOVA è soddisfatta. Per quanto riguarda l’altra
assunzione, quella dell’omogeneità delle matrici di varianza/covarianza all’interno di ogni gruppo, è
verificabile mediante SPSS con un apposito test statistico. I dati in Tabella 6.6.7 mostrano inoltre
che in ogni gruppo il numero di soggetti è maggiore del numero di variabili dipendenti.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Tabella 6.6.7 Punteggi alle scale della Intuitive Eating Scale per tre gruppi di soggetti, distinti in base
al criterio per la scelta del cibo
Gruppo Permesso Motivo Segnali
1
4,00
4,17
3,83
1
3,33
3,83
4,50
1
4,00
4,33
4,00
1
4,56
3,83
5,00
1
3,56
4,50
4,00
1
4,00
4,00
4,00
2
1,22
2,17
2,00
2
3,22
2,33
2,83
2
3,67
2,17
4,50
2
2,11
1,67
2,50
2
2,44
3,00
3,33
2
2,67
2,83
3,50
3
2,56
2,67
4,00
3
2,89
2,50
3,67
3
3,56
2,00
3,67
3
3,22
4,50
5,00
3
3,44
4,17
3,33
3
2,44
2,83
4,67
Nota: 1 = Gusto; 2 = Contenuto Calorico; 3 = Genuinità
Obiettivo: verificare se i punteggi alle tre scale del test IES si differenziano in base al criterio di
scelta del cibo
Variabili
Variabile Indipendente: Criterio di scelta del cibo (nominale, politomica: Gusto, Contenuto
Calorico, Genuinità)
Variabile Dipendente 1: punteggio alla scala Permesso dello IES (ad intervalli)
Variabile Dipendente 2: punteggio alla scala Motivo dello IES (ad intervalli)
Variabile Dipendente 3: punteggio alla scala Segnali dello IES (ad intervalli)
Ipotesi: potrebbe esservi un effetto della variabile indipendente sulle tre scale nel loro insieme.
H0: cGusto = cContenutoCalorico = cGenuinità → i centroidi c delle popolazioni da cui sono stati estratti i
gruppi sono uguali → il criterio per la scelta del cibo non influenza, in generale, i punteggi al
test IES
H1: Almeno due centroidi diversi → i centroidi c delle popolazioni da cui sono stati estratti i gruppi
non sono tutti uguali → il criterio per la scelta del cibo influenza, in generale, i punteggi al test
IES
oppure
H0: µGusto,Permesso = µContenutoCalorico,Permesso = µGenuinità,Permesso → le medie alla scala Permesso delle
popolazioni da cui sono stati estratti i gruppi sono uguali → il criterio per la scelta del cibo non
influenza il punteggio alla scala Permesso
µGusto,Motivo = µContenutoCalorico,Motivo = µGenuinità,Motivo → le medie alla scala Motivo delle popolazioni
da cui sono stati estratti i gruppi sono uguali → il criterio per la scelta del cibo non influenza il
punteggio alla scala Motivo
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
µGusto,Segnali = µContenutoCalorico,Segnali = µGenuinità,Segnali → le medie alla scala Segnali delle
popolazioni da cui sono stati estratti i gruppi sono uguali → il criterio per la scelta del cibo non
influenza il punteggio alla scala Segnali
H1: Almeno per una variabile, c’è almeno un gruppo con una media della popolazione diversa dalle
altre → il criterio per la scelta del cibo influenza almeno un punteggio al test IES
In SPSS i dati vanno organizzati come in Figura 6.6.40 e la MANOVA può essere realizzata
seguendo il percorso Analyze → General Linear Model → Multivariate.
Figura 6.6.40 Organizzazione dei dati in SPSS per la realizzazione di una MANOVA
La Figura 6.6.41 mostra come vanno riempiti i campi relativi alle variabili dipendenti e
indipendenti. Come si può intuire, è possibile inserire più di una variabile indipendente (fattore) e
più covariate, in modo da realizzare MANOVA o MANCOVA fattoriali. La logica è la stessa
dell’ANOVA.
Figura 6.6.41 Impostazioni per la realizzazione di una MANOVA in SPSS
La scelta delle opzioni è la stessa degli altri modelli di ANOVA. In questo caso, però, oltre a
specificare i test post-hoc, le statistiche descrittive e gli indici di dimensione dell’effetto, nel menu
Options è importante spuntare anche Homogeneity Tests, perché questo ci permetterà di ottenere il
test M di Box per l’omogeneità delle matrici di varianza/covarianza che, come abbiamo visto, è una
delle assunzioni per l’applicabilità della MANOVA e il test di Levine per l’omogeneità delle
varianze dei gruppi per ciascuna variabile dipendente.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
L’ouput di SPSS riporta le caratteristiche dei gruppi nella tabella Between-Subjects Factors
(non riportata) e le statistiche descrittive di ogni gruppo, per ogni variabile dipendente, nella tabella
Descriptive Statistics (non riportata). Le tre tabelle successive sono le più interessanti perché
riportano il test per l’omogeneità delle matrici di varianza/covarianza (Box’s Test of Equality of
Covariance Matrices), gli effetti multivariati (Multivariate Tests), e i test per l’omogeneità delle
varianze dei gruppi per ciascuna variabile dipendente (Levene’s Test of Equality of Error
Variances). (Figura 6.6.42).
a
Box's Test of Equality of Covariance Matrices
Box's M
F
df1
df2
Sig.
22,432
1,309
12
1090,385
,207
Tests the null hypothesis that the observed covariance
matrices of the dependent variables are equal across groups.
a. Design: Intercept+caratteristica
Multivariate Testsc
Effect
Intercept
caratteristica
Value
,985
,015
64,145
64,145
,862
,260
2,384
2,168
Pillai's Trace
Wilks' Lambda
Hotelling's Trace
Roy's Largest Root
Pillai's Trace
Wilks' Lambda
Hotelling's Trace
Roy's Largest Root
F
Hypothesis df
277,962a
3,000
277,962a
3,000
277,962a
3,000
277,962a
3,000
3,537
6,000
4,173a
6,000
4,768
6,000
10,115b
3,000
Error df
13,000
13,000
13,000
13,000
28,000
26,000
24,000
14,000
Sig.
,000
,000
,000
,000
,010
,005
,002
,001
Partial Eta
Squared
,985
,985
,985
,985
,431
,491
,544
,684
a. Exact statistic
b. The statistic is an upper bound on F that yields a lower bound on the significance level.
c. Design: Intercept+caratteristica
a
Levene's Test of Equality of Error Variances
permesso
motivo
segnali
F
1,401
6,188
1,196
df1
df2
2
2
2
15
15
15
Sig.
,277
,011
,330
Tests the null hypothesis that the error variance of the
dependent variable is equal across groups.
a. Design: Intercept+caratteristica
Figura 6.6.42 Output di SPSS per una MANOVA
Nella prima tabella osserviamo che il test di Box non è significativo, per cui non possiamo rifiutare
l’ipotesi nulla che le matrici di varianza/covarianza delle variabili siano omogenee fra i gruppi.
L’ultima assunzione da verificare della MANOVA è quindi soddisfatta. Se il test fosse stato
significativo, avremmo dovuto condurre tre ANOVA separate, una per variabile dipendente.
La tabella successiva mostra il risultato del test sui centroidi, ossia il primo effetto omnibus
da considerare. SPSS riporta quattro diverse statistiche (Pillai’s Trace, Wilks’ Lambda, Hotelling’s
Trace e Roy’s Largest Root). Il più utilizzato è sicuramente il Wilks’ Lambda, che è utilizzato anche
per calcolare l’indice multivariato di dimensione dell’effetto η2 = 1 − λ, dove λ nella Figura 6.6.42
si trova nella colonna Value, accanto al Wilks’ Lambda nel riquadro caratteristica, ed è ,26, per cui
η2 = 1 − ,26 = ,8413. Sia Barbaranelli (2006) che Bray e Maxwell (1985), tuttavia, citano Olson
13
Serlin (1982) suggerisce una diversa procedura di calcolo della dimensione dell’effetto: η 2 = Pillai' sTrace
PB
s
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
(1974, 1976) nel riferire che il Pillai’s Trace dovrebbe essere preferito in caso di sospette violazioni
delle assunzioni e di campioni piccoli (come potrebbe essere questo il caso). Ad ogni modo, in
questo caso ci troviamo di fronte ad un effetto multivariato significativo, poiché sia il Pillai’s Trace
che il Wilks’ Lambda sono significativi (Sig. < ,05 in entrambi i casi). Questo significa che almeno
in una variabile dipendente dovremmo trovare un test F significativo. Nell’ultima tabella
osserviamo infine come le varianze dei gruppi per la variabile Motivo non siano omogenee, il che
suggerirebbe di considerare con attenzione i risultati dei test univariati in questa variabile.
La Figura 6.6.43 riporta i risultati dei test univariati (Tests of Between-Subjects Effects),
delle medie stimate (Estimates) e dei test post-hoc (Pairwise Comparisons)14.
Tests of Between-Subjects Effects
Source
Corrected Model
Intercept
caratteristica
Error
Total
Corrected Total
Dependent Variable
permesso
motivo
segnali
permesso
motivo
segnali
permesso
motivo
segnali
permesso
motivo
segnali
permesso
motivo
segnali
permesso
motivo
segnali
Type III Sum
of Squares
5,664a
9,250b
4,309c
179,797
183,681
259,414
5,664
9,250
4,309
5,650
6,486
6,889
191,111
199,417
270,611
11,314
15,736
11,198
df
2
2
2
1
1
1
2
2
2
15
15
15
18
18
18
17
17
17
Mean Square
2,832
4,625
2,154
179,797
183,681
259,414
2,832
4,625
2,154
,377
,432
,459
F
7,518
10,696
4,691
477,320
424,786
564,852
7,518
10,696
4,691
Partial Eta
Squared
,501
,588
,385
,970
,966
,974
,501
,588
,385
Sig.
,005
,001
,026
,000
,000
,000
,005
,001
,026
a. R Squared = ,501 (Adjusted R Squared = ,434)
b. R Squared = ,588 (Adjusted R Squared = ,533)
c. R Squared = ,385 (Adjusted R Squared = ,303)
Estimates
Dependent Variable
permesso
motivo
segnali
caratteristica
Gusto
Contenuto calorico
Genuinità
Gusto
Contenuto calorico
Genuinità
Gusto
Contenuto calorico
Genuinità
Mean
3,907
2,556
3,019
4,111
2,361
3,111
4,222
3,111
4,056
Std. Error
,251
,251
,251
,268
,268
,268
,277
,277
,277
95% Confidence Interval
Lower Bound Upper Bound
3,373
4,441
2,022
3,090
2,484
3,553
3,539
4,683
1,789
2,933
2,539
3,683
3,633
4,812
2,521
3,701
3,466
4,645
dove s è il valore minore fra il numero di variabili dipendenti e il numero di gruppi meno 1. Nel nostro caso, il numero
di variabili dipendenti è 3, il numero di gruppi meno 1 è 3 − 1 = 2, per cui s = 2, da cui η 2 = ,862 =,431
PB
2
Il valore va poi ulteriormente aggiustato mediante la formula ηˆ = 1 − (1 − η ) n − 1  , dove n è il numero totale di
 n − b − 1
soggetti, e b il valore maggiore fra il numero di gruppi e il numero di variabili. Nel nostro caso, n = 18, e b = 3, in
quanto abbiamo tre gruppi e tre variabili, per cui: ηˆ 2 = 1 − (1−,431) 18 − 1  =,31
 18 − 3 − 1 
2
PB
14
2
PB
Sono omesse dall’esposizione le tabelle Multivariate Tests e Univariate Tests per brevità.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Pairwise Comparisons
Dependent Variable
permesso
(I) caratteristica
Gusto
Contenuto calorico
Genuinità
motivo
Gusto
Contenuto calorico
Genuinità
segnali
Gusto
Contenuto calorico
Genuinità
(J) caratteristica
Contenuto calorico
Genuinità
Gusto
Genuinità
Gusto
Contenuto calorico
Contenuto calorico
Genuinità
Gusto
Genuinità
Gusto
Contenuto calorico
Contenuto calorico
Genuinità
Gusto
Genuinità
Gusto
Contenuto calorico
Mean
Difference
(I-J)
1,352*
,889
-1,352*
-,463
-,889
,463
1,750*
1,000
-1,750*
-,750
-1,000
,750
1,111*
,167
-1,111*
-,944
-,167
,944
Std. Error
,354
,354
,354
,354
,354
,354
,380
,380
,380
,380
,380
,380
,391
,391
,391
,391
,391
,391
a
Sig.
,005
,072
,005
,633
,072
,633
,001
,056
,001
,201
,056
,201
,037
1,000
,037
,087
1,000
,087
95% Confidence Interval for
a
Difference
Lower Bound Upper Bound
,397
2,306
-,066
1,843
-2,306
-,397
-1,417
,492
-1,843
,066
-,492
1,417
,727
2,773
-,023
2,023
-2,773
-,727
-1,773
,273
-2,023
,023
-,273
1,773
,057
2,165
-,887
1,221
-2,165
-,057
-1,998
,110
-1,221
,887
-,110
1,998
Based on estimated marginal means
*. The mean difference is significant at the ,05 level.
a. Adjustment for multiple comparisons: Bonferroni.
Figura 6.6.43 Output di SPSS per una MANOVA: test univariati e post-hoc
La tabella Tests of Between-Subjects Effects mostra come il criterio di scelta del cibo abbia un
effetto statisticamente significativo per tutte e tre le variabili dipendenti, anche se una correzione
per confronti multipli sul livello di significatività α = ,05 porterebbe il livello di significatività
comparisonwise a ,05 / 3 = ,017, il che escluderebbe la significatività nella variabile Segnali. Nella
tabella Pairwise Comparisons si nota come in tutte e tre le variabili dipendenti il gruppo che
riferisce di basare la scelta del cibo sul Gusto abbia punteggi più alti di chi si basa sul Contenuto
Calorico. Alcuni livelli di significatività sono al limite dell’accettabilità, come ad esempio
Genuinità vs Gusto in Permesso e in Motivo, o Genuinità vs Contenuto Calorico in Segnali.
Considerando la scarsa numerosità dei gruppi, è probabile che questi effetti risultino significativi in
campioni anche poco più ampi.
Una possibile rappresentazione grafica dei dati è presentata in Figura 6.6.44.
Punteggio medio di scala
5
4
3
2
Gusto
Contenuto calorico
1
Genuinità
0
Permesso
Motivo
Segnali
Criterio scelta del cibo
Figura 6.6.44 Grafico delle medie in base ai risultati di una MANOVA
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Per riportare il risultato in un articolo scientifico o in una tesi di laurea riporteremo la tabella con le
statistiche descrittive, il grafico in Figura 6.6.44 e scriveremo:
E’ stata eseguita un’analisi multivariata della varianza con il criterio di scelta del cibo
come variabile indipendente (Gusto, Contenuto Calorico, Genuinità) e variabili
dipendenti le tre scale della Intuitive Eating Scale (Permesso, Motivo, Segnali). Una
volta verificato che le matrici di varianza/covarianza dei gruppi erano omogenee (Box’s
M = 22,43, F(12, 1090.39) = 1,309, p = ,207), il test multivariato ha mostrato un effetto
statisticamente significativo del fattore (Wilks’ Lambda = ,260, F(6, 26) = 4,173, p =
,005, η2 parziale = ,49). I test univariati hanno evidenziato un effetto statisticamente
significativo del fattore su tutte le variabili (Permesso: F(2, 15) = 7,52, p = ,005, η2
parziale = ,50; Motivo: F(2, 15) = 10,70, p = ,001, η2 parziale = ,58; Segnali: F(2, 15) =
4,69, p = ,026, η2 parziale = ,39), e i successivi test post-hoc, eseguiti con correzione
Bonferroni del livello di significatività, hanno rivelato come in tutte e tre le variabili
dipendenti il gruppo che riferisce di basare la scelta del cibo sul Gusto abbia punteggi
più alti di chi si basa sul Contenuto Calorico. Alcuni livelli di significatività sono
risultati al limite dell’accettabilità, come ad esempio Genuinità vs Gusto in Permesso e
in Motivo, o Genuinità vs Contenuto Calorico in Segnali. Considerando la scarsa
numerosità dei gruppi, è probabile che questi effetti risultino significativi in campioni
anche poco più ampi.
6.6.6 Analisi multivariata della varianza per misure ripetute (RM-MANOVA)
Questo tipo di analisi è detta anche doubly multivariate ("doppiamente multivariata") e si applica in
quei casi in cui si ha un insieme di variabili dipendenti che non vogliamo e/o possiamo confrontare
fra loro misurate in due o più momenti successivi nel tempo o in condizioni diverse. Ad esempio,
potremmo aver realizzato un esperimento di psicologia dove per ogni condizione vengono misurati
l'accuratezza (proporzione di risposte corrette) e il tempo di risposta. Di solito i due indici vengono
analizzati separatamente, ma grazie alla RM-MANOVA (dove RM sta per Repeated Measures) è
possibile analizzarli contemporaneamente.
Supponiamo di sottoporre tre gruppi randomizzati di pazienti di un reparto psichiatrico (8
soggetti che assumono uno psicofarmaco il cui principio attivo produce un'azione inibitoria sul
sistema nervoso centrale, 8 soggetti che ricevono un placebo e 8 che non ricevono niente) ad una
condizione di doppio compito, nella quale devono eseguire un compito primario di guida al
simulatore (uguale per tutti) e nel contempo, come compito secondario, rispondere alle domande di
un compito verbale (dire il contrario della parola che sentono) o numerico (fare delle addizioni). Le
variabili dipendenti che ci interessa misurare sono sia la prestazione al compito di guida (numero di
errori) che l'accuratezza delle risposte (proporzione di risposte corrette). In questa situazione
abbiamo due variabili dipendenti che non ha senso confrontare fra loro in termini di punteggio
medio, ma che vengono misurate in due diverse condizioni ripetute all'interno dei soggetti (compito
verbale e numerico). E' quindi un disegno fattoriale misto (la variabile Trattamento è between) in
cui, però, le variabili dipendenti sono due. I dati sono riportati in Tabella 6.6.8.
15
Tabella 6.6.8 Accuratezza e numero di errori a compiti secondari di natura verbale e numerica per
tre gruppi di soggetti (Farmaco: 0; Placebo: 1; Controllo: 2)
15
I dati dell'accuratezza, che in origine erano proporzioni (P), sono stati trasformati mediante la formula:
360
TP =
arcsin P . La trasformata arcoseno TP si ottiene facilmente con Excel mediante la funzione
2π
=((360/(2*PI.GRECO()))*ARCSEN(RADQ(P))). Questo tipo di trasformazione è necessario perché la varianza di una
proporzione P [ossia sP2 = P(1 − P)/(n − 1)], si ottiene a partire dal valore stesso della proporzione, il che rappresenta
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Gruppo
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
Verbale
ACC
ERR
38,06
60
36,27
58
42,13
64
36,27
68
43,28
69
46,72
63
39,23
67
42,71
64
45,57
48
44,65
56
53,74
54
51,02
49
50,96
51
53,02
50
55,20
49
53,66
44
73,22
28
67,42
39
69,28
40
69,79
40
62,74
38
67,08
35
68,69
38
61,37
35
Numerico
ACC
ERR
28,45
84
30,66
88
29,87
81
36,27
79
35,06
81
31,95
88
35,06
78
39,43
85
42,23
73
39,34
75
48,16
73
45,53
75
48,77
73
47,88
67
48,59
72
49,97
65
58,24
67
51,95
56
52,81
63
56,34
59
53,73
61
50,37
63
53,51
57
61,76
58
Nota: ACC = accuratezza sottoposta a trasformazione arcoseno; ERR = numero di errori
Obiettivo: verificare se la prestazione al compito primario e l'accuratezza nelle risposte al compito
secondario variano in funzione del tipo di compito secondario e del trattamento ricevuto
Variabili
Variabile Indipendente 1: Tipo di compito secondario (nominale, dicotomica: Verbale, Numerico;
within)
Variabile Indipendente 2: Trattamento (nominale, politomica: Farmaco; Placebo, Controllo;
between)
Variabile Dipendente 1: numero di errori al compito primario (a rapporti)
Variabile Dipendente 2: proporzione di risposte corrette al compito secondario (a rapporti)
Ipotesi:
Effetto principale del tipo di compito secondario
una violazione dell'assunzione dell'omogeneità delle varianze fra i soggetti e impedisce l'applicazione di test statistici
come l'ANOVA o la regressione. Nel caso di una distribuzione binomiale la trasformazione arcoseno produce valori la
cui varianza è indipendente dal valore di P (Hogg e Craig, 1995). Se la proporzione è uguale a zero al posto di P
occorre utilizzare il valore P' = 1/4n, dove n è il numero di prove su cui è stata calcolata la proporzione, mentre se P = 1
occorre utilizzare il valore P' = (n − 0,25)/n. Se interessa, una volta ottenuti i risultati sui dati trasformati (ad esempio,
 2π

× TP  , che in Excel può
P = sin 
 360

2
medie), ritornare all'unità di misura iniziale basta utilizzare la formula inversa
essere scritta come =SEN((2*PI.GRECO()/360)*valore_TP)^2.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
H0: cVerbale = cNumerico → indipendentemente dal Trattamento, i centroidi c delle popolazioni da cui
sono stati estratti i campioni di osservazioni sui livelli del tipo di compito secondario sono
uguali → il tipo di compito secondario non influenza, nel loro insieme, né il numero di errori al
compito primario né l'accuratezza delle risposte al compito secondario
H1: cVerbale ≠ cNumerico → indipendentemente dal Trattamento, i centroidi c delle popolazioni da cui
sono stati estratti i campioni di osservazioni sui livelli del tipo di compito secondario sono
diversi → il tipo di compito secondario influenza, nel loro insieme, il numero di errori al
compito primario e l'accuratezza delle risposte al compito secondario
Effetto principale del Trattamento
H0: cFarmaco = cPlacebo = cControllo → indipendentemente dal tipo di compito secondario, i centroidi c
delle popolazioni a cui fanno riferimento i campioni definiti dal trattamento non differiscono fra
loro → il trattamento non influenza, nel loro insieme, né il numero di errori al compito primario
né l'accuratezza delle risposte al compito secondario
H1: Almeno due centroidi diversi → indipendentemente dal tipo di compito secondario, almeno due
centroidi c delle popolazioni a cui fanno riferimento i campioni definiti dal trattamento
differiscono fra loro → il trattamento influenza, nel loro insieme, il numero di errori al compito
primario e l'accuratezza delle risposte al compito secondario
Effetto di interazione16
H0: (cVerbale − cNumerico)Farmaco = (cVerbale − cNumerico)Placebo = (cVerbale − cNumerico)Controllo → la differenza
fra i centroidi c delle popolazioni da cui sono stati estratti i campioni di osservazioni sui livelli
del tipo di compito secondario è la stessa per tutti i livelli di trattamento → il trattamento non
modifica, in generale, l'effetto del tipo di compito secondario sul numero di errori al compito
primario e sull'accuratezza delle risposte al compito secondario
H0: Almeno due differenze diverse → la differenza fra i centroidi c delle popolazioni da cui sono
stati estratti i campioni di osservazioni sui livelli del tipo di compito secondario non è la stessa
per tutti i livelli di trattamento → il trattamento modifica, in generale, l'effetto del tipo di
compito secondario sul numero di errori al compito primario e sull'accuratezza delle risposte al
compito secondario
Per realizzare l'analisi con SPSS occorre impostare i dati come in Figura 6.6.45. Si presti attenzione
alla necessità di avere i nomi delle variabili su una sola riga.
16
Era possibile formulare le ipotesi sull'effetto di interazione anche nell'altra direzione, ossia che il tipo di compito
secondario modera l'effetto del trattamento.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Figura 6.6.45 Organizzazione dei dati in SPSS per la realizzazione di una MANOVA fattoriale mista
Il procedimento di fatto è identico a quello per la realizzazione di un'ANOVA fattoriale mista
(Analyze→General Linear Model→Repeated Measures, con impostazione del fattori within), a
parte il fatto che vanno inseriti tramite il campo Measure Name i nomi delle due variabili dipendenti
(Figura 6.6.46). Dopo aver inserito ogni nome occorre clickare su Add per spostarlo nel campo
sottostante.
Figura 6.6.46 Impostazioni di SPSS per la realizzazione di una MANOVA per misure ripetute
Nella finestra successiva ogni variabile deve essere assegnata alla condizione corretta, e non
necessariamente le variabili sono nello stesso ordine delle combinazioni delle condizioni, come nel
caso della Figura 6.6.47.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Figura 6.6.47 Impostazioni di SPSS per la realizzazione di una MANOVA per misure ripetute
Clickiamo su Options, in modo da impostare i test post-hoc per gli effetti principali e per
l’interazione (anche in questo caso è necessaria la modifica della sintassi di SPSS vista nella
sezione 6.6.1)17, richiedere le statistiche descrittive, le dimensioni dell’effetto e i test di omogeneità
delle varianze (Figura 6.6.48). Si noti che i test post-hoc per il tipo di compito secondario non sono
necessari dato che la variabile è dicotomica.
17
GLM
ACC_VER ACC_NUM ERR_VER ERR_NUM BY Trattamento
/WSFACTOR = compito 2 Polynomial
/MEASURE = acc err
/METHOD = SSTYPE(3)
/PLOT = PROFILE( Trattamento*compito compito*Trattamento )
/EMMEANS = TABLES(Trattamento) COMPARE ADJ(BONFERRONI)
/EMMEANS = TABLES(compito) COMPARE ADJ(BONFERRONI)
/EMMEANS = TABLES(Trattamento*compito) COMPARE(Trattamento) ADJ(BONFERRONI)
/EMMEANS = TABLES(Trattamento*compito) COMPARE(compito) ADJ(BONFERRONI)
/PRINT = DESCRIPTIVE ETASQ HOMOGENEITY
/CRITERIA = ALPHA(.05)
/WSDESIGN = compito
/DESIGN = Trattamento .
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Figura 6.6.48 Impostazioni delle opzioni per la realizzazione di una MANOVA per misure ripetute
Infine, impostiamo i grafici clickando su Plots. In questo caso chiediamo che vengano realizzati
entrambi i grafici possibili, ossia quello con le categorie della variabile Trattamento (Horizontal
Axis) e le categorie della variabile Tipo di compito secondario rappresentate da linee di colore
diverso (Separate Lines), e viceversa.
Eseguiamo l'analisi e otteniamo nell'output le tabelle in Figura 6.6.49 e 6.6.50.
Within-Subjects Factors
Measure
acc
err
compito
1
2
1
2
Between-Subjects Factors
Dependent
Variable
ACC_VER
ACC_NUM
ERR_VER
ERR_NUM
Trattamento
,00
1,00
2,00
Value Label
Farmaco
Placebo
Controllo
N
8
8
8
Descriptive Statistics
ACC_VER
ACC_NUM
ERR_VER
ERR_NUM
Trattamento
Farmaco
Placebo
Controllo
Total
Farmaco
Placebo
Controllo
Total
Farmaco
Placebo
Controllo
Total
Farmaco
Placebo
Controllo
Total
Mean
40,5838
50,9775
67,4488
53,0033
33,3438
46,3088
54,8388
44,8304
64,13
50,13
36,63
50,29
83,00
71,63
60,50
71,71
Std. Deviation
3,72739
3,89338
3,83486
11,87337
3,71593
3,71038
3,72542
9,70106
3,834
3,682
3,998
12,042
3,854
3,662
3,703
10,041
N
8
8
8
24
8
8
8
24
8
8
8
24
8
8
8
24
a
Box's Test of Equality of Covariance Matrices
Box's M
F
df1
df2
Sig.
40,129
1,433
20
1582,995
,097
Tests the null hypothesis that the observed covariance
matrices of the dependent variables are equal across groups.
a.
Design: Intercept+Trattamento
Within Subjects Design: compito
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Multivariate Testsc
Effect
Between
Subjects
Intercept
Trattamento
Within Subjects
compito
compito * Trattamento
Pillai's Trace
Wilks' Lambda
Hotelling's Trace
Roy's Largest Root
Pillai's Trace
Wilks' Lambda
Hotelling's Trace
Roy's Largest Root
Pillai's Trace
Wilks' Lambda
Hotelling's Trace
Roy's Largest Root
Pillai's Trace
Wilks' Lambda
Hotelling's Trace
Roy's Largest Root
Value
,999
,001
1441,409
1441,409
,975
,033
29,107
29,099
,940
,060
15,583
15,583
,461
,568
,712
,633
F
Hypothesis df
14414,090a
2,000
14414,090a
2,000
14414,090a
2,000
14414,090a
2,000
9,986
4,000
45,087a
4,000
138,260
4,000
305,542b
2,000
155,833a
2,000
155,833a
2,000
155,833a
2,000
155,833a
2,000
3,142
4,000
3,272a
4,000
3,381
4,000
6,646b
2,000
Error df
20,000
20,000
20,000
20,000
42,000
40,000
38,000
21,000
20,000
20,000
20,000
20,000
42,000
40,000
38,000
21,000
Sig.
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,024
,021
,018
,006
Partial Eta
Squared
,999
,999
,999
,999
,487
,818
,936
,967
,940
,940
,940
,940
,230
,247
,262
,388
a. Exact statistic
b. The statistic is an upper bound on F that yields a lower bound on the significance level.
c.
Design: Intercept+Trattamento
Within Subjects Design: compito
Mauchly's Test of Sphericityb
Epsilon
Within Subjects Effect
compito
Measure
acc
err
Mauchly's W
1,000
1,000
Approx.
Chi-Square
,000
,000
df
Sig.
0
0
.
.
Greenhous
e-Geisser
1,000
1,000
a
Huynh-Feldt
1,000
1,000
Lower-bound
1,000
1,000
Tests the null hypothesis that the error covariance matrix of the orthonormalized transformed dependent variables is proportional to an
identity matrix.
a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in the Tests of
Within-Subjects Effects table.
b.
Design: Intercept+Trattamento
Within Subjects Design: compito
Tests of within-subjects effects
Multivariatec,d
Within Subjects Effect
compito
compito * Trattamento
Pillai's Trace
Wilks' Lambda
Hotelling's Trace
Roy's Largest Root
Pillai's Trace
Wilks' Lambda
Hotelling's Trace
Roy's Largest Root
Value
,940
,060
15,583
15,583
,461
,568
,712
,633
F
Hypothesis df
155,833a
2,000
155,833a
2,000
155,833a
2,000
155,833a
2,000
3,142
4,000
3,272a
4,000
3,381
4,000
6,646b
2,000
Error df
20,000
20,000
20,000
20,000
42,000
40,000
38,000
21,000
Sig.
,000
,000
,000
,000
,024
,021
,018
,006
Partial Eta
Squared
,940
,940
,940
,940
,230
,247
,262
,388
a. Exact statistic
b. The statistic is an upper bound on F that yields a lower bound on the significance level.
c.
Design: Intercept+Trattamento
Within Subjects Design: compito
d. Tests are based on averaged variables.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Univariate Tests
Source
compito
Measure
acc
err
compito * Trattamento
acc
err
Error(compito)
acc
err
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Type III Sum
of Squares
801,559
801,559
801,559
801,559
5504,083
5504,083
5504,083
5504,083
131,349
131,349
131,349
131,349
50,042
50,042
50,042
50,042
209,105
209,105
209,105
209,105
388,875
388,875
388,875
388,875
df
1
1,000
1,000
1,000
1
1,000
1,000
1,000
2
2,000
2,000
2,000
2
2,000
2,000
2,000
21
21,000
21,000
21,000
21
21,000
21,000
21,000
Mean Square
801,559
801,559
801,559
801,559
5504,083
5504,083
5504,083
5504,083
65,674
65,674
65,674
65,674
25,021
25,021
25,021
25,021
9,957
9,957
9,957
9,957
18,518
18,518
18,518
18,518
F
80,499
80,499
80,499
80,499
297,231
297,231
297,231
297,231
6,596
6,596
6,596
6,596
1,351
1,351
1,351
1,351
Sig.
,000
,000
,000
,000
,000
,000
,000
,000
,006
,006
,006
,006
,281
,281
,281
,281
Partial Eta
Squared
,793
,793
,793
,793
,934
,934
,934
,934
,386
,386
,386
,386
,114
,114
,114
,114
Tests of Within-Subjects Contrasts
Source
compito
compito * Trattamento
Error(compito)
Measure
acc
err
acc
err
acc
err
compito
Linear
Linear
Linear
Linear
Linear
Linear
Type III Sum
of Squares
801,559
5504,083
131,349
50,042
209,105
388,875
df
1
1
2
2
21
21
Mean Square
801,559
5504,083
65,674
25,021
9,957
18,518
F
80,499
297,231
6,596
1,351
Sig.
,000
,000
,006
,281
Partial Eta
Squared
,793
,934
,386
,114
a
Levene's Test of Equality of Error Variances
F
,048
,018
,040
,109
ACC_VER
ACC_NUM
ERR_VER
ERR_NUM
df1
df2
2
2
2
2
21
21
21
21
Sig.
,954
,982
,961
,897
Tests the null hypothesis that the error variance of the
dependent variable is equal across groups.
a.
Design: Intercept+Trattamento
Within Subjects Design: compito
Tests of Between-Subjects Effects
Transformed Variable: Average
Source
Intercept
Trattamento
Error
Measure
acc
err
acc
err
acc
err
Type III Sum
of Squares
114857,312
178608,000
4679,178
5000,375
387,378
214,625
df
1
1
2
2
21
21
Mean Square
114857,312
178608,000
2339,589
2500,188
18,447
10,220
F
6226,483
17475,914
126,831
244,631
Sig.
,000
,000
,000
,000
Partial Eta
Squared
,997
,999
,924
,959
Figura 6.6.49 Output di SPSS per una MANOVA per misure ripetute
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Nell'output di Figura 6.6.49 osserviamo subito un'apparente ambiguità. Vi sono due tabelle
chiamate Multivariate Tests, che peraltro contengono dati che in questo caso sono identici per gli
effetti del fattore within. Si noti che non sempre questo è il caso, soprattutto se non si hanno fattori
between ma solo fattori within. Per questo motivo è bene comprendere che differenza c'è. La prima
di queste tabelle contiene test completamente (o doppiamente) multivariati, mentre la seconda
contiene test in media (o singolarmente) multivariati, come indicato nella nota (Tests are based on
averaged variables). In generale è consigliabile consultare la prima tabella, perché è quella che
contiene tutti gli effetti contemporaneamente − nella seconda non sono presenti gli effetti between −
per cui ci concentreremo solo su questa. Ma andiamo con ordine.
Le tabella Within-Subjects Factors e Between-Subjects Factors riassumono il disegno della
ricerca, mentre la tabella Descriptive Statistics fornisce medie e deviazioni standard per ogni gruppo
in ogni condizione per ogni variabile dipendente. La tabella Box's Test of Equality of Covariance
Matrices è di fondamentale importanza in quanto, come abbiamo visto, ci permette di appurare se
l'assunzione per l'applicazione della MANOVA che le matrici di varianza/covarianza delle variabili
dipendenti siano omogenee nei gruppi definiti dalla variabile between. In questo caso l'assunzione è
soddisfatta (Sig. = ,097 > ,05).
Nella tabella Multivariate Tests osserviamo che tutti gli effetti principali dei fattori e la loro
interazione sono statisticamente significativi, sia se consideriamo il Pillai's Trace, sia se
consideriamo il Wilks' Lambda. Questo vuol dire che andremo ad indagare per ognuna delle
variabili dipendenti l'effetto univariato dei fattori.
La tabella Mauchly's Test of Sphericity in questo caso non ci fornisce informazioni utili, in
quanto il test di Mauchly può essere applicato solo quando si hanno almeno tre condizioni within, e
noi ne abbiamo due (tipo di compito secondario).
Ignoriamo, come spiegato in precedenza, la seconda tabella Multivariate, e osserviamo la
tabella Univariate Tests, che ci mostra che l'effetto principale del tipo di compito è statisticamente
significativo sia per l'accuratezza, sia per il numero di errori, mentre l'interazione Compito ×
Trattamento è significativa solo per l'accuratezza.
Anche la tabella Tests of Within-Subjects Contrasts è poco informativa nel nostro caso, dato
che, avendo il fattore within solo due livelli, è possibile verificare solo l'ipotesi di linearità.
Dalla tabella Levene's Test of Equality of Error Variances comincia la parte di output
relativa al fattore between, ossia il Trattamento. Questa tabella ci mostra come l'assunzione di
omogeneità della varianza fra i gruppi sia soddisfatta in tutte le condizioni per tutte le variabili (Sig.
> ,05). La tabella successiva Tests of Between-Subjects Effects ci informa che l'effetto del
Trattamento è significativo per entrambe le variabili dipendenti, per cui esamineremo i risultati dei
test post-hoc per entrambe. I test post-hoc sono riportati in Figura 6.6.50.
1. Trattamento
Estimates
Measure
acc
err
Trattamento
Farmaco
Placebo
Controllo
Farmaco
Placebo
Controllo
Mean
36,964
48,643
61,144
73,563
60,875
48,563
Std. Error
1,074
1,074
1,074
,799
,799
,799
95% Confidence Interval
Lower Bound Upper Bound
34,731
39,197
46,410
50,876
58,911
63,377
71,900
75,225
59,213
62,537
46,900
50,225
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Pairwise Comparisons
Measure
acc
(I) Trattamento
Farmaco
Placebo
Controllo
err
Farmaco
Placebo
Controllo
(J) Trattamento
Placebo
Controllo
Farmaco
Controllo
Farmaco
Placebo
Placebo
Controllo
Farmaco
Controllo
Farmaco
Placebo
Mean
Difference
(I-J)
Std. Error
-11,679*
1,518
-24,180*
1,518
11,679*
1,518
-12,501*
1,518
24,180*
1,518
12,501*
1,518
12,688*
1,130
25,000*
1,130
-12,688*
1,130
12,313*
1,130
-25,000*
1,130
-12,313*
1,130
a
Sig.
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
95% Confidence Interval for
a
Difference
Lower Bound Upper Bound
-15,630
-7,729
-28,130
-20,230
7,729
15,630
-16,451
-8,550
20,230
28,130
8,550
16,451
9,747
15,628
22,060
27,940
-15,628
-9,747
9,372
15,253
-27,940
-22,060
-15,253
-9,372
Based on estimated marginal means
*. The mean difference is significant at the ,05 level.
a. Adjustment for multiple comparisons: Bonferroni.
2. Compito
Estimates
Measure
acc
err
compito
1
2
1
2
Mean
53,003
44,830
50,292
71,708
95% Confidence Interval
Lower Bound Upper Bound
51,382
54,625
43,252
46,408
48,662
51,922
70,120
73,296
Std. Error
,780
,759
,784
,764
Pairwise Comparisons
Measure
acc
err
(I) compito
1
2
1
2
Mean
Difference
(I-J)
8,173*
-8,173*
-21,417*
21,417*
(J) compito
2
1
2
1
Std. Error
,911
,911
1,242
1,242
a
Sig.
,000
,000
,000
,000
95% Confidence Interval for
a
Difference
Lower Bound Upper Bound
6,279
10,067
-10,067
-6,279
-24,000
-18,833
18,833
24,000
Based on estimated marginal means
*. The mean difference is significant at the ,05 level.
a. Adjustment for multiple comparisons: Bonferroni.
3. Trattamento*compito
Estimates
Measure
acc
Trattamento
Farmaco
Placebo
Controllo
err
Farmaco
Placebo
Controllo
compito
1
2
1
2
1
2
1
2
1
2
1
2
Mean
40,584
33,344
50,978
46,309
67,449
54,839
64,125
83,000
50,125
71,625
36,625
60,500
Std. Error
1,350
1,314
1,350
1,314
1,350
1,314
1,358
1,323
1,358
1,323
1,358
1,323
95% Confidence Interval
Lower Bound Upper Bound
37,776
43,392
30,611
36,077
48,169
53,786
43,576
49,042
64,641
70,257
52,106
57,572
61,302
66,948
80,250
85,750
47,302
52,948
68,875
74,375
33,802
39,448
57,750
63,250
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Pairwise Comparisons
Measure
acc
compito
1
(I) Trattamento
Farmaco
Placebo
Controllo
2
Farmaco
Placebo
Controllo
err
1
Farmaco
Placebo
Controllo
2
Farmaco
Placebo
Controllo
(J) Trattamento
Placebo
Controllo
Farmaco
Controllo
Farmaco
Placebo
Placebo
Controllo
Farmaco
Controllo
Farmaco
Placebo
Placebo
Controllo
Farmaco
Controllo
Farmaco
Placebo
Placebo
Controllo
Farmaco
Controllo
Farmaco
Placebo
Mean
Difference
(I-J)
-10,394*
-26,865*
10,394*
-16,471*
26,865*
16,471*
-12,965*
-21,495*
12,965*
-8,530*
21,495*
8,530*
14,000*
27,500*
-14,000*
13,500*
-27,500*
-13,500*
11,375*
22,500*
-11,375*
11,125*
-22,500*
-11,125*
Std. Error
1,910
1,910
1,910
1,910
1,910
1,910
1,859
1,859
1,859
1,859
1,859
1,859
1,920
1,920
1,920
1,920
1,920
1,920
1,870
1,870
1,870
1,870
1,870
1,870
a
Sig.
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
95% Confidence Interval for
a
Difference
Lower Bound
Upper Bound
-15,361
-5,426
-31,832
-21,898
5,426
15,361
-21,439
-11,504
21,898
31,832
11,504
21,439
-17,800
-8,130
-26,330
-16,660
8,130
17,800
-13,365
-3,695
16,660
26,330
3,695
13,365
9,006
18,994
22,506
32,494
-18,994
-9,006
8,506
18,494
-32,494
-22,506
-18,494
-8,506
6,509
16,241
17,634
27,366
-16,241
-6,509
6,259
15,991
-27,366
-17,634
-15,991
-6,259
Based on estimated marginal means
*. The mean difference is significant at the ,05 level.
a. Adjustment for multiple comparisons: Bonferroni.
Estimates
Measure
acc
Trattamento
Farmaco
Placebo
Controllo
err
Farmaco
Placebo
Controllo
compito
1
2
1
2
1
2
1
2
1
2
1
2
Mean
40,584
33,344
50,978
46,309
67,449
54,839
64,125
83,000
50,125
71,625
36,625
60,500
Std. Error
1,350
1,314
1,350
1,314
1,350
1,314
1,358
1,323
1,358
1,323
1,358
1,323
95% Confidence Interval
Lower Bound Upper Bound
37,776
43,392
30,611
36,077
48,169
53,786
43,576
49,042
64,641
70,257
52,106
57,572
61,302
66,948
80,250
85,750
47,302
52,948
68,875
74,375
33,802
39,448
57,750
63,250
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Pairwise Comparisons
Measure
acc
Trattamento
Farmaco
Placebo
Controllo
err
Farmaco
Placebo
Controllo
(I) compito
1
2
1
2
1
2
1
2
1
2
1
2
(J) compito
2
1
2
1
2
1
2
1
2
1
2
1
Mean
Difference
Std. Error
(I-J)
7,240*
1,578
-7,240*
1,578
4,669*
1,578
-4,669*
1,578
12,610*
1,578
-12,610*
1,578
-18,875*
2,152
18,875*
2,152
-21,500*
2,152
21,500*
2,152
-23,875*
2,152
23,875*
2,152
a
Sig.
,000
,000
,007
,007
,000
,000
,000
,000
,000
,000
,000
,000
95% Confidence Interval for
a
Difference
Lower Bound Upper Bound
3,959
10,521
-10,521
-3,959
1,388
7,950
-7,950
-1,388
9,329
15,891
-15,891
-9,329
-23,350
-14,400
14,400
23,350
-25,975
-17,025
17,025
25,975
-28,350
-19,400
19,400
28,350
Based on estimated marginal means
*. The mean difference is significant at the ,05 level.
a. Adjustment for multiple comparisons: Bonferroni.
Figura 6.6.50 Output di SPSS per i test post-hoc di una MANOVA mista
18
La prima parte della Figura 6.6.50 mostra le medie stimate (Estimates) e i test post-hoc (Pairwise
Comparisons) per l'effetto principale del compito. Quello che notiamo in questo caso è che,
indipendentemente dal tipo di compito secondario, tutti i confronti sono statisticamente
significativi. In particolare, osserviamo che il gruppo Controllo ha un'accuratezza media nel
compito secondario superiore al gruppo Placebo, che a sua volta ha un'accuratezza media superiore
al gruppo Farmaco. Nel caso degli errori al compito primario, il gruppo Controllo ha un numero
medio di errori inferiore al gruppo Placebo, che a sua volta ha un numero medio di errori inferiore
al gruppo Farmaco. Questi dati, quindi, suggeriscono che chi non prende il farmaco con azione
inibitoria sul sistema nervoso centrale ha una maggiore accuratezza nel compito secondario e un
minor numero di errori nel compito primario. In qualche modo è un risultato che non ci sorprende,
dato che il farmaco potrebbe effettivamente impoverire le capacità di mantenere ad un livello
attentivo adeguato.
Come detto, per il fattore Tipo di compito secondario i test post-hoc non sono necessari,
dato che abbiamo solo due categorie. Ad ogni modo, la tabella Pairwise Comparisons mostra come,
indipendentemente dal Trattamento, nella condizione 1 (compito secondario verbale) i soggetti
siano più accurati nelle risposte al compito secondario e commettano meno errori nel compito
primario. Questo risultato mostra che il compito secondario di tipo numerico (sommare i numeri
che vengono comunicati) è più difficile e impegnativo di quello verbale (dire il contrario della
parola che viene proposta).
Nel caso dei test post-hoc per l'effetto di interazione abbiamo come sempre una doppia
prospettiva: le differenze fra le condizioni di compito secondario su ogni livello del trattamento, e le
differenze fra i livelli di trattamento su ogni livello della condizione di compito. Nel primo caso
osserviamo che sia per l'accuratezza al compito secondario che per il numero di errori al compito
primario il pattern di risultati osservato per l'effetto principale del Trattamento è riprodotto sia per la
condizione 1 (compito secondario verbale) che per la condizione 2 (compito secondario numerico).
Nel secondo caso, allo stesso modo, troviamo che sia l'accuratezza al compito secondario che il Nel
primo caso osserviamo che sia per l'accuratezza al compito secondario che per il numero di errori al
18
Per non appesantire l'esposizione sono state omesse le tabelle Multivariate Tests e Univariate Tests
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
compito primario il pattern di risultati osservato per l'effetto principale del Tipo di compito
secondario è riprodotto in tutti i livelli di Trattamento. Questo risultato appare contraddittorio con
quanto osservato precedentemente, ossia che l'effetto di interazione, a livello univariato, era
significativo solo per l'accuratezza al compito secondario. E' una situazione apparentemente
paradossale ma che può capitare quando l'effetto non è abbastanza forte per emergere a livello di
test omnibus ma che, per il modo particolare che ha il software di eseguire i confronti post-hoc sulle
medie marginali stimate, può emergere a livello di confronti a coppie.
L'ouput offre anche i grafici di interazione per le due variabili (Figura 6.6.51).
Accuratezza
Errori
Figura 6.6.51 Grafici di interazione per le variabili dipendenti di una MANOVA fattoriale mista
In una tesi o in un articolo scientifico riporteremmo le tabelle con le statistiche descrittive, un
grafico per ogni variabile dipendente fra quelli illustrati in Figura 6.6.51 e scriveremmo:
E' stata condotta un'analisi multivariata della varianza fattoriale mista [oppure: è stata
condotta un'analisi doppiamente multivariata] per valutare se soggetti psichiatrici in
diverse condizioni di trattamento con un farmaco ad azione inibitoria sul sistema
nervoso centrale (Farmaco, Placebo, Controllo) differivano rispetto al numero di errori
in un compito primario di guida al simulatore e rispetto all'accuratezza in un compito
secondario, e se il diverso tipo di compito secondario (Verbale: rispondere alla parola
proposta col suo contrario; Numerico: riferire la somma delle ultime due cifre di una
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
serie presentata uditivamente) poteva giocare a sua volta un ruolo, sia come effetto
principale che in interazione con il trattamento. A livello multivariato tutti gli effetti
sono risultati statisticamente significativi (Trattamento: Wilks' Lambda = ,033, F(4, 40)
= 45,09, p < ,001, η2 parziale = ,82; Compito: Wilks' Lambda = ,060, F(2, 20) = 155,83,
p < ,001, η2 parziale = ,94; Compito × Trattamento: Wilks' Lambda = ,568, F(4, 40) =
3,27, p = ,021; η2 parziale = ,25). Le successive analisi della varianza univariate hanno
mostrato che il gruppo di Controllo aveva una maggiore accuratezza nelle risposte al
compito secondario e produceva un minor numero di errori nel compito primario sia
rispetto al gruppo Placebo che al gruppo Farmaco, e che, a sua volta, il gruppo Placebo
era più accurato nel compito secondario e commetteva meno errori nel compito
primario del gruppo Farmaco. I risultati di questo studio suggeriscono che il farmaco
abbia un effetto di peggioramento della prestazione in compiti che richiedono
attenzione sostenuta.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Scarica